Académique Documents
Professionnel Documents
Culture Documents
2014
SUMRIO
INTRODUO ............................................................................................ 03
2
INTRODUO
3
conhecimento, os conceitos empregados, as limitaes das tcnicas e as
consequncias dessas interpretaes so essencialmente as mesmas.
Segundo Rao (1999), a estatstica uma cincia que estuda e pesquisa sobre: o
levantamento de dados com a mxima quantidade de informao possvel para
um dado custo; o processamento de dados para a quantificao da quantidade
de incerteza existente na resposta para um determinado problema; a tomada de
decises sob condies de incerteza, sob o menor risco possvel. Finalmente, a
estatstica tem sido utilizada na pesquisa cientfica, para a otimizao de
recursos econmicos, para o aumento da qualidade e produtividade, na
otimizao em anlise de decises, em questes judiciais, previses e em
muitas outras reas.
4
I - A NATUREZA DA ESTATSTICA
PANORAMA HISTRICO
5
MTODO ESTATSTICO
O Mtodo Cientfico
Muitos dos conhecimentos que temos foram obtidos na antiguidade por acaso
e, outros, por necessidades prticas, sem aplicao de um mtodo.
Atualmente, quase todo acrscimo de conhecimento resulta da observao e
do estudo. Se bem que muito desse conhecimento possa ter sido observado
inicialmente por acaso, a verdade que desenvolvemos processos cientficos
para seu estudo e para adquirirmos tais conhecimentos. Podemos ento dizer
que:
O Mtodo Estatstico
6
Nesses casos, lanamos mo de outro mtodo, embora mais difcil e menos
preciso, denominado mtodo estatstico.
A ESTATSTICA
7
Fases do Mtodo estatstico:
1 Coleta de Dados
1.1 Direta:
1.2 Indireta:
8
2 Crtica dos Dados
Por mais diversa que seja a finalidade que se tenha em vista, os dados devem
ser apresentados sob forma de tabelas (unidade 3) e grficos (unidade 4), pois
tornam mais fcil o exame daquilo que est sendo objeto de tratamento
estatstico e ulterior obteno de medidas de posio (unidade 6) e medidas de
disperso (unidade 7).
9
A ESTATSTICA NAS EMPRESAS
10
EXERCCIOS
1. Complete:
O mtodo experimental o mais usado por cincias como: _______________.
3. O que Estatstica?
11
II POPULAO E AMOSTRA
1 VARIVEL
12
De modo geral, as medies do origem a variveis contnuas e as contagens
ou enumeraes, a variveis discretas.
Exerccio resolvido:
Resolva:
2 POPULAO E AMOSTRA
13
Populao: coleo completa de todos os elementos que so objeto de um
estudo; conjunto de entes portadores de, pelo menos, uma caracterstica
comum. A populao estatstica tambm conhecida como universo
estatstico.
Exemplo: pessoas que possuem automvel.
3 AMOSTRAGEM
Dessa forma, cada elemento da populao passa a ter a mesma chance de ser
escolhido, o que garante amostra o carter de representatividade, e isto
muito importante, pois, como vimos, nossas concluses relativas populao
vo estar baseadas nos resultados obtidos nas amostras dessa populao.
14
Numeramos os alunos de 01 a 90 (populao);
Colocamos os noventa nmeros, em pedaos iguais de um mesmo
papel, dentro de uma caixa. Agitamos sempre a caixa para misturar bem
os pedaos de papel e retiramos, um a um, 9 nmeros que representaro
a amostra. Neste caso, 10% desta populao.
15
exatamente isso que fazemos quando empregamos a amostragem
proporcional estratificada, que, alm de considerar a existncia de estratos,
obtm elementos da amostra proporcional ao nmero de elementos desses
estratos.
57 28 92 90 80 22 56 79 53 18 53 03 27 05 40
Temos ento;
28 22 53 18 03 para os meninos;
57 90 80 56 para as meninas.
Resolva:
16
3 Em uma escola existem 250 alunos, sendo 35 na 1 srie, 32 na 2, 30 na
3, 28 na 4, 35 na 5, 32 na 6, 31 na 7 e 27 na 8. Obtenha uma amostra de 40
alunos e preencha o quadro a seguir.
Exemplo: Supomos uma rua com 500 casas, das quais desejamos obter uma
amostra formada por 20 casas para uma pesquisa de opinio.
Neste caso, podemos usar o seguinte procedimento:
17
EXERCCIOS
18
7 Uma populao se encontra dividida em quatro estratos, com tamanhos
N1 90 , N 2 120 , N 3 60 e N 4 480 . Ao se realizar uma amostragem
estratificada proporcional, doze elementos da amostra foram retirados do
primeiro estrato. Qual o nmero de elementos da amostra de cada estrato?
N DE ESTUDANTES
ESCOLAS
MASCULINO FEMININO
A 80 95
B 102 120
C 110 92
D 134 228
E 150 130
F 300 290
Total 876 955
19
III - SRIES ESTATSTICAS
TABELAS
20
Fonte: entidade responsvel pelo levantamento dos dados ou pela elaborao
da tabela;
Notas: so informaes de natureza geral, destinada a conceituar ou esclarecer
o contedo das tabelas, ou indicar a metodologia adotada;
Chamadas: informaes de natureza especfica sobre determinada parte da
tabela, destinada a conceituar ou esclarecer dados.
21
Ex.: Levantamento Epidemiolgico no Estado do Rio de Janeiro 2010
SRIES ESTATSTICAS
Denominamos sries estatsticas toda tabela que apresenta a distribuio de
um conjunto de dados estatsticos em funo da poca, do local ou da espcie.
Da, podemos inferir que numa srie estatstica observamos a existncia de
trs elementos ou fatores: o tempo, o espao e a espcie.
Dividem-se em sries homgradas e conjugadas.
Sries Homgradas: so aquelas em que a varivel descrita apresenta
variao discreta ou descontnua. Podem ser do tipo temporal,
geogrfica ou especfica.
a) Srie Temporal: Identifica-se pelo carter varivel do fator cronolgico. O
local e a espcie (fenmeno) so elementos fixos. Esta srie tambm
chamada de histrica, cronolgica, marcha ou evolutiva.
Frango Preos Mdios em So Paulo 2003 a 2008
ANOS PREO (R$)
2003 2,56
2004 2,64
2005 2,67
2006 2,53
2007 3,20
2008 3,64
22
b) Srie Geogrfica: Apresenta como elemento varivel o fator geogrfico. A
poca e o fato (espcie) so elementos fixos. Tambm chamada de espacial,
territorial ou de localizao.
Durao Mdia dos Estudos Superiores - 1994
PASES N DE ANOS
Itlia 7,5
Alemanha 7,0
Frana 7,0
Holanda 5,9
Inglaterra Menos de 4
Fonte: Revista Veja.
c) Srie Especfica: O carter varivel apenas o fato ou espcie. Tambm
chamada de srie categrica.
Rebanhos Brasileiros - 2006
ESPCIES QUANTIDADE
Bovinos 205.886.244
Bubalinos 1.156.870
Aves 821.541.630
Sunos 35.173.824
Ovinos 16.019.170
Caprinos 10.401.449
Fonte: IBGE.
23
Resolva:
1 Classifique as sries
24
2 Procure exemplos de sries estatsticas em jornais e revistas e copie-os,
classificando essas sries.
25
6-
Complete-a com uma coluna de percentagens com uma casa decimal e faa a
compensao, se necessrio.
26
1 Percentagens
Considere a srie:
Os valores dessa nova coluna nos dizem que, de cada 100 alunos da cidade A,
91 esto no ensino fundamental, 8 aproximadamente esto no ensino mdio e
1 aproximadamente est matriculado no ensino superior.
27
NOTAS:
Resolva:
DADOS RELATIVOS
ESCOLAS N. DE ALUNOS
POR 1 POR 100
A 175 0,098 9,8
B 222
C 202
D 362
E 280
F 540
TOTAL 1781 1,000 100,0
2 ndices
Os ndices so razes entre duas grandezas tais que uma no inclui a outra.
So exemplos de ndices:
28
Densidade demogrfica = populao total
Superfcie (rea)
ndice econmicos:
3 Coeficientes
So exemplos de coeficientes:
Coeficiente educacionais:
29
4 Taxas
As taxas so os coeficientes multiplicados por uma potncia de 10 (10, 100,
1000 etc.) para tornar o resultado mais inteligvel.
So exemplos de taxas:
Exerccio Resolvido:
1 O estado A apresentou 733.986 matriculados na 1 srie, no incio do ano
de 2012, e 683.816 no fim do ano. O Estado B apresentou, respectivamente,
436.127 e 412.457 matriculados. Qual o Estado que apresentou maior evaso
escolar?
A: TEE = (733.986 683.816) x 100 = 6,8%
733.986
EXERCCIOS
1 Considere a srie estatstica:
30
2 Uma escola apresentava, no final do ano, o seguinte quadro:
MATRICULAS
SRIES
MARO NOVEMBRO
1 480 475
2 458 456
3 436 430
4 420 420
TOTAL 1794 1781
Calcule:
a. o ndice da densidade demogrfica;
b. a taxa de natalidade;
c. a taxa de mortalidade.
31
IV - GRFICOS ESTATSTICOS
1- Conceito:
O grfico um mtodo de representao de dados estatsticos em forma
visual, por meio de figuras geomtricas. Devem corresponder, mas nunca
substituir as tabelas estatsticas.
uma forma de apresentao dos dados estatsticos, cujo objetivo o de
produzir, no investigador ou no pblico em geral, uma impresso mais rpida
e viva do fenmeno em estudo, j que os grficos falam mais compreenso
que as sries.
Para tornarmos possvel uma representao grfica, estabelecemos uma
correspondncia entre os termos da srie e determinada figura geomtrica, de
tal modo que cada elemento da srie seja representado por uma figura
proporcional.
A representao grfica deve obedecer a certos requisitos fundamentais como:
Simplicidade o grfico deve ser destitudo de detalhes de importncia
secundria, assim como traos desnecessrios que possam levar o
observador a uma anlise morosa ou com erros. Deve proporcionar que
o observador analise rapidamente o fenmeno apresentado;
Uso indevido de Grficos: Podem trazer uma ideia falsa dos dados que esto
sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade,
de um problema de construo de escalas.
32
2 - Classificao dos grficos:
Os principais grficos so os Diagramas, Estereogramas, Pictogramas e
Cartogramas.
2.1 - Diagramas:
So grficos geomtricos dispostos, no mximo, em duas dimenses; para sua
construo, em geral, fazemos uso do sistema cartesiano. So os mais usados
na representao de sries estatsticas. Eles podem ser em linhas, em barras
horizontais, em barras verticais (colunas), e em setores.
33
So frequentemente usados para representao de sries cronolgicas com um
grande nmero de perodos de tempo. As linhas so mais eficientes do que as
colunas, quando existem intensas flutuaes nas sries ou quando h
necessidade de se representarem vrias sries em um mesmo grfico.
Quando representamos, em um mesmo sistema de coordenadas, a variao de
dois fenmenos, a parte interna da figura formada pelos grficos desses
fenmenos denominada de rea de excesso.
34
Exemplo: Grfico em colunas
35
Exemplo: Grfico em barras
NOTAS:
Quando as legendas no so breves usa-se de preferncia os grficos em
barras horizontais;
A ordem a ser observada a cronolgica, se a srie for histrica, e a
decrescente, se for geogrfica ou categrica;
A distncia entre as colunas (ou barras), por questes estticas, no
dever ser menor que a metade nem maior que os dois teros da largura
(ou da altura) dos retngulos.
36
Grficos em barras ou colunas mltiplas
Grficos em setores
Este grfico construdo com base em um crculo, e empregado sempre que
desejamos ressaltar a participao do dado no total.
O total representado pelo crculo, que fica dividido em tantos setores quantas
so as partes.
Os setores so tais que suas reas so respectivamente proporcionais aos
dados da srie. Obtemos cada setor por meio de uma regra de trs simples e
direta, lembrando que o total da srie corresponde a 360.
37
O grfico em setores s deve ser empregado quando h, no mximo, sete
dados.
Obs.: As sries temporais geralmente no so representadas por este tipo de
grfico.
38
2.2 - Estereogramas:
So grficos geomtricos dispostos em trs dimenses, pois representam
volume. So usados nas representaes grficas das tabelas de dupla entrada.
Em alguns casos este tipo de grfico fica difcil de ser interpretado dada a
pequena preciso que oferecem.
2.3 - Pictogramas:
So construdos a partir de figuras representativas da intensidade do
fenmeno. Este tipo de grfico tem a vantagem de despertar a ateno do
pblico leigo, pois sua forma atraente e sugestiva. Os smbolos devem ser
auto-explicativos. A desvantagem dos pictogramas que apenas mostram uma
viso geral do fenmeno, e no de detalhes minuciosos. Veja o exemplo
abaixo:
39
2.4 - Cartogramas: So ilustraes relativas a cartas geogrficas (mapas). O
objetivo desse grfico o de figurar os dados estatsticos diretamente
relacionados com reas geogrficas ou polticas.
Distinguimos duas aplicaes:
a. representar os dados absolutos (populao) neste caso,
lanamos mo, em geral, dos pontos, em nmero proporcional
aos dados.
b. representar dados relativos (densidade) - neste caso, lanamos
mo, em geral, de hachuras ou cores.
40
41
EXERCCIOS
1 Represente a srie abaixo usando o grfico em linha:
COMRCIO EXTERIOR
BRASIL 1984 -93
QUANTIDADE (1000t)
ANOS
EXPORTAO IMPORTAO
84 141.737 53.988
85 146.351 48.870
86 133.832 60.597
87 142.378 61.975
88 169.666 58.095
89 177.033 57.293
90 168.095 57.184
91 165.974 63.278
92 167.295 68.059
93 182.561 77.813
Fonte: Min. Indstria, Comrcio e Turismo.
42
3 Represente as tabelas usando o grfico em barras:
a) PRODUO DE OVOS NO BRASIL - 1992
QUANT.
REGIES
(1000dzias)
Norte 57.297
Nordeste 414.804
Sudeste 984.659
Sul 615.978
Centro-Oeste 126.345
Fonte: IBGE.
43
5 Represente as tabelas usando o grfico em colunas mltiplas:
PROPORO DOS DOMICLIOS
POR CONDIO DE OCUPAO
BRASIL 1990 -91
NATUREZA
ANOS
PRPRIOS (%) ALUGADOS (%) CEDIDOS (%)
90 62,7 22,9 14,4
91 70,3 16,5 13,2
Fonte: IBGE.
44
V - DISTRIBUIO DE FREQUENCIA
45
Essa classificao dos dados proporciona algumas vantagens concretas com
relao sua forma original:
- possvel visualizar de forma ampla as variaes de consumo;
- os valores extremos so percebidos de imediato;
- possvel observar a tendncia de concentrao dos valores.
Agora, podemos saber, com relativa facilidade, qual a menor estatura (150
cm) e qual a maior (173 cm); que a amplitude de variao foi de 173 150 =
23 cm; e, ainda, a ordem que um valor particular ocupa no grupo. Com um
exame mais acurado, vemos que h uma concentrao das estaturas em algum
valor entre 160 cm e 165 cm e, mais ainda, que h poucos valores abaixo de
155 cm e acima de 170 cm.
2 Distribuio de Frequncia
um tipo de tabela que condensa uma coleo de dados conforme as
frequncias (repeties de seus valores).
No exemplo que trabalhamos, a varivel em questo, estatura, ser observada
e estudada muito mais facilmente quando dispusermos valores ordenados em
uma coluna e colocarmos, ao lado de cada valor, o nmero de vezes que
aparece repetido. Logo podemos definir o termo frequncia.
Frequncia: a quantidade que fica relacionada a um determinado valor da
varivel.
Distribuio de frequncia sem intervalos de classe: a simples
condensao dos dados conforme as repeties de seus valores.
Veja para o nosso exemplo:
46
VARIVEL FREQUENCIA
150 1
151 1
152 1
153 1
154 1
155 4
156 3
157 1
158 2
160 5
161 4
162 2
163 2
164 3
165 1
166 1
167 1
168 2
169 1
170 1
172 1
173 1
TOTAL 40
47
ESTATURAS DE 40 ALUNOS DO IFCE
CLASSES FREQUENCIAS
150 |---- 154 4
154 |---- 158 9
158 |---- 162 11
162 |---- 166 8
166 |---- 170 5
170 |---- 174 3
Total 40
68 82 75 43 59 80 69 60 73 54
51 93 70 32 63 61 76 87 65 71
Como todos os dados possuem dois algarismos, podemos dividir cada dado
em algarismo da dezena e da unidade. Portanto, o algarismo da dezena ser o
48
ramo e a unidade ser a folha. Vamos usar o dado 68 como exemplo:
6 8
ramo folha
3 3 3 3 2
4 4 4 4 3
5 5 5 5 9 4 1
6 6 8 6 8 6 8 9 0 3 1 5
7 7 7 7 5 3 0 6 1
8 8 8 2 8 2 0 7
9 9 9 9 3
(a) (b) (c) (d)
3.1 Classe
49
3.2 Limites de classe
.......
h6 = 174 - 170 = 4
50
3.4 Amplitude total da distribuio
Ponto mdio da classe (xi) , como o prprio nome indica, o ponto que divide
o intervalo de classe em duas partes iguais.
51
Obs.: O ponto mdio da classe o valor que a representa para efeito de
clculos de medidas de posio e disperso ou variabilidade.
3.7 Frequncia simples ou absoluta
f1 = 4; f2 = 9; f3 = 11; f4 = 8; f5 = 5 e f6 = 3.
A soma das frequncias sempre igual ao total de elementos da amostra.
Atividade 1: As notas obtidas por 50 alunos de uma classe foram:
1; 2; 3; 4; 5; 0; 6; 7; 7; 8; 2; 3; 3; 4; 5; 6; 6; 7; 8; 8; 2; 3; 4; 4; 5; 6; 6; 7; 8; 9;
2; 3; 4; 5; 5; 6; 6; 7; 8; 9; 2; 3; 4; 5; 5; 6; 7; 7; 8; 9.
a) Complete a distribuio de frequncia abaixo:
i Notas xi fi
1 0 |---- 2
2 2 |---- 4
3 4 |---- 6
4 6 |---- 8
5 8 |---- 10
Total 50
52
b) Agora, responda:
c) Complete:
1. h3 = .......
2. n = ........
3. l1 = ........
4. L3 = ........
5. x2 = ........
6. f5 = ........
4 Tipos de Frequncias
53
Frequncia acumulada de uma classe (Fi) o total das frequncias de todos
os valores inferiores ao limite superior do intervalo de uma determinada
classe:
Fk = f1 + f2 + f3 + ...... + fK
54
5 - Mtodo Prtico para Construo de uma Distribuio de Frequncias com
Classes:
1 - Organize os dados brutos em um ROL.
2 - Calcule a amplitude amostral AA. Para o exemplo da pgina 45, temos:
AA = 173 - 150 = 23
3 - Calcule o nmero de classes atravs da:
a) Regra de Sturges: i = 1 + 3,3.log n
n i = n de classes
3 ---- 5 3
6 ---- 11 4
12 ---- 22 5
23 ---- 46 6
47 ---- 90 7
91 ---- 181 8
182---- 362 9
b) Raiz quadrada de n. (usa-se somente a parte inteira do nmero quando a
raiz no for exata).
Obs.: Qualquer regra para determinao do n de classes da tabela no nos
leva a uma deciso final; esta vai depender na realidade de um julgamento
pessoal, que deve estar ligado natureza dos dados.
No nosso exemplo: n = 40 dados, ento, a regra de Sturges sugere a adoo
de 6 classes e pela regra da raiz quadrada tambm o uso de 6 classes.
Dependendo do n, o nmero de classes pode ser diferente quando usamos os
dois mtodos. Por exemplo, para n igual a 100 teremos 8 classes pela regra de
Sturges e 10 classes para a regra da raiz de n.
4 - Decidido o n de classes, calcule ento a amplitude do intervalo de classe
h > AA / i.
No nosso exemplo: AA / i = 23/6 = 3,83. Obs.: Como h > AA / i um valor
ligeiramente superior para haver folga na ltima classe. Utilizaremos ento
h = 4.
55
5 - Temos ento o menor n da amostra, o n de classes e a amplitude do
intervalo. Podemos montar a tabela, com o cuidado para no aparecer classes
com frequncia = 0 (zero).
No nosso exemplo: o menor n da amostra = 150 + h = 154, logo a primeira
classe ser representada por 150 |---- 154. As classes seguintes respeitaro o
mesmo procedimento.
O primeiro elemento da classe seguinte sempre ser formado pelo ltimo
elemento da classe anterior.
Resolva:
1. Complete a distribuio abaixo, determinando as frequncias simples:
xi fi Fi
2 2
3 9
4 21
5 29
6 34
Total 34 --
EXERCCIOS
1 - Suponha que o ponto mdio das classes de uma distribuio de frequncia
de umidade relativa em um posto seja: 28%, 37%, 46%, 55%, 64%, 73% e
82%.
a) Encontre a amplitude da classe;
b) Os limites de cada classe.
2 - Imagine que em uma regio durante um dia de inverno foram medidas 150
temperaturas mnimas (em oC) em pontos prximos. Suponha que estas
temperaturas variaram entre 5,18 C a 7,44 C. Determine um conjunto de
intervalos de classe que seja razovel para esse conjunto de dados.
56
4 Os resultados do lanamento de um dado 50 vezes foram os seguintes:
6, 5, 2, 6, 4, 3, 6, 2, 6, 5, 1, 6, 3, 3, 5, 1, 3, 6, 3, 4, 5, 4, 3, 1, 3, 5, 4, 4, 2, 6, 2,
2, 5, 2, 5, 1, 3, 6, 5, 1, 5, 6, 2, 4, 6, 1, 5, 2, 4, 3.
Forme uma distribuio de frequncia sem intervalos de classes.
N. de
Salrios (R$)
Empregados
5.000 |--- 6.000 8
6.000 |--- 7.000 10
7.000 |--- 8.000 16
8.000 |--- 9.000 14
9.000 |--- 10.000 10
10.000 |--- 11.000 5
11.000 |--- 12.000 2
Total 65
57
Determinar:
a) O limite inferior da 6 classe;
b) O limite superior da 4 classe;
c) O ponto mdio da 3 classe;
d) A amplitude do 5 intervalo de classe;
e) A frequncia da 3 classe;
f) A frequncia relativa da 3 classe;
g) O intervalo de classe que tem a maior frequncia;
h) A percentagem de empregados que ganham menos de R$ 8.000,00 por ms;
i) A percentagem de empregados que ganham menos de R$ 10.000,00 e pelo
menos R$ 6.000,00 por ms;
N DE LOTES 14 46 58 76 68 62 48 22 6
Com referncia a esta tabela, determine:
a) a amplitude total;
b) o limite superior da quinta classe;
c) o limite inferior da oitava classe;
d) o ponto mdio da stima classe;
e) a amplitude do intervalo da segunda classe;
f) a frequncia da quarta classe;
58
g) a frequncia relativa da sexta classe;
h) a frequncia acumulada da quinta classe;
i) o nmero de lotes cuja rea no atinge 700 m2;
j) o nmero de lotes cuja rea atinge e ultrapassa 800 m2;
k) a percentagem dos lotes cuja rea no atinge 600 m2;
l) a percentagem dos lotes cuja rea seja maior ou igual a 900 m2;
m) a percentagem dos lotes cuja rea de 500 m2, no mnimo, mas inferior
a 1000 m2;
n) a classe do 72 lote;
o) At que classe esto includos 60% dos lotes.
6.1 - Histograma
59
ESTATURAS DE 40 ALUNOS NA ESCOLA A
60
6.3 Polgono de Frequncia Acumulada
61
um segmento de reta varivel e de comprimento proporcional respectiva
frequncia.
EXERCCIOS
PESOS
i fi
(Kg)
1 40 |--- 44 2
2 44 |--- 48 5
3 48 |--- 52 9
4 52 |--- 56 6
5 56 |--- 60 4
Total 26
62
b)
SALRIOS
i fi
(R$)
1 500 |--- 700 8
2 700 |--- 900 20
3 900 |--- 1100 7
4 1100 |--- 1300 5
5 1300 |--- 1500 2
6 1500 |--- 1700 1
7 1700 |--- 1900 1
Total 44
63
VI - MEDIDAS DE POSIO
1 Introduo
O estudo que fizemos sobre distribuies de frequncia, at agora, permite-nos
descrever, de modo geral, os grupos dos valores que uma varivel pode
assumir. Dessa forma, podemos localizar a maior concentrao de valores de
uma dada distribuio, isto , se ela se localiza no incio, no meio ou no final,
ou ainda, se h uma distribuio por igual.
Porm, para ressaltar as tendncias caractersticas de cada distribuio,
isoladamente, ou em confronto com outras, necessitamos introduzir conceitos
que se expressam atravs de nmeros, que nos permitam traduzir essas
tendncias. Esses conceitos so denominados elementos tpicos da
distribuio e so as:
a. medidas de posio;
b. medidas de variabilidade ou disperso;
c. medidas de assimetria;
d. medidas de curtose.
Dentre os elementos tpicos, destacamos, neste captulo, as medidas de
posio - estatsticas que representam uma srie de dados orientando-nos
quanto posio da distribuio em relao ao eixo horizontal do grfico da
curva de frequncia.
As medidas de posies mais importantes so as medidas de tendncia
central ou promdias, que recebem tal denominao pelo fato de os dados
observados tenderem, em geral, a se agruparem em torno dos valores centrais.
Dentre as medidas de tendncia central, destacamos:
a. a mdia aritmtica;
b. a moda;
c. a mediana.
Outras promdias menos usadas so as mdias: geomtrica, harmnica,
quadrtica, cbica e biquadrtica.
As outras medidas de posio so as separatrizes, que englobam: a prpria
mediana, os decis, os quartis e os percentis.
64
2 Mdia Aritmtica ( )
Em um conjunto de dados, podemos definir vrios tipos de mdias. Porm, em
nossos estudos iremos nos limitar a mais importante: a mdia aritmtica.
.= (10+14+13+15+16+18+12) / 7 = 14 kg
Logo: .= 14 Kg
s vezes, a mdia pode ser um nmero diferente de todos os da srie de dados
que ela representa. o que acontece quando temos os valores 2, 4, 6 e 8, para
os quais a mdia 5. Esse ser o nmero representativo dessa srie de valores,
embora no esteja representado nos dados originais. Neste caso, costumamos
dizer que a mdia no tem existncia concreta.
2.2 Desvio em relao mdia
65
No exemplo anterior temos sete desvios:...
d1 = 10 - 14 = -4;
d2 = 14 - 14 = 0;
d3 = 13 - 14 = -1;
d4 = 15 - 14 = 1;
d5 = 16 - 14 = 2;
d6 = 18 - 14 = 4;
d7 = 12 - 14 = -2.
2.3 -.Propriedades da mdia
1 propriedade: A soma algbrica dos desvios em relao mdia nula.
Ou seja:
No exemplo anterior: d1 + d2 + d3 + d4 + d5 + d6 + d7 = 0
2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos
os valores de uma varivel, a mdia do conjunto fica aumentada (ou
diminuda) dessa constante.
Ou seja, Y = .+ 2 = 14 +2 = 16 kg
66
Se no exemplo anterior multiplicarmos a constante 3 a cada um dos valores da
varivel temos:
Y = (30+42+39+45+48+54+36) / 7 = 294/7 = 42 kg
Ou seja, Y = x 3 = 14 x 3 = 42 kg.
2.4 Dados Agrupados
A mdia aritmtica sem intervalos de classe
Consideremos a distribuio relativa a 34 famlias de quatro filhos, tomando
para varivel o nmero de filhos do sexo masculino. Calcularemos a
quantidade mdia de meninos por famlia:
N de meninos Frequncia (fi)
0 2
1 6
2 10
3 12
4 4
Total 34
67
xi fi x i . fi
0 2 0
1 6 6
2 10 20
3 12 36
4 4 16
34 78
Temos, xifi = 78 e f i = 34
Logo xifi / f i = 78 / 34 = 2,3
Portanto a mdia de 2,3 meninos por famlia
Nota:
- Sendo x uma varivel discreta, como interpretar o resultado obtido, 2
meninos e 3 dcimos de menino?
O valor mdio de 2,3 meninos sugere, neste caso, que o maior nmero de
famlias tem 2 meninos e 2 meninas, sendo, porm, a tendncia geral de uma
leve superioridade numrica em relao ao nmero de meninos.
Resolva:
1 Calcule a mdia aritmtica da distribuio:
xi 1 2 3 4 5 6
fi 2 4 6 8 3 1
68
Exemplo: Considere a distribuio de frequncia relativo a estaturas, em cm,
de 40 bebs. Calcular a estatura mdia dos bebs conforme a tabela abaixo.
i Estaturas (cm) fi
1 50 |---- 54 4
2 54 |---- 58 9
3 58 |---- 62 11
4 62 |---- 66 8
5 66 |---- 70 5
6 70 |---- 74 3
40
Pela mesma razo do caso anterior, vamos, inicialmente, abrir uma coluna
para os pontos mdios (xi) e outra para os produtos xifi:
69
Resolva:
1 Calcule a media da distribuio de frequncia:
CUSTO (R$) 450 |-- 550 |-- 650 |-- 750 |-- 850 |-- 950 |-- 1050 |-- 1150
fi 8 10 11 16 13 5 1
3 Moda
Denominamos Moda o valor que ocorre com maior frequncia em uma srie
de valores.
Mo o smbolo da moda.
Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais
comum, isto , o salrio recebido pelo maior nmero de empregados dessa
fbrica.
3.1 Dados no - agrupados
Quando lidamos com dados no-agrupados, a moda facilmente reconhecida:
basta, de acordo com definio, procurar o valor que mais se repete.
Exemplo: Na srie de dados {7, 8, 9, 10, 10, 10, 11, 12} a moda igual a 10.
H sries nas quais no exista valor modal, isto , nas quais nenhum valor
aparea mais vezes que outros.
Exemplo: {3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal.
Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos,
ento, que a srie tem dois ou mais valores modais.
Exemplo: {2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7.
A srie bimodal.
3.2 Dados agrupados
Sem intervalos de classe
Uma vez agrupados os dados, possvel determinar imediatamente a moda:
basta fixar o valor da varivel de maior frequncia.
70
Exemplo: Qual a temperatura mais comum medida no ms abaixo:
Temperaturas ( C) Frequncia
0 3
1 9
2 12
3 6
Resp.: 2 C a temperatura modal, pois a de maior frequncia (12 vezes).
Com intervalos de classe
A classe que apresenta a maior frequncia denominada classe modal. Pela
definio, podemos afirmar que a moda, neste caso, o valor dominante que
est compreendido entre os limites da classe modal.
O mtodo mais simples para o clculo da moda consiste em tomar o ponto
mdio da classe modal. Damos a esse valor a denominao de moda bruta.
71
H, para o clculo da moda, outros mtodos mais elaborados, como, por
exemplo, o que faz uso da frmula de Czuber:
Na qual:
l* o limite inferior da classe modal;
h* a amplitude da classe modal;
D1 = f* - f (ant.);
D2 = f* - f (post.);
Sendo:
f* a frequncia simples da classe modal;
f (ant.) a frequncia simples da classe anterior classe modal;
f (post.) a frequncia simples da classe posterior classe modal.
72
3.3 Emprego da moda
A moda utilizada quando:
a. desejamos obter uma medida rpida e aproximada de posio;
b. quando a medida de posio deva ser o valor mais tpico da
distribuio.
Resolva:
1 Calcule a moda da distribuio de frequncia:
Classes fi
450 |---- 550 8
550 |---- 650 10
650 |---- 750 11
750 |---- 850 16
850 |---- 950 13
950 |---- 1050 5
1050 |---- 1150 1
Total 64
4 Mediana
Smbolo da mediana: Md
4.1 Dados no-agrupados
Dada uma srie de valores como, por exemplo:
{5, 2, 6, 13, 9, 15, 10}
De acordo com a definio de mediana, o primeiro passo a ser dado o da
ordenao (crescente ou decrescente) dos valores:
{2, 5, 6, 9, 10, 13, 15}
73
Em seguida, tomamos aquele valor central que apresenta o mesmo nmero de
elementos direita e esquerda. Neste caso o valor que divide a srie acima
em duas partes iguais o 9, logo a Md = 9.
Se, porm, a srie dada tiver um nmero par de termos, a mediana ser, por
definio, qualquer dos nmeros compreendidos entre os dois valores centrais
da srie. Convencionou-se utilizar o ponto mdio.
.Mtodo prtico para o clculo da Mediana
a) Se a srie dada tiver nmero mpar de termos:
O valor mediano ser o termo de ordem dado pela frmula:
(n+1)/2
74
Notas:
Quando o nmero de elementos da srie estatstica for mpar, haver
coincidncia da mediana com um dos elementos da srie.
Quando o nmero de elementos da srie estatstica for par, haver ou
no coincidncia da mediana com um dos elementos da srie. A
mediana ser sempre a mdia aritmtica dos 2 elementos centrais da
srie.
Em uma srie a mediana, a mdia e a moda no tm, necessariamente, o
mesmo valor.
A mediana depende da posio e no dos valores dos elementos na srie
ordenada. Essa uma das diferenas marcantes entre mediana e mdia
(que se deixa influenciar, e muito, pelos valores extremos). Vejamos:
Em {5, 7, 10, 13, 15}; a mdia = 10 e a mediana = 10
Em {5, 7, 10, 13, 65}; a mdia = 20 e a mediana = 10
Isto , a mdia do segundo conjunto de valores maior do que a do primeiro,
por influncia dos valores extremos, ao passo que a mediana permanece a
mesma.
75
Exemplo considere a distribuio abaixo:
Varivel (xi) fi Fi
0 2 2
1 6 8
2 9 17
3 13 30
4 5 35
Total 35 --
xi fi Fi
12 1 1
14 2 3
15 1 4
16 2 6
17 1 7
20 1 8
Total 8 --
Aplicando frmula acima teremos:
[(8/2)+ (8/2+1)]/2 = (4 termo + 5 termo) / 2 = (15 + 16) / 2 = 15,5
Logo, o valor da mediana para esta distribuio ser igual a 15,5.
76
Resolva:
1 Calcule a mediana da distribuio:
xi 2 4 6 8 10
fi 3 7 12 8 4
77
Temos: = 40 / 2 =.20
Logo,.a classe mediana ser a terceira classe, ou seja, 58 |---- 62 e com base
nesta classe temos ainda:
l* = 58........... F(ant) = 13........... f* = 11........... h* = 4
Substituindo esses valores na frmula acima, obtemos:
Md = 58 + [(20 - 13) x 4] / 11 = 58 + (28/11) = 58 + 2,54 = 60,54
Obs.: Este valor (Md = 60,54) estimado, pois no temos os 40 valores da
distribuio.
NOTA: No caso de existir uma frequncia acumulada exatamente igual a fi/2, a
mediana ser o limite superior da classe correspondente.
Exemplo: Considere a distribuio a seguir
i Classes fi Fi
1 0 |---- 10 1 1
2 10 |---- 20 3 4
3 20 |---- 30 9 13
4 30 |---- 40 7 20
5 40 |---- 50 4 24
6 50 |---- 60 2 26
Total 26 --
Temos: = 26 / 2 =.13
Logo,.Md = L* = 30
78
Resolva:
1 Calcule a mediana da distribuio de frequncia:
CUSTO (R$) 450 |-- 550 |-- 650 |-- 750 |-- 850 |-- 950 |-- 1050 |-- 1150
fi 8 10 11 16 13 5 1
79
6 As Separatrizes
Como vimos, a mediana caracteriza uma srie de valores devido sua posio
central. No entanto, ela apresenta uma caracterstica, to importante quanto a
primeira: ela separa a srie em dois grupos que apresentam o mesmo
nmero de valores.
Assim, alm das medidas de posio que estudamos, h outras que,
consideradas individualmente, no so medidas de tendncia central, mas
esto ligadas mediana relativamente sua segunda caracterstica, j que se
baseiam em posio na srie. Essas medidas os quartis, os percentis e os
decis so, juntamente com a mediana, conhecidas pelo nome genrico de
separatrizes.
6.1 Os quartis
80
Sendo K o nmero de ordem do quartil. Assim temos:
Exemplo:
Classes fi Fi
150 |---- 154 4 4
154 |---- 158 9 13 (Q1)
158 |---- 162 11 24
162 |---- 166 8 32 (Q3)
166 |---- 170 5 37
170 |---- 174 3 40
Total 40 --
81
Resolva:
82
6.2 Os Decis
Indicamos:
D1, D2, D3, ............, D9
evidente que:
D5= Q2 = Md
10
10
D1
10
D3
83
Exemplo: Calcule o stimo decil
Classes fi Fi
150 |---- 154 4 4
154 |---- 158 9 13
158 |---- 162 11 24
162 |---- 166 8 32 (D7)
166 |---- 170 5 37
170 |---- 174 3 40
Total 40 --
Stimo Decil:
7 x fi/10 = 7 x 40/10 = 28 (28 termo)
6.3 Os Percentis
Indicamos:
P1, P2, P3, ............, P99
evidente que:
P50= D5= Q2 = Md, P25= Q1, P75= Q3
O clculo de um percentil segue a mesma tcnica do clculo da mediana,
porm, a frmula ser substituda por:
84
Sendo K o nmero de ordem do percentil. Assim para o 27 percentil, temos:
Exemplo:
Considerando a distribuio de frequncia, temos para o oitavo percentil:
Classes fi Fi
150 |---- 154 4 4 (P8)
154 |---- 158 9 13
158 |---- 162 11 24
162 |---- 166 8 32
166 |---- 170 5 37
170 |---- 174 3 40
Total 40 --
85
Resolva:
86
EXERCCIOS
1 Com relao s propriedades da mdia aritmtica, moda e mediana,
marque V ou F nas sentenas abaixo.
( ) Multiplicando-se todos os elementos de uma srie por 5, sua mdia
permanece inalterada.
( ) A mediana de uma srie disposta em ordem crescente o termo que a
divide em trs partes iguais.
( ) A moda o valor da varivel que possui maior frequncia.
( ) A mediana de uma srie de 46 elementos a mdia dos valores do 23 e
do 24 termos desta srie, quando ela estiver disposta em ordem crescente.
( ) A mediana de uma srie de 33 elementos o valor do 17 termo desta
srie, quando ela estiver disposta em ordem decrescente.
( ) Dividindo-se todos os nmeros de uma srie com cinco elementos por 2,
sua mediana ficar multiplicada por 2.
2 - A mdia da srie {21, 13, 8, 15, 27, 12, 16, 12, 17, 3, 26, 10} igual a:
( ) 15 ( ) 12 ( ) 15,5 ( ) 14 ( ) NRA
3 - A mediana da srie {21, 13, 8, 15, 30, 12, 17, 3, 26, 10, 25, 16} igual a:
( ) 15 ( ) 12 ( ) 16 ( ) 14 ( ) 15,5
4 - A moda da srie {21, 13, 8, 15, 27, 12, 16, 12, 17, 3, 26, 10} igual a:
( ) 15 ( ) 12 ( ) 15,5 ( ) 14 ( ) NRA
87
7 A mdia aritmtica dos elementos de um conjunto de 28 nmeros 27. Se
retirarmos desse conjunto trs nmeros, de valores 25, 28 e 30, a mdia
aritmtica dos elementos do novo conjunto :
a) 25,48 b) 26,38 c) 28,04 d) 26,62 e) 26,92
Qual das alternativas representa melhor a mdia aritmtica das idades dos
alunos:
a) 16 anos e 10 meses b) 17 anos e 1 ms c) 17 anos e 5 meses d) 17 anos e 4
meses e) 18 anos e 2 meses
Classes Frequncias
02 |- 04 3
04 |- 06 k
06 |- 08 1001
08 |- 10 3k-12
10 |- 12 3
Total
88
10 - Considere a tabela de distribuio de frequncia a seguir, calcule a mdia,
a moda e a mediana das encomendas devolvidas em 35 correios de Fortaleza
no ms de abril de 2005:
N. DE
(fi)
CHEQUES
36 |---- 40 6
40 |---- 44 9
44 |---- 48 4
48 |---- 52 8
52 |---- 56 5
56 |---- 60 3
Total 35
FREQUENCIAS
IDADE
ACUMULADAS
11 10
12 15
13 25
14 40
15 50
Amostra 1 2 3 4 5 6 7 8
Defeitos 300 550 480 980 1050 350 450 870
Pede-se:
a) Calcular a mdia diria de parafusos com defeitos;
b) Projetar o nmero total de parafusos com defeitos em um dia de
trabalho.
89
13 - Calcule a mdia, moda e a mediana das distribuies de frequncia
abaixo:
90
17 - Uma pesquisa contemplando uma amostra de 54 estagirios da Empresa
Produtos Bons Ltda., revelou os salrios apresentados na tabela seguinte.
Faa a distribuio de frequncia com classes e baseado nela calcule:
a) O salrio mdio;
b) O salrio modal;
c) O salrio mediano;
d) Q3; D8; P73.
91
VII MEDIDAS DE DISPERSO OU VARIABILIDADE
1 Disperso ou variabilidade
Vimos anteriormente que um conjunto de valores pode ser convenientemente
sintetizado, por meio de procedimentos matemticos, em poucos valores
representativos mdia aritmtica, moda e mediana. Tais valores podem
servir de comparao para dar a posio de qualquer elemento do conjunto.
No entanto, quando se trata de interpretar dados estatsticos, mesmo aqueles j
convenientemente simplificados, necessrio ter-se uma ideia retrospectiva de
como se apresentavam esses mesmos dados nas tabelas.
Assim, no o bastante dar uma das medidas de posio para caracterizar
perfeitamente um conjunto de valores. Vemos, ento, que a mdia ainda que
considerada como um nmero que tem a faculdade de representar uma srie de
valores no pode, por si mesma, destacar o grau de homogeneidade que
existe entre os valores que compem o conjunto.
Consideremos os seguintes conjuntos de valores das variveis x, y e z:
X: 70, 70, 70, 70, 70
Y: 68, 69, 70, 71, 72
Z: 5, 15, 50, 120, 160
Calculando a mdia aritmtica de cada um desses conjuntos, obtemos:
mdia da varivel x = 70;
mdia da varivel y = 70;
mdia da varivel z = 70;
Vemos ento que os trs conjuntos apresentam a mesma mdia aritmtica: 70.
Entretanto, fcil notar que o conjunto X mais homogneo que os
conjuntos Y e Z, j que todos os valores so iguais mdia. O conjunto Y, por
sua vez, mais homogneo que o conjunto Z, pois h menor diversificao
entre cada um de seus valores e a mdia representativa.
Chamando de disperso ou variabilidade a maior ou menor diversificao
dos valores de uma varivel em torno de um valor de tendncia central tomado
como ponto de comparao, podemos dizer que o conjunto X apresenta
92
disperso ou variabilidade nula e que o conjunto Y apresenta uma disperso
ou variabilidade menor que o conjunto Z.
Portanto, para qualificar os valores de uma dada varivel, ressaltando a maior
ou menor disperso ou variabilidade entre esses valores e a sua medida de
posio, a Estatstica recorre s medidas de disperso ou de variabilidade.
Dessas medidas, estudaremos a amplitude total, o Desvio-padro, a
Varincia e o Coeficiente de variao.
2 Amplitude Total
2.1 Dados no-agrupados
AT = X (max) - X (min)
93
Exemplo:
Considerando a tabela abaixo:
Xi fi
0 2
1 6
2 12
3 7
4 3
Total 30
Temos: AT = 4 0 = 4, logo AT = 4.
AT = L (max) - l (min)
Exemplo:
Considerando a distribuio de frequncia abaixo:
Classes fi
150 |---- 154 4
154 |---- 158 9
158 |---- 162 11
162 |---- 166 8
166 |---- 170 5
170 |---- 174 3
Total 40
Temos:
AT = 174 150 = 24, logo: AT = 24 cm.
A amplitude total tem o inconveniente de s levar em conta os dois valores
extremos da srie, descuidando do conjunto de valores intermedirios, o que
quase sempre invalida a idoneidade do resultado. Ela apenas uma indicao
aproximada da disperso ou variabilidade.
94
3 Varincia e Desvio-padro
3.1 Introduo:
A varincia e o desvio-padro levam em considerao a totalidade dos valores
da varivel em estudo, o que faz delas ndices de variabilidade bastante
estveis e, por isso mesmo, os mais geralmente empregados.
A varincia uma medida que tem pouca utilidade como estatstica descritiva,
porm extremamente importante na inferncia estatstica e em combinaes
de amostras.
Por isso mesmo, imaginou-se uma nova medida que tem utilidade e
interpretaes prticas, denominada desvio-padro, definida como a raiz
quadrada da varincia e representada por S.
95
NOTA:
Tanto o desvio-padro como a varincia so usados como medidas de
disperso ou variabilidade. O uso de uma ou de outra depender da
finalidade que se tenha em vista.
Outra frmula bastante utilizada para calcular o desvio-padro de uma
populao :
96
3.3 Dados no-agrupados
Devemos empregar uma das duas frmulas mostradas para clculo do desvio-
padro.
Exemplo: Calcular o desvio padro da populao representada por:
Populao = {10, 6, 1, 3, 5}
xi
10 5 5 25
6 5 1 1
1 5 -4 16
3 5 -2 4
5 5 0 0
-- -- = 46
Usando a frmula:
97
Resolva:
1 - Calcule o desvio padro, dados os valores da varivel: 8, 10, 11, 15, 16, 18.
2 - Comprove a primeira propriedade do desvio padro somando 5 a cada
valor da varivel do exerccio 1.
3 Comprove a segunda propriedade do desvio padro multiplicando por 2
cada valor da varivel do exerccio 1.
3.4 Dados agrupados
Quando os dados esto agrupados (temos a presena de frequncias) a frmula
do clculo do desvio padro para uma populao ficar:
98
Sabemos que fi = 30 e . f i / n = 32,7 / 30 = 1,09.
A raiz quadrada de 1,09 o desvio padro, ou seja, s = 1,044.
Se considerarmos os dados como sendo de uma amostra o desvio padro seria:
A raiz quadrada de 32,7 / (30 -1) = 1,062.
Obs.: Nas tabelas de frequncias com intervalos de classe a frmula a ser
utilizada a mesma do exemplo anterior.
No exemplo anterior a varincia igual a:
a) Para a populao
S2 = (1,044)2 = 1,09
b) Para a amostra:
S2 = (1,062)2 = 1,13
99
1 - Aproximadamente 68% dos dados esto no intervalo
100
4 Coeficiente de Variao
O desvio padro por si s no nos diz muita coisa. Assim, um desvio padro
de duas unidades pode ser considerado pequeno para uma srie de valores cujo
valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode
ser dito. Alm disso, o fato de o desvio padro ser expresso na mesma unidade
dos dados limita o seu emprego quando desejamos comparar duas ou mais
sries de valores, relativamente sua disperso ou variabilidade, quando
expressas em unidades diferentes.
Para contornar essas dificuldades e limitaes, podemos caracterizar a
disperso ou variabilidade dos dados em termos relativos a seu valor mdio,
medida essa denominada coeficiente de variao (CV):
Exemplo:
Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo
grupo de indivduos:
Varivel S
101
EXERCCIOS
1 Com relao s propriedades do desvio-padro, coloque V ou F nas
sentenas abaixo:
( ) O desvio padro pode assumir qualquer valor numrico.
( ) O desvio - padro representa o grau de variabilidade de um conjunto de
dados, ou seja, quanto maior o valor do desvio-padro mais compactos so
seus dados.
( ) Quando o valor do desvio-padro zero, todos os valores do conjunto de
dados so iguais, no h variao entre eles.
( ) Quando multiplicarmos uma constante a um conjunto de dados, podemos
afirmar que seu desvio-padro fica multiplicado por essa constante, assim
como sua mdia.
( ) Quando somamos uma constante K a um conjunto de dados, podemos
afirmar que seu desvio-padro e sua mdia permanecem inalterados.
( ) Para calcularmos o desvio-padro e a varincia para uma populao e para
uma amostra, devemos proceder da mesma maneira.
2 Considere o conjunto de A = {3, 5, 6, 8}, que tem mdia igual a 5,5 e
desvio-padro igual a 2,08. Sobre o conjunto B = {9, 15, 18, 24} podemos
afirmar que:
( ) Sua mdia e seu desvio-padro no se alteram.
( ) A mdia permanece a mesma e seu desvio-padro fica multiplicado por 3.
( ) Seu desvio-padro o mesmo e a mdia fica multiplicada por 3.
( ) Tanto a mdia como o desvio-padro ficam multiplicados por 3.
( ) Nada podemos afirmar em relao a mdia e seu desvio-padro.
102
5- Dados os conjuntos de nmeros:
A = {-2, -1, 0, 1, 2 } B = {220, 225, 230, 235, 240}
Podemos afirmar, de acordo com as propriedades do desvio padro, que o
desvio padro de B igual:
a) ao desvio padro de A;
b) ao desvio padro de A, multiplicado pela constante 5;
c) ao desvio padro de A, multiplicado pela constante 5, e esse resultado
somado a 230;
d) ao desvio padro de A mais a constante 230.
PESO (kg) fi
41 3
43 1
50 2
54 1
57 1
60 2
TOTAL 10
103
10 - Considere a seguinte amostra, faa a distribuio de frequncia por
classes e calcule o desvio-padro e a varincia.
A = (45, 43, 41, 42, 68, 42, 43, 42, 44, 41, 50, 46, 50, 46, 51, 60, 62, 54, 55,
52,64, 58, 57, 58, 67, 60, 51, 70, 65, 61).
104
VIII - PROBABILIDADE
1 - Introduo
Neste captulo, presumiremos que a populao conhecida e calcularemos as
chances de obter vrias amostras desta populao. Assim, mostraremos que a
probabilidade o reverso da estatstica: na probabilidade usaremos a
informao da populao para inferir a natureza provvel da amostra.
Sendo assim, as situaes marcadas pela possibilidade de ocorrncia de mais
de um resultado possvel costumam ser analisadas em estatstica com o auxlio
das probabilidades. A probabilidade estuda o risco e o acaso em eventos
futuros, determinando se provvel ou no o seu acontecimento.
O clculo das probabilidades pertence ao campo da Matemtica, entretanto a
maioria dos fenmenos de que trata a Estatstica so de natureza aleatria ou
probabilstica. O conhecimento dos aspectos fundamentais do clculo da
probabilidade uma necessidade essencial para o estudo da Estatstica
Indutiva ou Inferencial.
Para estudar probabilidades, necessrio definir alguns conceitos e
terminologias usuais, como os relativos a experimento aleatrio, espao
amostral e eventos.
2 - Experimento Aleatrio
Suponha que uma moeda foi jogada uma vez e deu cara. O resultado que
vemos e registramos chamado de observao, ou medio, e o processo de
realizar uma observao chamado de experimento. Baseado neste exemplo,
enunciamos a definio de experimentos aleatrios:
So fenmenos que, mesmo repetidos vrias vezes sob condies
semelhantes, apresentam resultados imprevisveis. O resultado final depende
do acaso.
105
importante destacar que os experimentos mencionados possuem algumas
caractersticas em comum:
a) Cada experimento poder ser repetido indefinidamente sob
condies essencialmente inalteradas;
b) Muito embora no seja possvel afirmar que resultado particular
ocorrer, pode-se descrever o conjunto de todos os possveis
resultados do experimento;
c) Quando o experimento for executado repetidamente, os resultados
individuais parecero ocorrer de forma acidental. Porm, quando o
experimento for repetido um grande nmero de vezes, uma
configurao definida ou uma regularidade surgir.
3 - Espao Amostral
Um conjunto de resultados totais pode ser obtido ao ser realizada uma
experincia aleatria, embora um e somente um resultado possa ser obtido por
vez. Logo, por espao amostral, entende-se:
.
Considerando os quatros experimentos aleatrios citados no item anterior, o
espao amostral para cada um deles pode ser descrito, respectivamente, por:
S1: {1; 2; 3; 4; 5; 6}
S2: {0; 1; 2; 3}
S3: {0; 1; 2; 3; .........; N}
4 - Eventos
106
Em relao aos quatro experimentos aleatrios apresentados inicialmente,
podem ser citados, respectivamente, como os eventos abaixo:
A1: {2; 4; 6}; isto , um nmero par ocorre.
A2: {2}; isto , duas caras ocorrem.
A3: {0}; isto , todas as peas so perfeitas.
5 - Probabilidade
Dado um experimento aleatrio, sendo S o seu espao amostral, vamos
admitir que todos os elementos de S tenham a mesma chance de acontecer, ou
seja, que S um conjunto equiprovvel.
107
2 - No lanamento de um dado qual a probabilidade de obter um nmero par
em um evento A?
S = {1,2,3,4,5,6} = 6 A = {2,4,6} = 3 P (A) = 3/6 = 0,5 = 50%
3 - No lanamento de um dado qual a probabilidade de obter um nmero
menor ou igual a 6 em um evento A?
S = {1,2,3,4,5,6} = 6 A = {1,2,3,4,5,6} = 6 P (A) = 6/6 = 1,0 = 100%
Obs.: a probabilidade de todo evento certo igual a 1 ou 100%.
4 - No lanamento de um dado qual a probabilidade de obter um nmero
maior que 6 em um evento A?
S = {1,2,3,4,5,6} = 6 A={ }=0 P (A) = 0/6 = 0 = 0%
Obs.: a probabilidade de todo evento impossvel igual a 0 ou 0%
6 - Eventos Complementares
Sabemos que um evento pode ocorrer ou no. Sendo p a probabilidade de que
ele ocorra (sucesso) e q a probabilidade de que ele no ocorra (insucesso),
para um mesmo evento existe sempre a relao:
p+q=1
108
Soluo: O termo "3 para 2" significa: de cada 5 corridas ele ganha 3 e perde
2. Ento p = 3/5 ou 60% (ganhar) e q = 2/5 ou 40% (perder).
7 - Eventos Independentes
Dizemos que dois eventos so independentes quando a realizao ou a no-
realizao de um dos eventos no afeta a probabilidade da realizao do outro
e vice-versa. Por exemplo, quando lanamos dois dados, o resultado obtido em
um deles independe do resultado obtido no outro.
Se dois eventos so independentes, a probabilidade de que eles se realizem
simultaneamente igual ao produto das probabilidades de realizao dos dois
eventos.
Assim, se p1 a probabilidade de realizao do primeiro evento e p2 a
probabilidade de realizao do segundo evento, a probabilidade de que tais
eventos se realizem simultaneamente dada por:
p = p1 x p2
Esta regra tambm conhecida como Teorema do produto, que se aplica nas
operaes multiplicativas de probabilidades. Operaes multiplicativas
geralmente envolvem a conjuno e, e so representadas pelo smbolo de
interseco .
109
1 Ao lanarmos dois dados, qual a probabilidade de obtermos o nmero 1 no
primeiro e o nmero 5 no segundo dado?
Soluo:
A probabilidade de obtermos 1 no primeiro dado : p1 = 1/6
A probabilidade de obtermos 5 no segundo dado : p2 = 1/6
Logo, a probabilidade de obtermos, simultaneamente, 1 no primeiro e 5 no
segundo :
p = 1/6 x 1/6 = 1/36 ou 2,78%
110
Veja os exemplos apresentados a seguir, em que os eventos so classificados
como mutuamente exclusivos ou excludentes.
111
A probabilidade de obtermos uma bola branca : p2 = 4/15
Logo, a probabilidade da extrao de uma bola vermelha ou branca :
p = 4/15 + 6/15 = 10/15 ou 66,67%
Exerccios Resolvidos
112
probabilidade de as bolas retiradas da primeira, segunda e terceira urnas
serem, respectivamente, branca, preta e verde?
Resposta: Temos: p1 = 3/9 = 1/3; p2 = 2/8= 1/4 e p3 = 4/9. Como esses trs
acontecimentos so independentes e simultneos, vem: p = 1/3 x 1/4 x 4/9 =
1/27 ou 3,70%.
113
12 Dois dados so lanados conjuntamente. Determine a probabilidade de a
soma ser 10 ou maior que 10.
Resposta: A soma dever ser ento 10, 11 ou 12. Para que a soma seja 10, a
probabilidade (4,6); (5,5) e (6,4), logo: p = 3/36. Para que a soma seja 11,
a probabilidade (5,6) e (6,5), logo: p = 2/36. Para que a soma seja 12, a
probabilidade (6,6), logo: p = 1/36.
Como esses trs eventos so mutuamente exclusivos, temos: p = 3/36 + 2/36
+ 1/36 = 6/36 = 1/6 ou 16,67%.
EXERCCIOS
5 Uma bola retirada ao acaso de uma urna que contm 12 bolas pretas, 16
verdes e 8 rosas. Calcule a probabilidade de: (a) no ser verde; (b) no ser
preta; (c) ser rosa.
114
8 Uma urna contm 50 bolas idnticas. Sendo as bolas numeradas de 1 a 50,
determine a probabilidade de, em uma extrao ao acaso: (a) obtermos a bola
de nmero 27; (b) obtermos uma bola de nmero par; (c) obtermos uma bola
de nmero maior que 20; (d) obtermos uma bola de nmero menor ou igual a
20.
10 Um lote formado por dez peas boas, quatro com defeitos e duas com
defeitos graves. Uma pea escolhida ao acaso. Calcule a probabilidade de
que: (a) ela no tenha defeitos graves; (b) ela no tenha defeitos; (c) ela se boa
ou tenha defeitos graves.
115
IX DISTRIBUIES BINOMIAL E NORMAL
1 - Varivel Aleatria
PONTO
X
AMOSTRAL
(Ca, Ca) 2
(Ca, Co) 1
(Co, Ca) 1
(Co, Co) 0
2 Distribuio de Probabilidade
Consideremos a distribuio de frequncias relativa ao nmero de acidentes
dirios em um estacionamento:
N DE
FREQUENCIAS
ACIDENTES
0 22
1 5
2 2
3 1
TOTAL 30
116
Em um dia, a probabilidade de:
- no ocorrer acidente : p = 22/30 = 0,73 ou 73%
- ocorrer um acidente : p = 5/30 = 0,17 ou 17%
- ocorrerem dois acidentes : p = 2/30 = 0,07 ou 7%
- ocorrerem trs acidentes : p = 1/30 = 0,03 ou 3%
Podemos, ento, escrever:
N DE
PROBABILIDADES
ACIDENTES
0 0,73
1 0,17
2 0,07
3 0,03
TOTAL 1,00
Essa tabela denominada distribuio de probabilidade.
Seja X uma varivel aleatria que pode assumir os valores x 1, x2, x3, ....., xn. A
cada valor xi correspondem a probabilidade pi de ocorrncia de tais pontos no
espao amostral.
Assim, temos:
pi = 1
Os valores x1, x2, x3, ....., xn e seus correspondentes p1, p2, p3, ....., pn definem
uma distribuio de probabilidade.
117
Logo, podemos escrever:
X P(X)
1 1/6
2 1/6
3 1/6
4 1/6
5 1/6
6 1/6
1
118
3 Distribuio Binomial
Eventos binomiais so marcados pela existncia de duas categorias,
mutuamente excludentes e coletivamente exaustivos. Mutuamente excludentes
significa que uma categoria implica a possibilidade da no-ocorrncia
simultnea da outra categoria. Por coletivamente exaustivas entende-se que a
unio de ambos os eventos resulta no espao amostral.
Exemplos de eventos binomiais podem ser fornecidos por meio de nmeros
pares e mpares no lanamento de um dado honesto, e por meio da extrao de
cartas vermelhas e pretas de um baralho.
Geralmente, em anlises estatsticas, os exemplos mais comuns de eventos
binomiais so aqueles que estabelecem situaes de sucesso e fracasso.
Situaes de sucesso correspondem quilo que se deseja estudar. Situaes de
fracasso correspondem ao complemento. Ou seja, quilo que no se deseja
estudar.
Vamos, neste item, considerar experimentos que satisfaam as seguintes
condies:
a. O experimento deve ser repetido, nas mesmas condies, um nmero
finito de vezes (n).
b. As provas repetidas devem ser independentes, isto , o resultado de uma
no deve afetar os resultados das sucessivas.
c. Em cada prova deve aparecer um dos dois possveis resultados: sucesso
e insucesso.
d. No decorrer do experimento, a probabilidade p do sucesso e a
probabilidade q (q = 1 p) do insucesso manter-se-o constantes.
Resolveremos problemas do tipo: determinar a probabilidade de se obterem k
sucessos em n tentativas.
O experimento obteno de caras em cinco lanamentos sucessivos e
independentes de uma moeda satisfaz essas condies. Sabemos que, quando
da realizao de um experimento qualquer em uma nica tentativa, se a
probabilidade de realizao de um evento (sucesso) p, a probabilidade de
no-realizao desse mesmo evento (insucesso) 1 p = q.
119
Suponhamos, agora, que realizemos a mesma prova n vezes sucessivas e
independentes. A probabilidade de que um evento se realize k vezes nas
provas dada pela funo:
Na qual:
P (X = k) a probabilidade de que o evento se realize k vezes em n provas;
p a probabilidade de que o evento se realize em uma s prova sucesso;
q a probabilidade de que o evento no se realize no decurso dessa
insucesso;
Exerccios Resolvidos
1 Uma moeda lanada 5 vezes seguidas e independentes. Calcule a
probabilidade de serem obtidas 3 caras nessas 5 provas.
120
2 Dois times de futebol, A e B, jogam entre si 6 vezes. Encontre a
probabilidade de o time A ganhar 4 jogos.
121
4 A probabilidade de uma duplicata ser paga em dia de 70%. Escolhemos
ao acaso seis duplicatas para uma auditoria. Deseja-se calcular a probabilidade
de: (a) todas serem pagas em atraso; (b) Apenas uma ser paga em dia; (c)
todas serem pagas em dia.
Soluo: para resolver este problema podemos considerar como evento
sucesso i) duplicata paga em dia; ii) duplicata paga em atraso. Considerando a
primeira opo temos:
(a) Para calcular a probabilidade de todas serem pagas em atraso, ou
nenhuma ser paga em dia, temos x = 0.
P(x = 0) = C6,0(0,70)0(0,30)6-0 = 0,0007 ou 0,07%
(b) Para calcular a probabilidade de apenas uma duplicata ser paga em dia,
temos x = 1.
P(x = 1) = C6,1(0,70)1(0,30)6-1 = 0,01 ou 1%
(c) Para calcular a probabilidade de todas as duplicatas serem pagas em
dia, temos x = 6.
P(x = 6) = C6,6(0,70)6(0,30)6-6 = 0,118 ou 11,8%
EXERCCIOS
122
6 A probabilidade de um atirador acertar o alvo em um nico tiro 2/3. Se
ele atirar 5 vezes, qual a probabilidade de acertar exatamente 2 tiros?
7 Seis parafusos so escolhidos ao acaso da produo de certa mquina, que
apresenta 10% de peas defeituosas. Qual a probabilidade de serem
defeituosos dois deles?
8 Uma prova tipo teste tem 50 questes independentes. Cada questo tem 5
alternativas. Apenas uma das alternativas a correta. Se um aluno resolve a
prova respondendo a esmo as questes, qual a probabilidade de tirar nota 5?
9 Uma urna tem 20 bolas pretas e 30 brancas. Retiram-se 25 bolas com
reposio. Qual a probabilidade de que:
a. 2 sejam pretas?
b. Pelo menos 3 sejam pretas?
c. 10 sejam brancas?
10 A probabilidade de um arqueiro acertar o alvo com uma nica flecha
0,20. Lana 30 flechas no alvo. Qual a probabilidade de que:
a. Exatamente 4 acertem o alvo?
b. Pelo menos 3 acertem o alvo?
11 Considere 10 tentativas independentes de um experimento. Cada
tentativa admite sucesso com probabilidade 0,05. Seja X o nmero de
sucessos, calcular P (1< x 4).
12 Uma urna tem 10 bolas brancas e 40 pretas. Qual a probabilidade de que
em 30 bolas retiradas com reposio ocorram no mximo 2 brancas?
13 A probabilidade de um atirador acertar no alvo num nico tiro 1/4. O
atirador atira 20 vezes no alvo. Qual a probabilidade de acertar:
a. Exatamente 5 vezes?
b. Pelo menos 3 vezes?
c. Nenhuma vez?
d. No mximo 4 vezes?
14 Uma urna contm 8 bolas brancas e 12 pretas. Retiram-se 10 bolas com
reposio. Qual a probabilidade de que:
a. No mximo 2 sejam brancas?
b. 3 sejam brancas?
123
15 A probabilidade de uma mquina produzir uma pea defeituosa, num dia,
de 0,1. Qual a probabilidade de que em 20 peas produzidas pela mquina
num dia, ocorram 3 defeituosas?
16 Estima-se que cerca de 30% dos frangos congelados contenham
suficiente nmero de bactrias salmonelas causadoras de doenas, se forem
assados inadequadamente. Um consumidor compra 12 frangos congelados.
Qual a probabilidade do consumidor ter mais de 6 frangos contaminados?
124
22 Um vendedor de seguros vende aplices a 5 homens, todos da mesma
idade e de boa sade. De acordo com as tabelas atuariais, a probabilidade de
um homem, dessa idade particular, estar vivo daqui a 30 anos de 2/3.
Determinar a probabilidade de estarem ainda vivos daqui a 30 anos:
a) Todos os cinco homens;
b) Pelo menos 3;
c) Apenas 2;
d) Pelo menos 1.
23 Uma recente pesquisa detectou que 90% dos fumantes de uma regio
afirmaram desejar parar com seu vcio. Em uma amostra formada por dez
pessoas:
a) Qual a probabilidade de a maioria querer parar de fumar?
b) Qual a probabilidade de todos quererem parar de fumar?
125
4 Distribuio Normal
Entre as distribuies tericas de varivel aleatria contnua, uma das mais
empregadas a distribuio normal. Consiste em uma distribuio contnua
de probabilidades, onde a apresentao da distribuio de frequncias f(x) de
uma varivel qualitativa x costuma apresentar-se em forma de sino e simtrica
em relao mdia.
O estudo da distribuio normal recebeu contribuies de matemticos
importantes, como De Moivre, Laplace e Gauss. Alguns estudos revelam que
medies repetidas de uma mesma grandeza, como o dimetro de uma esfera
ou o peso de determinado objeto, nunca forneciam os mesmos valores. Porm,
a apresentao das frequncias dos inmeros nmeros coletados sempre
resultava em uma curiosa curva em forma de sino. Das observaes surgiu o
nome curva normal dos erros.
Muitas das variveis analisadas na pesquisa socioeconmica correspondem
distribuio normal ou dela se aproximam.
O aspecto grfico da distribuio normal o da figura abaixo:
126
Para uma perfeita compreenso da distribuio normal, observe a figura e
procure visualizar as seguintes propriedades:
127
fcil notar que essa probabilidade, indicada por: P(2< X < 2,05) corresponde
rea hachurada na figura:
128
Voltemos, ento, ao nosso problema.
Queremos calcular P(2< X < 2,05). Para obter essa probabilidade, precisamos,
em primeiro lugar, calcular o valor de z que corresponde a varivel x = 2,05,
j que para x = 2 z = 0, pois = 2. Temos ento:
Z = 2,05 2 / 0,04 = 1,25
donde:
P(2 < X < 2,05) = P(0 < Z < 1,25)
Procuremos, agora, na tabela Z em anexo, o valor de z = 1,25. Observe a
forma de entrada na tabela:
Na primeira coluna encontramos o valor 1,2 (nmero inteiro + 1 casa
decimal). Em seguida, encontramos, na primeira linha, o valor 5 (2 casa
decimal), que corresponde ao ltimo algarismo do nmero 1,25. Na
interseco da linha e coluna correspondentes encontramos o valor 0,3944, o
que nos permite escrever:
P(0 < Z < 1,25) = 0,3944
Assim, a probabilidade de um parafuso fabricado por essa mquina apresentar
um dimetro entre a mdia = 2 e o valor x = 2,05 0,3944.
Escrevemos, ento:
P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44%.
129
Exerccios Resolvidos
1 Com base na tabela Z determine as probabilidades:
a. P(-1,25 < Z < 0)
A probabilidade procurada corresponde parte hachurada da figura:
Temos que:
P(-0,5 < Z < 1,48) = P(-0,5 < Z < 0) + P(0 < Z < 1,48)
Como:
P(-0,5 < Z < 0) = P(0 < Z < 0,5) = 0,1915 e P(0 < Z < 1,48)= 0,4306
Obtemos:
P(-0,5 < Z < 1,48) = 0,1915 + 0,4306 = 0,6221ou 62,21%
130
c. P(0,8 < Z < 1,23)
A probabilidade procurada corresponde parte hachurada da figura:
Temos que:
P(0,8 < Z < 1,23) = P(0 < Z < 1,23) - P(0 < Z < 0,8)
Como:
P(0 < Z < 1,23)= 0,3907 e P(0 < Z < 0,8)= 0,2881
Obtemos:
P(0,8 < Z < 1,23) = 0,3907 - 0,2881 = 0,1026 ou 10,26%
Temos que:
P(Z > 0,6) = P(Z > 0) - P(0 < Z < 0,6)
Como: P(Z > 0)= 0,5 e P(0 < Z < 0,6)= 0,2258
Obtemos:
P(Z > 0,6) = 0,5 - 0,2258 = 0,2742 ou 27,42%
131
e. P(Z < 0,92)
A probabilidade procurada corresponde parte hachurada da figura:
Temos que:
P(Z < 0,92) = P(Z < 0) + P(0 < Z < 0,92)
Como:
P(Z < 0)= 0,5 e P(0 < Z < 0,92)= 0,3212,
Obtemos:
P(Z < 0,92) = 0,5 + 0,3212 = 0,8212 ou 82,12%.
132
EXERCCIOS
1 Sendo Z uma varivel com distribuio normal reduzida, baseado na
tabela Z calcule:
a. P(0 < Z < 1,44)
b. P(-0,85 < Z < 0)
c. P(- 1,48 < Z < 2,05)
d. P(0,72 < Z < 1,89)
e. P(Z > - 2,03)
f. P(Z > 1,08)
g. P(Z < - 0,66)
h. P(Z < 0,60)
133
5 No exerccio anterior, qual a nota que apresenta 93,70% de probabilidade
de um aluno tirar acima dela?
6 As alturas de 20000 alunos de um colgio tm distribuio
aproximadamente normal, com media 1,64 m e desvio padro 0,16 m. Pede-se:
a) Qual o nmero esperado de alunos com altura superior a 1,52 m?
b) Qual o intervalo simtrico em torno da media, que conter 78% das
alturas dos alunos?
c) Qual a altura esperada, no qual 15036 alunos estejam abaixo dela?
134
11 Uma fbrica de carros sabe que os motores de sua fabricao tm durao
normal com mdia de 150.000 km e desvio padro de 5.000 km. Qual a
probabilidade de que um carro, escolhido ao acaso, dos fabricados por essa
firma, tenha um motor que dure:
a. Menos de 170.000 km?
b. Entre 140.000 e 165.000 km?
c. Se a fbrica substitui o motor que apresenta durao inferior garantia,
qual deve ser esta garantia para que a porcentagem de motores
substitudos seja inferior a 0,2%?
135
16 Um estudo das modificaes dos preos, no atacado, de produtos
industrializados, mostrou que h distribuio normal com mdia de 50% e
desvio padro de 10%. Qual a porcentagem dos artigos que:
a. Sofreram aumentos superiores a 75%?
b. Sofreram aumentos entre 30% e 80%?
17 O volume de correspondncia recebido por uma firma quinzenalmente
tem distribuio normal com mdia de 4000 cartas e desvio padro de 200
cartas. Qual a percentagem de quinzenas em que a firma recebe:
a. Entre 3600 e 4250 cartas?
b. Mais de 4636 cartas?
c. Menos de 3400 cartas?
136
21 Suponha que as notas em certa disciplina esto normalmente distribudas
com mdia 5,0 e desvio padro 1,5:
a) determine o percentual de estudantes com nota superior a 8,0;
b) se a nota mnima para obter aprovao e 3,0, determine o percentual de
estudantes reprovados;
c) explique por que a probabilidade de um estudante dessa populao obter
nota acima de 9,8 praticamente zero.
22 Um fabricante de mquinas de lavar sabe, por longa experincia, que a
durao tem durao de suas mquinas tem distribuio normal com mdia de
1000 dias e desvio padro de 200 dias. O fabricante oferece uma garantia de 1
ano (365 dias) para o produto. Produz mensalmente 2000 mquinas. Quantas
mquinas ele espera trocar mensalmente pelo uso da garantia dada?
137
25 A distribuio dos pesos de porcos numa suinocultura pode muito bem
ser representada por uma distribuio normal, com mdia de 128,72 kg e
desvio padro de 32,46 kg. Um matadouro comprar 5000 porcos e pretende
classific-los de acordo com o peso, do seguinte modo: 18% dos mais leves
como pequenos, os 50% seguintes como mdios, os 22% seguintes como
grandes e os 10% mais pesados como extras. Quais os limites de peso para
cada classificao?
26 Um pesquisador verificou que em uma cidade do interior de So Paulo o
peso dos homens tem distribuio aproximadamente normal com mdia de 85
kg e desvio padro de 20 kg, enquanto o das mulheres tambm apresenta-se
normalmente distribudo, com mdia de 60 kg e desvio padro de 8 kg. Pede-
se: (a) sorteando-se um homem, qual a probabilidade de ele ter peso acima de
75 kg? (b) sorteando-se uma mulher, qual a probabilidade de ela ter peso
acima de 65 kg? (c) qual a probabilidade de uma pessoa ter peso acima de 65
kg, sendo ela sorteada de um grupo em que o nmero de mulheres o triplo
do de homens?
138
X CORRELAO E REGRESSO
1 - Introduo
Nos captulos anteriores, nossa preocupao era descrever a distribuio de
valores de uma varivel. Com esse objetivo, aprendemos a calcular medidas
de tendncia central e variabilidade.
Quando, porm, consideramos observaes de duas ou mais variveis, surge
um novo problema: as relaes que podem existir entre as variveis
estudadas. Nesse caso, as medidas estudadas no so suficientes.
Assim, quando consideramos variveis como peso e altura de um grupo de
pessoas, uso do cigarro e incidncia de cncer, vocabulrio e compreenso da
leitura, dominncia e submisso, procuramos verificar se existe alguma
relao entre as variveis de cada um dos pares e qual o grau dessa relao.
Para isso, necessrio o conhecimento de novas medidas.
Sendo a relao entre as variveis de natureza quantitativa, a correlao o
instrumento adequado para descobrir e medir essa relao.
Uma vez caracterizada a relao, procuramos descrev-la atravs de uma
funo matemtica. A regresso o instrumento adequado para a
determinao dos parmetros dessa funo.
2 Correlao
2.1 Relao funcional e relao estatstica
Como sabemos, o permetro e o lado de um quadrado esto relacionados. A
relao que os liga perfeitamente definida e pode ser expressa por meio de
uma sentena matemtica:
2p = 4l,
onde 2p o permetro e l o lado do quadrado.
Atribuindo-se, ento, um valor qualquer a l, possvel determinar exatamente
o valor de 2p.
Consideremos, agora, a relao que existe entre o peso e a estatura de um
grupo de pessoas. evidente que essa relao no do mesmo tipo da
anterior; ela bem menos precisa. Assim, pode acontecer que a estaturas
diferentes correspondam pesos iguais ou que a estaturas iguais correspondam
pesos diferentes. Porm, em media, quanto maior a estatura, maior o peso.
139
As relaes do tipo permetro-lado so conhecidas como relaes funcionais
e as do tipo peso-estatura, como relaes estatsticas.
Quando duas variveis esto ligadas por uma relao estatstica, dizemos
que existe correlao entre elas.
140
2.3 Correlao linear
Os pontos obtidos, vistos em conjunto, formam uma elipse em diagonal.
Podemos imaginar que, quanto mais fina for a elipse, mais ela se aproximar
de uma reta. Dizemos, ento, que a correlao de forma elptica tem como
imagem uma reta, sendo, por isso, denominada correlao linear.
possvel verificar que a cada correlao est associada como imagem uma
relao funcional. Por esse motivo, as relaes funcionais so chamadas
relaes perfeitas.
Como a correlao em estudo tem como imagem uma reta ascendente, ela
chamada correlao linear positiva.
Assim, uma correlao :
Linear positiva se os pontos do diagrama tm como imagem uma
reta ascendente;
Linear negativa se os pontos do diagrama tm como imagem uma
reta descendente;
No-linear se os pontos tm como imagem uma curva.
Se os pontos apresentam-se dispersos, no oferecendo uma imagem
definida, conclumos que no h relao alguma entre as variveis em estudo.
141
Temos, ento:
142
Assim:
Se a correlao entre duas variveis perfeita e positiva, ento r = +1;
Se a correlao perfeita e negativa, ento r = -1;
Se no h correlao entre as variveis, ento r = 0.
Logicamente:
Se r = +1, h uma correlao perfeita e positiva entre as variveis;
Se r = -1, h uma correlao perfeita e negativa entre as variveis;
Se r = 0, ou no h correlao entre as variveis, ou a relao que
porventura exista no linear.
NOTAS:
Para que uma relao possa ser descrita por meio do coeficiente de
correlao de Pearson imprescindvel que ela se aproxime de uma funo
linear. Uma maneira prtica de verificarmos a linearidade da relao a
inspeo do diagrama de disperso: se a elipse apresenta salincias ou
reentrncias muito acentuadas, provavelmente trata-se de correlao
curvilnea.
143
Tabela 2 Clculo dos valores de xiyi, xi2 e yi2 (n = 10)
Logo:
Da:
r = 0,91.
Resultado que indica uma correlao linear positiva altamente significativa
entre as duas variveis.
144
Resolva:
145
3 Regresso
3.1 Ajustamento da reta
Sempre que desejamos estudar determinada varivel em funo de outra,
fazemos uma anlise de regresso.
Podemos dizer que a anlise de regresso tem por objetivo descrever, atravs
de um modelo matemtico, a relao entre as duas variveis, partindo de n
observaes das mesmas.
A varivel sobre a qual desejamos fazer uma estimativa recebe o nome de
varivel dependente e a outra recebe o nome de varivel independente.
Assim, supondo X a varivel independente e Y a dependente, vamos procurar
determinar o ajustamento de uma reta relao entre essas variveis, ou seja,
vamos obter uma funo definida por:
Y = aX + b
onde a e b so os parmetros.
Sejam duas variveis X e Y, entre as quais exista uma correlao acentuada,
embora no perfeita, como, por exemplo, as que formam a tabela 2.
Da, temos:
Tabela 3 Valores das variveis xi e yi.
xi 5 8 7 10 6 7 9 3 8 2
yi 6 9 8 10 5 7 8 4 6 2
cujo diagrama de disperso dado por:
146
Podemos concluir, pela forma do diagrama, que se trata de uma correlao
retilnea, de modo a permitir o ajustamento de uma reta, imagem da funo
definida por:
Y = aX + b
Vamos, ento, calcular os valores dos parmetros a e b com a ajuda das
frmulas:
onde,
NOTA:
Como estamos fazendo uso de uma amostra para obtermos os valores dos
parmetros, o resultado, na realidade, uma estimativa da verdadeira equao de
regresso. Sendo assim, escrevemos:
147
Formemos, ento, a tabela de valores:
Tabela 4 Clculo dos valores de xiyi e xi2 (n = 10).
(xi) (yi) xiyi x i2
5,0 6,0 30 25
8,0 9,0 72 64
7,0 8,0 56 49
10,0 10,0 100 100
6,0 5,0 30 36
7,0 7,0 49 49
9,0 8,0 72 81
3,0 4,0 12 9
8,0 6,0 48 64
2,0 2,0 4 4
= 65 = 65 = 473 = 481
Temos, assim:
a = 10x473 65x65 = 4730 4225 = 505 = 0,8632
10x481 (65)2 4810 4225 585
148
Assim, temos:
Como a nota 4,0 pertence ao intervalo [2,10], dizemos que foi feita uma
interpolao; e como a nota 1,0 no pertence ao intervalo [2,10], dizemos que
foi uma extrapolao.
NOTA:
Uma norma fundamental no uso das equaes de regresso a de nunca extrapolar,
exceto quando consideraes tericas ou experimentais demonstrem a possibilidade
de extrapolao.
149
Resolva:
xi 2 4 6 8 10 12 14
yi 30 25 22 18 15 11 10
150
EXERCCIOS
xi 11 14 19 19 22 28 30 31 34 37
yi 13 14 18 15 22 17 24 22 24 25
a) Verifique, pelo diagrama, se existe correlao retilnea;
b) Em caso afirmativo, calcule o coeficiente de correlao;
c) Escreva, em poucas linhas, as concluses a que chegou sobre a relao
entre as variveis.
3 A tabela abaixo apresenta a produo de uma indstria:
ANOS 1980 1981 1982 1983 1984 1985 1986 1987 1988
QUANTIDADES (t) 34 36 36 38 41 42 43 44 46
Calcule:
a) O coeficiente de correlao;
Sugesto: para simplificar os clculos, use para o tempo uma varivel
auxiliar, por exemplo:
xi = xi - 1984
b) A reta ajustada;
c) A produo estimada para o ano de 1989.
151
4 A tabela abaixo apresenta valores que mostram como o comprimento de
uma barra de ao varia conforme a temperatura:
TEMPERATURA (C) 10 15 20 25 30
COMPRIMENTO (mm) 1003 1005 1010 1011 1014
Determine:
a) O coeficiente de correlao;
b) A reta ajustada a essa correlao;
c) O valor estimado do comprimento da barra para a temperatura de 18C;
d) O valor estimado do comprimento da barra para a temperatura de 35C;
6 A partir da tabela:
xi 1 2 3 4 5 6
yi 70 50 40 30 20 10
a) Calcule o coeficiente de correlao;
b) Determine a reta ajustada;
c) Estime o valor de Y para X = 0.
152
7 Certa empresa, estudando a variao da demanda de seu produto em
relao variao de preo de venda, obteve a tabela:
Determine:
a) O clculo do coeficiente de correlao;
b) A equao de regresso de Y para X;
c) A equao de regresso de X para Y.
153
REFERENCIAS
Silva, Ermes Medeiro da; Silva, Elio Medeiro da; Gonalves; Valter; Murolo,
Afrnio Carlos. Estatstica: Para os cursos de economia, Administrao e
Cincias Contbeis - 1. 3.ed. So Paulo: Editora Atlas, 1999.
154
ANEXOS:
Tabela de Nmeros Aleatrios;
Tabela de Distribuio Normal.
155
TABELA DE NMEROS ALEATRIOS
C1 C2 C3 C4 C5 C6 C7 C8 C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 C21 C22 C23 C24 C25 C26 C27 C28 C29
L1 4 1 6 1 6 1 0 2 3 5 7 6 2 0 9 9 8 1 0 3 4 7 2 1 0 8 7 8 4
L2 3 0 7 2 6 3 9 5 5 3 4 8 8 0 9 3 0 1 7 0 4 0 8 3 1 2 0 1 2
L3 2 2 5 3 7 5 0 1 9 8 7 6 3 0 0 1 2 1 4 3 2 4 5 6 7 7 4 3 0
L4 1 9 8 4 7 7 8 6 5 2 7 8 1 0 0 7 5 3 2 2 5 8 1 9 0 3 2 3 4
L5 0 3 4 5 8 9 0 2 0 3 1 0 1 1 2 4 3 1 9 5 6 8 5 0 2 3 4 9 0
L6 0 8 9 6 8 1 7 2 2 2 2 8 6 1 9 4 5 2 0 0 1 3 1 0 9 2 3 4 1
L7 8 3 3 7 9 0 6 3 7 6 4 0 7 1 2 1 0 1 2 8 9 7 5 3 2 1 1 8 2
L8 8 8 0 8 9 2 3 6 3 7 3 7 8 9 4 3 9 2 3 2 3 0 0 4 4 2 3 1 3
L9 5 4 1 9 0 0 2 0 3 7 5 0 9 7 6 5 7 8 0 8 4 5 2 3 0 7 4 3 6
L10 6 7 2 0 0 3 1 1 1 2 6 0 2 0 8 0 9 7 7 7 3 6 7 2 9 0 3 1 0
L11 4 4 0 5 1 9 1 9 4 1 8 4 2 1 3 3 2 7 6 4 4 3 8 9 0 7 2 2 9
L12 3 5 1 4 3 3 0 3 2 3 7 0 3 4 5 8 9 3 5 2 4 0 1 7 9 1 8 1 3
L13 2 6 9 3 5 8 2 3 6 5 0 2 6 3 6 7 0 1 7 9 6 8 3 5 3 3 5 7 2
L14 0 1 2 2 7 4 0 7 0 7 9 0 0 6 5 2 7 8 1 0 0 7 5 3 0 9 1 1 3
L15 9 0 8 1 9 8 3 8 3 9 4 0 1 9 5 2 2 0 0 2 1 2 4 7 6 3 2 1 5
L16 7 2 2 0 2 5 0 5 3 2 1 3 5 8 9 1 2 3 9 6 5 2 7 8 1 0 0 7 0
L17 8 9 3 9 4 7 4 1 1 4 2 4 6 7 0 2 3 7 8 5 3 1 2 5 6 9 0 7 9
L18 6 3 0 8 6 6 0 1 4 6 2 2 3 3 0 1 5 4 5 1 1 3 4 7 8 1 2 8 8
L19 5 8 1 7 8 7 5 9 4 8 0 0 2 3 6 9 6 4 3 6 7 2 1 9 7 0 1 8 5
L20 3 4 0 6 0 1 9 8 4 0 2 9 2 3 2 5 3 5 7 2 7 8 2 5 6 2 2 9 4
L21 8 7 2 1 1 3 5 2 4 1 7 5 7 3 0 0 9 1 2 0 3 4 9 3 0 4 4 9 1
L22 1 4 9 1 3 2 8 6 1 2 0 2 0 1 3 5 4 6 4 3 2 0 0 3 9 6 6 0 2
L23 2 7 3 2 5 4 6 5 8 4 0 8 0 1 9 6 9 5 0 8 0 2 4 9 8 8 8 0 3
L24 4 3 8 2 7 3 7 8 0 3 0 9 2 2 6 7 6 4 9 8 9 4 7 7 7 0 0 2 4
L25 5 0 3 3 9 5 7 0 4 5 8 7 4 2 2 3 8 2 1 2 2 0 7 0 6 1 1 2 5
L26 2 5 7 3 0 4 2 2 6 6 1 1 0 3 9 9 1 0 3 4 3 9 6 3 5 3 3 4 8
L27 1 1 4 4 2 6 3 2 0 8 9 2 3 3 7 7 4 0 5 6 8 8 5 2 4 5 5 4 0
L28 0 2 7 4 3 6 4 3 1 7 1 0 2 0 9 6 4 3 7 9 0 7 6 1 3 7 5 5 8
L29 9 1 5 5 6 8 5 6 9 8 2 0 2 3 0 1 4 3 3 7 7 5 6 7 4 3 4 0 1
156
157