Académique Documents
Professionnel Documents
Culture Documents
2015
SUMRIO
INTRODUO ............................................................................................ 03
UNIDADE 1: A NATUREZA DA ESTATSTICA ................................... 05
UNIDADE 2: POPULAO E AMOSTRA ............................................. 12
UNIDADE 3: SRIES ESTATSTICAS.................................................... 19
UNIDADE 4: GRFICOS ........................................................................... 31
UNIDADE 5: DISTRIBUIO DE FREQUENCIA ................................ 46
UNIDADE 6: MEDIDAS DE POSIO ................................................... 66
UNIDADE 7: MEDIDAS DE DISPERSO OU VARIABILIDADE....... 94
UNIDADE 8: PROBABILIDADE ............................................................ 109
UNIDADE 9: DISTRIBUIO BINOMIAL E NORMAL ................... 118
UNIDADE 10: CORRELAO E REGRESSO .................................. 143
REFERENCIAS ......................................................................................... 158
ANEXOS ..................................................................................................... 159
INTRODUO
Segundo Rao (1999), a estatstica uma cincia que estuda e pesquisa sobre: o
levantamento de dados com a mxima quantidade de informao possvel para um
dado custo; o processamento de dados para a quantificao da quantidade de
incerteza existente na resposta para um determinado problema; a tomada de decises
sob condies de incerteza, sob o menor risco possvel. Finalmente, a estatstica tem
sido utilizada na pesquisa cientfica, para a otimizao de recursos econmicos, para
o aumento da qualidade e produtividade, na otimizao em anlise de decises, em
questes judiciais, previses e em muitas outras reas.
I - A NATUREZA DA ESTATSTICA
A palavra estatstica formou-se da mesma raiz latina da palavra Estado
(Organizao Poltica): status; porque, originalmente, as estatsticas eram
colhidas para as finalidades relacionadas com o Estado (com objetivos militares,
tributrios, recenseamentos, entre outros).
PANORAMA HISTRICO
Todas as cincias tm suas razes na histria do homem.
A Matemtica, que considerada a cincia que une clareza do raciocnio a sntese
da linguagem, originou-se do convvio social, das trocas, da contagem, com carter
prtico, utilitrio, emprico.
A estatstica, ramo da matemtica aplicada, teve origem semelhante.
Desde a antiguidade, vrios povos j registravam o nmero de habitantes, de
nascimentos, de bitos, faziam estimativas das riquezas individual e social,
distriburam equitativamente terras ao povo, cobravam impostos e realizavam
inquritos quantitativos por processos que, hoje, chamaramos de "estatsticas".
Na idade mdia colhiam-se informaes, geralmente com finalidades tributrias ou
blicas.
A partir do sculo XVI comearam a surgir as primeiras anlises sistemticas de
fatos sociais, como batizados, casamentos, funerais, originando as primeiras tbuas
e tabelas e os primeiros nmeros relativos.
No sculo XVIII o estudo de tais fatos foi adquirindo, aos poucos, feio
verdadeiramente cientfica. Godofredo Achenwall batizou a nova cincia (ou
mtodo) com o nome de Estatstica, determinando o seu objetivo com as cincias.
As tabelas tornam-se mais completas, surgiram as representaes grficas e o
clculo das probabilidades, e a estatstica deixa de ser uma simples catalogao de
dados numricos para se tornar o estudo de como se chegar a concluso sobre uma
populao, partindo da observao de partes dessa populao (amostra).
Atualmente, o pblico leigo (leitor de jornais e revistas) posiciona-se em dois
extremos divergentes e igualmente errneos quanto a validade das concluses
estatsticas: ou cr em sua infalibilidade ou afirma que elas nada provam. Os que
assim pensam ignoram os objetivos, o campo e o rigor do mtodo estatstico;
ignoram a Estatstica, quer terica quer prtica, ou a conhecem muito
superficialmente.
Na era da energia nuclear, os estudos estatsticos tm avanado rapidamente e, com
seus processos e tcnicas, tm contribudo para a organizao dos negcios e
recursos do mundo moderno.
MTODO ESTATSTICO
O Mtodo Cientfico
Muitos dos conhecimentos que temos foram obtidos na antiguidade por acaso e,
outros, por necessidades prticas, sem aplicao de um mtodo.
Atualmente, quase todo acrscimo de conhecimento resulta da observao e do
estudo. Se bem que muito desse conhecimento possa ter sido observado inicialmente
por acaso, a verdade que desenvolvemos processos cientficos para seu estudo e
para adquirirmos tais conhecimentos. Podemos ento dizer que:
Mtodo: um conjunto de meios dispostos convenientemente para se chegar
a um fim que se deseja, ou seja, um meio mais eficaz para atingir
determinada meta.
Dos mtodos cientficos, vamos destacar o Mtodo experimental e o Mtodo
estatstico. O Mtodo Experimental - o mtodo preferido pela fsica, Qumica, etc.
Mtodo experimental: consiste em manter constantes todas as causas
(fatores), menos uma, e variar esta causa de modo que o pesquisador possa
descobrir seus efeitos, caso existam.
O Mtodo Estatstico
Muitas vezes temos necessidade de descobrir fatos em um campo em que o mtodo
experimental no se aplica (nas cincias sociais), j que os vrios fatores que afetam
o fenmeno em estudo no podem permanecer constantes enquanto fazemos variar a
causa que, naquele momento, nos interessa.
Como exemplo, podemos citar a determinao das causas que definem o preo de
uma mercadoria. Para aplicarmos o mtodo experimental, teramos de fazer variar a
quantidade da mercadoria e verificar se tal fato iria influenciar seu preo.
Contudo, seria necessrio que no houvesse alterao nos outros fatores. Assim,
deveria existir, no momento da pesquisa, uma uniformidade dos salrios, o gosto
dos consumidores deveria permanecer constante, seria necessria a fixao do nvel
geral dos preos das outras necessidades etc. Mas isso tudo impossvel.
Nesses casos, lanamos mo de outro mtodo, embora mais difcil e menos preciso,
denominado mtodo estatstico.
Mtodo estatstico: diante da impossibilidade de manter as causas constantes,
admitem todas essas causas presentes variando-as, registrando essas variaes
e procurando determinar, no resultado final, que influncias cabem a cada
uma delas.
6
A ESTATSTICA
Exprimindo por meio de nmeros as observaes que se fazem de elementos com,
pelo menos, uma caracterstica comum (por exemplo: os alunos do sexo masculino
de uma comunidade), obtemos os chamados dados referentes a esses elementos.
Podemos dizer, ento, que:
A Estatstica uma parte da matemtica aplicada que fornece mtodos para a coleta,
organizao, descrio, anlise e interpretao de dados e para a utilizao dos
mesmos na tomada de decises.
A Estatstica Descritiva se encarrega de fazer a coleta, organizao e
descrio dos dados.
A Estatstica Indutiva ou Inferencial se encarrega de fazer a anlise e
interpretao dos dados.
Em geral, as pessoas, quando se referem ao termo estatstica, o fazem no sentido da
organizao e descrio dos dados (estatstica do Ministrio da educao,
estatsticas dos acidentes de trfego etc.), desconhecendo que o aspecto essencial
da Estatstica o de proporcionar mtodos inferenciais, que permitam
concluses que transcendam os dados obtidos inicialmente.
Assim, a anlise e a interpretao dos dados estatsticos tornam possvel o
diagnstico de uma empresa (por exemplo, de uma escola), o conhecimento de seus
problemas (condies de funcionamento, produtividade), a formulao de solues
apropriadas e um planejamento objetivo de ao.
Fases do Mtodo estatstico:
Podemos distinguir no mtodo estatstico as seguintes fases:
1 Coleta de Dados
Aps cuidadoso planejamento e a devida determinao das caractersticas
mensurveis do fenmeno coletivamente tpico que se quer pesquisar, damos incio
coleta dos dados numricos necessrios sua descrio.
A coleta de dados pode ser direta ou indireta.
1.1 Direta:
Quando ela feita sobre elementos informativos de registro obrigatrio
(nascimentos, casamentos e bitos, importao e exportao de mercadorias),
elementos pertinentes aos pronturios dos alunos de uma escola ou, ainda, quando
os dados so coletados pelo prprio pesquisador atravs de inquritos e
questionrios, como o caso das notas de verificao e de exames, do censo
demogrfico, etc.
A coleta direta de dados pode ser classificada relativamente ao fator tempo em:
Contnua (registro): quando feita continuamente, tal como a de nascimentos,
bitos e a frequncia dos alunos s aulas;
Peridica: quando feita em intervalos constantes de tempo, como os censos
(de 10 em 10 anos) e as avaliaes peridicas; recenseamento demogrfico,
censo industrial;
Ocasional: quando feita extemporaneamente, a fim de atender a uma
conjuntura ou a uma emergncia, como no caso de epidemias que assolam ou
dizimam rebanhos inteiros.
1.2 Indireta:
Quando inferida de elementos conhecidos (coleta direta) e/ou conhecimento de
outros fenmenos relacionados com o fenmeno estudado. Como por exemplo,
podemos citar a pesquisa sobre mortalidade infantil, que feita atravs de dados
colhidos por uma coleta direta.
2 Crtica dos Dados
Obtidos os dados, eles devem ser cuidadosamente criticados, procura de possveis
falhas e imperfeies, a fim de no incorrermos em erros grosseiros ou de certo
vulto, que possam influir sensivelmente nos resultados.
A crtica dos dados se divide em: externa e interna
Crtica externa quando visa s causas dos erros por parte do informante, por
distrao ou m interpretao das perguntas que lhe foram feitas.
Crtica interna quando visa observar os elementos originais dos dados da
coleta.
Tudo isso que se pensou, se planejou, precisa ficar registrado, documentado para
evitar esquecimentos, a fim de garantir o bom uso do tempo, da energia e do
material e, ainda, para controle eficiente do trabalho.
O esquema do planejamento o plano, que pode ser resumido, com auxlio da
estatstica, em tabelas e grficos, que facilitaro a compreenso visual dos clculos
matemtico-estatsticos que lhes deram origens.
O homem de hoje, em suas mltiplas atividades, lana mo de processos e tcnicas
estatsticas, e s estudando-os evitaremos o erro das generalizaes apressadas a
respeito de tabelas e grficos apresentados em jornais, revistas e televiso,
frequentemente cometido quando se conhece apenas por cima um pouco de
Estatstica.
10
EXERCCIOS
1. Complete:
O mtodo experimental o mais usado por cincias como: ____________________.
2. As cincias humanas e sociais, para obter os dados que buscam, lanam mo de
que mtodo?
3. O que Estatstica?
4. Cite as fases do mtodo estatstico.
5. Para voc, o que coletar dados?
6. Para que serve a crtica dos dados?
7. O que apurar dados?
8. Como podem ser apresentados ou expostos os dados?
9. As concluses, as inferncias pertencem a que parte da Estatstica?
10. Cite trs ou mais atividades do planejamento empresarial em que a Estatstica se
faz necessria.
11. O mtodo estatstico tem como um de seus fins:
a)
b)
c)
d)
e)
11
II POPULAO E AMOSTRA
1 VARIVEL
A cada fenmeno corresponde um nmero de resultados possveis. Assim, por
exemplo:
- para um fenmeno sexo so dois os resultados possveis: masculino
e feminino;
- para o fenmeno nmero de filhos h um nmero de resultados
possveis expressos atravs dos nmeros naturais: 0,1,2,3,....,n;
- para o fenmeno estatura temos uma situao diferente, pois os
resultados podem tomar um nmero infinito de valores numricos dentro de um
determinado intervalo.
Varivel: , convencionalmente, o conjunto de resultados possveis de um
fenmeno. Uma varivel qualquer caracterstica de um elemento observado
(pessoa, objeto ou animal).
Algumas variveis, como sexo e designao de emprego, simplesmente enquadram
os indivduos em categorias. Outras, como altura e renda anual, tomam valores
numricos com os quais podemos fazer clculos.
Uma varivel pode ser: qualitativa ou quantitativa
Qualitativa: quando seus valores so expressos por atributos; ex.: sexo
(masculino ou feminino), cor da pele (branca, preta, amarela, vermelha,
parda) etc.;
Quantitativa: quando seus valores so expressos em nmeros; ex.: salrios
dos operrios, idade, altura, etc. Divide-se em discreta e contnua:
Discreta ou descontnua: seus valores so expressos geralmente atravs
de nmeros inteiros no negativos. Resulta normalmente de contagens.
Ex.: nmero de alunos de uma escola que pode assumir qualquer um
dos valores do conjunto N = {1, 2, 3, ..., 58,...}, mas nunca valores
como 2,5 ou 3,78 ou 4,325 etc.
Contnua: resulta normalmente de uma mensurao, e a escala
numrica de seus possveis valores corresponde ao conjunto R dos
nmeros reais, ou seja, podem assumir, teoricamente, qualquer valor
entre dois limites. Ex.: peso dos alunos de uma escola, pois um aluno
12
tanto pode pesar 72 kg, como 72,5 kg, como 72,54 kg, dependendo da
preciso da medida.
De modo geral, as medies do origem a variveis contnuas e as contagens ou
enumeraes, a variveis discretas.
Designamos as variveis por letras latinas, em geral, as ltimas: x, y, z.
Por exemplo, sejam 2, 3, 5 e 8 todos os resultados possveis de um dado fenmeno.
Fazendo uso da letra x para indicar a varivel relativa ao fenmeno considerado,
temos:
x {2, 3, 5, 8}
Exerccio resolvido:
1. Classifique as variveis em qualitativas e quantitativas (contnuas ou discretas):
a) Cor dos olhos Qualitativa
b) ndice de liquidez nas indstrias Cearenses Quantitativa contnua
c) Produo de caf no Brasil Quantitativa contnua
d) Nmero de defeitos em aparelhos de TV Quantitativa discreta
e) Comprimento dos pregos produzidos por uma empresa Quantitativa contnua
f) O ponto obtido em cada jogada de um dado quantitativa discreta
Resolva:
1. Classifique as variveis em qualitativas e quantitativas (contnuas ou discretas):
a) Cor dos cabelos
b) Nmero de filhos
c) Nmero de peas produzidas por hora
d) Dimetro de uma pea
e) Nmero de volumes de uma biblioteca
f) produo de algodo em um ano
2 POPULAO E AMOSTRA
Dois conceitos devem estar bem claros: o de populao e o de amostra, pois deles
que so extrados os dados que do origem s diversas relaes estatsticas, como a
mdia, o desvio-padro, etc., e que, em ltima anlise, possibilitam descreve-las sob
os mais diversos aspectos.
13
POPULAO
MASCULINO
54
FEMININO
36
TOTAL
90
10 %
10 x 54 = 5,4
100
10 x 36 = 3,6
100
10 x 90 = 9
100
AMOSTRA
5
4
9
Resolva:
1. Pesquise o peso de seus colegas de classe (incluindo o seu) e retire uma amostra
de 30% da populao.
Sugesto: Use a tabela de Tabela de Nmeros Aleatrios (5 e 6 colunas, de baixo
para cima).
2. Pesquise a estatura de seus colegas de classe (incluindo o seu) e retire uma
amostra de 15% da populao.
Sugesto: Use a tabela de Tabela de Nmeros Aleatrios (25 linha, da esquerda
para a direita).
3 Em uma escola existem 250 alunos, sendo 35 na 1 srie, 32 na 2, 30 na 3, 28
na 4, 35 na 5, 32 na 6, 31 na 7 e 27 na 8. Obtenha uma amostra de 40 alunos e
preencha o quadro a seguir.
16
N DE ESTUDANTES
MASCULINO
FEMININO
80
95
102
120
110
92
134
228
150
130
300
290
876
955
18
Zero (0) quando o valor muito pequeno para ser expresso pela unidade
utilizada. Se os valores so expressos em numerais decimais, precisamos
acrescentar parte decimal um nmero correspondente de zeros (0,0; 0,00;
0,000; .....);
Obs.: Os lados direito e esquerdo de uma tabela oficial devem ser abertos.
SRIES ESTATSTICAS
Denominamos sries estatsticas toda tabela que apresenta a distribuio de um
conjunto de dados estatsticos em funo da poca, do local ou da espcie.
Da, podemos inferir que numa srie estatstica observamos a existncia de trs
elementos ou fatores: o tempo, o espao e a espcie.
Dividem-se em sries homgradas e conjugadas.
Sries Homgradas: so aquelas em que a varivel descrita apresenta variao
discreta ou descontnua. Podem ser do tipo temporal, geogrfica ou
especfica.
20
PREO (R$)
2003
2004
2005
2006
2007
2008
2,56
2,64
2,67
2,53
3,20
3,64
N DE ANOS
Itlia
Alemanha
Frana
Holanda
Inglaterra
7,5
7,0
7,0
5,9
Menos de 4
QUANTIDADE
Bovinos
Bubalinos
Aves
Sunos
Ovinos
Caprinos
205.886.244
1.156.870
821.541.630
35.173.824
16.019.170
10.401.449
Fonte: IBGE.
21
1991
1992
1993
Norte
Nordeste
Sudeste
Sul
Centro-Oeste
342.938
1.287.813
6.234.501
1.497.315
713.357
375.658
1.379.101
6.729.467
1.608.989
778.925
403.494
1.486.649
7.231.634
1.746.232
884.822
22
Resolva:
1 Classifique as sries
23
VENDAS
(mil und.)
FIAT
VW
GM
TOTAL
17
23
12
52
a) Classifique a srie;
b) Represente esta srie atravs de grfico de setores.
4 Considere a srie abaixo:
Vendas no Ano de 2014 (em mil unidades)
FILIAIS
JAN
FEV
MAR
SO PAULO
FORTALEZA
RIO DE JANEIRO
TOTAL
10
8
12
30
15
5
13
33
7
4
10
21
a) Classifique a srie;
b) Represente esta srie atravs de grfico de colunas;
c) Represente esta srie atravs de grfico de barras;
5 Verificou-se, em 1993, o seguinte movimento de importao de mercadorias:
14.839.804 t, oriundas da Arbia Saudita; 10.547.889 t, dos Estados Unidos; e
561.024 t, do Japo, no valor de US$ 1.518.843.000. Confeccione a srie
correspondente e classifique-a, sabendo que os dados acima foram fornecidos pelo
Ministrio da Fazenda.
24
6-
Complete-a com uma coluna de percentagens com uma casa decimal e faa a
compensao, se necessrio.
DADOS ABSOLUTOS E DADOS RELATIVOS
Dados absolutos: so dados resultantes da coleta direta da fonte, sem outra
manipulao seno a contagem ou medida.
A leitura dos dados absolutos sempre enfadonha e inexpressiva; embora esses
dados traduzam um resultado exato e fiel, no tm a virtude de ressaltar de imediato
as suas concluses numricas. Da o uso imprescindvel que faz a Estatstica dos
dados relativos.
Dados relativos: so os resultados de comparaes por quocientes (razes)
que se estabelecem entre dados absolutos e tm por finalidade realar ou
facilitar as comparaes entre quantidades.
Traduzem-se os dados relativos, em geral, por meio de percentagens, ndices,
coeficientes e taxas.
25
1 Percentagens
Considere a srie:
MATRCULAS NAS ESCOLAS DA CIDADE A 2014
NVEL
N. DE ALUNOS
Fundamental
Ensino mdio
Superior
TOTAL
19286
1681
234
21201
Dados fictcios.
N. DE ALUNOS
Fundamental
Ensino mdio
Superior
TOTAL
19286
1681
234
21201
91,0
7,9
1,1
100
Dados fictcios.
Os valores dessa nova coluna nos dizem que, de cada 100 alunos da cidade A, 91
esto no ensino fundamental, 8 aproximadamente esto no ensino mdio e 1
aproximadamente est matriculado no ensino superior.
O emprego da porcentagem de grande valia quando nosso intuito destacar a
participao da parte no todo.
26
Resolva:
1 - Complete a tabela abaixo
DADOS RELATIVOS
ESCOLAS
N. DE ALUNOS
A
B
C
D
E
F
TOTAL
175
222
202
362
280
540
1781
POR 1
POR 100
0,098
9,8
1,000
100,0
2 ndices
Os ndices so razes entre duas grandezas tais que uma no inclui a outra.
So exemplos de ndices:
ndice ceflico = dimetro transversal do crnio x 100
dimetro longitudinal do crnio
Quociente intelectual =
idade mental
idade cronolgica
x 100
receita__
populao
3 Coeficientes
Os coeficientes so razes entre o nmero de ocorrncias e o nmero total (nmero
de ocorrncias e nmero de no-ocorrncias).
So exemplos de coeficientes:
Coeficiente de natalidade = nmero de nascimentos
populao total
Coeficiente de mortalidade = nmero de bitos__
populao total
Coeficiente educacionais:
Coeficiente de evaso escolar =
n. de alunos evadidos__
n. inicial de matrculas
28
Exerccio Resolvido:
1 O estado A apresentou 733.986 matriculados na 1 srie, no incio do ano de
2012, e 683.816 no fim do ano. O Estado B apresentou, respectivamente, 436.127 e
412.457 matriculados. Qual o Estado que apresentou maior evaso escolar?
A: TEE = (733.986 683.816) x 100 = 6,8%
733.986
B: TEE = (436.127 412.457) x 100 = 5,4%
436.127
O Estado que apresentou maior evaso escolar foi A.
EXERCCIOS
1 Considere a srie estatstica:
SRIES
ALUNOS MATRIC.
1
546
2
328
3
280
4
120
TOTAL
1274
Complete-a, determinando as percentagens com uma casa decimal e fazendo a
compensao, se necessrio.
2 Uma escola apresentava, no final do ano, o seguinte quadro:
MATRICULAS
SRIES
1
2
3
4
TOTAL
JANEIRO
DEZEMBRO
480
458
436
420
1794
475
456
430
420
1781
29
30
IV - GRFICOS ESTATSTICOS
1- Conceito:
O grfico um mtodo de representao de dados estatsticos em forma visual, por
meio de figuras geomtricas. Devem corresponder, mas nunca substituir as tabelas
estatsticas.
uma forma de apresentao dos dados estatsticos, cujo objetivo o de produzir,
no investigador ou no pblico em geral, uma impresso mais rpida e viva do
fenmeno em estudo, j que os grficos falam mais compreenso que as sries.
Para tornarmos possvel uma representao grfica, estabelecemos uma
correspondncia entre os termos da srie e determinada figura geomtrica, de tal
modo que cada elemento da srie seja representado por uma figura proporcional.
A representao grfica deve obedecer a certos requisitos fundamentais como:
Simplicidade o grfico deve ser destitudo de detalhes de importncia
secundria, assim como traos desnecessrios que possam levar o observador
a uma anlise morosa ou com erros. Deve proporcionar que o observador
analise rapidamente o fenmeno apresentado;
Clareza deve proporcionar que o observador tenha uma correta leitura dos
valores representativos do fenmeno;
Veracidade deve expressar a verdade sobre o fenmeno em estudo.
Uso indevido de Grficos: Podem trazer uma ideia falsa dos dados que esto sendo
analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade, de um
problema de construo de escalas.
31
32
33
34
NOTAS:
Quando as legendas no so breves usa-se de preferncia os grficos em
barras horizontais;
A ordem a ser observada a cronolgica, se a srie for histrica, e a
decrescente, se for geogrfica ou categrica;
A distncia entre as colunas (ou barras), por questes estticas, no dever ser
menor que a metade nem maior que os dois teros da largura (ou da altura)
dos retngulos.
35
Grficos em setores
Este grfico construdo com base em um crculo, e empregado sempre que
desejamos ressaltar a participao do dado no total.
O total representado pelo crculo, que fica dividido em tantos setores quantas so
as partes. Os setores so tais que suas reas so respectivamente proporcionais aos
dados da srie. Obtemos cada setor por meio de uma regra de trs simples e direta,
lembrando que o total da srie corresponde a 360.
Grfico Polar:
o grfico ideal para representar sries temporais cclicas, isto , sries
temporais que apresentam em seu desenvolvimento determinada periodicidade,
como, por exemplo, a variao da precipitao pluviomtrica ao longo do ano ou da
temperatura ao longo do dia, a arrecadao da Zona Azul durante a semana, o
consumo de energia eltrica durante o ms ou o ano, o nmero de passageiros de
uma linha de nibus ao longo da semana etc.
O grfico polar faz uso do sistema de coordenadas polares.
Exemplo: Dada a srie:
PRECIPITAO PLUVIOMTRICA
MUNICPIO DE PORTO ALEGRE 1995
MESES
PRECIPITAO
(mm)
Janeiro
174,8
Fevereiro
36,9
Maro
83,9
Abril
462,7
Maio
418,1
Junho
418,4
Julho
538,7
Agosto
323,8
Setembro
39,7
Outubro
66,1
Novembro
83,3
Dezembro
201,2
FONTE: IBGE
37
Setembro
Fevereiro
Maro
Abril
Maio
Agosto
Junho
Julho
FONTE: IBGE
2.2 - Estereogramas:
So grficos geomtricos dispostos em trs dimenses, pois representam volume.
So usados nas representaes grficas das tabelas de dupla entrada. Em alguns
casos este tipo de grfico fica difcil de ser interpretado dada a pequena preciso que
oferecem.
2.3 - Pictogramas:
So construdos a partir de figuras representativas da intensidade do fenmeno. Este
tipo de grfico tem a vantagem de despertar a ateno do pblico leigo, pois sua
forma atraente e sugestiva. Os smbolos devem ser autoexplicativos. A
desvantagem dos pictogramas que apenas mostram uma viso geral do fenmeno,
e no de detalhes minuciosos. Veja o exemplo abaixo:
38
39
POPULAO DO BRASIL
1950 - 1980
ANOS
HABITANTES
(milhares)
1950
51.944
1960
70.191
1970
93.139
1980
119.071
FONTE: IBGE
POPULAO DO BRASIL
1950 1980
1950
1960
1970
1980
Cada smbolo representa 10.000.000 de habitantes
FONTE: IBGE
40
41
EXERCCIOS
1 Represente a srie abaixo usando o grfico em linha:
COMRCIO EXTERIOR
BRASIL 1984 -93
QUANTIDADE (1000t)
ANOS
EXPORTAO
IMPORTAO
141.737
146.351
133.832
142.378
169.666
177.033
168.095
165.974
167.295
182.561
53.988
48.870
60.597
61.975
58.095
57.293
57.184
63.278
68.059
77.813
84
85
86
87
88
89
90
91
92
93
VOLUME (1000m3)
88
89
90
91
9.267,7
9.723,1
10.121,3
12.345,4
Fonte: IBGE.
QUANT. (1000m3)
91
92
93
36.180,4
36.410,5
37.164,3
Fonte: Petrobrs.
42
QUANT.
(1000dzias)
Norte
Nordeste
Sudeste
Sul
Centro-Oeste
57.297
414.804
984.659
615.978
126.345
Fonte: IBGE.
QUANTIDADE
Automveis
Comerciais leves
Comerciais pesados
1.100.278
224.387
66.771
Fonte: ANFAVEA.
RELATIVA (%)
Norte
Nordeste
Sudeste
Sul
Centro-Oeste
45,25
18,28
10,85
6,76
18,86
Fonte: IBGE.
PRODUO (1000t)
Minas Gerais
Esprito Santo
Rio de Janeiro
So Paulo
12.888
3.174
5.008
2.912
43
PRPRIOS (%)
ALUGADOS (%)
CEDIDOS (%)
62,7
70,3
22,9
16,5
14,4
13,2
Fonte: IBGE.
45
V - DISTRIBUIO DE FREQUENCIA
Vamos considerar, neste captulo, em particular, a forma pela qual podemos
descrever os dados estatsticos resultantes de variveis quantitativas, como o caso
de notas obtidas pelos alunos de uma classe, estaturas de um conjunto de pessoas,
salrios recebidos pelos operrios de uma fbrica, etc.
1 Tabela Primitiva e Rol
Considere a estatura de quarenta alunos, que compem uma amostra dos alunos do
IFCE, resultando a seguinte tabela de valores:
ESTATURAS DE 40 ALUNOS DO IFCE
166
162
155
154
160
161
152
161
161
168
163
156
150
163
160
172
162
156
155
153
160
173
155
157
165
160
169
156
167
155
151
158
164
164
170
158
160
168
164
161
Agora, podemos saber, com relativa facilidade, qual a menor estatura (150 cm) e
qual a maior (173 cm); que a amplitude de variao foi de 173 150 = 23 cm; e,
ainda, a ordem que um valor particular ocupa no grupo. Com um exame mais
acurado, vemos que h uma concentrao das estaturas em algum valor entre 160
cm e 165 cm e, mais ainda, que h poucos valores abaixo de 155 cm e acima de 170
cm.
Apesar de o rol propiciar ao analista mais informaes e com menor esforo de
concentrao do que os dados brutos, ainda assim persiste o problema de a anlise
ter que se basear nas 40 observaes. O problema se agravar quando o nmero de
dados for muito grande.
2 Distribuio de Frequncia
um tipo de tabela que condensa uma coleo de dados conforme as frequncias
(repeties de seus valores).
No exemplo que trabalhamos, a varivel em questo, estatura, ser observada e
estudada muito mais facilmente quando dispusermos valores ordenados em uma
coluna e colocarmos, ao lado de cada valor, o nmero de vezes que aparece
repetido. Logo podemos definir o termo frequncia.
Frequncia: a quantidade que fica relacionada a um determinado valor da
varivel.
Distribuio de frequncia sem intervalos de classe: a simples condensao dos
dados conforme as repeties de seus valores.
47
FREQUENCIA
150
151
152
153
154
155
156
157
158
160
161
162
163
164
165
166
167
168
169
170
172
173
1
1
1
1
1
4
3
1
2
5
4
2
2
3
1
1
1
2
1
1
1
1
40
TOTAL
48
FREQUENCIAS
4
9
11
8
5
3
40
82
93
75
70
43
32
59
63
80
61
69
76
60
87
73
65
54
71
Como todos os dados possuem dois algarismos, podemos dividir cada dado em
algarismo da dezena e da unidade. Portanto, o algarismo da dezena ser o ramo e a
unidade ser a folha. Vamos usar o dado 68 como exemplo:
6
ramo
8
folha
49
3
4
5
6 8
7
8
9
(b)
3
4
5
6 8
7
8 2
9
(c)
3
4
5
6
7
8
9
(d)
2
3
9
8
5
2
3
4
9
3
0
1
0
0
7
3
6
1
1
50
51
Temos:
24 = 6
4
52
FREQUNCIA
4
9
11
8
5
3
40
f1 = 4; f2 = 9; f3 = 11; f4 = 8; f5 = 5 e f6 = 3.
A soma das frequncias sempre igual ao total de elementos da amostra.
Atividade 1: As notas obtidas por 50 alunos de uma classe foram:
1; 2; 3; 4; 5; 0; 6; 7; 7; 8; 2; 3; 3; 4; 5; 6; 6; 7; 8; 8; 2; 3; 4; 4; 5; 6; 6; 7; 8; 9; 2; 3; 4;
5; 5; 6; 6; 7; 8; 9; 2; 3; 4; 5; 5; 6; 7; 7; 8; 9.
a) Complete a distribuio de frequncia abaixo:
i
1
2
3
4
5
Notas
0 |---- 2
2 |---- 4
4 |---- 6
6 |---- 8
8 |---- 10
Total
xi
fi
50
b) Agora, responda:
1. Qual a amplitude amostral?
2. Qual a amplitude da distribuio?
3. Qual o nmero de classes da distribuio?
4. Qual o limite inferior da quarta classe?
5. Qual o limite superior da classe de ordem 2?
6. Qual a amplitude do segundo intervalo de classe?
7. Qual a frequncia da terceira classe?
53
c) Complete:
1. h3 = .......
2. n = ........
3. l1 = ........
4. L3 = ........
5. x2 = ........
6. f5 = ........
4 Tipos de Frequncias
Frequncia simples ou absolutas (fi) so os valores que realmente representam
o nmero de dados de cada classe.
A soma das frequncias simples igual ao nmero total de dados da distribuio.
fi = n
Frequncias relativas (fri) ou fi (%) so os valores das razes entre as
frequncias absolutas de cada classe e a frequncia total da distribuio.
A soma das frequncias relativas igual a 1 ou 100 %.
Logo, para o exemplo da pgina 36 a frequncia da terceira classe :
fr3 = f3/n ; fr3 = 11/40 = 0,275 ou 27,5%
Nota: O propsito das frequncias relativas o de permitir a anlise ou facilitar as
comparaes.
xi
52
56
60
64
68
72
--
fi
7
10
13
11
9
6
56
Fi
fi (%)
Fi (%)
--
100,0
--
55
56
fi
34
Fi
2
9
21
29
34
--
EXERCCIOS
1 - Suponha que o ponto mdio das classes de uma distribuio de frequncia de
umidade relativa em um posto seja: 28%, 37%, 46%, 55%, 64%, 73% e 82%.
a) Encontre a amplitude da classe;
b) Os limites (inferior e superior) de cada classe.
2 - Imagine que em uma regio durante um dia de inverno foram medidas 150
temperaturas mnimas (em oC) em pontos prximos. Suponha que estas
temperaturas variaram entre 5,18 C a 7,44 C. Determine um conjunto de intervalos
de classe que seja razovel para esse conjunto de dados.
3 Conhecidas as notas de 50 alunos, obtenha uma distribuio de frequncia tendo
30 para limite inferior da primeira classe e 10 para intervalo de classe.
84 - 68 - 33 - 52 - 47 - 73 - 68 - 61 - 73 - 77 - 74 - 71 - 81 - 91 - 65 - 55 - 57 - 35 85 - 88 - 59 - 80 - 41 - 50 - 53 - 65 - 76 - 85 - 73 - 60 - 67 - 41 - 78 - 56 - 94 - 35 45 - 55 - 64 - 74 - 65 - 94 - 66 - 48 - 39 - 69 - 89 - 98 - 42 - 54.
4 Os resultados do lanamento de um dado 50 vezes foram os seguintes:
6, 5, 2, 6, 4, 3, 6, 2, 6, 5, 1, 6, 3, 3, 5, 1, 3, 6, 3, 4, 5, 4, 3, 1, 3, 5, 4, 4, 2, 6, 2, 2, 5, 2,
5, 1, 3, 6, 5, 1, 5, 6, 2, 4, 6, 1, 5, 2, 4, 3.
Forme uma distribuio de frequncia sem intervalos de classes.
57
Frequncia (fi)
39
41
38
40
42
200
N. de
Empregados
8
10
16
14
10
5
2
65
Determinar:
a) O limite inferior da 6 classe;
b) O limite superior da 4 classe;
c) O ponto mdio da 3 classe;
d) A amplitude do 5 intervalo de classe;
e) A frequncia da 3 classe;
f) A frequncia relativa da 3 classe;
58
N MOTORISTAS
20
10
16
Determine:
a) O nmero de motoristas que no sofreram nenhum acidente;
b) O nmero de motoristas que sofreram pelo menos quatro acidentes;
c) O nmero de motoristas que sofreram menos de trs acidentes;
d) O nmero de motoristas que sofreram no mnimo trs e no mximo cinco
acidentes;
e) A percentagem dos motoristas que sofreram no mximo dois acidentes.
9 A tabela abaixo apresenta a distribuio de frequncia das reas de 400 lotes:
REAS (m2)
N DE LOTES
300 |-- 400 |-- 500 |-- 600 |-- 700 |-- 800 |-- 900 |-- 1000 |-- 1100 |-- 1200
14
46
58
76
68
62
48
22
48 49
68 65
67 88 74 79 67 89 84 73 75
79 61
68 74 73 75 79 74 84 87 84
68 64
Faa a distribuio de frequncia com classes (use uma casa decimal para
porcentagens) e baseado nela responda as perguntas abaixo:
a) O limite inferior da 7 classe;
b) O limite superior da 1 classe;
c) O ponto mdio da 5 classe;
d) A amplitude da 2 classe;
e) A frequncia simples da 6 classe;
f) A frequncia percentual da 3 classe;
g) A frequncia acumulada da 4 classe;
h) A percentagem de pessoas que tem menos de 72 kg;
i) A percentagem de pessoas que tem menos de 84 kg e igual ou mais de 60
kg;
j) O nmero de pessoas que tem peso maior ou igual 54 e menor do que 78
kg;
k) O nmero de pessoas que tem peso maior ou igual 66 kg.
6 - Representao Grfica de uma Distribuio
Uma distribuio de frequncia pode ser representada graficamente pelo
Histograma, pelo Polgono de frequncia e pelo Polgono de frequncia
acumulada (alguns autores denominam de ogiva de Galton).
Em todos os grficos acima utilizamos o primeiro quadrante do sistema de eixos
coordenados cartesianos ortogonais. Na linha horizontal (eixo das abscissas)
colocamos os valores da varivel e na linha vertical (eixo das ordenadas), as
frequncias.
60
6.1 - Histograma
O Histograma formado por um conjunto de retngulos justapostos, cujas bases
se localizam sobre o eixo horizontal, de tal modo que seus pontos mdios
coincidam com os pontos mdios dos intervalos de classe.
As larguras dos retngulos so iguais s amplitudes dos intervalos de classe.
As alturas dos retngulos devem ser proporcionais s frequncias das classes, sendo
a amplitude dos intervalos igual. Isso nos permite tomar as alturas numericamente
iguais s frequncias.
A rea de um histograma proporcional soma das frequncias simples ou
absolutas.
No caso de usarmos as frequncias relativas, obtemos um grfico de rea unitria.
Para o exemplo a seguir, temos o seguinte histograma:
ESTATURAS DE 40 ALUNOS NA ESCOLA A
ESTATURA (cm)
FREQUNCIA
4
9
11
8
5
3
40
61
62
xi
52
56
60
64
68
72
--
fi
5
10
12
9
6
4
46
Fi
fi (%)
Fi (%)
--
100
--
63
EXERCCIOS
1 Considerando a distribuio de frequncia seguinte, confeccione, o Histograma,
o Polgono de frequncia simples e o Polgono de frequncia acumulada.
i
1
2
3
4
5
6
7
SALRIOS
(R$)
500 |--- 700
700 |--- 900
900 |--- 1100
1100 |--- 1300
1300 |--- 1500
1500 |--- 1700
1700 |--- 1900
Total
fi
8
20
7
5
2
1
1
44
6
7
1
0
0
7
1
8
9
6
3
6
4
7
5
2
1
1
5
4
0
5
0
64
65
VI - MEDIDAS DE POSIO
1 Introduo
O estudo que fizemos sobre distribuies de frequncia, at agora, permite-nos
descrever, de modo geral, os grupos dos valores que uma varivel pode assumir.
Dessa forma, podemos localizar a maior concentrao de valores de uma dada
distribuio, isto , se ela se localiza no incio, no meio ou no final, ou ainda, se h
uma distribuio por igual.
Porm, para ressaltar as tendncias caractersticas de cada distribuio,
isoladamente, ou em confronto com outras, necessitamos introduzir conceitos que se
expressam atravs de nmeros, que nos permitam traduzir essas tendncias. Esses
conceitos so denominados elementos tpicos da distribuio e so as:
a. Medidas de posio;
b. Medidas de variabilidade ou disperso;
c. Medidas de assimetria;
d. Medidas de curtose.
Dentre os elementos tpicos, destacamos, neste captulo, as medidas de posio estatsticas que representam uma srie de dados orientando-nos quanto posio da
distribuio em relao ao eixo horizontal do grfico da curva de frequncia.
As medidas de posies mais importantes so as medidas de tendncia central ou
promdias, que recebem tal denominao pelo fato de os dados observados
tenderem, em geral, a se agruparem em torno dos valores centrais. Dentre as
medidas de tendncia central, destacamos:
a. A mdia aritmtica;
b. A moda;
c. A mediana.
Outras promdias menos usadas so as mdias: geomtrica, harmnica, quadrtica,
cbica e biquadrtica.
As outras medidas de posio so as separatrizes, que englobam: a prpria
mediana, os decis, os quartis e os percentis.
66
2 Mdia Aritmtica (
.= 14 Kg
s vezes, a mdia pode ser um nmero diferente de todos os da srie de dados que
ela representa. o que acontece quando temos os valores 2, 4, 6 e 8, para os quais a
mdia 5. Esse ser o nmero representativo dessa srie de valores, embora no
esteja representado nos dados originais. Neste caso, costumamos dizer que a mdia
no tem existncia concreta.
2.2 Desvio em relao mdia
Denominamos Desvio em relao mdia a diferena entre cada elemento de
um conjunto de valores e a mdia aritmtica.
Designando o desvio por di, temos:.di = Xi - . No exemplo anterior temos sete
desvios:
d1 = 10 - 14 = -4;
d2 = 14 - 14 = 0;
d3 = 13 - 14 = -1;
d4 = 15 - 14 = 1;
d5 = 16 - 14 = 2;
d6 = 18 - 14 = 4;
d7 = 12 - 14 = -2.
67
No exemplo anterior: d1 + d2 + d3 + d4 + d5 + d6 + d7 = 0
2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos os
valores de uma varivel, a mdia do conjunto fica aumentada (ou diminuda)
dessa constante.
.+ 2 = 14 +2 = 16 kg
x 3 = 14 x 3 = 42 kg.
68
Frequncia (fi)
2
6
10
12
4
34
O modo mais prtico de obteno da mdia ponderada abrir, na tabela, uma coluna
correspondente aos produtos xifi:
xi
0
1
2
3
4
fi
2
6
10
12
4
34
x i . fi
0
6
20
36
16
78
Temos, xifi = 78 e f i = 34
Logo xifi / f i = 78 / 34 = 2,3
Portanto a mdia de 2,3 meninos por famlia.
69
Nota:
- Sendo x uma varivel discreta, como interpretar o resultado obtido, 2 meninos e 3
dcimos de menino?
O valor mdio de 2,3 meninos sugere, neste caso, que o maior nmero de famlias
tem 2 meninos e 2 meninas, sendo, porm, a tendncia geral de uma leve
superioridade numrica em relao ao nmero de meninos.
Resolva:
1 Calcule a mdia aritmtica da distribuio:
xi
fi
Estaturas (cm)
50 |---- 54
54 |---- 58
58 |---- 62
62 |---- 66
66 |---- 70
70 |---- 74
fi
4
9
11
8
5
3
40
70
Pela mesma razo do caso anterior, vamos, inicialmente, abrir uma coluna para os
pontos mdios (xi) e outra para os produtos xifi:
i
1
2
3
4
5
6
Estaturas (cm)
50 |---- 54
54 |---- 58
58 |---- 62
62 |---- 66
66 |---- 70
70 |---- 74
fi
4
9
11
8
5
3
40
xi
52
56
60
64
68
72
xi.fi
208
504
660
512
340
216
2.440
450 |-- 550 |-- 650 |-- 750 |-- 850 |-- 950 |-- 1050 |-- 1150
10
11
16
13
3 Moda
Denominamos Moda o valor que ocorre com maior frequncia em uma srie de
valores.
Mo o smbolo da moda.
Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais
comum, isto , o salrio recebido pelo maior nmero de empregados dessa fbrica.
71
Frequncia
3
9
12
6
72
Frequncia
9
11
8
5
73
fi
4
9
11
8
5
3
40
Temos:
D1 = 11 9 = 2 e D2 = 11 8 = 3;
Mo = 158 + 2 x 4 = 159,6 cm
2+3
3.3 Emprego da moda
A moda utilizada quando:
a. desejamos obter uma medida rpida e aproximada de posio;
b. quando a medida de posio deva ser o valor mais tpico da distribuio.
Resolva:
1 Calcule a moda da distribuio de frequncia:
Classes
450 |---- 550
550 |---- 650
650 |---- 750
750 |---- 850
850 |---- 950
950 |---- 1050
1050 |---- 1150
Total
fi
8
10
11
16
13
5
1
64
74
4 Mediana
A Mediana de um conjunto de valores, dispostos segundo uma ordem (crescente
ou decrescente), o valor situado de tal forma no conjunto que o separa em dois
subconjuntos de mesmo nmero de elementos.
Smbolo da mediana: Md
4.1 Dados no-agrupados
Dada uma srie de valores como, por exemplo:
{5, 2, 6, 13, 9, 15, 10}
De acordo com a definio de mediana, o primeiro passo a ser dado o da
ordenao (crescente ou decrescente) dos valores:
{2, 5, 6, 9, 10, 13, 15}
Em seguida, tomamos aquele valor central que apresenta o mesmo nmero de
elementos direita e esquerda. Neste caso o valor que divide a srie acima em
duas partes iguais o 9, logo a Md = 9.
Se, porm, a srie dada tiver um nmero par de termos, a mediana ser, por
definio, qualquer dos nmeros compreendidos entre os dois valores centrais da
srie. Convencionou-se utilizar o ponto mdio.
.Mtodo prtico para o clculo da Mediana
a) Se a srie dada tiver nmero mpar de termos:
O valor mediano ser o termo de ordem dado pela frmula:
(n+1)/2
Exemplo: Calcule a mediana da srie {1, 3, 0, 0, 2, 4, 1, 2, 5}
1 - ordenar a srie {0, 0, 1, 1, 2, 2, 3, 4, 5}
n = 9, logo (n + 1)/2 dado por (9 + 1) / 2 = 5, ou seja, o 5 elemento da srie
ordenada ser a mediana.
A mediana ser o 5 elemento = 2
75
76
fi
2
6
9
13
5
35
Fi
2
8
17
30
35
--
Como o somatrio das frequncias fi = 35, a frmula para calcular a mediana ser:
(35+1) / 2 = 18 termo.
Pela distribuio temos a mediana igual ao valor da varivel correspondente ao 18
termo, ou seja, igual a 3.
- Quando o somatrio das frequncias for par o valor mediano ser o termo de
ordem dado pela frmula:
77
fi
1
2
1
2
1
1
8
Fi
1
3
4
6
7
8
--
Resolva:
1 Calcule a mediana da distribuio:
xi
10
fi
12
78
fi
4
9
11
8
5
3
40
Fi
4
13
24
32
37
40
--
= 40 / 2 =.20
Logo,.a classe mediana ser a terceira classe, ou seja, 58 |---- 62 e com base nesta
classe temos ainda:
l* = 58........... F(ant) = 13........... f* = 11........... h* = 4
Substituindo esses valores na frmula acima, obtemos:
Md = 58 + [(20 - 13) x 4] / 11 = 58 + (28/11) = 58 + 2,54 = 60,54
Obs.: Este valor (Md = 60,54) estimado, pois no temos os 40 valores da
distribuio.
NOTA: No caso de existir uma frequncia acumulada exatamente igual a fi/2, a
mediana ser o limite superior da classe correspondente.
79
Classes
0 |---- 10
10 |---- 20
20 |---- 30
30 |---- 40
40 |---- 50
50 |---- 60
Total
Temos:
fi
1
3
9
7
4
2
26
Fi
1
4
13
20
24
26
--
= 26 / 2 =.13
Logo,.Md = L* = 30
4.3 - Emprego da Mediana
A mediana usada quando:
a. desejamos obter o ponto que divide a distribuio em duas partes iguais;
b. h valores extremos que afetam de maneira acentuada a mdia aritmtica;
c. a varivel em estudo salrio.
Resolva:
1 Calcule a mediana da distribuio de frequncia:
CUSTO (R$)
fi
450 |-- 550 |-- 650 |-- 750 |-- 850 |-- 950 |-- 1050 |-- 1150
10
11
16
13
80
6 As Separatrizes
Como vimos, a mediana caracteriza uma srie de valores devido sua posio
central. No entanto, ela apresenta uma caracterstica, to importante quanto a
primeira: ela separa a srie em dois grupos que apresentam o mesmo nmero de
valores.
Assim, alm das medidas de posio que estudamos, h outras que, consideradas
individualmente, no so medidas de tendncia central, mas esto ligadas mediana
relativamente sua segunda caracterstica, j que se baseiam em posio na srie.
Essas medidas os quartis, os percentis e os decis so, juntamente com a
mediana, conhecidas pelo nome genrico de separatrizes.
6.1 Os quartis
Denominamos quartis os valores de uma srie que a divide em quatro partes
iguais.
81
por:
Exemplo:
Classes
150 |---- 154
154 |---- 158
158 |---- 162
162 |---- 166
166 |---- 170
170 |---- 174
Total
fi
4
9
11
8
5
3
40
Fi
4
13
24
32
37
40
--
(Q1)
(Q3)
82
Resolva:
1. Complete os esquemas para o clculo do primeiro e do terceiro quartis da
distribuio de frequncia:
83
6.2 Os Decis
Denominamos decis os nove valores que separam uma srie em dez partes iguais.
Indicamos:
D1, D2, D3, ............, D9
evidente que:
D5= Q2 = Md
84
10
D1
D3
10
10
fi
4
9
11
8
5
3
40
Fi
4
13
24
32
37
40
--
(D7)
Stimo Decil:
7 x fi/10 = 7 x 40/10 = 28 (28 termo)
D7 = 162 + (28 -24).4
8
D7 = 162 + 2 = 164
85
6.3 Os Percentis
Denominamos percentis os noventa e nove valores que separam uma srie em
cem partes iguais.
Indicamos:
P1, P2, P3, ............, P99
evidente que:
P50= D5= Q2 = Md, P25= Q1, P75= Q3
O clculo de um percentil segue a mesma tcnica do clculo da mediana, porm, a
frmula
Exemplo:
Considerando a distribuio de frequncia, temos para o oitavo percentil:
Classes
150 |---- 154
154 |---- 158
158 |---- 162
162 |---- 166
166 |---- 170
170 |---- 174
Total
fi
4
9
11
8
5
3
40
Fi
4
13
24
32
37
40
--
(P8)
86
87
Resolva:
1. Complete o esquema para o clculo do vigsimo percentil da distribuio:
88
EXERCCIOS
1 Com relao s propriedades da mdia aritmtica, moda e mediana, marque V
ou F nas sentenas abaixo.
( ) Multiplicando-se todos os elementos de uma srie por 5, sua mdia permanece
inalterada.
( ) A mediana de uma srie disposta em ordem crescente o termo que a divide em
trs partes iguais.
( ) A moda o valor da varivel que possui maior frequncia.
( ) A mediana de uma srie de 46 elementos a mdia dos valores do 23 e do 24
termos desta srie, quando ela estiver disposta em ordem crescente.
( ) A mediana de uma srie de 33 elementos o valor do 17 termo desta srie,
quando ela estiver disposta em ordem decrescente.
( ) Dividindo-se todos os nmeros de uma srie com cinco elementos por 2, sua
mediana ficar multiplicada por 2.
2 - A mdia da srie {21, 13, 8, 15, 27, 12, 16, 12, 17, 3, 26, 10} igual a:
( ) 15
( ) 12
( ) 15,5
( ) 14
( ) 16
3 - A mediana da srie {21, 13, 8, 15, 30, 12, 17, 3, 26, 10, 25, 16} igual a:
( ) 15
( ) 12
( ) 16
( ) 14
( ) 15,5
4 - A moda da srie {21, 13, 8, 15, 27, 12, 16, 12, 17, 3, 26, 10} igual a:
( ) 15
( ) 12
( ) 15,5
( ) 14
( ) 16
a) 25,48
b) 26,38
c) 28,04
d) 26,62
e) 26,92
8 A distribuio de idades dos alunos de uma sala dada pelo grfico abaixo.
Qual das alternativas representa melhor a mdia aritmtica das idades dos alunos:
a) 16 anos e 10 meses b) 17 anos e 1 ms c) 17 anos e 5 meses d) 17 anos e 4
meses e) 18 anos e 2 meses
9 - Considere a distribuio de frequncias:
Classes
02 |- 04
04 |- 06
06 |- 08
08 |- 10
10 |- 12
Total
Frequncias
3
k
1001
3k-12
3
(fi)
6
9
4
8
5
3
35
90
Fi
10
15
25
40
50
c) 14,0
d) 14,5
e) 13,6
Defeitos
300
550
480
980
1050
350
450
870
Pede-se:
a) Calcular a mdia diria de parafusos com defeitos;
b) Projetar o nmero total de parafusos com defeitos em um dia de trabalho.
13 - A mdia aritmtica dos salrios de 5 funcionrios de uma empresa R$ 2.500,00. A
mdia aritmtica dos salrios dos trs primeiros R$ 3.000,00, o quinto ganha R$
500,00 a mais que o quarto. Nesse caso, o salrio do quinto empregado igual a?
91
Com base no grfico, o valor da mdia e da mediana dos empregos formais surgidos no
perodo vale?
92
497
506
511
513
520
526
499
508
511
513
520
528
500
508
511
513
523
529
498
507
517
521
531
501
502
503
519
527
530
528
501
508
511
514
524
530
504
508
512
516
524
532
537
520
534
526
535
536
O salrio mdio;
O salrio modal;
O salrio mediano;
Q3; D8; P73.
93
95
Exemplo:
Considerando a tabela abaixo:
Xi
0
1
2
3
4
Total
fi
2
6
12
7
3
30
Temos: AT = 4 0 = 4, logo AT = 4.
2.2.2 Com intervalos de classe
Neste caso, a amplitude total a diferena entre o limite superior da ltima classe e
o limite inferior da primeira classe:
AT = L (max) - l (min)
Exemplo:
Considerando a distribuio de frequncia abaixo:
Classes
150 |---- 154
154 |---- 158
158 |---- 162
162 |---- 166
166 |---- 170
170 |---- 174
Total
fi
4
9
11
8
5
3
40
Temos:
AT = 174 150 = 24, logo: AT = 24 cm.
A amplitude total tem o inconveniente de s levar em conta os dois valores
extremos da srie, descuidando do conjunto de valores intermedirios, o que quase
sempre invalida a idoneidade do resultado. Ela apenas uma indicao aproximada
da disperso ou variabilidade.
96
3 Varincia e Desvio-padro
3.1 Introduo:
A varincia e o desvio-padro levam em considerao a totalidade dos valores da
varivel em estudo, o que faz delas ndices de variabilidade bastante estveis e, por
isso mesmo, os mais geralmente empregados.
A varincia uma medida que tem pouca utilidade como estatstica descritiva,
porm extremamente importante na inferncia estatstica e em combinaes de
amostras.
A varincia baseia-se nos desvios em torno da mdia aritmtica, porm
determinando mdia aritmtica dos quadrados dos desvios. Assim,
representando a varincia por s2, temos:
Podemos entender o desvio padro como uma mdia dos valores absolutos dos
desvios, ou seja, dos desvios considerados todos com sinal positivo, mdia essa
obtida, porm, por um processo bastante elaborado: calculamos o quadrado de cada
desvio, obtemos a mdia desses quadrados e, depois obtemos a raiz quadrada da
mdia dos quadrados dos desvios.
Outra frmula bastante utilizada para calcular o desvio-padro de uma populao :
98
5
5
5
5
5
5
1
-4
-2
0
25
1
16
4
0
Total
--
--
46
Usando a frmula:
/ n = 46 / 5 = 9,2.
99
fi
2
6
12
7
3
x i . fi
0
6
24
21
12
2,1
2,1
2,1
2,1
2,1
Total
30
63
--
Sabemos que fi = 30 e
. fi
-2,1
-1,1
-0,1
0,9
1,9
4,41
1,21
0,01
0,81
3,61
Somatrio
8,82
7,26
0,12
5,67
10,83
32,70
. f i / n = 32,7 / 30 = 1,09.
% da populao includa
Grosseiramente
68,3
2/3 da populao
1,96
95,0
95,5
2,58
99,0
99,7
95 % da populao
100 % da populao
101
102
4 Coeficiente de Variao
O desvio padro por si s no nos diz muita coisa. Assim, um desvio padro de duas
unidades pode ser considerado pequeno para uma srie de valores cujo valor mdio
200; no entanto, se a mdia for igual a 20, o mesmo no pode ser dito. Alm disso,
o fato de o desvio padro ser expresso na mesma unidade dos dados limita o seu
emprego quando desejamos comparar duas ou mais sries de valores, relativamente
sua disperso ou variabilidade, quando expressas em unidades diferentes.
Para contornar essas dificuldades e limitaes, podemos caracterizar a disperso ou
variabilidade dos dados em termos relativos a seu valor mdio, medida essa
denominada coeficiente de variao (CV):
Exemplo:
Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo grupo
de indivduos:
Varivel
Estatura
175 cm
5,0 cm
Peso
68 Kg
2,0 Kg
Temos:
CVE = (5/175) x 100 = 2,85%
CVP = (2/68) x 100 = 2,94%
Logo, nesse grupo de indivduos, os pesos apresentam maior grau de disperso que
as estaturas.
103
EXERCCIOS
1 Com relao s propriedades do desvio-padro, coloque V ou F nas sentenas
abaixo:
( ) O desvio padro pode assumir qualquer valor numrico.
( ) O desvio - padro representa o grau de variabilidade de um conjunto de dados,
ou seja, quanto maior o valor do desvio-padro mais compactos so seus dados.
( ) Quando o valor do desvio-padro zero, todos os valores do conjunto de dados
so iguais, no h variao entre eles.
( ) Quando multiplicarmos uma constante a um conjunto de dados, podemos
afirmar que seu desvio-padro fica multiplicado por essa constante, assim como sua
mdia.
( ) Quando somamos uma constante K a um conjunto de dados, podemos afirmar
que seu desvio-padro e sua mdia permanecem inalterados.
( ) Para calcularmos o desvio-padro e a varincia para uma populao e para uma
amostra, devemos proceder da mesma maneira.
2 Considere o conjunto de A = {3, 5, 6, 8}, que tem mdia igual a 5,5 e desviopadro igual a 2,08. Sobre o conjunto B = {9, 15, 18, 24} podemos afirmar que:
(
(
(
(
(
Que relao existe entre os desvios padres dos dois conjuntos de nmeros?
4 - Dados os conjuntos de nmeros:
A = {220, 230, 240, 250, 260}
Que relao existe entre os desvios padres dos dois conjuntos de nmeros?
5- Dados os conjuntos de nmeros:
A = {-2, -1, 0, 1, 2 }
a) ao desvio padro de A;
b) ao desvio padro de A, multiplicado pela constante 5;
c) ao desvio padro de A, multiplicado pela constante 5, e esse resultado somado a
230;
d) ao desvio padro de A mais a constante 230.
6 Calcule a amplitude total dos conjuntos de dados:
a) 1, 3, 5, 9
b) 20, 14, 15, 19, 21, 22, 20
c) 17,9; 22,5; 13,3; 16,8; 15,4; 14,2
d) -10, -6, 2, 3, 7, 9, 10
7 Considere a populao A = {1, 3, 7, 9, 6} calcule o desvio-padro e a varincia.
8 Considere a amostra B = {2, 5, 6, 13, 7, 8} calcule a mdia, o desvio-padro e a
varincia.
9 - Considere a distribuio de frequncia transcrita a seguir como de uma
populao. Calcule o desvio-padro e sua varincia.
PESO (kg)
41
43
50
54
57
60
TOTAL
fi
13
12
20
11
15
16
87
10 - O grfico a seguir indica a massa de uma populao de objetos. Acrescentandose ao grupo n objetos de massa igual a 4 kg cada, sabe-se que a media no se altera,
mas o desvio padro se reduz metade do que era. Nessas condies, calcule o valor
de n.
105
497
506
511
513
520
526
499
508
511
513
520
528
500
508
511
513
523
529
498
507
517
521
531
501
502
503
519
527
530
528
501
508
511
514
524
530
504
508
512
516
524
532
4 5
1 1
106
107
VIII - PROBABILIDADE
1 - Introduo
Neste captulo, presumiremos que a populao conhecida e calcularemos as
chances de obter vrias amostras desta populao. Assim, mostraremos que a
probabilidade o reverso da estatstica: na probabilidade usaremos a informao da
populao para inferir a natureza provvel da amostra.
Sendo assim, as situaes marcadas pela possibilidade de ocorrncia de mais de um
resultado possvel costumam ser analisadas em estatstica com o auxlio das
probabilidades. A probabilidade estuda o risco e o acaso em eventos futuros,
determinando se provvel ou no o seu acontecimento.
O clculo das probabilidades pertence ao campo da Matemtica, entretanto a
maioria dos fenmenos de que trata a Estatstica so de natureza aleatria ou
probabilstica. O conhecimento dos aspectos fundamentais do clculo da
probabilidade uma necessidade essencial para o estudo da Estatstica Indutiva ou
Inferencial.
Para estudar probabilidades, necessrio definir alguns conceitos e terminologias
usuais, como os relativos a experimento aleatrio, espao amostral e eventos.
2 - Experimento Aleatrio
Suponha que uma moeda foi jogada uma vez e deu cara. O resultado que vemos e
registramos chamado de observao, ou medio, e o processo de realizar uma
observao chamado de experimento. Baseado neste exemplo, enunciamos a
definio de experimentos aleatrios:
So fenmenos que, mesmo repetidos vrias vezes sob condies semelhantes,
apresentam resultados imprevisveis. O resultado final depende do acaso.
108
A = {ca} = 1
A = {2,4,6} = 3
110
A = {1,2,3,4,5,6} = 6
A={ }=0
P (A) = 0/6 = 0 = 0%
111
113
115
116
117
X
2
1
1
0
2 Distribuio de Probabilidade
Consideremos a distribuio de frequncias relativa ao nmero de acidentes dirios
em um estacionamento em um ms:
N DE
ACIDENTES
0
1
2
3
TOTAL
FREQUENCIAS
22
5
2
1
30
118
PROBABILIDADES
0,73
0,17
0,07
0,03
1,00
Os valores x1, x2, x3, ....., xn e seus correspondentes p1, p2, p3, ....., pn definem uma
distribuio de probabilidade.
Assim, voltando a tabela inicial. Temos:
119
P(X)
1/4
2/4
1/4
X
1
2
3
4
5
6
P(X)
1/6
1/6
1/6
1/6
1/6
1/6
120
3 Distribuio Binomial
Eventos binomiais so marcados pela existncia de duas categorias, mutuamente
excludentes e coletivamente exaustivos. Mutuamente excludentes significa que uma
categoria implica a possibilidade da no-ocorrncia simultnea da outra categoria.
Por coletivamente exaustivas entende-se que a unio de ambos os eventos resulta no
espao amostral.
Exemplos de eventos binomiais podem ser fornecidos por meio de nmeros pares e
mpares no lanamento de um dado honesto, e por meio da extrao de cartas
vermelhas e pretas de um baralho.
Geralmente, em anlises estatsticas, os exemplos mais comuns de eventos
binomiais so aqueles que estabelecem situaes de sucesso e fracasso. Situaes de
sucesso correspondem quilo que se deseja estudar. Situaes de fracasso
correspondem ao complemento. Ou seja, quilo que no se deseja estudar.
Vamos, neste item, considerar experimentos que satisfaam as seguintes condies:
a. O experimento deve ser repetido, nas mesmas condies, um nmero finito de
vezes (n).
b. As provas repetidas devem ser independentes, isto , o resultado de uma no
deve afetar os resultados das sucessivas.
c. Em cada prova deve aparecer um dos dois possveis resultados: sucesso e
insucesso.
d. No decorrer do experimento, a probabilidade p do sucesso e a probabilidade q
(q = 1 p) do insucesso manter-se-o constantes.
Resolveremos problemas do tipo: determinar a probabilidade de se obterem k
sucessos em n tentativas.
O experimento obteno de caras em cinco lanamentos sucessivos e
independentes de uma moeda satisfaz essas condies. Sabemos que, quando da
realizao de um experimento qualquer em uma nica tentativa, se a probabilidade
de realizao de um evento (sucesso) p, a probabilidade de no-realizao desse
mesmo evento (insucesso) 1 p = q.
Suponhamos, agora, que realizemos a mesma prova n vezes sucessivas e
independentes. A probabilidade de que um evento se realize k vezes nas provas
dada pela funo:
121
Na qual:
P (X = k) a probabilidade de que o evento se realize k vezes em n provas;
p a probabilidade de que o evento se realize em uma s prova sucesso;
q a probabilidade de que o evento no se realize no decurso dessa insucesso;
122
123
124
17 Acredita-se que 20% dos moradores das proximidades de uma grande indstria
siderrgica tem alergia aos poluentes lanados ao ar. Admitindo que este percentual
de alrgicos real (correto), calcule a probabilidade de que pelo menos 4 moradores
tenham alergia entre 13 selecionados ao acaso.
18 - Trs em cada quatro alunos de uma universidade fizeram cursinho antes de
prestar vestibular. Se 16 alunos so selecionados ao acaso, qual a probabilidade de
que:
a) Pelo menos 12 tenham feito cursinho?
b) No mximo 13 tenham feito cursinho?
c) Exatamente 12 tenham feito cursinho?
19 - Admita que, respectivamente, 90% e 80% dos indivduos das populaes A e B
sejam alfabetizados. Se 12 pessoas da populao A e 10 da populao B forem
selecionadas ao acaso, qual a probabilidade de que pelo menos uma no seja
alfabetizada?
20 Uma pesquisa, com 420 casais que possuem cinco filhos, constatou que a
probabilidade de nascimento de meninos de 58%. Nestas 420 famlias com cinco
crianas cada uma, quantas se esperaria que tivessem:
a) Nenhuma menina;
b) Trs meninos;
c) Quatro meninos.
21 As pacientes diagnosticadas com certa doena tm 80% de chance de serem
curadas. Para um grupo de doze pacientes nessas condies, calcule a probabilidade
de:
a) Oito ficarem completamente curadas;
b) Entre trs (inclusive) e cinco (inclusive) no serem curadas;
c) No mais do que duas permanecerem com a doena.
22 Um vendedor de seguros vende aplices a 5 homens, todos da mesma idade e
de boa sade. De acordo com as tabelas atuariais, a probabilidade de um homem,
dessa idade particular, estar vivo daqui a 30 anos de 2/3. Determinar a
probabilidade de estarem ainda vivos daqui a 30 anos:
a) Todos os cinco homens;
b) Pelo menos 3;
c) Apenas 2;
d) Pelo menos 1.
126
23 Uma recente pesquisa detectou que 90% dos fumantes de uma regio
afirmaram desejar parar com seu vcio. Em uma amostra formada por dez pessoas:
a) Qual a probabilidade de a maioria querer parar de fumar?
b) Qual a probabilidade de todos quererem parar de fumar?
24 Uma empresa comercial calcula que 5% de suas vendas no so recebidas, em
funo do recebimento de cheques sem fundos. Ao se analisar uma amostra formada
por oito vendas, qual a probabilidade de: a) todas serem pagas normalmente? b) uma
ou duas vendas, apenas, serem pagas? c) pelo menos trs vendas serem pagas
normalmente? d) todas no serem pagas?
25 Existem treze jogos na Loteria Esportiva. Em cada um dos jogos, determinado
time pode ganhar ou empatar ou perder. Calcule a probabilidade de um jogador que
nada sabe sobre os times: a) acertar todos os jogos; b) acertar pelo menos um jogo;
c) acertar pelo menos doze jogos. Use o maior nmero de casas decimais nas
respostas.
26 - O Estado da Pensilvnia tem uma loteria diria. Cada noite escolhido um
nmero de trs algarismos. Qual a probabilidade de se obter:
a) Um nmero inferior a 100, mais de cinco vezes em uma semana;
b) Um nmero par pelo menos uma vez na semana.
Obs.: Coloque todas as casas decimais.
27 - O escore em um teste internacional de proficincia na lngua inglesa varia de 0
a 700 pontos, com mais pontos indicando um melhor desempenho. Informaes,
coletadas durante vrios anos, permitem estabelecer o seguinte modelo para o
desempenho no teste:
Pontos [0,200) [200,300) [300,400)
P(x)
0.06
0.15
0.16
[400,500) [500,600)
0.25
0.28
[600,700)
0.10
128
4 Distribuio Normal
Entre as distribuies tericas de varivel aleatria contnua, uma das mais
empregadas a distribuio normal. Consiste em uma distribuio contnua de
probabilidades, onde a apresentao da distribuio de frequncias f(x) de uma
varivel qualitativa x costuma apresentar-se em forma de sino e simtrica em
relao mdia.
O estudo da distribuio normal recebeu contribuies de matemticos importantes,
como De Moivre, Laplace e Gauss. Alguns estudos revelam que medies repetidas
de uma mesma grandeza, como o dimetro de uma esfera ou o peso de determinado
objeto, nunca forneciam os mesmos valores. Porm, a apresentao das frequncias
dos inmeros nmeros coletados sempre resultava em uma curiosa curva em forma
de sino. Das observaes surgiu o nome curva normal dos erros.
Muitas das variveis analisadas na pesquisa socioeconmica correspondem
distribuio normal ou dela se aproximam.
O aspecto grfico da distribuio normal o da figura abaixo:
129
) = P(X <
) = 0,5 ou 50%.
Quando temos em mos uma varivel aleatria com distribuio normal, nosso
principal interesse obter a probabilidade de essa varivel aleatria assumir um
valor em um determinado intervalo.
A distribuio Normal de varivel aleatria X depende dos parmetros da media e
do desvio padro, proveniente da varincia. Ento, pode ser tambm representada
desta maneira: X: N ( , S2), ou seja, X segue uma distribuio Normal de media
e varincia S2.
4.1 - Parmetros da Distribuio Normal
A distribuio normal uma distribuio de dois parmetros (mdia) e (desviopadro). A densidade de probabilidade desta distribuio tem a seguinte forma:
fX
1
2
X 2
22
para x
1
2
X 2
2 2
dX
1
2
Z2
2
dZ
131
e desvio padro
= 2. Temos ento:
Z = 2,05 2 / 0,04 = 1,25
donde:
P(2 < X < 2,05) = P(0 < Z < 1,25)
Procuremos, agora, na tabela Z em anexo, o valor de z = 1,25. Observe a forma de
entrada na tabela:
132
Escrevemos, ento:
P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44%.
Exerccios Resolvidos
1 Com base na tabela Z determine as probabilidades:
a) P(-1,25 < Z < 0)
A probabilidade procurada corresponde parte hachurada da figura:
133
Temos que:
P(-0,5 < Z < 1,48) = P(-0,5 < Z < 0) + P(0 < Z < 1,48)
Como:
P(-0,5 < Z < 0) = P(0 < Z < 0,5) = 0,1915 e P(0 < Z < 1,48)= 0,4306
Obtemos:
P(-0,5 < Z < 1,48) = 0,1915 + 0,4306 = 0,6221ou 62,21%
Temos que:
P(0,8 < Z < 1,23) = P(0 < Z < 1,23) - P(0 < Z < 0,8)
Como:
P(0 < Z < 1,23)= 0,3907 e P(0 < Z < 0,8)= 0,2881
Obtemos:
P(0,8 < Z < 1,23) = 0,3907 - 0,2881 = 0,1026 ou 10,26%
134
Temos que:
P(Z > 0,6) = P(Z > 0) - P(0 < Z < 0,6)
Como: P(Z > 0)= 0,5 e P(0 < Z < 0,6)= 0,2258
Obtemos:
P(Z > 0,6) = 0,5 - 0,2258 = 0,2742 ou 27,42%
Temos que:
P(Z < 0,92) = P(Z < 0) + P(0 < Z < 0,92)
Como:
P(Z < 0)= 0,5 e P(0 < Z < 0,92)= 0,3212,
Obtemos:
P(Z < 0,92) = 0,5 + 0,3212 = 0,8212 ou 82,12%.
135
P (Z > 0,34)
P (Z < 1,85)
P (Z < - 1,24)
P (1,56 < Z < 2,37)
P (-0,37 < Z < 3,4)
P (Z > 1,08)
P (Z < - 0,66)
P (Z < -2,30 ou Z > 1,29)
136
P (100 X 106)
P (89 X 107)
P (112 X 116)
P (X 108)
P (X 90)
137
15 Foi feito um estudo sobre a altura dos alunos da IFCE. Observou-se que ela se
distribui normalmente com mdia de 1,72 m e desvio padro de 5 cm. Qual a
porcentagem dos alunos com altura:
a) Entre 1,57 e 1,87 m?
b) Acima de 1,90 m?
139
140
24 Um teste de aptido feito por pilotos de elite em treinamento inicial requer que
uma srie de operaes seja realizada em uma rpida sucesso. Suponha que o
tempo para completar o teste seja distribudo normalmente com mdia de 80
minutos e desvio padro de 30 minutos. Para passar no teste, o candidato deve
complet-lo em menos de 70 minutos. Pede-se:
a) Se 200 candidatos fazem o teste, quantos so esperados passar no teste?
b) Se os 5% melhores candidatos sero alocados para aeronaves maiores, quo
rpido deve ser o candidato para que obtenha essa posio?
25 A distribuio dos pesos de porcos numa suinocultura pode muito bem ser
representada por uma distribuio normal, com mdia de 128,72 kg e desvio padro
de 32,46 kg. Um matadouro comprar 5000 porcos e pretende classific-los de
acordo com o peso, do seguinte modo: 18% dos mais leves como pequenos, os 50%
seguintes como mdios, os 22% seguintes como grandes e os 10% mais pesados
como extras. Quais os limites de peso para cada classificao?
26 Um pesquisador verificou que em uma cidade do interior de So Paulo o peso
dos homens tem distribuio aproximadamente normal com mdia de 85 kg e desvio
padro de 20 kg, enquanto o das mulheres tambm se apresenta normalmente
distribudo, com mdia de 60 kg e desvio padro de 8 kg. Pede-se: a) sorteando-se
um homem, qual a probabilidade de ele ter peso acima de 75 kg? b) sorteando-se
uma mulher, qual a probabilidade de ela ter peso acima de 65 kg? c) qual a
probabilidade de uma pessoa ter peso acima de 65 kg, sendo ela sorteada de um
grupo em que o nmero de mulheres o triplo do de homens?
27 Antes de uma importante prova de Estatstica, o professor verificou que o
tempo dedicado aos estudos de reviso dos seus alunos seguia uma distribuio
aproximadamente normal, de media 12 horas e desvio padro de 1,5 hora. Pede-se:
a) Determinar o tempo de estudo que superado por 98,5% dos alunos?
b) Determinar a faixa em torno do valor mdio que contenha 90% dos valores do
tempo dedicados aos estudos.
28 Para ser aprovado em um exame seletivo um candidato deve obter nota
superior a 8,2 em matemtica e superior a 9,5 em portugus. Sabendo que as notas
seguem uma distribuio normal, com media e varincia apresentados na tabela
seguinte, calcule quantos alunos de um grupo de 950 devem ser aprovados neste
processo seletivo.
PROVA
PORTUGUES
MATEMTICA
MEDIA
7,3
6,1
VARIANCIA
7,29
3,24
141
142
X CORRELAO E REGRESSO
1 - Introduo
Nos captulos anteriores, nossa preocupao era descrever a distribuio de valores
de uma varivel. Com esse objetivo, aprendemos a calcular medidas de tendncia
central e variabilidade.
Quando, porm, consideramos observaes de duas ou mais variveis, surge um
novo problema: as relaes que podem existir entre as variveis estudadas. Nesse
caso, as medidas estudadas no so suficientes.
Assim, quando consideramos variveis como peso e altura de um grupo de pessoas,
uso do cigarro e incidncia de cncer, vocabulrio e compreenso da leitura,
dominncia e submisso, procuramos verificar se existe alguma relao entre as
variveis de cada um dos pares e qual o grau dessa relao. Para isso, necessrio o
conhecimento de novas medidas.
Sendo a relao entre as variveis de natureza quantitativa, a correlao o
instrumento adequado para descobrir e medir essa relao.
Uma vez caracterizada a relao, procuramos descrev-la atravs de uma funo
matemtica. A regresso o instrumento adequado para a determinao dos
parmetros dessa funo.
2 Correlao
2.1 Relao funcional e relao estatstica
Como sabemos, o permetro e o lado de um quadrado esto relacionados. A relao
que os liga perfeitamente definida e pode ser expressa por meio de uma sentena
matemtica:
2p = 4l,
onde 2p o permetro e l o lado do quadrado.
Atribuindo-se, ento, um valor qualquer a l, possvel determinar exatamente o
valor de 2p.
Consideremos, agora, a relao que existe entre o peso e a estatura de um grupo de
pessoas. evidente que essa relao no do mesmo tipo da anterior; ela bem
menos precisa. Assim, pode acontecer que a estaturas diferentes correspondam
pesos iguais ou que a estaturas iguais correspondam pesos diferentes. Porm, em
media, quanto maior a estatura, maior o peso.
143
144
Como a correlao em estudo tem como imagem uma reta ascendente, ela
chamada correlao linear positiva.
Assim, uma correlao :
Linear positiva se os pontos do diagrama tm como imagem uma reta
ascendente;
Linear negativa se os pontos do diagrama tm como imagem uma reta
descendente;
No-linear se os pontos tm como imagem uma curva.
Se os pontos se apresentam dispersos, no oferecendo uma imagem definida,
conclumos que no h relao alguma entre as variveis em estudo.
145
Temos, ento:
146
Para que uma relao possa ser descrita por meio do coeficiente de correlao de
Pearson imprescindvel que ela se aproxime de uma funo linear. Uma maneira prtica
de verificarmos a linearidade da relao a inspeo do diagrama de disperso: se a elipse
apresenta salincias ou reentrncias muito acentuadas, provavelmente trata-se de
correlao curvilnea.
Para podermos tirar algumas concluses significativas sobre o comportamento
simultneo das variveis analisadas, necessrio que:
0,6 | r | 1 (forte correlao entre as variveis).
Se 0,3 | r | < 0,6, h uma correlao relativamente fraca entre as variveis.
Se 0 < | r | < 0,3, a correlao muita fraca e, praticamente, nada podemos concluir
sobre a relao entre as variveis em estudo.
147
Estatstica
(yi)
6,0
9,0
8,0
10,0
5,0
7,0
8,0
4,0
6,0
2,0
xiyi
x i2
y i2
30
72
56
100
30
49
72
12
48
4
25
64
49
100
36
49
81
9
64
4
36
81
64
100
25
49
64
16
36
4
= 65
= 65
= 473
= 481
= 475
Logo:
Da:
r = 0,91.
Resultado que indica uma correlao linear positiva altamente significativa entre as
duas variveis.
148
Resolva:
1. Complete o esquema de clculo do coeficiente de correlao para os valores das
variveis xi e yi:
149
3 Regresso
3.1 Ajustamento da reta
Sempre que desejamos estudar determinada varivel em funo de outra, fazemos
uma anlise de regresso.
Podemos dizer que a anlise de regresso tem por objetivo descrever, atravs de
um modelo matemtico, a relao entre as duas variveis, partindo de n observaes
das mesmas.
A varivel sobre a qual desejamos fazer uma estimativa recebe o nome de varivel
dependente e a outra recebe o nome de varivel independente.
Assim, supondo X a varivel independente e Y a dependente, vamos procurar
determinar o ajustamento de uma reta relao entre essas variveis, ou seja, vamos
obter uma funo definida por:
Y = aX + b
onde a e b so os parmetros.
Sejam duas variveis X e Y, entre as quais exista uma correlao acentuada, embora
no perfeita, como, por exemplo, as que formam a tabela 2.
Da, temos:
Tabela 3 Valores das variveis xi e yi.
xi
5
8
7
10
yi
6
9
8
10
cujo diagrama de disperso dado por:
6
5
7
7
9
8
3
4
8
6
2
2
150
Podemos concluir, pela forma do diagrama, que se trata de uma correlao retilnea,
de modo a permitir o ajustamento de uma reta, imagem da funo definida por:
Y = aX + b
Vamos, ento, calcular os valores dos parmetros a e b com a ajuda das frmulas:
onde,
NOTA:
Como estamos fazendo uso de uma amostra para obtermos os valores dos parmetros, o
resultado, na realidade, uma estimativa da verdadeira equao de regresso. Sendo assim,
escrevemos:
151
(yi)
xiyi
x i2
5,0
8,0
7,0
10,0
6,0
7,0
9,0
3,0
8,0
2,0
6,0
9,0
8,0
10,0
5,0
7,0
8,0
4,0
6,0
2,0
30
72
56
100
30
49
72
12
48
4
25
64
49
100
36
49
81
9
64
4
= 65
= 65
= 473 = 481
Temos, assim:
a = 10x473 65x65 = 4730 4225 = 505 = 0,8632
10x481 (65)2
4810 4225 585
152
Assim, temos:
Como a nota 4,0 pertence ao intervalo [2,10], dizemos que foi feita uma
interpolao; e como a nota 1,0 no pertence ao intervalo [2,10], dizemos que foi
uma extrapolao.
NOTA:
Uma norma fundamental no uso das equaes de regresso a de nunca extrapolar, exceto
quando consideraes tericas ou experimentais demonstrem a possibilidade de extrapolao.
153
Resolva:
1. Complete o esquema para o ajustamento de uma reta aos dados:
xi
yi
2
30
4
25
6
22
8
18
10
15
12
11
14
10
154
EXERCCIOS
1 Um grupo de pessoas fez uma avaliao do peso aparente de alguns objetos.
Com o peso real e a media dos pesos aparentes, dados pelo grupo, obteve-se a
tabela:
PESO REAL
18
30
42
62
73
97
120
PESO APARENTE
10
23
33
60
91
98
159
11
14
19
19
22
28
30
31
34
37
yi
13
14
18
15
22
17
24
22
24
25
36
36
38
41
42
43
44
46
Calcule:
a) O coeficiente de correlao;
Sugesto: para simplificar os clculos, use para o tempo uma varivel auxiliar,
por exemplo:
xi = xi - 1984
b) A reta ajustada;
c) A produo estimada para o ano de 1989.
155
10
15
20
25
30
Determine:
a) O coeficiente de correlao;
b) A reta ajustada a essa correlao;
c) O valor estimado do comprimento da barra para a temperatura de 18C;
d) O valor estimado do comprimento da barra para a temperatura de 35C;
5 A variao do valor da Unidade de Preos ao Consumidor - UPC, relativamente
a alguns meses de 2009, deu origem tabela:
MESES
mai
VALORES (R$)
jun
jul
ago
Set
out
nov
Calcule:
a) O grau de correlao de correlao;
b) Estabelea a equao de regresso de Y sobre X;
c) Estime o valor da UPC para o ms de dezembro.
Sugesto: substitua os meses, respectivamente, por 1, 2, 3, ....., 7.
6 A partir da tabela:
xi
yi
70
50
40
30
20
10
156
38
42
50
56
59
63
70
80
95
110
350 325
297
270
256
246
238
223
215
208
157
REFERENCIAS
Bonafini, Fernanda Csar. Estatstica. So Paulo: Pearson Education do Brasil,
2012.
Bruni, Adriano Leal. Estatstica aplicada gesto empresarial. 1.ed. So Paulo:
Editora Atlas, 2007.
Crespo, Antnio Arnot. Estatstica fcil. 17.ed. So Paulo: Saraiva, 2002.
Hoffmann, Ronaldo; Ovalle, Vieira Sonia. Elementos de estatstica. 4.ed. So
Paulo: Editora Atlas, 2003.
Morettin, Pedro A. Estatstica bsica. 5.ed. So Paulo: Saraiva, 2002.
Pinheiro, Joo Ismael D. Estatstica bsica: a arte de trabalhar com dados. Rio
de Janeiro: Elsevier, 2009.
Ronald, E. Walpole. Probabilidade & estatstica para engenharia e cincias. So
Paulo: Pearson Prentice Hall, 2009.
Silva, Ermes Medeiro da; Silva, Elio Medeiro da; Gonalves; Valter; Murolo,
Afrnio Carlos. Estatstica: Para os cursos de economia, Administrao e
Cincias Contbeis - 1. 3.ed. So Paulo: Editora Atlas, 1999.
Toledo, Geraldo Luciano; Ovalle, Ivo Izidoro. Estatstica bsica. 2.ed. So Paulo:
Editora Atlas, 1985.
158
ANEXOS:
159
L1
L2
L3
L4
L5
L6
L7
L8
L9
L10
L11
L12
L13
L14
L15
L16
L17
L18
L19
L20
L21
L22
L23
L24
L25
L26
L27
L28
L29
C1
4
3
2
1
0
0
8
8
5
6
4
3
2
0
9
7
8
6
5
3
8
1
2
4
5
2
1
0
9
C2
1
0
2
9
3
8
3
8
4
7
4
5
6
1
0
2
9
3
8
4
7
4
7
3
0
5
1
2
1
C3
6
7
5
8
4
9
3
0
1
2
0
1
9
2
8
2
3
0
1
0
2
9
3
8
3
7
4
7
5
C4
1
2
3
4
5
6
7
8
9
0
5
4
3
2
1
0
9
8
7
6
1
1
2
2
3
3
4
4
5
C5
6
6
7
7
8
8
9
9
0
0
1
3
5
7
9
2
4
6
8
0
1
3
5
7
9
0
2
3
6
C6
1
3
5
7
9
1
0
2
0
3
9
3
8
4
8
5
7
6
7
1
3
2
4
3
5
4
6
6
8
C7
0
9
0
8
0
7
6
3
2
1
1
0
2
0
3
0
4
0
5
9
5
8
6
7
7
2
3
4
5
C8
2
5
1
6
2
2
3
6
0
1
9
3
3
7
8
5
1
1
9
8
2
6
5
8
0
2
2
3
6
C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 C21 C22 C23 C24 C25 C26 C27 C28 C29
3 5
7
6
2
0
9
9
8
1
0
3
4
7
2
1
0
8
7
8
4
5 3
4
8
8
0
9
3
0
1
7
0
4
0
8
3
1
2
0
1
2
9 8
7
6
3
0
0
1
2
1
4
3
2
4
5
6
7
7
4
3
0
5 2
7
8
1
0
0
7
5
3
2
2
5
8
1
9
0
3
2
3
4
0 3
1
0
1
1
2
4
3
1
9
5
6
8
5
0
2
3
4
9
0
2 2
2
8
6
1
9
4
5
2
0
0
1
3
1
0
9
2
3
4
1
7 6
4
0
7
1
2
1
0
1
2
8
9
7
5
3
2
1
1
8
2
3 7
3
7
8
9
4
3
9
2
3
2
3
0
0
4
4
2
3
1
3
3 7
5
0
9
7
6
5
7
8
0
8
4
5
2
3
0
7
4
3
6
1 2
6
0
2
0
8
0
9
7
7
7
3
6
7
2
9
0
3
1
0
4 1
8
4
2
1
3
3
2
7
6
4
4
3
8
9
0
7
2
2
9
2 3
7
0
3
4
5
8
9
3
5
2
4
0
1
7
9
1
8
1
3
6 5
0
2
6
3
6
7
0
1
7
9
6
8
3
5
3
3
5
7
2
0 7
9
0
0
6
5
2
7
8
1
0
0
7
5
3
0
9
1
1
3
3 9
4
0
1
9
5
2
2
0
0
2
1
2
4
7
6
3
2
1
5
3 2
1
3
5
8
9
1
2
3
9
6
5
2
7
8
1
0
0
7
0
1 4
2
4
6
7
0
2
3
7
8
5
3
1
2
5
6
9
0
7
9
4 6
2
2
3
3
0
1
5
4
5
1
1
3
4
7
8
1
2
8
8
4 8
0
0
2
3
6
9
6
4
3
6
7
2
1
9
7
0
1
8
5
4 0
2
9
2
3
2
5
3
5
7
2
7
8
2
5
6
2
2
9
4
4 1
7
5
7
3
0
0
9
1
2
0
3
4
9
3
0
4
4
9
1
1 2
0
2
0
1
3
5
4
6
4
3
2
0
0
3
9
6
6
0
2
8 4
0
8
0
1
9
6
9
5
0
8
0
2
4
9
8
8
8
0
3
0 3
0
9
2
2
6
7
6
4
9
8
9
4
7
7
7
0
0
2
4
4 5
8
7
4
2
2
3
8
2
1
2
2
0
7
0
6
1
1
2
5
6 6
1
1
0
3
9
9
1
0
3
4
3
9
6
3
5
3
3
4
8
0 8
9
2
3
3
7
7
4
0
5
6
8
8
5
2
4
5
5
4
0
1 7
1
0
2
0
9
6
4
3
7
9
0
7
6
1
3
7
5
5
8
9 8
2
0
2
3
0
1
4
3
3
7
7
5
6
7
4
3
4
0
1
160
161