Académique Documents
Professionnel Documents
Culture Documents
2014
SUMRIO
INTRODUO ............................................................................................ 03
UNIDADE 1: A NATUREZA DA ESTATSTICA ................................... 05
UNIDADE 2: POPULAO E AMOSTRA ............................................. 12
UNIDADE 3: SRIES ESTATSTICAS.................................................... 20
UNIDADE 4: GRFICOS ........................................................................... 32
UNIDADE 5: DISTRIBUIO DE FREQUENCIA ................................ 45
UNIDADE 6: MEDIDAS DE POSIO ................................................... 64
UNIDADE 7: MEDIDAS DE DISPERSO OU VARIABILIDADE....... 92
UNIDADE 8: PROBABILIDADE ............................................................ 105
UNIDADE 9: DISTRIBUIO BINOMIAL E NORMAL ................... 116
UNIDADE 10: CORRELAO E REGRESSO .................................. 139
REFERENCIAS ......................................................................................... 154
ANEXOS ..................................................................................................... 155
INTRODUO
Na antiguidade os povos j registravam o nmero de habitantes, nascimentos,
bitos. Faziam "estatsticas". Na idade mdia as informaes eram tabuladas
com finalidades tributrias e blicas.
No sculo XVI surgem as primeiras anlises sistemticas, as primeiras tabelas
e os nmeros relativos.
No sculo XVIII a estatstica com feio cientfica batizada por
GODOFREDO ACHENWALL. As tabelas ficam mais completas, surgem as
primeiras representaes grficas e os clculos de probabilidades. A estatstica
deixa de ser uma simples tabulao de dados numricos para se tornar "O
estudo de como se chegar a concluso sobre uma populao, partindo da
observao de partes dessa populao (amostra)".
Ao longo do sculo XX, os mtodos estatsticos foram desenvolvidos como
uma mistura de cincia, tecnologia e lgica para a soluo e investigao de
problemas em vrias reas do conhecimento humano (Stigler, 1986). Ela foi
reconhecida como um campo da cincia neste perodo, mas sua histria tem
incio bem anterior a 1900.
A estatstica moderna uma tecnologia quantitativa para a cincia
experimental e observacional que permite avaliar e estudar as incertezas e os
seus efeitos no planejamento e interpretao de experincias e de observaes
de fenmenos da natureza e da sociedade.
A estatstica no uma caixa-preta, nem bola de cristal, nem mgica.
Tampouco um conjunto de tcnicas teis para algumas reas isoladas ou
restritas da cincia. Por exemplo, ao contrrio do que alguns imaginam, a
estatstica no um ramo da matemtica onde se investigam os processos de
obteno, organizao e anlise de dados sobre uma determinada populao.
A estatstica tambm no se limita a um conjunto de elementos numricos
relativos a um fato social, nem a nmeros, tabelas e grficos usados para o
resumo, organizao e apresentao dos dados de uma pesquisa, embora este
seja um aspecto da estatstica que pode ser facilmente percebido no cotidiano
(basta abrir os jornais e revistas para ver o "bombardeio" de estatsticas). Ela
uma cincia multidisciplinar: um mesmo programa de computador que
permite a anlise estatstica de dados de um fsico poderia tambm ser usado
por um economista, agrnomo, qumico, gelogo, matemtico, bilogo,
socilogo, psiclogo e cientista poltico. Mesmo que as interpretaes dessas
anlises sejam diferentes por causa das diferenas entre as reas do
3
I - A NATUREZA DA ESTATSTICA
PANORAMA HISTRICO
Todas as cincias tm suas razes na histria do homem.
A Matemtica, que considerada a cincia que une clareza do raciocnio a
sntese da linguagem, originou-se do convvio social, das trocas, da
contagem, com carter prtico, utilitrio, emprico.
A estatstica, ramo da matemtica aplicada, teve origem semelhante.
Desde a antiguidade, vrios povos j registravam o nmero de habitantes, de
nascimentos, de bitos, faziam estimativas das riquezas individual e social,
distriburam equitativamente terras ao povo, cobravam impostos e realizavam
inquritos quantitativos por processos que, hoje, chamaramos de
"estatsticas".
Na idade mdia colhiam-se informaes, geralmente com finalidades
tributrias ou blicas.
A partir do sculo XVI comearam a surgir as primeiras anlises sistemticas
de fatos sociais, como batizados, casamentos, funerais, originando as
primeiras tbuas e tabelas e os primeiros nmeros relativos.
No sculo XVIII o estudo de tais fatos foi adquirindo, aos poucos, feio
verdadeiramente cientfica. Godofredo Achenwall batizou a nova cincia (ou
mtodo) com o nome de Estatstica, determinando o seu objetivo com as
cincias.
As tabelas tornam-se mais completas, surgiram as representaes grficas e o
clculo das probabilidades, e a estatstica deixa de ser uma simples
catalogao de dados numricos para se tornar o estudo de como se chegar a
concluso sobre uma populao, partindo da observao de partes dessa
populao (amostra).
Atualmente, o pblico leigo (leitor de jornais e revistas) posiciona-se em dois
extremos divergentes e igualmente errneos quanto a validade das concluses
estatsticas: ou cr em sua infalibilidade ou afirma que elas nada provam. Os
que assim pensam ignoram os objetivos, o campo e o rigor do mtodo
estatstico; ignoram a Estatstica, quer terica quer prtica, ou a conhecem
muito superficialmente.
Na era da energia nuclear, os estudos estatsticos tm avanado rapidamente e,
com seus processos e tcnicas, tm contribudo para a organizao dos
negcios e recursos do mundo moderno.
MTODO ESTATSTICO
O Mtodo Cientfico
Muitos dos conhecimentos que temos foram obtidos na antiguidade por acaso
e, outros, por necessidades prticas, sem aplicao de um mtodo.
Atualmente, quase todo acrscimo de conhecimento resulta da observao e
do estudo. Se bem que muito desse conhecimento possa ter sido observado
inicialmente por acaso, a verdade que desenvolvemos processos cientficos
para seu estudo e para adquirirmos tais conhecimentos. Podemos ento dizer
que:
Mtodo: um conjunto de meios dispostos convenientemente para se
chegar a um fim que se deseja, ou seja, um meio mais eficaz para
atingir determinada meta.
Dos mtodos cientficos, vamos destacar o Mtodo experimental e o Mtodo
estatstico.
O Mtodo Experimental - o mtodo preferido pela fsica, Qumica, etc.
Mtodo experimental: consiste em manter constantes todas as causas
(fatores), menos uma, e variar esta causa de modo que o pesquisador
possa descobrir seus efeitos, caso existam.
O Mtodo Estatstico
Muitas vezes temos necessidade de descobrir fatos em um campo em que o
mtodo experimental no se aplica (nas cincias sociais), j que os vrios
fatores que afetam o fenmeno em estudo no podem permanecer constantes
enquanto fazemos variar a causa que, naquele momento, nos interessa.
Como exemplo, podemos citar a determinao das causas que definem o preo
de uma mercadoria. Para aplicarmos o mtodo experimental, teramos de fazer
variar a quantidade da mercadoria e verificar se tal fato iria influenciar seu
preo.
Contudo, seria necessrio que no houvesse alterao nos outros fatores.
Assim, deveria existir, no momento da pesquisa, uma uniformidade dos
salrios, o gosto dos consumidores deveria permanecer constante, seria
necessria a fixao do nvel geral dos preos das outras necessidades etc.
Mas isso tudo impossvel.
10
EXERCCIOS
1. Complete:
O mtodo experimental o mais usado por cincias como: _______________.
2. As cincias humanas e sociais, para obter os dados que buscam, lanam
mo de que mtodo?
3. O que Estatstica?
4. Cite as fases do mtodo estatstico.
5. Para voc, o que coletar dados?
6. Para que serve a crtica dos dados?
7. O que apurar dados?
8. Como podem ser apresentados ou expostos os dados?
9. As concluses, as inferncias pertencem a que parte da Estatstica?
10. Cite trs ou mais atividades do planejamento empresarial em que a
Estatstica se faz necessria.
11. O mtodo estatstico tem como um de seus fins:
a)
b)
c)
d)
e)
11
II POPULAO E AMOSTRA
1 VARIVEL
A cada fenmeno corresponde um nmero de resultados possveis. Assim, por
exemplo:
- para um fenmeno sexo so dois os resultados possveis:
masculino e feminino;
- para o fenmeno nmero de filhos h um nmero de
resultados possveis expressos atravs dos nmeros naturais: 0,1,2,3,....,n;
- para o fenmeno estatura temos uma situao diferente, pois
os resultados podem tomar um nmero infinito de valores numricos dentro de
um determinado intervalo.
Varivel: , convencionalmente, o conjunto de resultados possveis de
um fenmeno.
Uma varivel pode ser: qualitativa ou quantitativa
Qualitativa: quando seus valores so expressos por atributos; ex.: sexo
(masculino ou feminino), cor da pele (branca, preta, amarela, vermelha,
parda) etc.;
Quantitativa: quando seus valores so expressos em nmeros; ex.:
salrios dos operrios, idade, altura, etc. Divide-se em discreta e
contnua:
Discreta ou descontnua: seus valores so expressos geralmente
atravs de nmeros inteiros no negativos. Resulta normalmente
de contagens.
Ex.: nmero de alunos de uma escola que pode assumir qualquer
um dos valores do conjunto N = {1, 2, 3, ..., 58,...}, mas nunca
valores como 2,5 ou 3,78 ou 4,325 etc.
Contnua: resulta normalmente de uma mensurao, e a escala
numrica de seus possveis valores corresponde ao conjunto R
dos nmeros reais, ou seja, podem assumir, teoricamente,
qualquer valor entre dois limites. Ex.: peso dos alunos de uma
escola, pois um aluno tanto pode pesar 72 kg, como 72,5 kg,
como 72,54 kg, dependendo da preciso da medida.
12
13
15
16
EXERCCIOS
1 Uma escola abriga 124 alunos. Obtenha uma amostra representativa
correspondendo a 15% da populao.
Sugesto: Use a 8, 9 e 10 colunas, a partir da 1 linha, da Tabela de
Nmeros Aleatrios (de cima para baixo).
2 Em uma escola h oitenta alunos. Obtenha uma amostra de doze alunos.
Sugesto: Use a Tabela de Nmeros Aleatrios (escolha a linha e a coluna).
3 Identifique o tipo de amostragem utilizada em cada situao: simples ao
acaso, sistemtica ou estratificada.
a) Dentre 240 pessoas escaladas para um sorteio de jri, 120 so brancas, 80
so negras e 40 so morenas.
b) Um administrador hospitalar faz uma pesquisa com as pessoas que esto na
fila de espera para serem atendidas pelo sistema SUS, entrevistando uma a
cada 10 pessoas da fila.
c) O sorteio de um livro dentre os 40 alunos de Estatstica de uma turma do
IFCE.
4 Uma empresa tem 3.414 colaboradores repartidos nos seguintes
departamentos: Administrao (914), Transporte (348), Produo (1401) e
Outros (751). Deseja-se extrair uma amostra entre os colaboradores para
verificar o grau de satisfao em relao qualidade da refeio servida no
refeitrio. Retire uma amostra de:
a) 10% colaboradores?
b) 854 colaboradores desta empresa.
5 O diretor de uma escola, na qual esto matriculados 280 meninos e 320
meninas, desejoso de conhecer as condies de vida extraescolar de seus
alunos e no dispondo de tempo para entrevistar todas as famlias, resolveu
fazer um levantamento, por amostragem, em 10% dessa clientela. Obtenha,
para esse diretor, os elementos componentes da amostra.
6 Mostre como seria possvel retirar uma amostra de 32 elementos de uma
populao ordenada por 2432 elementos. Na ordenao geral, qual dos
elementos abaixo seria escolhido para pertencer amostra, sabendo-se que o
elemento de ordem 1420 a ela pertence?
1648; 290; 725; 2025; 1120.
18
N DE ESTUDANTES
MASCULINO
FEMININO
80
95
102
120
110
92
134
228
150
130
300
290
876
955
19
20
Zero (0) quando o valor muito pequeno para ser expresso pela
unidade utilizada. Se os valores so expressos em numerais decimais,
precisamos acrescentar parte decimal um nmero correspondente de
zeros (0,0; 0,00; 0,000; .....);
Obs.: Os lados direito e esquerdo de uma tabela oficial devem ser abertos.
21
N de Casos
N de bitos
115
...
35
150
15
10
5
30
(1)
SRIES ESTATSTICAS
Denominamos sries estatsticas toda tabela que apresenta a distribuio de
um conjunto de dados estatsticos em funo da poca, do local ou da espcie.
Da, podemos inferir que numa srie estatstica observamos a existncia de
trs elementos ou fatores: o tempo, o espao e a espcie.
Dividem-se em sries homgradas e conjugadas.
Sries Homgradas: so aquelas em que a varivel descrita apresenta
variao discreta ou descontnua. Podem ser do tipo temporal,
geogrfica ou especfica.
a) Srie Temporal: Identifica-se pelo carter varivel do fator cronolgico. O
local e a espcie (fenmeno) so elementos fixos. Esta srie tambm
chamada de histrica, cronolgica, marcha ou evolutiva.
Frango Preos Mdios em So Paulo 2003 a 2008
ANOS
PREO (R$)
2003
2004
2005
2006
2007
2008
2,56
2,64
2,67
2,53
3,20
3,64
22
N DE ANOS
Itlia
Alemanha
Frana
Holanda
Inglaterra
7,5
7,0
7,0
5,9
Menos de 4
QUANTIDADE
Bovinos
Bubalinos
Aves
Sunos
Ovinos
Caprinos
205.886.244
1.156.870
821.541.630
35.173.824
16.019.170
10.401.449
Fonte: IBGE.
1991
1992
1993
Norte
Nordeste
Sudeste
Sul
Centro-Oeste
342.938
1.287.813
6.234.501
1.497.315
713.357
375.658
1.379.101
6.729.467
1.608.989
778.925
403.494
1.486.649
7.231.634
1.746.232
884.822
Resolva:
1 Classifique as sries
24
VENDAS
(mil und.)
FIAT
VW
GM
TOTAL
17
23
12
52
a) Classifique a srie;
b) Represente esta srie atravs de grfico de setores.
4 Considere a srie abaixo:
Vendas no Ano de 2008 (em mil unidades)
FILIAIS
JAN
FEV
MAR
SO PAULO
FORTALEZA
RIO DE JANEIRO
TOTAL
10
8
12
30
15
5
13
33
7
4
10
21
a) Classifique a srie;
b) Represente esta srie atravs de grfico de colunas;
c) Represente esta srie atravs de grfico de barras;
5 Verificou-se, em 1993, o seguinte movimento de importao de
mercadorias: 14.839.804 t, oriundas da Arbia Saudita, no valor de US$
1.469.000; 10.547.889 t, dos Estados Unidos, no valor de US$ 6.034.946.000;
e 561.024 t, do Japo, no valor de US$ 1.518.843.000. Confeccione a srie
correspondente e classifique-a, sabendo que os dados acima foram fornecidos
pelo Ministrio da Fazenda.
25
6-
Complete-a com uma coluna de percentagens com uma casa decimal e faa a
compensao, se necessrio.
DADOS ABSOLUTOS E DADOS RELATIVOS
Dados absolutos: so dados resultantes da coleta direta da fonte, sem
outra manipulao seno a contagem ou medida.
A leitura dos dados absolutos sempre enfadonha e inexpressiva; embora
esses dados traduzam um resultado exato e fiel, no tm a virtude de ressaltar
de imediato as suas concluses numricas. Da o uso imprescindvel que faz a
Estatstica dos dados relativos.
Dados relativos: so os resultados de comparaes por quocientes
(razes) que se estabelecem entre dados absolutos e tm por finalidade
realar ou facilitar as comparaes entre quantidades.
Traduzem-se os dados relativos, em geral, por meio de percentagens, ndices,
coeficientes e taxas.
26
1 Percentagens
Considere a srie:
MATRCULAS NAS ESCOLAS DA CIDADE A 2011
GRAU
N. DE ALUNOS
Fundamental
Ensino mdio
Superior
TOTAL
19286
1681
234
21201
Dados fictcios.
N. DE ALUNOS
Fundamental
Ensino mdio
Superior
TOTAL
19286
1681
234
21201
91,0
7,9
1,1
100
Dados fictcios.
Os valores dessa nova coluna nos dizem que, de cada 100 alunos da cidade A,
91 esto no ensino fundamental, 8 aproximadamente esto no ensino mdio e
1 aproximadamente est matriculado no ensino superior.
O emprego da porcentagem de grande valia quando nosso intuito destacar
a participao da parte no todo.
27
NOTAS:
Do mesmo modo que tomamos 100 para base de comparao, tambm
podemos tomar outro nmero qualquer, entre os quais destacamos o
nmero 1. claro que, supondo o total igual a 1, os dados relativos das
parcelas sero todos menores que 1.
Em geral, quando usamos 100 para base, os dados so arredondados at
a primeira casa decimal; e quando tomamos 1 por base, so
arredondados at a terceira casa decimal.
Resolva:
1 - Complete a tabela abaixo
DADOS RELATIVOS
ESCOLAS
N. DE ALUNOS
A
B
C
D
E
F
TOTAL
POR 1
POR 100
0,098
9,8
1,000
100,0
175
222
202
362
280
540
1781
2 ndices
Os ndices so razes entre duas grandezas tais que uma no inclui a outra.
So exemplos de ndices:
ndice ceflico = dimetro transversal do crnio x 100
dimetro longitudinal do crnio
Quociente intelectual =
idade mental
idade cronolgica
x 100
28
renda____
populao
receita__
populao
3 Coeficientes
Os coeficientes so razes entre o nmero de ocorrncias e o nmero total
(nmero de ocorrncias e nmero de no-ocorrncias).
So exemplos de coeficientes:
Coeficiente de natalidade = nmero de nascimentos
populao total
Coeficiente de mortalidade = nmero de bitos__
populao total
Coeficiente educacionais:
Coeficiente de evaso escolar =
n. de alunos evadidos__
n. inicial de matrculas
29
4 Taxas
As taxas so os coeficientes multiplicados por uma potncia de 10 (10, 100,
1000 etc.) para tornar o resultado mais inteligvel.
So exemplos de taxas:
Taxa de natalidade = Coeficiente de natalidade X 1000
Taxa de mortalidade = Coeficiente de mortalidade X 1000
Taxa de evaso escolar = Coeficiente de evaso escolar X 100
Exerccio Resolvido:
1 O estado A apresentou 733.986 matriculados na 1 srie, no incio do ano
de 2012, e 683.816 no fim do ano. O Estado B apresentou, respectivamente,
436.127 e 412.457 matriculados. Qual o Estado que apresentou maior evaso
escolar?
A: TEE = (733.986 683.816) x 100 = 6,8%
733.986
B: TEE = (436.127 412.457) x 100 = 5,4%
436.127
O Estado que apresentou maior evaso escolar foi A.
EXERCCIOS
1 Considere a srie estatstica:
SRIES
ALUNOS MATRIC.
1
546
2
328
3
280
4
120
TOTAL
1274
Complete-a, determinando as percentagens com uma casa decimal e fazendo
a compensao, se necessrio.
30
NOVEMBRO
480
458
436
420
1794
475
456
430
420
1781
1
2
3
4
TOTAL
a. Calcule a taxa de evaso por srie
b. Calcule a taxa de evaso da escola
31
IV - GRFICOS ESTATSTICOS
1- Conceito:
O grfico um mtodo de representao de dados estatsticos em forma
visual, por meio de figuras geomtricas. Devem corresponder, mas nunca
substituir as tabelas estatsticas.
uma forma de apresentao dos dados estatsticos, cujo objetivo o de
produzir, no investigador ou no pblico em geral, uma impresso mais rpida
e viva do fenmeno em estudo, j que os grficos falam mais compreenso
que as sries.
Para tornarmos possvel uma representao grfica, estabelecemos uma
correspondncia entre os termos da srie e determinada figura geomtrica, de
tal modo que cada elemento da srie seja representado por uma figura
proporcional.
A representao grfica deve obedecer a certos requisitos fundamentais como:
Simplicidade o grfico deve ser destitudo de detalhes de importncia
secundria, assim como traos desnecessrios que possam levar o
observador a uma anlise morosa ou com erros. Deve proporcionar que
o observador analise rapidamente o fenmeno apresentado;
Clareza deve proporcionar que o observador tenha uma correta leitura
dos valores representativos do fenmeno;
Veracidade deve expressar a verdade sobre o fenmeno em estudo.
Uso indevido de Grficos: Podem trazer uma ideia falsa dos dados que esto
sendo analisados, chegando mesmo a confundir o leitor. Trata-se, na realidade,
de um problema de construo de escalas.
32
34
35
NOTAS:
Quando as legendas no so breves usa-se de preferncia os grficos em
barras horizontais;
A ordem a ser observada a cronolgica, se a srie for histrica, e a
decrescente, se for geogrfica ou categrica;
A distncia entre as colunas (ou barras), por questes estticas, no
dever ser menor que a metade nem maior que os dois teros da largura
(ou da altura) dos retngulos.
36
Grficos em setores
Este grfico construdo com base em um crculo, e empregado sempre que
desejamos ressaltar a participao do dado no total.
O total representado pelo crculo, que fica dividido em tantos setores quantas
so as partes.
Os setores so tais que suas reas so respectivamente proporcionais aos
dados da srie. Obtemos cada setor por meio de uma regra de trs simples e
direta, lembrando que o total da srie corresponde a 360.
37
38
2.2 - Estereogramas:
So grficos geomtricos dispostos em trs dimenses, pois representam
volume. So usados nas representaes grficas das tabelas de dupla entrada.
Em alguns casos este tipo de grfico fica difcil de ser interpretado dada a
pequena preciso que oferecem.
2.3 - Pictogramas:
So construdos a partir de figuras representativas da intensidade do
fenmeno. Este tipo de grfico tem a vantagem de despertar a ateno do
pblico leigo, pois sua forma atraente e sugestiva. Os smbolos devem ser
auto-explicativos. A desvantagem dos pictogramas que apenas mostram uma
viso geral do fenmeno, e no de detalhes minuciosos. Veja o exemplo
abaixo:
39
40
41
EXERCCIOS
1 Represente a srie abaixo usando o grfico em linha:
COMRCIO EXTERIOR
BRASIL 1984 -93
QUANTIDADE (1000t)
ANOS
EXPORTAO
IMPORTAO
141.737
146.351
133.832
142.378
169.666
177.033
168.095
165.974
167.295
182.561
53.988
48.870
60.597
61.975
58.095
57.293
57.184
63.278
68.059
77.813
84
85
86
87
88
89
90
91
92
93
VOLUME (1000m3)
88
89
90
91
9.267,7
9.723,1
10.121,3
12.345,4
Fonte: IBGE.
QUANT. (1000m3)
91
92
93
36.180,4
36.410,5
37.164,3
Fonte: Petrobrs.
42
QUANT.
(1000dzias)
Norte
Nordeste
Sudeste
Sul
Centro-Oeste
57.297
414.804
984.659
615.978
126.345
Fonte: IBGE.
QUANTIDADE
Automveis
Comerciais leves
Comerciais pesados
1.100.278
224.387
66.771
Fonte: ANFAVEA.
RELATIVA (%)
Norte
Nordeste
Sudeste
Sul
Centro-Oeste
45,25
18,28
10,85
6,76
18,86
Fonte: IBGE.
PRODUO (1000t)
Minas Gerais
Esprito Santo
Rio de Janeiro
So Paulo
12.888
3.174
5.008
2.912
43
PRPRIOS (%)
ALUGADOS (%)
CEDIDOS (%)
62,7
70,3
22,9
16,5
14,4
13,2
Fonte: IBGE.
44
V - DISTRIBUIO DE FREQUENCIA
Vamos considerar, neste captulo, em particular, a forma pela qual podemos
descrever os dados estatsticos resultantes de variveis quantitativas, como o
caso de notas obtidas pelos alunos de uma classe, estaturas de um conjunto de
pessoas, salrios recebidos pelos operrios de uma fbrica, etc.
1 Tabela Primitiva e Rol
Considere a estatura de quarenta alunos, que compem uma amostra dos
alunos do IFCE, resultando a seguinte tabela de valores:
ESTATURAS DE 40 ALUNOS DO IFCE
166
162
155
154
160
161
152
161
161
168
163
156
150
163
160
172
162
156
155
153
160
173
155
157
165
160
169
156
167
155
151
158
164
164
170
158
160
168
164
161
151
156
161
165
152
157
161
166
153
158
161
167
154
158
162
168
155
160
162
168
155
160
163
169
155
160
163
170
155
160
164
172
156
160
164
173
45
46
VARIVEL
FREQUENCIA
150
151
152
153
154
155
156
157
158
160
161
162
163
164
165
166
167
168
169
170
172
173
1
1
1
1
1
4
3
1
2
5
4
2
2
3
1
1
1
2
1
1
1
1
40
TOTAL
47
FREQUENCIAS
4
9
11
8
5
3
40
82
93
75
70
43
32
59
63
80
61
69
76
60
87
73
65
54
71
Como todos os dados possuem dois algarismos, podemos dividir cada dado
em algarismo da dezena e da unidade. Portanto, o algarismo da dezena ser o
48
ramo
folha
3
4
5
6 8
7
8
9
(b)
3
4
5
6 8
7
8 2
9
(c)
3
4
5
6
7
8
9
(d)
2
3
9
8
5
2
3
4
9
3
0
1
0
0
7
3
6
1
1
49
50
Temos:
24 = 6
4
51
FREQUNCIA
4
9
11
8
5
3
40
f1 = 4; f2 = 9; f3 = 11; f4 = 8; f5 = 5 e f6 = 3.
A soma das frequncias sempre igual ao total de elementos da amostra.
Atividade 1: As notas obtidas por 50 alunos de uma classe foram:
1; 2; 3; 4; 5; 0; 6; 7; 7; 8; 2; 3; 3; 4; 5; 6; 6; 7; 8; 8; 2; 3; 4; 4; 5; 6; 6; 7; 8; 9;
2; 3; 4; 5; 5; 6; 6; 7; 8; 9; 2; 3; 4; 5; 5; 6; 7; 7; 8; 9.
a) Complete a distribuio de frequncia abaixo:
i
1
2
3
4
5
Notas
0 |---- 2
2 |---- 4
4 |---- 6
6 |---- 8
8 |---- 10
Total
xi
fi
50
52
b) Agora, responda:
1. Qual a amplitude amostral?
2. Qual a amplitude da distribuio?
3. Qual o nmero de classes da distribuio?
4. Qual o limite inferior da quarta classe?
5. Qual o limite superior da classe de ordem 2?
6. Qual a amplitude do segundo intervalo de classe?
7. Qual a frequncia da terceira classe?
c) Complete:
1. h3 = .......
2. n = ........
3. l1 = ........
4. L3 = ........
5. x2 = ........
6. f5 = ........
4 Tipos de Frequncias
Frequncia simples ou absolutas (fi) so os valores que realmente
representam o nmero de dados de cada classe.
A soma das frequncias simples igual ao nmero total de dados da
distribuio.
fi = n
Frequncias relativas (fri) ou fi (%) so os valores das razes entre as
frequncias absolutas de cada classe e a frequncia total da distribuio.
A soma das frequncias relativas igual a 1 ou 100 %.
Logo, para o exemplo da pgina 36 a frequncia da terceira classe :
fr3 = f3/n ; fr3 = 11/40 = 0,275 ou 27,5%
Nota: O propsito das frequncias relativas o de permitir a anlise ou
facilitar as comparaes.
53
xi
52
56
60
64
68
72
--
fi
4
9
11
8
5
3
40
Fi
fi (%)
Fi (%)
--
100
--
54
55
fi
34
Fi
2
9
21
29
34
--
EXERCCIOS
1 - Suponha que o ponto mdio das classes de uma distribuio de frequncia
de umidade relativa em um posto seja: 28%, 37%, 46%, 55%, 64%, 73% e
82%.
a) Encontre a amplitude da classe;
b) Os limites de cada classe.
2 - Imagine que em uma regio durante um dia de inverno foram medidas 150
temperaturas mnimas (em oC) em pontos prximos. Suponha que estas
temperaturas variaram entre 5,18 C a 7,44 C. Determine um conjunto de
intervalos de classe que seja razovel para esse conjunto de dados.
3 Conhecidas as notas de 50 alunos, obtenha uma distribuio de frequncia
tendo 30 para limite inferior da primeira classe e 10 para intervalo de classe.
84 - 68 - 33 - 52 - 47 - 73 - 68 - 61 - 73 - 77 - 74 - 71 - 81 - 91 - 65 - 55 - 57 35 - 85 - 88 - 59 - 80 - 41 - 50 - 53 - 65 - 76 - 85 - 73 - 60 - 67 - 41 - 78 - 56 94 - 35 - 45 - 55 - 64 - 74 - 65 - 94 - 66 - 48 - 39 - 69 - 89 - 98 - 42 - 54.
56
Frequncia (fi)
39
41
38
40
42
200
N. de
Empregados
8
10
16
14
10
5
2
65
57
Determinar:
a) O limite inferior da 6 classe;
b) O limite superior da 4 classe;
c) O ponto mdio da 3 classe;
d) A amplitude do 5 intervalo de classe;
e) A frequncia da 3 classe;
f) A frequncia relativa da 3 classe;
g) O intervalo de classe que tem a maior frequncia;
h) A percentagem de empregados que ganham menos de R$ 8.000,00 por ms;
i) A percentagem de empregados que ganham menos de R$ 10.000,00 e pelo
menos R$ 6.000,00 por ms;
8- A distribuio abaixo indica o nmero de acidentes ocorridos com 70
motoristas de uma empresa de nibus:
N ACIDENTES
N MOTORISTAS
20
10
16
Determine:
a)
b)
c)
d)
300 |-- 400 |-- 500 |-- 600 |-- 700 |-- 800 |-- 900 |-- 1000 |-- 1100 |-- 1200
14
46
58
76
68
62
48
22
a amplitude total;
o limite superior da quinta classe;
o limite inferior da oitava classe;
o ponto mdio da stima classe;
a amplitude do intervalo da segunda classe;
a frequncia da quarta classe;
58
59
FREQUNCIA
4
9
11
8
5
3
40
60
61
xi
52
56
60
64
68
72
--
fi
4
9
11
8
5
3
40
Fi
fi (%)
Fi (%)
--
100
--
PESOS
(Kg)
40 |--- 44
44 |--- 48
48 |--- 52
52 |--- 56
56 |--- 60
Total
fi
2
5
9
6
4
26
62
b)
i
1
2
3
4
5
6
7
SALRIOS
(R$)
500 |--- 700
700 |--- 900
900 |--- 1100
1100 |--- 1300
1300 |--- 1500
1500 |--- 1700
1700 |--- 1900
Total
fi
8
20
7
5
2
1
1
44
63
VI - MEDIDAS DE POSIO
1 Introduo
O estudo que fizemos sobre distribuies de frequncia, at agora, permite-nos
descrever, de modo geral, os grupos dos valores que uma varivel pode
assumir. Dessa forma, podemos localizar a maior concentrao de valores de
uma dada distribuio, isto , se ela se localiza no incio, no meio ou no final,
ou ainda, se h uma distribuio por igual.
Porm, para ressaltar as tendncias caractersticas de cada distribuio,
isoladamente, ou em confronto com outras, necessitamos introduzir conceitos
que se expressam atravs de nmeros, que nos permitam traduzir essas
tendncias. Esses conceitos so denominados elementos tpicos da
distribuio e so as:
a. medidas de posio;
b. medidas de variabilidade ou disperso;
c. medidas de assimetria;
d. medidas de curtose.
Dentre os elementos tpicos, destacamos, neste captulo, as medidas de
posio - estatsticas que representam uma srie de dados orientando-nos
quanto posio da distribuio em relao ao eixo horizontal do grfico da
curva de frequncia.
As medidas de posies mais importantes so as medidas de tendncia
central ou promdias, que recebem tal denominao pelo fato de os dados
observados tenderem, em geral, a se agruparem em torno dos valores centrais.
Dentre as medidas de tendncia central, destacamos:
a. a mdia aritmtica;
b. a moda;
c. a mediana.
Outras promdias menos usadas so as mdias: geomtrica, harmnica,
quadrtica, cbica e biquadrtica.
As outras medidas de posio so as separatrizes, que englobam: a prpria
mediana, os decis, os quartis e os percentis.
64
2 Mdia Aritmtica (
.= 14 Kg
65
No exemplo anterior: d1 + d2 + d3 + d4 + d5 + d6 + d7 = 0
2 propriedade: Somando-se (ou subtraindo-se) uma constante (c) a todos
os valores de uma varivel, a mdia do conjunto fica aumentada (ou
diminuda) dessa constante.
.+ 2 = 14 +2 = 16 kg
66
x 3 = 14 x 3 = 42 kg.
Frequncia (fi)
2
6
10
12
4
34
67
xi
0
1
2
3
4
fi
2
6
10
12
4
34
x i . fi
0
6
20
36
16
78
Temos, xifi = 78 e f i = 34
Logo xifi / f i = 78 / 34 = 2,3
Portanto a mdia de 2,3 meninos por famlia
Nota:
- Sendo x uma varivel discreta, como interpretar o resultado obtido, 2
meninos e 3 dcimos de menino?
O valor mdio de 2,3 meninos sugere, neste caso, que o maior nmero de
famlias tem 2 meninos e 2 meninas, sendo, porm, a tendncia geral de uma
leve superioridade numrica em relao ao nmero de meninos.
Resolva:
1 Calcule a mdia aritmtica da distribuio:
xi
fi
68
Estaturas (cm)
50 |---- 54
54 |---- 58
58 |---- 62
62 |---- 66
66 |---- 70
70 |---- 74
fi
4
9
11
8
5
3
40
Pela mesma razo do caso anterior, vamos, inicialmente, abrir uma coluna
para os pontos mdios (xi) e outra para os produtos xifi:
i
1
2
3
4
5
6
Estaturas (cm)
50 |---- 54
54 |---- 58
58 |---- 62
62 |---- 66
66 |---- 70
70 |---- 74
fi
4
9
11
8
5
3
40
xi
52
56
60
64
68
72
xi.fi
208
504
660
512
340
216
2.440
69
Resolva:
1 Calcule a media da distribuio de frequncia:
CUSTO (R$)
fi
450 |-- 550 |-- 650 |-- 750 |-- 850 |-- 950 |-- 1050 |-- 1150
10
11
16
13
3 Moda
Denominamos Moda o valor que ocorre com maior frequncia em uma srie
de valores.
Mo o smbolo da moda.
Desse modo, o salrio modal dos empregados de uma fbrica o salrio mais
comum, isto , o salrio recebido pelo maior nmero de empregados dessa
fbrica.
3.1 Dados no - agrupados
Quando lidamos com dados no-agrupados, a moda facilmente reconhecida:
basta, de acordo com definio, procurar o valor que mais se repete.
Exemplo: Na srie de dados {7, 8, 9, 10, 10, 10, 11, 12} a moda igual a 10.
H sries nas quais no exista valor modal, isto , nas quais nenhum valor
aparea mais vezes que outros.
Exemplo: {3 , 5 , 8 , 10 , 12 } no apresenta moda. A srie amodal.
Em outros casos, pode haver dois ou mais valores de concentrao. Dizemos,
ento, que a srie tem dois ou mais valores modais.
Exemplo: {2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7 , 7 , 8 , 9 } apresenta duas modas: 4 e 7.
A srie bimodal.
3.2 Dados agrupados
Sem intervalos de classe
Uma vez agrupados os dados, possvel determinar imediatamente a moda:
basta fixar o valor da varivel de maior frequncia.
70
Frequncia
3
9
12
6
Frequncia
9
11
8
5
71
Na qual:
l* o limite inferior da classe modal;
h* a amplitude da classe modal;
D1 = f* - f (ant.);
D2 = f* - f (post.);
Sendo:
f* a frequncia simples da classe modal;
f (ant.) a frequncia simples da classe anterior classe modal;
f (post.) a frequncia simples da classe posterior classe modal.
Exemplo: Considere a distribuio a seguir
Classes
150 |---- 154
154 |---- 158
158 |---- 162
162 |---- 166
166 |---- 170
170 |---- 174
Total
fi
4
9
11
8
5
3
40
Temos:
D1 = 11 9 = 2 e D2 = 11 8 = 3;
Mo = 158 + 2 x 4 = 159,6 cm
2+3
72
fi
8
10
11
16
13
5
1
64
4 Mediana
A Mediana de um conjunto de valores, dispostos segundo uma ordem
(crescente ou decrescente), o valor situado de tal forma no conjunto que o
separa em dois subconjuntos de mesmo nmero de elementos.
Smbolo da mediana: Md
4.1 Dados no-agrupados
Dada uma srie de valores como, por exemplo:
{5, 2, 6, 13, 9, 15, 10}
De acordo com a definio de mediana, o primeiro passo a ser dado o da
ordenao (crescente ou decrescente) dos valores:
{2, 5, 6, 9, 10, 13, 15}
73
Notas:
75
fi
2
6
9
13
5
35
Fi
2
8
17
30
35
--
fi
1
2
1
2
1
1
8
Fi
1
3
4
6
7
8
--
76
Resolva:
1 Calcule a mediana da distribuio:
xi
10
fi
12
fi
4
9
11
8
5
3
40
Fi
4
13
24
32
37
40
--
77
Temos:
= 40 / 2 =.20
Logo,.a classe mediana ser a terceira classe, ou seja, 58 |---- 62 e com base
nesta classe temos ainda:
l* = 58........... F(ant) = 13........... f* = 11........... h* = 4
Substituindo esses valores na frmula acima, obtemos:
Md = 58 + [(20 - 13) x 4] / 11 = 58 + (28/11) = 58 + 2,54 = 60,54
Obs.: Este valor (Md = 60,54) estimado, pois no temos os 40 valores da
distribuio.
NOTA: No caso de existir uma frequncia acumulada exatamente igual a fi/2, a
mediana ser o limite superior da classe correspondente.
Classes
0 |---- 10
10 |---- 20
20 |---- 30
30 |---- 40
40 |---- 50
50 |---- 60
Total
Temos:
fi
1
3
9
7
4
2
26
Fi
1
4
13
20
24
26
--
= 26 / 2 =.13
Logo,.Md = L* = 30
4.3 - Emprego da Mediana
A mediana usada quando:
a. desejamos obter o ponto que divide a distribuio em duas partes iguais;
b. h valores extremos que afetam de maneira acentuada a mdia
aritmtica;
c. a varivel em estudo salrio.
78
Resolva:
1 Calcule a mediana da distribuio de frequncia:
CUSTO (R$)
fi
450 |-- 550 |-- 650 |-- 750 |-- 850 |-- 950 |-- 1050 |-- 1150
10
11
16
13
79
6 As Separatrizes
Como vimos, a mediana caracteriza uma srie de valores devido sua posio
central. No entanto, ela apresenta uma caracterstica, to importante quanto a
primeira: ela separa a srie em dois grupos que apresentam o mesmo
nmero de valores.
Assim, alm das medidas de posio que estudamos, h outras que,
consideradas individualmente, no so medidas de tendncia central, mas
esto ligadas mediana relativamente sua segunda caracterstica, j que se
baseiam em posio na srie. Essas medidas os quartis, os percentis e os
decis so, juntamente com a mediana, conhecidas pelo nome genrico de
separatrizes.
6.1 Os quartis
Denominamos quartis os valores de uma srie que a divide em quatro
partes iguais.
H, portanto, trs quartis:
a. O primeiro quartil (Q1) valor situado de tal modo na srie que uma
quarta parte (25%) dos dados menor que ele e as trs quartas partes
restantes (75%) so maiores.
b. O segundo quartil (Q2) evidentemente, valor que coincide com a
mediana (Q2 = Md).
c. O terceiro quartil (Q3) valor situado de tal modo na srie que as trs
quartas partes (75%) dos termos so menores que ele e uma quarta parte
restante (25%) maior.
Quando os dados so agrupados, para determinar os quartis usamos a
mesma tcnica do clculo da mediana, bastando substituir, na frmula da
mediana,
por:
80
Exemplo:
Classes
150 |---- 154
154 |---- 158
158 |---- 162
162 |---- 166
166 |---- 170
170 |---- 174
Total
fi
4
9
11
8
5
3
40
Fi
4
13
24
32
37
40
--
(Q1)
(Q3)
81
Resolva:
1. Complete os esquemas para o clculo do primeiro e do terceiro quartis da
distribuio de frequncia:
82
6.2 Os Decis
Denominamos decis os nove valores que separam uma srie em 10 partes
iguais.
Indicamos:
D1, D2, D3, ............, D9
evidente que:
D5= Q2 = Md
10
D1
D3
10
10
83
fi
4
9
11
8
5
3
40
Fi
4
13
24
32
37
40
--
(D7)
Stimo Decil:
7 x fi/10 = 7 x 40/10 = 28 (28 termo)
D7 = 162 + (28 -24).4
8
D7 = 162 + 2 = 164
6.3 Os Percentis
Denominamos percentis os noventa e nove valores que separam uma srie
em 100 partes iguais.
Indicamos:
P1, P2, P3, ............, P99
evidente que:
P50= D5= Q2 = Md, P25= Q1, P75= Q3
O clculo de um percentil segue a mesma tcnica do clculo da mediana,
porm, a frmula
84
Exemplo:
Considerando a distribuio de frequncia, temos para o oitavo percentil:
Classes
150 |---- 154
154 |---- 158
158 |---- 162
162 |---- 166
166 |---- 170
170 |---- 174
Total
fi
4
9
11
8
5
3
40
Fi
4
13
24
32
37
40
--
(P8)
85
Resolva:
1. Complete o esquema para o clculo do vigsimo percentil da distribuio:
86
EXERCCIOS
1 Com relao s propriedades da mdia aritmtica, moda e mediana,
marque V ou F nas sentenas abaixo.
( ) Multiplicando-se todos os elementos de uma srie por 5, sua mdia
permanece inalterada.
( ) A mediana de uma srie disposta em ordem crescente o termo que a
divide em trs partes iguais.
( ) A moda o valor da varivel que possui maior frequncia.
( ) A mediana de uma srie de 46 elementos a mdia dos valores do 23 e
do 24 termos desta srie, quando ela estiver disposta em ordem crescente.
( ) A mediana de uma srie de 33 elementos o valor do 17 termo desta
srie, quando ela estiver disposta em ordem decrescente.
( ) Dividindo-se todos os nmeros de uma srie com cinco elementos por 2,
sua mediana ficar multiplicada por 2.
2 - A mdia da srie {21, 13, 8, 15, 27, 12, 16, 12, 17, 3, 26, 10} igual a:
( ) 15
( ) 12
) 15,5
) 14
) NRA
3 - A mediana da srie {21, 13, 8, 15, 30, 12, 17, 3, 26, 10, 25, 16} igual a:
( ) 15
) 12
( ) 16
( ) 14
) 15,5
4 - A moda da srie {21, 13, 8, 15, 27, 12, 16, 12, 17, 3, 26, 10} igual a:
( ) 15
( ) 12
( ) 15,5
( ) 14
( ) NRA
87
Qual das alternativas representa melhor a mdia aritmtica das idades dos
alunos:
a) 16 anos e 10 meses b) 17 anos e 1 ms c) 17 anos e 5 meses d) 17 anos e 4
meses e) 18 anos e 2 meses
9 - Considere a distribuio de frequncias:
Classes
02 |- 04
04 |- 06
06 |- 08
08 |- 10
10 |- 12
Total
Frequncias
3
k
1001
3k-12
3
88
(fi)
6
9
4
8
5
3
35
IDADE
11
12
13
14
15
A mdia aritmtica vale:
a) 13,2
b) 14,2
A moda e a mediana valem?
c) 14,0
d) 14,5
e) 13,6
Defeitos
300
550
480
980
1050
350
450
870
Pede-se:
a) Calcular a mdia diria de parafusos com defeitos;
b) Projetar o nmero total de parafusos com defeitos em um dia de
trabalho.
89
90
497
506
511
513
520
526
499
508
511
513
520
528
500
508
511
513
523
529
498
507
517
521
531
501
502
503
519
527
530
528
501
508
511
514
524
530
504
508
512
516
524
532
537
520
534
526
535
536
O salrio mdio;
O salrio modal;
O salrio mediano;
Q3; D8; P73.
91
93
Exemplo:
Considerando a tabela abaixo:
Xi
0
1
2
3
4
Total
fi
2
6
12
7
3
30
Temos: AT = 4 0 = 4, logo AT = 4.
2.2.2 Com intervalos de classe
Neste caso, a amplitude total a diferena entre o limite superior da ltima
classe e o limite inferior da primeira classe:
AT = L (max) - l (min)
Exemplo:
Considerando a distribuio de frequncia abaixo:
Classes
150 |---- 154
154 |---- 158
158 |---- 162
162 |---- 166
166 |---- 170
170 |---- 174
Total
fi
4
9
11
8
5
3
40
Temos:
AT = 174 150 = 24, logo: AT = 24 cm.
A amplitude total tem o inconveniente de s levar em conta os dois valores
extremos da srie, descuidando do conjunto de valores intermedirios, o que
quase sempre invalida a idoneidade do resultado. Ela apenas uma indicao
aproximada da disperso ou variabilidade.
94
3 Varincia e Desvio-padro
3.1 Introduo:
A varincia e o desvio-padro levam em considerao a totalidade dos valores
da varivel em estudo, o que faz delas ndices de variabilidade bastante
estveis e, por isso mesmo, os mais geralmente empregados.
A varincia uma medida que tem pouca utilidade como estatstica descritiva,
porm extremamente importante na inferncia estatstica e em combinaes
de amostras.
A varincia baseia-se nos desvios em torno da mdia aritmtica, porm
determinando mdia aritmtica dos quadrados dos desvios. Assim,
representando a varincia por s2, temos:
95
NOTA:
Tanto o desvio-padro como a varincia so usados como medidas de
disperso ou variabilidade. O uso de uma ou de outra depender da
finalidade que se tenha em vista.
Outra frmula bastante utilizada para calcular o desvio-padro de uma
populao :
96
5
5
5
5
5
5
1
-4
-2
0
25
1
16
4
0
--
--
= 46
Usando a frmula:
/ n = 46 / 5 = 9,2.
97
Resolva:
1 - Calcule o desvio padro, dados os valores da varivel: 8, 10, 11, 15, 16, 18.
2 - Comprove a primeira propriedade do desvio padro somando 5 a cada
valor da varivel do exerccio 1.
3 Comprove a segunda propriedade do desvio padro multiplicando por 2
cada valor da varivel do exerccio 1.
3.4 Dados agrupados
Quando os dados esto agrupados (temos a presena de frequncias) a frmula
do clculo do desvio padro para uma populao ficar:
fi
2
6
12
7
3
x i . fi
0
6
24
21
12
2,1
2,1
2,1
2,1
2,1
Total
30
63
--
. fi
-2,1
-1,1
-0,1
0,9
1,9
4,41
1,21
0,01
0,81
3,61
Somatrio
8,82
7,26
0,12
5,67
10,83
32,70
98
Sabemos que fi = 30 e
. f i / n = 32,7 / 30 = 1,09.
% da populao includa
Grosseiramente
68,3
2/3 da populao
1,96
95,0
95,5
2,58
99,0
99,7
95 % da populao
100 % da populao
99
100
4 Coeficiente de Variao
O desvio padro por si s no nos diz muita coisa. Assim, um desvio padro
de duas unidades pode ser considerado pequeno para uma srie de valores cujo
valor mdio 200; no entanto, se a mdia for igual a 20, o mesmo no pode
ser dito. Alm disso, o fato de o desvio padro ser expresso na mesma unidade
dos dados limita o seu emprego quando desejamos comparar duas ou mais
sries de valores, relativamente sua disperso ou variabilidade, quando
expressas em unidades diferentes.
Para contornar essas dificuldades e limitaes, podemos caracterizar a
disperso ou variabilidade dos dados em termos relativos a seu valor mdio,
medida essa denominada coeficiente de variao (CV):
Exemplo:
Tomemos os resultados das medidas das estaturas e dos pesos de um mesmo
grupo de indivduos:
Varivel
Estatura
175 cm
5,0 cm
Peso
68 Kg
2,0 Kg
Temos:
CVE = (5/175) x 100 = 2,85%
CVP = (2/68) x 100 = 2,94%
Logo, nesse grupo de indivduos, os pesos apresentam maior grau de disperso
que as estaturas.
101
EXERCCIOS
1 Com relao s propriedades do desvio-padro, coloque V ou F nas
sentenas abaixo:
( ) O desvio padro pode assumir qualquer valor numrico.
( ) O desvio - padro representa o grau de variabilidade de um conjunto de
dados, ou seja, quanto maior o valor do desvio-padro mais compactos so
seus dados.
( ) Quando o valor do desvio-padro zero, todos os valores do conjunto de
dados so iguais, no h variao entre eles.
( ) Quando multiplicarmos uma constante a um conjunto de dados, podemos
afirmar que seu desvio-padro fica multiplicado por essa constante, assim
como sua mdia.
( ) Quando somamos uma constante K a um conjunto de dados, podemos
afirmar que seu desvio-padro e sua mdia permanecem inalterados.
( ) Para calcularmos o desvio-padro e a varincia para uma populao e para
uma amostra, devemos proceder da mesma maneira.
2 Considere o conjunto de A = {3, 5, 6, 8}, que tem mdia igual a 5,5 e
desvio-padro igual a 2,08. Sobre o conjunto B = {9, 15, 18, 24} podemos
afirmar que:
(
(
(
(
(
Que relao existe entre os desvios padres dos dois conjuntos de nmeros?
4 - Dados os conjuntos de nmeros:
A = {220, 230, 240, 250, 260}
Que relao existe entre os desvios padres dos dois conjuntos de nmeros?
102
fi
3
1
2
1
1
2
10
103
104
VIII - PROBABILIDADE
1 - Introduo
Neste captulo, presumiremos que a populao conhecida e calcularemos as
chances de obter vrias amostras desta populao. Assim, mostraremos que a
probabilidade o reverso da estatstica: na probabilidade usaremos a
informao da populao para inferir a natureza provvel da amostra.
Sendo assim, as situaes marcadas pela possibilidade de ocorrncia de mais
de um resultado possvel costumam ser analisadas em estatstica com o auxlio
das probabilidades. A probabilidade estuda o risco e o acaso em eventos
futuros, determinando se provvel ou no o seu acontecimento.
O clculo das probabilidades pertence ao campo da Matemtica, entretanto a
maioria dos fenmenos de que trata a Estatstica so de natureza aleatria ou
probabilstica. O conhecimento dos aspectos fundamentais do clculo da
probabilidade uma necessidade essencial para o estudo da Estatstica
Indutiva ou Inferencial.
Para estudar probabilidades, necessrio definir alguns conceitos e
terminologias usuais, como os relativos a experimento aleatrio, espao
amostral e eventos.
2 - Experimento Aleatrio
Suponha que uma moeda foi jogada uma vez e deu cara. O resultado que
vemos e registramos chamado de observao, ou medio, e o processo de
realizar uma observao chamado de experimento. Baseado neste exemplo,
enunciamos a definio de experimentos aleatrios:
So fenmenos que, mesmo repetidos vrias vezes sob condies
semelhantes, apresentam resultados imprevisveis. O resultado final depende
do acaso.
Como exemplos de experimentos aleatrios, podem ser citados:
E1: Joga-se um dado e observa-se o nmero mostrado na face de cima.
E2: Joga-se uma moeda trs vezes e observa-se o nmero de caras obtido.
E3: Em uma linha de produo, fabricam-se peas em srie e conta-se o
nmero de peas defeituosas produzidas em um perodo de 24 horas.
105
A = {ca} = 1
A = {2,4,6} = 3
A = {1,2,3,4,5,6} = 6
A={ }=0
P (A) = 0/6 = 0 = 0%
Soluo: O termo "3 para 2" significa: de cada 5 corridas ele ganha 3 e perde
2. Ento p = 3/5 ou 60% (ganhar) e q = 2/5 ou 40% (perder).
3 - Qual a probabilidade de tirar um nmero maior ou igual a dois no
lanamento de um dado?
Soluo: sabemos que neste evento s exclumos a possibilidade do resultado
do lanamento ser o n 1 e a probabilidade de tir-lo no lanamento de um
dado p = 1/6. Logo, a probabilidade do resultado obtido neste lanamento
ser maior ou igual a 2 q = 1 p, logo q = 1 - 1/6 = 5/6 ou 83,33%.
Aprendemos a distinguir eventos complementares, e que a probabilidade de
um evento acontecer somado probabilidade deste mesmo evento no
acontecer (complementar) sempre igual a 1 ou 100%. A seguir vamos definir
eventos independentes e calcular a probabilidade deles acontecerem.
7 - Eventos Independentes
Dizemos que dois eventos so independentes quando a realizao ou a norealizao de um dos eventos no afeta a probabilidade da realizao do outro
e vice-versa. Por exemplo, quando lanamos dois dados, o resultado obtido em
um deles independe do resultado obtido no outro.
Se dois eventos so independentes, a probabilidade de que eles se realizem
simultaneamente igual ao produto das probabilidades de realizao dos dois
eventos.
Assim, se p1 a probabilidade de realizao do primeiro evento e p2 a
probabilidade de realizao do segundo evento, a probabilidade de que tais
eventos se realizem simultaneamente dada por:
p = p1 x p2
Esta regra tambm conhecida como Teorema do produto, que se aplica nas
operaes multiplicativas de probabilidades. Operaes multiplicativas
geralmente envolvem a conjuno e, e so representadas pelo smbolo de
interseco .
Fique atento aos exemplos de eventos independentes abaixo:
109
111
112
115
X
2
1
1
0
2 Distribuio de Probabilidade
Consideremos a distribuio de frequncias relativa ao nmero de acidentes
dirios em um estacionamento:
N DE
ACIDENTES
0
1
2
3
TOTAL
FREQUENCIAS
22
5
2
1
30
116
PROBABILIDADES
0,73
0,17
0,07
0,03
1,00
Os valores x1, x2, x3, ....., xn e seus correspondentes p1, p2, p3, ....., pn definem
uma distribuio de probabilidade.
Assim, voltando a tabela inicial. Temos:
117
P(X)
1/4
2/4
1/4
X
1
2
3
4
5
6
P(X)
1/6
1/6
1/6
1/6
1/6
1/6
118
3 Distribuio Binomial
Eventos binomiais so marcados pela existncia de duas categorias,
mutuamente excludentes e coletivamente exaustivos. Mutuamente excludentes
significa que uma categoria implica a possibilidade da no-ocorrncia
simultnea da outra categoria. Por coletivamente exaustivas entende-se que a
unio de ambos os eventos resulta no espao amostral.
Exemplos de eventos binomiais podem ser fornecidos por meio de nmeros
pares e mpares no lanamento de um dado honesto, e por meio da extrao de
cartas vermelhas e pretas de um baralho.
Geralmente, em anlises estatsticas, os exemplos mais comuns de eventos
binomiais so aqueles que estabelecem situaes de sucesso e fracasso.
Situaes de sucesso correspondem quilo que se deseja estudar. Situaes de
fracasso correspondem ao complemento. Ou seja, quilo que no se deseja
estudar.
Vamos, neste item, considerar experimentos que satisfaam as seguintes
condies:
a. O experimento deve ser repetido, nas mesmas condies, um nmero
finito de vezes (n).
b. As provas repetidas devem ser independentes, isto , o resultado de uma
no deve afetar os resultados das sucessivas.
c. Em cada prova deve aparecer um dos dois possveis resultados: sucesso
e insucesso.
d. No decorrer do experimento, a probabilidade p do sucesso e a
probabilidade q (q = 1 p) do insucesso manter-se-o constantes.
Resolveremos problemas do tipo: determinar a probabilidade de se obterem k
sucessos em n tentativas.
O experimento obteno de caras em cinco lanamentos sucessivos e
independentes de uma moeda satisfaz essas condies. Sabemos que, quando
da realizao de um experimento qualquer em uma nica tentativa, se a
probabilidade de realizao de um evento (sucesso) p, a probabilidade de
no-realizao desse mesmo evento (insucesso) 1 p = q.
119
Na qual:
P (X = k) a probabilidade de que o evento se realize k vezes em n provas;
p a probabilidade de que o evento se realize em uma s prova sucesso;
q a probabilidade de que o evento no se realize no decurso dessa
insucesso;
120
122
123
124
125
4 Distribuio Normal
Entre as distribuies tericas de varivel aleatria contnua, uma das mais
empregadas a distribuio normal. Consiste em uma distribuio contnua
de probabilidades, onde a apresentao da distribuio de frequncias f(x) de
uma varivel qualitativa x costuma apresentar-se em forma de sino e simtrica
em relao mdia.
O estudo da distribuio normal recebeu contribuies de matemticos
importantes, como De Moivre, Laplace e Gauss. Alguns estudos revelam que
medies repetidas de uma mesma grandeza, como o dimetro de uma esfera
ou o peso de determinado objeto, nunca forneciam os mesmos valores. Porm,
a apresentao das frequncias dos inmeros nmeros coletados sempre
resultava em uma curiosa curva em forma de sino. Das observaes surgiu o
nome curva normal dos erros.
Muitas das variveis analisadas na pesquisa socioeconmica correspondem
distribuio normal ou dela se aproximam.
O aspecto grfico da distribuio normal o da figura abaixo:
126
) = P(X <
) = 0,5 ou 50%.
e varincia S2.
127
fcil notar que essa probabilidade, indicada por: P(2< X < 2,05) corresponde
rea hachurada na figura:
128
= 2. Temos ento:
Escrevemos, ento:
P(2 < X < 2,05) = P(0 < Z < 1,25) = 0,3944 ou 39,44%.
129
Exerccios Resolvidos
1 Com base na tabela Z determine as probabilidades:
a. P(-1,25 < Z < 0)
A probabilidade procurada corresponde parte hachurada da figura:
Temos que:
P(-0,5 < Z < 1,48) = P(-0,5 < Z < 0) + P(0 < Z < 1,48)
Como:
P(-0,5 < Z < 0) = P(0 < Z < 0,5) = 0,1915 e P(0 < Z < 1,48)= 0,4306
Obtemos:
P(-0,5 < Z < 1,48) = 0,1915 + 0,4306 = 0,6221ou 62,21%
130
Temos que:
P(0,8 < Z < 1,23) = P(0 < Z < 1,23) - P(0 < Z < 0,8)
Como:
P(0 < Z < 1,23)= 0,3907 e P(0 < Z < 0,8)= 0,2881
Obtemos:
P(0,8 < Z < 1,23) = 0,3907 - 0,2881 = 0,1026 ou 10,26%
d. P(Z > 0,6)
A probabilidade procurada corresponde parte hachurada da figura:
Temos que:
P(Z > 0,6) = P(Z > 0) - P(0 < Z < 0,6)
Como: P(Z > 0)= 0,5 e P(0 < Z < 0,6)= 0,2258
Obtemos:
P(Z > 0,6) = 0,5 - 0,2258 = 0,2742 ou 27,42%
131
Temos que:
P(Z < 0,92) = P(Z < 0) + P(0 < Z < 0,92)
Como:
P(Z < 0)= 0,5 e P(0 < Z < 0,92)= 0,3212,
Obtemos:
P(Z < 0,92) = 0,5 + 0,3212 = 0,8212 ou 82,12%.
2 Os salrios semanais dos operrios industriais so distribudos
normalmente, em torno da mdia de R$ 500,00, com desvio padro de R$
40,00. Calcule a probabilidade de um operrio escolhido ao acaso ter um
salrio semanal situado entre R$ 490,00 e R$ 520,00.
Devemos inicialmente, determinar os valores Z1 e Z2 da varivel de
distribuio normal reduzida.
Assim,
Z1 = 490 500 = - 0,25 e Z2 = 520 500 = 0,5
40
40
Como:
P(490 < X < 520) = P(- 0,25 < Z < 0,5) = P(- 0,25 < Z < 0) +
P( 0 < Z < 0,5)= 0,0987 + 0,1915 = 0,2902
, pois, de se esperar que, em mdia, 29,02% dos operrios tenham
salrios entre R$ 490,00 e R$ 520,00, ou seja, a probabilidade de um
operrio escolhido ao acaso ter salrio entre R$ 490,00 e R$ 520,00
de 29,02%.
132
EXERCCIOS
1 Sendo Z uma varivel com distribuio normal reduzida, baseado na
tabela Z calcule:
a.
b.
c.
d.
e.
f.
g.
h.
P (Z > 0,34)
P (Z < 1,85)
P (Z < - 1,24)
P (1,56 < Z < 2,37)
P (-0,37 < Z < 3,4)
P (Z > 1,08)
P (Z < - 0,66)
P (Z < -2,30 ou Z > 1,29)
P (100 X 106)
P (89 X 107)
P (112 X 116)
P (X 108)
P (X 90)
133
134
135
136
137
MEDIA
7,3
6,1
VARIANCIA
7,29
3,24
138
X CORRELAO E REGRESSO
1 - Introduo
Nos captulos anteriores, nossa preocupao era descrever a distribuio de
valores de uma varivel. Com esse objetivo, aprendemos a calcular medidas
de tendncia central e variabilidade.
Quando, porm, consideramos observaes de duas ou mais variveis, surge
um novo problema: as relaes que podem existir entre as variveis
estudadas. Nesse caso, as medidas estudadas no so suficientes.
Assim, quando consideramos variveis como peso e altura de um grupo de
pessoas, uso do cigarro e incidncia de cncer, vocabulrio e compreenso da
leitura, dominncia e submisso, procuramos verificar se existe alguma
relao entre as variveis de cada um dos pares e qual o grau dessa relao.
Para isso, necessrio o conhecimento de novas medidas.
Sendo a relao entre as variveis de natureza quantitativa, a correlao o
instrumento adequado para descobrir e medir essa relao.
Uma vez caracterizada a relao, procuramos descrev-la atravs de uma
funo matemtica. A regresso o instrumento adequado para a
determinao dos parmetros dessa funo.
2 Correlao
2.1 Relao funcional e relao estatstica
Como sabemos, o permetro e o lado de um quadrado esto relacionados. A
relao que os liga perfeitamente definida e pode ser expressa por meio de
uma sentena matemtica:
2p = 4l,
onde 2p o permetro e l o lado do quadrado.
Atribuindo-se, ento, um valor qualquer a l, possvel determinar exatamente
o valor de 2p.
Consideremos, agora, a relao que existe entre o peso e a estatura de um
grupo de pessoas. evidente que essa relao no do mesmo tipo da
anterior; ela bem menos precisa. Assim, pode acontecer que a estaturas
diferentes correspondam pesos iguais ou que a estaturas iguais correspondam
pesos diferentes. Porm, em media, quanto maior a estatura, maior o peso.
139
140
Como a correlao em estudo tem como imagem uma reta ascendente, ela
chamada correlao linear positiva.
Assim, uma correlao :
Linear positiva se os pontos do diagrama tm como imagem uma
reta ascendente;
Linear negativa se os pontos do diagrama tm como imagem uma
reta descendente;
No-linear se os pontos tm como imagem uma curva.
Se os pontos apresentam-se dispersos, no oferecendo uma imagem
definida, conclumos que no h relao alguma entre as variveis em estudo.
141
Temos, ento:
142
Assim:
Se a correlao entre duas variveis perfeita e positiva, ento r = +1;
Se a correlao perfeita e negativa, ento r = -1;
Se no h correlao entre as variveis, ento r = 0.
Logicamente:
Se r = +1, h uma correlao perfeita e positiva entre as variveis;
Se r = -1, h uma correlao perfeita e negativa entre as variveis;
Se r = 0, ou no h correlao entre as variveis, ou a relao que
porventura exista no linear.
NOTAS:
Para que uma relao possa ser descrita por meio do coeficiente de
correlao de Pearson imprescindvel que ela se aproxime de uma funo
linear. Uma maneira prtica de verificarmos a linearidade da relao a
inspeo do diagrama de disperso: se a elipse apresenta salincias ou
reentrncias muito acentuadas, provavelmente trata-se de correlao
curvilnea.
Para podermos tirar algumas concluses significativas sobre
comportamento simultneo das variveis analisadas, necessrio que:
143
Estatstica
(yi)
6,0
9,0
8,0
10,0
5,0
7,0
8,0
4,0
6,0
2,0
xiyi
x i2
y i2
30
72
56
100
30
49
72
12
48
4
25
64
49
100
36
49
81
9
64
4
36
81
64
100
25
49
64
16
36
4
= 65
= 65
= 473
= 481
= 475
Logo:
Da:
r = 0,91.
Resultado que indica uma correlao linear positiva altamente significativa
entre as duas variveis.
144
Resolva:
1. Complete o esquema de clculo do coeficiente de correlao para os valores
das variveis xi e yi:
145
3 Regresso
3.1 Ajustamento da reta
Sempre que desejamos estudar determinada varivel em funo de outra,
fazemos uma anlise de regresso.
Podemos dizer que a anlise de regresso tem por objetivo descrever, atravs
de um modelo matemtico, a relao entre as duas variveis, partindo de n
observaes das mesmas.
A varivel sobre a qual desejamos fazer uma estimativa recebe o nome de
varivel dependente e a outra recebe o nome de varivel independente.
Assim, supondo X a varivel independente e Y a dependente, vamos procurar
determinar o ajustamento de uma reta relao entre essas variveis, ou seja,
vamos obter uma funo definida por:
Y = aX + b
onde a e b so os parmetros.
Sejam duas variveis X e Y, entre as quais exista uma correlao acentuada,
embora no perfeita, como, por exemplo, as que formam a tabela 2.
Da, temos:
Tabela 3 Valores das variveis xi e yi.
xi
5
8
7
10
6
yi
6
9
8
10
5
cujo diagrama de disperso dado por:
7
7
9
8
3
4
8
6
2
2
146
onde,
NOTA:
Como estamos fazendo uso de uma amostra para obtermos os valores dos
parmetros, o resultado, na realidade, uma estimativa da verdadeira equao de
regresso. Sendo assim, escrevemos:
147
(yi)
xiyi
x i2
5,0
8,0
7,0
10,0
6,0
7,0
9,0
3,0
8,0
2,0
6,0
9,0
8,0
10,0
5,0
7,0
8,0
4,0
6,0
2,0
30
72
56
100
30
49
72
12
48
4
25
64
49
100
36
49
81
9
64
4
= 65
= 65
= 473 = 481
Temos, assim:
a = 10x473 65x65 = 4730 4225 = 505 = 0,8632
10x481 (65)2
4810 4225 585
148
Assim, temos:
Como a nota 4,0 pertence ao intervalo [2,10], dizemos que foi feita uma
interpolao; e como a nota 1,0 no pertence ao intervalo [2,10], dizemos que
foi uma extrapolao.
NOTA:
Resolva:
1. Complete o esquema para o ajustamento de uma reta aos dados:
xi
yi
2
30
4
25
6
22
8
18
10
15
12
11
14
10
150
EXERCCIOS
1 Um grupo de pessoas fez uma avaliao do peso aparente de alguns
objetos. Com o peso real e a media dos pesos aparentes, dados pelo grupo,
obteve-se a tabela:
PESO REAL
18
30
42
62
73
97
120
PESO APARENTE
10
23
33
60
91
98
159
11
14
19
19
22
28
30
31
34
37
yi
13
14
18
15
22
17
24
22
24
25
36
36
38
41
42
43
44
46
Calcule:
a) O coeficiente de correlao;
Sugesto: para simplificar os clculos, use para o tempo uma varivel
auxiliar, por exemplo:
xi = xi - 1984
b) A reta ajustada;
c) A produo estimada para o ano de 1989.
151
10
15
20
25
30
Determine:
a) O coeficiente de correlao;
b) A reta ajustada a essa correlao;
c) O valor estimado do comprimento da barra para a temperatura de 18C;
d) O valor estimado do comprimento da barra para a temperatura de 35C;
5 A variao do valor da Unidade de Preos ao Consumidor - UPC,
relativamente a alguns meses de 2009, deu origem tabela:
MESES
mai
VALORES (R$)
jun
jul
ago
Set
out
nov
Calcule:
a) O grau de correlao de correlao;
b) Estabelea a equao de regresso de Y sobre X;
c) Estime o valor da UPC para o ms de dezembro.
Sugesto: substitua os meses, respectivamente, por 1, 2, 3, ....., 7.
6 A partir da tabela:
xi
yi
70
50
40
30
20
10
152
38
42
50
56
59
63
70
80
95
110
350 325
297
270
256
246
238
223
215
208
153
REFERENCIAS
Bruni, Adriano Leal. Estatstica aplicada gesto empresarial. 1.ed. So
Paulo: Editora Atlas, 2007.
Crespo, Antonio Arnot. Estatstica fcil. 17.ed. So Paulo: Saraiva, 2002.
Hoffmann, Ronaldo; Ovalle, Vieira Sonia. Elementos de estatstica. 4.ed.
So Paulo: Editora Atlas, 2003.
Morettin, Pedro A. Estatstica bsica. 5.ed. So Paulo: Saraiva, 2002.
Pinheiro, Joo Ismael D. Estatstica bsica: a arte de trabalhar com dados.
Rio de Janeiro: Elsevier, 2009.
Silva, Ermes Medeiro da; Silva, Elio Medeiro da; Gonalves; Valter; Murolo,
Afrnio Carlos. Estatstica: Para os cursos de economia, Administrao e
Cincias Contbeis - 1. 3.ed. So Paulo: Editora Atlas, 1999.
Toledo, Geraldo Luciano; Ovalle, Ivo Izidoro. Estatstica bsica. 2.ed. So
Paulo: Editora Atlas, 1985.
154
ANEXOS:
155
L1
L2
L3
L4
L5
L6
L7
L8
L9
L10
L11
L12
L13
L14
L15
L16
L17
L18
L19
L20
L21
L22
L23
L24
L25
L26
L27
L28
L29
C1
4
3
2
1
0
0
8
8
5
6
4
3
2
0
9
7
8
6
5
3
8
1
2
4
5
2
1
0
9
C2
1
0
2
9
3
8
3
8
4
7
4
5
6
1
0
2
9
3
8
4
7
4
7
3
0
5
1
2
1
C3
6
7
5
8
4
9
3
0
1
2
0
1
9
2
8
2
3
0
1
0
2
9
3
8
3
7
4
7
5
C4
1
2
3
4
5
6
7
8
9
0
5
4
3
2
1
0
9
8
7
6
1
1
2
2
3
3
4
4
5
C5
6
6
7
7
8
8
9
9
0
0
1
3
5
7
9
2
4
6
8
0
1
3
5
7
9
0
2
3
6
C6
1
3
5
7
9
1
0
2
0
3
9
3
8
4
8
5
7
6
7
1
3
2
4
3
5
4
6
6
8
C7
0
9
0
8
0
7
6
3
2
1
1
0
2
0
3
0
4
0
5
9
5
8
6
7
7
2
3
4
5
C8
2
5
1
6
2
2
3
6
0
1
9
3
3
7
8
5
1
1
9
8
2
6
5
8
0
2
2
3
6
C9 C10 C11 C12 C13 C14 C15 C16 C17 C18 C19 C20 C21 C22 C23 C24 C25 C26 C27 C28 C29
3 5
7
6
2
0
9
9
8
1
0
3
4
7
2
1
0
8
7
8
4
5 3
4
8
8
0
9
3
0
1
7
0
4
0
8
3
1
2
0
1
2
9 8
7
6
3
0
0
1
2
1
4
3
2
4
5
6
7
7
4
3
0
5 2
7
8
1
0
0
7
5
3
2
2
5
8
1
9
0
3
2
3
4
0 3
1
0
1
1
2
4
3
1
9
5
6
8
5
0
2
3
4
9
0
2 2
2
8
6
1
9
4
5
2
0
0
1
3
1
0
9
2
3
4
1
7 6
4
0
7
1
2
1
0
1
2
8
9
7
5
3
2
1
1
8
2
3 7
3
7
8
9
4
3
9
2
3
2
3
0
0
4
4
2
3
1
3
3 7
5
0
9
7
6
5
7
8
0
8
4
5
2
3
0
7
4
3
6
1 2
6
0
2
0
8
0
9
7
7
7
3
6
7
2
9
0
3
1
0
4 1
8
4
2
1
3
3
2
7
6
4
4
3
8
9
0
7
2
2
9
2 3
7
0
3
4
5
8
9
3
5
2
4
0
1
7
9
1
8
1
3
6 5
0
2
6
3
6
7
0
1
7
9
6
8
3
5
3
3
5
7
2
0 7
9
0
0
6
5
2
7
8
1
0
0
7
5
3
0
9
1
1
3
3 9
4
0
1
9
5
2
2
0
0
2
1
2
4
7
6
3
2
1
5
3 2
1
3
5
8
9
1
2
3
9
6
5
2
7
8
1
0
0
7
0
1 4
2
4
6
7
0
2
3
7
8
5
3
1
2
5
6
9
0
7
9
4 6
2
2
3
3
0
1
5
4
5
1
1
3
4
7
8
1
2
8
8
4 8
0
0
2
3
6
9
6
4
3
6
7
2
1
9
7
0
1
8
5
4 0
2
9
2
3
2
5
3
5
7
2
7
8
2
5
6
2
2
9
4
4 1
7
5
7
3
0
0
9
1
2
0
3
4
9
3
0
4
4
9
1
1 2
0
2
0
1
3
5
4
6
4
3
2
0
0
3
9
6
6
0
2
8 4
0
8
0
1
9
6
9
5
0
8
0
2
4
9
8
8
8
0
3
0 3
0
9
2
2
6
7
6
4
9
8
9
4
7
7
7
0
0
2
4
4 5
8
7
4
2
2
3
8
2
1
2
2
0
7
0
6
1
1
2
5
6 6
1
1
0
3
9
9
1
0
3
4
3
9
6
3
5
3
3
4
8
0 8
9
2
3
3
7
7
4
0
5
6
8
8
5
2
4
5
5
4
0
1 7
1
0
2
0
9
6
4
3
7
9
0
7
6
1
3
7
5
5
8
9 8
2
0
2
3
0
1
4
3
3
7
7
5
6
7
4
3
4
0
1
156
157