Académique Documents
Professionnel Documents
Culture Documents
Professores:
Adriana Speggiorin
adrianaspegg@hotmail.com
Andr Mauro dos Santos de Espndola
PREZADO(A) ALUNO(A)
Professora Adriana
Professor Andr
Probabilidade e Estatstica
CAPTULO 1- INTRODUO
INTRODUO
A palavra estatstica provm do latim status, que significa estado. A primeira utilizao da
estatstica envolvia compilaes de dados e grficos que descreviam vrios aspectos de um estado ou
pas. Tem-se notcia de que cerca de 2.000 a.C. os chineses recenseavam sua populaes agrcolas.
Em 1662, John Graunt publicou informes estatsticos sobre nascimentos e mortes. O trabalho de
Graunt foi secundado por estudos de mortalidade e taxas de morbidade, tamanho de populaes,
rendas e taxas de desemprego. As famlias, os governos e as empresas se apiam largamente em
dados estatsticos. Assim que as taxas de desemprego, de inflao, os ndices do consumidor, as
taxas de natalidade e mortalidade so calculadas cuidadosamente a intervalos regulares, e seus
resultados so utilizados por empresrios para tomarem decises que afetam a futura contratao de
empregados, nveis de produo e expanso para novos mercados.
A coleta, o processamento, a interpretao e a apresentao de dados numricos pertencem
todos ao domnio da estatstica.
O CRESCIMENTO DA ESTATSTICA MODERNA
So vrias as razes para o desenvolvimento acentuado do objetivo da estatstica e da
necessidade de estud-la, nesses ltimos cinquenta anos. Uma delas a abordagem crescentemente
quantitativa utilizada em todas as cincias, na engenharia e em muitas outras atividades que afetam
diretamente nossas vidas. Isto inclui o uso de tcnicas matemticas na avaliao de controles de
poluio, no planejamento de inventrios, na anlise de problemas de trfego, no estudo dos efeitos
de vrios remdios, na avaliao de tcnicas de ensino, na anlise do comportamento competitivo de
administradores e governos, no estudo de dietas e longevidade, e assim por diante. Nossa capacidade
de lidar com informaes numricas aumentou enormemente com o advento de poderosos
computadores. Muitos tipos de computadores so tambm econmicos, possibilitando a execuo por
pequenas empresas, estudantes de universidade e at mesmo de cursos secundrios, de trabalhos
sofisticados.
A outra razo que a quantidade de dados coletados, processados e apresentados ao pblico,
por uma razo ou outra, aumentou alm de qualquer limite imaginvel; julgar que parte constitui boa
estatstica e que parte m estatstica fica a critrio do leitor. Para exercer vigilncia, torna-se
necessrio um nmero cada vez maior de pessoas que participem da coleta dos dados, da sua anlise
e, o que igualmente importante, de todo o planejamento preliminar. Sem este ltimo, difcil
imaginarmos os erros que podero ocorrer na compilao dos dados estatsticos. Os resultados de
custosas pesquisas podem tornar-se inteis, se as questes so ambguas ou formuladas
incorretamente, se so endereadas a pessoas erradas, no lugar errado e em momento inadequado.
A ESTATSTICA uma Cincia que fornece mtodos para a coleta, organizao, descrio,
anlise e interpretao de dados e para a utilizao dos mesmos na tomada de decises.
Probabilidade e Estatstica
VARIVEIS
A cada fenmeno corresponde um nmero de resultados possveis. Assim, por exemplo:
- para o fenmeno 'sexo' so 2 os resultados possveis;
- o nmero de crianas em uma famlia pode ser expresso por nmeros naturais:
0, 1, 2 , ...,n;
- para o fenmeno 'estatura' temos uma situao diferente, pois os resultados podem tomar
um nmero infinito de valores numricos dentro de um intervalo (depende da preciso da
medida).
Logo
Varivel um smbolo, como x, y, z, t, que pode assumir qualquer valor de um conjunto de
resultados possveis de um fenmeno.
ou
A Varivel qualitativa
Quando uma caracterstica ou varivel no numrica. Aquelas que apresentam como possveis
realizaes uma qualidade (ou atributo) do indivduo pesquisado. As variveis qualitativas podem ser
classificadas como:
a) nominal, para a qual no existe nenhuma ordenao possvel; e
b) ordinal, para a qual existe uma ordem nos seus resultados.
Exemplos de variveis qualitativas:
- cor de um objeto;
- religio;
- naturalidade;
- cor dos olhos;
- faixa etria ( infncia, adolescncia, adulto, velho);
- classe social (baixa, mdia, alta).
Quando os dados so qualitativos, o interesse encontra-se, normalmente, na quantidade ou na
proporo de cada categoria em relao a um todo.
Exemplo: 23% das pessoas preferem carro de cor branca.
B Varivel quantitativa
Quando a varivel tem valor numrico mensurada com unidade.
Exemplos de variveis quantitativas:
- quantidade de alunos por sala de aula.
- nmero de aes de uma determinada empresa;
- tempo de durao de uma bateria de telefone celular.
As variveis quantitativas podem ser
a) discretas: so as que podem assumir apenas determinados valores.
Exemplos: - nmero de juntas defeituosas.
- nmero de passageiros em nibus de Caxias do Sul a Porto Alegre.
Probabilidade e Estatstica
b) contnuas: so as que podem assumir qualquer valor dentro de uma determinada faixa de
valores, e representam uma medida (em qualquer grau de preciso). Na prtica, entretanto,
os mecanismos de medio tm preciso limitada, tal que os dados coletados de variveis
contnuas so necessariamente discretos.
Exemplos: - volume de ar contido num ambiente fechado;
- tempo de voo entre duas cidades;
- peso (massa).
POPULAO E AMOSTRA
Estatstica no interessa concluir a respeito de indivduos isoladamente observados, mas sim
de grupos ou conjuntos, porque seu objetivo o estudo da chamada populao.
Populao consiste na totalidade de unidades de observao a partir das quais se deseja
tomar uma deciso. Tambm chamada de universo.
Se a populao pequena, razovel observar toda ela. Todavia, examinar a populao
inteira nem sempre vivel. Por esse motivo, o estudo estatstico inicia-se com a coleta de parte de
uma populao, denominada amostra, constituda de um nmero finito de unidades de observao e
que devem ter as mesmas caractersticas da populao.
CENSO uma coleo de dados relativos a todos os elementos de uma populao.
No ambiente das cincias exatas, os dados quase sempre so uma amostra que foi
selecionada a partir de alguma populao. Geralmente esses dados so coletados de uma das duas
formas a seguir:
- estudo observacional os dados so obtidos medida que se tornam disponveis.
Exemplo: Medir e registrar o desempenho de um processo de fabricao de peas automotivas.
- experimento planejado observa e registra dados onde so feitas variaes propositais nas
variveis controlveis de algum processo
Exemplo: Medir e registrar concentrao de certo componente qumico a partir de avriaes na
temperatura de uma reao qumica.
ARREDONDAMENTO DE DADOS
Muitas vezes necessrio ou conveniente suprimir unidades inferiores s de determinada
ordem. Essa tcnica chamada arredondamento de dados.
1) Quando o primeiro algarismo a ser abandonado 0, 1, 2, 3 ou 4, fica inalterado o ltimo algarismo
a permanecer.
Exemplos: a) 92,24 passa a 92,2
b) 5,6254 passa a 5,625 (para a preciso de milsimos)
c) 5,6254 passa a 5,6 (para a preciso de dcimos)
Probabilidade e Estatstica
Observaes
1) No devemos fazer arredondamentos sucessivos.
Exemplo: 17,3452 passa a 17,3 e no a 17,35 e por fim a 17,4
Se tivermos necessidade de um novo arredondamento, fica recomendada a volta aos dados originais.
2) Cuidado com o arredondamento em situaes como:
Dado o valor 2,46 milhes de reais, se arredondarmos para 2,5 milhes de reais estamos alterando a
quantidade em R$ 40.000,00.
EXERCCIOS
Classificar cada medida abaixo em varivel quantitativa (contnua ou discreta) ou
varivel qualitativa (ordinal ou nominal):
a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
p)
q)
r)
s)
t)
Probabilidade e Estatstica
Observe que, qualquer que seja a amostra, sempre corremos o risco de chegar a concluses
erradas, mas esse risco diminui a medida que aumenta a quantidade de elementos a serem
examinados.
Os estudos que utilizam mtodos estatsticos vo desde os que so bem concebidos e
executados, dando resultados confiveis, aos que so concebidos deficientemente e mal executados,
levando a concluses enganosas e sem qualquer valor real. Eis alguns pontos importantes para o
planejamento de um estudo eficaz de produzir resultados vlidos:
1- Identificar com preciso a questo a ser respondida e definir com clareza a populao de
interesse.
2- (Tentar) Identificar os fatores importantes que afetam o problema em questo.
3- Propor um modelo para o problema
4- Estabelecer um plano adequado para coleta de dados. Esse plano deve descrever detalhadamente
a realizao de um estudo observacional ou de um experimento, e deve ser elaborado
cuidadosamente, de modo que os dados coletados representem efetivamente a populao em
questo.
5- Coletar os dados. Devemos ser extremamente cautelosos, para minimizar os erros que podem
resultar de uma coleta tendenciosa de dados.
6- Analisar os dados e tirar concluses. Identificar tambm possveis fontes de erros. As diferenas
entre as amostras so chamadas de erro amostral, embora nenhum erro tenha ocorrido.
AMOSTRAGEM ALEATRIA
Para que nossas inferncias sejam vlidas, a amostra tem de ser representativa da populao.
Amostras com observaes que sejam convenientes ou exeram julgamento na seleo podem
introduzir alguma tendncia. Para evitar essas dificuldades desejvel selecionar uma amostra
aleatria como o resultado de algum mecanismo de chance.
1) AMOSTRAGEM ALEATRIA SIMPLES
Em uma amostra aleatria, os elementos da populao so escolhidos de tal forma que cada
um deles tenha igual chance de figurar na amostra. (Escolhe-se uma amostra aleatria simples de n
elementos, de maneira que toda amostra de tamanho n possvel tenha a mesma chance de ser
escolhida).
As amostras aleatrias podem ser escolhidas por diversos mtodos, inclusive a utilizao de
programas computacionais para gerar nmeros aleatrios.
Este tipo de amostragem equivalente a um sorteio lotrico.
Na prtica, a amostragem aleatria simples pode ser realizada numerando-se a populao de 1
a N e sorteando-se, a seguir por meio de um dispositivo aleatrio qualquer, n nmeros dessa
sequncia, os quais correspondero aos elementos pertencentes amostra.
2) AMOSTRAGEM SISTEMTICA
Quando os elementos da populao j se acham ordenados, no h necessidade de construir
um sistema de referncia. So exemplos os pronturios mdicos de um hospital, dos prdios de uma
rua, as linhas de produo e etc. Nestes casos, a seleo dos elementos que constituiro a amostra
pode ser feita por um sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos
sistemtica.
Assim, no caso de uma linha de produo, podemos, a cada dez itens produzidos, retirar um
para pertencer a uma amostra da produo diria. Neste caso estaramos fixando o tamanho da
amostra em 10% da populao.
Exemplo 2.1: No caso de uma linha de produo, podemos, a cada dez itens produzidos, retirar um
para pertencer a uma amostra da produo diria. Neste caso estaramos fixando o tamanho da
amostra em 10% da populao. Esse mtodo simples e utilizado com frequncia.
Adriana Speggiorin e Andr Espindola
Probabilidade e Estatstica
Exemplo 2.2: Deseja-se retirar uma amostra de n = 12 unidades de observao de uma populao de
tamanho N = 874. O intervalo de seleo , ento, 874/10 = 72,8(aproxima-se para menos, seno se
ultrapassar a ordem da ltima unidade). Desse modo, vo-se contando as unidades de observao e
escolhem-se aquelas que estiverem, por exemplo, nas seguintes posies: 72, 144, 216, 288, 360,
432, 504, 576, 648, 720, 792 e 864.
3) AMOSTRAGEM ESTRATIFICADA PROPORCIONAL
A amostragem estratificada proporcional recomendada quando existe uma diviso natural da
populao em grupos com nmeros de elementos diversos.
Com a amostragem estratificada, subdividimos a populao em, no mnimo, duas
subpopulaes (ou estratos) que compartilham das mesmas caractersticas (como sexo) e, em
seguida, extramos uma amostra de cada estrato.
Exemplo 2.3: Uma empresa cadastra seus funcionrios atravs do grau de instruo. A tabela a
seguir apresenta essa situao.
Se desejarmos uma amostra com 84 pessoas, elas ficariam distribudas conforme a
ltima coluna da tabela:
Grau de instruo
Ensino fundamental completo
Ensino mdio incompleto
Ensino mdio completo
Ensino superior incompleto
Ensino superior completo
Ps graduao
Total
Populao
Nmero de pessoas*
187
125
69
58
42
13
Amostra
Nmero de pessoas
OBESRVAO
AMOSTRAGEM POR JULGAMENTO (no aleatria)
Os elementos escolhidos so aqueles julgados como tpicos da populao que se deseja
estudar. Por exemplo, num estudo sobre a produo cientfica dos departamentos de ensino de uma
universidade, um estudioso sobre o assunto pode escolher os departamentos que ele considera serem
aqueles que melhor representam a universidade em estudo.
EXERCCIOS
1) As afirmaes a seguir contm erro(s). Identifique-o(s).
Probabilidade e Estatstica
POPULAO
400
300
350
450
520
4) Em uma cidade com 30.000 habitantes deseja fazer-se uma pesquisa sobre a preferncia por tipo
de lazer entre pessoas de 20 anos de idade, levando em conta o sexo a que pertencem.
a) Qual a populao envolvida na pesquisa?
b) Supondo que na cidade haja 5500 mulheres e 6000 homens, com 20 anos, determine uma
amostra com 1200 pessoas.
5) Uma populao encontra-se dividida em trs estratos, com tamanhos, respectivamente 40, 100 e
60 indivduos. Sabendo que, ao ser realizada uma amostragem estratificada proporcional, nove
elementos foram retirados do 3 estrato, determine o nmero total de elementos da amostra.
6) Em uma empresa existem 250 funcionrios, sendo 35 na linha de produo A, 32 na linha de
produo B , 30 na linha de produo C, 28 na linha de produo D , 35 na linha de produo E, 32 na
linha de produo F, 31 na rea administrativa e 27 na engenharia. Obtenha uma amostra de 40
funcionrios.
7) Uma empresa apresenta o seguinte quadro de funcionrios:
Setor
Produo
Engenharia
Administrao
Qualidade
Total
Nmero de funcionrios
Masculino
Feminino
80
60
11
4
13
17
4
5
108
86
Probabilidade e Estatstica
8) Uma empresa que embala biscoitos realiza o controle de qualidade selecionando aleatoriamente 10
caixas da produo total diria e pesando os pacotes. Depois, eles abrem um pacote de cada caixa e
inspecionam o contedo.
A partir dessas informaes, identifique se possvel:
a) a populao
b) as variveis da populao em questo
c) a(s) amostra(s)
d) o mtodo amostral e dizer se foi aleatrio ou no
e) qualquer fonte potencial de tendenciosidade que voc pode detectar
Respostas
3)
ESCOLA
A
B
C
D
E
TOTAL
AMOSTRA
60
45
52
67
78
302
Amostra (n de funcionrios)
6
6
5
5
6
6
5
5
44
7)
Setor
Produo
Engenharia
Administrao
Qualidade
Total
Probabilidade e Estatstica
10
No ms
ltimos 12 meses
0,78
0,52
0,57
0,43
0,0
0,01
0,04
0,45
0,75
0,83
0,63
0,83
4,38
5,17
5,26
5,22
4,84
4,60
4,49
4,70
5,20
5,63
5,91
5,95
Fonte: IBGE
Probabilidade e Estatstica
11
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
25
20
15
10
5
0
10 11 12 13 14 15 16 17 18 19 20 21
tempo (min)
Probabilidade e Estatstica
12
Exemplo 3.3:
Tabela: Taxa de desemprego na grande So Paulo
Ano
Homens (%)
Mulheres (%)
1996
13,5
17,1
1997
14,1
18,3
1998
16,0
21,0
1999
17,5
21,8
2000
15,1
20,8
2001
15,0
20,7
Fonte: EXAME (MEU DINHEIRO), Abril 2002.
25
20
15
%
HOMENS
10
MULHERES
5
0
1996
1997
1998
1999
2000
2001
Ano
concentrao (g)
30
25
20
15
10
5
0
0
10 11 12 13 14 15 16 17 18 19 20 21
tempo(min)
Componente B
Componente A
Probabilidade e Estatstica
13
Frequncia*
68
65
36
31
28
23
13
1
TV
Amigos
Internet
Jornal
Rdio
Parentes
Encartes de jornal
Outros
*Mltiplas respostas
%
44,3
42,9
23,6
20,7
18,7
14,9
8,7
0,9
30%
25,7%
25%
24,5%
20%
13,6%
15%
11,7%
10,6%
10%
8,7%
4,9%
5%
0,4%
0%
TV
Amigos
Internet
Jornal
Rdio
Parentes
Encartes
de jornal
Outros
Figura: Como voc fica sabendo das promoes da loja XX? (Mltiplas respostas)
Fonte: A autora
Probabilidade e Estatstica
14
Exemplo 3.6: Foi perguntado a um grupo de alunos de Ensino Mdio Como seu curso de graduao
seria financiado se voc continuasse estudando?. O grfico a seguir apresenta o resultado ao
questionamento.
Atravs de financiamento estudantil
3,2%
6,9%
8,9%
24,8%
25,4%
30,8%
0%
10%
20%
30%
40%
Probabilidade e Estatstica
15
Capacitao de
mo de obra
75%
Fonte: A autora
O total representado pelo crculo, que fica dividido em tantos setores quantas so as partes.
As reas dos setores so proporcionais aos dados da srie.
DIAGRAMA DE DISPERSO
O grfico de disperso apresenta duas variveis numricas. Ento temos pontos (pares
ordenados) representando a relao entre essas variveis.
Exemplo 3.9: Supe-se que o contedo de hidrognio seja um fator importante na porosidade de
fundies de liga de alumnio. A tabela a seguir apresenta os dados sobre contedo de hidrognio e
porosidade numa determinada srie de testes e o respectivo grfico.
Contedo de
hidrognio
Porosidade
0,18
0,2
0,21 0,21 0,21 0,22 0,23 0,23 0,24 0,24 0,25 0,28
0,3
0,46
0,7
0,72 0,75
0,8
0,88
0,7
0,37
Probabilidade e Estatstica
16
1,00
Porosidade
0,80
0,60
0,40
0,20
0,00
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
0,40
Contedo de hidrognio
R$ 1100
980
900
Homens
Mulheres
Probabilidade e Estatstica
17
1400
1230
1200
980
1000
800
R$
600
400
200
0
Homens
Mulheres
timo
28%
Ruim
18%
Regular
14%
Bom
32%
Probabilidade e Estatstica
18
50
40
32%
28%
30
%
18%
20
10
14%
8%
0
Pssimo
Ruim
Regular
Bom
timo
Percebe-se o erro na ltima coluna e tambm uma escala que pode ser enganadora, pois
pode-se ter a impresso que a inflao do ano de 2010 quase o triplo da inflao de 2009.
Fonte: http://www.viomundo.com.br/humor/grafico-da-globo-inflaciona-a-inflacao.html
O grfico correto :
Probabilidade e Estatstica
19
6,50%
5,92%
5,84%
5,91%
2012
2013
4,31%
2009
2010
2011
CARTOGRAMA
a representao sobre uma carta geogrfica.
Esse grfico empregado quando o objetivo o de figurar os dados estatsticos diretamente
relacionados com reas geogrficas ou polticas.
PICTOGRAMA
O pictograma constitui um dos processos grficos que melhor fala ao pblico, pela sua forma
ao mesmo tempo atraente e sugestiva. A representao grfica consta de figuras.
Exemplo 3.13: Pictograma
Probabilidade e Estatstica
20
CAPTULO 4
ANLISE DE CONJUNTOS DE DADOS NO AGRUPADOS
INTRODUO
A anlise de dados frequentemente segue linhas diferentes, conforme se trate de um grande ou
de um pequeno conjunto de dados. Quando h uma pequena quantidade de dados, utilizam-se os
mtodos que seguem neste captulo. Para maior quantidade de dados, so mais prticos mtodos que
exigem primeiro o agrupamento dos dados. Essas tcnicas sero consideradas posteriormente.
Frequentemente, um conjunto de nmeros pode reduzir-se a uma ou a algumas medidas
numricas que resumem todo o conjunto. Tais medidas so de mais fcil manejo e compreenso do
que os dados originais.
O objetivo aqui apresentar os mtodos mais teis para resumir dados. Embora no exista um
padro que se possa considerar o melhor, h tcnicas que se prestam melhor que outras a
determinadas situaes.
MEDIDAS DE TENDNCIA CENTRAL
H situaes em que no estamos interessados nos padres de um grupo, mas em
caracteriz-lo como um todo. Podemos ter questes como: Qual o salrio mdio do trabalhador
brasileiro? Qual o tipo sanguneo mais comum? Qual a nota que divide os alunos de uma turma em um
grupo superior e o outro inferior? Para responder a essas questes necessitamos de um grupo nico,
que represente todos os valores obtidos pelo grupo. Este nmero possibilita a caracterizao do grupo
como um conjunto e tende a se condensar no centro da srie; desse fato deriva o termo "medida de
tendncia central". A utilizao de medidas de posio no substitui o uso de tabelas e de grficos.
Veremos, ento, trs medidas de tendncia central: a mdia, a mediana e a moda. Elas
constituem maneiras diversas de determinar um nico nmero representativo de uma srie, e,
conforme veremos, raramente coincidem.
1) MDIAS
A mdia de um conjunto de nmeros um valor que, levando em conta a totalidade dos
elementos do conjunto, pode substituir a todos sem alterar determinada caracterstica desse conjunto.
Por exemplo, se a caracterstica do conjunto a soma dos seus elementos, tem-se a mais
simples de todas as mdias: a mdia aritmtica.
Existem vrios tipos de mdias, sendo a mais utilizada a aritmtica; portanto, sempre que
mencionarmos simplesmente mdia, estaremos nos referindo aritmtica.
MDIA ARITMTICA ( ou x )
A mdia (aritmtica) , de modo geral, a mais importante de todas as mensuraes numricas
descritivas. Consiste em adicionar os elementos e dividir a soma pelo nmero de elementos
adicionados. A mdia representada, por conveno, por x ( l-se x barra) quando estamos lidando
com uma amostra ou quando o conjunto de dados for uma populao .
Em notao de somatrio, a mdia aritmtica representada da seguinte forma:
Probabilidade e Estatstica
21
x
ou mais simples como:
x
i 1
ou
ou
i 1
xi
onde:
xi
n
N
Exemplo 4.1: Sabendo-se que o nmero de peas produzidas por sete mquinas diferentes, num
certo dia, foi 10, 17, 13, 15, 16, 18 e 12, temos, para produo mdia desse dia:
10 17 13 15 16 18 12 101
14,4
7
7
Logo:
x = 14,4 peas
A mdia aritmtica de uma amostra pode no pertencer ao conjunto original de valores, nem
precisa ter significado real.
83
11 3
5
5
Probabilidade e Estatstica
22
x .w
w
Exemplo 4.5: Uma pesquisa amostral efetuada junto a estudantes de uma faculdade acusa os
seguintes dados sobre o conceito obtido na disciplina de Estatstica.
Conceito
0
1
2
3
4
Total
Nmero de estudantes
4
28
41
29
12
MDIA GEOMTRICA
A mdia geomtrica de uma amostra um nmero que, levando em conta o total dos
elementos dessa amostra, pode representar a todos, sem alterar o produto desses elementos. Assim
sendo, a mdia geomtrica de uma amostra de tamanho n igual raiz de ordem n do produto dos n
valores.
Desse modo, a mdia geomtrica calcula por:
ou
x G n xi
Probabilidade e Estatstica
23
Se, por exemplo, uma populao de 2 milhes de habitantes em 1960 aumentou para 8
milhes em 1980, quadruplicou em 20 anos; qual teria sido a cifra da populao em 1970? No teria
sido cinco milhes, que a mdia aritmtica de 2 e 8 milhes, pois o aumento mais rpido nos anos
posteriores do que nos anteriores. A cifra real determinada calculando-se a mdia geomtrica, sendo
multiplicados todos os valores da srie e em seguida extrada a raiz de ordem n desses valores, de
acordo com seguinte :
Para o nosso exemplo teramos
xG 2 2x8 4
x G i x1 1 x2 2 ... xn
p
pn
MDIA HARMNICA
J vimos que a mdia aritmtica no adequada para todas as sries de dados. No pode ser
empregada, por exemplo, para mdias de crescimento (usamos a mdia geomtrica) ou propores de
velocidade. Digamos que um motorista dirija seu carro de uma cidade A para uma cidade B a uma
velocidade mdia de 60 quilmetros por hora. Na volta, ou seja, a viagem da cidade B para a cidade A
ele perfaz com uma velocidade mdia de 30 quilmetros por hora. Qual a velocidade mdia global? A
resposta no 45 quilmetros por hora.
Vamos supor que a distncia de A at B seja de 60 km (embora possa ser considerada qualquer
distncia). Ento:
60 km
2 horas
30 km / h
o tempo de A para B
se o tempo total foi 3 horas e a distncia total, 120 km, temos que a velocidade mdia global 40
km/h
60 km
1 hora
60 km / h
xH
2
1
1
30 60
40
Probabilidade e Estatstica
24
A frmula a seguinte:
xH
n
1
Exemplo 4.6: Um investidor compra R$ 18.000 em aes de uma companhia a R$ 45,00 a ao. Num
segundo momento, compra R$ 18.000 a R$ 36,00 a ao e, por fim, numa terceira aplicao, compra
R$ 18.000 a R$ 30,00 a ao. Assim, descubra o preo mdio por ao pago pelo investidor.
xH
P
i
p1 p2
p
... n
x1 x2
xn
ou x H
p
p
x
i
i
2) MEDIANA (Md)
Analisemos a situao a seguir:
As idades de seis alunos que participaram de uma excurso com finalidade geolgica so 18,
19, 20, 17, 19, 18 anos e a idade do professor que foi com eles 50 anos. Ao determinarmos a idade
mdia das sete pessoas obteremos x = 23 anos, mas uma afirmao de que a idade mdia do grupo
23 anos pode ser facilmente mal interpretada. Poderamos inferir incorretamente que todas as
pessoas que participaram da excurso estivessem na casa dos 20 anos.
Para evitar a possibilidade de sermos induzidos em erro por uma mdia afetada por um valor
muito pequeno ou muito grande, por vezes prefervel caracterizarmos o centro de um conjunto de
dados por outra medida que no a mdia: por exemplo, a mediana, que vamos estudar a seguir.
A mediana aquele valor que ocupa a posio central da listagem, estando a amostra com
seus valores ordenados e com todos os valores repetidos tambm includos, individualmente, na
lista. A mediana da amostra divide o conjunto total em duas partes iguais, com metade (50%) dos
valores acima da mediana da amostra e metade (50%) abaixo dela. A mediana da amostra pode no
pertencer ao conjunto original de valores.
Exemplo 4.7: Dada uma srie de valores, como, por exemplo: 5, 13, 10, 2, 18, 15, 6, 16, 9, de acordo
com a definio de mediana, o primeiro passo a ser dado o de ordenao (crescente ou
decrescente) dos valores:
2 - 5 - 6 - 9 - 10 - 13 - 15 - 16 - 18
Em seguida tomamos aquele valor central que apresenta o mesmo nmero de elementos
direita e esquerda. Em nosso exemplo esse valor o 10.
Logo, Md = 10
Probabilidade e Estatstica
25
Exemplo 4.8: Se a lista de valores tiver nmero par de termos, a mediana ser, por definio,
qualquer nmero compreendido entre os dois valores centrais da srie. Convencionaremos utilizar o
ponto mdio. Dada a lista:
2, 6, 7, 10, 12, 13, 18, 21
tem , para mediana, a mdia aritmtica entre 10 e 12.
Logo:
Md =
10 12 22
11
2
2
Md = 11
Ento, se os dados da lista esto ordenados e n o nmero de elementos dessa lista, o valor
mediano ser:
n 1
, se n for mpar
2
o termo de ordem
n
n
e
1 se n for par
2
2
OBSERVAES
1) A mdia e a mediana no tm, necessariamente, o mesmo valor.
2) A mediana no, necessariamente, coincide com um elemento da srie.
Exemplo 4.9: Em 15 dias, um laboratrio realiza 40, 52, 55, 38, 40, 48, 56, 56, 60, 37, 58, 63, 46, 50
e 61 testes qumicos. Qual a mediana para o contexto do problema?
Caractersticas da mediana
1) No depende de todos os valores da srie, podendo se manter inaltervel com a modificao de
alguns deles.
2) No influenciada pelos valores extremos da distribuio; por isso particularmente indicada
quando existem dados discrepantes.
3) Pode ser calculada quando os valores mais altos e mais baixos de uma srie no podem ser
exatamente definidos.
3) MODA( Mo)
A denominao moda torna-se coerente na medida em que (so) o(s) evento(s) que mais se
destaca(m), isto , que ocorre(m) com maior frequncia no fenmeno estudado. Examinemos alguns
exemplos do nosso cotidiano:
Probabilidade e Estatstica
26
Exemplo 4.10: Quando queremos informaes sobre o tipo de sangue mais comum, estamos
interessados na moda. Se um comerciante pretende abrir uma loja de calados e quer saber quais os
nmeros de sapatos femininos que deve encomendar em maior quantidade, a medida de tendncia
que ele necessita para um bom planejamento administrativo a moda. Numa eleio, o candidato que
tem o maior nmero de votos representa a moda. Evidentemente, o comerciante pode constatar que
no h um nico nmero de sapato que predomine, mas que os mais comuns so 35, 36 e 37. Ter,
assim, uma distribuio multimodal, com trs modas: 35, 36 e 37.
Cabe ressaltar que, apesar de ser a frequncia que se destaca, a moda no representa
necessariamente a maioria no total de resultados.
Uma sequncia de nmeros pode no ter valor modal ( ou moda) ou apresentar vrios tipos de
repeties, recebendo ento vrias denominaes:
a)
b)
c)
d)
Observao
Comparada com a mdia e com a mediana, a moda a menos til das medidas para
problemas estatsticos, porque no se presta anlise matemtica, ao contrrio do que ocorre com as
outras duas medidas. A utilidade da moda se acentua quando um ou dois valores, ou um grupo de
valores, ocorrem com muito maior freqncia que outros.
EXERCCIOS
1) Inspecionam-se quinze rdios antes da remessa. Os nmeros de defeitos por unidade so: 1, 0, 3,
4, 2, 1, 0, 3, 1, 2, 0, 1, 1, 0, 1. Determine o nmero mdio, mediano e modal de defeitos.
2) Qual o nmero que devemos juntar a 5; 7; 8 e 2 de modo que sua mdia seja 6 ?
3) A mdia aritmtica simples de um conjunto de 10 nmeros 35. Se o nmero 12 for retirado do
conjunto, qual ser a mdia aritmtica dos nmeros restantes?
4) A nota de Estatstica de uma turma seria calculada com a mdia aritmtica de 4 testes. Dessa
maneira, Luciana obteria nota 7. O professor, no entanto, resolver anular um dos testes no qual ela
havia tirado 8. Qual vai ser a nota de Luciana?
5) Se o salrio mdio anual pago aos trs profissionais de uma empresa R$ 156.000,00, algum
deles pode receber um salrio anual superior a R$ 500.000,00?
6) Em um posto de controle rodovirio, doze motoristas multados por excesso de velocidade estavam
dirigindo a 8 - 11 - 14 - 6 - 8 - 10 - 20 - 11 - 13 - 18 - 9 15 quilmetros por hora acima do limite
regulamentar de velocidade.
Adriana Speggiorin e Andr Espindola
Probabilidade e Estatstica
27
a) Em mdia, em quantos quilmetros por hora esses motoristas estavam excedendo o limite?
b) O motorista que excedeu o limite em menos de 15 quilmetros por hora foi multado em R$
60,00 e os outros foram multados em R$ 88,00. Determine a mdia das multas que esses
motoristas tiveram de pagar.
7) Durante um perodo de uma hora uma sorveteria recebeu 20 fregueses, e os valores das compras
em reais foram:
1,25 2,50 1,25 5,50 3,25 3,75 2,75 6,25 4,00 2,50
1,25 1,25 3,75 6,00 4,50 3,25 1,25 4,50 2,50 1,50
a) Calcule o valor mdio das compras.
b) Se cada compra abaixo de R$5,00 faz jus a um bnus de 50 centavos, e cada compra de
R$5,00 ou mais faz jus a um bnus de 1 real, ache o valor mdio desses 20 bnus.
8) O nmero de carros vendidos por cada um dos 10 vendedores de uma revenda autorizada de
automveis durante certo ms, 10,10,4,7,2,12,10,12,15 e 14. Determinar:
a) a venda mdia;
b) a venda mediana;
c) a moda para esta distribuio.
9) O nmero de acidentes ocorridos durante um dado ms em 13 departamentos de manufaturas de
uma indstria foi: 2, 0, 0, 3, 3, 12, 1, 0, 8, 1, 0, 5 e 1. Calcular:
a) a mdia;
b) a mediana;
c) a moda para o nmero de acidentes por departamento.
10) Suponha que os preos de varejos de alguns itens selecionados tenham variado conforme a tabela
a seguir. Determinar a mudana percentual mdia nos preos de varejo.
Item
Leite
Carne
Vesturio
Gasolina
Porcentagem
de aumentos
10%
-6%
-8%
20%
40,4
16,4
73,7
36,6
109,9
30,0
4,4
33,1
66,7
81,5
Probabilidade e Estatstica
28
4) 6,7
5) No
6) a) 11,92
b) 67
7) a) 3,14
b) 0,58
8) a) x = 9,6 b) Md = 10
c) Mo = 10
9) a) x = 2,77 b) Md = 1
c) Mo = 0
10) 6%
11) Sim. Sim.
12) Sim. Sim.
13) a) 46,8
b) 36,6
c) 44,5
SEPARATRIZES
A mediana apenas um dentre os muitos quantis que dividem os dados em duas ou mais
partes to aproximadamente iguais quanto possvel. Entre eles, destacam-se os quartis, os decis e os
percentis, que dividem os dados em 4, 10 e 100 partes, respectivamente.
QUARTIS
Vamos nos ocupar principalmente da anlise preliminar de conjuntos relativamente pequenos
de dados. o problema de dividir esses dados em quatro partes aproximadamente iguais, onde
dizemos aproximadamente iguais porque no h maneira de dividir em quatro partes iguais um
conjunto com n = 27 ou n = 33, por exemplo. As medidas estatsticas criadas com esta finalidade so
tradicionalmente conhecidas como quartis, Q1, Q2 e Q3. Sem dvida, Q2 simplesmente a mediana.
Por outro lado, h vasto campo para arbitrariedades na definio do quartil inferior Q1 e do quartil
superior Q3.
PERCENTIS
o problema de dividir esses dados em cem partes aproximadamente iguais, onde dizemos
aproximadamente iguais porque no h maneira de dividir em cem partes iguais um conjunto com
n=328, por exemplo. As medidas estatsticas criadas com esta finalidade so tradicionalmente
conhecidas como percentis, P1, P2 , ... P81, ... , P98 e P99.
Probabilidade e Estatstica
29
MEDIDAS DE DISPERSO
DISPERSO OU VARIABILIDADE
Vimos anteriormente que um conjunto de valores pode ser convenientemente sintetizado, por
meio de procedimentos matemticos, em poucos valores representativos - mdia aritmtica , mediana,
moda. Tais valores podem servir de comparao para dar a posio de qualquer elemento do
conjunto. Porm, no o bastante dar uma das medidas de posio para caracterizar perfeitamente
um conjunto de valores.
Exemplo 4.12: Suponhamos que se deseja comparar o desempenho de dois funcionrios, com base
no nmero de cadeiras sem defeitos produzidas durante uma semana:
Empregado A: 80, 81, 79, 80, 80 x 80 cadeiras
Empregado B: 70, 90, 80, 72, 93 x 81 cadeiras
Baseados nestes nicos resultados obtidos, diramos que a produo de B melhor do que de
A, j que B produz, em mdia, um maior nmero de cadeiras diariamente. No entanto se formos um
pouco cuidadosos, percebemos que a produo de A varia de 79 a 81 cadeiras, ao passo que a de B
varia de 70 a 93 cadeiras, o que indica que o desempenho de A bem mais homogneo do que de B.
evidente que um alto grau de homogeneidade costuma ser considerado como uma qualidade
desejvel nesta situao.
Consideremos agora a seguinte situao:
Exemplo 4.13: Temos duas turmas A e B . Observe a tabela onde mostrado o desempenho dos
alunos. Calcule a mdia de cada turma.
Turma A
1
0
10
9
2
8
5
= 35
Turma B
4
6
5
3
4
7
6
= 35
Esses dois conjuntos possuem a mesma mdia. Pode-se dizer que estes conjuntos so iguais?
No, porque embora ambos tenham a mesma mdia eles diferem na sua homogeneidade.
Neste exemplo, o conjunto A mais heterogneo ou mais disperso que o conjunto B. Portanto, no
bastam que conheamos apenas a mdia de um conjunto, precisamos tambm, conhecer a disperso
do conjunto.
Da surge as medidas de variabilidade ou medidas de disperso. Estas medidas medem a
disperso do conjunto, avaliando a heterogeneidade ou a homogeneidade do mesmo.
A disperso mede quo prximos uns dos outros esto os valores de um grupo.
Probabilidade e Estatstica
30
AMPLITUDE
A amplitude (ou intervalo total) de um conjunto de dados igual diferena entre o maior e o
menor valor.
Exemplo 4.14: Em um hospital, onde se mede a pulsao de cada paciente trs vezes por dia, o
paciente A acusou as taxas de 72, 76 e 74, e o paciente B acusou 72, 91 e 59. A taxa mdia de ambos
a mesma, 74; observe, entretanto, a diferena na variabilidade. Enquanto a pulsao de A estvel,
a de B apresenta grande flutuao.
A vantagem de usar a amplitude como medida de disperso reside no fato de o intervalo ser
relativamente fcil de calcular, mesmo para um grande conjunto de nmeros. Entretanto, a maior
limitao da amplitude o fato dela levar em conta somente os dois valores extremos de um conjunto,
nada informando quanto aos outros valores.
VARINCIA
A varincia a medida de disperso que mede a mdia dos quadrados dos desvios dos
valores, de um conjunto numrico em relao a sua mdia.
Clculo da Varincia:
amostral
populacional
Onde:
xi = valor da varivel
x mdia amostral
xi x = desvio em relao mdia
= mdia populacional
No clculo de varincia divide-se a soma obtida por n-1 quando se trata de um conjunto de
nmeros que representam uma amostra. Se um conjunto de nmeros constitui uma populao, ou se a
finalidade de somar os dados apenas descrev-los, e no fazer inferncias sobre uma populao,
ento deve-se usar N em lugar de (n-1) no denominador.
Exemplo 4.15: Calcular a varincia da produo dos dois funcionrios.
xi x
Funcionrio
A
80
81
79
80
80
=
( x i x )2
xi x
Funcionrio
B
70
90
80
72
93
=
( x i x )2
=
Probabilidade e Estatstica
31
xi x
Turma A
( x i x )2
xi x
Turma B
1
0
10
9
2
8
5
( x i x )2
4
6
5
3
4
7
6
=
DESVIO PADRO
O desvio padro simplesmente a raiz quadrada positiva da varincia.
s s2
2
ou
(x
x) 2
n 1
(x
)2
O desvio padro uma das medidas mais comumente usadas para distribuies, e
desempenha papel relevante em toda a estatstica. Cabe notar que a unidade do desvio padro a
mesma da mdia. Por exemplo, se a mdia em reais, o desvio padro tambm se exprime em reais.
A varincia, por sua vez, se exprime em quadrados de unidades ( p. ex., reais2).
Adriana Speggiorin e Andr Espindola
Probabilidade e Estatstica
32
x
x n
s2
x
x n
n 1
n 1
x2
Turma B
4
6
5
3
4
7
6
=
x2
COEFICIENTE DE VARIAO
Examinemos o seguinte exemplo, em que so comparados os pesos de dois grupos de
indivduos (crianas e adultos), apresentados na tabela abaixo:
Crianas ( kg )
4
2
6
Adultos ( kg )
66
64
62
Verificamos que o peso mdio para as crianas de 4 kg, enquanto para os adultos de 64 kg.
A disperso dos dados em torno da mdia a mesma, pois ambos tm desvio padro s = 2 kg.
Entretanto a variao de 2 kg no grupo de crianas, cujo peso mdio de 4 kg, mais importante do
que a mesma variao no grupo de adultos, cujo peso mdio 64 kg. Neste tipo de situao, mais
interessante o emprego de uma medida de disperso relativa adimensional e geralmente expressa em
porcentagens: o coeficiente de variao.
O coeficiente de variao dado pelo quociente entre o desvio padro e a mdia de um
conjunto.
CV
s
x 100
x
ou
CV
x 100
Probabilidade e Estatstica
33
AMPLITUDE INTERQUARTLICA
definida como a amplitude do intervalo entre o primeiro e o terceiro quartis, ou seja:
Q = Q3 - Q1
A amplitude interquartlica uma medida de variabilidade bastante robusta, que pouco
afetada pela presena de dados atpicos, onde 50% dos dados esto entre Q1 e Q3.
EXERCCIOS
1) O desvio padro pode ser zero? Explique.
2) Calcule a mdia e o desvio padro de uma amostra das vendas dirias, em reais;
8 100; 9 000; 4 580; 5 600; 7 680; 4 800 e 10 640
3) Em um exame final de Matemtica, o grau mdio de um grupo de 150 alunos foi 7,8 e o desvio
padro, 0,80. Em Estatstica, entretanto, o grau mdio final foi 7,3 e o desvio padro, 0,76. Em que
disciplina foi maior a disperso?
4) Uma distribuio apresenta as seguintes estatsticas: s = 1,5 e CV = 2,9%. Determine a mdia da
distribuio.
5) Sabendo que um conjunto de dados apresenta para mdia aritmtica e para desvio padro,
respectivamente, 18,3 e 1,47, calcule o coeficiente de variao.
Peso (kg)
53,2
42,7
48,8
55,0
31,5
44,2
45,6
49,1
54,0
56,2
38,8
37,4
Probabilidade e Estatstica
34
7) Medidas as estaturas de 1.017 indivduos, obtivemos x = 162,2 cm e s = 8,01 cm. O peso mdio
desses mesmos indivduos 52kg, com um desvio padro de 2,3kg. Esses indivduos apresentam
maior variabilidade em estatura ou em peso?
8) Um grupo de 85 moas tem estatura mdia de 160,6 cm, com um desvio padro igual a 5,97cm.
Outro grupo de 125 moas tem uma estatura mdia de 161,9 cm, sendo o desvio padro igual a
6,01cm. Qual o coeficiente de variao de cada um dos grupos? Qual o grupo mais homogneo?
9) Um grupo de cem estudantes tem uma estatura mdia de 163,8 cm, com um coeficiente de
variao de 3,3%. Qual o desvio padro desse grupo?
10) Quinze amostras de ar de certa regio foram obtidas e para cada uma delas foi determinada a
concentrao de monxido de carbono. Os resultados (em ppm) foram:
9,3
9,0
10,7
13,2
8,5
11,0
9,6
8,8
12,2
13,7
15,6
12,1
9,2
9,8
10,5
2) x = 7200
s = 2284
6) s = 60,6
5) 8%
s = 7,8
7) CV em estatura = 4,9%
CV em peso = 4,4%
9) 5,4
s = 2,08
Probabilidade e Estatstica
35