Académique Documents
Professionnel Documents
Culture Documents
1.1- Introdução
Uma variável que pode assumir qualquer valor entre dois valores dados é uma variável
contínua. Se isto não for possível, a variável é chamada discreta.
Exemplos: 1) Os resultados do lançamento de um dado podem assumir os valores 1, 2,
4, etc., mas não os valores 2,3 ou 3,2. Logo, a variável é discreta.
2) Os pesos ou as alturas de um conjunto de pessoas podem assumir,
teoricamente, qualquer valor. Logo, a variável é contínua.
1.6- Gráficos
1 de 1
Pol 1894 – Estatística Aplicada UNESA - Macaé
Exemplos:
1) Discos vendidos nos últimos anos (em milhões)
Ano Vendas
1995 76,6 Discos Vendidos nos Últimos Anos
1996 44,8
1997 44,3 90
80
1998 34,5 70
1999 44 60
Vendas
2000 60 50
40
30
20
10
1995 1996 1997 1998 1999 2000
Anos
Meses Candidato
A B Eleição para Presidente
4 (Abril) 31,7 20,2
5 (Maio) 38,3 23,5 50
45
6 (Junho) 37,9 22,8 40
Votos (%)
Candidato A Candidato B
Exemplos:
2 de 2
Pol 1894 – Estatística Aplicada UNESA - Macaé
Bim estres %
1 45
Porcentual de Reprovação
2 35
60
3 55
Porcentagens
50
4 15 40
30 55
20 45 35
10 15
0
1 2 3 4
Bim estres
Avaliação-UNE (%)
Ótimo 4 Avaliação UNE
Bom 25 Não Avaliaram 22
Regular 27
Péssimo 13
Ruim 9
Avaliação
Péssimo 13 Ruim 9
Não Avaliaram 22 Regular 27
Bom 25
Ótimo 4
0 10 20 30
Porcentagens
Unidades Vendidas
Meses 1993 1994 Unidades Vendidas
Unidades Vendidas
Janeiro 15 12 30 25
Fevereiro 10 18 25 18 20 18
20 15 1993
Março 12 20 12 10 12
15
Abril 18 25 10 1994
5
0
i ro
iro
ri l
ç
Ab
re
ne
ar
ve
M
Ja
Fe
Meses
Nota: Os dados nos gráficos de barras podem ser representados por diferentes
formas de figura, tais como pessoas, objetos, etc. Estes gráficos
recebem o nome de pictóricos.
3 de 3
Pol 1894 – Estatística Aplicada UNESA - Macaé
2- Somatório
Para indicar um conjunto de N dados X1, X2, X3, ... , XN é usual tomarmos o símbolo Xi, onde
i, denominado índice, representa quaisquer dos número 1, 2, 3, ..., N e indica o número de
ordem dos diferentes valores.
Assim, por exemplo, se tivermos os números 4, 28, 13, 18 e 10, a notação X4 representa o
quarto deles, ou seja, X4 = 18.
4 de 4
Pol 1894 – Estatística Aplicada UNESA - Macaé
Exemplos:
a) Sendo F uma variável, temos:
∑F = F 1 + F2 + F3 + ... + FN
∑ FX = F X 1 1 + F2 X 2 + F3 X 3 + ... + FN X N
∑ h = h + h + h + ... + h = N .h
Ou seja, a soma de uma constante que se repete N vezes é igual ao produto da constante
por esse número N.
∑ hF = h∑ F = h( F 1 +F2 + F3 + ... + FN )
Ou seja, o somatório do produto de uma constante por uma variável é igual ao produto da
constante pelo somatório da variável.
∑ X = ∑ (Y − Z + F ) = ∑ Y − ∑ Z + ∑ F
5 de 5
Pol 1894 – Estatística Aplicada UNESA - Macaé
6 de 6
Pol 1894 – Estatística Aplicada UNESA - Macaé
Representa-se uma seqüência em P..A. por a1, a2, a3, ... , an , ..., se ela tiver infinitos
termos; ou por a1, a2, a3, ... , an, se ela tiver um número finito (e igual a n) de termos.
a2 = a1 + r
a3 = a2 + r
. . .
. . .
. . .
an = an-1 + r
Exemplos: 1- Os primeiros cinco termos de uma P.A. infinita de primeiro termo igual
a 2 e razão igual a 3 são: 2, 5, 8, 11, 14.
2- A seqüência 2, 0, -2, -4, ... é uma P.A. infinita de razão r = -2.
a) Crescentes: r>0
Exemplo: 3, 4, 5, 6 (r = 1)
b) Decrescente: r<0
Exemplo: 3, 2, 1, 0 (r = -1)
c) Constante ou Estacionária: r = 0
Exemplo: 3, 3, 3, 3
Dada uma P.A. a1, a2, a3, ... , an , ... de razão r, podemos escrever as n-1
igualdades seguintes:
a2 = a1 + r
a3 = a2 + r
. . .
. . .
. . .
an = an-1 + r
7 de 7
Pol 1894 – Estatística Aplicada UNESA - Macaé
2) Numa P.A. em que a razão é -3 e o quinto termo vale 10, quanto vale o
primeiro termo?
Solução: Temos r = -3, a5 = 10 e, como a5 = a1 + (n-1)r, segue-se que:
10 = a1 + (5 -1) . (-3), ou seja: a1 = 22
Consideremos uma seqüência finita (a1, a2, ... , an-1, an), onde a1 e an são seus
termos extremos.
Consideremos, agora, uma P.A. finita a1, a2, a3, ... , an de razão r e sejam ap e aq
dois termos eqüidistantes dos extremos a1 e an. Pela fórmula do termo geral,
sabemos que:
ap = a1 + (p-l)r (I)
Entretanto, aq, aq+1, …, an também é uma P.A. de razão r, primeiro termo aq e
cujo número de termos é 1 + (p -1) = p, já que, por hipótese, há p -1 termos que
sucedem aq. Então, an = aq + (p-l)r.
Ou seja: ap = a1 + (p-l)r ( II )
ap + aq = a1 + an
Numa P.A. finita, a soma de dois termos eqüidistantes dos extremos é igual à
soma dos extremos.
m meios
aritméticos
P.A. de m + 2 termos
b−a
Disso resulta: r=
m +1
Exercício resolvido:
Interpolar 8 meios aritméticos entre 3 e 84.
Solução: Temos a = 3, b = 4 e m = 8.
84 − 3 81
A razão da P.A. será: r = = = 9 ;
8 +1 9
a P.A. será, então: 3,12,21; 30,39,48,57,66,75.84.
Exercícios de Aprendizagem:
1) Numa P.A. a razão é igual ao número de termos, o primeiro termo é 3 e o último 23. O
terceiro termo da P.A. vale:
a) 5 c) 13 e) n.r.a
b) 18 d) 20
1
2) Se em uma P.A. o primeiro termo vale 2.048 e a razão vale − , o valor do décimo
3
termo é:
a) 2.045 c) 2.018 e) n.r.a
2010
b) d) 2.043
5
3) Numa P.A. de n termos, a soma do primeiro com o último é 120. A soma do sexto com
o de ordem n – 5 é:
a) 100 c) 110 e) n.r.a
b) 60 d) 50
4) Os números 2x-3, 2x+1 e 3x+1 constituem, nessa ordem, uma P.A. O valor de x deve
ser:
a) 0 c) 1 e) n.r.a
b) -4 d) 4
10 de 10
Pol 1894 – Estatística Aplicada UNESA - Macaé
Representa-se uma seqüência em P.G. por a1, a2, a3, ... , an , ..., se ela tiver infinitos
termos; ou por a1, a2, a3, ... , an, se ela tiver um número finito (e igual a n) de termos.
a2 = a1 . q
a3 = a2 . q
. . .
. . .
. . .
an = an-1 . q
Exemplos: 1- Os primeiros cinco termos de uma P.G. infinita de primeiro termo igual
a 2 e razão igual a 3 são: 2, 6, 18, 54, 162.
1 1 1 1
2- A seqüência 1, , , , ... é uma P.G. infinita de razão q = .
2 4 8 2
3- A P.G. de cinco termos com primeiro termo igual a 1 e razão q = -2 é:
1, -2, 4, -8, 16.
b) a1 > 0 e q > 0
Todos os termos da P.G. serão positivos. A P.G. será:
Crescente, se q > 1
11 de 11
Pol 1894 – Estatística Aplicada UNESA - Macaé
b) a1 < 0 e q > 0
Todos os termos da P.G. serão negativos. A P.G. será:
Dada uma P.G. a1, a2, a3, ... , an , ... de razão q, podemos escrever as n - 1
igualdades seguintes:
a2 = a1 . q
a3 = a2 . q
. . .
. . .
. . .
an = an-1 . q
9
Ou seja, o quinto termo da P.G. vale .
8
Consideremos uma seqüência finita (a1, a2, ... , an-1, an), onde a1 e an são seus
termos extremos.
ap = a1 .q(p – 1) (I)
ap . aq = a1 . an
Exemplos: 1- Na P.G. 4, -8, 16, -32, 64, -128 os termos -8 e 64, 16 e -32 são
eqüidistantes dos extremos 4 e -128 e temos:
(-8) . 64 = -512 = 4 . (-128)
16 . (-32) = -512 = 4 . (-128)
2- Na P.G. 3, 6, 12, 24, 48, os termos 6 e 24, 12 e 12 (12 é o termo
médio) são eqüidistantes dos extremos 3 e 48 e temos:
6 x 24 = 144 = 3 x 48
12 x 12 = 144= 3 x 48
m meios
geométricos
P.G. de m + 2 termos
Exercícios resolvidos:
1) Interpolar três meios geométricos entre 4 e 64.
64
Solução: Temos q (3+1) = ⇒ q 4 = 16
4
Ocorrem, então, duas soluções para a incógnita q:
q = 2 e temos a P.G. 4, 8, 16, 32, 64
q = -2 e temos a P.G. 4, -8, 16, -32, 64
Exercícios de Aprendizagem:
5) Numa P.G. em que o sexto termo vale 162 e o quarto termo, 18, o primeiro termo vale:
3 2
a) ± c) ± e) n.r.a
2 3
2 2
b) d)
3 5
1
6) O número de termos de uma P.G. cujo primeiro termo é , a razão é 2 e o último
2
termo vale 128 é:
a) 8 c) 10 e) n.r.a
b) 9 d) 7
7) A seqüência (x, x + 9, x + 45) é uma P.G. . O valor de x é:
a) 10 c) indeterminado e) n.r.a
b) +/- 3 d) 3
8) O número que se deve acrescentar aos termos da seqüência (-1, 3, 15) para se obter
uma P.G. é:
a) 3 c) 7 e) n.r.a
15 de 15
Pol 1894 – Estatística Aplicada UNESA - Macaé
b) 2 d) 4
1
9) Numa P.G. o primeiro termo é e o último, 27. Se a razão da P.G. é 3, o número de
9
termos é:
a) 5 c) 7 e) n.r.a
b) 6 d) 4
4- Distribuição de Freqüências
1 8 4 9 6,5 6 9 10 2 3
8,5 4 9 6 5 5,5 6,5 9 8 7
4,5 6 6,5 7,5 5 6 5,5 8 9 8
6 7 8 9 10 3 2,5 1,5 4 7
Colocando estes dados em ordem crescente, vamos obter uma nova tabela denominada
rol:
Podemos agora estabelecer a amplitude do rol, que é a diferença entre o maior e o menor
valor. No caso, temos 10 – 1 = 9 como amplitude do rol.
O número de vezes que um determinado valor se repete é denominado como freqüência
deste valor. Podemos então formular uma nova tabela onde a cada valor associamos a
sua freqüência:
Notas Freqüência
1 1
1,5 1
2 1
2,5 1
3 2
4 3
4,5 1
16 de 16
Pol 1894 – Estatística Aplicada UNESA - Macaé
5 2
5,5 2
6 5
6,5 3
7 3
7,5 1
8 5
8,5 1
9 6
10 2
Notas Freqüências
0 2 2
2 4 4
4 6 8
6 8 12
8 10 14
Aos extremos de cada classe chamamos de limites, que podem ser inferior ou superior.
Assim, 0, 2, 4, 6 e 8 são limites inferiores, enquanto que 2, 4, 6, 8 e 10 são limites
superiores.
O ponto médio de cada intervalo de classe é obtido pela média aritmética dos limites
inferior e superior da classe. São pontos médios os valores 1, 3, 5, 7 e 9.
Já a freqüência acumulada (Fa) de cada classe é dada pela soma das freqüências de
todas as classes desde a primeira até a classe considerada.
Exercício resolvido:=============================================
17 de 17
Pol 1894 – Estatística Aplicada UNESA - Macaé
Resolução:
a)
150 151 152 153 156
157 158 159 159 159
160 162 162 162 163
164 164 165 166 167
168 169 170 174 175
25 – 100%
7 ⋅ 100
7 – x x= ⇒ x = 28%
25
Freqüência acumulada.
- de 150 155, temos: 4
- de 155 160, temos: 4 + 6 = 10
- de 160 165, temos: 4 + 6 + 7 = 17
- de 165 170, temos: 4 + 6 + 7 + 5 = 22
- de 170 175, temos: 4 + 6 + 7 + 5 + 3 = 25
Logo:
Alturas (cm) Freqüências Fr (%) Fa
150 155 4 16 4
155 160 6 24 10
160 165 7 28 17
165 170 5 20 22
170 175 3 12 25
4.2.1- Histograma
19 de 19
Pol 1894 – Estatística Aplicada UNESA - Macaé
18 Frequência
40
16 6
50
14 10
60
12 18
70
10 12
80 4
8
90
6
4
2
0
40 50 60 70 80 90 Peso
f
18
35 0
16
45 6
14
55 10
12
65 18
10
75 12
8
85 4
6
95 0
4
2
x
0
5 15 25 35 45 55 65 75 85 95 105
20 de 20
Pol 1894 – Estatística Aplicada UNESA - Macaé
O polígono de freqüências também pode ser obtido através dos pontos médios
das bases superiores dos retângulos do histograma, unidos aos pontos anterior à
primeira classe e posterior à última:
18 Frequência
40
16 6
50
14 10
60
12 18
70
10 12
80 4
8
90
6
4
2
0
40 50 60 70 80 90 Peso
4.2.3- Ogiva
10
x
0
0 10 20 30 40 50 60 70 80 90 100
21 de 21
Pol 1894 – Estatística Aplicada UNESA - Macaé
Exercícios de Aprendizagem:
10) Construa o histograma para as distribuições de freqüências a seguir:
a) b)
Pesos (kg) Freqüências Pesos (kg) Freqüências
0 10 3 100 120 3
10 20 8 120 140 5
20 30 11 140 160 10
30 40 7 160 180 12
40 50 3 180 200 8
200 220 7
220 240 5
450 2
valor
0
0 10 20 30 40 50 60
a) b)
Valor Freqüência Valor Freqüência
3 1 100 10
6 3 200 15
9 6 300 30
12 8 400 25
15 4 500 20
18 2 600 10
23 de 23
Pol 1894 – Estatística Aplicada UNESA - Macaé
5- Separatrizes
Separatriz (S) de uma série de N termos, X1, X2, X3, ..., XN, colocados em ordem crescente
(ou decrescente) de valor, é o termo da série que a divide em duas ou mais partes iguais.
Quartis: São representados por Q1, Q2 e Q3, sendo chamados, respectivamente, primeiro,
segundo e terceiro quartil.
Primeiro quartil (Q1) de uma série ordenada de modo crescente (ou decrescente), é
o termo da série que é precedido por 25% dos termos (N/4) e seguido pelos
restantes 75% (3N/4).
Decis: São representados por D1, D2 , ... , D9, sendo chamados, respectivamente, primeiro,
segundo, ... , nono decil.
Primeiro decil (D1) de uma série ordenada de modo crescente (ou decrescente), é o
termo da série que é precedido por 10% dos termos (N/10) e seguido pelos restantes
90% (9N/10).
Percentis: São representados por P1, P2 , ... , P99, sendo chamados, respectivamente, primeiro,
segundo, ... , nonagésimo nono percentil.
Primeiro percentil (P1) de uma série ordenada de modo crescente (ou decrescente),
é o termo da série que é precedido por 1% dos termos (N/100) e seguido pelos
restantes 99% (99N/100).
P −' Fa
S = Li + ⋅h
F
Ordem Percentílica(OP)
Dentre as medidas de uma distribuição, a média aritmética (Ma), a mediana (Md) e a moda
(Mo) ocupam especial posição. Em aplicações específicas podemos também utilizar a média
geométrica (Mg). São medidas de tendência central, devido ao fato de ocuparem posições
centrais numa distribuição.
∑x i
Ma = i =1
A média aritmética para dados não agrupados é a média aritmética simples dos
elementos.
1 + 3 + 4 + 6 + 7 + 9 30
Ma = = =5
6 6
Às vezes, determinados valores de uma série são mais importantes que os demais,
merecendo, por isso mesmo, um tratamento especial.
Assim sendo, média aritmética ponderada (Map) de uma série de valores x1, x2, x3, ...,
xn é, por definição, a relação entre a soma dos produtos de cada valor da série pelo
respectivo peso (p) e a soma dos pesos, ou seja:
∑p x i i
M ap = i =1
n
∑p
i =1
i
M ap =
(3 × 4) + (2 × 2) + (4 × 5) = 36 = 4
3+ 2+ 4 9
Exercícios resolvidos:=============================================
a) Com a finalidade de obrigar sua turma a resolver exercícios, um professor de
Estatística propõe um trabalho para ser feito em casa, trabalho esse que deverá ser
anexado à prova do mês. Se a prova e trabalho tiverem pesos 4 e 1,
26 de 26
Pol 1894 – Estatística Aplicada UNESA - Macaé
p1 x 1 + p 2 x 2 (4 × 7 ) + (1 × 9 ) 28 + 9 37
Resolução: M ap = = = = = 7, 4
p1 + p 2 4 +1 5 5
Devemos notar que a nota mensal (7,4) se aproximou da nota da
prova (7), porque esta recebeu o maior peso.
Se os elementos x1, x2, ..., xn apresentam, respectivamente, freqüências f1, f2, ..., fn ,
então:
n
∑f x i i
Ma = i =1
n
∑f
i −1
i
Exemplo:
Notas Freqüências (fi)
2 4
3 5
6 8
7 8
8 6
∑f x
i =1
i i
(2 ⋅ 4) + (3 ⋅ 5) + (6 ⋅ 8) + (7 ⋅ 8) + (8 ⋅ 6) = 175 ⇒ M
Temos: Ma = = a = 5,64
n
4+5+8+8+6 31
∑f
i =1
i
27 de 27
Pol 1894 – Estatística Aplicada UNESA - Macaé
∑f m i i
Temos então: Ma = i =1
n
∑f i =1
i
Exemplo:
∑f m i i
296
Assim: Ma = i =1
n
= ⇒ M a = 5,92
50
∑f i =1
i
Média geométrica (Mg) de uma série de valores x1, x2, x3, ..., xn é, por definição, a raiz
do índice n do produto desses valores, ou seja:
n
M g = n x 1 ⋅ x 2 ⋅ ... ⋅ x n ⇒ M g = n ∏x
i =1
i
Ou simplesmente :
Mg = n ∏X
28 de 28
Pol 1894 – Estatística Aplicada UNESA - Macaé
b) 4 e 16
M g = 4 × 16 = 8
c) 1, 9 e 81
M g = 3 1 × 9 × 81 = 3 729 = 9
(*) Apenas como informação, apresentamos a fórmula da média geométrica para logaritmos:
Se M g = n ∏ X , então :
log ∏ X = log(x ⋅ x 2 ⋅ ... ⋅ x n )
log M g = log n ∏X = n
1
n
=
1
⇒ M g = ant. log
n ∑ log X
Observações:
Se o número de elementos é ímpar, existe um único valor intermediário, que é a
mediana.
29 de 29
Pol 1894 – Estatística Aplicada UNESA - Macaé
Só devemos aplicar o que foi dito acima para a posição da mediana, seja o número de
elementos par ou ímpar, no caso de séries constituídas de dados isolados ou de dados
repetidos, o mesmo não acontecendo para o caso de dados agrupados em classes,
conforme veremos adiante.
Salários fi Fa
100 15 15
120 12 27
150 10 37
180 8 45
200 6 51
∑f
∑f
i
Como i = 51, então := 25,5
2
Assim, a mediana é um valor entre o 25º e o 26º elementos. Estes valores
ocorrem com o salário 12.
Portanto: Md = 120
onde:
ld : limite inferior da classe mediana
Fant: soma das freqüências das classes anteriores à classe mediana
hd: amplitude da classe mediana
fd: freqüência da classe mediana
30 de 30
Pol 1894 – Estatística Aplicada UNESA - Macaé
Exercício resolvido:==============================================
Salários fi Fa
100 120 30 30
120 140 28 58
140 160 22 80
160 180 14 94
180 200 6 100
Resolução:
Temos:
∑f i = 30 + 28 + 22 + 14 + 6 ⇒ ∑ f i = 100
Como:
∑f i
=
100
= 50 , então a classe mediana é a segunda.
2 2
Assim:
ld : 120
Fant: 30
hd: 20
fd: 28
∑ fi
− Fant
2
M = l + ⋅ h ⇒ M = 120 + (50 − 30) ⋅ 20 ⇒ M = 134,28
Logo: d d d d d
fd 28
Um conjunto de elementos pode ter uma moda, mais de uma ou não ter moda.
31 de 31
Pol 1894 – Estatística Aplicada UNESA - Macaé
A classe modal é a classe que apresenta maior freqüência. Consideramos como moda de
uma distribuição de freqüências o valor compreendido entre os limites da classe modal.
Tal valor, pelo processo de Czuber, é dado por:
∆1
Mo = lo + ⋅h
(∆ 1 + ∆ 2 ) o
onde:
lo : limite inferior da classe modal
ho: amplitude da classe mediana
∆1: freqüência da classe modal menos freqüência da classe anterior à modal
∆2: freqüência da classe modal menos freqüência da classe posterior à modal
Exercício resolvido:==============================================
Calcular a moda para a distribuição de freqüências que apresenta tempos gastos por
jogadores de um clube para percorrer uma distância:
Resolução:
Exercícios de Aprendizagem:
14) Um jogador de futebol controlou a bola com os pés sem derrubá-la, conseguindo os
seguintes números de vezes: 23, 43, 16, 26, 49, 15, 58, 68, 71 e 114. Determine:
a) a amplitude do rol
b) a média aritmética
c) a mediana
32 de 32
Pol 1894 – Estatística Aplicada UNESA - Macaé
d) a moda
Notas Freqüências
0 2 2
2 4 5
4 6 15
6 8 12
8 10 6
17) Calcule a média e a mediana para a distribuição que apresenta os salários de uma
empresa:
Salários fi
100 150 13
150 200 10
200 250 8
250 300 5
300 350 3
350 400 2
18) A tabela abaixo apresenta a duração, em horas, de uma determinada lâmpada. Calcule a
média, moda e mediana.
Número de horas fi
100 200 15
200 300 25
300 400 40
400 500 32
500 600 8
33 de 33
Pol 1894 – Estatística Aplicada UNESA - Macaé
19) A distribuição de freqüência nos fornece, por faixa etária, a freqüência com que ocorre
determinada doença, para um grupo de 100 pessoas estudadas, com idade entre 16 e 48
anos. Calcule a média, moda e mediana.
Idade fi
16 20 9
20 24 18
24 28 26
28 32 14
32 36 10
36 40 9
40 44 8
44 48 9
∑ f i = 100
34 de 34
Pol 1894 – Estatística Aplicada UNESA - Macaé
7- Medidas de Dispersão
Grupo A: 7, 7, 7, 7 e 7.
Grupo B: 5, 6, 7, 8 e 9.
Grupo C: 4, 5, 7, 9 e 10
Grupo D: 0, 5, 10, 10 e 10.
Para representarmos cada grupo, podemos calcular a sua respectiva média aritmética,
encontrando:
Vemos assim que apesar de constituídos de valores diferentes, os grupos revelam uma mesma
média aritmética.
Observando-os mais detalhadamente, notamos que em cada grupo as notas se distribuem
diferentemente em relação à sua média 7. Necessitamos assim de uma medida estatística
complementar para melhor caracterizar cada conjunto apresentado.
As medidas estatísticas responsáveis pela variação ou dispersão dos valores de uma série são
as chamadas medidas de dispersão, que nos mostram como se distribuem os dados em torno
de um valor central. A amplitude total, o desvio médio, o desvio padrão, a variância e o
coeficiente de variação são as medidas de dispersão mais usadas. Em princípio, diremos que
entre duas ou mais séries, a mais dispersa (ou menos homogênea) é aquela que tem a maior
medida de dispersão.
A amplitude ou intervalo total (It) é definida como a diferença entre o maior e o menor
valor ocorridos numa determinada série .
A amplitude nos dá idéia do campo de variação dos valores da série.
Para os grupos de notas apresentados anteriormente, temos:
Grupo A: It = 7 – 7 = 0
Grupo B: It = 9 – 5 = 2
Grupo C: It = 10 – 4 = 6
Grupo D: It = 10 – 0 = 10
160 170
170 180
180 190
190 200
35 de 35
Pol 1894 – Estatística Aplicada UNESA - Macaé
A amplitude total é igual a 200 – 160 = 40, ou seja, a diferença entre o maior limite
superior e o menor limite inferior.
Para um conjunto de números x1, x2, ... , xn, de média aritmética Ma, definimos o desvio
médio (dm) por:
dm =
∑x i − Ma
n
dm =
∑f i mi − Ma
∑f i
Exercícios resolvidos:==============================================
Solução:
Ma =
∑x i
⇒ Ma =
2 + 3 + 4 + 5 + 7 + 8 + 13
⇒ Ma =
42
⇒ Ma = 6
n 7 7
Mas:
∑ x i − M a = 2 − 6 + 3 − 6 + 4 − 6 + 5 − 6 + 7 − 6 + 8 − 6 + 13 − 6 ⇒
⇒ ∑ x i − M a = 4 + 3 + 2 + 1 + 1 + 2 + 7 ⇒ ∑ x i − M a = 20
Logo:
20
dm = ⇒ d m = 2,87
7
Número de horas fi
100 200 15
200 300 25
300 400 40
400 500 32
500 600 8
Solução:
36 de 36
Pol 1894 – Estatística Aplicada UNESA - Macaé
Então:
Ma =
∑f mi i
⇒ Ma =
41300
⇒ M a = 344,17
∑f i 120
∑f i mi − M a 10533,20
Logo: d m = ⇒ dm = ⇒ d m = 87,78
∑f i 120
É a mais usada e também a mais importante das medidas de dispersão. Assim como o
desvio médio, o desvio padrão, representado por σ (letra grega sigma, minúscula),
determina a dispersão dos valores em torno da média.
O desvio padrão facilita a interpretação dos dados, pois é expresso na mesma unidade
dos valores observados. É dado pela seguinte fórmula:
∑ (d )
2
i
σ= , onde : d i = x i - M a
n
37 de 37
Pol 1894 – Estatística Aplicada UNESA - Macaé
∑ (d )
2
i
σ= , onde : d i = f i m i - M a
∑f i
∑ f (m ) ∑ fimi
2
2
−
i i
σ=
Logo: ∑f i
∑f
i
Custo fi
50 60 3
60 70 5
70 80 8
80 90 4
Solução:
Vamos precisar das colunas mi, fimi e fi(mi)². Assim:
Custo fi mi f im i fi(mi)²
50 60 3 55 165 9075
60 70 5 65 325 21125
70 80 8 75 600 45000
80 90 4 85 340 .28900
∑ f i m i = 1430 ∑ f i (m i ) 2 = 104100
∑ f (m ) ∑ fimi
2
2
2
σ=
i i
− ⇒ σ = 104100 − 1430 ⇒ σ = 5204 − 5112,25 ⇒
∑f i
∑f
i
20 20
⇒ σ = 92,75 ⇒ σ = 9,63
38 de 38
Pol 1894 – Estatística Aplicada UNESA - Macaé
∑ (x i − M a )2
n
∑ f (m ) ∑ fimi
2
2
−
i i
σ 2
=
∑f i
∑f
i
Embora a variância seja suficiente para diferenciar a dispersão de uma série, não é
possível expressá-la na mesma unidade dos valores da variável, uma vez que os desvios
são elevados ao quadrado.
Exemplos: a) Se o desvio padrão de uma série for 8cm, sua variância será igual a
(8cm).(8cm) = 64 cm².
b) Se o desvio padrão de uma série for 18 ≅ 4,2kg , sua variância será
igual a 18 kg² ( e não 4,2kg × 4,2kg ≅ 17,6kg 2 ) .
Como não há muito sentido no fato de compararmos unidades diferentes, como, por
exemplo, kg com cm, definimos o coeficiente de variação, que é uma medida relativa de
dispersão. O coeficiente de variação (V) mede percentualmente a relação entre o desvio
padrão e a média aritmética, sendo, pois, uma medida adimensional.
σ
Sua expressão de cálculo é: V = 100 ⋅
Ma
7,5
Distribuição de pesos: V = 100 ⋅ ⇒ V = 12,99 ⇒ V ≅ 13,0 %
57,7
7 ,1
Distribuição de estaturas: V = 100 ⋅ ⇒ V = 4 ,17 ⇒ V ≅ 4 , 2 %
170
Vemos, assim, que a distribuição de estatura é mais homogênea (menos dispersa) que a
de pesos.
40 de 40
Pol 1894 – Estatística Aplicada UNESA - Macaé
Exercícios de Aprendizagem:
20) Calcule o desvio médio e o desvio padrão para as seguintes distribuições:
a)
Salários fi
100 150 13
150 200 10
200 250 8
250 300 5
300 350 3
350 400 2
b)
Notas fi
0 2 2
2 4 5
4 6 15
6 8 12
8 10 6
c)
Número de horas fi
100 200 15
200 300 25
300 400 40
400 500 32
500 600 8
Notas fi
0 2 2
2 4 3
4 6 8
6 8 5
8 10 2
b) A média aritmética;
c) A moda;
d) A mediana;
e) O desvio médio;
f) O desvio padrão;
g) Ma – σ e M a + σ
Intervalos Frequência
1 5 3
5 9 5
9 13 8
13 17 15
17 21 11
21 25 8
23) Determine a média aritmética, a mediana, a moda, os desvios médio e padrão para a
distribuição abaixo:
Custo fi
10 20 3
20 30 8
30 40 12
40 50 7
26) Calcular o desvio padrão dos seguintes dados de pesos em quilogramas, de dois grupos
(A e B) de alunas, dizendo, ainda com base no cálculo, qual o grupo mais homogêneo
(ou menos disperso).
Grupo A: 43, 45, 52, 54 e 56 Grupo B: 46, 53, 58, 60 e 66
Notas fi
0 1 1
1 2 3
2 3 7
3 4 6
4 5 7
5 6 10
6 7 8
7 8 10
8 9 6
9 10 2
∑ f i = 60
c) Número de alunos da turma por classe de notas:
Notas fi
40 50 3
50 60 9
60 70 9
70 80 10
80 90 10
90 100 5
100 110 6
110 120 4
120 130 3
130 140 1
∑ f i = 60
28) Dados de peso de 140 universitários, separados por sexo, revelaram após tabulação e
cálculos:
Grupo 1 Grupo 2
(sexo masculino) (sexo feminino)
- número de componentes: 50 90
- peso médio: 65,4 kg 52,6 kg
- desvio padrão: 8,9 kg 6,2 kg
29) Calcular a variância das distribuições que revelaram os seguintes desvios padrões:
43 de 43
Pol 1894 – Estatística Aplicada UNESA - Macaé
8.1- Introdução
Na prática, quase sempre interessa-nos estudar muito mais do que uma simples
característica isolada de uma variável, como, por exemplo, sua média. O que queremos
saber é como a variável está relacionada com outras variáveis: é isto o que os estatísticos
chamam de regressão.
Por exemplo: Os pesos dos adultos do sexo masculino dependem, em certo grau, de
suas alturas; as circunferências de círculos dependem de seus raios; a
pressão de uma determinada massa de gás depende de sua temperatura e
de seu volume. Podemos ainda, através de uma pesquisa de clima em uma
determinada empresa, relacionar o grau de satisfação dos empregados
com os níveis salariais, benefícios oferecidos pela empresa, etc.
Deseja-se, frequentemente, expressar essa relação sob forma matemática, por meio do
estabelecimento de uma equação que ligue as variáveis.
Neste caso mais simples, a variável Y está relacionada com uma única variável X por
uma linha reta – é a chamada regressão simples de Y sobre X.
X Y
Fertilizante Safra
(kg/Ha) (ton./Ha)
100 40
200 50
300 50
400 70
500 65
600 65
700 80
X Y
Fertilizante Safra Observações sobre Fertilizante e Safra
(kg/Ha) (ton./Ha)
100 40 90
200 50 80
Y Safra (ton./Ha)
300 50 70
400 70 60
500 65 50
600 65
40
700 80
30
0 100 200 300 400 500 600 700 800
X Fertilizante (kg/Ha)
d = Y – Y’
Até que ponto é válido um ajustamento a olho tal como o utilizado no exemplo anterior?
Se todos os pontos estivessem exatamente sobre uma reta, poderíamos traçar a reta
ajustada com precisão total. Mas, ao considerarmos o caso de maior dispersão exibido
no exemplo anterior, precisamos achar um novo método – mais objetivo e de cálculo
fácil, ou seja, estabelecermos fórmulas algébricas para o ajustamento de uma reta.
45 de 45
Pol 1894 – Estatística Aplicada UNESA - Macaé
Y = a + bX
minimizar ∑d 2
= ∑ (Y − Y) 2
Este critério permite selecionar uma reta única de ajustamento, chamada reta de
mínimos quadrados.
b=
∑ ( X − X) ⋅ ( Y − Y )
∑ ( X − X) 2
Como os desvios ( X − X) e ( Y − Y ) aparecem com grande frequência, convém
representá-los por notações abreviadas:
( X − X) = x
(Y − Y) = y
b=
∑ xy
∑x 2
a = Y − bX
46 de 46
Pol 1894 – Estatística Aplicada UNESA - Macaé
b=
∑ xy ⇒ b = 16500 ⇒ b = 0,059
∑x 2
280000
a = Y − b X ⇒ a = 60 − 0,059(400) ⇒ a = 36,4
Podemos traçar o gráfico da equação acima e verificarmos que a reta obtida está
tão próxima da traçada a olho que mal se discerne qualquer diferença.
Y = 36,4 + 0,059X
X Y Observações sobre Fertilizante e Safra
0 36,4
100 42,3 80
Y Safra (ton./Ha)
200 48,2 70
300 54,1 60
400 60 50
500 65,9 40
600 71,8
30
700 77,7
0 100 200 300 400 500 600 700
X Fertilizante (kg/Ha)
47 de 47
Pol 1894 – Estatística Aplicada UNESA - Macaé
Exercícios de Aprendizagem:
31) Suponhamos quatro tipos de fertilizante aplicados a quatro lotes escolhidos
arbitrariamente, com os seguintes resultados:
Safra Y
(1000kg/Ha) (ton./Ha)
1 70
2 70
4 80
5 100
a) Calcule a reta de regressão da safra sobre o fertilizante.
b) Grafe os quatro pontos e a reta de regressão, verificando que a reta se ajusta
razoavelmente bem aos dados.
c) Use a regressão para predizer:
- A safra, no caso de aplicação de 3000kg de fertilizante por Ha.
- A safra, no caso de aplicação de 4000kg de fertilizante por Ha.
- O aumento da safra para cada aumento de 1000kg/Ha no fertilizante. Faça o
gráfico.
32) Suponha que uma amostra aleatória de cinco famílias acuse as seguintes cifras de rendas
anuais e economias (em milhares de reais):
Renda X Economia S
A 16 1,2
B 22 2,4
C 18 2,0
D 12 1,4
E 12 0,6
Calcule a reta de regressão de S sobre X.
48 de 48
Pol 1894 – Estatística Aplicada UNESA - Macaé
A regressão múltipla nada mais é que a regressão simples, quando se tem em conta mais
de um fator X. É, sem dúvida, a técnica adequada quando desejamos pesquisar o efeito
simultâneo de vários fatores sobre Y. Mesmo assim, embora interessados no efeito de
apenas um dos fatores, é essencial aplicarmos os métodos de regressão múltipla, quando
os dados provêm de um estudo observacional. A regressão múltipla reduz a
tendenciosidade que se verificaria no caso de uma regressão simples que não levasse em
conta fatores estranhos. Este aspecto se tornará claro no exemplo a seguir.
X Y Z
Fertilizante Safra Nível Pluviométrico
(kg/Ha) (ton./Ha) (cm3)
100 40 10
200 50 20
300 50 10
400 70 30
500 65 20
600 65 20
700 80 30
49 de 49
Pol 1894 – Estatística Aplicada UNESA - Macaé
Solução:
a)
X Y Z
Fertilizante Safra Nível Pluviométrico
3
(kg/Ha) (ton./Ha) (cm )
100 40 10
200 50 20
300 50 10
400 70 30
500 65 20
600 65 20
700 80 30
90
80 Z = 30
Y Safra (ton./Ha)
70
60 Z = 20
50
40 Z = 10
30
0 100 200 300 400 500 600 700 800
X Fertilizante (kg/Ha)
1) Y = a 0 + a1 X
2) Y = a0 + a1X + a2X2 Curva do 2º grau
3) Y = a0 + a1X + a2X2 + a3X3 Curva do 3º grau
4) Y = a0 + a1X + a2X2 + a3X3 + ... + anXn Curva do n.º grau
Exercícios de Aprendizagem:
33) Suponhamos uma amostra aleatória de cinco famílias com os dados abaixo (S e X
avaliados em milhares de dólares por ano):
c) Para uma família F, com quatro filhos e uma renda anual de 25.000 dólares,
preveja a poupança utilizando o gráfico. Verifique a sua resposta utilizando a
equação.
51 de 51
Pol 1894 – Estatística Aplicada UNESA - Macaé
d) Suponha que uma família G tenha o mesmo número de filhos da família F, porém
mais 1.000 dólares de renda. Estime o aumento de poupança da família G.
52 de 52
Pol 1894 – Estatística Aplicada UNESA - Macaé
8.4- Correlação
b=
∑ xy
∑x 2
Correlação de X e Y r=
∑ xy
∑x ⋅ ∑y
2 2
Qualquer que seja a forma como x comparece nesta fórmula, agora y comparece
simetricamente na mesma forma. Assim, o coeficiente de correlação r não faz distinção
entre a resposta y e o regressor x, como fazia o coeficiente de regressão b.
53 de 53
Pol 1894 – Estatística Aplicada UNESA - Macaé
b=
∑ xy ⇒ b = 654 ⇒ b = 0,50
∑x 2
1304
r=
∑ xy =
654
⇒ r = 0,63
∑x ⋅ ∑y
2 2
1304 ⋅ 836
Dados y=Y-Y'
X Y 80
80 65 70 20 P1
P2
60 10
50 60 x=X-X'
36 35 50 Y
40 10 20
58 39
30
72 48
20
60 44
10
56 48 X
0
68 61 0 10 20 30 40 50 60 70 80 90
54 de 54
Pol 1894 – Estatística Aplicada UNESA - Macaé
(a) r = 0,6
30 (b) r = 1 20
80 65 35 25
8050 60 80 40 30
36 35 45 35
58
6072
39 50 40
48 60 55 45
55 44 60 50
4056 48 40 65 55
68 61 70 60
55 40 75 65
2064 55 20 80 70
70 55 63 53
065 38 0 68 58
76 55 73 63
40
0 10 20 4530 40 50 60 70 80 90 0 58
10 20 30 4840 50 60 70 80 90
45 60 53 43
50 34 48 38
80 36 35 68
76 (c) r 32
= - 0,6 38 d) r = - 1 65
8072
70
40
33
80 40
43
63
60
68 42 60
45 58
6065 50 48 55
64 55 50 53
4058
56
48
46 40 53
55
50
48
55 55 58 45
2055 59 20 60 43
50 67 63 40
050 57 0
65 38
45 70 68 35
40
0 10 20 5530 40 50 60 70 80 90 0 70
10 20 30 3340 50 60 70 80 90
36 65 73 30
75 28
e) r = 0
80
35 45
38 59
70 40 44
60
43 30
45 50
50 48 65
40
50 44
53 58
30 55 58
58 70
20 60 66
10 63 47
65 58
0 68 27
0 70
10 20 3044
73 6040 50 60 70 80 90
75 28
No painel (b), há uma associação positiva perfeita, de modo que o produto xy é sempre
positivo. Consequentemente, r toma seu valor máximo, que é +1.
55 de 55
Pol 1894 – Estatística Aplicada UNESA - Macaé
Da mesma forma, no painel (d), onde há uma associação negativa perfeita, r toma o
maior valor negativo possível, que é –1.
Correlação e Regressão
σy
b=r
σx
Solução:
σx =
∑ ( X − X) 2
⇒ σx =
∑x 2
⇒ σx =
1304
⇒ σ x = 186,3
n−1 n−1 8−1
σy =
∑ (Y − Y) 2
⇒ σy =
∑y 2
⇒ σy =
836
⇒ σ y = 119,4
n −1 n −1 8−1
σy 119,4
b=r ⇒ b = 0,63 ⇒ b = 0,50
σx 186,3 c.q.d.
Exercícios de Aprendizagem:
35) Uma amostra aleatória de seis países acusou as seguintes cifras para X = consumo anual
de cigarros per capita e Y = taxa anual de mortalidade por 100.000 em consequência de
câncer no pulmão. Calcule o coeficiente amostral de correlação r.
Países X Y
A 3400 24
B 2600 20
56 de 56
Pol 1894 – Estatística Aplicada UNESA - Macaé
C 2200 17
D 2400 19
E 2900 26
F 2100 20
Médias 2600 21
37) Uma amostra aleatória de sete mulheres acusou os seguintes dados relativos a X (idade
em anos) e Y (concentração de colesterol no sangue em gramas por litro). A correlação é
0,693. Calcule a reta de regressão de Y sobre X (sugestão: é mais fácil utilizar a eq. que
relaciona b e r). Faça o gráfico da reta de regressão, juntamente com o dos sete pontos.
X Y
30 1,6
60 2,5
40 2,2
20 1,4
50 2,7
50 1,6
30 2,0
Média 40 2,0
Variação 1200 1,46
Variância 200 0,243
Desvio Padrão 14,1 0,493
57 de 57
Pol 1894 – Estatística Aplicada UNESA - Macaé
X Y
60 2,9
20 2,0
50 1,7
20 1,5
50 2,4
Média 40 2,1
Variação 1400 1,26
Variância 350 0,315
Desvio Padrão 18,7 0,561
58 de 58