Vous êtes sur la page 1sur 15

INF 162 Prof.

Luiz Alexandre Peternelli


13
CAPTULO 2 - Estatstica Descritiva
Podemos dividir a Estatstica em duas reas: estatstica indutiva (inferncia
estatstica) e estatstica descritiva.
Estatstica Indutiva: (Inferncia Estatstica)
Se uma amostra representativa de uma populao, concluses importantes sobre
a populao podem ser inferidas de sua anlise.
A parte da estatstica que trata das condies sob as quais essas inferncias so
vlidas chama-se estatstica indutiva ou inferncia estatstica.
Este assunto iremos tratar apenas no final desse curso. Neste captulo,
estudaremos a outra rea da estatstica, que a Estatstica Descritiva.
Estatstica Descritiva
a parte da Estatstica que procura somente descrever e avaliar um certo grupo,
sem tirar quaisquer concluses ou inferncias sobre um grupo maior.
A Estatstica Descritiva pode ser resumida nas seguintes etapas:
Definio do problema:
Planejamento
Coleta dos dados
Crtica dos dados
Apresentao dos dados
tabelas
grficos
Descrio dos dados
Nesse captulo veremos como podem ser feitas tais apresentaes (e descries
resumidas) dos dados.
Em estatstica descritiva teremos portanto dois mtodos que podem ser usados
para a apresentao dos dados: mtodos grficos (envolvendo apresentao grfica e/ou
tabular) e mtodos numricos (envolvendo apresentaes de medidas de posio e/ou
disperso).
Apresentao grfica e tabular.
Os grficos constituem uma das formas mais eficientes de apresentao de dados.
Um grfico , essencialmente, uma figura constituida partir de uma tabela, pois quase
sempre possvel locar um dado tabulado num grfico.
INF 162 Prof. Luiz Alexandre Peternelli
14
Enquanto as tabelas fornecem uma idia mais precisa e possibilitam uma inspeo
mais rigorosa aos dados, os grficos so mais indicados em situaes que objetivam dar
uma viso mais rpida e fcil a respeito das variveis s quais se referem os dados.
Embora a confeco de grficos dependa muito da habilidade individual, algumas
regras gerais so importantes. O leitor deve ficar atento e procurar saber sobre tais regras
antes de se envolver na confeco de grficos.
Existem vrios tipos de grficos que podem ser utilizados com o objetivo de
descrever um conjunto de dados resumidamente. Alguns deles sero aqui exemplificados.
Vejamos, primeiro, uma forma tabular de apresentao de dados e, a seguir,
veremos 3 tipos de apresentao grfica.
Distribuio de frequncia
Organizao tabular dos dados em classes de ocorrncia, ou no, segundo suas
respectivas frequncias absolutas. Em alguns casos h tambm o interesse de se
apresentar os dados em frequncias relativas ou acumuladas.
A apresentao dos dados em tabelas obedecem a certas normas e recomendaes.
Essas normas so teis para que as tabelas sejam feitas de modo que simplicidade,
clareza e veracidade perdurem. Diferentes revistas costumam usar pequenas variaes na
confeco de suas tabelas. Uma observao importante que as tabelas devem ter
significado prprio, ou seja, devem ser entendidas mesmo quando no se l o texto em
que esto apresentadas. O mesmo vlido para as tabelas de distribuio de frequncias.
exemplo:
Foram anotados os pontos finais dos alunos de INF 160, referentes ao segundo
semestre de 1999. Foi feita a contagem e depois a organizao dos dados na seguinte
tabela:
Conceitos (Notas) Nmero de alunos Porcentagem
A (90 a 100) 14 7,07
B (75 a 89) 32 16,16
C (60 a 74) 50 25,25
R (<60) 63 31,82
L
1/
39 19,70
198 100,00
FONTE: Departamento de Informtica UFV;
1/
Reprovao por faltas.
Diagrama de pontos (dot diagram)
Este tipo de diagrama muito til para apresentar um pequeno conjunto de dados
(at cerca de 20 observaes). Assim podemos ver, de uma maneira rpida e fcil, a
tendncia central dos dados, alm da sua distribuio ou variabilidade.
exemplo:
Considere o seguinte resultado de um experimento no qual o engenheiro testa
adio de uma substncia em cimento de construo para determinar seu efeito na fora
da tenso de aderncia (em determinada unidade/cm
2
):
16,85 16,40 17,21 16,35 16,52 17,04 16,96 17,15 16,59 16,57
INF 162 Prof. Luiz Alexandre Peternelli
15
Para esse conjunto de dados o diagrama de pontos seria:

| | | | |
16,00 16,50 17,00 17,50 18,00
Observe que os dados esto centrados num valor prximo de 16,8 e que os valores
da tenso de aderncia caem no intervalo de cerca de 16,3 at 17,2 ud/cm
2
.
Este tipo de diagrama pode tambm ser usado para se comparar dois ou mais
conjuntos de dados. Por exemplo suponha ter sido verificado a tenso de aderncia em
cimentos no modificados. Os resultados so apresentados abaixo.
17,50 17,63 18,25 18,00 17,86 17,75 18,22 17,90 17,96 18,15
Faa voc mesmo o diagrama de pontos para os dois cojuntos de dados, ou seja,
colocando ambos os conjuntos de dados no mesmo diagrama. Observe que o diagrama
revela imediatamente que o cimento modificado parece ter uma menor fora de tenso de
aderncia, mas que a variabilidade das medidas dentro de ambos os conjuntos de dados
parece ser a mesma.
Testes estatsticos para verificar essas duas afirmativas podem ser realizados com
esses dados apresentados, e sero discutidos no momento oportuno.
Quando o nmero de observaes pequeno, geralmente se torna difcil
identificar algum padro especfico de variao. No entanto este tipo de diagrama pode
ser til em mostrar alguma caracterstica incomum no conjunto de dados.
Diagrama de ramos e folhas (stem-and-leaf diagram)
Quando o nmero de observaes relativamente grande, este diagrama pode ser
de boa utilidade.
exemplo:
Barulho medido em decibis, representado por dB. Um decibel corresponde ao
nvel do som mais fraco que pode ser ouvido em um local silencioso por algum com boa
audio. Um sussurro corresponde a cerca de 30 dB; a voz humana em conversao
normal corresponde a cerca de 70dB; um rdio em volume alto cerca de 100 dB;
Desconforto para os ouvidos geralmente ocorre a cerca de 120 dB. Os dados abaixo
correspondem aos nveis de barulho medidos em 36 horrios diferentes em um
determinado local.
82 89 94 110 74 122 112 95 100 78 65 60
90 83 87 75 114 85 69 94 124 115 107 88
97 74 72 68 83 91 90 102 77 125 108 65
o grfico de ramos e folhas para o conjunto acima :
INF 162 Prof. Luiz Alexandre Peternelli
16
6 0,5,5,8,9
7 2,4,4,5,7,8
8 2,3,3,5,7,8,9
9 0,0,1,4,4,5,7
10 0,2,7,8
11 0,2,4,5
12 2,4,5
Histograma
Para alguns conjuntos de dados o nmero de valores distintos da varivel em
estudo muito grande para serem considerados os tipos de apresentao grfica
apresentados acima. Em tais casos seria til dividir os valores em grupos, ou intervalos de
classe, e ento plotar o nmero de valores dos dados correspondentes a cada intervalo de
classe. Existem vrias frmulas para se estabelecer o nmero de classes, porm qualquer
nmero de classes poderia ser utilizado, baseando-se nas seguintes observaes:
(a) no escolher muito poucas classes, para evitar perda de informao sobre os dados;
(b) no escolher muitas classes, o que poderia fazer com que as frequncias referentes a
cada classe fossem to pequenas a ponto de atrapalhar o discernimento de algum
padro de distribuio para a varivel em estudo.
O que se faz na prtica tentar variados nmeros de classes e verificar, com a
ajuda de um computador, o nmero ideal para os dados em questo. Alm disso,
comumente usamos intervalos de classe de iguais amplitudes.
exemplo: (envolvendo distribuio de frequncia e histograma, com algumas variaes)
Suponhamos que uma empresa deseja avaliar a distribuio dos salrios pagos por
hora a seus funcionrios. O estatstico da empresa possui os seguintes dados:
13,3 15,2 12,4 15,8 9,6 10,4 13,2 8,8 8,3 8,5 10,2
11,5 12,6 10,7 12,6 9,7 12,1 13,5 10,3 14,3 9,8 12,3
10,4 11,6 12,4 12,9 11,6 10,3 14,2 13,8
Temos ai o que chamamos dados brutos.
Dados como estes poderiam ser agrupados em classes. Uma maneira de escolher o
nmero de classes poderia ser usarmos um valor prximo raiz quadrada do nmero de
observaes. Poderamos usar, ento, 5 classes. Tomando-se a diferena entre o maior e o
menor valor do conjunto de dados, e dividindo pelo nmero de classes escolhido
teramos: (15,8 8,3)/5 =1,5. Esse seria o valor para amplitude da classe, ou intervalo da
classe. A seguinte tabela pode ser construida (com intervalo fechado esquerda):
Classes frequncias
8,3 9,8 5
9,8 11,3 7
11,3 12,8 9
12,8 14,3 6
14,3 15,8 3
30
INF 162 Prof. Luiz Alexandre Peternelli
17
Agora podemos ter uma idia da distribuio dos salrios. Apenas com essas
informaes poderamos concluir que a classe de salrios predominante na empresa a
terceira, ou seja, com salrios de 11,3 a 12,8 salrios mnimos.
Se quisssemos obter maiores informaes sobre os dados, poderamos montar
uma nova tabela, incluindo outros tipos de frequncia, como: frequncia acumulada (f
a
),
frequncia relativa (f
r
), e frequncia acumulada relativa (f
ar
).
Classes f
i
f
ai
f
ri
f
ari
8,3 9,8 5 5 0,17 0,17
9,8 11,3 7 12 0,23 0,40
11,3 12,8 9 21 0,30 0,70
12,8 14,3 6 27 0,20 0,90
14,3 15,8 3 30 0,10 1,00
30 1,00
Discusso: exemplos
- na terceira coluna, a frequncia acumulada 21 indica que , nessa empresa, 21
funcionrios recebem salrios/hora abaixo de 12,8 unidades;
- Podemos constatar, tambm, uma certa predominncia de salrios mais baixos.
Realmente cerca de 70% da distribuio de salrios concentra-se at o salrio de 12,8
unidades;
- Os maiores salrios serve a apenas 10% dos funcionrios da empresa.;
- 40% dos funcionrios (12 funcionrios) recebem at 11,3 unidades, sendo 23% (ou
seja, 7 funcionrios) recebendo entre 9,8 e 11,3 unidades.
Essas informaes preliminares, bem como outras, seriam impossveis de serem
obtidas se a populao de funcionrios fosse muito maior e os dados correspondentes no
estivessem tabelados.
O histograma pode ser feito a partir das frequncia simples de cada classe ou a
partir das frequencias relativas. Bastaria informar corretamente o que seria usado no eixo
vertical.
Algumas vezes h o interesse em plotar as frequncias acumuladas, ou
frequncias acumuladas relativas. Nesse caso teramos a chamada Ogiva, ou ogiva
percentual, respectivamente (veja abaixo).
INF 162 Prof. Luiz Alexandre Peternelli
18
Medidas de posio e de disperso.
Nesse tpico sero apresentadas algumas estatsticas teis para resumir, de modo
bastante conciso, as informaes contidas em um conjunto do dados. Estattica, nesse
contexto, significa alguma quantidade numrica cujo valor determinado pelos dados.
Medidas de Posio
Sero apresentadas algumas estatsticas usadas para descrever o centro de um
conjunto de dados.
! Mdia Aritmtica
Suponha termos um conjunto de n valores numricos x
1
, x
2
, , x
n
. A mdia
aritmtica desses valores ser dada por:
n
x
x
n
1 i
i
=
= .
obs.: o clculo da mdia pode ser frequentemente simplificado se observarmos que, para
quaisquer contantes a e b
, b ax y
i i
+ = i =1, n.
de modo que a mdia amostral do novo conjunto de dados ser:
b x a
n
b ax
n
b ax
n
y
y
n
i
n
i
i
n
i
i
n
i
i
+ =
+
=
+
= =

= = = = 1 1 1 1
) (
exemplo:
Considere o seguinte conjunto de dados:
284, 280, 277, 282, 279, 285, 281, 283, 278, 277
encontre a mdia desses valores.
soluo:
uma soluo a seguinte: ao invs de adicionar esses valores diretamente, fica mais fcil
se subtrarmos 280 de cada um para obter os novos valores 280 =
i i
x y :
4, 0, -3, 2, -1, 5, 1, 3, -2, -3.
A mdia dos valores transformados ser:
. 6 , 0 10 / 6 = = y
Desse modo,
INF 162 Prof. Luiz Alexandre Peternelli
19
. 6 , 280 280= + = y x
Algumas vezes queremos determinar a mdia de um conjunto de dados
organizados em uma tabela de distribuio de frequncias onde os k valores distintos de X
(x
1
, x
2
, , x
k
) ocorrem nas respectivas frequncias f
1
, f
2
, , f
k
. Nesse caso a mdia
aritmtica ser dada por:
n
x f
x
k
i
i i
=
=
1
, onde

=
=
k
i
i
f n
1
Escrevendo a frmula anterior como
k
k
x
n
f
x
n
f
x
n
f
x + + + = !
2
2
1
1
pode ser observado que a mdia amostral corresponde mdia ponderada dos valores
distintos de X na amostra, onde o peso dado a cada valor x
i
nesse caso corresponde
proporo dos n valores iguais a x
i
, com i = 1 a k.
exemplo:
a seguinte distribuio de frequncia d as idades de jovens em determinada lanchonete a
determinada hora.
Idade Frequncia
15 2
16 5
17 11
18 9
19 14
20 13
encontre a mdia aritmtica da idade dos indivduos acima.
soluo:
= x (2.15 +5.16 +11.17 +9.18 +14.19 +13.20)/54 18,24.
OBS.: se a tabela for organizada em classes de valores da varivel, para o clculo da
mdia devemos substituir cada classe pelo seu ponto mdio (mdia aritmtica do
limite superior e inferior da classe em questo) e calcular a mdia conforme
discutido acima.
! Mediana amostral
Outra estatstica usada para indicar o centro de um conjunto de dados a mediana
amostral, que pode ser definida, de maneira simplificada, como o valor intermedirio do
conjunto de dados, cujos n valores so dispostos em ordem crescente.
Se n for mpar, a mediana ser o valor que ocupa a posio (n +1)/2; se n for par,
a mediana ser a mdia aritmtica dos valores ocupando as posies n/2 e n/2 +1.
exemplo:
encontre a mediana para os dados apresentados acima.
INF 162 Prof. Luiz Alexandre Peternelli
20
soluo:
j que temos 54 observaes, segue que a mediana amostral ser a media dos valores
ocupando as posies 27 e 28, quando essas 54 observaes so organizadas em ordem
crescente. Portanto a mediana ser o valor 18,5.
OBS.: a escolha entre media e mediana depende do tipo de informao o pesquisador
tenta obter dos dados. A media afetada por valores extremos ocorrendo na
distribuio, enquanto a mediana faz uso de apenas um ou dois valores centrais,
no sendo, portanto, afetada por valores extremos.
! Moda amostral
Outra estatstica que tem sido usada para indicar a tendncia central de um
conjunto de observaes a moda amostral. Ela definida como o valor que ocorre com
maior frequncia. Podemos ter sries unimodais, bimodais ou multimodais, dependendo
do nmero de valores modais ocorrendo na amostra.
exemplo:
encontre a moda para o mesmo exemplo acima.
soluo:
a moda ser o valor 19, pois esse valor ocorre com maior frequncia na distribuio. Essa
uma distribuio unimodal.
Medidas de Disperso
Essas medidas so teis para complementar as informaes fornecidas pelas
medidas de posio. Descrevem a variabilidade ocorrendo no conjunto de dados sendo
analisados.
! Varincia amostral
A varincia amostral de um conjunto de dados, x
1
, x
2
, , x
n
, definida por
1
) (
1
2
2

=
n
x x
s
n
i
i
=
1 n
SQD
x
,
onde SQD
x
corresponde soma de quadrados dos desvios de X.
exemplo:
encontre a varincia amostral para os dois conjuntos de dados abaixo:
A: 3, 4, 6, 7, 10 B: -20, 5, 15, 24
soluo:
a mdia para o conjunto A 6; portanto a varincia ser:
s
2
=[(-3)
2
+(-2)
2
+(0)
2
+1
2
+4
2
]/4 =7,5
a mdia para o conjunto B tambm 6; portanto a varincia de B ser:
s
2
=[(-26)
2
+(-1)
2
+9
2
+(18)
2
]/3 360,67
INF 162 Prof. Luiz Alexandre Peternelli
21
Portanto, apesar dos dois conjuntos terem a mesma mdia, h maior variabilidade
nos valores do conjunto B do que nos do conjunto A.
Para o clculo da varincia til se faz a seguinte identidade algbrica:
n
x
x x n x ) x x (
2
n
1 i
i
n
1 i
2
i
2
n
1 i
2
i
n
1 i
2
i

= =


=
= = =
Tambm, o clculo da varincia pode ser simplificado por notar que se:
b ax y
i i
+ = , i =1, , n
ento, como visto atrs, b x a y + = e, ento

= =
=
n
i
i
n
i
i
x x a y y
1
2 2
1
2
) ( ) (
ou seja, adicionando uma constante a cada valor do conjunto de dados no altera a
varincia amostral; enquanto multiplicando-se cada valor por uma constante, a nova
varincia amostral ser igual a varincia original multiplicada pelo quadrado da
constante.
exemplo:
O conjunto de dados abaixo fornece o nmero mundial de acidentes areos fatais
de aeronaves comerciais nos anos de 1985 a 1993.
Ano 1985 1986 1987 1988 1989 1990 1991 1992 1993
Acidentes 22 22 26 28 27 25 30 29 24
encontre a varincia amostral do nmero de acidentes nesses anos.
soluo:
considere o seguinte conjunto de dados resultante da subtrao de 22 de cada
valor original:
0, 0, 4, 6, 5, 3, 8, 7, 2
chamando esses valores de y
1
, y
2
, , y
9
, teremos
, 35
9
1
=

= i
i
y 203
9
1
2
=

= i
y .
Portanto, j que a varincia dos dados transformados corresponde exatamente varincia
dos dados originais, usando-se a identidade algbrica acima teremos:
361 , 8
8
) 9 / 35 ( 9 203
2
2

= s
OBS.: se a cada valor de X tivermos associado sua frequncia de ocorrncia, ento
1
) (
2
2

i
i
i
i i
f
x x f
s =
1
) (
2
2

i
i
i
i
i
i i
i i
f
f
x f
x f
INF 162 Prof. Luiz Alexandre Peternelli
22
! Desvio padro amostral
A raiz quadrada positiva da varincia amostral chamada de desvio padro
amostral, ou seja,
1
) (
11
2
2

= =

=
n
x x
s s
n
i
i
Existem outras medidas tambm teis para representar a disperso dos dados.
Poderamos citar: Amplitude Total, Erro padro da mdia, Coeficiente de variao.
! Amplitude total
A amplitude total a diferena entre o maior e o menor valor da srie. Tem a
vantagem de ser rpido e fcil de ser calculada, porm fornece um nmero ndice
grosseiro da variabilidade de uma distribuio, por levar em conta apenas 2 valores de
um conjunto.
! Erro-padro da mdia
O erro-padro da mdia mede a preciso da mdia. Sua frmula dada por:
n
s
n
s
) X ( V ) X ( s
X
2
X
= = =
! Coeficiente de Variao
O coeficiente de variao uma medida de disperso relativa. uma medida til
para comparao, em termos relativos, do grau de concentrao, em torno da mdia, de
sries distintas. Por ser um nmero admensional permite a comparao de sries de
variveis com unidades diferentes. Sua frmula dada por:
C.V. (%) = 100
X
s
) X (

OBS.: se existem duas amostras distintas A e B, e se desejamos saber qual delas a mais
homognea, ou seja, de menor variabilidade, basta fazermos o seguinte: calculamos as
mdias e os desvios padres de A e B, e:
- se
B A
X X = , ento o prprio desvio padro informar qual a mais homognea.
- se
B A
X X , ento a mais homognea ser a que tiver menor C.V.
OBS.: valores muito altos de C.V. indicam pequena representatividade da mdia.
exemplo:
Supor duas amostras:
A={1, 3, 5}
B={53, 55, 57}
Qual das duas a mais homognea?
soluo:
C.V.
A
=2/3(100) =66,7%
C.V.
B
=2/55(100) =3,6%
INF 162 Prof. Luiz Alexandre Peternelli
23
Portanto a amostra B a mais homognea.
Exerccios Propostos
1) Considerando os dados amostrais abaixo, calcular: mdia aritmtica, varincia, desvio
padro, erro padro da mdia e coeficiente de variao
Dados: 2, 3, 5, 1, 2, 1, 4, 3, 3, 4, 3.
R.:2,81; 1,56; 1,24; 0,37; 44,12%
2) Em certa regio a temperatura mdia 20
0
C e a precipitao mdia 700 mm. O
desvio padro para temperatura 3
0
C, enquanto que a varincia para a precipitao
1225 mm
2
. Qual dos dois fenmenos apresenta maior variabilidade? J ustifique.
R.: a temperatura apresenta maior variabilidade relativa. Voc justifica
3) Um artigo retirado da revista Technometrics (Vol. 19, 1977, p. 425) apresenta os
seguintes dados sobre a taxa de octanagem de vrias misturas de gasolina:
88,5 87,7 83,4 86,7 87,5 91,5 88,6 100,3 96,5 93,3 94,7
91,1 91,0 94,2 87,8 89,9 88,3 87,6 84,3 86,7 84,3 86,7
88,2 90,8 88,3 98,8 94,2 92,7 93,2 91,0 90,1 93,4 88,5
90,1 89,2 88,3 85,3 87,9 88,6 90,9 89,0 96,1 93,3 91,8
92,3 90,4 90,1 93,0 88,7 89,9 89,8 89,6 87,4 88,4 88,9
91,2 89,3 94,4 92,7 91,8 91,6 90,4 91,1 92,6 89,8 90,6
91,1 90,4 89,3 89,7 90,3 91,6 90,5 93,7 92,7 92,2 92,2
91,2 91,0 92,2 90,0 90,7
(a) Construa o diagrama de folhas-e-ramos para esses dados
(b) Construa a distribuio de frequncia e o histograma. Use 8 intervalos de classe.
(c) Construa a distribuio de frequncia e o histograma, agora com 16 intervalos de
classe.
(d) Compare a forma dos dois histogramas em b e c. Ambos os histogramas mostram
informaes similares?
4) O seguinte conjunto de dados representa as vidas de 40 baterias de carro da mesma
marca e mesmas caractersticas com aproximao at dcimos do ano. As baterias
tinham garantia para 3 anos.
2,2 4,1 3,5 4,5 3,2 3,7 3,0 2,6 3,4 1,6 3,1
3,3 3,8 3,1 4,7 3,7 2,5 4,3 3,4 3,6 2,9 3,3
3,9 3,1 3,3 3,1 3,7 4,4 3,2 4,1 1,9 3,4 4,7
3,8 3,2 2,6 3,9 3,0 4,2 3,5
(a) Construa a distribuio de frequncia e o histograma;
(b) Faa o grfico da distribuio de frequncias relativas acumuladas.
(c) Calcule a mdia aritmtica dos dados originais
INF 162 Prof. Luiz Alexandre Peternelli
24
(d) Usando a distribuio de frequncia conforme obtido em a calcule a mdia
novamente. Para tal, considere os pontos mdios de cada classe (mdia entre os
dois limites de cada classe) para serem os valores da varivel no clculo da mdia.
(e) Obtenha a varincia para os dados originais conforme feito para a mdia em c.
(f) Obtenha a varincia a partir da distribuio de frequncia conforme feito para a
mdia no tem d.
obs.: use 7 intervalos de classe. Amplitude da classe igual a 0,5. E o incio do
intervalo mais baixo em 1,5.
5) Mostre que
2
) (


i
i i
x x f =


i
i
i
i i
i i
f
x f
x f
2
2
) (
6) Mostre que a soma de quadrados dos desvios (SQD) em relao mdia um
mnimo. Dica: Considere f(a) a funo que representa a SQD em relao a a. Ou
seja,

=
=
n
i
i
a x a f
1
2
) ( ) ( . Usando seus conhecimentos de clculo, mostre que f(a)
ser mnimo quando a for igual a mdia dos valores de X.
7) Calcule a mdia, mediana, e amplitude total dos valores dispostos no seguinte
diagrama de ramos e folhas
6 0 5 5 8 9
7 2 4 4 5 7 8
8 2 3 3 5 7 8 9
9 0 0 1 4 4 5 7
10 0 2 7 8
11 0 2 4 5
12 2 4 5
INF 162 Prof. Luiz Alexandre Peternelli
25
UNIVERSIDADE FEDERAL DE VIOSA
--Departamento de Informtica / CCE
INF 161 - Iniciao Estatstica / INF 162 Estatstica I
Lista de Exerccios: Estatstica Descritiva
1) Os dados abaixo se referem a medidas tomadas em uma amostra de 10 ces:
Co 1 2 3 4 5 6 7 8 9 10
Peso (kg) 23,0 22,7 21,2 21,5 17,0 28,4 19,0 14,5 19,0 19,5
Comprimento (cm) 104 105 103 105 100 104 100 91 102 99
Pede-se, para as caractersticas avaliadas, peso e comprimento, as estatsticas:
a) Mdia;
b) Varincia;
c) Desvio-padro;
d) Erro-padro da mdia;
e) Coeficiente de variao;
f) Qual das duas caractersticas a mais homognea;
g) Mediana;
h) Moda.
2) Um pesquisador dispe das seguintes informaes, a respeito dos valores de uma
amostra:
- a mdia de todos os valores igual a 50,34;
- a soma dos quadrados dos valores igual a 150.000;
- a amostra constituda de 52 valores distintos.
Pergunta-se:
Com essas informaes possvel obter alguma(s) medida(s) de disperso dos
valores amostrais? Em caso afirmativo, efetue os clculos e obtenha a(s) respectiva(s)
medida(s).
3) Considere os dados: 12, 17, 17, 17, 10, 10, 9, 9, 9, 12, 12, 6, 6, 6, 17, 17, 12, 12, 9, 9,
9, 12, 12, 12, 12. Supondo que sejam valores assumidos por uma varivel aleatria
discreta X, pede-se:
a) Mdia, mediana e moda;
b) Erro-padro da mdia e C.V.(%).
INF 162 Prof. Luiz Alexandre Peternelli
26
4) Duas turmas A e B com n
A
= 50 e n
B
= 80 apresentaram mdias X
A
= 65 e X
B
= 70
e varincias s
A
2
225 = e s
B
2
235 = . Qual a turma mais homognea?
5) A mdia de aprovao na disciplina de Estatstica 6 ou mais. Durante um perodo
letivo foram realizadas quatro provas, sendo que a primeira prova teve peso dois, a
segunda e a terceira o dobro do peso da primeira e a ltima igual ao peso da primeira.
Os resultados, incluindo os de uma prova de substituio optativa, foram os seguintes:
Estudantes 1
a
2
a
3
a
4
a
Optativa
1 2,5 4,5 5,0 6,0 7,0
2 2,0 8,5 7,0 3,0 5,0
3 8,5 10,0 9,0 8,5 nc
4 3,5 5,5 8,5 7,5 6,5
5 3,0 5,0 6,0 4,5 5,0
6 6,0 3,0 4,0 5,0 2,0
7 8,0 1,5 2,0 9,0 5,0
8 1,5 2,0 1,0 2,5 nc
9 7,5 8,0 8,5 10,0 nc
10 5,5 4,5 5,0 4,5 2,5
Sabendo-se que a nota da prova optativa substitui a menor nota das provas
precedentes, determine:
a) Mdia de cada estudante;
b) Para cada prova: mdia, moda, mediana, varincia, desvio-padro, erro-padro da
mdia e CV.
c) Para o perodo: mdia, varincia, desvio-padro, erro-padro da mdia, CV.
d) Liste as provas em ordem crescente de homogeneidade.
INF 162 Prof. Luiz Alexandre Peternelli
27
RESPOSTAS
( ) ( )
( ) ( )
( ) ( )
cm e cm cm Mo kg Mo h
cm Md kg Md g
CV CV e
cm Y s kg X s d
cm Y s kg X s c
cm Y V kg X V b
cm Y kg X a
Y X
Y X
Y X
105 104 , 100 ; 0 , 19 )
50 , 102 ; 35 , 20 )
CV. menor possui que a pois o, Compriment f)
% 16 , 4 ; % 37 , 18 )
3338 , 1 ; 1957 , 1 )
2177 , 4 ; 7812 , 3 )
7889 , 17

; 2973 , 14

)
3 , 101 ; 58 , 20 ) . 1
2 2
= =
= =
= =
= =
= =
= =
= =
2. s
2
=357,3723; s =18,9043; CV =37,55%; 2,6215 = ) X s(
3. a) X =11,4; Md =12; Mo =12 b) ( ) 6904 , 0 = X s ; CV =30,28%
4. Turma B
5. a)
Estudante 1 2 3 4 5 6 7 8 9 10
Mdia 5,33 6,50 9,17 7,00 5,25 3,83 5,17 1,67 8,42 4,50
b)
Arguio
1
a
2
a
3
a
4
a
X
6,05 5,50 5,60 5,85
Mo 5 2; 4,5; 5 5; 8,5 2,5
Md 6,25 5,0 5,5 5,5
s
2
4,02 6,94 7,54 7,78
s 2,01 2,64 2,75 2,79
s( X )
0,63 0,83 0,87 0,88
CV(%) 33,16% 47,91% 49,05% 47,68%
( )
c X s s s X CV ) , ; , ; ; , ; , = = = = = 56833 62098 4919 02275 4385%
2
d) 3
a
, 2
a
, 4
a
, 1
a