Vous êtes sur la page 1sur 38

COORDENADORIA DE MATEMTICA

ESTATSTICA DESCRITIVA







Oscar Luiz Teixeira de Rezende










Vitria - ES

Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 2 -
1-INTRODUO


Pesquisas arqueolgicas indicam que h 3000 anos A.C. j se faziam censos
na Babilnia, China e Egito. O 4 livro do Velho Testamento faz referncia a uma
instruo dada a Moiss para que fizesse um levantamento dos homens de Israel
que estivessem aptos para guerrear. Outro registro bblico informa que o Imperador
Csar Augusto ordenou que se fizesse o Censo de todo o Imprio Romano para
serem utilizados na taxao de impostos e alistamento militar.
A prtica de coletar dados sobre agricultura, composio da populao
humana ou de animais, impostos, etc., era conhecida pelos egpcios, hebreus,
caldeus e gregos. No entanto, apenas no sculo XVII, a estatstica passou a ser
considerada autnoma, tendo como objetivo bsico a descrio dos bens do
Estado.
As palavras censo e estatstica, que so comumente usadas no trato das
analises de dados estatsticos, tem origem no latim. Censo, que derivado da
palavra censere, que significa taxar, e estatstica, derivada de status, que
significa estado.
Um fato histrico relevante no uso da estatstica foi atribudo a Florence
Nightingale (1820-1910), conhecida como a criadora da profisso de enfermeiro.
Ela salvou milhares de vidas utilizando a Estatstica. Ao encontrar um hospital em
ms condies sanitrias e sem suprimentos, tratou de melhorar estas condies e
passou a utilizar a estatstica para convencer as autoridades da necessidade de
uma reforma mdica mais ampla. Ela elaborou grficos para mostrar que durante a
guerra da Crimia, morreram mais soldados em consequncia das ms condies
sanitrias do que em combate. Florence Nightingale considerada uma das
pioneiras na Estatstica Social e nas tcnicas de utilizao de grficos estatsticos.
No Brasil, s se pode falar, realmente, sobre estatstica a partir do imprio,
quando foi realizado o primeiro censo, em 1872, e, mais precisamente, com a
fundao do IBGE em 1936, em que os levantamentos estatsticos ganharam
regularidade e mais apoio do estado.
Desde a segunda metade do sculo XX a Estatstica vem se consolidando
como um poderoso instrumento da pesquisa cientifica, sendo o seu ensino
incorporado a diversos cursos superiores de graduao e ps-graduao.
No final dos anos 90, os Parmetros Curriculares Nacionais (PCNs) de
Matemtica incorporaram nos currculos do ensino fundamental e mdio a
Estatstica, o que promoveu uma inflexo no ensino da disciplina. Vrios
Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 3 -
pesquisadores em Educao Matemtica se interessaram pelo ensino de Estatstica,
impulsionando a criao de grupos de pesquisa em Educao Estatstica, com a
preocupao de relacionar os contedos da disciplina ao cotidiano dos alunos.
Atualmente, a Estatstica est presente em vrios aspectos do nosso dia a dia.
Nas pesquisas que medem a popularidade dos polticos, na apurao de resultados
dos censos do IBGE, na medio da audincia de um programa de televiso, na
anlise dos indicadores sociais e econmicos do nosso pas.
Nos estudos acadmicos ela tem importncia capital, ao validar as pesquisas
nas diversas reas do conhecimento, o que torna o seu estudo multidisciplinar: a
mesma anlise estatstica de dados de um fsico poderia tambm ser usada por um
economista, agrnomo, qumico, gelogo, matemtico, bilogo, socilogo, psiclogo
e cientista poltico. Mesmo que as interpretaes dessas anlises no sejam as
mesmas devido s diferenas entre as reas do conhecimento, os conceitos
empregados, as limitaes das tcnicas e as consequncias dessas interpretaes
so essencialmente as mesmas.


Os ramos e os dados da estatstica

De forma geral o estudo da Estatstica se divide em trs ramos: 1) a
Estatstica Descritiva, que incluem tcnicas que dizem respeito sntese e a
descrio de dados; 2) a Probabilidade, que incluem tcnicas que analisam
situaes que envolvem o acaso e ; 3) a Inferncia, que incluem tcnicas que
dizem respeito a analise e a interpretao de dados amostrais.
Sempre que se fala em Estatstica est associada a ela a palavra dados, que
pode se entendido como as informaes levantadas (coletadas) que serviro como
base para as analises estatsticas. Assim, se for investigado a estatura dos alunos
de uma determinada escola, o dado da pesquisa a estatura do aluno. Esses dados
podem, tambm, serem compreendidos como as variveis estatsticas em estudo.
Os dados (variveis) estatsticos podem ser divididos em dois grupos: a)
Qualitativos, que se distinguem por caractersticas no numricas, tais com sexo,
cor dos olhos, marca de um determinado produto, etc. e; b) Quantitativos que
consistem de nmeros que representam contagens ou medidas.
Os dados quantitativos podem ser divididos em dois grupos: os discretos,
que resultam de um conjunto finito de valores, ou um conjunto enumervel destes
valores, e os contnuos que resultam de um nmero infinito de valores possveis,
que podem ser associados a pontos em uma escala continua, de tal maneira que
Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 4 -
no haja lacunas ou interrupes. Para facilitar o entendimento destes dois grupos
de dados e s levar em considerao que os dados que representam contagem so
discretos, e os que representam medida so contnuos. Assim, o nmero de alunos
de uma determinada faculdade constituem dados discretos j o peso destes alunos
constituem dados contnuos.

Delimitao da pesquisa

Aps decidir o que estudar necessrio delimitar, a populao estatstica
ou universa estatstica, denominao que se da a todos os entes portadores de
pelo menos uma caracterstica comum. Por exemplo, os estudantes constituem
uma populao, pois apresentam pelo menos uma caracterstica comum: so todos
que estudam.
Em qualquer estudo estatstico esta caracterstica deve estar perfeitamente
definida. Isso se d quando, considerado um elemento qualquer, podemos afirmar,
sem ambiguidade, se esse elemento pertence ou no populao. necessrio,
portanto, existir um critrio de constituio da populao, vlido para qualquer
dado, no tempo ou no espao.
Na maioria das vezes, por impossibilidade ou inviabilidade econmica ou
temporal, limitamos as observaes referentes a uma determinada pesquisa apenas
a uma parte da populao. A essa parte, proveniente da populao em estudo,
denominamos amostra. Assim, uma amostra um subconjunto finito de uma
populao.
Vimos anteriormente que a estatstica inferencial tem por objetivo tirar
concluses sobre as populaes, com base em resultados verificados em amostras
retiradas dessa populao. Mas, para que as inferncias sejam capazes de refletir
os dados da populao, necessrio garantir que a amostra seja representativa
da populao, ou seja, ela deve possuir as mesmas caractersticas bsicas da
populao no que diz respeito ao fenmeno que desejamos pesquisar. preciso,
pois, que a amostra ou as amostras, que sero utilizadas como inferncia a
respeito de uma determinada populao, sejam obtidas por processos adequados.
Na coleta de uma amostra, o pesquisador deve se atentar para as tcnicas de
amostragem que garantam, o quanto possvel, o acaso na escolha. Desta forma,
cada elemento da populao tem a mesma chance de ser escolhido, o que garante
a amostra o carter de representatividade.
A seguir vamos abordar os principais tipos de amostragens.

Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 5 -

Tipos de amostragem

No item anterior definimos o que uma populao e uma amostra. A Figura 1
ilustra esses conceitos.



Figura 1- Ilustrao do conceito de populao e amostra

As setas que aparecem na Figura 1 mostram os dois sentidos da relao entre
populao e amostra. Da esquerda para a direita, ou seja, da populao para a
amostra, caracterizamos a amostragem, que a tcnica utilizada na construo
da amostra a partir da populao; e, da direta para a esquerda, da amostra para a
populao, caracterizamos a inferncia, que so as tcnicas que nos permite
concluir estudos sobre uma determinada populao a partir de uma amostra dessa
mesma populao. Nesse texto, no iremos tratar da inferncia, que estar
presente em futuras publicaes.
Antes de apresentaremos os tipos de amostragem mais comuns utilizadas nas
pesquisas, voltamos a falar sobre a importncia da representatividade de uma
amostra. Para ilustrar essa ideia vamos utilizar um exemplo bem simples: imagine
uma cozinheira que est temperando, com sal, o feijo para o almoo. Se ela
deseja observar a quantidade de sal no alimento no necessita ingerir todo o feijo
da panela, basta que prove uma pequena quantidade, no verdade? Se voc
respondeu afirmativamente a pergunta no foi cuidadoso em observar se aquela
amostra (a pequena quantidade de alimento provado pela cozinheira) , ou no,
representativa da populao. A cozinheira poderia ter colocado o sal de um lado da
panela e esquecido de mexer o feijo. Se por acaso a prova fosse retirada do outro
lado da panela, a concluso poderia ser que o feijo est sem sal.
Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 6 -
Observamos, nesse caso, que a amostragem foi ineficiente, causando
problemas na inferncia (observar se a quantidade de sal estava boa), pois a
cozinheira no se preocupou com a representatividade daquela amostra.
importante numa pesquisa que faz uso da amostra como fonte de
informao de uma populao, que as tcnicas de amostragem sejam utilizadas, de
modo a produzir uma amostra que seja um modelo (em escala menor) fiel da
populao.
Muitas vezes observamos pesquisadores mais preocupados com o tamanho da
amostra do que com a sua representatividade, esse equivoco pode comprometer os
resultados de uma pesquisa.
Os tipos mais comuns de amostragem so:

Amostragem casual ou aleatria simples

Este tipo de amostragem equivalente a um sorteio lotrico. Na prtica, a
amostragem casual ou aleatria simples pode ser realizada numerando-se a
populao de um at n e sorteando-se, a seguir, por meio de um dispositivo
aleatrio qualquer k nmeros dessa sequncia, os quais correspondero aos
elementos pertencentes amostra.

Amostragem proporcional estratificada

Muitas vezes a populao se divide em subpopulaes estratos. Como
provvel que a varivel em estudo apresente, de estrato em estrato, um
comportamento heterogneo e, dentro de cada estrato, um comportamento
homogneo, convm que o sorteio de elementos da amostra leve em considerao
tais estratos.
Assim quando empregamos a amostragem proporcional estratificada,
consideramos a existncia dos estratos obtemos os elementos da amostra
proporcional ao nmero de elementos dos mesmos.
Exemplo:
Suponha que noventa alunos de uma turma, 54 sejam meninos e 36 sejam
meninas. E desejamos estudar a varivel estatura. Como a estatura diferenciada
para cada sexo vamos ento obter uma amostra proporcional estratificada.
Colhendo uma amostra de 10% da populao temos:



Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 7 -
Sexo Populao 10% amostra
M 54 4 , 5
100
54 10
=
x
5
F 36 6 , 3
100
36 10
=
x
4
Total 90 0 , 9
100
90 10
=
x
9

Tomando as informaes da tabela acima, sorteiam-se aleatoriamente 5
alunos do sexo masculino e 4 alunos do sexo feminino, formando assim uma
amostra proporcional estratificada de 10% da populao.

Amostra sistemtica

Quando os elementos da populao j se acham ordenados, no h
necessidade de construir o sistema de referncia. So exemplos os pronturios
mdicos de um hospital, os prdios de uma rua, as linhas de produo etc. Nestes
casos, a seleo dos elementos que constituiro a amostra pode ser feita por um
sistema imposto pelo pesquisador. A esse tipo de amostragem denominamos
sistemtica.
Exemplo:
Suponhamos uma rua contendo novecentos prdios, dos quais desejamos
obter uma amostra formada de cinqenta prdios. Podemos, neste caso, usar o
seguinte procedimento: como 18
50
900
= , escolhemos por sorteio casual um nmero
de 1 a 18 (inclusive), o qual indicaria o primeiro elemento sorteado para a amostra;
os demais elementos seriam periodicamente considerados de 18 em 18. Assim, se
o nmero sorteado fosse o 4, tomaramos, pelo lado direito da rua, o 4
0
prdio, o
22
0
, o 40
0
etc., at voltarmos ao incio da rua pelo lado esquerdo.







Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 8 -
2 ORGANIZANDO DADOS DE UMA PESQUISA

No captulo anterior, abordamos os conceitos de populao e amostra e
algumas tcnicas de como coletar uma amostra. Neste captulo, a nossa
preocupao se volta para a organizao dos dados coletados.
Aps definirmos se os dados de uma determinada pesquisa sero coletados a
partir de uma populao ou de uma amostra, iniciamos a etapa de coleta dos
dados. Nesta etapa, dependendo das variveis em estudo, podemos empregar dois
mtodos: utilizando instrumentos de medida, tais como, balana, estadimetro
(instrumento que mede altura), termopar, etc.; ou, utilizando os instrumentos
elaborados pelo pesquisador, como questionrios, entrevistas e outros.
De posse dos dados, iniciamos a etapa de organizao. A primeira delas a
ordenao. Para exemplificar, consideremos as notas de estatstica ( de 0 a 10,0)
de 10 alunos de uma turma, com o seguinte arranjo:

7,5 6,0 3,5 8,2 5,0 4,3 7,5 3,5 5,0 9,5

Observe que da forma como os dados esto dispostos, a primeira vista
difcil extrair concluses a respeito deles. No entanto, se forem organizados em
ordem crescente, se torna mais fcil observarmos algumas informaes.

3,5 3,5 4,3 5,0 5,0 6,0 7,5 7,5 8,2 9,5

possvel ver que 5 notas, ou seja 50% das notas, so menores ou igual 5,0,
que a maior nota da turma foi 9,5 e outras informaes poderiam se extradas dos
dados. O exemplo nos d uma pequena medida da importncia de organizar dados
em uma pesquisa.
A organizao dos dados uma das tcnicas mais importantes da Estatstica,
ela contribui para a compreenso, interpretao e apresentao das variveis em
estudo.
As formas mais prprias para a organizao dos dados so as Tabelas e os
Grficos.




Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 9 -
TABELAS

So formas de sintetizar os dados, para que se tenha uma viso global das
variveis envolvidas na pesquisa.
As tabelas devem ser inseridas o mais prximo possvel do trecho a que se
referem, e, padronizadas conforme as normas do Instituto Brasileiro de Geografia
e Estatstica (IBGE).
Na Figura 2 apresentamos um modelo de Tabela e os seus elementos bsicos.


Figura 2 Modelo de Tabela e os seus elementos bsicos

De acordo com a Resoluo 886 do IBGE, em algumas situaes especiais as
clulas devem ser preenchidas atendendo as seguintes normas:

- Um trao horizontal ( ) quando o valor zero, no s quanto a natureza
das coisas, como quanto ao resultado do inqurito;
- Trs pontos (.) quando no temos dados;
- Um ponto de interrogao (?) quando temos dvida quanto exatido de
determinado valor;
- Zero ( 0 ) quando o valor muito pequeno para ser expresso pela unidade
utilizada. Se os valores so expressos em numerais decimais, precisamos
acrescentar parte decimal um nmero correspondente de zeros ( 0,0;
0,00; 0,000; ...).





Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 10 -
Para ilustrar, apresentamos, a seguir, alguns exemplos mais comuns de
tabela:

Tabelas de dupla entrada



Distribuio de frequncia




A tabela de distribuio de frequncia tem um interesse especial no estudo da
Estatstica, alm de organizar os dados da pesquisa ela utilizada para os clculos
de diversas medidas estatsticas, servindo de referncia para alguns grficos.
H duas formas de construir uma de tabela de frequncia. A seguir
apresentamos algumas orientaes bsicas para a sua construo:




Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 11 -
a) Quando os dados so contnuos

1) Determinar o intervalo dos dados
2) Determinar o nmero K de classes, s observae de nmero k ~ ,em geral,
tomar o valor de k entre 5 e 15.
3) Calcular a amplitude de classe dividindo o intervalo por k (intervalo/k),
fazendo o arredondamento conveniente.
4) Certificar-se de que k vezes a amplitude maior do que o intervalo, para
evitar que valores extremos sejam excludos.
5) Estabelecer limites de classe, rever os limites, que devem tocar-se, mas
no se interceptar.
6) Distribuir os dados, determinando com que frequncia, eles aparecem
dentro de cada classe.
7) Rever a distribuio de forma a evitar que uma determinada classe tenha
frequncia zero.

Exemplo:

Os dados a seguir, previamente ordenados, correspondem a estatura, em
cm, de 40 alunos de uma determinada escola:

150 154 155 157 160 161 162 164 166 169
151 155 156 158 160 161 162 164 167 170
152 155 156 158 160 161 163 164 168 172
153 155 156 160 160 161 163 165 168 173

Construindo uma tabela de distribuio de frequncias para estes dados
temos:

1) Determinar o intervalo de dados, amplitude total:
AT=173 150 = 23
2) Determinar o nmero de classe
k = 40 , considere o valor de k= 6, pois o inteiro mais prximo.

3) Determinar a amplitude de classe

Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 12 -
6
23
= =
k
AT
h , considere h = 4 que o inteiro mais prximo

4) Verificar se todos os dados esto includos

AT h k > . , ou seja: 23 4 . 6 > ,

Construir a tabela





importante ressaltar que a sequncia apresentada anteriormente para a
construo da tabela, no nica. O pesquisador pode construir a tabela com outra
destruio, pois no existe uma regra fechada para essa construo. Outros
intervalos de classe poderiam ter sido utilizados, o nmero de classe poderia ter
sido diferente, o que conduziria a outra distribuio de frequncia. No entanto,
devemos levar em considerao que no se deve construir a tabela com um
nmero muito grande de classes o aconselhvel que tenhamos no mximo oito
classe pois dificulta a interpretao dos dados e no traz maior exatido nos
clculos estatsticos feitos a partir da tabela.




Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 13 -
b) Quando os dados so discretos

Quando os dados so discretos e no apresentam um nmero muito grande
de diferentes valores (no mximo 8) da varivel em estudo, a tabela de frequncia
deve ser construda considerando o valor da varivel e no o intervalo de dados.


Exemplo:

Vamos considerar os dados correspondentes idade (em anos) de 20 alunos
de uma turma do ensino mdio.

14 15 18 17 18 17 16 15 18 17
17 14 15 18 17 18 16 16 15 16

Nesse exemplo a varivel idade assume cinco valores diferentes. A tabela ser
construda, ento, com essas idades.




Observe que na tabela de frequncia em que os dados esto distribudos em
intervalo de dados, h perda dos seus valores originais. Mas, isso no prejudica a
analise desses dados. Est aqui uma das belezas da Estatstica, mesmo sem
conhecer a exatido matemtica dos dados, ela permite a sua interpretao.



Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 14 -
GRFICO

uma forma de apresentao de dados cujo objetivo o de produzir, no
investigador ou no publico em geral, uma impresso mais rpida e viva do
fenmeno em estudo, j que os grficos falam mais rpido compreenso que as
sries.

A seguir apresentaremos alguns exemplos de grficos:

Grfico de linhas


Fonte: Folha de So Paulo

Grfico de colunas


Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 15 -
Grfico de barras mltiplas



Grfico de setores







Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 16 -
Grfico polar
















Pictograma






PRECIPITAO
PLUVIOMTRICA(mm) EM
RECIFE -1993
20
70
120
170
220
270
320
janeiro
fevereiro
maro
abril
maio
junho
julho
agosto
setembro
outubro
novembro
dezembro
Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 17 -
Histograma, polgono e curva de frequncia.

Estes trs tipos de grficos so importantes na apresentao dos dados
estatsticos quando esto distribudos em classe.
Para exemplificar a construo dos trs tipos de grficos vamos considerar os
dados correspondentes a estatura dos 40 alunos de um determinada escola
apresentados anteriormente.

a) Histograma
O histograma um grfico de colunas que retrata a distribuio de
frequncia. Ele relaciona as classes com a frequncia.

Construindo o histograma temos:




Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 18 -

b) Polgono de frequncia

um grfico de linhas que relaciona o ponto mdio classe - a mdia aritmtica dos
limites superior e inferior de cada classe- com a frequncia. Acrescentando na
tabela de frequncia a coluna correspondente ao ponto mdio de classe temos:


Para melhor entendimento do polgono de frequncia vamos constru-lo tendo
como base o histograma.



c) Curva de frequncia

A curva de frequncia uma curva suavizada do polgono de frequncia. Para
eliminar os bicos do polgono de frequncia fazemos o clculo de uma outra
Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 19 -
frequncia chamada frequncia calculada, que considera a influncia das classes
vizinhas por meio de uma mdia ponderada:
4
2
post i ant
i
f f f
fc
+ +
=

A curva de frequncia relaciona o ponto mdio de classe coma a frequncia
calculada. Acrescentado na tabela de frequncia a coluna da frequncia calculada
temos:

Para um melhor entendimento a respeito da curva de frequncia vamos traa-
la no grfico junto com o polgono de frequncia.



Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 20 -
Uma observao importante a respeito do polgono de frequncia e da curva
de frequncia que o primeiro retrata a situao real dos dados em estudos,
enquanto a segunda retrata a tendncias desses dados. No exemplo, a curva de
frequncia mostra que h tendncia de concentrao da estatura dos alunos nas
proximidades de 160 cm.


3 MEDIDAS ESTATSTICAS

Alm da construo de tabelas e grficos, a anlise exploratria de dados,
consiste tambm de clculos de medidas estatsticas que resumem as informaes
obtidas, dando uma viso global dos dados. Essas medidas tambm conhecidas
como medidas descritivas recebem o nome genrico de estatsticas quando
calculada com os dados da amostra, e de parmetros quando calculadas com dados
populacionais. Dentre as medidas estatsticas as mais utilizadas so as de
tendncia central (ou de posio) e as de disperso ( ou de variabilidade) e
as separatrizes.


3.1 MEDIDAS DE POSIO

As medidas de posio, tambm chamadas de tendncia central, constituem
um procedimento para a reduo de dados estatsticos expressados por valores que
se encontram situados entre os extremos de uma srie ou distribuio.
Normalmente estas medidas tendem a se aproximar do centro da distribuio. As
trs medidas mais comuns so: a mdia, a mediana e a moda.

A MDIA

A mdia a medida estatstica mais popular e, portanto, mais usada na
interpretao de dados. A mdia tem certas propriedades matemticas
interessantes e teis, o que explica a sua maior importncia como medida de
tendncia central. Na figura a seguir ilustramos a mdia, em um histograma, como
o centro de conjunto de dados, no sentido de que o ponto de equilbrio dos
mesmos.
Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 21 -

Os tipos de mdia mais utilizada so: a mdia aritmtica, a mdia
geomtrica e a mdia harmnica. Cada uma com especificidade para
determinado tipo de dado.

Mdia aritmtica

Dos tipos de mdia a aritmtica que no texto ser chamada de mdia a
mais utilizada. A mdia obtida dividindo-se a soma das observaes pelo nmero delas
n
x
N
x x x
X
i
n

=
+ +
=

2 1
, onde x
i
representa o valor da varivel i e n o
nmero de observaes da varivel.

Exemplo: Calcular a mdia dos seguintes dados: 20, 80, 40, 60, 50.

50
5
60 50 40 80 20
=
+ + + +
= X

Uma das variantes da mdia aritmtica a mdia aritmtica ponderada,
que utilizada quando os dados que se deseja determinar a mdia apresentam
importncia diferentes (pesos) dentro do conjunto de dados. A mdia aritmtica
ponderada de n nmeros a soma dos produtos de cada um multiplicados por seus
respectivos pesos, dividida pela soma dos pesos
i
1
1
2 1
2 2 1 1
varivel da peso o onde ; x w
w
x w
w w w
x w x w x w
X
i
n
i
i
n
i
i i
n
n n

=
=
=
+ + +
+ +
=




Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 22 -
Exemplo:
Um professor divide os 100 pontos da avaliao semestral de sua disciplina
usando o seguinte critrio: uma avaliao individual valendo 40 pontos, um
trabalho em grupo valendo 20 pontos, um seminrio valendo 25 pontos e um
trabalho individual valendo 15 pontos. A mdia final de um aluno que recebeu as
seguintes notas: avaliao individual 85, trabalho em grupo 75, seminrio 70 e
trabalho individual 65 igual a:

25 , 76
100
15 65 25 70 20 75 40 85
=
+ + +
= x


Quando os dados esto distribudos em uma tabela de frequncia , calcula-se
a mdia utilizando o conceito da mdia ponderada, considerando o peso de cada
valor a sua frequncia.

=
i
i i
f
x f
X , f
i
frequncia da varivel x
i
.

Exemplo:

Vamos considerar a idade de 20 alunos de uma determinada escola,
distribudos na tabela de frequncia a seguir:



Foi criada uma nova coluna para representar o produto da varivel pela sua
respectiva frequncia. A mdia , ento, calculada dividindo o total dessa nova
coluna pelo total das frequncias.
Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 23 -
35 , 16
20
327
= = X anos

Quando dados esto numa tabela, separados em classe, criam-se duas novas
colunas, uma para representar o ponto mdio de cada classe, que passa a ser o
representado dos valores da varivel dentro daquela classe, e outra para
representar o produto da frequncia pelo ponto mdio de classe.
Vamos considerar o exemplo em que se deseja calculara mdia das estaturas
de 40 alunos de um determinada escola, distribudas na tabela a seguir .


Foram criadas as colunas, x
i
que representa o ponto mdio de cada classe, e
i i
x f produto da frequncia pelo ponto mdio de classe.
A mdia calculada dividindo o total do produto da frequncia pelo ponto
mdio de classe pelo total das frequncias.

cm
f
x f
X
i
i i
161
40
6440
= = =


Mdia Geomtrica

A mdia geomtrica deve ser utilizada quando os dados apresentam uma
variao geomtrica, ela muito utilizada para encontrar taxas mdias de
variao, de crescimento, ou razes mdias.
Para calcular a mdia geomtrica de n valores(todos positivos) de uma srie
de dados, extrai-se a raiz ensima do produto desses dados.

n
n
x x x x MG =
3 2 1


Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 24 -
Exemplo: Determine o fator de crescimento mdio para uma aplicao,
composta taxas anuais de juros de 10%, 8%, 9%, 12% e 7%.

O fator de crescimento para cada ano ser: 1,10; 1,08; 1,09; 1,12 e 1,07
Fator de crescimento mdio= 09 , 1 07 , 1 12 , 1 09 , 1 08 , 1 10 , 1
5
=

Mdia Harmnica

A mdia harmnica costuma ser usada para calcular a mdia de um conjunto
de dados que constituem uma taxa de variao como, por exemplo, velocidades.
Obtm-se a mdia harmnica dividindo-se o nmero n de valores pela soma dos
inversos de todos os valores.

=
i
x
n
MH
1


Exemplo:
Um carro, no trajeto em entre Vitria e Cachoeiro, faz a viagem de ida com
uma velocidade mdia de 60 Km/h e a volta com a velocidade mdia de 80 Km/h.
Determinar a velocidade mdia para a viagem de ida e volta.

h km mdia velocidade / 57 , 68
80
1
60
1
2
=
+
=

Propriedades da mdia

a) A mdia de um conjunto de nmeros pode sempre ser calculada.
b) Para um conjunto de dados a mdia nica.
c) A mdia sensvel a todos os valores do conjunto. Assim, se um valor se
modifica a mdia tambm se modifica.
d) Somando-se uma constante a cada valor de um conjunto de dados, a mdia
ficar aumentada desse valor.
e) A soma dos desvios dos nmeros de um conjunto de dados em relao a mdia
zero, ou seja

= 0 ) ( x x
i
.
Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 25 -
A MEDIANA

A mediana o valor central de um conjunto ordenado de dados, ela divide o
conjunto em dois grupos iguais, 50% dos valores menores ou igual mediana e 50%
dos valores maiores ou iguais mediana.

Processo para calcular a mediana

1) Para dados no agrupados
Inicialmente ordenam-se os dados em ordem crescente ou decrescente

a) Para um nmero impar de valores a mediana o valor:


2
1 +
=
n
x Me , onde n o nmero de dados.
b) Para um nmero par de valores, a mediana a mdia dos valores do
meio.
2
1
2 2
+
+
=
n n
x x
Me , onde n o nmero de dados.

Exemplo: Calcular a mediana do seguinte conjunto de dados: 20 50 40 30 60
65 80 45 90 70

Valores ordenados: 20 30 40 45 50 60 65 70 80 90. Dado que n=10 um
nmero par ao mediana ser:

55
2
60 50
2
1
2 2
=
+
=
+
=
+
n n
x x
Me

2) Quando os dados esto distribudos em classe (agrupados), vamos utilizar um
exemplo correspondente a estatura de 40 alunos de uma determinada escola,
distribudos conforme a tabela a seguir:



Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 26 -


Passos para calcular a mediana:

1) Cria-se uma coluna
i
F chamada frequncia acumula, esta frequncia determina
o posicionamento dos valores dentro da distribuio. Na tabela observamos que
existem 13 estaturas entre 150 cm e 158 cm, 32 estaturas entre 150 cm e 166 cm,
e assim por diante. Uma ressalva importante que na tabela de distribuio de
frequncia os dados j esto ordenados

2) Determina-se a classe em que a mediana est. Na tabela temos
20
2
40
2
= =
i
f
. A mediana ocupa a 20 posio, estando, portanto, na 3 classe.
Observe que quando os dados esto distribudos em classe no h a necessidade de
verificar se o nmero de dados par ou impar, basta dividir por 2 e determinar a
sua posio.

3) Quando os dados esto distribudos em classe numa tabela de frequncia h
perda de informao dos dados originais, sabemos, apenas, que a mediana
um valor que est entre 158 cm e 162 cm. Para estimarmos o valor da mediana
vamos dividira a classe ( 3 classe) em 11 seguimentos de reta iguais, como
mostra o modelo a seguir.


Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 27 -


Para calcular a mediana s somar ao limite inferior da classe com os valores
dos intervalos at a posio da mediana, ou seja:
cm M
e
54 , 160
11
4
7 158 = + =
Usando um raciocnio semelhante desenvolvemos a seguinte frmula
calculara a mediana.

*
) (
*
2
i
ant
i
i
f
h F
f
Me

(
(

+ =



*
i
l - Limite inferior da classe mediana.
*
i
f - Freqncia simples da classe mediana.
F
(ant)
frequncia acumulada da classe anterior classe mediana.
h amplitude da classe mediana.

Aplicando a frmula vem o clculo a mediana ser:
h
f
ant F
f
l Me
i
i
i
|
|
|
|
.
|

\
|

+ =

*
*
) (
2

cm M
e
54 , 160 54 , 2 158 4
11
13 20
158 = + =
|
.
|

\
|
+ =


Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 28 -
A MODA

A moda a medida estatstica que aparece com maior frequncia.

Exemplo: Determina a moda dos dados a seguir: 20, 30, 50, 40, 40, 60,
40, 90, 80, 80

40 = Mo

A moda, no necessariamente, nica. Um conjunto de dados pode ter duas,
trs, quatro,... ou nenhuma moda.
Quando os dados esto distribudos em classe, pode-se atribuir o valor da
moda como sendo o ponto mdio da classe de maior freqncia. No exemplo
anterior a moda seria 160 cm. No entanto, este tipo de moda no leva em
considerao a instabilidade nas fronteiras das classes, onde esto as variveis
que, com pequenas modificaes da amplitude do intervalo, tendem a migrar para
uma das classes vizinhas. Foi pensando nesta instabilidade que se desenvolveu
uma frmula para o clculo da moda, que considera as frequncias das classes
vizinhas. A figura a seguir representa uma parte do histograma de uma
distribuio, em que so representadas: a classe de maior frequncia (que contm
a moda) e as classes vizinhas.






Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 29 -
Os tringulos PSQ e RST so semelhantes, ento:

h
D D
D
x
x h
x
D
D
2 1
1
2
1
+
=

=

Como x M
i o
+ = , temos:
h
D D
D
M
i o
2 1
1
+
+ =
post i
ant i
f f D
f f D
=
=
*
2
*
1


Exemplo:

Determinar a moda dos dados representados na tabela anterior.
Primeiro determina-se o classe em que a moda est, ou seja a classe de maior
frequncias, e sem seguida aplica-se a frmula

cm h
D D
D
l Mo
i
6 , 159 6 , 1 158 4
) 8 11 ( ) 9 11 (
9 11
158 .
2 1
1 *
= + =
+

+ =
+
+ =

Neste caso a moda foi um pouco menor que o ponto mdio de classe. Esta
diferena se deve ao fato da classe anterior classe modal ter uma frequncia
maior que a da classe superior, arrastando a mdia para um valor um pouco
abaixo do centro da classe.

SEPARATRIZES

Medida estatstica que separam os dados em grupos que apresentam o
mesmo nmero de valores.
Exemplo:
Mediana: Separa os dados em dois grupos que apresentam o mesmo
nmero de valores .
Quartis: separa os dados em quatro grupos que apresentam o mesmo
nmero de valores.
Decis: separa os dados em dez grupos que apresentam o mesmo nmero
de valores.
Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 30 -
Percentis: separa os dados em cem grupos que apresentam o mesmo
nmero de valores.
Para calcular as separatrizes podemos adaptar a frmula da mediana
generalizando para o clculo de um percentil k qualquer.







Observao: Para calcular o quartil 3 temos: Q
3
= P
75

Exemplo: Calcular o
20
P dos dados da tabela anterior.
Primeiro preciso determinar a classe onde est o
20
P
8
100
40 20
=
x
, ocupa a 8 posio ou seja est na classe 2.
cm P 78 , 155 78 , 1 154 4
9
4 8
154
20
= + =
|
.
|

\
|
+ =
A interpretao do percentil a seguinte: 20% das estaturas esto abaixo
de 155,78cm enquanto que 80% esto acima.

3.2 MEDIDAS DE DISPERSO OU VARIAO

Nas anlises de dados, alm da informao quanto ao meio de um conjunto
de dados, conveniente observar tambm uma medida para avaliar a disperso,
ou seja, se os valores esto relativamente prximos uns aos outros.
Imagine uma pesquisa em trs residncias a respeito do consumo de gua
durante o perodo de cinco dias e os resultados esto apresentados na tabela a
seguir:






K%
(100-K)%
Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 31 -


Observe que o consumo mdio das trs residncias foi o mesmo,
dia x / 2000
5
10000
= = , no entanto, uma observao rpida e visual indica que a
residncia C teve um consumo mais diferenciado a cada dia se comparada s
outras, ou seja um consumo menos estvel. exatamente este tipo de informao
que as medidas de disperso fornecem numa anlise de dados. As principais
medidas de disperso sero estudadas a seguir.

INTERVALO OU AMPLITUDE

Diferena entre o maior e o menor valor em um grupo de dados
Exemplo:
Determinar o intervalo do conjunto de dados: 12, 20, 3, 2, 15, 17.
18 2 20 = = AT
No exemplo das residncias temos:
Amplitude relativa ao consumo de gua da residncia A 2.000 litros, o da
residncia B 3500 litros e o da residncia C 3700 litros.
Obs. A amplitude no considerada uma boa medida de disperso
pois s leva em considerao os extremos do intervalo, no sendo sensvel
a todo conjunto de dados.

DESVIO MDIO ABSOLUTO

Desvio a diferena entre um determinado valor de um dado e a mdia
relativa a estes dados.


Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 32 -
Uma propriedade importante do desvio que

= 0
i
d

= = = 0 ) ( x n x n x x x x
i i

Exemplo:
No conjunto de dados 12, 20, 3, 2, 15, 17 , temos 50 , 11
6
69
= = x . O desvio
relativo ao valor 12 0,5, ou seja, 5 , 0 5 , 11 12
1
= = d . A interpretao deste valor
que 12 esta a 0,5 pontos acima da mdia. J o desvio relativo ao valor 2
5 , 9 50 , 11 2
4
= = d , o que significa que 2 est a 9,5 pontos abaixo da mdia.
Como a mdia dos desvios sempre ser zero, uma forma de captar a
disperso dos dados calcular a mdia dos valores absolutos dos desvios.


|


Exemplo:
Calcular o desvio mdio absoluto dos dados 12, 20, 3, 2, 15, 17.

6
| 5 , 11 17 | | 5 , 11 15 | | 5 , 11 2 | | 5 , 11 3 | | 5 , 11 20 | | 5 , 11 12 | + + + + +
= DMA
6
5 , 5 5 , 3 5 , 9 5 , 8 5 , 8 5 , 0
6
| 5 , 5 | | 5 , 3 | | 5 , 9 | | 5 , 8 | | 5 , 8 | | 5 , 0 | + + + + +
=
+ + + + +
= DMA
0 , 6
6
36
= = DMA

Como sugesto, calcule o desvio mdio absoluto relativo ao consumo de gua
nas trs residncias apresentadas na tabela anterior e compare os resultados.

VARINCIA

A varincia tambm uma medida que capta a disperso de um conjunto de
dados, e definida como a mdia da soma dos quadros dos desvios. Para
representar a varincia usaremos a letra grega
2
o (sigma ao quadrado)


Exemplo: Calcular a varincia do conjunto de dados: 12, 20, 3, 2, 15, 17.
Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 33 -
6
) 5 , 11 17 ( ) 5 , 11 15 ( ) 5 , 11 2 ( ) 5 , 11 3 ( ) 5 , 11 20 ( ) 5 , 11 12 (
2 2 2 2 2 2
2
+ + + + +
= o
35 , 53
6
25 , 30 25 , 12 25 , 90 25 , 72 25 , 72 25 , 0
6
) 5 , 5 ( ) 5 , 3 ( ) 5 , 9 ( ) 5 , 8 ( ) 5 , 8 ( ) 5 , 0 (
2 2 2 2 2 2
2
=
+ + + + +
=
+ + + + +
= o


Quando estamos trabalhando com dados associados a alguma unidade de
medida o valor da varincia ser na unidade de medida ao quadrado.
No caso do consumo de gua de uma residncia, se os dados esto em litros
varincia estar em litros ao quadrado, o que em muitos casos dificulta a
interpretao.
Para facilitar os clculos e evitar que sejam feitas muitas aproximaes nos
clculos dos desvios apresentamos uma outra frmula para o clculo da varincia.

) 1 ( ) ( 2 ] ) ( 2 [ ) ( que Temos
2 2
1
2 2 2
equao x x x x x x x x x x
i i i i
+ = + + =
) 2 ( ) ( 2 2 que temos , 2 2 como
2
equao x n x x x n x e x x x x
i i i i
= = =
) 3 ( ) ( ) ( como
2 2
quao e x n x

=
Substituindo em (1) os valores de (2) e (3) vem:
2
2 2 2 2 2 2
i
2
i
) ( ) ( ) ( 2 x ) (x



|
|
.
|

\
|
= = + =
n
x
n x x n x x n x n x
i
i i

2
2
2
2
2
2
) (
|
|
.
|

\
|
=
|
|
.
|

\
|

n
x
n
x
n
n
x
n x
n
x x
i i
i
i
i
o



Quando os dados esto tabelados e so apresentados em associao com a
frequncias em que eles aparecem, podemos adaptar a frmula anterior para:



Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 34 -
DESVIO PADRO

A medida de disperso mais usada nas analises de dados o desvio padro,
e o seu clculo e feitor extraindo a raiz quadrada da varincia.

ou ainda

Da mesma forma da varincia podemos adaptar a frmula quando os dados
esto associados a uma frequncia




Exemplo:
Calcular o desvio do conjunto de dados: 12, 20, 3, 2, 15, 17.
Como j calculamos anteriormente a varincia como 35 , 53
2
= o o desvio padro
ser:
30 , 7 35 , 53 = = o
Como sugesto calcule o desvio padro do consumo de gua das trs
residncias na tabela anterior e compare os resultados.

Em muitas situaes praticas necessrio fazer uma estimativa para ao
desvio padro e uma sugesto de alguns autores especializados estimar o desvio
padro como sendo um quarto da amplitude.
4
amplitude
= o
O ideal mesmo calcular o desvio padro, pois como sabemos, a amplitude
s leva em considerao os extremos de um conjunto de dados.

Exemplo:
Calcular o desvio padro, correspondente as estaturas de um grupo de 40
alunos de uma determinada escola, apresentados na tabela a seguir
Calcular o desvio padro dos dados a seguir:

Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 35 -


Observem que na tabela foi acrescentada a coluna
2
i i
x f para ajudar nos
clculos e utilizar a frmula associada com as frequncias que os dados so
apresentados
cm
n
x f
n
x f
i i i i
57 , 5 31 25921 25952
40
6440
40
1038080
2
2
2
= = =
|
.
|

\
|
=
|
|
.
|

\
|
=

o

3.3 MDIA X DESVIO PADRO

Quando a distribuio de um conjunto de dados se aproxima de uma
distribuio normal, ou seja, a curva de frequncia tem o formato de um sino,
valem as seguintes regras empricas para estes dados.

- Cerca de 68% destes dados esto a menos de 1 desvio padro a
contar da mdia.
- Cerca de 95% destes dados esto a menos de 2 desvio padro a
contar da mdia.
- Cerca de 99,7% destes dados esto a menos de 3 desvio padro da
mdia.


Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 36 -
4 MEDIDAS DE ASSIMETRIA
Essas medidas referem-se forma da curva de uma distribuio de
frequncia.

Assimetria Positiva


o e
M M X > >


Assimetria Negativa


o e
M M X < <


Simtrica
o e
M M X = =


o e
M M X = =
Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 37 -


4.1 Coeficientes de Assimetria (As):
Karl Pearson props duas maneiras de avaliar o grau de deformao da
curva de uma distribuio de frequncia, cujo objetivo principal justamente
indicar a grandeza do afastamento em termos relativos.

Coeficiente assimtrico de Pearson


ou


onde:
As = 0 a distribuio simtrica
As > 0 a distribuio assimtrica positiva
As < 0 a distribuio assimtrica negativa

5 - MEDIDAS DE CURTOSE

Curtose nada mais do que o grau de achatamento da curva de uma
distribuio de frequncia. Isto considerando que a curva pode apresentar-se mais
achatada ou mais afilada em relao a uma curva considerada curva-padro ou
curva normal.
Assim, dentro destas especificaes, uma curva normal deve apresentar um
coeficiente de curtose igual a 0,263. O calculo deste coeficiente dado pela
seguinte expresso:

Coeficiente percentlico de curtose



C = 0,263 curva Mesocrtica
C > 0,263 curva Platicrtica
C < 0,263 curva Leptocrtica





Estatstica Descritiva Oscar Luiz Teixeira de Rezende

__________________________________________________________________

- 38 -






6- BIBLIOGRAFIA

CRESPO, Antnio Armont. Estatstica fcil. So Paulo: Editora Saraiva, 1996.

DEVORE, J. L. Probabilidade e estatstica para engenharia e cincias. Traduo de
Joaquim Pinheiro Nunes da Silva. So Paulo: Thomson, 2006.

SILVA, Medeiros da Silva, SILVA, Elio Medeiros, GONALVES, Valter, MUROLO,
Antnio Carlos. Estatstica Para os Cursos de Economia, Administrao e Cincias Contbeis.
2
a
ed, Vol 1 e 2. So Paulo: Editora Atlas S.A, 1997.

STEVENSON, William J. Estatstica aplicada administrao. So Paulo: Editora
Harbra LTDA, 1988.

TRIOLA, Mario F. Introduo a Estatstica. 7 ed Rio de janeiro: LTC , 1999.

Vous aimerez peut-être aussi