Académique Documents
Professionnel Documents
Culture Documents
, , 2
2
=
2, 8
2
= 1, 1
= 1, 1 pontos.
Como vemos, entre o 1
o
quartil (
) e o 3
o
(
= r
mdia
Parece intuitivo que, quanto mais os valores de uma srie se distanciaremda sua mdia,
maior deve ser a soma desses desvios, no mesmo? Ento, talvez ns pudssemos usar
essa soma como uma medida de disperso. Vamos, ento, calcular os desvios em relao
mdia (r = 6, ) para as notas de cada candidato (A, B e C), somar os desvios em cada
conjunto e ver o que podemos concluir?
Acompanhe os clculos:
Portanto,
mdia) = 0, sempre.
Essa medida de disperso, muito utilizada na estatstica mais avanada, baseada nos
desvios de cada valor observado, em relao mdia (). Portanto, ela considera, alm
dessa medida de tendncia central, todas as observaes do conjunto estudado. Mas, o que
quer dizer desvios em relao mdia?
Denimos desvio em relao mdia (
(r
(equao 1);
e amostrais:
(r
r)
1
(equao 2).
7 2 Edio Aula 10 Matemtica e Realidade
Calcularemos s
2
, pois as quatro disciplinas escolhidas constituem uma amostra das seis.
Portanto, temos:
Podemos ver que o conjunto B apresentou uma variabilidade muito maior que os demais.
Da conclumos que seus valores no esto muito concentrados ao redor da sua mdia.
Desenvolvendo-se algebricamente as expresses (1) e (2), e aps as devidas
simplicaes, podemos reescrev-las, respectivamente para
2
e s
2
, da forma:
Embora essas novas frmulas possam parecer mais complicadas, elas, na verdade,
exigem clculos bastante simples. Voc precisa apenas calcular duas somas: uma, referente
ao quadrado de cada observao, e a outra, ao total de todos os dados.
Como exemplo, vamos calcular a varincia para os dados do Censo de 2000, relativos s
taxas de Mortalidade Infantil at 1 ano, dos 8 municpios que compem a regio metropolitana
de Natal. Essas taxas representam a mortalidade de crianas menores de 1 ano em 1.000
nascidos vivos.
Obs.: deixe sempre o resultado da varincia com pelo menos 4 casas
decimais, pois isso ser importante para o clculo do desvio-padro que
veremos mais adiante.
\ o:( ) =
(r
r)
n 1
=
0
8
= 0
\ o:() = :
=
77
8
= 22 (pontos)
\ o:() = :
=
2,
8
= 0, 8888 (pontos)
(
)
(equao 3) e
(
)
1
=
1
(equao 4)
Desvios
2
=(x
1
x)
2
A B C
(x
1
6)
2
0 0 0,2
(x
1
6)
2
0 16 1,0
(x
1
6)
2
0 16 0,2
(x
1
6)
2
0 2 1,0
Soma
0 66 2,
8 Aula 10 Matemtica e Realidade 2 Edio
Tabela 1 Clculos auxiliares para obteno da varincia.
A varincia uma medida de disperso que assume valores maiores ou iguais a zero,
porque uma mdia quadrtica, portanto nunca ser um nmero negativo. Para efeito de
anlise, quanto maior a varincia (quanto mais distante do zero), maior a disperso dos
dados em relao mdia.
Atividade 3
Os dados apresentados a seguir foram obtidos do Atlas de Desenvolvimento
Humano no Brasil e referem-se ao percentual
*
de analfabetismo funcional
(menos de quatro anos de estudo) de pessoas com 15 anos ou mais em seis
municpios da microrregio de Sousa (Paraba), dos anos:
1991: 73 67 70 60 69 77
2000: 57 57 62 53 61 68
*Esses percentuais foram arredondados para facilitar os clculos.
Calcule a mdia e a varincia para cada ano, comparando os resultados dos
mesmos em relao variabilidade dos dados.
Os dados so:
48,86 40,16 43,96 36,53 48,41 38,10 35,26 36,99
Para facilitar os clculos, construmos a tabela a seguir:
1
=
(186 8 2)
(828 2 )
=
186 8 2 184 0 1=
= 20 08 (bitos1000)
x
i
x
2
i
8,26 1.248,27
86,8 1.884,44
86,00 1.868,26
88,10 1.41,61
40,16 1.612,88
48,06 1.082,48
48,41 2.848.8
48,86 2.887,80
x
i
2
= 828,27 x
i
2
= 18.678,72
9 2 Edio Aula 10 Matemtica e Realidade
Varincia para dados agrupados em
tabelas de freqncias
Para dados agrupados em distribuies de freqncias, temos, respectivamente, as
seguintes frmulas para a varincia populacional e para a amostral:
Observe que agora trabalharemos com as freqncias e que a variao do ndice no
somatrio vai de 1 a k, que representa exatamente a quantidade de valores assumidos
pela varivel estudada ou o nmero de intervalos, quando trabalhamos com dados
agrupados em classes.
Os valores x
i
so substitudos pelos pontos mdios dos intervalos quando se
trabalha com dados agrupados em classes.
Vamos acompanhar duas situaes atravs dos exemplos 1 e 2 para que voc possa se
familiarizar melhor com as frmulas apresentadas.
Exemplo 1
Retomaremos a aula 5 em que temos a pontuao no teste objetivo de Matemtica numa
amostra de 54 alunos da 8 srie/manh, exposta na Tabela 2, que a seguir apresentamos.
Observe que as duas ltimas colunas da tabela so sucientes para a obteno dos valores
que sero utilizados na frmula da varincia. Veja tambm que a varivel pontuao (X
i
)
assume 6 valores distintos, isto signica que: k = 6.
(equao 5) e
1
(equao 6)
10 Aula 10 Matemtica e Realidade 2 Edio
Fonte: Dados ctcios
Como se trata de uma amostra, calcularemos s
2
ao invs de .
Agora que temos todos os elementos, deveremos aplicar a equao (6):
Atividade 4
Na aula 8, pedimos para voc calcular a mdia para a pontuao no teste
objetivo de Matemtica na amostra das turmas da 8 srie/noite. Agora, calcule
a varincia e compare o resultado com o que acabamos de encontrar.
Exemplo 2
A Tabela 3 que segue exibe dados agrupados em intervalos de classe. Vamos aprender
como se calcula a varincia, em situaes como esta. Voc se lembra que, nesse caso (dados
agrupados em classes), x
i
se refere ao ponto mdio de cada intervalo e representa todos
os valores contidos em sua respectiva classe? Para facilitar os clculos da varincia, foram
acrescentadas as trs ltimas colunas, tal como foi feito no exemplo 1.
Tabela 2 Pontuao no teste objetivo de Matemtica, na amostra das turmas da 8
a
srie/manh, na
E. E. Nair Burgio, municpio de Carapeba, em abril de 2004.
1
77
(87)
4
8
77 7 77
8
1 74 (pontos)
.
Pontuao x
i
N de alunos f
i
x
i
f
i
x
2
i
f
i
4 2 8 4
2
x 2 = 82
8 40
2
x 8 = 200
6 10 60 6
2
x 10 = 860
7 1 10 7
2
x 1 = 78
8 12 06 8
2
x 12 = 768
0 7 68 0
2
x 7 = 67
TOTAL f
i
= f = 4 x
i
f
i
= 872 x
i
2
f
i
= 2.662
11 2 Edio Aula 10 Matemtica e Realidade
Fonte: Dados ctcios
Atividade 5
A Tabela 4 mostra o percentual de indigentes, com base no Censo de 1991, dos
estados brasileiros. Calcule a varincia apresentada por esses dados.
Fonte: Atlas do Desenvolvimento Humano no Brasil
Tabela 3 Distribuio das mdias trimestrais de Matemtica, na amostra das turmas da 8
a
srie/
manh, na E. E. Nair Burgio, municpio de Carapeba, em abril de 2004.
Tabela 4 Percentual de indigentes dos estados brasileiros, 1991.
1
8011 =
(8 4)
=4
=8
8011 =2 74 74
=8
8 7 (pontos)
.
Notas (mdias) N de alunos (f
i
)
Ponto
mdio (x
i
)
x
i
f
i
x
i
2
x
2
i
f
i
8 ` 4 2 8, 7,0 12,2 12,2
x 2 = 24,0
4 ` 8 4, 18, 20,2 20,2
x 8 = 60,70
` 6 7 , 88, 80,2 80,2
x 7 = 211,7
6 ` 7 8 6, 2,0 42,2 42,2
x 8 = 888,00
7 ` 8 14 7, 10,0 6,2 6,2
x 14 = 787,0
8 ` 0 12 8, 102,0 72,2 72,2
x 12 = 867,00
0 ` 10 8 0, 76,0 00,2 00,2
x 8 = 722,00
TOTAL
4 804,0 8.011,0
% de indigentes
classes
N de Municpios
f
i
8 ` 11 8
11 ` 10 8
10 ` 27
27 ` 8 6
8 ` 48 4
48 ` 1 1
TOTAL
20
12 Aula 10 Matemtica e Realidade 2 Edio
DESVIO-PADRO: (para dados populacionais) ou
s (para dados amostrais)
A varincia uma importante medida de disperso, entretanto, seu resultado dado
em unidade de medida que o quadrado da original. Algumas dessas medidas no tm
nenhum sentido prtico, como na atividade referente mortalidade infantil. Como avaliar,
por exemplo, kg
2
, (Salrio mnimo)
2
, anos
2
, pontos
2
etc.? Ento, como alternativa para
contornar esse problema, existe uma medida denominada desvio-padro, denida como a
raiz quadrada positiva da varincia. Assim,
Considerando todos os clculos anteriores obtidos para a varincia, vamos calcular o
desvio-padro.
No exemplo, das notas dos candidatos (cujos resultados da varincia esto na pgina
9) temos:
Como podemos observar, o desvio-padro associado ao candidato B muito maior
do que os demais. Isso signica que as notas desse candidato apresentaram-se bastante
dispersas ao redor da mdia 6,0.
Para os dados referentes Mortalidade Infantil, a varincia e o respectivo desvio-padro so:
Considerando as notas da amostra das turmas da 8
a
srie/manh, no teste objetivo, e
as mdias trimestrais em Matemtica, teremos os seguintes desvios-padro:
Obs.: tanto a varincia quanto o desvio-padro so medidas largamente usadas
na Estatstica Inferencial. Na Estatstica Descritiva, que o nosso caso, essas
medidas tm sentido, principalmente, quando comparamos conjunto de dados
de mesma natureza e que apresentam mdias com valores aproximados.
Desvio-padro populacional:
;
Desvio-padro amostral:
.
Var(A)=
= ;
Var(B)=
= 4, 60 pontos;
Var(C)=
= , 888
, 888 = , 0 pontos.
8 (bitos).
teste objetivo:
= 1, 2 =
1, 2 = 1, 8 pontos;
mdias trimestrais:
= 8, 00 =
8, 00 = 1, 0 pontos.
13 2 Edio Aula 10 Matemtica e Realidade
Atividade 6
Calcule o desvio-padro para os percentuais (%) de indigentes apresentados na
Tabela 4 (atividade 5).
Para entendermos melhor o desvio-padro, imagine, por exemplo, o tempo de espera
numa la de um banco durante uma semana tpica. O tempo mdio de espera dos clientes
durante esse perodo independe da la ser nica ou no. Entretanto, os clientes cam muito
mais satisfeitos quando esto em la nica, uma vez que o tempo de espera, por no depender
de um caixa em particular, se distribui de forma mais homognea ao redor do tempo mdio.
Quando no h la nica, alguns clientes esperam mais do que outros, dependendo do caixa,
fato que causa insatisfao. Essa situao reete que a tomada de deciso dos bancos ao se
optar por la nica, provavelmente se baseou em um estudo da variabilidade apresentada
pelo tempo de espera dos clientes, que, no caso da la nica, diminui bastante.
O desvio-padro a medida de disperso mais utilizada, universalmente, na anlise
de dados, tendo se tornado um apoio indispensvel na tomada de deciso.
A seguir, apresentamos a Figura 1 que mostra uma distribuio de dados simtrica, ou
seja, que apresenta mdia, moda e mediana iguais. Nessas distribuies, verica-se que cerca
de 68,26% dos dados esto a menos de 1 desvio-padro da mdia; 95,45% dos dados esto
a menos de dois desvios padro e 99,7% dos dados esto a menos de trs desvios padro. Os
valores que esto a mais de 3 desvios-padro so considerados discrepantes dos demais.
Como entender o desvio-padro?
95,45%
P
P2V P2V
Figura 1 Distribuio simtrica
14 Aula 10 Matemtica e Realidade 2 Edio
Resumo
Os fenmenos que pesquisamos e exploramos com ferramentas estatsticas
esto associados a dados que se apresentam de forma variada. Estudar como
as observaes coletadas esto se comportando em relao variabilidade de
grande importncia para o conhecimento da varivel pesquisada. Neste texto,
abordamos quatro medidas amplitude total, desvio quartil, desvio-padro e
varincia utilizadas no estudo da disperso ou variabilidade de dados estatsticos.
Apresentamos o conceito e os clculos referentes a cada uma delas. Mostramos
com nfase atravs de exemplos o importante papel que elas desempenham
na descrio e anlise de dados quantitativos. Encaminhamos vrias situaes
para auxiliar no estudo e compreenso deste tema.
Auto-avaliao
Abaixo, reproduzimos a tabela que mostra as mdias de Matemtica da amostra
das turmas da noite, apresentada na aula 6 (Grcos representativos de uma
distribuio de freqncias):
1
Fonte: Dados Fictcios
Tabela 5 Distribuio das mdias trimestrais de Matemtica, na amostra das turmas da 8
a
srie/
noite, na E. E. Nair Burgio, municpio de Carapeba, em abril de 2004.
Assim, o conhecimento de uma medida de tendncia central (a mdia) e de uma medida
de disperso nos permite descrever com mais detalhes (e muito menor risco de equvocos)
um conjunto de dados.
Notas (mdias) N de alunos ()
8 ` 4 6
4 ` 12
` 6 14
6 ` 7 8
7 ` 8
8 ` 0 4
0 ` 10 8
Total
2
15 2 Edio Aula 10 Matemtica e Realidade
Com base nessa Tabela, calcule a varincia e o desvio-padro e compare-os com essas
mesmas medidas calculadas no decorrer da aula para a amostra das turmas da manh. Faa
comentrios pertinentes ao contexto.
Os dados a seguir referem-se ao ndice de Desenvolvimento Humano (IDH) de
algumas capitais nordestinas, obtidos com dados dos Censos de 1991 e 2000.
Tabela 6 ndice de Desenvolvimento Humano nos anos de 1991 e 2000 de algumas capitais
nordestinas.
Capitais IDH-1991 IDH-2000
Fortaleza 0,688 0,767
Macei 0,660 0,724
Natal 0,689 0,762
Recife 0,715 0,780
Salvador 0,735 0,794
So Lus 0,707 0,766
Fonte: Atlas do Desenvolvimento Humano no Brasil
Obtenha, para cada ano, as seguintes medidas de variabilidade:
a) amplitude total;
b) varincia;
c) desvio-padro.
Faa comparaes entre os anos de 1991 e 2000, usando as medidas calculadas.
2
Referncias
AZEVEDO, P. R. Introduo estatstica. Natal: EDUFRN, 2005.
BARBETTA, P. A. Estatstica aplicada s cincias sociais. Florianpolis: Ed. da UFSC, 2002.
MOORE, D. A estatstica bsica e sua prtica. Traduo de Alfredo Alves de Farias. Rio de
Janeiro: LTC, 2000.
PEREIRA, W.; TANAKA, O. K. Estatstica: conceitos bsicos. 2.ed. So Paulo:
McGraw-Hill, 1990.
16 Aula 10 Matemtica e Realidade 2 Edio
PROGRAMA DAS NAES UNIDAS PARA O DESENVOLVIMENTO (PNUD). Atlas do
Desenvolvimento Humano no Brasil. Indicadores de Vulnerabilidade Familiar, 1991 e 2000,
municpios da microrregio Cariri Ocidental (Paraba). Disponvel em: <http://www.pnud.org.
br/> Acesso em 31/05/2005.
TOLEDO, G. L.; OVALLE, I. I. Estatstica bsica. 2.ed. So Paulo: Atlas, 1985.
TRIOLA, M. F. Introduo estatstica. Traduo de Alfredo Alves de Farias. 7.ed. Rio de
Janeiro: LTC, 1999.
Anotaes