Vous êtes sur la page 1sur 108

Controle da

Gesto Pblica
Curso de Ps-Graduao em
Couvaotr lsvnvsvco nr
aocrssos rnan arn uutcn
Hans Michaels van Bellen
Universidade Federal de Santa Catarina
Centro Scio-Econmico
Departamento de Cincias Contbeis


V217c VAN BELLEN, Hans. M
Controle estatstico de processos para rea pblica / Hans Michael van Bellen .
Florianpolis : Departamento de Cincias Contbeis/ UFSC, 2008.
108 p. : il
Curso de Ps-Graduao em Controle da Gesto Pblica
Inclui bibliografa
ISBN: 978-85-7426-051-8
1. Estatstica. 2. Mtodos quantitativos. 3. Controle. 4. Gesto pblica. 5. Educao a
distncia I. Universidade Federal de Santa Catarina/Departamento de Cincias Contbeis. II.
Ttulo.
CDU: 519.2

Universidade Federal de Santa Catarina, Sistema UAB. Nenhuma parte deste material poder ser reproduzida,
transmitida e gravada, por qualquer meio eletrnico, por fotocpia e outros, sem a prvia autorizao, por escrito,
dos autores.
GOVERNO FEDERAL
Presidente da Repblica Luiz Incio Lula da Silva
Ministro da Educao Fernando Hadad
Secretrio de Educao a Distncia Carlos Eduardo Bielschowsky
Coodenador Nacional da Universidade Aberta do Brasil Celso Costa
UNiVERsiDADE FEDERAL DE sANtA CAtARiNA
Reitor lvaro Toubes Prata
ViceReitor Carlos Alberto Justo da Silva
Pr-Reitor de Desenvolvimento Humano e Social Luiz Henrique Vieira Silva
Pr-Reitor de Assuntos Estudantis Cludio Jos Amante
Pr-Reitora de Pesquisa e Extenso Dbora Peres Menezes
Pr-Reitora de Ps-Graduao Maria Lucia de Barros Camargo
Pr-Reitora de Ensino de Graduao Yara Maria Rauh Muller
Diretora de Educao a Distncia Araci Hack Catapan
Secretrio de Planejamento e Finanas Luiz Alberton
Secretria de Cultura e Arte Maria de Lourdes Alves Borges
CENtRO sCiO-ECONMiCO
Diretor Maurcio Fernandes Pereira
Vice-Diretor Altair Borgert
DEPARtAMENtO DE CiNCiAs CONtBEis
Chefe do Departamento Maria Denize Henrique Casagrande
Sub-chefe do Departamento Flvio da Cruz
Coordenador Geral do Curso de ps-graduao na modalidade a distncia Ernesto Fernando
Rodrigues Vicente
Coordenadora de Educao a Distncia e Tutoria Maria Denize Henrique Casagrande
Coordenador de Ambiente Virtual de Ensino e Aprendizagem Orion Augusto Platt Neto
Coordenador Financeiro Vladimir Arthur Fey
Coordenador Pedaggico Guilherme Julio da Silva
Coordenadora de Pesquisa e TCC Valdirene Gaspareto
sECREtARiA DE EDUCAO A DistNCiA
Coordenao de Design Instrucional Fernanda Pires Teixeira
Design Instrucional Mrcia Melo Bortolato
Reviso Textual Jlio Csar Ramos
Coordenao de Design Grfco Giovana Schuelter
Design Grfco Ariana Schlsser
Andr Rodrigues da Silva
Ilustraes Aurino Manoel dos Santos Neto
Design de Capa Guilherme Dias Simes
Felipe Augusto Franke
Steven Nicols Franz Pea
Projeto Editorial Guilherme Dias Simes
Felipe Augusto Franke
Steven Nicols Franz Pea
sumrio
UNiDADE 1 - FUNDAMENtOs DE EstAtstiCA: CONCEitOs BsiCOs
E APLiCAO NA CONtABiLiDADE GERENCiAL
1.1 Fundamentos de Estatstica: conceitos bsicos ..................................................... 3
1.2 Nveis de mensurao ............................................................................................................... 4
Nvel nominal ................................................................................................................................................................................................. 4
Nvel ordinal .....................................................................................................................................................................................................5
Nvel intervalar ...............................................................................................................................................................................................5
1.3 Estatstica descritiva ................................................................................................................ 6
1.4 Suporte tomada de deciso ............................................................................................10
UNiDADE 2 - PLANEjAMENtO DE UMA PEsqUisA COM LEVANtAMENtO
E ANLisE DE DADOs qUANtitAtiVOs
2.1 Coleta de dados..........................................................................................................................15
2.2 Organizao de dados ..........................................................................................................18
2.3 Tecnologia da informao, pacotes estatsticos e bases de dados ...... 26
UNiDADE 3 - MEDiDAs DE tENDNCiA CENtRAL
3.1 Mdia ................................................................................................................................................. 33
3.2 Mediana ........................................................................................................................................... 35
3.3 Moda ................................................................................................................................................. 37
UNiDADE 4 - MEDiDAs DE VARiABiLiDADE
4.1 Amplitude ....................................................................................................................................... 44
4.2 Desvio mdio ................................................................................................................................ 45
4.3 Varincia ........................................................................................................................................ 49
4.4 Desvio padro .............................................................................................................................. 51
4.5 Comparando Medidas de Variabilidade .................................................................... 53
UNiDADE 5 - DistRiBUiO DE PROBABiLiDADEs
UNiDADE 6 - tEORiA DA AMOstRAGEM
6.1 Tamanho das amostras ........................................................................................................ 76
Amplitude ...................................................................................................................................................................................................... 77
Nvel de Confana..................................................................................................................................................................................... 77
Erro de Estimao ...................................................................................................................................................................................... 78
Proporo da Caracterstica ................................................................................................................................................................. 78
Tamanho da Amostra para Universo (Populao) Infnito ................................................................................................. 79
Tamanho da Amostra para Universo (Populao) Finito .................................................................................................... 79
UNiDADE 7 - CORRELAO
UNiDADE 8 - REGREssO
Caro(a) aluno(a),
Ol! Seja bemvindo!
Bem-vindos disciplina de Controle Estatstico de Processos para a rea
Pblica. Nesta disciplina exploraremos algumas ferramentas construdas a
partir do desenvolvimento da Estatstica que so bastante teis para auxiliar
um gestor, no seu dia-a-dia, particularmente aquele que trabalha na rea p-
blica, a tomar decises.
Esta apostila foi desenvolvida com a perspectiva de fornecer o suporte tex-
tual necessrio para permitir que o aluno possa compreender os conceitos da
disciplina e aplic-los sua realidade. Juntamente com outros conhecimentos
que o Curso propicia no processo de aprendizagem, pretende-se construir, ao
longo do tempo de interao, bases mais slidas de conhecimentos na rea.
Para dar suporte a este processo, o contedo da disciplina foi dividido em
oito unidades principais. Estas unidades abordam desde a base terica necess-
ria para apreenso dos principais tpicos da Estatstica at exemplos e exerc-
cios que auxiliam na fxao deste contedo.
importante ressaltar que um dos propsitos principais desta apostila
mostrar de forma simples e sinttica uma srie de ferramentas que a Estats-
tica fornece e que podem auxiliar qualquer gestor no processo de tomada de
deciso. Para isso os cientistas sociais e os gestores podem utilizar tecnologias
de processamento de dados para extrair observaes relevantes e tirar conclu-
ses a respeito da realidade ou de uma determinada situao problema.
Essas tecnologias de processamento de dados so programas (ou softwa-
res) chamados tambm aqui de pacotes estatsticos, que processam as infor-
maes automaticamente, retirando delas os aspectos mais importantes para
a tomada de deciso.
A partir do conhecimento construdo no Curso, voc ter, ao fnal, uma
base para anlise das questes do seu dia-a-dia no processo de gesto. o que
lhe deseja seu professor.
Prof. Dr. Hans Michael van Bellen
1
Nesta unidade voc compreender a
defnio de Estatstica, os elementos da
estatstica descritiva e os diferentes nveis
de mensurao de uma varivel.
Unidade 1
Fundamentos de Estatstica: conceitos bsicos
e aplicao na contabilidade gerencial
1
Nesta unidade voc compreender a
defnio de Estatstica, os elementos da
estatstica descritiva e os diferentes nveis
de mensurao de uma varivel.
Unidade 1
Fundamentos de Estatstica: conceitos bsicos
e aplicao na contabilidade gerencial
10
Curso de Ps-Graduao em Controle da Gesto Pblica
A partir do conhecimento construdo no Curso e das tecnologias existentes
para anlise de dados quantitativos, voc ter, ao fnal do curso, uma base
melhor para anlise das questes do seu dia-a-dia no processo de gesto.
Para entrar no esprito aprendizado assista ao vdeo no YouTube sobre co-
nhecimento e deixe seu comentrio no frum especfco da introduo.
http://www.youtube.com/watch?v=AXzfQeEjYg
1.1 FUNDAMENtOs DE EstAtstiCA:
CONCEitOs BsiCOs
Para entender os principais conceitos e ferramentas da Estatstica neces-
srio compreender primeiramente o que pesquisa cientfca e seus principais
estgios e abordagens.
O ser humano na sua abordagem cotidiana da vida procura compreender a
realidade e a partir disso explic-la.
Numa perspectiva cientfca ele procura observar a realidade de uma forma
mais sistemtica e estruturada a partir dos dados que encontra ao seu redor.
Muitas vezes a caracterstica da realidade observada permite sua mensura-
o atravs de nmeros. Os nmeros desempenham algumas funes impor-
tantes para o pesquisador (LEVIN; FOX, 2004):
Classifcar ou categorizar (nvel nominal de mensurao)
Ordenar por postos (nvel ordinal de mensurao)
Atribuir um escore (no nvel intervalar de mensurao).
Os dados nominais
consistem em apenas
nomes, rtulos ou ca-
tegorias. Os dados no
podem ser dispostos
segundo um esquema
ordenado.
Como as categorias
carecem de qualquer
signifcado ordinal ou
numrico, os dados
em nvel nominal de
mensurao, mesmo
estando diante de
rtulos numricos,
permanecem no nvel
nominal e no po-
demos fazer clculos
com eles.
11
Unidade 1 - Fundamentos de Estatstica: Conceitos Bsicos e Aplicao na
Contabilidade Gerencial
1.2 NVEis DE MENsURAO
Veremos agora a classifcao dos dados quanto ao nvel de mensurao,
que so:
nominal,
ordinal e
intervalar.
Nvel nominal
O nvel nominal de mensurao se refere possibilidade de rotular ou no-
mear os casos observados. Por exemplo, quando observamos os alunos de
uma sala de aula, podemos segmentar a turma considerando o gnero de seus
componentes. Uma turma de 30 estudantes, neste caso, pode ser comporta
por 18 estudantes do sexo masculino e 12 estudantes do sexo feminino.
Existem diversos exemplos de categorizao numa perspectiva nominal.
Por exemplo, quando tratamos de um conjunto de clientes de uma instituio,
poderamos dividi-los em dois conjuntos: um conjunto contendo os indivdu-
os inadimplentes com a empresa e outro conjunto de clientes adimplentes.
importante ressaltar, quando se discute o nvel nominal de mensurao,
que cada caso s pode ser enquadrado em uma, e s uma, categoria (LEVIN;
FOX, 2004). As categorias no podem se sobrepor. Por isso nenhum indivduo
classifcado como do sexo feminino poderia, ao mesmo tempo, ser colocado
no conjunto de alunos da turma de sexo masculino.
Tambm muito importante perceber que variveis nominais no so pas-
sveis de serem classifcadas ou escalonadas em relao qualidades. Por exem-
plo: a simples diviso de uma turma de aula em dois grupos de gnero distinto
no pode signifcar uma ordenao de qualidade tipo melhor ou pior.
Os dados nominais
consistem em apenas
nomes, rtulos ou ca-
tegorias. Os dados no
podem ser dispostos
segundo um esquema
ordenado.
Como as categorias
carecem de qualquer
signifcado ordinal ou
numrico, os dados
em nvel nominal de
mensurao, mesmo
estando diante de
rtulos numricos,
permanecem no nvel
nominal e no po-
demos fazer clculos
com eles.
12
Curso de Ps-Graduao em Controle da Gesto Pblica
Nvel ordinal
O nvel ordinal de mensurao refere-se possibilidade do pesquisador em or-
denar os casos em funo de determinada caracterstica. Um dos exemplos mais
fceis para perceber a possibilidade de ordenao dos casos a classifcao de seg-
mentos da sociedade civil em termos de suas caractersticas socioeconmicas.
Normalmente vamos encontrar nos meios de comunicao a discusso do
impacto da infao sobre a classe mdia, o crescimento da renda da classe alta
ou estabilizao da renda dos indivduos da classe baixa. As classes (alta, mdia
e baixa ou classe A, B e C) so estratos dos casos observados que, diferente-
mente da discusso anterior, permitem uma ordenao. Exemplifcando, se
classe social no caso signifca renda, temos uma classe alta (A) com maior ren-
da que a classe mdia (B) e tambm com maior renda que a classe baixa (C).
Podemos afrmar ento que a categorizao exemplifcada representa uma
estratifcao dos casos que utiliza como fator de agrupamento o grau de ren-
da dos indivduos.
Levin e Fox (2004) afrmam que o nvel ordinal, apesar de proporcionar
a ordenao dos grupos observados, no permite identifcar o tamanho da
diferena entre os grupos. Isto signifca que no possvel atribuir escores ou
valores dentro de um ponto especfco dentro da escala.
Nvel intervalar
O nvel intervalar, alm de informar a ordenao das categorias, permite
identifcar a distncia exata entre elas. Podemos continuar utilizando o exemplo
da turma de uma disciplina formada por 12 mulheres e 18 homens. Nessa turma
poderamos estar interessados na altura ou peso dos indivduos. A mensurao
da altura ou peso de cada um dos estudantes da turma permite a identifcao
exata do valor referente sua altura ou peso bem como da diferena entre o
valor encontrado e o valor das medidas de outros componentes da turma.
Na medida em que os pesquisadores se utilizam de nmeros, ou seja, quanti-
fcam seus dados nos diferentes nveis abordados anteriormente, a Estatstica se
transforma num instrumento importante para atender a duas funes principais:
descrio da realidade; 1.
suporte para a tomada de deciso. 2.
O nvel de mensura-
o ordinal envolve
dados que podem ser
dispostos em alguma
ordem, mas as dife-
renas entre os valores
dos dados no podem
ser determinadas, ou
no tem sentido. Ex:
um editor classifca
alguns originais como
excelentes, alguns
como bons e alguns
maus. (No podemos
determinar uma
diferena quantitativa
entre bom e mau).
O nvel de razo de
mensurao o nvel
intervalar modifcado,
de modo a incluir
o ponto de partida
0 inerente (onde 0
signifca nenhuma
quantidade presente).
Para valores neste n-
vel, tanto as diferenas
quanto as razes tm
signifcados.
Ex.1: pesos de artigos
de material plstico
descartados pelas re-
sidncias (0 Kg indica
que nenhum plstico
foi descartado, e 10 kg
representa 2x5 Kg).
Ex.2: Distncias em Km
percorridas por carros
em um teste de consu-
mo de combustvel.
Obs.: Ao aplicarmos
Estatstica proble-
mas reais, o nvel de
mensurao dos dados
um fator importante
para determinarmos
o processo a ser
utilizado.
13
Unidade 1 - Fundamentos de Estatstica: Conceitos Bsicos e Aplicao na
Contabilidade Gerencial
O nvel de mensura-
o ordinal envolve
dados que podem ser
dispostos em alguma
ordem, mas as dife-
renas entre os valores
dos dados no podem
ser determinadas, ou
no tem sentido. Ex:
um editor classifca
alguns originais como
excelentes, alguns
como bons e alguns
maus. (No podemos
determinar uma
diferena quantitativa
entre bom e mau).
O nvel de razo de
mensurao o nvel
intervalar modifcado,
de modo a incluir
o ponto de partida
0 inerente (onde 0
signifca nenhuma
quantidade presente).
Para valores neste n-
vel, tanto as diferenas
quanto as razes tm
signifcados.
Ex.1: pesos de artigos
de material plstico
descartados pelas re-
sidncias (0 Kg indica
que nenhum plstico
foi descartado, e 10 kg
representa 2x5 Kg).
Ex.2: Distncias em Km
percorridas por carros
em um teste de consu-
mo de combustvel.
Obs.: Ao aplicarmos
Estatstica proble-
mas reais, o nvel de
mensurao dos dados
um fator importante
para determinarmos
o processo a ser
utilizado.
1.3 EstAtstiCA DEsCRitiVA
Para conseguir entender um determinado fenmeno, o pesquisador ou
gestor deve se utilizar de uma grande quantidade de informaes a respeito
deste. Por exemplo, um gestor pblico, do setor fnanceiro de uma prefeitura
municipal pode estar interessado no desempenho relativo da prefeitura na ar-
recadao do Importo Predial e Territorial Urbano (IPTU) de sua cidade.
Para poder descrever o comportamento da arrecadao, esse mesmo ges-
tor dispe do montante total arrecadado nos ltimos trinta anos. Na tabela 1
temos o valor, em reais, arrecadado entre os anos de 1978 e 2007:
Tabela 1.1 Evoluo da Arrecadao
Municipal do IPTU
ANo ToTAl ARRECADADo (R$)
2007 R$ 3.565.000
2006 R$ 3.515.000
2005 R$ 3.530.000
2004 R$ 3.469.000
2003 R$ 3.833.000
2002 R$ 3.766.000
2001 R$ 3.365.000
2000 R$ 3.234.000
1999 R$ 3.787.000
1998 R$ 3.165.000
1997 R$ 2.789.000
1996 R$ 2.565.000
1995 R$ 2.565.000
1994 R$ 2.600.000
1993 R$ 3.105.000
1992 R$ 2.879.000
1991 R$ 2.776.000
1990 R$ 2.789.000
1989 R$ 2.665.000
1988 R$ 2.725.000
1987 R$ 2.683.000
1986 R$ 2.463.000
1985 R$ 3.011.000
1984 R$ 2.852.000
1983 R$ 2.675.000
1982 R$ 2.565.000
1981 R$ 2.645.000
1980 R$ 2.555.000
1979 R$ 2.479.000
1978 R$ 2.444.000
14
Curso de Ps-Graduao em Controle da Gesto Pblica
Imagine-se como gestor desse municpio e de posse desta tabela.
Quais as concluses que voc pode tirar a partir dessas informaes? Voc
conseguiria, simplesmente olhando a tabela, verifcar algum comporta-
mento padro no desempenho da arrecadao do municpio? Voc con-
seguiria descrever o que aconteceu com a arrecadao nos ltimos trinta
anos, em poucas palavras?
Voc seria capaz de afrmar que o desempenho na arrecadao vem au-
mentando ou diminuindo com o tempo?
A princpio, mesmo se tratando de um nmero mais baixo de informa-
es, a resposta a todas estas questes seria no. Entretanto, a partir da
aplicao dos princpios mais bsicos do que a partir de agora denominare-
mos estatstica descritiva qualquer gestor municipal, de posse dos dados
agrupados em diferentes formas, derivados da tabela, poderia caracterizar o
comportamento da arrecadao no perodo citado de forma sucinta, clara
e precisa.
Veja alguns exemplos do que a estatstica descritiva pode fazer para auxiliar
o gestor municipal a descrever o desempenho da arrecadao do municpio:
As arrecadaes obtidas poderiam ser colocadas numa ordem
consecutiva, por exemplo, da menor para maior e depois agrupa-
das considerando determinado critrio. A este tipo de tratamen-
to, exemplifcado na tabela 2, daremos o nome de distribuio de
freqncias, ferramenta que ser explorada com mais profundi-
dade na prxima unidade.
Poderamos dispor as informaes em uma forma grfca. O
montante arrecadado anualmente, juntamente com o ano da
arrecadao, colocado num grfco. Os valores arrecadados so
colocados no eixo vertical (eixo Y) e os anos que compreendem o
perodo de tempo so colocadas no eixo vertical (eixo X) confor-
me pode ser visualizado na fgura 1.
15
Unidade 1 - Fundamentos de Estatstica: Conceitos Bsicos e Aplicao na
Contabilidade Gerencial
Tabela 1.2 Evoluo da Arrecadao
Municipal do IPTU ordenada
do maior valor para o menor
valor arrecadado.
ANo ToTAl ARRECADADo (R$)
2007 R$ 3.565.000
2006 R$ 3.833.000
2005 R$ 3.787.000
2004 R$ 3.766.000
2003 R$ 3.530.000
2002 R$ 3.515.000
2001 R$ 3.469.000
2000 R$ 3.365.000
1999 R$ 3.234.000
1998 R$ 3.165.000
1997 R$ 3.105.000
1996 R$ 3.011.000
1995 R$ 2.879.000
1994 R$ 2.852.000
1993 R$ 2.789.000
1992 R$ 2.789.000
1991 R$ 2.776.000
1990 R$ 2.725.000
1989 R$ 2.683.000
1988 R$ 2.675.000
1987 R$ 2.665.000
1986 R$ 2.645.000
1985 R$ 2.600.000
1984 R$ 2.565.000
1983 R$ 2.565.000
1982 R$ 2.565.000
1981 R$ 2.555.000
1980 R$ 2.479.000
1979 R$ 2.463.000
1978 R$ 2.444.000
16
Curso de Ps-Graduao em Controle da Gesto Pblica
0
500000
1000000
1500000
2000000
2500000
3000000
3500000
4000000
4500000
2
0
0
7
2
0
0
5
2
0
0
3
2
0
0
1
1
9
9
9
1
9
9
7
1
9
9
5
1
9
9
3
1
9
9
1
1
9
8
9
1
9
8
7
1
9
8
5
1
9
8
3
1
9
8
1
1
9
7
9
Ano
V
a
l
o
r

A
r
r
e
c
a
d
a
d
o

(
R
$
)
Figura 1.1 Evoluo da Arrecadao Anual
Perceba que a partir destes dois procedimentos bsicos podemos tecer al-
gumas consideraes importantes, e resumidas, sobre o desempenho da arre-
cadao do imposto.
Dentro da perspectiva descritiva, a Estatstica ento poderia ser defnida
como conjunto de tcnicas para a reduo de dados quantitativos a um
pequeno nmero de termos descritivos mais convenientes e facilmente
transmissveis (LEVIN; FOX, 2004, p. 15)
Segundo Lapponi (2005, p. 5) o objetivo da estatstica descritiva organi-
zar, resumir, analisar e interpretar observaes disponveis.
Nessa perspectiva a Estatstica compreende elementos cientfcos, mas que
abrangem aspectos como bom senso e tambm arte. De qualquer forma, de
acordo com esse autor, a Estatstica deve auxiliar no processo decisrio, mes-
mo que as informaes existentes a respeito de uma determinada situao
problema sejam insufcientes.
Populao ou Uni-
verso totalidade de
itens, objetos ou pes-
soas sob considerao
(MARTINS, 2006)
Amostra uma
parte da populao
que selecionada para
anlise (MARTINS,
2006).
17
Unidade 1 - Fundamentos de Estatstica: Conceitos Bsicos e Aplicao na
Contabilidade Gerencial
1.4 sUPORtE tOMADA DE DECisO
Muitas vezes a estatstica puramente descritiva no sufciente para auxi-
liar um gestor no processo de tomada de deciso. Quando se defronta com um
conjunto de dados, o gestor, seja ele do setor privado ou pblico, est preocu-
pado no somente em descrever o que ocorre em sua empresa, mas tambm
fazer inferncias. Inferncias sobre a realidade da organizao a partir de um
nmero menor de dados ou previses acerca do comportamento dos resulta-
dos da empresa num determinado momento.
Existem diversos fatores que limitam a possibilidade de o tomador de de-
ciso trabalhar com todos os dados disponveis. Aspectos como custo de se
trabalhar com uma quantidade muito grande de dados bem como o tempo
disponvel para uma determinada ao muitas vezes impedem que seja feito
um tratamento com a totalidade dos dados.
Normalmente o conjunto completo dos dados defnido pelos pesquisa-
dores como universo ou populao. Para que seja possvel fazer inferncias
sobre as caractersticas dessa populao o gestor normalmente se utiliza de
uma parte do conjunto de dados, denominada de amostra, e a partir disso faz
as suas inferncias.
Figura 1.2 Populao e amostra
O objetivo , atravs de uma amostra representativa, conseguir captar as
principais caractersticas da populao ou universo. Na verdade os pesquisa-
dores sabem que nesse processo os erros so inevitveis. O que se procura
alcanar um nvel de erro que seja aceitvel.
Populao ou Uni-
verso totalidade de
itens, objetos ou pes-
soas sob considerao
(MARTINS, 2006)
Amostra uma
parte da populao
que selecionada para
anlise (MARTINS,
2006).
18
Curso de Ps-Graduao em Controle da Gesto Pblica
Como afrma Martins (2006), a estatstica inferencial pode ser defnida
como um conjunto de mtodos que permitem a estimao de caractersti-
cas de uma populao especfca a partir de resultados que o pesquisador
obtm em uma amostra.
Chegamos ao fm da Unidade 1. Para fxar os conceitos aqui elencados,
faa a avaliao a seguir. Caso tenha dvidas sobre o contedo estudado,
procure esclarec-las antes de seguir em frente. Este contedo bsico
para os posteriores.
Atividades de Aprendizagem 1
1) Leia atentamente a Introduo e a Unidade 1 e discorra, utilizan
do no mximo uma pgina A4, sobre estes dois aspectos funda
mentais da estatstica:
descrio da realidade;
suporte tomada de deciso.
2) Responda:
O que e para que serve a Estatstica?
Envie estas atividades para a tutoria.
19
Unidade 1 - Fundamentos de Estatstica: Conceitos Bsicos e Aplicao na
Contabilidade Gerencial
Saiba mais
Voc quer conhecer um pouco mais a histria da Estatstica? Ento consulte
o site:
http://www.eb23-guifoes.rcts.pt/NetMate/sitio/matematicos/historia-da-
estatistica.htm
Para aprofundar um pouco mais seus conhecimentos, consulte tambm:
http://pt.wikipedia.org/wiki/Estat%C3%ADstica#Hist.C3.B3ria
REsUMO DA UNiDADE
Nesta unidade voc teve seu primeiro contato com os fundamentos de Es-
tatstica. Para aprofundar seus conhecimentos foram apresentados alguns
conceitos bsicos desta cincia bem como suas possibilidades de aplicao
na contabilidade gerencial. A Estatstica pode ser compreendida como um
conjunto de ferramentas que auxiliam na transformao de um grande n-
mero de dados quantitativos em um nmero menor de termos que podem
ser mais facilmente trabalhados. Um dos principais objetivos da Estatstica
sistematizar e, a partir desse processo de organizao, analisar informaes
para dar suporte tomada de deciso.
2
Nesta unidade voc compreender a difer-
ena entre dados primrios e secundrios.
Aprender a construir histogramas de
freqncia e outras ferramentas da estats-
tica descritiva.
Unidade 2
Planejamento de uma Pesquisa com
Levantamento e Anlise de Dados Quantitativos
2
Nesta unidade voc compreender a difer-
ena entre dados primrios e secundrios.
Aprender a construir histogramas de
freqncia e outras ferramentas da estats-
tica descritiva.
Unidade 2
Planejamento de uma Pesquisa com
Levantamento e Anlise de Dados Quantitativos
22
Curso de Ps-Graduao em Controle da Gesto Pblica
Esta unidade aborda o conjunto de etapas que deve ser seguido para que um
gestor possa realizar uma pesquisa de levantamento a partir de dados quanti-
tativos. A unidade est dividia em trs partes principais.
Na primeira exploraremos o mundo da coleta de dados cuja maior nfase
ser dada s fontes de dados para pesquisa.
A segunda parte abordar a organizao dos dados explorando algumas
ferramentas da estatstica descritiva disponveis para permitir ao pesquisa-
dor descrever uma grande quantidade de dados de uma forma sinttica e,
por ltimo, sero apresentadas algumas ferramentas, softwares, que auxi-
liam enormemente no processo de anlise estatstica, tanto na perspectiva
descritiva como na perspectiva inferencial.
Estes softwares podem ser utilizados ao longo do curso para o desenvolvi-
mento de atividades especfcas.
2.1 COLEtA DE DADOs
Conforme descrito anteriormente, um dos principais objetivos da Esta-
tstica conseguir sintetizar, de maneira simples, mas tambm precisa, um
conjunto de dados quantitativos referentes a uma determinada realidade. Na
primeira parte desta unidade procuraremos explorar algumas formas de obter
os dados que serviro de base para a anlise estatstica.
As bases de dados que orientam o processo de pesquisa so normalmente
denominadas fontes. Existem inmeras fontes onde um pesquisador pode ob-
ter dados ou informaes. No Brasil, temos alguns exemplos:
Relatrios de rgos do governo O Instituto Brasileiro de Geogra-
fa e Estatstica (IBGE) o rgo do governo federal, vinculado ao
Ministrio de Planejamento, Oramento e Gesto, que rene um
conjunto de dados e informaes relacionados s mais diferentes
esferas. Por exemplo, no site do IBGE (www.ibge.gov.br) encontrare-
mos informaes relativas populao, economia e diversos outros
23
Unidade 2 - Planejamento de uma Pesquisa com Levantamento e Anlise de
Dados Quantitativos
indicadores. Alm disso, alguns estados tambm possuem rgos
especfcos que renem dados de bases diferentes que os orientam
em termos de formulao de polticas pblicas.

Figura 2.1 Pgina do IBGE
Relatrios oriundos de fontes empresariais ou outro tipo de
organizaes. Como exemplo, podemos olhar para o site da
Confederao Nacional da Indstria (www.cni.org.br) e tambm
verifcar a existncia de um grande conjunto de dados relaciona-
dos atividade industrial.
No site da Bovespa ( http://www.bovespa.com.br) tambm
possvel coletar informaes e dados de empresas que operam no
mercado de capitais no Brasil.
Pesquisas de mercado, orientadas, por exemplo, para o gosto do
consumidor, fornecem muitas vezes uma srie bastante interes-
sante de dados quantitativos a respeito do comportamento do
cliente de determinado produto.
24
Curso de Ps-Graduao em Controle da Gesto Pblica
Figura 2.2 Pgina da Confederao Nacional da Indstria
Existe uma classifcao que divide os dados obtidos para uma pesquisa em
dois grupos principais:
Dados primrios so aqueles dados obtidos diretamente pelo pesquisa-
dor. Por exemplo, o pesquisador pode estar interessado na forma de pagamen-
to de multas na prefeitura e ele realiza uma pesquisa de campo verifcando
o comportamento do contribuinte diretamente numa agncia da prefeitura.
Normalmente podemos afrmar que a fonte primria.
Dados secundrios so aqueles obtidos de outras fontes, no diretas, ou seja,
secundrias de informao. Normalmente referem-se a anurios, relatrios de
uma empresa, de um rgo ou instituio ou quaisquer outras fontes que forne-
cem dados que foram previamente coletados e sintetizados por outro ente.
Quando efetuamos uma coleta de dados, algumas precaues devem ser
tomadas pelo pesquisador. A fonte de dados deve ser confvel, os relat-
rios devem ser atualizados, as referncias e/ou fontes devem constar do
relatrio etc.
25
Unidade 2 - Planejamento de uma Pesquisa com Levantamento e Anlise de
Dados Quantitativos
Quando os dados so provenientes de um questionrio, podemos ter o re-
gistro incorreto ou inadequado das respostas, problemas de processamento ou
transferncia de dados para o computador, e at mesmo problemas relaciona-
dos ao instrumento de coleta, por exemplo, um questionrio mal elaborado
(SMAILES; MCGRANE, 2002).
2.2 ORGANizAO DE DADOs
Nesta seo abordaremos um aspecto importante da Estatstica que se
refere organizao dos dados e sua apresentao.
importante lembrar que at o momento estamos discutindo uma forma
mais sinttica de apresentar e analisar conjunto de dados quantitativos.
A forma normalmente utilizada para sintetizar e descrever dados quanti-
tativos atravs de grfcos, e o mais adequado para esta representao
grfca o histograma de freqncia.
A principal caracterstica dos histogramas de freqncia organizar os da-
dos observados a partir de agrupamentos ou classes.
Vamos tomar como exemplo os dados da tabela 2.1, abaixo, onde so apresen-
tados os dados relativos populao de trinta diferentes municpios.
Tabela 2.1 Populao de 30 Municpios
3000 18000 35000
9000 24000 35500
12000 22300 37800
15700 24700 39100
19600 26800 43400
21000 25100 45700
23600 27000 39000
27700 29900 42300
18900 27000 47000
21300 33400 52000
26
Curso de Ps-Graduao em Controle da Gesto Pblica
Cada quadro (clula da tabela) representa a populao de um municpio num
determinado momento; vamos tentar construir, a partir dos dados da tabela, um
histograma de freqncia que representa sinteticamente estas informaes.
Primeiramente necessrio determinar a amplitude dos dados. Neste caso,
trata-se de determinar o maior e o menor valor entre as trinta observaes. A
partir da tabela possvel perceber que o maior municpio apresenta uma po-
pulao de 52.000 habitantes e o menor municpio tem como populao 3.000
habitantes. A amplitude nada mais do que o espao existente entre a menor
e a maior populao, 52.000 habitantes menos 3.000 habitantes, ou seja, 49.000
habitantes.
O segundo passo determinar o nmero de classes, ou seja, o nmero de
agrupamentos para dividir o conjunto de observaes. Existem duas formas
usuais para realizar esta diviso:
A primeira maneira utilizar a frmula de Sturges, defnida abaixo como:
K= 1+3,33 log n
Onde
K= nmero aproximado de classes
e
N = nmero de observaes
Uma segunda forma, emprica, dada pela tabela 2.2, abaixo, na qual
possvel escolher diretamente, em funo do nmero de observaes, alguns
valores para o conjunto de classes.
Tabela 2.2
NMERo DE oBSERVAES NMERo DE ClASSES (AGRUPAMENToS)
Maior que 50 15 a 20 classes
Entre 25 e 50 07 a 14 classes
Menor que 25 5 ou 6 classes
Utilizando a abordagem emprica, portanto a tabela 2.2, verifcamos que
nosso exemplo apresenta 30 observaes; portanto podemos trabalhar entre
7 e 14 classes. Como o nmero de observaes, trinta, est mais prximo da
base ou piso da escala (25 a 50) vamos tomar neste exemplo um conjunto de
7 classes (k = 7).
27
Unidade 2 - Planejamento de uma Pesquisa com Levantamento e Anlise de
Dados Quantitativos
No terceiro passos vamos dividir o conjunto de observaes no nmero
de classes defnido pela tabela. Adotaremos intervalos iguais; portanto, dividi-
remos a amplitude (49.000) pelo nmero de classes (7). Com isso chegamos a
intervalos de 7.000 habitantes.
A partir dos passos anteriores temos as seguintes informaes relativas ao
exemplo:
Menor populao 3.000
Maior populao 52.000
Nmero de classes 7
Amplitude do intervalo 7.000
A partir dessas informaes possvel montar a tabela 2.3, de distribuio
de freqncia para o exemplo apresentado.
Tabela 2.3 Distribuio de Freqncia
ClASSE INTERVAlo FI FI FAC FAC
1 3.000-10.000 2 6,67% 2 6,67%
2 10.000-17.000 2 6,67% 4 13,33%
3 17.000-24.000 8 26,67% 12 40,00%
4 24.000-31.000 7 23,33% 19 63,33%
5 31.000-38.000 4 13,33% 23 76,67
6 38.000-45.000 4 13,33% 27 90%
7 45.000-52.000 3 10,00% 30 100%
Soma-trio 30 30
28
Curso de Ps-Graduao em Controle da Gesto Pblica
Nesta tabela podemos observar as seguintes informaes:
Na primeira coluna temos um nmero, que associaremos a cada
uma das classes.
Na segunda coluna temos representados os intervalos associados
a cada uma das classes.
A terceira coluna refere-se freqncia absoluta (nmero de
observaes) associada tambm a cada classe.
A quarta coluna converte a freqncia absoluta em freqncia
relativa, ou seja, a proporo de observaes dentro da classe em
frente do total de observaes.
As ltimas duas colunas referem-se s informaes relativas
freqncia acumulada (absoluta e percentual), ou seja, o nme-
ro absoluto a partir das classes, que se acumula medida que
descemos na tabela.
Outra informao importante, determinada pela notao grfca adotada,
qual efetivamente o intervalo adotado nas classes a partir da incluso ou
no de seus extremos.
Ento, por exemplo, quando temos a representao grfca:
3.000 |- 10.000
estamos tratando de um intervalo que vai de cidades com um nmero de
habitantes maior ou igual a 3.000 at cidades com nmero de habitantes me-
nor do que 10.000.
A partir das informaes tabuladas anteriormente possvel construir uma f-
gura com as freqncias, relativas e absolutas, das populaes dos municpios.
29
Unidade 2 - Planejamento de uma Pesquisa com Levantamento e Anlise de
Dados Quantitativos
Histograma
0
5
10
1
0
0
0
0
1
7
0
0
0
2
4
0
0
0
3
1
0
0
0
3
8
0
0
0
4
5
0
0
0
5
2
0
0
1
M
a
i
s
Bloco
F
r
e
q

n
c
i
a
Figura 2.3 Histograma de Freqncia relativa das Populaes
Histograma
0
5
10
1
0
0
0
0
1
7
0
0
0
2
4
0
0
0
3
1
0
0
0
3
8
0
0
0
4
5
0
0
0
5
2
0
0
1
M
a
i
s
Bloco
F
r
e
q

n
c
i
a
Figura 2.4 Histograma de Freqncia absoluta das populaes.
As distribuies de freqncia apresentadas nas fguras 2.3 e 2.4 esto pre-
sentes em todos os lugares. Se voc olhar atentamente um jornal ou revista
vai perceber que, seja no suplemento de economia discutindo a produo in-
dustrial, seja nas pginas policiais, num artigo sobre a evoluo do ndice de
violncia nos centros urbanos, alguma informao organizada por classes ou
categorias estar presente.
Para facilitar o entendimento do leitor ou dos tomadores de deciso de uma
entidade, pblica ou privada, quando se trata de jornais, revistas ou relatrios de
gesto, essa informao muitas vezes estar na forma de apresentao grfca.
30
Curso de Ps-Graduao em Controle da Gesto Pblica
Esse tipo de apresentao se justifca na medida em que tabelas, com nme-
ro excessivo de linhas e colunas, muitas vezes no so as formas mais apropria-
das para revelar aspectos importantes observados na realidade pesquisada.
Devemos sempre lembrar que o objetivo da Estatstica, na perspectiva des-
critiva em que trabalhamos at o momento, procura resumir, de forma sis-
tematizada a realidade.
Uma das formas grfcas de apresentao dos dados mais conhecida o
grfco em setores, conhecido como grfco tipo pizza. Trata-se de um gr-
fco circular, representado na fgura 2.5, onde as freqncias ou percentagens
das categorias podem ser visualmente identifcadas.
Na fgura temos a distribuio da populao dos municpios anteriormente
citados, nas categorias defnidas e representadas juntamente com o percentual
de municpios em cada uma das classes.
7%
7%
23%
27%
13%
13%
10%
1 2 3 4 5 6 7
Figura 2.5 Distribuio de Freqncias Tipo Pizza
Da mesma maneira possvel representar a distribuio dos municpios atravs
de barras (grfcos em barra). Uma representao neste tipo de grfco, relativa
novamente aos municpios e populao, pode ser visualizada na fgura 2.6.
Um polgono de
freqncias nada mais
do que a construo
de um grfco feita
atravs dos pontos su-
cessivos encontrados
nos limites de cada
categoria
31
Unidade 2 - Planejamento de uma Pesquisa com Levantamento e Anlise de
Dados Quantitativos
0,00%
5,00%
10,00%
15,00%
20,00%
25,00%
30,00%
1 2 3 4 5 6 7
Figura 2.6 Distribuio de Freqncia Tipo Barras
Por ltimo vale destacar que, quando nos defrontamos com uma distribui-
o de freqncias, podemos construir o que conhecido como polgono de
freqncias. Na fgura 2.7 pode ser visualizado um polgono de freqncia
associado distribuio dos municpios do exemplo.
Frequencia
0
1
2
3
4
5
6
7
8
9
1 2 3 4 5 6 7
Frequencia
Figura 2.7 Polgono de Freqncias
A curva fornecida pelo polgono de freqncias pode assumir diferentes
formas. Algumas distribuies so simtricas, ou seja, se pudssemos dividir
Um polgono de
freqncias nada mais
do que a construo
de um grfco feita
atravs dos pontos su-
cessivos encontrados
nos limites de cada
categoria
32
Curso de Ps-Graduao em Controle da Gesto Pblica
a curva em duas partes teramos duas metades praticamente iguais. Outras
distribuies so assimtricas e observa-se, nestes casos, uma maior freqncia
de pontos num lado ou outro da curva.
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7
Figura 2.8 Distribuio Simtrica
Na fgura 2.8 percebe-se um relativo grau de simetria em todas as fguras.
J as fguras 2.9 e 2.10 representam distribuies assimtricas: uma curva posi-
tivamente assimtrica e outra negativamente assimtrica.
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7
Figura 2.9 Distribuio Positivamente Assimtrica
33
Unidade 2 - Planejamento de uma Pesquisa com Levantamento e Anlise de
Dados Quantitativos
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7
Figura 2.10 Distribuio Negativamente Assimtrica
2.3 tECNOLOGiA DA iNFORMAO,
PACOtEs EstAtstiCOs E BAsEs DE DADOs
A utilizao cada vez mais forte de tecnologia da informao tambm se
refete no ramo da Estatstica; na verdade, como afrmam Smailes e McGrane
(2002, p. 11) o uso de tecnologia da informao tornou-se parte integrante da
anlise de dados.
34
Curso de Ps-Graduao em Controle da Gesto Pblica
Sofware, entendido como um programa de computador, nada mais que uma
seqncia de instrues, que interpretada e executada por um processador ou
por uma mquina virtual. Em um programa correto e funcional, essa seqncia
segue padres especfcos que resultam em um comportamento desejado. Um
programa pode ser executado por qualquer dispositivo capaz de interpretar e
executar as instrues de que formado.
Quando um software est representado como instrues que podem ser exe-
cutadas diretamente por um processador, dizemos que est escrito em lingua-
gem de mquina. A execuo de um software tambm pode ser intermediada
por um programa interpretador, responsvel por interpretar e executar cada
uma de suas instrues. Uma categoria especial e notvel de interpretadores
so as mquinas virtuais, como a Mquina Virtual Java (JVM), que simulam um
computador inteiro, real ou imaginado.
O dispositivo mais conhecido que dispe de um processador o compu-
tador. Atualmente, com o barateamento dos microprocessadores, existem
outras mquinas programveis, como telefone celular, mquinas de auto-
mao industrial, calculadora, etc.
(Wikipedia, Disponvel em: http://pt.wikipedia.org/wiki/Software. Acesso
em: 01/07/2008)
Existem inmeros pacotes estatsticos poderosos disponveis no mercado,
alguns de uso comercial e outros de cdigo aberto. Como exemplos de sof-
twares comerciais voltados para a Estatstica, podemos citar pelo menos dois
bastante poderosos: o SPSS e o Minitab.
O SPSS, sigla em ingls de Statistical Package for Social Science (Pacote Es-
tatstico para as Cincias Sociais) um programa muito conhecido e utilizado na
rea de Cincias Sociais aplicadas. Trata-se de um software poderoso, cujas infor-
maes a respeito de suas caractersticas e valor da licena podem ser obtidas em:
http://www.spss.com.br/
O Minitab

tambm um programa estatstico, de uso comercial, bastante


conhecido no mundo todo; informaes a seu respeito podem ser obtidas em:
http://www.minitabbrasil.com.br/
35
Unidade 2 - Planejamento de uma Pesquisa com Levantamento e Anlise de
Dados Quantitativos
Algumas vezes os fabricantes de pacotes estatsticos comerciais disponibili-
zam em seu site verses de demonstrao (demos) dos softwares para que poss-
veis usurios possam verifcar suas funcionalidades. Procure visitar estes sites
para observar as informaes disponveis a respeito deles.
Alm dos pacotes comerciais especfcos utilizados para anlise estatstica,
existem alguns outros programas bastante simples para essa funo. Talvez
um dos mais conhecidos seja a planilha eletrnica Excel

. Apesar de ser um
programa que no foi construdo especifcamente para ser uma ferramenta
estatstica, apresenta diversas funcionalidades que o tornam adequado para
projetos de anlise de dados que no sejam extremamente sofsticados. Trata-
se de uma interface bastante conhecida de muitos usurios e bastante visual o
que pode tornar o aprendizado da Estatstica mais intuitivo.
Como a maioria dos estudantes j teve algum contato com planilhas, o pro-
cesso de trabalhar funes estatsticas dentro delas fca bastante facilitado.
Dentro do universo de cdigos abertos ou softwares livres podemos encon-
trar um projeto bastante interessante voltado para o mundo da Estatstica.
Trata-se do The R Project for Statistical (Projeto R para a Estatstica) conheci-
do simplesmente como R. Trata-se de um projeto de linguagem e ambiente
para programao estatstica atravs de um software livre. Para maiores infor-
maes sobre o R consulte o site:
http://www.r-project.org/
Chegamos ao fm da Unidade 2. Para fxar os conceitos aqui elencados,
faa a avaliao a seguir. Caso tenha dvidas sobre o contedo estudado,
procure esclarec-las antes de seguir em frente. Este contedo bsico
para os posteriores.
Atividades de auto-avaliao 1
Para entrar no esprito do aprendizado assista ao vdeo 1)
no YouTube sobre conhecimento e deixe seu comentrio
no frum especfco da introduo.
http://www.youtube.com/watch?v=AXzfjQeEjYg
36
Curso de Ps-Graduao em Controle da Gesto Pblica
Procure, em revista ou jornal, informaes na forma de 2)
fgura ou grfco que representem uma sumarizao de
dados quantitativos.
Procure pesquisar algumas fontes na internet que apresen- 3)
tam dados e informaes que serviriam para trabalhos de
anlise estatstica.
Procure identifcar se seu estado ou municpio dispem de 4)
um rgo ou mais que renem informaes e dados.
Selecione, de uma das bases encontradas, um conjunto de 5)
dados e procure organizar a informao utilizando as fer-
ramentas que foram apresentadas nesta Unidade. Descre-
va as ferramentas que devem ser utilizadas e encaminhe
seu relatrio para a tutoria.
Saiba mais
Veja abaixo uma lista de sites, no Brasil e no mundo, que oferecem bases de
dados interessantes e que podem ser usadas para pesquisas que se utilizam
de ferramentas estatsticas:
IPEA www.ipea.gov.br
Fundao SEADE www.seade.gov.br
Fundao CIDE www.cide.rj.gov.br
IBGE www.ibge.gov.br
OCDE www.ocde.org
ONU www.un.org
FAO www.fao.org
37
Unidade 2 - Planejamento de uma Pesquisa com Levantamento e Anlise de
Dados Quantitativos
REsUMO DA UNiDADE
Nesta unidade aprendemos a utilizar algumas ferramentas da estatstica
descritiva e tambm a construir histogramas e polgonos de freqncia.
Tambm aprendemos a diferenciar dados primrios e secundrios bem
como conhecemos algumas ferramentas computacionais usualmente uti-
lizadas para auxiliar na anlise estatstica.
3
Nesta unidade voc compreender o que
uma medida de tendncia central, e ter
condies de construir as seguintes medi-
das de tendncia central: mdia, mediana e
moda, e poder interpretar o signifcado
destas medidas.
Unidade 3
Medidas de tendncia central
3
Nesta unidade voc compreender o que
uma medida de tendncia central, e ter
condies de construir as seguintes medi-
das de tendncia central: mdia, mediana e
moda, e poder interpretar o signifcado
destas medidas.
Unidade 3
Medidas de tendncia central
40
Curso de Ps-Graduao em Controle da Gesto Pblica
Voc j deve ter se defrontado muitas vezes com a expresso mdia em
jornais e revistas. As questes podem ser de diferentes tipos:
Qual a idade mdia do brasileiro?
Qual a renda mdia da populao do municpio?
Qual a arrecadao mdia de um determinado tributo numa determinada
municipalidade?
Na verdade uma maneira muito interessante de observar a realidade e des-
crev-la de uma forma sinttica encontrando um nmero ou expresso
que represente o que tpico daquele conjunto de dados (LEVIN; FOX,
2004).
O componente tpico daquele conjunto de dados o que conhecemos
como valor mdio do mesmo conjunto e, na estatstica, esse valor conhe-
cido como medida de tendncia central. Normalmente para uma pessoa
comum o termo mdia pode ser confuso, mas para o pesquisador esta
expresso precisa e expressa numericamente em diversas medidas de
tendncia central. As medidas apresentadas nesta unidade so trs:
mdia;
mediana e
moda.
3.1 MDiA
A medida de tendncia central mais conhecida e utilizada a mdia. A for-
ma de obter a mdia de um conjunto de dados quantitativos atravs da soma
dos valores referentes a todo o conjunto de observaes dividida pelo nmero
de observaes. A mdia pode ser expressa pela frmula matemtica:
41
Unidade 3 - Medidas de Tendncia Central
N
X
X

=
Onde:
X = mdia (normalmente se l X barra)

= somatrio (representao da letra grega sigma)


X = valor ou escore especfco dentro do conjunto de dados
N = nmero total de valores ou escores
Trata-se, portanto da soma (somatrio) de todos os valores (observaes
ou escores) dividida pelo nmero total de observaes.
Tomemos como exemplo a tabela com a populao dos municpios apre-
sentada anteriormente.
Tabela Populao de 30 Municpios
3000 18000 35000
9000 24000 35500
12000 22300 37800
15700 24700 39100
19600 26800 43400
21000 25100 45700
23600 27000 39000
27700 29900 42300
18900 27000 47000
21300 33400 52000
Para calcularmos a mdia devemos calcular o somatrio da populao e
dividi-lo pelo nmero de municpios (30). O valor encontrado uma mdia de
28.226,7 habitantes por municpio.
42
Curso de Ps-Graduao em Controle da Gesto Pblica
3.2 MEDiANA
A mediana nada mais do que o ponto mdio de uma distribuio. Trata-se
aqui no do valor mdio de um conjunto de observaes, mas sim da observa-
o que divide o seu conjunto em dois.
A mediana deve ser compreendida como o ponto que divide o conjunto de
dados em duas partes iguais.
Para calcular a mediana o primeiro passo ordenar o conjuntos de dados
ou observaes. Os nmeros devem ser ordenados em ordem crescente ou
decrescente para que assim possamos determinar o ponto ou observao que
divide o conjunto ao meio.
Existe uma frmula para determinar a posio, ou posto, da mediana:
Posio da Mediana =
2
1 + N
Onde N igual ao nmero de observaes ou dados.
A partir da frmula podemos perceber que teremos sempre dois casos es-
pecfcos. Para o caso de observaes (N) ser mpar, a mediana recair sempre
exatamente no meio da distribuio. Ento, por exemplo, quando considera-
mos os cinco valores abaixo:
Dados: 5, 7, 8, 9 e 11
teremos
Posio da Mediana =
2
1 5 +
= 3
A posio da mediana a terceira na seqncia de dados; portanto, ser
igual, e o seu valor ser 8.
No caso de N ser par, verifcaremos que no possvel determinar um pos-
to ou posio que divida exatamente o conjunto ao meio. Neste caso a media-
na estar no meio do caminho entre dois valores especfcos. Observemos o
clculo da mediana num conjunto em que o nmero de observaes par:
43
Unidade 3 - Medidas de Tendncia Central
Dados: 4, 6, 7, 8, 9 e 11
Posio da Mediana =
2
1 6 +
= 3,5
A posio da mediana se localiza entre o posto 3 e 4 do conjunto de dados.
O posto 3 corresponde ao valor 7 e o posto 4 ao valor 8. Para determinar a me-
diana, que est exatamente entre estes dois postos, basta determinar o valor
mdio das duas observaes:
Mediana =
2
8 7 +
= 7,5
Uma outra situao que deve ser elucidada aquela relativa a um conjunto
de valores que ocupam a posio mdia no conjunto e que so iguais. Consi-
dere a seguinte situao:
Dados: 4, 6, 7, 7, 7, 8, 9 e 11
Posio da Mediana =
2
1 8 +
= 4,5
Neste caso, ocupando as posies 4 e 5 temos dois valores iguais, 7, e a solu-
o bastante simples, sendo que o valor da mediana ser exatamente o valor
numrico repetido, no caso do exemplo, 7.
Para o exemplo da populao dos municpios verifcamos que a posio da
mediana pode ser obtida por:
Posio da Mediana =
2
1 30 +
= 15,5
Portanto, o valor da mediana ser o valor mdio dos valores que ocupam a
dcima quinta e dcima sexta posio:
Posio 15 =
Posio 16 =
Mediana =
2
x x +
= 7xx
44
Curso de Ps-Graduao em Controle da Gesto Pblica
3.3 MODA
A moda pode ser defnida como o valor mais freqente, mais tpico ou mais
comum numa distribuio. Para distribuies simples a moda determinada
pela simples observao do elemento que apresenta maior freqncia (MAR-
TINS, 2006). Por exemplo, no Brasil temos maior presena de adeptos da reli-
gio catlica do que de outras.
Na verdade a moda a nica medida de tendncia central de que dispomos
para variveis no nvel nominal, e ela exatamente utilizada para descrever
o valor ou escore mais comum em qualquer mensurao.
Para calcular a moda agimos por inspeo, ou seja, observamos o conjun-
to de dados para verifcar aquele que ocorre com mais freqncia. Tomemos
como exemplo o conjunto de dados abaixo:
Dados: 4, 6, 6, 8, 4, 5, 6, 8, 9 e 11
Atravs da inspeo verifcamos que a moda do conjunto anterior 6, que
na verdade o valor dentro do conjunto de dados que tem maior freqncia.
VAloR FREqNCIA
6 3
4 2
8 2
5 1
9 1
11 1
importante observar que o valor da moda 6 e no 3. Trs a freqncia de
ocorrncia do valor que no deve ser confundida com o valor em si.
45
Unidade 3 - Medidas de Tendncia Central
Podemos encontrar tambm distribuies onde existam duas ou mais mo-
das. Considere o exemplo a seguir:
Dados: 4, 6, 4, 6, 6, 8, 8, 4, 5, 6, 8, 5, 9, 11, 8, 9 e 11 com a distribuio de
freqncia explicitada abaixo.
VAloR FREqNCIA
6 4
8 4
4 3
5 2
9 2
11 2
Observe que a distribuio acima revela a existncia de duas modas: os va-
lores 6 e 8 com freqncia, para os dois valores igual a 4. Essas distribuies
so chamadas normalmente de Bimodais porque, ao contrrio das distribui-
es Unimodais, apresentam dois pontos de freqncia mxima. A Figura
exemplifca os dois tipos de distribuio
x
x
Figura 3.1 Distribuio Unimodal e Bimodal
Estudamos nesta unidade as trs medidas de tendncia central mais conhe-
cidas e utilizadas: mdia, mediana e moda. Existem algumas condies espe-
cfcas que orientam na escolha de uma ou mais destas trs medidas (LEVIN;
FOX, 2004, p. 97):
46
Curso de Ps-Graduao em Controle da Gesto Pblica
MoDA MEDIANA MDIA
Nvel de Mensurao
Nominal, ordinal,
intervalar.
Ordinal, intervalar. Intervalar.
Forma de distribuio
Mais apropriada para
a bimodal.
Mais apropriada para
assimetria acentuada.
Mais apropriada para
simetria unimodal.
Objetivo
Apresenta como
principal caracterstica
o fato de ser uma
medida de tendncia
central simples e
rpida.
Caracteriza-se por
ser uma medida
precisa, eventual-
mente utilizada para
operaes estatsticas
mais avanadas ou
para separao de
distribuio em duas
categorias.
Freqentemente uti-
lizada para operaes
estatsticas mais avan-
adas, inclusive para
a tomada de deciso,
que sero abordados
posteriormente neste
Curso.
Chegamos ao fm da Unidade 3. Para fxar os conceitos aqui elencados, faa
a avaliao a seguir. Caso tenha dvidas sobre o contedo estudado, procure
esclarec-las antes de seguir em frente. Este contedo bsico para os poste-
riores.
Atividades de Aprendizagem 1
Procure na internet ou em revistas e jornais informaes e fontes de
dados quantitativos, preferencialmente ligados rea fnanceira de seu
municpio. Procure uma srie de dados com valor de observao maior
ou igual a cinqenta (N 50) e determine as seguintes medidas de ten-
dncia central:
Mdia
Mediana
Moda (se possvel).
Elabore tambm um histograma de freqncia utilizando os conheci-
mentos adquiridos na Unidade anterior.
Procure interpretar os resultados encontrados.
47
Unidade 3 - Medidas de Tendncia Central
Saiba mais
Quer saber mais sobre alguns dos fundamentos da Estatstica?
Acesse:
http://pt.wikipedia.org/wiki/Estat%C3%ADstica#Fundamentos
REsUMO DA UNiDADE
Estudamos nesta Unidade as trs medidas de tendncia central mais conhe-
cidas e utilizadas: mdia, mediana e moda. O objetivo de cada uma delas
descrever, atravs de um nico dado, uma tendncia central de uma popu-
lao. A mdia a medida mais conhecida, mas a mediana e a moda tam-
bm so bastante utilizadas pelas facilidades envolvidas na sua obteno.
4
Nesta unidade voc compreender o
signifcado de Disperso e Variabilidade,
aprender a calcular e interpretar medidas
de variabilidade como Amplitude, Desvio
mdio, Varincia e Desvio padro.
Unidade 4
Medidas de Variabilidade
4
Nesta unidade voc compreender o
signifcado de Disperso e Variabilidade,
aprender a calcular e interpretar medidas
de variabilidade como Amplitude, Desvio
mdio, Varincia e Desvio padro.
Unidade 4
Medidas de Variabilidade
50
Curso de Ps-Graduao em Controle da Gesto Pblica
A Unidade anterior procurou aprofundar algumas medidas de tendncia
central e, para isso, foram apresentados os conceitos de mdia, mediana
e moda.
Apesar de importantes, estas medidas, quando utilizadas isoladamente,
so apenas um quadro parcial do conjunto de dados estudados.
Nesse sentido, uma medida central utilizada de forma isolada pode tanto
ajudar a compreender um fenmeno como tambm pode distorcer a per-
cepo do pesquisador sobre os dados.
Podemos ilustrar este exemplo atravs da seguinte situao:
Dois municpios (Alfa e Beta) apresentam a mesma mdia de arrecadao
de tributos.
Municpio Alfa mdia anual de arrecadao R$ 1.150.000,00
Municpio Beta mdia anual de arrecadao R$ 1.150.000,00
Podemos afrmar, com base unicamente nestes dados, que o comporta-
mento de arrecadao ao longo dos anos igual para os dois municpios
considerados?
Vamos analisar mais detalhadamente um perodo de dez anos de arrecadao
para os dois municpios. Na tabela abaixo esto representados estes dados.
Tabela 4.1 Perodo de dez anos de arrecadao
ANo AlFA BETA
1 R$ 700.000,00 R$ 500.000,00
2 R$ 800.000,00 R$ 600.000,00
3 R$ 900.000,00 R$ 800.000,00
4 R$ 1.000.000,00 R$ 900.000,00
5 R$ 1.100.000,00 R$ 1.000.000,00
6 R$ 1.200.000,00 R$ 1.200.000,00
7 R$ 1.300.000,00 R$ 1.300.000,00
8 R$ 1.400.000,00 R$ 1.500.000,00
9 R$ 1.500.000,00 R$ 1.700.000,00
10 R$ 1.600.000,00 R$ 2.000.000,00
Mdia R$ 1.150.000,00 R$ 1.150.000,00
51
Unidade 4 - Medidas de Variabilidade
Pela simples observao dos dados contidos na tabela, percebemos efetiva-
mente que a mdia de arrecadao dos municpios considerados a mesma;
entretanto, o comportamento da arrecadao ao longo dos anos para cada um
dos municpios apresenta algumas particularidades.
A observao atenta da tabela permite concluir que o municpio Alfa tem
uma disperso menor em relao ao valor mdio da arrecadao ao longo dos
anos do que a disperso do municpio Beta.
Percebe-se que no municpio Alfa os valores relativos arrecadao ao lon-
go dos anos esto mais prximos do valor mdio do perodo, diferentemente
do municpio Beta, onde a diferena de cada um dos valores medidos no pero-
do esto mais distantes da mdia. Isto quer dizer que o municpio Alfa, apesar
de apresentar ao longo dos dez anos uma arrecadao igual ao municpio Beta,
apresenta uma menor variabilidade de valores ao longo do perodo.
A partir disso percebe-se a necessidade de constituir uma medida que re-
presente a disperso dos dados, ou escores, em torno do centro de uma distri-
buio. Precisamos de uma medida que represente esta variabilidade, e esta
unidade abordar as medidas mais comuns que procuram mensurar esta dis-
perso:
Amplitude
Desvio mdio
Varincia
Desvio padro
4.1 AMPLitUDE
A amplitude uma medida no muito precisa, mas bastante rpida para
mensurar a disperso ou variabilidade dos dados de um conjunto de informa-
es. A amplitude medida pela diferena entre o valor mais alto e o valor
mais baixo de um conjunto de escores associada a uma distribuio.
52
Curso de Ps-Graduao em Controle da Gesto Pblica
A representao matemtica da amplitude :
Onde
A = Amplitude
X max = valor mais alto em uma distribuio
X mn = valor mais baixo em uma distribuio
Vamos utilizar novamente o exemplo dos municpios Alfa e Beta apresen-
tado anteriormente. Utilizando a frmula, temos:
Amplitude de arrecadao em AlfaAmplitude de arrecadao em Alfa =
900.000
Amplitude de arrecadao em Beta = mn mx
A 000 . 500 000 . 000 . 2 =
Amplitude de arrecadao em Beta = 1.500.000
Apesar da facilidade de determinar a amplitude de um determinado conjun-
to de dados, principal atributo desta medida, a maior desvantagem deste mtodo
consiste justamente no fato de depender unicamente de dois escores, dados limites
do conjunto de dados, o valor mximo e mnimo do conjunto. Desta maneira
podemos afrmar que a amplitude fornece apenas uma medida geral, mas pouco
precisa da disperso ou variabilidade de um conjunto de dados.
4.2 DEsViO MDiO
Quando abordamos, na Unidade anterior, a medida de tendncia central
conhecida como mdia, percebemos que ela representava um valor tpico
ou ilustrativo do conjunto de dados. Apesar de representar o conjunto como
um todo, a mdia no pode ser compreendida como uma medida especfca
dos dados observados.
Na verdade a grande maioria dos dados especfcos do conjunto apresenta
um valor diferente da mdia. E o desvio, numa perspectiva de um determina-
53
Unidade 4 - Medidas de Variabilidade
do dado especfco do conjunto, nada mais do que a distncia deste dado em
relao mdia do conjunto.
Portanto, para que encontremos o desvio de um determinado dado, deve-
mos subtrair a mdia do conjunto do valor especfco do dado. Por exemplo,
calculemos o desvio referente ao nono ano da arrecadao dos municpios
Alfa e Beta em relao mdia de arrecadao:
No terceiro ano temos os seguintes valores de arrecadao para cada um
dos municpios:
Alfa R$ 1.500.000,00
Beta R$ 1.700.000,00
A mdia de arrecadao para cada um dos municpios R$ 1.150.000,00.
Portanto, temos como desvio especfco para Alfa (distncia entre o dado
relativo ao ano e a mdia do conjunto).
Desvio Alfa (ano 9) R$ 350.000,00
Para o municpio Beta, temos, como desvio especfco (distncia entre o
dado relativo ao ano e a mdia do conjunto).
Desvio Beta (ano 9) R$ 550.000,00
O interesse especfco nosso, neste momento, determinar uma medida
de disperso (variabilidade) que considere todo o conjunto de dados. Para isso
podemos primeiramente calcular o desvio de cada um dos valores especfcos
do conjunto, sem considerar sinais de mais ou menos.
Para efetuar este clculo, basta subtrair do valor especfco do ano o valor da
mdia geral para cada um dos anos. Para obter uma mdia do desvio, podemos
somar todos os desvios, sem considerar o sinal de mais ou menos (mdulo do
desvio), e obter um desvio total. Dividindo-se o desvio total pelo nmero de ob-
servaes do conjunto, neste caso o nmero de anos, obtm-se o desvio mdio.
O desvio mdio pode ser representado pela frmula:

N
X X
DM


=
Onde
DM = Desvio mdio
54
Curso de Ps-Graduao em Controle da Gesto Pblica
N = nmero total de observaes ou escores
soma do mdulo dos desvios (o desvio absoluto desconsidera o sinal de
mais ou menos).
Vamos utilizar novamente o exemplo dos municpios Alfa e Beta para ilus-
trar o clculo do desvio mdio. Para isso podemos montar uma tabela onde
temos, naprimeira colunaos anos correspondentes de arrecadao.
Nasegunda colunaesto disponveis as arrecadaes em cada ano especfco.
Aterceira colunarepresenta a mdia da arrecadao para o perodo consi-
derado; portanto, permanece constante.
Naquarta coluna ilustramos o primeiro passo para o clculo efetivo do
desvio mdio, ou seja, a subtrao do escore especfco da mdia do perodo
para cada um dos anos considerados.
A quinta colunatraz o mdulo (desvio absoluto, no considera o sinal de
mais ou de menos) do desvio. O fato de ignorar os sinais fundamental para
compreender o que signifca o desvio mdio
Aps determinar o desvio absoluto de cada um dos dados do conjunto,
deve-se somar todos esses valores e dividir pelo nmero de observao, no
caso do exemplo, 10.
Tabela 4.2 Desvio mdio de Arrecadao
para o Municpio Alfa
Se fossem conside-
rados os sinais no
clculo da diferena,
os valores abaixo da
mdia neutraliza-
riam os valores ao
lado, gerando como
resultado o valor Zero.
Ao contrrio disso,
a utilizao dos m-
dulos dos desvios ou
desvio absoluto tende
a tornar a medida um
indicador importante
da variabilidade dos
dados.
55
Unidade 4 - Medidas de Variabilidade
Se fossem conside-
rados os sinais no
clculo da diferena,
os valores abaixo da
mdia neutraliza-
riam os valores ao
lado, gerando como
resultado o valor Zero.
Ao contrrio disso,
a utilizao dos m-
dulos dos desvios ou
desvio absoluto tende
a tornar a medida um
indicador importante
da variabilidade dos
dados.
ANo N ESCoRE MDIA X - XMDIo
MDUlo
(X-XMDIo)
1 R$ 700.000,00 R$ 1.150.000,00 -R$ 450.000,00 R$ 450.000,00
2 R$ 800.000,00 R$ 1.150.000,00 -R$ 350.000,00 R$ 350.000,00
3 R$ 900.000,00 R$ 1.150.000,00 -R$ 250.000,00 R$ 250.000,00
4 R$ 1.000.000,00 R$ 1.150.000,00 -R$ 150.000,00 R$ 150.000,00
5 R$ 1.100.000,00 R$ 1.150.000,00 -R$ 50.000,00 R$ 50.000,00
6 R$ 1.200.000,00 R$ 1.150.000,00 R$ 50.000,00 R$ 50.000,00
7 R$ 1.300.000,00 R$ 1.150.000,00 R$ 150.000,00 R$ 150.000,00
8 R$ 1.400.000,00 R$ 1.150.000,00 R$ 250.000,00 R$ 250.000,00
9 R$ 1.500.000,00 R$ 1.150.000,00 R$ 350.000,00 R$ 350.000,00
10 R$ 1.600.000,00 R$ 1.150.000,00 R$ 450.000,00 R$ 450.000,00
Mdia R$ 1.150.000,00 Somatrio R$ 2.500.000,00
N 10
Desvio mdio R$ 250.000,00
O resultado do desvio mdio, representado na ltima linha da tabela, de
R$ 250.000,00.
Podemos agora calcular o desvio mdio para o municpio Beta. Na tabela
abaixo esto os dados e os resultados do clculo:
Tabela 4.3 Desvio mdio de Arrecadao
para o Municpio Beta
ANo N ESCoRE MDIA X - XMDIo
MDUlo
(X-XMDIo)
1 R$ 500.000,00 R$ 1.150.000,00 -R$ 650.000,00 R$ 650.000,00
2 R$ 600.000,00 R$ 1.150.000,00 -R$ 550.000,00 R$ 550.000,00
3 R$ 800.000,00 R$ 1.150.000,00 -R$ 350.000,00 R$ 350.000,00
4 R$ 900.000,00 R$ 1.150.000,00 -R$ 250.000,00 R$ 250.000,00
5 R$ 1.000.000,00 R$ 1.150.000,00 -R$ 150.000,00 R$ 150.000,00
6 R$ 1.200.000,00 R$ 1.150.000,00 R$ 50.000,00 R$ 50.000,00
7 R$ 1.300.000,00 R$ 1.150.000,00 R$ 150.000,00 R$ 150.000,00
8 R$ 1.500.000,00 R$ 1.150.000,00 R$ 350.000,00 R$ 350.000,00
9 R$ 1.700.000,00 R$ 1.150.000,00 R$ 550.000,00 R$ 550.000,00
10 R$ 2.000.000,00 R$ 1.150.000,00 R$ 850.000,00 R$ 850.000,00
Mdia R$ 1.150.000,00 Somatrio R$ 3.900.000,00
N 10
Desvio mdio R$ 390.000,00
56
Curso de Ps-Graduao em Controle da Gesto Pblica
4.3 VARiNCiA
Apesar de ser importante no sentido de representar uma medida de disper-
so de um conjunto de dados, o desvio mdio, por uma srie de razes que
se tornaro claras a partir de agora, no mais muito utilizado. Sua utilizao
vem decaindo medida que outras ferramentas foram desenvolvidas, prxi-
mas do conceito de desvio mdio, mas que apresentam outras virtudes que
a idia de desvio mdio no possui. Mesmo assim necessrio perceber que
as bases da medida do desvio mdio so necessrias at para a construo do
desvio padro.
O clculo do desvio mdio necessita a eliminao dos nmeros negativos,
que se considerados assim, tenderiam a zerar o desvio, e faz isso trabalhando
com o desvio absoluto ou mdulo do desvio. Uma das desvantagens deste pro-
cesso, de eliminar o sinal negativo dos desvios, o fato de que este tratamento
muitas vezes inviabiliza processos estatsticos mais avanados (uma vez que
no permitem manipulaes algbricas simples) (LEVIN; FOX, 2004).
Para resolver este problema e construir uma medida de variabilidade mais
adequada para processos estatsticos avanados, a opo dos matemticos
utilizar os desvios individuais e elev-los ao quadrado. Da mesma forma que
o desvio mdio, o que se procura retirar o problema de que os nmeros ne-
gativos sejam confrontados com os positivos, levando a um resultado de soma
zero. A estratgia, neste caso, diferente, pois opta por elevar os desvios ao
quadrado, eliminando, da mesma maneira, os nmeros negativos.
O somatrio do quadrado dos desvios pode ento ser dividido pelo nmero
de observaes (N). O resultado desta frmula, expressa abaixo, denomina-
do varincia, simbolizada por
( )
N
X X
s


=
2
2
Onde
s
2
= Varincia
N = Nmero de observaes ou escores
somatrio dos quadrados dos desviosPara exemplifcar o clculo vamos
utilizar novamente o caso dos municpios Alfa e Beta. Primeiramente para
Alfa construiremos, de forma anloga ao exemplo anterior, uma tabela com
os componentes da frmula:
57
Unidade 4 - Medidas de Variabilidade
Tabela 4.4 Varincia da Arrecadao
para o Municpio Alfa
ANo N ESCoRE MDIA X - XMDIo
MDUlo
(X-XMDIo)
1 R$ 700.000,00 R$ 1.150.000,00 -R$ 450.000,00 202.500.000.000,00
2 R$ 800.000,00 R$ 1.150.000,00 -R$ 350.000,00 122.500.000.000,00
3 R$ 900.000,00 R$ 1.150.000,00 -R$ 250.000,00 62.500.000.000,00
4 R$ 1.000.000,00 R$ 1.150.000,00 -R$ 150.000,00 22.500.000.000,00
5 R$ 1.100.000,00 R$ 1.150.000,00 -R$ 50.000,00 2.500.000.000,00
6 R$ 1.200.000,00 R$ 1.150.000,00 R$ 50.000,00 2.500.000.000,00
7 R$ 1.300.000,00 R$ 1.150.000,00 R$ 150.000,00 22.500.000.000,00
8 R$ 1.400.000,00 R$ 1.150.000,00 R$ 250.000,00 62.500.000.000,00
9 R$ 1.500.000,00 R$ 1.150.000,00 R$ 350.000,00 122.500.000.000,00
10 R$ 1.600.000,00 R$ 1.150.000,00 R$ 450.000,00 202.500.000.000,00
Mdia R$ 1.150.000,00 Somatrio 825.000.000.000,00
N 10,00
Varincia 82.500.000.000,00
A diferena fundamental entre as tabelas anteriores utilizadas para o clcu-
lo do desvio mdio est na ultima coluna, onde agora para calcular a varincia,
trabalhamos com o quadrado de cada um dos desvios em relao a mdia.
Depois disso, basta somarmos o quadrado dos desvios e dividirmos este re-
sultado pelo total de observaes (N) que igual a 10. O resultado encontrado
82.500.000.000,00.
De forma similar podemos calcular a varincia associada arrecadao dos
ltimos dez anos no municpio Beta. Neste caso o valor da varincia encontra-
do 210.500.000.000,00. A tabela abaixo represente este processo:
Tabela 4.5 Varincia da Arrecadao
para o Municpio BETA
58
Curso de Ps-Graduao em Controle da Gesto Pblica
ANo N ESCoRE MDIA X - XMDIo
MDUlo
(X-XMDIo)
1 R$ 500.000,00 R$ 1.150.000,00 -R$ 650.000,00 422.500.000.000,00
2 R$ 600.000,00 R$ 1.150.000,00 -R$ 550.000,00 302.500.000.000,00
3 R$ 800.000,00 R$ 1.150.000,00 -R$ 350.000,00 122.500.000.000,00
4 R$ 900.000,00 R$ 1.150.000,00 -R$ 250.000,00 62.500.000.000,00
5 R$ 1.000.000,00 R$ 1.150.000,00 -R$ 150.000,00 22.500.000.000,00
6 R$ 1.200.000,00 R$ 1.150.000,00 R$ 50.000,00 2.500.000.000,00
7 R$ 1.300.000,00 R$ 1.150.000,00 R$ 150.000,00 22.500.000.000,00
8 R$ 1.500.000,00 R$ 1.150.000,00 R$ 350.000,00 122.500.000.000,00
9 R$ 1.700.000,00 R$ 1.150.000,00 R$ 550.000,00 302.500.000.000,00
10 R$ 2.000.000,00 R$ 1.150.000,00 R$ 850.000,00 722.500.000.000,00
Mdia R$ 1.150.000,00 Somatrio 2.105.000.000.000,00
N 10,00
Varincia 210.500.000.000,00
Uma das vantagens do valor da varincia sobre o valor encontrado pelo
clculo do desvio mdio que a primeira trata de forma mais apropriada os
valores extremos. Observe que pelo mtodo da varincia eliminamos o pro-
blema relativo aos sinais negativos elevando todos os desvios aos quadrados.
Os maiores desvios, em relao mdia, localizam-se nos extremos de uma
distribuio; portanto, a sensibilidade deste mtodo aos valores dos extremos
muito maior que o anterior. Isto signifca que a varincia mais sensvel ao
grau de desvio na distribuio (LEVIN; FOX, 2004).
4.4 DEsViO PADRO
Muito embora o conceito de varincia tenha eliminado os problemas rela-
Com objetivo de
colocar a medida
da varincia numa
perspectiva mais
apropriada que se
desenvolveu a medida
denominada Desvio
padro.
59
Unidade 4 - Medidas de Variabilidade
cionados aos nmeros negativos, ela apresenta ao pesquisador um pequeno
problema. Resolvendo o problema do sinal do desvio atravs da exponenciao,
a varincia acaba alterando tambm a unidade de medida efetiva. Observe aten-
tamente os exemplos anteriores: ao elevar ao quadrado todos os desvios, som-
los e depois dividir o somatrio por N, qual seria a unidade do resultado?
Em tese estaramos falando de reais elevados ao quadrado, ou R$
2
. Isto se
repete para qualquer unidade de medida, sejam elas habitantes, tempo, etc.
O desvio padro resolve o problema anterior, na medida em que defnido
como raiz quadrada da varincia. O clculo ento segue todos os passos ante-
riores defnidos pela varincia, ou seja, trata-se do somatrio do quadrado dos
desvios em relao mdia dividido pelo nmero de escores de cujo resultado
se tira a raiz quadrada. A frmula matemtica do desvio padro, simbolizada
por s fca defnida ento como:
( )
N
X X
s


=
2
Onde:
s = Desvio padro
N = Nmero de observaes ou escores

( )
N
X X


2
= Raiz Quadrada do somatrio dos quadrados dos desvios
dividido por N
Para facilitar, vamos exemplifcar o clculo do desvio padro tomando dire-
tamente os resultados encontrados para a varincia nos exerccios anteriores.
Para varincia da arrecadao no municpio Alfa calculamos anteriormente:
S
2
= 82.500.000.000,00.
Logo, o desvio padro associado arrecadao do municpio Alfa pode ser
calculado por:
s=
.000,00 82.500.000
s= 287.228,13.
Para Beta, tnhamos
Com objetivo de
colocar a medida
da varincia numa
perspectiva mais
apropriada que se
desenvolveu a medida
denominada Desvio
padro.
60
Curso de Ps-Graduao em Controle da Gesto Pblica
S
2
= 210.500.000.000,00
Logo:
s= 0.000,00 210.500.00
s= 458.802,79
O desvio padro permite uma interpretao melhor do que a varincia na
medida em que respeita a unidade de medida correta. No exemplo anterior os
valores 287.228,13 e 458.802,79 relacionados aos desvios de Alfa e Beta esto
em reais (R$).
O desvio padro, na forma como foi calculado at agora, representa uma
variabilidade mdia associada distribuio, na medida em que mensura a
mdia dos desvios a partir da sua mdia (LEVIN; FOX, 2004). Quanto maior
o desvio padro relacionado a uma distribuio, maior a variabilidade dos
dados dentro da distribuio.
O clculo do desvio padro extremamente til para compreender a varia-
bilidade dentro de uma dada distribuio de dados e tambm para comparar
diferentes conjuntos de distribuio. O exemplo anterior bastante evidente
ao permitir ao usurio da informao perceber que embora os dois municpios
tenham uma mdia exatamente igual em termos de arrecadao de recursos,
o comportamento da arrecadao em cada um dos municpios diferente, ao
apresentar pelo menos uma peculiaridade importante: o municpio Beta apre-
senta uma variabilidade dessa arrecadao bem maior.
Como ser discutido na prxima Unidade, o signifcado e as interpretaes
do desvio padro, da forma como foi apresentado, ser bastante importante
para interpretar os valores dentro do que chamado distribuio normal.
4.5 COMPARANDO MEDiDAs DE
VARiABiLiDADE
Esta Unidade discutiu algumas medidas de disperso ou variabilidade que
podem ser associadas a um determinado conjunto de dados. Estas medidas fo-
ram defnidas porque se percebeu que as medidas de tendncia central, apesar
61
Unidade 4 - Medidas de Variabilidade
de extremamente teis, possuam algumas limitaes. Para superar algumas
dessas limitaes, foram apresentadas quatro medidas de variabilidade:
Amplitude
Desvio mdio
Varincia
Desvio padro
Cabe agora resumir um pouco as principais caractersticas, com seus po-
tenciais e limitaes, de cada uma dessas medidas e verifcar como elas podem
ser comparadas.
A amplitude, primeira medida de variabilidade abordada, a medida mais
simples, e por isso mais limitada, da variabilidade de um conjunto de escores.
Por isso esta medida s deve ser utilizada como elemento de uma anlise ini-
cial ou preliminar de um conjunto de dados. Entretanto, o valor da amplitude
de um conjunto de dados pode se constituir numa ferramenta til para esti-
mar (mas no calcular) o desvio padro.
Numa distribuio simtrica de escores normalmente se estima que um
conjunto de trs desvios padro para cima e para baixo de uma mdia cobre
todo o conjunto de dados. No objetivo aprofundar esta discusso nesse
momento, mas este fato apresentado atravs do grfco de distribuio de
freqncias abaixo.
Desvio Padro
Percentagens Acumuladas
Percentagensde
casos em oito
pores da curva
Curva Normal
Percentis
Escores z
-4,0 -3,0 -2,0 -1,0 0 +1,0 +2,0 +3,0 +4,0
99 95 90 80 70 60 50 40 30 20 10 5 1
0,1%
-3
2,3% 15,9% 50% 84,1% 99,7% 99,9%
0,13% 0,13% 2,14% 2,14% 13,59% 13,59% 34,13% 34,13%
-2 -1 +1 0 +2 +3 +4
Figura 4.1 Grfco de Distribuio de Freqncia e Desvio padro
O grfco evidencia que, dada uma mdia de uma distribuio e um de-
62
Curso de Ps-Graduao em Controle da Gesto Pblica
terminado desvio padro, se adicionarmos a mdia, representada no grfco
como x no eixo horizontal, trs vezes o desvio padro (chegando a 3s) e, da
mesma forma, projetarmos no lado esquerdo do grfco trs vezes o desvio
padro, teremos uma distribuio que normalmente abrange todo o conjunto
de dados (amplitude da amostra).
Considerando que isto um padro que ocorre freqentemente, poder-
amos estimar que o desvio padro de um determinado conjunto de escores
seria a amplitude dividida por seis. Obviamente isto uma aproximao, mas
permite pelo menos que a pessoa interessada na informao possa se aproxi-
mar do que poderia ser um valor prximo do desvio padro do conjunto.
Uma informao importante: esta regra funciona mais adequadamente
para um grande conjunto de dados. Para um nmero mais reduzido de esco-
res, a regra de um sexto da amplitude no deve ser utilizada. Para poucos da-
dos mais adequado dividir a amplitude por um nmero menor para chegar
ao desvio.
Tomemos como exemplo os dados contidos na tabela abaixo, resultado do
conjunto de escores de arrecadao nos municpios Alfa e Beta.
Tabela 4.6 Resumo das Medidas de Variabilide
associadas arrecadao dos
municpios Alfa e Beta
AMPlITUDE
DESVIo
MDIo
VARINCIA
DESVIo
PADRo
AlFA 900.000 250.000 82.500.000.000,00 287.228,13
BETA 1.500.000 390.000 210.500.000.000,00 458.802,79
Se fssemos utilizar a regra de um sexto da amplitude, teramos para esti-
mativa de desvio padro:
ALFA =
6
000 . 900
= 150.000
63
Unidade 4 - Medidas de Variabilidade
e
BETA =
6
000 . 500 . 1
= 250.000
Que so obviamente valores mais baixos do que o desvio padro efetiva-
mente calculado, devido justamente ao fato de o nmero de escores, dez, ser
muito baixo.
A amplitude calculada usando unicamente dois valores, os extremos de
um dado conjunto de dados, mas as outras medidas de variabilidade, para se-
rem obtidas, devem considerar todos os escores.
O desvio mdio atualmente pouco usado por no ser muito til para an-
lises estatsticas mais sofsticadas. A tendncia de se utilizar o desvio padro
como uma boa medida da variabilidade, uma vez que este clculo resolve o
problema dos sinais de desvios de uma forma que mantm a consistncia nas
unidades de medida utilizadas.
Apesar das vantagens, o desvio padro tambm apresenta algumas limita-
es, sendo a principal delas o fato de se tratar de um mtodo demorado, j
que deve contemplar todo o conjunto de dados. Entretanto, com o advento
de calculadores e softwares, a utilizao desta medida se tornou cada vez mais
comum para os mais diferentes tipos de usurio.
Chegamos ao fm da Unidade 4. Para fxar os conceitos aqui elencados, faa
a avaliao a seguir. Caso tenha dvidas sobre o contedo estudado, procure
esclarec-las antes de seguir em frente. Este contedo bsico para os pos-
teriores.
Atividades de Aprendizagem 1
Procure na internet, ou em revistas e jornais, informaes e fontes de
dados quantitativos, preferencialmente ligadas rea fnanceira de seu
municpio. Procure uma srie de dados com valor de observao menor
64
Curso de Ps-Graduao em Controle da Gesto Pblica
ou igual a cinqenta e maior ou igual a trinta (50 N 30) e determine
as seguintes medidas de variabilidade:
Amplitude
Desvio mdio
Varincia
Desvio padro
Alm das medidas de variabilidade, monte um quadro que contenha as
seguintes medidas de tendncia central:
Mdia
Mediana
Elabore tambm um histograma de freqncia utilizando os conheci-
mentos adquiridos nas Unidades anteriores.
Procure interpretar os resultados encontrados.
Saiba mais
http://pt.wikipedia.org/wiki/Desvio_padr%C3%A3o
http://pt.wikipedia.org/wiki/Vari%C3%A2ncia
65
Unidade 4 - Medidas de Variabilidade
REsUMO DA UNiDADE
Nesta unidade aprofundamos mais alguns elementos da Estatstica. Nela co-
nhecemos medidas relacionadas a um universo que podem ajudar a supe-
rar algumas das limitaes naturais das medidas anteriormente estudadas.
Para isso, algumas novas medidas foram apresentadas: Amplitude, Desvio
mdio, Varincia e Desvio padro. A amplitude a medida mais simples, e
por isso mais limitada, da variabilidade de um conjunto de escores. O des-
vio mdio pouco utilizado justamente por no ser adequado para anlises
estatsticas mais sofsticadas. O desvio padro se apresenta como uma boa
medida da variabilidade, mas tambm tem limitaes, sendo a principal
delas o fato de se tratar de um mtodo demorado, j que deve contemplar
todo o conjunto de dados.
5
Nesta unidade voc compreender as
regras e as aplicaes das leis da Proba-
bilidade.
Unidade 5
Distribuio de Probabilidades
5
Nesta unidade voc compreender as
regras e as aplicaes das leis da Proba-
bilidade.
Unidade 5
Distribuio de Probabilidades
68
Curso de Ps-Graduao em Controle da Gesto Pblica
As decises que tomamos todos os dias muitas vezes contm uma parcela
bastante signifcativa de incerteza. Quando nos referimos ao mundo da
gesto esta questo mais presente (ANDERSON; SWEENEY; WILLIAMS,
2005). Pense na perspectiva de um gestor da Administrao Pblica nas
seguintes questes:
Qual a chance de determinada obra ser concluda no prazo estabelecido?
Qual a probabilidade de um novo imposto ter o grau de retorno esperado?
Qual a probabilidade de aumentar a arrecadao com a mudana de
alquota?
Todas as essas questes remetam ao que chamamos de probabilidade, a
pedra angular da tomada de deciso, segundo Levin e Fox (2004). A probabili-
dade um mtodo de testar hipteses por meio de uma anlise detalhada de
dados associados. Embora muitas vezes seja difcil de assimilar o real signif-
cado do termo probabilidade, percebemos que o utilizamos o tempo todo em
nosso cotidiano.
Vamos pensar no exemplo do meteorologista que diariamente nos informa
sobre a previso do tempo para o dia seguinte. Normalmente iremos ouvir ou
ler expresses como estas:
Existe 90% de chance de ocorrerem chuvas esparsas no perodo
Ou
A probabilidade de chuvas no domingo est abaixo de 10%
Em termos matemticos a probabilidade, que uma medida numrica da
plausibilidade de que um evento ocorrer (ANDERSON; SWEENEY; WILLIA-
MS, 2005), deve variar entre zero (0) e um (1). A utilizao de percentuais
bastante comum quando falamos de probabilidade, mas claro que ainda obe-
decer regra anterior.
A Figura abaixo retrata a probabilidade como valor numrico associado
plausibilidade.
69
Unidade 5 - Distribuio de Probabilidades
A ocorrncia do evento
to provavel quanto o improvavel
Plausibilidade Crescente de Ocorrncia
0 0,5 1,0
Figura 5.1 Probabilidade como Medida Numrica da Plausabilidade de Ocorrncia
Fonte: Anderson, Sweeney e Williams (2005, p. 137)
Uma probabilidade de 1 (100%) constitui a certeza que determinado evento
ocorrer e o contrrio, probabilidade de 0 (0%), indica tambm certeza, mas
de que determinado evento no ocorrer. Quando navegamos dentro deste
intervalo (zero at um), estaremos discutindo as possibilidades, maiores ou
menores, de que um determinado evento ocorra.
Algumas vezes a probabilidade de ocorrncia de um evento determinado
fcil de calcular. O exemplo mais utilizado o do lanamento de uma moeda
que, ao cair, pode apresentar como face superior a fgura da cara ou da coroa.
Neste caso a probabilidade de ocorrncia, tanto de Cara como Coroa, de
0,5 ou 50%. Entretanto existem situaes bem mais complexas nas quais vrias
regras devero ser aplicadas para chegar probabilidade correta.
Nesta unidade vamos procurar compreender algumas da regras bsicas da
Probabilidade. A defnio de Lewin e Fox (2004, p. 142) associa ao termo
probabilidade a possibilidade relativa da ocorrncia de um resultado ou
evento arbitrrio. Ou seja, a probabilidade associada a um evento o n-
mero de vezes que ele pode ocorrer em relao ao nmero total de vezes
que qualquer evento pode ocorrer.
Uma representao matemtica desta expresso seria:
P(A) =
n
m
Onde
m = nmero de casos favorveis ao evento A
n = nmero de casos possveis
70
Curso de Ps-Graduao em Controle da Gesto Pblica
Tomemos um exemplo bastante simples: a probabilidade de o lanamento
de um dado com seis faces tenha como resultado o nmero trs. Temos, para
este caso:
n = seis, ou seja, podemos ter como resultado valores de 1, 2, 3, 4, 5 e 6
total de seis alternativas.
Para m teremos apenas um caso, a face com o nmero trs.
Aplicando a frmula
P(A) =
6
1
= 0,1667 ou 16,67%
A = nmero 3
Da mesma maneira podemos calcular a probabilidade de retirar uma carta
ou mais de um baralho de cartas. Tomemos a chance de retirar uma fgura de
Damas, independentemente do naipe, do baralho. Para isso teramos
P(A) =
52
4
= 0,0769 ou 7,69%
A = Figura de Damas
A partir desta frmula inicial podemos deduzir uma srie de regras da Pro-
babilidade.
A primeira regra que podemos apresentar aqui a probabilidade de no
ocorrncia, conhecida como regra complementar da probabilidade.
Esta regra afrma que a probabilidade de no ocorrncia igual a um me-
nos a probabilidade de ocorrncia. No exemplo do dado, a probabilidade de
no ocorrncia de trs ser igual a um menos a probabilidade de ocorrncia,
ou seja:
P(B) = [1- P(A)] = ( 1 - 0,1667) = 0,8333
B = nmero diferente de trs
Ou para o exemplo de no tirar uma fgura de Damas do baralho de cartas,
temos:
P(B) = [1- P(A)] = ( 1 - 0,0769) = 0,9231
71
Unidade 5 - Distribuio de Probabilidades
B = Figura diferente de Damas
Outra regra bastante conhecida da probabilidade a regra de adio, que
afrma que a probabilidade de se obter um qualquer, dentre vrios resul-
tados diferentes, igual a soma de suas probabilidades separadas (LEVIN;
FOX, 2004, p.143).
Tomemos o exemplo dos dados, agora para verifcar a probabilidade de
que, ao lan-los, os resulta seja ou trs ou dois. Pela regra da adio temos:
P(A) =
6
1
= 0,1667 ou 16,67%
A = nmero 3
P(B) =
6
1
= 0,1667 ou 16,67%
A = nmero 2
P(C) = P(A) + P(B) = 0,1667 + 0,1667 = 0,3334 ou 33,34%
C = nmero 2 ou trs
A regra de adio considera sempre que os resultados so mutuamente
excludentes, ou seja, os dois no podem ocorrer simultaneamente. No caso
anterior o resultado pode ser trs oU dois, e no trs E dois.
Outra regra importante da probabilidade a regra da multiplicao. Por
esta regra a probabilidade de se obter uma combinao de resultados in-
dependentes igual ao produto de suas probabilidades individuais (LEVIN;
FOX, 2004, p. 144).
Vamos exemplifcar atravs do caso do lanamento de moedas. Verifca-
mos que a chance ou probabilidade de que o resultado do lanamento de uma
moeda seja cara de 0,5. Mas qual seria a probabilidade de, realizando dois
lanamentos consecutivos, os dois resultados serem cara?
Pela regra da multiplicao, considerando que os resultados so independen-
tes, teremos que a probabilidade de obter duas caras nos dois lanamentos seria:
72
Curso de Ps-Graduao em Controle da Gesto Pblica
P(C) = P(B) * P(A)
Onde
P(A) probabilidade de cara no primeiro lanamento = 0,5
P(B) probabilidade de cara no segundo lanamento = 0,5
P(C) = probabilidade de ocorrer cara nos dois lanamentos
P(C) = 0,5 * 0,5 = 0,25 = 25%
Por ltimo, vamos explorar um pouco o que chamado de distribuio de
probabilidade. Nas unidades anteriores voc conheceu algumas medidas de
apresentao da cincia Estatstica e, dentre elas, uma conhecida como distri-
buio de freqncia. Na Unidade 2 foi apresentado o exemplo do tamanho
da populao de diferentes municpios e essas informaes foram sumariza-
das atravs de um histograma de freqncias.
A distribuio de probabilidade semelhante quela anteriormente apre-
sentada, sendo que a nica diferena que obedece a uma teoria e no o que
foi observado efetivamente.
Para exemplifcar a construo de uma fgura que represente a distribuio
de probabilidade vamos utilizar o exemplo do lanamento de moedas:
Suponhamos que voc lance duas moedas e que voc queira saber quantas
caras obter destes lanamentos. Na distribuio de probabilidades o pesqui-
sador est justamente preocupado em saber como se dar a distribuio das
ocorrncias.
Existem trs possibilidades a partir do lanamento das duas moedas:
podemos obter nenhuma cara nas duas moedas; 1.
podemos obter uma cara nas duas moedas; 2.
podemos obter duas caras nas duas moedas. 3.
Vamos calcular as probabilidades para cada uma das possibilidades:
73
Unidade 5 - Distribuio de Probabilidades
1. A probabilidade de obter duas caras, nos dois lanamentos independen-
tes, igual probabilidade de obter duas coroas (probabilidade de no
ocorrncia), ou seja:
P(1) = 0,5 * 0,5 = 0,25.
2. A probabilidade de obter uma cara, nos dois lanamentos independen-
tes, igual a probabilidade de obter uma cara na jogada 1 e uma coroa
na jogada dois, adicionada probabilidade de obter uma coroa na joga-
da um e uma cara na jogada dois. Logo:
P(2) = 0,5 * 0,5 + 0,5 * 0,5 = 0,50.
3. A probabilidade de obter duas caras, nos dois lanamentos independen-
tes, igual probabilidade de obter duas coroas (probabilidade de no
ocorrncia) ou seja:
P(3) = 0,5 * 0,5 = 0,25.
A partir dessas dedues podemos construir uma tabela e um grfco da
distribuio de probabilidades para dois lanamentos de moeda.
Tabela 5.1 Distribuio de probabilidades
para ocorrncia de Cara em dois
lanamentos independentes de moeda
CARA PRoBABIlIDADE (P)
0 0,25
1 0,50
2 0,25
ToTAl 1,00
74
Curso de Ps-Graduao em Controle da Gesto Pblica
P
r
o
b
a
b
i
l
i
d
a
d
e
Nmero de Caras
0,60
0,50
0,40
0,30
0,20
0,10
0
Grfco 5.1 Distribuio de probabilidades para ocorrncia de cara em dois lanamentos independentes de moeda
Observe atentamente o grfco de distribuio e agora faa uma experi-
ncia. Pegue duas moedas e realiza dez lanamentos anotando o nmero de
caras e coroas para cada lanamento. Ao fnal dos dez lanamentos anote:
o nmero de vezes em que ocorreram duas caras no lanamento;
o nmero de vezes em que no ocorreram caras no lanamento;
o nmero de vezes em que ocorreu uma cara no lanamento.
O resultado encontrado igual ao que voc observa na tabela anterior.
Pode ser que isso ocorra, mas pode ser que no. A principal diferena que
o caso experimental trata de uma distribuio de freqncias real e no de
probabilidades.
A distribuio de probabilidades ideal ou terica, ou seja, representa o que
deveria acontecer, mas no o que efetivamente ocorre na realidade.
Entretanto, se aumentarmos o nmero de lanamentos, a curva de distri-
buio de freqncias fcar mais prxima da curva de distribuio de probabi-
lidades uma vez que uma distribuio de probabilidades pode ser aproximada
a uma distribuio de freqncias para um nmero infnito de provas.
75
Unidade 5 - Distribuio de Probabilidades
A curva normal que a representao grfca da distribuio de probabili-
dades est representada abaixo.
rea total = 1
Pontos de inexo
- 3 + 3 - + - 2 + 2
x
Figura 5.2 A forma da Curva Normal
Chegamos ao fm da Unidade 5. Para fxar os conceitos aqui elencados, faa
a avaliao a seguir. Caso tenha dvidas sobre o contedo estudado, procure
esclarec-las antes de seguir em frente. Este contedo bsico para os poste-
riores.
Atividades de Aprendizagem 1
Refita sobre o contedo terico que foi abordado nesta Unidade e iden-
tifque trs possibilidades prticas de utilizao das teorias da probabili-
dade em seu trabalho profssional.
Saiba mais
Aprenda mais sobre probabilidade em:
http://pt.wikipedia.org/wiki/Distribui%C3%A7%C3%A3o_de_probabilidade
76
Curso de Ps-Graduao em Controle da Gesto Pblica
REsUMO DA UNiDADE
Nesta unidade voc deve ter aprendido a trabalhar com a incerteza, atravs
do conhecimento de alguns elementos da probabilidade. A principal regra
a Probabilidade de no ocorrncia, conhecida como regra complementar
da probabilidade. Alm disso, estudamos as regras da adio e multiplica-
o e observamos o comportamento da curva de distribuio de probabi-
lidades.
Anotaes
a m d
6
Nesta unidade voc entender os
conceitos de Universo e Amostra.
Calcular o tamanho da amostra para
Universos Finitos e Infnitos e conseguir
estimar caractersticas do Universo a
partir da amostra.
Unidade 6
Teoria de Amostragem
6
Nesta unidade voc entender os
conceitos de Universo e Amostra.
Calcular o tamanho da amostra para
Universos Finitos e Infnitos e conseguir
estimar caractersticas do Universo a
partir da amostra.
Unidade 6
Teoria de Amostragem
80
Curso de Ps-Graduao em Controle da Gesto Pblica
Na maioria das vezes bastante difcil obter todos os dados de um proble-
ma para poder analis-lo ou resolv-lo. Pense nos custos envolvidos quan-
do um gestor procura conhecer um aspecto quantitativo de seu municpio
e para isso resolve coletar todos os dados disponveis.
Alm do custo, muitas vezes impossvel juntar efetivamente todos os
dados de uma realidade para uma anlise mais detalhada.
Esses so alguns dos motivos que conduzem necessidade de se trabalhar
muitas vezes com uma parte de um determinado conjunto de dados e no
com todos.
O que se procura , atravs da anlise de parte do conjunto total de dados
existentes, extrair um conjunto de informaes a respeito do total de da-
dos e no somente da parte que foi analisada.
So as tcnicas de amostragem que vo permitir este tipo de trabalho.
Para que se discutam os elementos que constituem a Teoria da Amostra-
gem, necessrio inicialmente defnir alguns termos centrais da teoria. O pri-
meiro refere-se ao conjunto total de dados, cujas caractersticas um observa-
dor pretende capturar, e que denominado de Populao ou Universo.
Normalmente falamos de populao quando nos referimos ao conjunto de
habitante de um lugar (RICHARDSON, 1999). Numa perspectiva estatstica,
a populao ou universo pode ser efetivamente o conjunto total de indiv-
duos que trabalham em uma organizao. Estes indivduos (populao ou
universo) possuem caractersticas distintas que so alvo do interesse de um
pesquisador.
Cada indivduo de uma populao denominado elemento. Um grupo de
indivduos, tomados em conjunto para identifcar determinadas caractersticas
de uma populao, defnido como amostra.
Nesse sentido, a princpio, uma amostra poderia ser defnida como qual-
quer subconjunto de uma populao ou universo.
Os parmetros so os
valores caractersticos
de uma populao ou
universo. Podemos
citar, por exemplo:
Mdia, Desvio padro,
Proporo, Coef-
ciente de Correlao
etc. Espera-se, com a
utilizao da teoria da
amostragem, conse-
guir as caractersticas
da populao atravs
da observao das
caractersticas da
amostra. Estes valores,
para a amostra, so
denominados Estatsti-
cos da amostra.
Uma amostra repre-
sentativa aquela que
tem a mesma compo-
sio ou estrutura da
populao.
81
Unidade 6 - Teoria da Amostragem
importante ressaltar que muitas vezes perceberemos que a especifcao
de uma populao ou amostra poder se alterar, dependendo da perspectiva
em que se trabalha.
Uma sala de aula, composta por trinta alunos, pode ser uma amostra de
todos os alunos que estudam em uma escola, mas tambm pode ser o universo
ou populao se o interesse fosse por um determinado perfl especfco da sala
e voc, como pesquisador, tomasse alguns dos componentes dessa sala como
amostra.
Atravs de procedimentos de amostragem, o pesquisador se torna apto a
resolver problemas de trs tipos principais:
Estimar as caractersticas (parmetros) de uma populao a partir dos 1.
dados estatsticos de sua amostra.
Determinar se uma amostra provm de uma populao da qual se co- 2.
nhecem suas caractersticas (parmetros).
Determinar se duas ou mais amostras, com dados estatsticos conheci- 3.
dos, tm origem numa mesma amostra.
Talvez voc esteja se questionando neste momento:
Seria possvel, a partir de qualquer amostra, responder s questes ante-
riormente levantadas?
Para que possamos responder a esta questo necessrio esclarecer dois
aspectos principais:
Primeiramente, para que uma amostra fornea, a partir de seus dados es-
tatsticos, os parmetros de uma populao, fundamental que ela represente
efetivamente esta populao ou universo. O termo utilizado normalmente
representatividade.
Em segundo lugar, as amostras tm que cumprir algumas exigncias do pla-
no experimental. Isto quer dizer que ao escolher os elementos que integraro
a amostra, deve-se medir ou controlar as variveis independentes que podem
infuir na varivel dependente, nos grupos experimentais ou de controle e que,
desse modo, podem vieses nas interpretaes das hipteses.
Os parmetros so os
valores caractersticos
de uma populao ou
universo. Podemos
citar, por exemplo:
Mdia, Desvio padro,
Proporo, Coef-
ciente de Correlao
etc. Espera-se, com a
utilizao da teoria da
amostragem, conse-
guir as caractersticas
da populao atravs
da observao das
caractersticas da
amostra. Estes valores,
para a amostra, so
denominados Estatsti-
cos da amostra.
Uma amostra repre-
sentativa aquela que
tem a mesma compo-
sio ou estrutura da
populao.
82
Curso de Ps-Graduao em Controle da Gesto Pblica
As amostras podem ser divididas em dois tipos principais:
Amostras probabilsticas;
Amostras no probabilsticas.
Nas amostras no probabilsticas os elementos que constituiro a amostra
so escolhidos por critrios que podem ser acidentais ou intencionais. J na
amostra probabilstica (probabilstica, aleatria ou ao acaso), que ser jus-
tamente aquela trabalhada na Estatstica, qualquer elemento da populao
ou universo deve ter a mesma chance de ser escolhido como membro da
amostra.
O que defne se uma amostra aleatria justamente o fato de que qualquer
elemento do universo deve ter a mesma probabilidade (diferente de zero) de fazer
parte dela. Para que se cumpra este pr-requisito necessrio ter a listagem de to-
dos os componentes que fazem parte de uma determinada populao. Com isso
possvel selecionar ao acaso os membros da populao que constituiro a amostra,
deixando a eles a mesma chance de fazer parte da amostra.
A listagem de todos os componentes, ou universo, defnida como marco de
referncia ou base da amostragem (RICHARDSON, 1999). No caso em que se
escolha diretamente desta lista a amostragem denominada aleatria ou simples.
A representatividade das amostras guiada pelas leis da probabilidade, ou
seja, a forma como selecionamos a amostra diante da populao defnir
a sua.
Importante observar o que fazemos com um elemento retirado da popula-
o para compor a amostra: caso o elemento volte para a populao, a amos-
tra defnida como com reposio de elementos. Em caso contrrio, teramos
uma amostra sem reposio.
A utilizao de amostra aleatria simples apresenta algumas vantagens
importantes:
no requer muito conhecimento da populao;
83
Unidade 6 - Teoria da Amostragem
bastante fcil de calcular;
facilita a anlise.
Mesmo assim podemos citar uma desvantagem importante da utilizao
de amostra aleatria simples, que o fato de no garantir que casos minorit-
rios sejam includos quando a populao ou universo for muito grande.
Existem dois princpios bsicos que se relacionam diretamente com a repre-
sentatividade da amostra:
a) quanto maior o percentual da amostra diante da populao, maior a
chance de a amostra ser representativa;
N
n
= frao da amostragem onde n igual ao tamanho da amostra e N o
tamanho da populao
b) para uma populao igual ou acima de 10.000 (N 10.000), uma frao
de amostragem de 0,1 (10%) apresenta uma probabilidade aceitvel de
ser representativa.
6.1 tAMANhO DAs AMOstRAs
Percebe-se, a partir do exposto anteriormente, que no basta constituir
uma poro de elementos para ter uma amostra da populao. tambm
necessrio que esse conjunto represente efetivamente as caractersticas pes-
quisadas da populao em estudo.
84
Curso de Ps-Graduao em Controle da Gesto Pblica
Para isso ela deve incluir um nmero sufciente de elementos escolhidos de
forma aleatria ou ao acaso, para que certo grau de segurana estatstica
seja conferido as inferncias que podemos fazer a partir dela.
Neste momento compreenderemos a forma para determinar ou calcular o
tamanho de amostra necessrio para que essa representatividade seja al-
canada, dentro de alguns padres de segurana estabelecidos, bem como
para atender a alguns aspectos prticos como custo, tempo etc., necess-
rios para qualquer trabalho de pesquisa.
De uma forma bastante simplifcada, o tamanho de uma amostra vai de-
pender basicamente dos quatro fatores relacionados abaixo:
Amplitude da Populao
Nvel de Confana pretendido
Erro de estimao permitido
Proporo da caracterstica pesquisada na Populao.
Amplitude
Considerando este aspecto, uma populao pode ser fnita ou infnita. Po-
pulaes ou universos fnitos so aqueles menores que 100.000 (N 100.000)
e universos infnitos so aqueles que ultrapassam este limite (100.000). Esta
diferena importante na determinao do tamanho da amostra, uma vez que
conduz frmulas diferentes. Em universos infnitos a amplitude no infuen-
cia na frmula, diferentemente do caso de universos fnitos.
Nvel de Confana
Mostramos anteriormente, atravs da Distribuio de Probabilidades, que
uma distribuio tem a tendncia de se ajustar forma de distribuio normal,
de acordo com a fgura abaixo.
85
Unidade 6 - Teoria da Amostragem
Desvio Padro
Percentagens Acumuladas
Percentagensde
casos em oito
pores da curva
Curva Normal
Percentis
Escores z
-4,0 -3,0 -2,0 -1,0 0 +1,0 +2,0 +3,0 +4,0
99 95 90 80 70 60 50 40 30 20 10 5 1
0,1%
-3
2,3% 15,9% 50% 84,1% 99,7% 99,9%
0,13% 0,13% 2,14% 2,14% 13,59% 13,59% 34,13% 34,13%
-2 -1 +1 0 +2 +3 +4
Figura 6.1 Forma da Curva Normal
A fgura mostra que os valores centrais na distribuio so os mais eleva-
dos, ou seja, repetem-se com mais freqncia do que os valores nos extremos
da curva.
A partir da compreenso do comportamento da distribuio, que obedece
a forma normal, podemos defnir o nvel de confana como rea da curva que
se pretende abranger. Por exemplo, se o pesquisador deseja fazer estimativas
com 90% de segurana, ele deve considerar 90% da rea sob a curva de dis-
tribuio normal. Em cincias sociais normalmente se trabalha com um nvel
de confana de 95% mas quando se deseja um nvel de confana maior, este
percentual dever ser superior a isso.
Erro de Estimao
J sabemos que o resultado da amostra no ser exatamente igual popu-
lao que se procura representar. Na verdade sabemos que podem ocorrer
erros de medio, mas que esses erros diminuem medida que o tamanho da
amostra cresce. Na rea de Cincias Sociais no aceito um erro de estimao
superior a 6%, sendo que na maioria das pesquisas vamos observar estatsticos
trabalhando com erros de estimao entre 5% e 4%.
Proporo da Caracterstica
O ltimo fator a ser considerado aqui na determinao do tamanho da
amostra o que se conhece por estimativa de proporo (p). Trata-se na verda-
86
Curso de Ps-Graduao em Controle da Gesto Pblica
de de uma estimativa da caracterstica pesquisada no universo ou populao.
Este tipo de estimativa muito difcil de obter em Cincias Sociais ( j que no
fcil conseguir estimativas prvias da caracterstica do universo) e por isso
bastante comum trabalhar com estimativa de proporo de 50%.
A partir das informaes a respeito dos quatro fatores apresentados pode-
mos calcular o tamanho da amostra atravs de duas frmulas, uma destinada
para universos fnitos e a outra para universos infnitos.
tamanho da Amostra para Universo (Populao) infnito
2
2
e
q Z
n

=
r
Onde
n = Tamanho da Amostra
Z = abscissa da distribuio normal padro, fxado um nvel de confana:
Se o nvel for de 95,0 % - Z = 1,96
Se o nvel for de 95,5 % - Z = 2,00
Se o nvel for de 99,0 % - Z = 2,57
r = Proporo das Caractersticas no Universo (percentual)
q = Proporo no Universo que no possui a caracterstica (q = 100 p)
e = Erro de estimao
Percebemos, observando atentamente a frmula, que, independentemente da
amplitude, o tamanho da amostra no deve variar, dados os fatores estabelecidos.
tamanho da Amostra para Universo (Populao) Finito
q Z N e
N q Z
n
+

=
r
r
2 2
2
) 1 (
87
Unidade 6 - Teoria da Amostragem
Onde
n = Tamanho da Amostra
N = Tamanho da Populao ou Universo
Z = abscissa da distribuio normal padro, fxado um nvel de confana:
Se o nvel for de 95,0 % - Z = 1,96
Se o nvel for de 95,5 % - Z = 2,00
Se o nvel for de 99,0 % - Z = 2,57
r = Proporo das Caractersticas no Universo (percentual)
q = Proporo no universo que no possui a caracterstica (q = 100 p)
e = Erro de estimao
Novamente possvel perceber que no caso de uma Populao ou Universo
fnito o tamanho da amostra depende deste tamanho.
Chegamos ao fm da Unidade 1. Para fxar os conceitos aqui elencados,
faa a avaliao a seguir. Caso tenha dvidas sobre o contedo estudado,
procure esclarec-las antes de seguir em frente. Este contedo bsico
para os posteriores.
Atividades de Aprendizagem 1
Considere os dois casos abaixo:
Voc precisa determinar o tamanho de uma amostra (n) 1)
que seja representativa de uma populao (N) de 60.000
cadastros de proprietrios de imveis que esto em dia
com o pagamento do Imposto Predial Territorial Urbano
(IPTU).
Considere as seguintes condies:
n = Tamanho da Amostra
88
Curso de Ps-Graduao em Controle da Gesto Pblica
N = Tamanho da Populao ou Universo
r = Proporo das Caractersticas no Universo (percentual) = 50
q = Proporo no universo que no possui a caracterstica (q = 100 p)
= 50
e = Erro de estimao = 5
Calcule o tamanho da amostra (n) para os trs nveis de a)
confana abaixo:
95,0 % Z = 1,96
95,5 % Z = 2,00
99,0 % Z = 2,57
O que acontece com o tamanho da amostra medida que b)
mudamos os nveis de confana? Explique:
Considere os dois casos abaixo:
2) Voc precisa determinar o tamanho de uma amostra (n)
que seja representativa de uma populao (N) de 250.000
cadastros de proprietrios de imveis que esto em dia
com o pagamento do Imposto Predial Territorial Urbano
(IPTU).
Considere as seguintes condies:
n = Tamanho da Amostra
N = Tamanho da Populao ou Universo
r = Proporo das Caractersticas no Universo (percentual) = 50
q = Proporo no universo que no possui a caracterstica (q = 100 p)
= 50
e = Erro de estimao = 5
a) Calcule o tamanho da amostra (n) para os trs nveis de
confana abaixo:
95,0 % Z = 1,96
89
Unidade 6 - Teoria da Amostragem
95,5 % Z = 2,00
99,0 % Z = 2,57
b) O que acontece com o tamanho da amostra a medida em
que mudamos os nveis de confana?
c) Se mudssemos o tamanho da Populao ou Universo
para 500.000 cadastros, o que aconteceria com o tamanho
da amostra? Explique:
Saiba mais
Acesse o link abaixo e amplie seus conhecimentos:
http://www.tj.ce.gov.br/esmec/pdf/metodos_quantitativos_censo%20
e%20amostra.pdf
REsUMO DA UNiDADE
Nesta unidade voc foi apresentado aos conceitos de Universo e Amostra.
O Universo compreende o conjunto de todos os indivduos, ou dados, de
uma determinada populao. A amostra refere-se a uma parte da popula-
o que pode reproduzir caractersticas da populao que se quer estudar.
Voc calcular o tamanho da amostra para Universos Finitos e Infnitos e
conseguir estimar caractersticas do Universo a partir da amostra. A re-
presentatividade das amostras obtida pela aplicao das leis da probabi-
lidade, ou seja, a forma como selecionamos a amostra frente populao
defnir a representatividade da amostra. O tamanho de uma amostra que
represente adequadamente uma populao depende basicamente de qua-
tro fatores: amplitude, nvel de confana pretendido, erro de estimao
permitido e proporo da caracterstica pesquisada na populao.
7
Nesta unidade voc compreender os
conceitos de varivel dependente e inde-
pendente. Conseguir construir um
diagrama de disperso e calcular o coef-
ciente de Correlao Linear de Pearson.
Unidade 7
Correlao
7
Nesta unidade voc compreender os
conceitos de varivel dependente e inde-
pendente. Conseguir construir um
diagrama de disperso e calcular o coef-
ciente de Correlao Linear de Pearson.
Unidade 7
Correlao
92
Curso de Ps-Graduao em Controle da Gesto Pblica
At o momento exploramos uma sria de ferramentas da Estatstica que nos
ajudam a compreender a realidade expressa atravs de dados quantitativos.
Para isso utilizamos ferramentas da estatstica descritiva para descrever um
conjunto de dados, estimamos medidas de tendncia de uma varivel e tam-
bm exploramos aspectos de probabilidade relacionados a uma determina-
da caracterstica de um conjunto de dados.
Esta caracterstica usualmente denominada varivel, ou seja, um aspecto que
se modifca ao longo do conjunto de elementos de uma populao.
A partir de agora trabalharemos com estimativas, no de tendncia de
uma nica varivel, mas sim com a medida da relao que pode ocorrer
entre duas variveis. Esta medida de fora entre pares de variveis deno-
minada de correlao.
Correlao uma medida da relao entre duas variveis, sendo que normal-
mente os dados sero representados por pares ordenados (LARSON; FARBER,
2004). Normalmente chamaremos estas duas variveis de:
Varivel independente, plotada convencionalmente no eixo horizontal X
Varivel dependente, plotada usualmente no eixo vertical Y
A varivel independente (X) tambm conhecida como varivel explanat-
ria, e a varivel dependente (Y), como varivel de resposta.
Muitas vezes podemos, olhando um conjunto de dados emparelhados, su-
por a existncia de algum tipo de associao entre eles. Tomemos por exemplo
um beb recm-nascido, que ao longo do tempo apresenta modifcaes de
peso (kg) e estatura (cm). Podemos construir uma tabela com duas colunas, na
qual a primeira representa o peso e a segunda a estatura. Logo perceberemos,
observando tal tabela, que aparentemente a medida que a altura aumenta, o
peso tambm sofre um incremento, o que indicaria uma associao entre estas
duas variveis.
93
Unidade 7 - Correlao
Mas, mesmo percebendo que existe esta associao, qual efetivamente
sua fora? E se pegarmos a evoluo do peso e altura num adolescente de
15 anos ou mesmo num adulto de 30 anos, o que acontece?
Na verdade as correlaes variam efetivamente no que diz respeito sua
intensidade. Podemos visualizar mais facilmente a variao da fora de uma
correlao quando analisamos um diagrama ou grfco de disperso. A Figura
abaixo ilustra como construdo um diagrama de disperso que associa valor
pago pelo aluguel com renda familiar (ambos os valores em R$).
Renda Familiar
3000 2000 1000 0
V
a
l
o
r

p
a
g
o

p
e
l
o

A
l
u
g
u
e
l
400
300
200
100
0
Figura 7.1 Diagrama de Disperso
Alm disso, a direo da associao (ou correlao) entre duas variveis
tambm pode variar. Quando existe uma relao diretamente proporcional
entre as variveis, ou seja, quando uma varivel X aumenta e a outra varivel
Y tambm aumenta, dizemos que existe uma correlao positiva entre as va-
riveis. No caso de associao inversamente proporcional entre as variveis
(X aumenta e Y diminui, por exemplo), dizemos que a correlao negativa.
94
Curso de Ps-Graduao em Controle da Gesto Pblica
Alguns tipos de correlao so mostrados no quadro abaixo.
Linear Positiva
Correlao Diagrama de disperso Descrio
Nula
Linear Negativa
Linear Perfeita
Positiva
Linear Perfeita
Negativa
y
x
y
x
y
x
y
x
x
y
A correlao positiva se os valores crescentes ou decres-
centes x e y estiverem ligados. Ou seja, quando y cresce, x
cresce tambm. Quando y decresce, x decresce tambm.
Nos modelos de correo linear positiva, o valor do coe-
ciente de correlao de Pearson, r , positivo : 0<r<1
A correlao linear perfeita positiva apenas ocorre quando
os valores de x e y yesto perfeitamente alinhados. Nessas
situaes, o valor do coeciente de correlao de Pearson,
r , igual unidade: r = 1
A correlao negativa percebida quando os valores cres-
centes de x ou y esto associados a valores decrescentes de
y ou x, respectivamente. Ou seja, quando y cresce, x de-
cresce e vice-versa. o valor do coeciente de corelao de
Pearson, r , negativo: -1 < r <0
A correlao considerada perfeita negativa quando os
valores de x e y estiverem perfeitamente alinhados, mas
em sentido contrrio. Nessa situao, o valor do coecien-
te de correlao de Pearson, r , iual a menos um: r = -1
A correlao nula pe percebida quando no h relao
entre x e y. As variveis ocorrem independentemente.
Nestas situaes, o valor do coeciente de correlao de
Pearson, r , nulo: r = 0.
Quadro 7.1 Tipos de Correlao
Fonte: Bruni (2007, p.286)
Nos dois casos anteriores verifcamos que a correlao linear, ou seja, a
associao entre as variveis obedece a uma equao linear. Mas nem sempre
a relao entre as variveis ser linear. Existem medidas de associao fortes
entre variveis que obedecem a outras formas que no uma reta.
A partir das consideraes anteriores podemos agora tentar medir a fora
da associao entre duas variveis. Esta medida chamada de coefciente de
correlao e expressa numericamente a intensidade e a direo de uma corre-
lao linear. Normalmente os coefcientes de correlao variam de menos um
(-1) at mais um (+1).
95
Unidade 7 - Correlao
Dentro desses limites de variao podemos afrmar que:
Coefciente de correlao = -1,00 correlao negativa perfeita
Coefciente de correlao = 0,00 no existe correlao
Coefciente de correlao = +1,00 correlao positiva perfeita
A partir dos intervalos menores estabelecidos anteriormente podemos dizer que
Coefciente de correlao = - 0,60 correlao negativa forte
Coefciente de correlao = - 0,30 correlao negativa moderada
Coefciente de correlao = + 0,60 correlao positiva forte
Coefciente de correlao = + 0,30 correlao positiva moderada
Esses limites so um pouco subjetivos, e no caso deste mdulo foram retira-
dos de Levin e Fox (2004). O importante perceber que quanto mais prximo
de um (positivo ou negativo) mais forte associao (direta ou inversamente
proporcional); e quanto mais perto de zero, menor a intensidade da associao
entre as variveis.
Uma das medidas mais conhecidas para mensurar a fora da associao
entre duas variveis o coefciente de correlao de Pearson (r). O coefciente
de Pearson calculado a partir dos produtos dos desvios de X e Y a partir de
suas respectivas mdias. A frmula do Coefciente de correlao de Pearson (r)
apresentada abaixo:
( )( )
( ) ( )




=
2
2
2
2
Y Y n X X n
Y X XY n
r
Onde:
N = nmero de pares ordenados
e
X e Y formam o conjunto de variveis independentes e dependentes.
96
Curso de Ps-Graduao em Controle da Gesto Pblica
Para calcular o coefciente de correlao, vamos seguir os passos abaixo:
I Obter a soma dos valores X

X
II Obter a soma dos valores Y

Y
III
Multiplicar cada valor X por
cada valor Y e calcular o soma-
trio X multiplicado por Y
Y X

IV
Elevar ao quadrado cada valor
de X e obter seu somatrio
2

X
V
Elevar ao quadrado cada valor
de Y e obter seu somatrio
2

Y
VI
Utilizar todos os valores cons-
trudos anteriormente e aplicar
na frmula do coefciente de
correlao
( )( )
( ) ( )




=
2
2
2
2
Y Y n X X n
Y X XY n
r
Vamos utilizar um exemplo para esclarecer todo o procedimento:
Considere a tabela de dados abaixo, onde a primeira coluna expressa o gas-
to com propaganda, e a segunda coluna, o resultado de vendas, sendo que
todos os valores esto expressos em reais. As trs colunas esquerda so adi-
cionadas a tabela para facilitar o procedimento de clculo a partir da frmula
que foi deduzida.
Tabela 7.1
X Y X * Y X2 Y2
3,36 270,00 907,20 11,29 72.900,00
2,24 220,80 494,59 5,02 48.752,64
2,80 264,00 739,20 7,84 69.696,00
2,52 231,60 583,63 6,35 53.638,56
2,38 212,40 505,51 5,66 45.113,76
3,64 288,00 1.048,32 13,25 82.944,00
1,96 216,00 423,36 3,84 46.656,00
2,24 220,80 494,59 5,02 48.752,64
2,80 223,20 624,96 7,84 49.818,24
3,08 258,00 794,64 9,49 66.564,00
x
27,02
y
2.404,80
x.y
6616,01
x2
75,60
y2
584.835,84
97
Unidade 7 - Correlao
Para calcular o coefciente de correlao, vamos seguir os passos abaixo:
I Obter a soma dos valores X

X
II Obter a soma dos valores Y

Y
III
Multiplicar cada valor X por
cada valor Y e calcular o soma-
trio X multiplicado por Y
Y X

IV
Elevar ao quadrado cada valor
de X e obter seu somatrio
2

X
V
Elevar ao quadrado cada valor
de Y e obter seu somatrio
2

Y
VI
Utilizar todos os valores cons-
trudos anteriormente e aplicar
na frmula do coefciente de
correlao
( )( )
( ) ( )




=
2
2
2
2
Y Y n X X n
Y X XY n
r
Vamos utilizar um exemplo para esclarecer todo o procedimento:
Considere a tabela de dados abaixo, onde a primeira coluna expressa o gas-
to com propaganda, e a segunda coluna, o resultado de vendas, sendo que
todos os valores esto expressos em reais. As trs colunas esquerda so adi-
cionadas a tabela para facilitar o procedimento de clculo a partir da frmula
que foi deduzida.
Tabela 7.1
X Y X * Y X2 Y2
3,36 270,00 907,20 11,29 72.900,00
2,24 220,80 494,59 5,02 48.752,64
2,80 264,00 739,20 7,84 69.696,00
2,52 231,60 583,63 6,35 53.638,56
2,38 212,40 505,51 5,66 45.113,76
3,64 288,00 1.048,32 13,25 82.944,00
1,96 216,00 423,36 3,84 46.656,00
2,24 220,80 494,59 5,02 48.752,64
2,80 223,20 624,96 7,84 49.818,24
3,08 258,00 794,64 9,49 66.564,00
x
27,02
y
2.404,80
x.y
6616,01
x2
75,60
y2
584.835,84
Aplicando os valores encontrados na frmula:
( )( )
( ) ( )




=
2
2
2
2
Y Y n X X n
Y X XY n
r
Onde:
n = 10 e
x = 27,02
y = 2.404,80
x.y = 6616,01
x
2
= 75,60
y
2
= 584.835,84
Assim temos:
( ) ( )
( ) ( )
2 2
80 , 2404 84 , 584835 10 02 , 27 60 , 75 10
80 , 2404 02 , 27 01 , 6616 10


= r
909 , 0 = r
O que indica uma correlao positiva forte: r maior que zero e prximo de um
Existem alguns requisitos que devem ser atendidos para que o coefciente
de Pearson seja aplicado corretamente:
a relao entre as variveis deve ser linear;
as variveis devem ser medidas no nvel intervalar;
a amostragem deve ser aleatria;
a distribuio dos dados, variveis X e Y, deve obedecer curva
normal.
98
Curso de Ps-Graduao em Controle da Gesto Pblica
Por ltimo devemos fcar atentos ao fato de que se duas variveis esto for-
temente correlacionadas, no signifca necessariamente que exista uma rela-
o de causa e efeito entre elas. Para determinar causalidade entre as variveis,
geralmente necessrio um estudo mais aprofundado.
Chegamos ao fm da Unidade 7. Para fxar os conceitos aqui elencados,
faa a avaliao a seguir. Caso tenha dvidas sobre o contedo estudado,
procure esclarec-las antes de seguir em frente. Este contedo bsico
para os posteriores.
Atividades de Aprendizagem 1
A tabela abaixo relaciona o nmero de horas estudadas antes de uma
avaliao e o resultado obtido na prova. Voc est interessado em ve-
rifcar se existe uma associao entre estas duas variveis. Para isso, a
partir da tabela, determine o coefciente de correlao de Pearson (r) ou
o ndice de correlao entre as variveis abaixo:
(utilize a frmula a partir da montagem da tabela dos somatrios que foi
abordada no exemplo do mdulo)
NMERo DE HoRAS DE ESTUDo NoTA DA AVAlIAo
7,00 8,00
6,00 6,00
8,00 8,00
9,00 9,00
4,00 5,00
3,00 4,00
5,00 7,00
6,00 5,00
7,00 8,00
4,00 5,00
Procure uma srie de dados pareados do seu interesse e calcule o coefciente
de correlao de Pearson (r). Utilize uma srie com n maior que 15.
99
Unidade 7 - Correlao
Saiba mais
http://pt.wikipedia.org/wiki/Coefciente_de_Correla%C3%A7%C3%A3o_Line-
ar_de_Pearson
REsUMO DA UNiDADE
Nesta unidade aprendemos as diferenas entre variveis independentes e
dependentes e exploramos uma importante medida de associao entre
variveis, o coefciente de correlao. Notamos que a associao entre va-
riveis pode ser mensurada variando de um (correlao perfeita positiva)
e menos um (correlao perfeita negativa). Para utilizar adequadamente o
coefciente de correlao de Pearson, alguns aspectos devem ser considera-
dos: a relao entre as variveis deve ser linear, as variveis devem ser medi-
das no nvel intervalar, a amostragem deve ser aleatria e a distribuio dos
dados, variveis X e Y, deve obedecer curva normal.
8
Nesta unidade voc conseguir determi-
nar a equao da reta de regresso e
entender as aplicaes da Regresso
Linear
Unidade 8
Regresso
8
Nesta unidade voc conseguir determi-
nar a equao da reta de regresso e
entender as aplicaes da Regresso
Linear
Unidade 8
Regresso
102
Curso de Ps-Graduao em Controle da Gesto Pblica
Uma anlise de regresso nos fornece uma funo matemtica que procura
descrever a relao entre duas ou mais variveis. A equao resultante da an-
lise de regresso pode ser utilizada para predizer ou estimar valores futuros
(BRUNI, 2007).
Devemos lembrar que ao estudarmos as medidas de associao entre as variveis
utilizvamos um diagrama conhecido como grfco de disperso.
Estes grfcos podiam obedecer a determinadas formas, sendo que a me-
dida estudada foi o coefciente de correlao de Pearson (r), que media a
intensidade de uma associao linear.
Na anlise de regresso procuramos no mais estabelecer a fora da asso-
ciao entre as variveis, mas sim a natureza desta relao.
Na regresso procura-se determinar a equao matemtica que permita
predizer o valor de uma varivel dependente Y, dado um valor para a vari-
vel independente X.
No caso da regresso linear, objeto deste curso, o que se procura a equa-
o matemtica da reta que representa o melhor relacionamento numrico
linear entre o conjunto de pares de dados (BRUNI, 2007).
Normalmente encontraremos uma expresso do tipo:
Y = a + b . X
Onde:
X = varivel independente
Y = varivel dependente
a = coefciente de inclinao da reta
b = intercepto no eixo vertical, valor o cruzamento da reta no eixo Y
A reta de regresso tambm conhecida como reta de ajuste timo e deter-
minada por uma reta ideal em que a soma dos quadrados do desvio mnima.
103
Unidade 8 - Regresso
y
x
y
i
x
i
y
i
^
d = y - y
i i i
^
y
i
^
y = a + bx
^
Atravs do mtodo conhecido como mtodo dos mnimos quadrados po-
demos encontrar os valores de a e b. Este mtodo permite ajustar uma linha
reta a um grupo de dados de duas variveis quantitativas.
O mtodo foi desenvolvido no incio do sculo XIX, sendo que foi o mate-
mtico francs Legendre que chegou s frmulas matemticas para clculo de
a (coefciente de inclinao da reta) e b (intercepto), abaixo, que minimizam os
desvios dos pontos em relao reta (BRUNI, 2007).
n
X b Y
a

=
( ) ( )
( ) ( )
2
2
.

=
X X n
Y X XY n
b
Vamos adotar o mesmo exemplo que foi utilizado para clculo do coef-
ciente de correlao para demonstrar a utilizao da frmula. Para isso utili-
zamos a mesma tabela:
104
Curso de Ps-Graduao em Controle da Gesto Pblica
X Y X * Y X2 Y2
3,36 270,00 907,20 11,29 72.900,00
2,24 220,80 494,59 5,02 48.752,64
2,80 264,00 739,20 7,84 69.696,00
2,52 231,60 583,63 6,35 53.638,56
2,38 212,40 505,51 5,66 45.113,76
3,64 288,00 1.048,32 13,25 82.944,00
1,96 216,00 423,36 3,84 46.656,00
2,24 220,80 494,59 5,02 48.752,64
2,80 223,20 624,96 7,84 49.818,24
3,08 258,00 794,64 9,49 66.564,00
x
27,02
y
2.404,80
x.y
6616,01
x2
75,60
y2
584.835,84
Calculando b (coefciente angular da reta), temos:
( ) ( )
( ) ( )
2
2
.

=
X X n
Y X XY n
b
Onde:
n = 10 e
x = 27,02
y = 2.404,80
x.y = 6616,01
x
2
= 75,60
y
2
= 584.835,84
( ) ( )
( ) ( )
2
02 , 27 60 , 75 10
80 , 2404 02 , 27 06 , 6616 10


= b
6 , 45 = b
A partir de b podemos calcular a:
105
Unidade 8 - Regresso
n
X b Y
a

=
10
02 , 27 6 , 45 80 , 2404
= a
2 , 117 = a
Estes so os coefcientes que permitem o melhor ajuste da reta aos pontos
observados pelo mtodo estabelecido. A equao resultante :
x y . 6 , 45 2 , 117 + =
De mesma maneira que para o coefciente de correlao, temos alguns ele-
mentos que devem ser considerados ao proceder uma anlise de regresso linear:
deve existir para cada valor de X um valor de Y;
ambas as variveis devem ser medidas no nvel intervalar;
deve existir um relacionamento linear entre as variveis;
para empregar testes como o de signifcncia, os elementos que
compem a amostra devem ser aleatrios;
supe-se tambm uma distribuio normal para as duas variveis
ou dispor de um conjunto de dados bastante grande.
Chegamos ao fm da Unidade 8. Para fxar os conceitos aqui elencados,
faa a avaliao a seguir. Caso tenha dvidas sobre o contedo estudado,
procure esclarec-las antes de seguir em frente. Este contedo bsico
para os posteriores.
106
Curso de Ps-Graduao em Controle da Gesto Pblica
Atividades de Aprendizagem 1
Elabore um diagrama de disperso dos dados e tente construir sobre o
diagrama a reta que voc encontrou.
Lembre-se
Equao de Reta Y = a + b . X
Novamente utilize os dados em que voc calculou o coefciente de cor-
relao e tente encontrar os coefcientes que permitam o melhor ajuste
aos pontos.
Elabore um diagrama de disperso dos dados e tente construir sobre o
diagrama a reta que voc encontrou.
Lembre-se
Equao de Reta Y = a + b . X
Saiba mais
Para aprender um pouco mais sobre anlise de regresso, consulte os seguin-
tes sites:
http://pt.wikipedia.org/wiki/Regress%C3%A3o_linear
Alm disso, neste momento voc j deve estar apto a aprofun-
dar seus conhecimentos em mtodos quantitativos. Para isso, a lis-
ta de sites abaixo fornece informaes relacionadas a fontes de da-
dos e ferramentas estatsticas que voc pode usar no seu dia-a-dia:
http://www.math.uah.edu/stat/
http://www.itl.nist.gov/div898/handbook/
http://www.statsoft.com/textbook/stathome.html
http://www.r-project.org/
http://www.uis.unesco.org/ev.php?ID=2867_201&ID2=DO_TOPIC
http://lib.stat.cmu.edu/
107
Unidade 8 - Regresso
CONsiDERAEs FiNAis
Ao longo do curso voc se deparou com uma srie de ferramentas da Es-
tatstica que podem auxiliar uma pessoa a descrever melhor uma determina-
da realidade e, desse modo, tomar decises mais seguras dentro do contexto
de turbulncia em que vivemos. O ambiente profssional em que cada pessoa
atua fator condicionante das perspectivas de utilizao dos modelos que a
Estatstica apresenta; entretanto, independentemente deste contexto, fcil
perceber que seu campo de aplicao vastssimo, desde projetar receitas ou
custos, at orientar na elaborao de um oramento. O ferramental utilizado
pode ser bastante til para voc. A partir de agora tente utilizar os conheci-
mentos do Curso no seu dia-a-dia e boa sorte!
Refita sobre o vdeo Desperte para a Motivao:
http://www.youtube.com/watch?v=U7fSA-RNQaM&feature=related
REFERNCiAs
ANDERSON, D.R; SWEENEY, D.J.; WILLIAMS, T. A. Estatstica aplicada a
administrao e a economia. So Paulo: Pioneira Tomson Learning, 2005.
BARBETTA, P.A. Estatstica aplicada s cincias sociais. 6 ed. Florianpo-
lis: Ed. da UFSC, 2006.
BISQUERRA, R.; SARRIERA, J.C.; MARTINEZ, F. Introduo estatstica:
enfoque informtico com o pacote estatstico SPSS. Porto Alegre : Artmed,
2004.
BRUNI, A.L. Estatstica aplicada gesto empresarial. So Paulo: Atlas,
2007.
LAPPONI, J. C. Estatstica usando o Excel. Rio de Janeiro: Elsevier, 2005.
LARSON, R.; FARBER, B. Estatstica aplicada. So Paulo: Prentice Hall,
2004.
LEVIN, J.; FOX, J. A. Estatstica para cincias humanas. 9. ed. So Paulo:
Prentice Hall, 2004.
108
Curso de Ps-Graduao em Controle da Gesto Pblica
MAROCO, J. Anlise estatstica: com utilizao do SPSS. 2. ed. Lisboa: Abril,
2003.
MARTINS, G. de A. Estatstica geral e aplicada. 3. ed. So Paulo: Atlas,
2006.
NEUFELD, J. L. Estatstica aplicada administrao usando o Excel. So
Paulo: Prentice Hall, 2003.
RICHARDSON, R. J. Pesquisa social: mtodos e tcnicas. So Paulo: Atlas,
1999.
SMAILES, J.; MACGRANE, A. Estatstica aplicada administrao com
Excel. So Paulo: Atlas, 2002.

Vous aimerez peut-être aussi