Académique Documents
Professionnel Documents
Culture Documents
Gesto Pblica
Curso de Ps-Graduao em
Couvaotr lsvnvsvco nr
aocrssos rnan arn uutcn
Hans Michaels van Bellen
Universidade Federal de Santa Catarina
Centro Scio-Econmico
Departamento de Cincias Contbeis
V217c VAN BELLEN, Hans. M
Controle estatstico de processos para rea pblica / Hans Michael van Bellen .
Florianpolis : Departamento de Cincias Contbeis/ UFSC, 2008.
108 p. : il
Curso de Ps-Graduao em Controle da Gesto Pblica
Inclui bibliografa
ISBN: 978-85-7426-051-8
1. Estatstica. 2. Mtodos quantitativos. 3. Controle. 4. Gesto pblica. 5. Educao a
distncia I. Universidade Federal de Santa Catarina/Departamento de Cincias Contbeis. II.
Ttulo.
CDU: 519.2
Universidade Federal de Santa Catarina, Sistema UAB. Nenhuma parte deste material poder ser reproduzida,
transmitida e gravada, por qualquer meio eletrnico, por fotocpia e outros, sem a prvia autorizao, por escrito,
dos autores.
GOVERNO FEDERAL
Presidente da Repblica Luiz Incio Lula da Silva
Ministro da Educao Fernando Hadad
Secretrio de Educao a Distncia Carlos Eduardo Bielschowsky
Coodenador Nacional da Universidade Aberta do Brasil Celso Costa
UNiVERsiDADE FEDERAL DE sANtA CAtARiNA
Reitor lvaro Toubes Prata
ViceReitor Carlos Alberto Justo da Silva
Pr-Reitor de Desenvolvimento Humano e Social Luiz Henrique Vieira Silva
Pr-Reitor de Assuntos Estudantis Cludio Jos Amante
Pr-Reitora de Pesquisa e Extenso Dbora Peres Menezes
Pr-Reitora de Ps-Graduao Maria Lucia de Barros Camargo
Pr-Reitora de Ensino de Graduao Yara Maria Rauh Muller
Diretora de Educao a Distncia Araci Hack Catapan
Secretrio de Planejamento e Finanas Luiz Alberton
Secretria de Cultura e Arte Maria de Lourdes Alves Borges
CENtRO sCiO-ECONMiCO
Diretor Maurcio Fernandes Pereira
Vice-Diretor Altair Borgert
DEPARtAMENtO DE CiNCiAs CONtBEis
Chefe do Departamento Maria Denize Henrique Casagrande
Sub-chefe do Departamento Flvio da Cruz
Coordenador Geral do Curso de ps-graduao na modalidade a distncia Ernesto Fernando
Rodrigues Vicente
Coordenadora de Educao a Distncia e Tutoria Maria Denize Henrique Casagrande
Coordenador de Ambiente Virtual de Ensino e Aprendizagem Orion Augusto Platt Neto
Coordenador Financeiro Vladimir Arthur Fey
Coordenador Pedaggico Guilherme Julio da Silva
Coordenadora de Pesquisa e TCC Valdirene Gaspareto
sECREtARiA DE EDUCAO A DistNCiA
Coordenao de Design Instrucional Fernanda Pires Teixeira
Design Instrucional Mrcia Melo Bortolato
Reviso Textual Jlio Csar Ramos
Coordenao de Design Grfco Giovana Schuelter
Design Grfco Ariana Schlsser
Andr Rodrigues da Silva
Ilustraes Aurino Manoel dos Santos Neto
Design de Capa Guilherme Dias Simes
Felipe Augusto Franke
Steven Nicols Franz Pea
Projeto Editorial Guilherme Dias Simes
Felipe Augusto Franke
Steven Nicols Franz Pea
sumrio
UNiDADE 1 - FUNDAMENtOs DE EstAtstiCA: CONCEitOs BsiCOs
E APLiCAO NA CONtABiLiDADE GERENCiAL
1.1 Fundamentos de Estatstica: conceitos bsicos ..................................................... 3
1.2 Nveis de mensurao ............................................................................................................... 4
Nvel nominal ................................................................................................................................................................................................. 4
Nvel ordinal .....................................................................................................................................................................................................5
Nvel intervalar ...............................................................................................................................................................................................5
1.3 Estatstica descritiva ................................................................................................................ 6
1.4 Suporte tomada de deciso ............................................................................................10
UNiDADE 2 - PLANEjAMENtO DE UMA PEsqUisA COM LEVANtAMENtO
E ANLisE DE DADOs qUANtitAtiVOs
2.1 Coleta de dados..........................................................................................................................15
2.2 Organizao de dados ..........................................................................................................18
2.3 Tecnologia da informao, pacotes estatsticos e bases de dados ...... 26
UNiDADE 3 - MEDiDAs DE tENDNCiA CENtRAL
3.1 Mdia ................................................................................................................................................. 33
3.2 Mediana ........................................................................................................................................... 35
3.3 Moda ................................................................................................................................................. 37
UNiDADE 4 - MEDiDAs DE VARiABiLiDADE
4.1 Amplitude ....................................................................................................................................... 44
4.2 Desvio mdio ................................................................................................................................ 45
4.3 Varincia ........................................................................................................................................ 49
4.4 Desvio padro .............................................................................................................................. 51
4.5 Comparando Medidas de Variabilidade .................................................................... 53
UNiDADE 5 - DistRiBUiO DE PROBABiLiDADEs
UNiDADE 6 - tEORiA DA AMOstRAGEM
6.1 Tamanho das amostras ........................................................................................................ 76
Amplitude ...................................................................................................................................................................................................... 77
Nvel de Confana..................................................................................................................................................................................... 77
Erro de Estimao ...................................................................................................................................................................................... 78
Proporo da Caracterstica ................................................................................................................................................................. 78
Tamanho da Amostra para Universo (Populao) Infnito ................................................................................................. 79
Tamanho da Amostra para Universo (Populao) Finito .................................................................................................... 79
UNiDADE 7 - CORRELAO
UNiDADE 8 - REGREssO
Caro(a) aluno(a),
Ol! Seja bemvindo!
Bem-vindos disciplina de Controle Estatstico de Processos para a rea
Pblica. Nesta disciplina exploraremos algumas ferramentas construdas a
partir do desenvolvimento da Estatstica que so bastante teis para auxiliar
um gestor, no seu dia-a-dia, particularmente aquele que trabalha na rea p-
blica, a tomar decises.
Esta apostila foi desenvolvida com a perspectiva de fornecer o suporte tex-
tual necessrio para permitir que o aluno possa compreender os conceitos da
disciplina e aplic-los sua realidade. Juntamente com outros conhecimentos
que o Curso propicia no processo de aprendizagem, pretende-se construir, ao
longo do tempo de interao, bases mais slidas de conhecimentos na rea.
Para dar suporte a este processo, o contedo da disciplina foi dividido em
oito unidades principais. Estas unidades abordam desde a base terica necess-
ria para apreenso dos principais tpicos da Estatstica at exemplos e exerc-
cios que auxiliam na fxao deste contedo.
importante ressaltar que um dos propsitos principais desta apostila
mostrar de forma simples e sinttica uma srie de ferramentas que a Estats-
tica fornece e que podem auxiliar qualquer gestor no processo de tomada de
deciso. Para isso os cientistas sociais e os gestores podem utilizar tecnologias
de processamento de dados para extrair observaes relevantes e tirar conclu-
ses a respeito da realidade ou de uma determinada situao problema.
Essas tecnologias de processamento de dados so programas (ou softwa-
res) chamados tambm aqui de pacotes estatsticos, que processam as infor-
maes automaticamente, retirando delas os aspectos mais importantes para
a tomada de deciso.
A partir do conhecimento construdo no Curso, voc ter, ao fnal, uma
base para anlise das questes do seu dia-a-dia no processo de gesto. o que
lhe deseja seu professor.
Prof. Dr. Hans Michael van Bellen
1
Nesta unidade voc compreender a
defnio de Estatstica, os elementos da
estatstica descritiva e os diferentes nveis
de mensurao de uma varivel.
Unidade 1
Fundamentos de Estatstica: conceitos bsicos
e aplicao na contabilidade gerencial
1
Nesta unidade voc compreender a
defnio de Estatstica, os elementos da
estatstica descritiva e os diferentes nveis
de mensurao de uma varivel.
Unidade 1
Fundamentos de Estatstica: conceitos bsicos
e aplicao na contabilidade gerencial
10
Curso de Ps-Graduao em Controle da Gesto Pblica
A partir do conhecimento construdo no Curso e das tecnologias existentes
para anlise de dados quantitativos, voc ter, ao fnal do curso, uma base
melhor para anlise das questes do seu dia-a-dia no processo de gesto.
Para entrar no esprito aprendizado assista ao vdeo no YouTube sobre co-
nhecimento e deixe seu comentrio no frum especfco da introduo.
http://www.youtube.com/watch?v=AXzfQeEjYg
1.1 FUNDAMENtOs DE EstAtstiCA:
CONCEitOs BsiCOs
Para entender os principais conceitos e ferramentas da Estatstica neces-
srio compreender primeiramente o que pesquisa cientfca e seus principais
estgios e abordagens.
O ser humano na sua abordagem cotidiana da vida procura compreender a
realidade e a partir disso explic-la.
Numa perspectiva cientfca ele procura observar a realidade de uma forma
mais sistemtica e estruturada a partir dos dados que encontra ao seu redor.
Muitas vezes a caracterstica da realidade observada permite sua mensura-
o atravs de nmeros. Os nmeros desempenham algumas funes impor-
tantes para o pesquisador (LEVIN; FOX, 2004):
Classifcar ou categorizar (nvel nominal de mensurao)
Ordenar por postos (nvel ordinal de mensurao)
Atribuir um escore (no nvel intervalar de mensurao).
Os dados nominais
consistem em apenas
nomes, rtulos ou ca-
tegorias. Os dados no
podem ser dispostos
segundo um esquema
ordenado.
Como as categorias
carecem de qualquer
signifcado ordinal ou
numrico, os dados
em nvel nominal de
mensurao, mesmo
estando diante de
rtulos numricos,
permanecem no nvel
nominal e no po-
demos fazer clculos
com eles.
11
Unidade 1 - Fundamentos de Estatstica: Conceitos Bsicos e Aplicao na
Contabilidade Gerencial
1.2 NVEis DE MENsURAO
Veremos agora a classifcao dos dados quanto ao nvel de mensurao,
que so:
nominal,
ordinal e
intervalar.
Nvel nominal
O nvel nominal de mensurao se refere possibilidade de rotular ou no-
mear os casos observados. Por exemplo, quando observamos os alunos de
uma sala de aula, podemos segmentar a turma considerando o gnero de seus
componentes. Uma turma de 30 estudantes, neste caso, pode ser comporta
por 18 estudantes do sexo masculino e 12 estudantes do sexo feminino.
Existem diversos exemplos de categorizao numa perspectiva nominal.
Por exemplo, quando tratamos de um conjunto de clientes de uma instituio,
poderamos dividi-los em dois conjuntos: um conjunto contendo os indivdu-
os inadimplentes com a empresa e outro conjunto de clientes adimplentes.
importante ressaltar, quando se discute o nvel nominal de mensurao,
que cada caso s pode ser enquadrado em uma, e s uma, categoria (LEVIN;
FOX, 2004). As categorias no podem se sobrepor. Por isso nenhum indivduo
classifcado como do sexo feminino poderia, ao mesmo tempo, ser colocado
no conjunto de alunos da turma de sexo masculino.
Tambm muito importante perceber que variveis nominais no so pas-
sveis de serem classifcadas ou escalonadas em relao qualidades. Por exem-
plo: a simples diviso de uma turma de aula em dois grupos de gnero distinto
no pode signifcar uma ordenao de qualidade tipo melhor ou pior.
Os dados nominais
consistem em apenas
nomes, rtulos ou ca-
tegorias. Os dados no
podem ser dispostos
segundo um esquema
ordenado.
Como as categorias
carecem de qualquer
signifcado ordinal ou
numrico, os dados
em nvel nominal de
mensurao, mesmo
estando diante de
rtulos numricos,
permanecem no nvel
nominal e no po-
demos fazer clculos
com eles.
12
Curso de Ps-Graduao em Controle da Gesto Pblica
Nvel ordinal
O nvel ordinal de mensurao refere-se possibilidade do pesquisador em or-
denar os casos em funo de determinada caracterstica. Um dos exemplos mais
fceis para perceber a possibilidade de ordenao dos casos a classifcao de seg-
mentos da sociedade civil em termos de suas caractersticas socioeconmicas.
Normalmente vamos encontrar nos meios de comunicao a discusso do
impacto da infao sobre a classe mdia, o crescimento da renda da classe alta
ou estabilizao da renda dos indivduos da classe baixa. As classes (alta, mdia
e baixa ou classe A, B e C) so estratos dos casos observados que, diferente-
mente da discusso anterior, permitem uma ordenao. Exemplifcando, se
classe social no caso signifca renda, temos uma classe alta (A) com maior ren-
da que a classe mdia (B) e tambm com maior renda que a classe baixa (C).
Podemos afrmar ento que a categorizao exemplifcada representa uma
estratifcao dos casos que utiliza como fator de agrupamento o grau de ren-
da dos indivduos.
Levin e Fox (2004) afrmam que o nvel ordinal, apesar de proporcionar
a ordenao dos grupos observados, no permite identifcar o tamanho da
diferena entre os grupos. Isto signifca que no possvel atribuir escores ou
valores dentro de um ponto especfco dentro da escala.
Nvel intervalar
O nvel intervalar, alm de informar a ordenao das categorias, permite
identifcar a distncia exata entre elas. Podemos continuar utilizando o exemplo
da turma de uma disciplina formada por 12 mulheres e 18 homens. Nessa turma
poderamos estar interessados na altura ou peso dos indivduos. A mensurao
da altura ou peso de cada um dos estudantes da turma permite a identifcao
exata do valor referente sua altura ou peso bem como da diferena entre o
valor encontrado e o valor das medidas de outros componentes da turma.
Na medida em que os pesquisadores se utilizam de nmeros, ou seja, quanti-
fcam seus dados nos diferentes nveis abordados anteriormente, a Estatstica se
transforma num instrumento importante para atender a duas funes principais:
descrio da realidade; 1.
suporte para a tomada de deciso. 2.
O nvel de mensura-
o ordinal envolve
dados que podem ser
dispostos em alguma
ordem, mas as dife-
renas entre os valores
dos dados no podem
ser determinadas, ou
no tem sentido. Ex:
um editor classifca
alguns originais como
excelentes, alguns
como bons e alguns
maus. (No podemos
determinar uma
diferena quantitativa
entre bom e mau).
O nvel de razo de
mensurao o nvel
intervalar modifcado,
de modo a incluir
o ponto de partida
0 inerente (onde 0
signifca nenhuma
quantidade presente).
Para valores neste n-
vel, tanto as diferenas
quanto as razes tm
signifcados.
Ex.1: pesos de artigos
de material plstico
descartados pelas re-
sidncias (0 Kg indica
que nenhum plstico
foi descartado, e 10 kg
representa 2x5 Kg).
Ex.2: Distncias em Km
percorridas por carros
em um teste de consu-
mo de combustvel.
Obs.: Ao aplicarmos
Estatstica proble-
mas reais, o nvel de
mensurao dos dados
um fator importante
para determinarmos
o processo a ser
utilizado.
13
Unidade 1 - Fundamentos de Estatstica: Conceitos Bsicos e Aplicao na
Contabilidade Gerencial
O nvel de mensura-
o ordinal envolve
dados que podem ser
dispostos em alguma
ordem, mas as dife-
renas entre os valores
dos dados no podem
ser determinadas, ou
no tem sentido. Ex:
um editor classifca
alguns originais como
excelentes, alguns
como bons e alguns
maus. (No podemos
determinar uma
diferena quantitativa
entre bom e mau).
O nvel de razo de
mensurao o nvel
intervalar modifcado,
de modo a incluir
o ponto de partida
0 inerente (onde 0
signifca nenhuma
quantidade presente).
Para valores neste n-
vel, tanto as diferenas
quanto as razes tm
signifcados.
Ex.1: pesos de artigos
de material plstico
descartados pelas re-
sidncias (0 Kg indica
que nenhum plstico
foi descartado, e 10 kg
representa 2x5 Kg).
Ex.2: Distncias em Km
percorridas por carros
em um teste de consu-
mo de combustvel.
Obs.: Ao aplicarmos
Estatstica proble-
mas reais, o nvel de
mensurao dos dados
um fator importante
para determinarmos
o processo a ser
utilizado.
1.3 EstAtstiCA DEsCRitiVA
Para conseguir entender um determinado fenmeno, o pesquisador ou
gestor deve se utilizar de uma grande quantidade de informaes a respeito
deste. Por exemplo, um gestor pblico, do setor fnanceiro de uma prefeitura
municipal pode estar interessado no desempenho relativo da prefeitura na ar-
recadao do Importo Predial e Territorial Urbano (IPTU) de sua cidade.
Para poder descrever o comportamento da arrecadao, esse mesmo ges-
tor dispe do montante total arrecadado nos ltimos trinta anos. Na tabela 1
temos o valor, em reais, arrecadado entre os anos de 1978 e 2007:
Tabela 1.1 Evoluo da Arrecadao
Municipal do IPTU
ANo ToTAl ARRECADADo (R$)
2007 R$ 3.565.000
2006 R$ 3.515.000
2005 R$ 3.530.000
2004 R$ 3.469.000
2003 R$ 3.833.000
2002 R$ 3.766.000
2001 R$ 3.365.000
2000 R$ 3.234.000
1999 R$ 3.787.000
1998 R$ 3.165.000
1997 R$ 2.789.000
1996 R$ 2.565.000
1995 R$ 2.565.000
1994 R$ 2.600.000
1993 R$ 3.105.000
1992 R$ 2.879.000
1991 R$ 2.776.000
1990 R$ 2.789.000
1989 R$ 2.665.000
1988 R$ 2.725.000
1987 R$ 2.683.000
1986 R$ 2.463.000
1985 R$ 3.011.000
1984 R$ 2.852.000
1983 R$ 2.675.000
1982 R$ 2.565.000
1981 R$ 2.645.000
1980 R$ 2.555.000
1979 R$ 2.479.000
1978 R$ 2.444.000
14
Curso de Ps-Graduao em Controle da Gesto Pblica
Imagine-se como gestor desse municpio e de posse desta tabela.
Quais as concluses que voc pode tirar a partir dessas informaes? Voc
conseguiria, simplesmente olhando a tabela, verifcar algum comporta-
mento padro no desempenho da arrecadao do municpio? Voc con-
seguiria descrever o que aconteceu com a arrecadao nos ltimos trinta
anos, em poucas palavras?
Voc seria capaz de afrmar que o desempenho na arrecadao vem au-
mentando ou diminuindo com o tempo?
A princpio, mesmo se tratando de um nmero mais baixo de informa-
es, a resposta a todas estas questes seria no. Entretanto, a partir da
aplicao dos princpios mais bsicos do que a partir de agora denominare-
mos estatstica descritiva qualquer gestor municipal, de posse dos dados
agrupados em diferentes formas, derivados da tabela, poderia caracterizar o
comportamento da arrecadao no perodo citado de forma sucinta, clara
e precisa.
Veja alguns exemplos do que a estatstica descritiva pode fazer para auxiliar
o gestor municipal a descrever o desempenho da arrecadao do municpio:
As arrecadaes obtidas poderiam ser colocadas numa ordem
consecutiva, por exemplo, da menor para maior e depois agrupa-
das considerando determinado critrio. A este tipo de tratamen-
to, exemplifcado na tabela 2, daremos o nome de distribuio de
freqncias, ferramenta que ser explorada com mais profundi-
dade na prxima unidade.
Poderamos dispor as informaes em uma forma grfca. O
montante arrecadado anualmente, juntamente com o ano da
arrecadao, colocado num grfco. Os valores arrecadados so
colocados no eixo vertical (eixo Y) e os anos que compreendem o
perodo de tempo so colocadas no eixo vertical (eixo X) confor-
me pode ser visualizado na fgura 1.
15
Unidade 1 - Fundamentos de Estatstica: Conceitos Bsicos e Aplicao na
Contabilidade Gerencial
Tabela 1.2 Evoluo da Arrecadao
Municipal do IPTU ordenada
do maior valor para o menor
valor arrecadado.
ANo ToTAl ARRECADADo (R$)
2007 R$ 3.565.000
2006 R$ 3.833.000
2005 R$ 3.787.000
2004 R$ 3.766.000
2003 R$ 3.530.000
2002 R$ 3.515.000
2001 R$ 3.469.000
2000 R$ 3.365.000
1999 R$ 3.234.000
1998 R$ 3.165.000
1997 R$ 3.105.000
1996 R$ 3.011.000
1995 R$ 2.879.000
1994 R$ 2.852.000
1993 R$ 2.789.000
1992 R$ 2.789.000
1991 R$ 2.776.000
1990 R$ 2.725.000
1989 R$ 2.683.000
1988 R$ 2.675.000
1987 R$ 2.665.000
1986 R$ 2.645.000
1985 R$ 2.600.000
1984 R$ 2.565.000
1983 R$ 2.565.000
1982 R$ 2.565.000
1981 R$ 2.555.000
1980 R$ 2.479.000
1979 R$ 2.463.000
1978 R$ 2.444.000
16
Curso de Ps-Graduao em Controle da Gesto Pblica
0
500000
1000000
1500000
2000000
2500000
3000000
3500000
4000000
4500000
2
0
0
7
2
0
0
5
2
0
0
3
2
0
0
1
1
9
9
9
1
9
9
7
1
9
9
5
1
9
9
3
1
9
9
1
1
9
8
9
1
9
8
7
1
9
8
5
1
9
8
3
1
9
8
1
1
9
7
9
Ano
V
a
l
o
r
A
r
r
e
c
a
d
a
d
o
(
R
$
)
Figura 1.1 Evoluo da Arrecadao Anual
Perceba que a partir destes dois procedimentos bsicos podemos tecer al-
gumas consideraes importantes, e resumidas, sobre o desempenho da arre-
cadao do imposto.
Dentro da perspectiva descritiva, a Estatstica ento poderia ser defnida
como conjunto de tcnicas para a reduo de dados quantitativos a um
pequeno nmero de termos descritivos mais convenientes e facilmente
transmissveis (LEVIN; FOX, 2004, p. 15)
Segundo Lapponi (2005, p. 5) o objetivo da estatstica descritiva organi-
zar, resumir, analisar e interpretar observaes disponveis.
Nessa perspectiva a Estatstica compreende elementos cientfcos, mas que
abrangem aspectos como bom senso e tambm arte. De qualquer forma, de
acordo com esse autor, a Estatstica deve auxiliar no processo decisrio, mes-
mo que as informaes existentes a respeito de uma determinada situao
problema sejam insufcientes.
Populao ou Uni-
verso totalidade de
itens, objetos ou pes-
soas sob considerao
(MARTINS, 2006)
Amostra uma
parte da populao
que selecionada para
anlise (MARTINS,
2006).
17
Unidade 1 - Fundamentos de Estatstica: Conceitos Bsicos e Aplicao na
Contabilidade Gerencial
1.4 sUPORtE tOMADA DE DECisO
Muitas vezes a estatstica puramente descritiva no sufciente para auxi-
liar um gestor no processo de tomada de deciso. Quando se defronta com um
conjunto de dados, o gestor, seja ele do setor privado ou pblico, est preocu-
pado no somente em descrever o que ocorre em sua empresa, mas tambm
fazer inferncias. Inferncias sobre a realidade da organizao a partir de um
nmero menor de dados ou previses acerca do comportamento dos resulta-
dos da empresa num determinado momento.
Existem diversos fatores que limitam a possibilidade de o tomador de de-
ciso trabalhar com todos os dados disponveis. Aspectos como custo de se
trabalhar com uma quantidade muito grande de dados bem como o tempo
disponvel para uma determinada ao muitas vezes impedem que seja feito
um tratamento com a totalidade dos dados.
Normalmente o conjunto completo dos dados defnido pelos pesquisa-
dores como universo ou populao. Para que seja possvel fazer inferncias
sobre as caractersticas dessa populao o gestor normalmente se utiliza de
uma parte do conjunto de dados, denominada de amostra, e a partir disso faz
as suas inferncias.
Figura 1.2 Populao e amostra
O objetivo , atravs de uma amostra representativa, conseguir captar as
principais caractersticas da populao ou universo. Na verdade os pesquisa-
dores sabem que nesse processo os erros so inevitveis. O que se procura
alcanar um nvel de erro que seja aceitvel.
Populao ou Uni-
verso totalidade de
itens, objetos ou pes-
soas sob considerao
(MARTINS, 2006)
Amostra uma
parte da populao
que selecionada para
anlise (MARTINS,
2006).
18
Curso de Ps-Graduao em Controle da Gesto Pblica
Como afrma Martins (2006), a estatstica inferencial pode ser defnida
como um conjunto de mtodos que permitem a estimao de caractersti-
cas de uma populao especfca a partir de resultados que o pesquisador
obtm em uma amostra.
Chegamos ao fm da Unidade 1. Para fxar os conceitos aqui elencados,
faa a avaliao a seguir. Caso tenha dvidas sobre o contedo estudado,
procure esclarec-las antes de seguir em frente. Este contedo bsico
para os posteriores.
Atividades de Aprendizagem 1
1) Leia atentamente a Introduo e a Unidade 1 e discorra, utilizan
do no mximo uma pgina A4, sobre estes dois aspectos funda
mentais da estatstica:
descrio da realidade;
suporte tomada de deciso.
2) Responda:
O que e para que serve a Estatstica?
Envie estas atividades para a tutoria.
19
Unidade 1 - Fundamentos de Estatstica: Conceitos Bsicos e Aplicao na
Contabilidade Gerencial
Saiba mais
Voc quer conhecer um pouco mais a histria da Estatstica? Ento consulte
o site:
http://www.eb23-guifoes.rcts.pt/NetMate/sitio/matematicos/historia-da-
estatistica.htm
Para aprofundar um pouco mais seus conhecimentos, consulte tambm:
http://pt.wikipedia.org/wiki/Estat%C3%ADstica#Hist.C3.B3ria
REsUMO DA UNiDADE
Nesta unidade voc teve seu primeiro contato com os fundamentos de Es-
tatstica. Para aprofundar seus conhecimentos foram apresentados alguns
conceitos bsicos desta cincia bem como suas possibilidades de aplicao
na contabilidade gerencial. A Estatstica pode ser compreendida como um
conjunto de ferramentas que auxiliam na transformao de um grande n-
mero de dados quantitativos em um nmero menor de termos que podem
ser mais facilmente trabalhados. Um dos principais objetivos da Estatstica
sistematizar e, a partir desse processo de organizao, analisar informaes
para dar suporte tomada de deciso.
2
Nesta unidade voc compreender a difer-
ena entre dados primrios e secundrios.
Aprender a construir histogramas de
freqncia e outras ferramentas da estats-
tica descritiva.
Unidade 2
Planejamento de uma Pesquisa com
Levantamento e Anlise de Dados Quantitativos
2
Nesta unidade voc compreender a difer-
ena entre dados primrios e secundrios.
Aprender a construir histogramas de
freqncia e outras ferramentas da estats-
tica descritiva.
Unidade 2
Planejamento de uma Pesquisa com
Levantamento e Anlise de Dados Quantitativos
22
Curso de Ps-Graduao em Controle da Gesto Pblica
Esta unidade aborda o conjunto de etapas que deve ser seguido para que um
gestor possa realizar uma pesquisa de levantamento a partir de dados quanti-
tativos. A unidade est dividia em trs partes principais.
Na primeira exploraremos o mundo da coleta de dados cuja maior nfase
ser dada s fontes de dados para pesquisa.
A segunda parte abordar a organizao dos dados explorando algumas
ferramentas da estatstica descritiva disponveis para permitir ao pesquisa-
dor descrever uma grande quantidade de dados de uma forma sinttica e,
por ltimo, sero apresentadas algumas ferramentas, softwares, que auxi-
liam enormemente no processo de anlise estatstica, tanto na perspectiva
descritiva como na perspectiva inferencial.
Estes softwares podem ser utilizados ao longo do curso para o desenvolvi-
mento de atividades especfcas.
2.1 COLEtA DE DADOs
Conforme descrito anteriormente, um dos principais objetivos da Esta-
tstica conseguir sintetizar, de maneira simples, mas tambm precisa, um
conjunto de dados quantitativos referentes a uma determinada realidade. Na
primeira parte desta unidade procuraremos explorar algumas formas de obter
os dados que serviro de base para a anlise estatstica.
As bases de dados que orientam o processo de pesquisa so normalmente
denominadas fontes. Existem inmeras fontes onde um pesquisador pode ob-
ter dados ou informaes. No Brasil, temos alguns exemplos:
Relatrios de rgos do governo O Instituto Brasileiro de Geogra-
fa e Estatstica (IBGE) o rgo do governo federal, vinculado ao
Ministrio de Planejamento, Oramento e Gesto, que rene um
conjunto de dados e informaes relacionados s mais diferentes
esferas. Por exemplo, no site do IBGE (www.ibge.gov.br) encontrare-
mos informaes relativas populao, economia e diversos outros
23
Unidade 2 - Planejamento de uma Pesquisa com Levantamento e Anlise de
Dados Quantitativos
indicadores. Alm disso, alguns estados tambm possuem rgos
especfcos que renem dados de bases diferentes que os orientam
em termos de formulao de polticas pblicas.
Figura 2.1 Pgina do IBGE
Relatrios oriundos de fontes empresariais ou outro tipo de
organizaes. Como exemplo, podemos olhar para o site da
Confederao Nacional da Indstria (www.cni.org.br) e tambm
verifcar a existncia de um grande conjunto de dados relaciona-
dos atividade industrial.
No site da Bovespa ( http://www.bovespa.com.br) tambm
possvel coletar informaes e dados de empresas que operam no
mercado de capitais no Brasil.
Pesquisas de mercado, orientadas, por exemplo, para o gosto do
consumidor, fornecem muitas vezes uma srie bastante interes-
sante de dados quantitativos a respeito do comportamento do
cliente de determinado produto.
24
Curso de Ps-Graduao em Controle da Gesto Pblica
Figura 2.2 Pgina da Confederao Nacional da Indstria
Existe uma classifcao que divide os dados obtidos para uma pesquisa em
dois grupos principais:
Dados primrios so aqueles dados obtidos diretamente pelo pesquisa-
dor. Por exemplo, o pesquisador pode estar interessado na forma de pagamen-
to de multas na prefeitura e ele realiza uma pesquisa de campo verifcando
o comportamento do contribuinte diretamente numa agncia da prefeitura.
Normalmente podemos afrmar que a fonte primria.
Dados secundrios so aqueles obtidos de outras fontes, no diretas, ou seja,
secundrias de informao. Normalmente referem-se a anurios, relatrios de
uma empresa, de um rgo ou instituio ou quaisquer outras fontes que forne-
cem dados que foram previamente coletados e sintetizados por outro ente.
Quando efetuamos uma coleta de dados, algumas precaues devem ser
tomadas pelo pesquisador. A fonte de dados deve ser confvel, os relat-
rios devem ser atualizados, as referncias e/ou fontes devem constar do
relatrio etc.
25
Unidade 2 - Planejamento de uma Pesquisa com Levantamento e Anlise de
Dados Quantitativos
Quando os dados so provenientes de um questionrio, podemos ter o re-
gistro incorreto ou inadequado das respostas, problemas de processamento ou
transferncia de dados para o computador, e at mesmo problemas relaciona-
dos ao instrumento de coleta, por exemplo, um questionrio mal elaborado
(SMAILES; MCGRANE, 2002).
2.2 ORGANizAO DE DADOs
Nesta seo abordaremos um aspecto importante da Estatstica que se
refere organizao dos dados e sua apresentao.
importante lembrar que at o momento estamos discutindo uma forma
mais sinttica de apresentar e analisar conjunto de dados quantitativos.
A forma normalmente utilizada para sintetizar e descrever dados quanti-
tativos atravs de grfcos, e o mais adequado para esta representao
grfca o histograma de freqncia.
A principal caracterstica dos histogramas de freqncia organizar os da-
dos observados a partir de agrupamentos ou classes.
Vamos tomar como exemplo os dados da tabela 2.1, abaixo, onde so apresen-
tados os dados relativos populao de trinta diferentes municpios.
Tabela 2.1 Populao de 30 Municpios
3000 18000 35000
9000 24000 35500
12000 22300 37800
15700 24700 39100
19600 26800 43400
21000 25100 45700
23600 27000 39000
27700 29900 42300
18900 27000 47000
21300 33400 52000
26
Curso de Ps-Graduao em Controle da Gesto Pblica
Cada quadro (clula da tabela) representa a populao de um municpio num
determinado momento; vamos tentar construir, a partir dos dados da tabela, um
histograma de freqncia que representa sinteticamente estas informaes.
Primeiramente necessrio determinar a amplitude dos dados. Neste caso,
trata-se de determinar o maior e o menor valor entre as trinta observaes. A
partir da tabela possvel perceber que o maior municpio apresenta uma po-
pulao de 52.000 habitantes e o menor municpio tem como populao 3.000
habitantes. A amplitude nada mais do que o espao existente entre a menor
e a maior populao, 52.000 habitantes menos 3.000 habitantes, ou seja, 49.000
habitantes.
O segundo passo determinar o nmero de classes, ou seja, o nmero de
agrupamentos para dividir o conjunto de observaes. Existem duas formas
usuais para realizar esta diviso:
A primeira maneira utilizar a frmula de Sturges, defnida abaixo como:
K= 1+3,33 log n
Onde
K= nmero aproximado de classes
e
N = nmero de observaes
Uma segunda forma, emprica, dada pela tabela 2.2, abaixo, na qual
possvel escolher diretamente, em funo do nmero de observaes, alguns
valores para o conjunto de classes.
Tabela 2.2
NMERo DE oBSERVAES NMERo DE ClASSES (AGRUPAMENToS)
Maior que 50 15 a 20 classes
Entre 25 e 50 07 a 14 classes
Menor que 25 5 ou 6 classes
Utilizando a abordagem emprica, portanto a tabela 2.2, verifcamos que
nosso exemplo apresenta 30 observaes; portanto podemos trabalhar entre
7 e 14 classes. Como o nmero de observaes, trinta, est mais prximo da
base ou piso da escala (25 a 50) vamos tomar neste exemplo um conjunto de
7 classes (k = 7).
27
Unidade 2 - Planejamento de uma Pesquisa com Levantamento e Anlise de
Dados Quantitativos
No terceiro passos vamos dividir o conjunto de observaes no nmero
de classes defnido pela tabela. Adotaremos intervalos iguais; portanto, dividi-
remos a amplitude (49.000) pelo nmero de classes (7). Com isso chegamos a
intervalos de 7.000 habitantes.
A partir dos passos anteriores temos as seguintes informaes relativas ao
exemplo:
Menor populao 3.000
Maior populao 52.000
Nmero de classes 7
Amplitude do intervalo 7.000
A partir dessas informaes possvel montar a tabela 2.3, de distribuio
de freqncia para o exemplo apresentado.
Tabela 2.3 Distribuio de Freqncia
ClASSE INTERVAlo FI FI FAC FAC
1 3.000-10.000 2 6,67% 2 6,67%
2 10.000-17.000 2 6,67% 4 13,33%
3 17.000-24.000 8 26,67% 12 40,00%
4 24.000-31.000 7 23,33% 19 63,33%
5 31.000-38.000 4 13,33% 23 76,67
6 38.000-45.000 4 13,33% 27 90%
7 45.000-52.000 3 10,00% 30 100%
Soma-trio 30 30
28
Curso de Ps-Graduao em Controle da Gesto Pblica
Nesta tabela podemos observar as seguintes informaes:
Na primeira coluna temos um nmero, que associaremos a cada
uma das classes.
Na segunda coluna temos representados os intervalos associados
a cada uma das classes.
A terceira coluna refere-se freqncia absoluta (nmero de
observaes) associada tambm a cada classe.
A quarta coluna converte a freqncia absoluta em freqncia
relativa, ou seja, a proporo de observaes dentro da classe em
frente do total de observaes.
As ltimas duas colunas referem-se s informaes relativas
freqncia acumulada (absoluta e percentual), ou seja, o nme-
ro absoluto a partir das classes, que se acumula medida que
descemos na tabela.
Outra informao importante, determinada pela notao grfca adotada,
qual efetivamente o intervalo adotado nas classes a partir da incluso ou
no de seus extremos.
Ento, por exemplo, quando temos a representao grfca:
3.000 |- 10.000
estamos tratando de um intervalo que vai de cidades com um nmero de
habitantes maior ou igual a 3.000 at cidades com nmero de habitantes me-
nor do que 10.000.
A partir das informaes tabuladas anteriormente possvel construir uma f-
gura com as freqncias, relativas e absolutas, das populaes dos municpios.
29
Unidade 2 - Planejamento de uma Pesquisa com Levantamento e Anlise de
Dados Quantitativos
Histograma
0
5
10
1
0
0
0
0
1
7
0
0
0
2
4
0
0
0
3
1
0
0
0
3
8
0
0
0
4
5
0
0
0
5
2
0
0
1
M
a
i
s
Bloco
F
r
e
q
n
c
i
a
Figura 2.3 Histograma de Freqncia relativa das Populaes
Histograma
0
5
10
1
0
0
0
0
1
7
0
0
0
2
4
0
0
0
3
1
0
0
0
3
8
0
0
0
4
5
0
0
0
5
2
0
0
1
M
a
i
s
Bloco
F
r
e
q
n
c
i
a
Figura 2.4 Histograma de Freqncia absoluta das populaes.
As distribuies de freqncia apresentadas nas fguras 2.3 e 2.4 esto pre-
sentes em todos os lugares. Se voc olhar atentamente um jornal ou revista
vai perceber que, seja no suplemento de economia discutindo a produo in-
dustrial, seja nas pginas policiais, num artigo sobre a evoluo do ndice de
violncia nos centros urbanos, alguma informao organizada por classes ou
categorias estar presente.
Para facilitar o entendimento do leitor ou dos tomadores de deciso de uma
entidade, pblica ou privada, quando se trata de jornais, revistas ou relatrios de
gesto, essa informao muitas vezes estar na forma de apresentao grfca.
30
Curso de Ps-Graduao em Controle da Gesto Pblica
Esse tipo de apresentao se justifca na medida em que tabelas, com nme-
ro excessivo de linhas e colunas, muitas vezes no so as formas mais apropria-
das para revelar aspectos importantes observados na realidade pesquisada.
Devemos sempre lembrar que o objetivo da Estatstica, na perspectiva des-
critiva em que trabalhamos at o momento, procura resumir, de forma sis-
tematizada a realidade.
Uma das formas grfcas de apresentao dos dados mais conhecida o
grfco em setores, conhecido como grfco tipo pizza. Trata-se de um gr-
fco circular, representado na fgura 2.5, onde as freqncias ou percentagens
das categorias podem ser visualmente identifcadas.
Na fgura temos a distribuio da populao dos municpios anteriormente
citados, nas categorias defnidas e representadas juntamente com o percentual
de municpios em cada uma das classes.
7%
7%
23%
27%
13%
13%
10%
1 2 3 4 5 6 7
Figura 2.5 Distribuio de Freqncias Tipo Pizza
Da mesma maneira possvel representar a distribuio dos municpios atravs
de barras (grfcos em barra). Uma representao neste tipo de grfco, relativa
novamente aos municpios e populao, pode ser visualizada na fgura 2.6.
Um polgono de
freqncias nada mais
do que a construo
de um grfco feita
atravs dos pontos su-
cessivos encontrados
nos limites de cada
categoria
31
Unidade 2 - Planejamento de uma Pesquisa com Levantamento e Anlise de
Dados Quantitativos
0,00%
5,00%
10,00%
15,00%
20,00%
25,00%
30,00%
1 2 3 4 5 6 7
Figura 2.6 Distribuio de Freqncia Tipo Barras
Por ltimo vale destacar que, quando nos defrontamos com uma distribui-
o de freqncias, podemos construir o que conhecido como polgono de
freqncias. Na fgura 2.7 pode ser visualizado um polgono de freqncia
associado distribuio dos municpios do exemplo.
Frequencia
0
1
2
3
4
5
6
7
8
9
1 2 3 4 5 6 7
Frequencia
Figura 2.7 Polgono de Freqncias
A curva fornecida pelo polgono de freqncias pode assumir diferentes
formas. Algumas distribuies so simtricas, ou seja, se pudssemos dividir
Um polgono de
freqncias nada mais
do que a construo
de um grfco feita
atravs dos pontos su-
cessivos encontrados
nos limites de cada
categoria
32
Curso de Ps-Graduao em Controle da Gesto Pblica
a curva em duas partes teramos duas metades praticamente iguais. Outras
distribuies so assimtricas e observa-se, nestes casos, uma maior freqncia
de pontos num lado ou outro da curva.
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7
Figura 2.8 Distribuio Simtrica
Na fgura 2.8 percebe-se um relativo grau de simetria em todas as fguras.
J as fguras 2.9 e 2.10 representam distribuies assimtricas: uma curva posi-
tivamente assimtrica e outra negativamente assimtrica.
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7
Figura 2.9 Distribuio Positivamente Assimtrica
33
Unidade 2 - Planejamento de uma Pesquisa com Levantamento e Anlise de
Dados Quantitativos
0
1
2
3
4
5
6
7
8
1 2 3 4 5 6 7
Figura 2.10 Distribuio Negativamente Assimtrica
2.3 tECNOLOGiA DA iNFORMAO,
PACOtEs EstAtstiCOs E BAsEs DE DADOs
A utilizao cada vez mais forte de tecnologia da informao tambm se
refete no ramo da Estatstica; na verdade, como afrmam Smailes e McGrane
(2002, p. 11) o uso de tecnologia da informao tornou-se parte integrante da
anlise de dados.
34
Curso de Ps-Graduao em Controle da Gesto Pblica
Sofware, entendido como um programa de computador, nada mais que uma
seqncia de instrues, que interpretada e executada por um processador ou
por uma mquina virtual. Em um programa correto e funcional, essa seqncia
segue padres especfcos que resultam em um comportamento desejado. Um
programa pode ser executado por qualquer dispositivo capaz de interpretar e
executar as instrues de que formado.
Quando um software est representado como instrues que podem ser exe-
cutadas diretamente por um processador, dizemos que est escrito em lingua-
gem de mquina. A execuo de um software tambm pode ser intermediada
por um programa interpretador, responsvel por interpretar e executar cada
uma de suas instrues. Uma categoria especial e notvel de interpretadores
so as mquinas virtuais, como a Mquina Virtual Java (JVM), que simulam um
computador inteiro, real ou imaginado.
O dispositivo mais conhecido que dispe de um processador o compu-
tador. Atualmente, com o barateamento dos microprocessadores, existem
outras mquinas programveis, como telefone celular, mquinas de auto-
mao industrial, calculadora, etc.
(Wikipedia, Disponvel em: http://pt.wikipedia.org/wiki/Software. Acesso
em: 01/07/2008)
Existem inmeros pacotes estatsticos poderosos disponveis no mercado,
alguns de uso comercial e outros de cdigo aberto. Como exemplos de sof-
twares comerciais voltados para a Estatstica, podemos citar pelo menos dois
bastante poderosos: o SPSS e o Minitab.
O SPSS, sigla em ingls de Statistical Package for Social Science (Pacote Es-
tatstico para as Cincias Sociais) um programa muito conhecido e utilizado na
rea de Cincias Sociais aplicadas. Trata-se de um software poderoso, cujas infor-
maes a respeito de suas caractersticas e valor da licena podem ser obtidas em:
http://www.spss.com.br/
O Minitab
. Apesar de ser um
programa que no foi construdo especifcamente para ser uma ferramenta
estatstica, apresenta diversas funcionalidades que o tornam adequado para
projetos de anlise de dados que no sejam extremamente sofsticados. Trata-
se de uma interface bastante conhecida de muitos usurios e bastante visual o
que pode tornar o aprendizado da Estatstica mais intuitivo.
Como a maioria dos estudantes j teve algum contato com planilhas, o pro-
cesso de trabalhar funes estatsticas dentro delas fca bastante facilitado.
Dentro do universo de cdigos abertos ou softwares livres podemos encon-
trar um projeto bastante interessante voltado para o mundo da Estatstica.
Trata-se do The R Project for Statistical (Projeto R para a Estatstica) conheci-
do simplesmente como R. Trata-se de um projeto de linguagem e ambiente
para programao estatstica atravs de um software livre. Para maiores infor-
maes sobre o R consulte o site:
http://www.r-project.org/
Chegamos ao fm da Unidade 2. Para fxar os conceitos aqui elencados,
faa a avaliao a seguir. Caso tenha dvidas sobre o contedo estudado,
procure esclarec-las antes de seguir em frente. Este contedo bsico
para os posteriores.
Atividades de auto-avaliao 1
Para entrar no esprito do aprendizado assista ao vdeo 1)
no YouTube sobre conhecimento e deixe seu comentrio
no frum especfco da introduo.
http://www.youtube.com/watch?v=AXzfjQeEjYg
36
Curso de Ps-Graduao em Controle da Gesto Pblica
Procure, em revista ou jornal, informaes na forma de 2)
fgura ou grfco que representem uma sumarizao de
dados quantitativos.
Procure pesquisar algumas fontes na internet que apresen- 3)
tam dados e informaes que serviriam para trabalhos de
anlise estatstica.
Procure identifcar se seu estado ou municpio dispem de 4)
um rgo ou mais que renem informaes e dados.
Selecione, de uma das bases encontradas, um conjunto de 5)
dados e procure organizar a informao utilizando as fer-
ramentas que foram apresentadas nesta Unidade. Descre-
va as ferramentas que devem ser utilizadas e encaminhe
seu relatrio para a tutoria.
Saiba mais
Veja abaixo uma lista de sites, no Brasil e no mundo, que oferecem bases de
dados interessantes e que podem ser usadas para pesquisas que se utilizam
de ferramentas estatsticas:
IPEA www.ipea.gov.br
Fundao SEADE www.seade.gov.br
Fundao CIDE www.cide.rj.gov.br
IBGE www.ibge.gov.br
OCDE www.ocde.org
ONU www.un.org
FAO www.fao.org
37
Unidade 2 - Planejamento de uma Pesquisa com Levantamento e Anlise de
Dados Quantitativos
REsUMO DA UNiDADE
Nesta unidade aprendemos a utilizar algumas ferramentas da estatstica
descritiva e tambm a construir histogramas e polgonos de freqncia.
Tambm aprendemos a diferenciar dados primrios e secundrios bem
como conhecemos algumas ferramentas computacionais usualmente uti-
lizadas para auxiliar na anlise estatstica.
3
Nesta unidade voc compreender o que
uma medida de tendncia central, e ter
condies de construir as seguintes medi-
das de tendncia central: mdia, mediana e
moda, e poder interpretar o signifcado
destas medidas.
Unidade 3
Medidas de tendncia central
3
Nesta unidade voc compreender o que
uma medida de tendncia central, e ter
condies de construir as seguintes medi-
das de tendncia central: mdia, mediana e
moda, e poder interpretar o signifcado
destas medidas.
Unidade 3
Medidas de tendncia central
40
Curso de Ps-Graduao em Controle da Gesto Pblica
Voc j deve ter se defrontado muitas vezes com a expresso mdia em
jornais e revistas. As questes podem ser de diferentes tipos:
Qual a idade mdia do brasileiro?
Qual a renda mdia da populao do municpio?
Qual a arrecadao mdia de um determinado tributo numa determinada
municipalidade?
Na verdade uma maneira muito interessante de observar a realidade e des-
crev-la de uma forma sinttica encontrando um nmero ou expresso
que represente o que tpico daquele conjunto de dados (LEVIN; FOX,
2004).
O componente tpico daquele conjunto de dados o que conhecemos
como valor mdio do mesmo conjunto e, na estatstica, esse valor conhe-
cido como medida de tendncia central. Normalmente para uma pessoa
comum o termo mdia pode ser confuso, mas para o pesquisador esta
expresso precisa e expressa numericamente em diversas medidas de
tendncia central. As medidas apresentadas nesta unidade so trs:
mdia;
mediana e
moda.
3.1 MDiA
A medida de tendncia central mais conhecida e utilizada a mdia. A for-
ma de obter a mdia de um conjunto de dados quantitativos atravs da soma
dos valores referentes a todo o conjunto de observaes dividida pelo nmero
de observaes. A mdia pode ser expressa pela frmula matemtica:
41
Unidade 3 - Medidas de Tendncia Central
N
X
X
=
Onde:
X = mdia (normalmente se l X barra)
2
= Raiz Quadrada do somatrio dos quadrados dos desvios
dividido por N
Para facilitar, vamos exemplifcar o clculo do desvio padro tomando dire-
tamente os resultados encontrados para a varincia nos exerccios anteriores.
Para varincia da arrecadao no municpio Alfa calculamos anteriormente:
S
2
= 82.500.000.000,00.
Logo, o desvio padro associado arrecadao do municpio Alfa pode ser
calculado por:
s=
.000,00 82.500.000
s= 287.228,13.
Para Beta, tnhamos
Com objetivo de
colocar a medida
da varincia numa
perspectiva mais
apropriada que se
desenvolveu a medida
denominada Desvio
padro.
60
Curso de Ps-Graduao em Controle da Gesto Pblica
S
2
= 210.500.000.000,00
Logo:
s= 0.000,00 210.500.00
s= 458.802,79
O desvio padro permite uma interpretao melhor do que a varincia na
medida em que respeita a unidade de medida correta. No exemplo anterior os
valores 287.228,13 e 458.802,79 relacionados aos desvios de Alfa e Beta esto
em reais (R$).
O desvio padro, na forma como foi calculado at agora, representa uma
variabilidade mdia associada distribuio, na medida em que mensura a
mdia dos desvios a partir da sua mdia (LEVIN; FOX, 2004). Quanto maior
o desvio padro relacionado a uma distribuio, maior a variabilidade dos
dados dentro da distribuio.
O clculo do desvio padro extremamente til para compreender a varia-
bilidade dentro de uma dada distribuio de dados e tambm para comparar
diferentes conjuntos de distribuio. O exemplo anterior bastante evidente
ao permitir ao usurio da informao perceber que embora os dois municpios
tenham uma mdia exatamente igual em termos de arrecadao de recursos,
o comportamento da arrecadao em cada um dos municpios diferente, ao
apresentar pelo menos uma peculiaridade importante: o municpio Beta apre-
senta uma variabilidade dessa arrecadao bem maior.
Como ser discutido na prxima Unidade, o signifcado e as interpretaes
do desvio padro, da forma como foi apresentado, ser bastante importante
para interpretar os valores dentro do que chamado distribuio normal.
4.5 COMPARANDO MEDiDAs DE
VARiABiLiDADE
Esta Unidade discutiu algumas medidas de disperso ou variabilidade que
podem ser associadas a um determinado conjunto de dados. Estas medidas fo-
ram defnidas porque se percebeu que as medidas de tendncia central, apesar
61
Unidade 4 - Medidas de Variabilidade
de extremamente teis, possuam algumas limitaes. Para superar algumas
dessas limitaes, foram apresentadas quatro medidas de variabilidade:
Amplitude
Desvio mdio
Varincia
Desvio padro
Cabe agora resumir um pouco as principais caractersticas, com seus po-
tenciais e limitaes, de cada uma dessas medidas e verifcar como elas podem
ser comparadas.
A amplitude, primeira medida de variabilidade abordada, a medida mais
simples, e por isso mais limitada, da variabilidade de um conjunto de escores.
Por isso esta medida s deve ser utilizada como elemento de uma anlise ini-
cial ou preliminar de um conjunto de dados. Entretanto, o valor da amplitude
de um conjunto de dados pode se constituir numa ferramenta til para esti-
mar (mas no calcular) o desvio padro.
Numa distribuio simtrica de escores normalmente se estima que um
conjunto de trs desvios padro para cima e para baixo de uma mdia cobre
todo o conjunto de dados. No objetivo aprofundar esta discusso nesse
momento, mas este fato apresentado atravs do grfco de distribuio de
freqncias abaixo.
Desvio Padro
Percentagens Acumuladas
Percentagensde
casos em oito
pores da curva
Curva Normal
Percentis
Escores z
-4,0 -3,0 -2,0 -1,0 0 +1,0 +2,0 +3,0 +4,0
99 95 90 80 70 60 50 40 30 20 10 5 1
0,1%
-3
2,3% 15,9% 50% 84,1% 99,7% 99,9%
0,13% 0,13% 2,14% 2,14% 13,59% 13,59% 34,13% 34,13%
-2 -1 +1 0 +2 +3 +4
Figura 4.1 Grfco de Distribuio de Freqncia e Desvio padro
O grfco evidencia que, dada uma mdia de uma distribuio e um de-
62
Curso de Ps-Graduao em Controle da Gesto Pblica
terminado desvio padro, se adicionarmos a mdia, representada no grfco
como x no eixo horizontal, trs vezes o desvio padro (chegando a 3s) e, da
mesma forma, projetarmos no lado esquerdo do grfco trs vezes o desvio
padro, teremos uma distribuio que normalmente abrange todo o conjunto
de dados (amplitude da amostra).
Considerando que isto um padro que ocorre freqentemente, poder-
amos estimar que o desvio padro de um determinado conjunto de escores
seria a amplitude dividida por seis. Obviamente isto uma aproximao, mas
permite pelo menos que a pessoa interessada na informao possa se aproxi-
mar do que poderia ser um valor prximo do desvio padro do conjunto.
Uma informao importante: esta regra funciona mais adequadamente
para um grande conjunto de dados. Para um nmero mais reduzido de esco-
res, a regra de um sexto da amplitude no deve ser utilizada. Para poucos da-
dos mais adequado dividir a amplitude por um nmero menor para chegar
ao desvio.
Tomemos como exemplo os dados contidos na tabela abaixo, resultado do
conjunto de escores de arrecadao nos municpios Alfa e Beta.
Tabela 4.6 Resumo das Medidas de Variabilide
associadas arrecadao dos
municpios Alfa e Beta
AMPlITUDE
DESVIo
MDIo
VARINCIA
DESVIo
PADRo
AlFA 900.000 250.000 82.500.000.000,00 287.228,13
BETA 1.500.000 390.000 210.500.000.000,00 458.802,79
Se fssemos utilizar a regra de um sexto da amplitude, teramos para esti-
mativa de desvio padro:
ALFA =
6
000 . 900
= 150.000
63
Unidade 4 - Medidas de Variabilidade
e
BETA =
6
000 . 500 . 1
= 250.000
Que so obviamente valores mais baixos do que o desvio padro efetiva-
mente calculado, devido justamente ao fato de o nmero de escores, dez, ser
muito baixo.
A amplitude calculada usando unicamente dois valores, os extremos de
um dado conjunto de dados, mas as outras medidas de variabilidade, para se-
rem obtidas, devem considerar todos os escores.
O desvio mdio atualmente pouco usado por no ser muito til para an-
lises estatsticas mais sofsticadas. A tendncia de se utilizar o desvio padro
como uma boa medida da variabilidade, uma vez que este clculo resolve o
problema dos sinais de desvios de uma forma que mantm a consistncia nas
unidades de medida utilizadas.
Apesar das vantagens, o desvio padro tambm apresenta algumas limita-
es, sendo a principal delas o fato de se tratar de um mtodo demorado, j
que deve contemplar todo o conjunto de dados. Entretanto, com o advento
de calculadores e softwares, a utilizao desta medida se tornou cada vez mais
comum para os mais diferentes tipos de usurio.
Chegamos ao fm da Unidade 4. Para fxar os conceitos aqui elencados, faa
a avaliao a seguir. Caso tenha dvidas sobre o contedo estudado, procure
esclarec-las antes de seguir em frente. Este contedo bsico para os pos-
teriores.
Atividades de Aprendizagem 1
Procure na internet, ou em revistas e jornais, informaes e fontes de
dados quantitativos, preferencialmente ligadas rea fnanceira de seu
municpio. Procure uma srie de dados com valor de observao menor
64
Curso de Ps-Graduao em Controle da Gesto Pblica
ou igual a cinqenta e maior ou igual a trinta (50 N 30) e determine
as seguintes medidas de variabilidade:
Amplitude
Desvio mdio
Varincia
Desvio padro
Alm das medidas de variabilidade, monte um quadro que contenha as
seguintes medidas de tendncia central:
Mdia
Mediana
Elabore tambm um histograma de freqncia utilizando os conheci-
mentos adquiridos nas Unidades anteriores.
Procure interpretar os resultados encontrados.
Saiba mais
http://pt.wikipedia.org/wiki/Desvio_padr%C3%A3o
http://pt.wikipedia.org/wiki/Vari%C3%A2ncia
65
Unidade 4 - Medidas de Variabilidade
REsUMO DA UNiDADE
Nesta unidade aprofundamos mais alguns elementos da Estatstica. Nela co-
nhecemos medidas relacionadas a um universo que podem ajudar a supe-
rar algumas das limitaes naturais das medidas anteriormente estudadas.
Para isso, algumas novas medidas foram apresentadas: Amplitude, Desvio
mdio, Varincia e Desvio padro. A amplitude a medida mais simples, e
por isso mais limitada, da variabilidade de um conjunto de escores. O des-
vio mdio pouco utilizado justamente por no ser adequado para anlises
estatsticas mais sofsticadas. O desvio padro se apresenta como uma boa
medida da variabilidade, mas tambm tem limitaes, sendo a principal
delas o fato de se tratar de um mtodo demorado, j que deve contemplar
todo o conjunto de dados.
5
Nesta unidade voc compreender as
regras e as aplicaes das leis da Proba-
bilidade.
Unidade 5
Distribuio de Probabilidades
5
Nesta unidade voc compreender as
regras e as aplicaes das leis da Proba-
bilidade.
Unidade 5
Distribuio de Probabilidades
68
Curso de Ps-Graduao em Controle da Gesto Pblica
As decises que tomamos todos os dias muitas vezes contm uma parcela
bastante signifcativa de incerteza. Quando nos referimos ao mundo da
gesto esta questo mais presente (ANDERSON; SWEENEY; WILLIAMS,
2005). Pense na perspectiva de um gestor da Administrao Pblica nas
seguintes questes:
Qual a chance de determinada obra ser concluda no prazo estabelecido?
Qual a probabilidade de um novo imposto ter o grau de retorno esperado?
Qual a probabilidade de aumentar a arrecadao com a mudana de
alquota?
Todas as essas questes remetam ao que chamamos de probabilidade, a
pedra angular da tomada de deciso, segundo Levin e Fox (2004). A probabili-
dade um mtodo de testar hipteses por meio de uma anlise detalhada de
dados associados. Embora muitas vezes seja difcil de assimilar o real signif-
cado do termo probabilidade, percebemos que o utilizamos o tempo todo em
nosso cotidiano.
Vamos pensar no exemplo do meteorologista que diariamente nos informa
sobre a previso do tempo para o dia seguinte. Normalmente iremos ouvir ou
ler expresses como estas:
Existe 90% de chance de ocorrerem chuvas esparsas no perodo
Ou
A probabilidade de chuvas no domingo est abaixo de 10%
Em termos matemticos a probabilidade, que uma medida numrica da
plausibilidade de que um evento ocorrer (ANDERSON; SWEENEY; WILLIA-
MS, 2005), deve variar entre zero (0) e um (1). A utilizao de percentuais
bastante comum quando falamos de probabilidade, mas claro que ainda obe-
decer regra anterior.
A Figura abaixo retrata a probabilidade como valor numrico associado
plausibilidade.
69
Unidade 5 - Distribuio de Probabilidades
A ocorrncia do evento
to provavel quanto o improvavel
Plausibilidade Crescente de Ocorrncia
0 0,5 1,0
Figura 5.1 Probabilidade como Medida Numrica da Plausabilidade de Ocorrncia
Fonte: Anderson, Sweeney e Williams (2005, p. 137)
Uma probabilidade de 1 (100%) constitui a certeza que determinado evento
ocorrer e o contrrio, probabilidade de 0 (0%), indica tambm certeza, mas
de que determinado evento no ocorrer. Quando navegamos dentro deste
intervalo (zero at um), estaremos discutindo as possibilidades, maiores ou
menores, de que um determinado evento ocorra.
Algumas vezes a probabilidade de ocorrncia de um evento determinado
fcil de calcular. O exemplo mais utilizado o do lanamento de uma moeda
que, ao cair, pode apresentar como face superior a fgura da cara ou da coroa.
Neste caso a probabilidade de ocorrncia, tanto de Cara como Coroa, de
0,5 ou 50%. Entretanto existem situaes bem mais complexas nas quais vrias
regras devero ser aplicadas para chegar probabilidade correta.
Nesta unidade vamos procurar compreender algumas da regras bsicas da
Probabilidade. A defnio de Lewin e Fox (2004, p. 142) associa ao termo
probabilidade a possibilidade relativa da ocorrncia de um resultado ou
evento arbitrrio. Ou seja, a probabilidade associada a um evento o n-
mero de vezes que ele pode ocorrer em relao ao nmero total de vezes
que qualquer evento pode ocorrer.
Uma representao matemtica desta expresso seria:
P(A) =
n
m
Onde
m = nmero de casos favorveis ao evento A
n = nmero de casos possveis
70
Curso de Ps-Graduao em Controle da Gesto Pblica
Tomemos um exemplo bastante simples: a probabilidade de o lanamento
de um dado com seis faces tenha como resultado o nmero trs. Temos, para
este caso:
n = seis, ou seja, podemos ter como resultado valores de 1, 2, 3, 4, 5 e 6
total de seis alternativas.
Para m teremos apenas um caso, a face com o nmero trs.
Aplicando a frmula
P(A) =
6
1
= 0,1667 ou 16,67%
A = nmero 3
Da mesma maneira podemos calcular a probabilidade de retirar uma carta
ou mais de um baralho de cartas. Tomemos a chance de retirar uma fgura de
Damas, independentemente do naipe, do baralho. Para isso teramos
P(A) =
52
4
= 0,0769 ou 7,69%
A = Figura de Damas
A partir desta frmula inicial podemos deduzir uma srie de regras da Pro-
babilidade.
A primeira regra que podemos apresentar aqui a probabilidade de no
ocorrncia, conhecida como regra complementar da probabilidade.
Esta regra afrma que a probabilidade de no ocorrncia igual a um me-
nos a probabilidade de ocorrncia. No exemplo do dado, a probabilidade de
no ocorrncia de trs ser igual a um menos a probabilidade de ocorrncia,
ou seja:
P(B) = [1- P(A)] = ( 1 - 0,1667) = 0,8333
B = nmero diferente de trs
Ou para o exemplo de no tirar uma fgura de Damas do baralho de cartas,
temos:
P(B) = [1- P(A)] = ( 1 - 0,0769) = 0,9231
71
Unidade 5 - Distribuio de Probabilidades
B = Figura diferente de Damas
Outra regra bastante conhecida da probabilidade a regra de adio, que
afrma que a probabilidade de se obter um qualquer, dentre vrios resul-
tados diferentes, igual a soma de suas probabilidades separadas (LEVIN;
FOX, 2004, p.143).
Tomemos o exemplo dos dados, agora para verifcar a probabilidade de
que, ao lan-los, os resulta seja ou trs ou dois. Pela regra da adio temos:
P(A) =
6
1
= 0,1667 ou 16,67%
A = nmero 3
P(B) =
6
1
= 0,1667 ou 16,67%
A = nmero 2
P(C) = P(A) + P(B) = 0,1667 + 0,1667 = 0,3334 ou 33,34%
C = nmero 2 ou trs
A regra de adio considera sempre que os resultados so mutuamente
excludentes, ou seja, os dois no podem ocorrer simultaneamente. No caso
anterior o resultado pode ser trs oU dois, e no trs E dois.
Outra regra importante da probabilidade a regra da multiplicao. Por
esta regra a probabilidade de se obter uma combinao de resultados in-
dependentes igual ao produto de suas probabilidades individuais (LEVIN;
FOX, 2004, p. 144).
Vamos exemplifcar atravs do caso do lanamento de moedas. Verifca-
mos que a chance ou probabilidade de que o resultado do lanamento de uma
moeda seja cara de 0,5. Mas qual seria a probabilidade de, realizando dois
lanamentos consecutivos, os dois resultados serem cara?
Pela regra da multiplicao, considerando que os resultados so independen-
tes, teremos que a probabilidade de obter duas caras nos dois lanamentos seria:
72
Curso de Ps-Graduao em Controle da Gesto Pblica
P(C) = P(B) * P(A)
Onde
P(A) probabilidade de cara no primeiro lanamento = 0,5
P(B) probabilidade de cara no segundo lanamento = 0,5
P(C) = probabilidade de ocorrer cara nos dois lanamentos
P(C) = 0,5 * 0,5 = 0,25 = 25%
Por ltimo, vamos explorar um pouco o que chamado de distribuio de
probabilidade. Nas unidades anteriores voc conheceu algumas medidas de
apresentao da cincia Estatstica e, dentre elas, uma conhecida como distri-
buio de freqncia. Na Unidade 2 foi apresentado o exemplo do tamanho
da populao de diferentes municpios e essas informaes foram sumariza-
das atravs de um histograma de freqncias.
A distribuio de probabilidade semelhante quela anteriormente apre-
sentada, sendo que a nica diferena que obedece a uma teoria e no o que
foi observado efetivamente.
Para exemplifcar a construo de uma fgura que represente a distribuio
de probabilidade vamos utilizar o exemplo do lanamento de moedas:
Suponhamos que voc lance duas moedas e que voc queira saber quantas
caras obter destes lanamentos. Na distribuio de probabilidades o pesqui-
sador est justamente preocupado em saber como se dar a distribuio das
ocorrncias.
Existem trs possibilidades a partir do lanamento das duas moedas:
podemos obter nenhuma cara nas duas moedas; 1.
podemos obter uma cara nas duas moedas; 2.
podemos obter duas caras nas duas moedas. 3.
Vamos calcular as probabilidades para cada uma das possibilidades:
73
Unidade 5 - Distribuio de Probabilidades
1. A probabilidade de obter duas caras, nos dois lanamentos independen-
tes, igual probabilidade de obter duas coroas (probabilidade de no
ocorrncia), ou seja:
P(1) = 0,5 * 0,5 = 0,25.
2. A probabilidade de obter uma cara, nos dois lanamentos independen-
tes, igual a probabilidade de obter uma cara na jogada 1 e uma coroa
na jogada dois, adicionada probabilidade de obter uma coroa na joga-
da um e uma cara na jogada dois. Logo:
P(2) = 0,5 * 0,5 + 0,5 * 0,5 = 0,50.
3. A probabilidade de obter duas caras, nos dois lanamentos independen-
tes, igual probabilidade de obter duas coroas (probabilidade de no
ocorrncia) ou seja:
P(3) = 0,5 * 0,5 = 0,25.
A partir dessas dedues podemos construir uma tabela e um grfco da
distribuio de probabilidades para dois lanamentos de moeda.
Tabela 5.1 Distribuio de probabilidades
para ocorrncia de Cara em dois
lanamentos independentes de moeda
CARA PRoBABIlIDADE (P)
0 0,25
1 0,50
2 0,25
ToTAl 1,00
74
Curso de Ps-Graduao em Controle da Gesto Pblica
P
r
o
b
a
b
i
l
i
d
a
d
e
Nmero de Caras
0,60
0,50
0,40
0,30
0,20
0,10
0
Grfco 5.1 Distribuio de probabilidades para ocorrncia de cara em dois lanamentos independentes de moeda
Observe atentamente o grfco de distribuio e agora faa uma experi-
ncia. Pegue duas moedas e realiza dez lanamentos anotando o nmero de
caras e coroas para cada lanamento. Ao fnal dos dez lanamentos anote:
o nmero de vezes em que ocorreram duas caras no lanamento;
o nmero de vezes em que no ocorreram caras no lanamento;
o nmero de vezes em que ocorreu uma cara no lanamento.
O resultado encontrado igual ao que voc observa na tabela anterior.
Pode ser que isso ocorra, mas pode ser que no. A principal diferena que
o caso experimental trata de uma distribuio de freqncias real e no de
probabilidades.
A distribuio de probabilidades ideal ou terica, ou seja, representa o que
deveria acontecer, mas no o que efetivamente ocorre na realidade.
Entretanto, se aumentarmos o nmero de lanamentos, a curva de distri-
buio de freqncias fcar mais prxima da curva de distribuio de probabi-
lidades uma vez que uma distribuio de probabilidades pode ser aproximada
a uma distribuio de freqncias para um nmero infnito de provas.
75
Unidade 5 - Distribuio de Probabilidades
A curva normal que a representao grfca da distribuio de probabili-
dades est representada abaixo.
rea total = 1
Pontos de inexo
- 3 + 3 - + - 2 + 2
x
Figura 5.2 A forma da Curva Normal
Chegamos ao fm da Unidade 5. Para fxar os conceitos aqui elencados, faa
a avaliao a seguir. Caso tenha dvidas sobre o contedo estudado, procure
esclarec-las antes de seguir em frente. Este contedo bsico para os poste-
riores.
Atividades de Aprendizagem 1
Refita sobre o contedo terico que foi abordado nesta Unidade e iden-
tifque trs possibilidades prticas de utilizao das teorias da probabili-
dade em seu trabalho profssional.
Saiba mais
Aprenda mais sobre probabilidade em:
http://pt.wikipedia.org/wiki/Distribui%C3%A7%C3%A3o_de_probabilidade
76
Curso de Ps-Graduao em Controle da Gesto Pblica
REsUMO DA UNiDADE
Nesta unidade voc deve ter aprendido a trabalhar com a incerteza, atravs
do conhecimento de alguns elementos da probabilidade. A principal regra
a Probabilidade de no ocorrncia, conhecida como regra complementar
da probabilidade. Alm disso, estudamos as regras da adio e multiplica-
o e observamos o comportamento da curva de distribuio de probabi-
lidades.
Anotaes
a m d
6
Nesta unidade voc entender os
conceitos de Universo e Amostra.
Calcular o tamanho da amostra para
Universos Finitos e Infnitos e conseguir
estimar caractersticas do Universo a
partir da amostra.
Unidade 6
Teoria de Amostragem
6
Nesta unidade voc entender os
conceitos de Universo e Amostra.
Calcular o tamanho da amostra para
Universos Finitos e Infnitos e conseguir
estimar caractersticas do Universo a
partir da amostra.
Unidade 6
Teoria de Amostragem
80
Curso de Ps-Graduao em Controle da Gesto Pblica
Na maioria das vezes bastante difcil obter todos os dados de um proble-
ma para poder analis-lo ou resolv-lo. Pense nos custos envolvidos quan-
do um gestor procura conhecer um aspecto quantitativo de seu municpio
e para isso resolve coletar todos os dados disponveis.
Alm do custo, muitas vezes impossvel juntar efetivamente todos os
dados de uma realidade para uma anlise mais detalhada.
Esses so alguns dos motivos que conduzem necessidade de se trabalhar
muitas vezes com uma parte de um determinado conjunto de dados e no
com todos.
O que se procura , atravs da anlise de parte do conjunto total de dados
existentes, extrair um conjunto de informaes a respeito do total de da-
dos e no somente da parte que foi analisada.
So as tcnicas de amostragem que vo permitir este tipo de trabalho.
Para que se discutam os elementos que constituem a Teoria da Amostra-
gem, necessrio inicialmente defnir alguns termos centrais da teoria. O pri-
meiro refere-se ao conjunto total de dados, cujas caractersticas um observa-
dor pretende capturar, e que denominado de Populao ou Universo.
Normalmente falamos de populao quando nos referimos ao conjunto de
habitante de um lugar (RICHARDSON, 1999). Numa perspectiva estatstica,
a populao ou universo pode ser efetivamente o conjunto total de indiv-
duos que trabalham em uma organizao. Estes indivduos (populao ou
universo) possuem caractersticas distintas que so alvo do interesse de um
pesquisador.
Cada indivduo de uma populao denominado elemento. Um grupo de
indivduos, tomados em conjunto para identifcar determinadas caractersticas
de uma populao, defnido como amostra.
Nesse sentido, a princpio, uma amostra poderia ser defnida como qual-
quer subconjunto de uma populao ou universo.
Os parmetros so os
valores caractersticos
de uma populao ou
universo. Podemos
citar, por exemplo:
Mdia, Desvio padro,
Proporo, Coef-
ciente de Correlao
etc. Espera-se, com a
utilizao da teoria da
amostragem, conse-
guir as caractersticas
da populao atravs
da observao das
caractersticas da
amostra. Estes valores,
para a amostra, so
denominados Estatsti-
cos da amostra.
Uma amostra repre-
sentativa aquela que
tem a mesma compo-
sio ou estrutura da
populao.
81
Unidade 6 - Teoria da Amostragem
importante ressaltar que muitas vezes perceberemos que a especifcao
de uma populao ou amostra poder se alterar, dependendo da perspectiva
em que se trabalha.
Uma sala de aula, composta por trinta alunos, pode ser uma amostra de
todos os alunos que estudam em uma escola, mas tambm pode ser o universo
ou populao se o interesse fosse por um determinado perfl especfco da sala
e voc, como pesquisador, tomasse alguns dos componentes dessa sala como
amostra.
Atravs de procedimentos de amostragem, o pesquisador se torna apto a
resolver problemas de trs tipos principais:
Estimar as caractersticas (parmetros) de uma populao a partir dos 1.
dados estatsticos de sua amostra.
Determinar se uma amostra provm de uma populao da qual se co- 2.
nhecem suas caractersticas (parmetros).
Determinar se duas ou mais amostras, com dados estatsticos conheci- 3.
dos, tm origem numa mesma amostra.
Talvez voc esteja se questionando neste momento:
Seria possvel, a partir de qualquer amostra, responder s questes ante-
riormente levantadas?
Para que possamos responder a esta questo necessrio esclarecer dois
aspectos principais:
Primeiramente, para que uma amostra fornea, a partir de seus dados es-
tatsticos, os parmetros de uma populao, fundamental que ela represente
efetivamente esta populao ou universo. O termo utilizado normalmente
representatividade.
Em segundo lugar, as amostras tm que cumprir algumas exigncias do pla-
no experimental. Isto quer dizer que ao escolher os elementos que integraro
a amostra, deve-se medir ou controlar as variveis independentes que podem
infuir na varivel dependente, nos grupos experimentais ou de controle e que,
desse modo, podem vieses nas interpretaes das hipteses.
Os parmetros so os
valores caractersticos
de uma populao ou
universo. Podemos
citar, por exemplo:
Mdia, Desvio padro,
Proporo, Coef-
ciente de Correlao
etc. Espera-se, com a
utilizao da teoria da
amostragem, conse-
guir as caractersticas
da populao atravs
da observao das
caractersticas da
amostra. Estes valores,
para a amostra, so
denominados Estatsti-
cos da amostra.
Uma amostra repre-
sentativa aquela que
tem a mesma compo-
sio ou estrutura da
populao.
82
Curso de Ps-Graduao em Controle da Gesto Pblica
As amostras podem ser divididas em dois tipos principais:
Amostras probabilsticas;
Amostras no probabilsticas.
Nas amostras no probabilsticas os elementos que constituiro a amostra
so escolhidos por critrios que podem ser acidentais ou intencionais. J na
amostra probabilstica (probabilstica, aleatria ou ao acaso), que ser jus-
tamente aquela trabalhada na Estatstica, qualquer elemento da populao
ou universo deve ter a mesma chance de ser escolhido como membro da
amostra.
O que defne se uma amostra aleatria justamente o fato de que qualquer
elemento do universo deve ter a mesma probabilidade (diferente de zero) de fazer
parte dela. Para que se cumpra este pr-requisito necessrio ter a listagem de to-
dos os componentes que fazem parte de uma determinada populao. Com isso
possvel selecionar ao acaso os membros da populao que constituiro a amostra,
deixando a eles a mesma chance de fazer parte da amostra.
A listagem de todos os componentes, ou universo, defnida como marco de
referncia ou base da amostragem (RICHARDSON, 1999). No caso em que se
escolha diretamente desta lista a amostragem denominada aleatria ou simples.
A representatividade das amostras guiada pelas leis da probabilidade, ou
seja, a forma como selecionamos a amostra diante da populao defnir
a sua.
Importante observar o que fazemos com um elemento retirado da popula-
o para compor a amostra: caso o elemento volte para a populao, a amos-
tra defnida como com reposio de elementos. Em caso contrrio, teramos
uma amostra sem reposio.
A utilizao de amostra aleatria simples apresenta algumas vantagens
importantes:
no requer muito conhecimento da populao;
83
Unidade 6 - Teoria da Amostragem
bastante fcil de calcular;
facilita a anlise.
Mesmo assim podemos citar uma desvantagem importante da utilizao
de amostra aleatria simples, que o fato de no garantir que casos minorit-
rios sejam includos quando a populao ou universo for muito grande.
Existem dois princpios bsicos que se relacionam diretamente com a repre-
sentatividade da amostra:
a) quanto maior o percentual da amostra diante da populao, maior a
chance de a amostra ser representativa;
N
n
= frao da amostragem onde n igual ao tamanho da amostra e N o
tamanho da populao
b) para uma populao igual ou acima de 10.000 (N 10.000), uma frao
de amostragem de 0,1 (10%) apresenta uma probabilidade aceitvel de
ser representativa.
6.1 tAMANhO DAs AMOstRAs
Percebe-se, a partir do exposto anteriormente, que no basta constituir
uma poro de elementos para ter uma amostra da populao. tambm
necessrio que esse conjunto represente efetivamente as caractersticas pes-
quisadas da populao em estudo.
84
Curso de Ps-Graduao em Controle da Gesto Pblica
Para isso ela deve incluir um nmero sufciente de elementos escolhidos de
forma aleatria ou ao acaso, para que certo grau de segurana estatstica
seja conferido as inferncias que podemos fazer a partir dela.
Neste momento compreenderemos a forma para determinar ou calcular o
tamanho de amostra necessrio para que essa representatividade seja al-
canada, dentro de alguns padres de segurana estabelecidos, bem como
para atender a alguns aspectos prticos como custo, tempo etc., necess-
rios para qualquer trabalho de pesquisa.
De uma forma bastante simplifcada, o tamanho de uma amostra vai de-
pender basicamente dos quatro fatores relacionados abaixo:
Amplitude da Populao
Nvel de Confana pretendido
Erro de estimao permitido
Proporo da caracterstica pesquisada na Populao.
Amplitude
Considerando este aspecto, uma populao pode ser fnita ou infnita. Po-
pulaes ou universos fnitos so aqueles menores que 100.000 (N 100.000)
e universos infnitos so aqueles que ultrapassam este limite (100.000). Esta
diferena importante na determinao do tamanho da amostra, uma vez que
conduz frmulas diferentes. Em universos infnitos a amplitude no infuen-
cia na frmula, diferentemente do caso de universos fnitos.
Nvel de Confana
Mostramos anteriormente, atravs da Distribuio de Probabilidades, que
uma distribuio tem a tendncia de se ajustar forma de distribuio normal,
de acordo com a fgura abaixo.
85
Unidade 6 - Teoria da Amostragem
Desvio Padro
Percentagens Acumuladas
Percentagensde
casos em oito
pores da curva
Curva Normal
Percentis
Escores z
-4,0 -3,0 -2,0 -1,0 0 +1,0 +2,0 +3,0 +4,0
99 95 90 80 70 60 50 40 30 20 10 5 1
0,1%
-3
2,3% 15,9% 50% 84,1% 99,7% 99,9%
0,13% 0,13% 2,14% 2,14% 13,59% 13,59% 34,13% 34,13%
-2 -1 +1 0 +2 +3 +4
Figura 6.1 Forma da Curva Normal
A fgura mostra que os valores centrais na distribuio so os mais eleva-
dos, ou seja, repetem-se com mais freqncia do que os valores nos extremos
da curva.
A partir da compreenso do comportamento da distribuio, que obedece
a forma normal, podemos defnir o nvel de confana como rea da curva que
se pretende abranger. Por exemplo, se o pesquisador deseja fazer estimativas
com 90% de segurana, ele deve considerar 90% da rea sob a curva de dis-
tribuio normal. Em cincias sociais normalmente se trabalha com um nvel
de confana de 95% mas quando se deseja um nvel de confana maior, este
percentual dever ser superior a isso.
Erro de Estimao
J sabemos que o resultado da amostra no ser exatamente igual popu-
lao que se procura representar. Na verdade sabemos que podem ocorrer
erros de medio, mas que esses erros diminuem medida que o tamanho da
amostra cresce. Na rea de Cincias Sociais no aceito um erro de estimao
superior a 6%, sendo que na maioria das pesquisas vamos observar estatsticos
trabalhando com erros de estimao entre 5% e 4%.
Proporo da Caracterstica
O ltimo fator a ser considerado aqui na determinao do tamanho da
amostra o que se conhece por estimativa de proporo (p). Trata-se na verda-
86
Curso de Ps-Graduao em Controle da Gesto Pblica
de de uma estimativa da caracterstica pesquisada no universo ou populao.
Este tipo de estimativa muito difcil de obter em Cincias Sociais ( j que no
fcil conseguir estimativas prvias da caracterstica do universo) e por isso
bastante comum trabalhar com estimativa de proporo de 50%.
A partir das informaes a respeito dos quatro fatores apresentados pode-
mos calcular o tamanho da amostra atravs de duas frmulas, uma destinada
para universos fnitos e a outra para universos infnitos.
tamanho da Amostra para Universo (Populao) infnito
2
2
e
q Z
n
=
r
Onde
n = Tamanho da Amostra
Z = abscissa da distribuio normal padro, fxado um nvel de confana:
Se o nvel for de 95,0 % - Z = 1,96
Se o nvel for de 95,5 % - Z = 2,00
Se o nvel for de 99,0 % - Z = 2,57
r = Proporo das Caractersticas no Universo (percentual)
q = Proporo no Universo que no possui a caracterstica (q = 100 p)
e = Erro de estimao
Percebemos, observando atentamente a frmula, que, independentemente da
amplitude, o tamanho da amostra no deve variar, dados os fatores estabelecidos.
tamanho da Amostra para Universo (Populao) Finito
q Z N e
N q Z
n
+
=
r
r
2 2
2
) 1 (
87
Unidade 6 - Teoria da Amostragem
Onde
n = Tamanho da Amostra
N = Tamanho da Populao ou Universo
Z = abscissa da distribuio normal padro, fxado um nvel de confana:
Se o nvel for de 95,0 % - Z = 1,96
Se o nvel for de 95,5 % - Z = 2,00
Se o nvel for de 99,0 % - Z = 2,57
r = Proporo das Caractersticas no Universo (percentual)
q = Proporo no universo que no possui a caracterstica (q = 100 p)
e = Erro de estimao
Novamente possvel perceber que no caso de uma Populao ou Universo
fnito o tamanho da amostra depende deste tamanho.
Chegamos ao fm da Unidade 1. Para fxar os conceitos aqui elencados,
faa a avaliao a seguir. Caso tenha dvidas sobre o contedo estudado,
procure esclarec-las antes de seguir em frente. Este contedo bsico
para os posteriores.
Atividades de Aprendizagem 1
Considere os dois casos abaixo:
Voc precisa determinar o tamanho de uma amostra (n) 1)
que seja representativa de uma populao (N) de 60.000
cadastros de proprietrios de imveis que esto em dia
com o pagamento do Imposto Predial Territorial Urbano
(IPTU).
Considere as seguintes condies:
n = Tamanho da Amostra
88
Curso de Ps-Graduao em Controle da Gesto Pblica
N = Tamanho da Populao ou Universo
r = Proporo das Caractersticas no Universo (percentual) = 50
q = Proporo no universo que no possui a caracterstica (q = 100 p)
= 50
e = Erro de estimao = 5
Calcule o tamanho da amostra (n) para os trs nveis de a)
confana abaixo:
95,0 % Z = 1,96
95,5 % Z = 2,00
99,0 % Z = 2,57
O que acontece com o tamanho da amostra medida que b)
mudamos os nveis de confana? Explique:
Considere os dois casos abaixo:
2) Voc precisa determinar o tamanho de uma amostra (n)
que seja representativa de uma populao (N) de 250.000
cadastros de proprietrios de imveis que esto em dia
com o pagamento do Imposto Predial Territorial Urbano
(IPTU).
Considere as seguintes condies:
n = Tamanho da Amostra
N = Tamanho da Populao ou Universo
r = Proporo das Caractersticas no Universo (percentual) = 50
q = Proporo no universo que no possui a caracterstica (q = 100 p)
= 50
e = Erro de estimao = 5
a) Calcule o tamanho da amostra (n) para os trs nveis de
confana abaixo:
95,0 % Z = 1,96
89
Unidade 6 - Teoria da Amostragem
95,5 % Z = 2,00
99,0 % Z = 2,57
b) O que acontece com o tamanho da amostra a medida em
que mudamos os nveis de confana?
c) Se mudssemos o tamanho da Populao ou Universo
para 500.000 cadastros, o que aconteceria com o tamanho
da amostra? Explique:
Saiba mais
Acesse o link abaixo e amplie seus conhecimentos:
http://www.tj.ce.gov.br/esmec/pdf/metodos_quantitativos_censo%20
e%20amostra.pdf
REsUMO DA UNiDADE
Nesta unidade voc foi apresentado aos conceitos de Universo e Amostra.
O Universo compreende o conjunto de todos os indivduos, ou dados, de
uma determinada populao. A amostra refere-se a uma parte da popula-
o que pode reproduzir caractersticas da populao que se quer estudar.
Voc calcular o tamanho da amostra para Universos Finitos e Infnitos e
conseguir estimar caractersticas do Universo a partir da amostra. A re-
presentatividade das amostras obtida pela aplicao das leis da probabi-
lidade, ou seja, a forma como selecionamos a amostra frente populao
defnir a representatividade da amostra. O tamanho de uma amostra que
represente adequadamente uma populao depende basicamente de qua-
tro fatores: amplitude, nvel de confana pretendido, erro de estimao
permitido e proporo da caracterstica pesquisada na populao.
7
Nesta unidade voc compreender os
conceitos de varivel dependente e inde-
pendente. Conseguir construir um
diagrama de disperso e calcular o coef-
ciente de Correlao Linear de Pearson.
Unidade 7
Correlao
7
Nesta unidade voc compreender os
conceitos de varivel dependente e inde-
pendente. Conseguir construir um
diagrama de disperso e calcular o coef-
ciente de Correlao Linear de Pearson.
Unidade 7
Correlao
92
Curso de Ps-Graduao em Controle da Gesto Pblica
At o momento exploramos uma sria de ferramentas da Estatstica que nos
ajudam a compreender a realidade expressa atravs de dados quantitativos.
Para isso utilizamos ferramentas da estatstica descritiva para descrever um
conjunto de dados, estimamos medidas de tendncia de uma varivel e tam-
bm exploramos aspectos de probabilidade relacionados a uma determina-
da caracterstica de um conjunto de dados.
Esta caracterstica usualmente denominada varivel, ou seja, um aspecto que
se modifca ao longo do conjunto de elementos de uma populao.
A partir de agora trabalharemos com estimativas, no de tendncia de
uma nica varivel, mas sim com a medida da relao que pode ocorrer
entre duas variveis. Esta medida de fora entre pares de variveis deno-
minada de correlao.
Correlao uma medida da relao entre duas variveis, sendo que normal-
mente os dados sero representados por pares ordenados (LARSON; FARBER,
2004). Normalmente chamaremos estas duas variveis de:
Varivel independente, plotada convencionalmente no eixo horizontal X
Varivel dependente, plotada usualmente no eixo vertical Y
A varivel independente (X) tambm conhecida como varivel explanat-
ria, e a varivel dependente (Y), como varivel de resposta.
Muitas vezes podemos, olhando um conjunto de dados emparelhados, su-
por a existncia de algum tipo de associao entre eles. Tomemos por exemplo
um beb recm-nascido, que ao longo do tempo apresenta modifcaes de
peso (kg) e estatura (cm). Podemos construir uma tabela com duas colunas, na
qual a primeira representa o peso e a segunda a estatura. Logo perceberemos,
observando tal tabela, que aparentemente a medida que a altura aumenta, o
peso tambm sofre um incremento, o que indicaria uma associao entre estas
duas variveis.
93
Unidade 7 - Correlao
Mas, mesmo percebendo que existe esta associao, qual efetivamente
sua fora? E se pegarmos a evoluo do peso e altura num adolescente de
15 anos ou mesmo num adulto de 30 anos, o que acontece?
Na verdade as correlaes variam efetivamente no que diz respeito sua
intensidade. Podemos visualizar mais facilmente a variao da fora de uma
correlao quando analisamos um diagrama ou grfco de disperso. A Figura
abaixo ilustra como construdo um diagrama de disperso que associa valor
pago pelo aluguel com renda familiar (ambos os valores em R$).
Renda Familiar
3000 2000 1000 0
V
a
l
o
r
p
a
g
o
p
e
l
o
A
l
u
g
u
e
l
400
300
200
100
0
Figura 7.1 Diagrama de Disperso
Alm disso, a direo da associao (ou correlao) entre duas variveis
tambm pode variar. Quando existe uma relao diretamente proporcional
entre as variveis, ou seja, quando uma varivel X aumenta e a outra varivel
Y tambm aumenta, dizemos que existe uma correlao positiva entre as va-
riveis. No caso de associao inversamente proporcional entre as variveis
(X aumenta e Y diminui, por exemplo), dizemos que a correlao negativa.
94
Curso de Ps-Graduao em Controle da Gesto Pblica
Alguns tipos de correlao so mostrados no quadro abaixo.
Linear Positiva
Correlao Diagrama de disperso Descrio
Nula
Linear Negativa
Linear Perfeita
Positiva
Linear Perfeita
Negativa
y
x
y
x
y
x
y
x
x
y
A correlao positiva se os valores crescentes ou decres-
centes x e y estiverem ligados. Ou seja, quando y cresce, x
cresce tambm. Quando y decresce, x decresce tambm.
Nos modelos de correo linear positiva, o valor do coe-
ciente de correlao de Pearson, r , positivo : 0<r<1
A correlao linear perfeita positiva apenas ocorre quando
os valores de x e y yesto perfeitamente alinhados. Nessas
situaes, o valor do coeciente de correlao de Pearson,
r , igual unidade: r = 1
A correlao negativa percebida quando os valores cres-
centes de x ou y esto associados a valores decrescentes de
y ou x, respectivamente. Ou seja, quando y cresce, x de-
cresce e vice-versa. o valor do coeciente de corelao de
Pearson, r , negativo: -1 < r <0
A correlao considerada perfeita negativa quando os
valores de x e y estiverem perfeitamente alinhados, mas
em sentido contrrio. Nessa situao, o valor do coecien-
te de correlao de Pearson, r , iual a menos um: r = -1
A correlao nula pe percebida quando no h relao
entre x e y. As variveis ocorrem independentemente.
Nestas situaes, o valor do coeciente de correlao de
Pearson, r , nulo: r = 0.
Quadro 7.1 Tipos de Correlao
Fonte: Bruni (2007, p.286)
Nos dois casos anteriores verifcamos que a correlao linear, ou seja, a
associao entre as variveis obedece a uma equao linear. Mas nem sempre
a relao entre as variveis ser linear. Existem medidas de associao fortes
entre variveis que obedecem a outras formas que no uma reta.
A partir das consideraes anteriores podemos agora tentar medir a fora
da associao entre duas variveis. Esta medida chamada de coefciente de
correlao e expressa numericamente a intensidade e a direo de uma corre-
lao linear. Normalmente os coefcientes de correlao variam de menos um
(-1) at mais um (+1).
95
Unidade 7 - Correlao
Dentro desses limites de variao podemos afrmar que:
Coefciente de correlao = -1,00 correlao negativa perfeita
Coefciente de correlao = 0,00 no existe correlao
Coefciente de correlao = +1,00 correlao positiva perfeita
A partir dos intervalos menores estabelecidos anteriormente podemos dizer que
Coefciente de correlao = - 0,60 correlao negativa forte
Coefciente de correlao = - 0,30 correlao negativa moderada
Coefciente de correlao = + 0,60 correlao positiva forte
Coefciente de correlao = + 0,30 correlao positiva moderada
Esses limites so um pouco subjetivos, e no caso deste mdulo foram retira-
dos de Levin e Fox (2004). O importante perceber que quanto mais prximo
de um (positivo ou negativo) mais forte associao (direta ou inversamente
proporcional); e quanto mais perto de zero, menor a intensidade da associao
entre as variveis.
Uma das medidas mais conhecidas para mensurar a fora da associao
entre duas variveis o coefciente de correlao de Pearson (r). O coefciente
de Pearson calculado a partir dos produtos dos desvios de X e Y a partir de
suas respectivas mdias. A frmula do Coefciente de correlao de Pearson (r)
apresentada abaixo:
( )( )
( ) ( )
=
2
2
2
2
Y Y n X X n
Y X XY n
r
Onde:
N = nmero de pares ordenados
e
X e Y formam o conjunto de variveis independentes e dependentes.
96
Curso de Ps-Graduao em Controle da Gesto Pblica
Para calcular o coefciente de correlao, vamos seguir os passos abaixo:
I Obter a soma dos valores X
X
II Obter a soma dos valores Y
Y
III
Multiplicar cada valor X por
cada valor Y e calcular o soma-
trio X multiplicado por Y
Y X
IV
Elevar ao quadrado cada valor
de X e obter seu somatrio
2
X
V
Elevar ao quadrado cada valor
de Y e obter seu somatrio
2
Y
VI
Utilizar todos os valores cons-
trudos anteriormente e aplicar
na frmula do coefciente de
correlao
( )( )
( ) ( )
=
2
2
2
2
Y Y n X X n
Y X XY n
r
Vamos utilizar um exemplo para esclarecer todo o procedimento:
Considere a tabela de dados abaixo, onde a primeira coluna expressa o gas-
to com propaganda, e a segunda coluna, o resultado de vendas, sendo que
todos os valores esto expressos em reais. As trs colunas esquerda so adi-
cionadas a tabela para facilitar o procedimento de clculo a partir da frmula
que foi deduzida.
Tabela 7.1
X Y X * Y X2 Y2
3,36 270,00 907,20 11,29 72.900,00
2,24 220,80 494,59 5,02 48.752,64
2,80 264,00 739,20 7,84 69.696,00
2,52 231,60 583,63 6,35 53.638,56
2,38 212,40 505,51 5,66 45.113,76
3,64 288,00 1.048,32 13,25 82.944,00
1,96 216,00 423,36 3,84 46.656,00
2,24 220,80 494,59 5,02 48.752,64
2,80 223,20 624,96 7,84 49.818,24
3,08 258,00 794,64 9,49 66.564,00
x
27,02
y
2.404,80
x.y
6616,01
x2
75,60
y2
584.835,84
97
Unidade 7 - Correlao
Para calcular o coefciente de correlao, vamos seguir os passos abaixo:
I Obter a soma dos valores X
X
II Obter a soma dos valores Y
Y
III
Multiplicar cada valor X por
cada valor Y e calcular o soma-
trio X multiplicado por Y
Y X
IV
Elevar ao quadrado cada valor
de X e obter seu somatrio
2
X
V
Elevar ao quadrado cada valor
de Y e obter seu somatrio
2
Y
VI
Utilizar todos os valores cons-
trudos anteriormente e aplicar
na frmula do coefciente de
correlao
( )( )
( ) ( )
=
2
2
2
2
Y Y n X X n
Y X XY n
r
Vamos utilizar um exemplo para esclarecer todo o procedimento:
Considere a tabela de dados abaixo, onde a primeira coluna expressa o gas-
to com propaganda, e a segunda coluna, o resultado de vendas, sendo que
todos os valores esto expressos em reais. As trs colunas esquerda so adi-
cionadas a tabela para facilitar o procedimento de clculo a partir da frmula
que foi deduzida.
Tabela 7.1
X Y X * Y X2 Y2
3,36 270,00 907,20 11,29 72.900,00
2,24 220,80 494,59 5,02 48.752,64
2,80 264,00 739,20 7,84 69.696,00
2,52 231,60 583,63 6,35 53.638,56
2,38 212,40 505,51 5,66 45.113,76
3,64 288,00 1.048,32 13,25 82.944,00
1,96 216,00 423,36 3,84 46.656,00
2,24 220,80 494,59 5,02 48.752,64
2,80 223,20 624,96 7,84 49.818,24
3,08 258,00 794,64 9,49 66.564,00
x
27,02
y
2.404,80
x.y
6616,01
x2
75,60
y2
584.835,84
Aplicando os valores encontrados na frmula:
( )( )
( ) ( )
=
2
2
2
2
Y Y n X X n
Y X XY n
r
Onde:
n = 10 e
x = 27,02
y = 2.404,80
x.y = 6616,01
x
2
= 75,60
y
2
= 584.835,84
Assim temos:
( ) ( )
( ) ( )
2 2
80 , 2404 84 , 584835 10 02 , 27 60 , 75 10
80 , 2404 02 , 27 01 , 6616 10
= r
909 , 0 = r
O que indica uma correlao positiva forte: r maior que zero e prximo de um
Existem alguns requisitos que devem ser atendidos para que o coefciente
de Pearson seja aplicado corretamente:
a relao entre as variveis deve ser linear;
as variveis devem ser medidas no nvel intervalar;
a amostragem deve ser aleatria;
a distribuio dos dados, variveis X e Y, deve obedecer curva
normal.
98
Curso de Ps-Graduao em Controle da Gesto Pblica
Por ltimo devemos fcar atentos ao fato de que se duas variveis esto for-
temente correlacionadas, no signifca necessariamente que exista uma rela-
o de causa e efeito entre elas. Para determinar causalidade entre as variveis,
geralmente necessrio um estudo mais aprofundado.
Chegamos ao fm da Unidade 7. Para fxar os conceitos aqui elencados,
faa a avaliao a seguir. Caso tenha dvidas sobre o contedo estudado,
procure esclarec-las antes de seguir em frente. Este contedo bsico
para os posteriores.
Atividades de Aprendizagem 1
A tabela abaixo relaciona o nmero de horas estudadas antes de uma
avaliao e o resultado obtido na prova. Voc est interessado em ve-
rifcar se existe uma associao entre estas duas variveis. Para isso, a
partir da tabela, determine o coefciente de correlao de Pearson (r) ou
o ndice de correlao entre as variveis abaixo:
(utilize a frmula a partir da montagem da tabela dos somatrios que foi
abordada no exemplo do mdulo)
NMERo DE HoRAS DE ESTUDo NoTA DA AVAlIAo
7,00 8,00
6,00 6,00
8,00 8,00
9,00 9,00
4,00 5,00
3,00 4,00
5,00 7,00
6,00 5,00
7,00 8,00
4,00 5,00
Procure uma srie de dados pareados do seu interesse e calcule o coefciente
de correlao de Pearson (r). Utilize uma srie com n maior que 15.
99
Unidade 7 - Correlao
Saiba mais
http://pt.wikipedia.org/wiki/Coefciente_de_Correla%C3%A7%C3%A3o_Line-
ar_de_Pearson
REsUMO DA UNiDADE
Nesta unidade aprendemos as diferenas entre variveis independentes e
dependentes e exploramos uma importante medida de associao entre
variveis, o coefciente de correlao. Notamos que a associao entre va-
riveis pode ser mensurada variando de um (correlao perfeita positiva)
e menos um (correlao perfeita negativa). Para utilizar adequadamente o
coefciente de correlao de Pearson, alguns aspectos devem ser considera-
dos: a relao entre as variveis deve ser linear, as variveis devem ser medi-
das no nvel intervalar, a amostragem deve ser aleatria e a distribuio dos
dados, variveis X e Y, deve obedecer curva normal.
8
Nesta unidade voc conseguir determi-
nar a equao da reta de regresso e
entender as aplicaes da Regresso
Linear
Unidade 8
Regresso
8
Nesta unidade voc conseguir determi-
nar a equao da reta de regresso e
entender as aplicaes da Regresso
Linear
Unidade 8
Regresso
102
Curso de Ps-Graduao em Controle da Gesto Pblica
Uma anlise de regresso nos fornece uma funo matemtica que procura
descrever a relao entre duas ou mais variveis. A equao resultante da an-
lise de regresso pode ser utilizada para predizer ou estimar valores futuros
(BRUNI, 2007).
Devemos lembrar que ao estudarmos as medidas de associao entre as variveis
utilizvamos um diagrama conhecido como grfco de disperso.
Estes grfcos podiam obedecer a determinadas formas, sendo que a me-
dida estudada foi o coefciente de correlao de Pearson (r), que media a
intensidade de uma associao linear.
Na anlise de regresso procuramos no mais estabelecer a fora da asso-
ciao entre as variveis, mas sim a natureza desta relao.
Na regresso procura-se determinar a equao matemtica que permita
predizer o valor de uma varivel dependente Y, dado um valor para a vari-
vel independente X.
No caso da regresso linear, objeto deste curso, o que se procura a equa-
o matemtica da reta que representa o melhor relacionamento numrico
linear entre o conjunto de pares de dados (BRUNI, 2007).
Normalmente encontraremos uma expresso do tipo:
Y = a + b . X
Onde:
X = varivel independente
Y = varivel dependente
a = coefciente de inclinao da reta
b = intercepto no eixo vertical, valor o cruzamento da reta no eixo Y
A reta de regresso tambm conhecida como reta de ajuste timo e deter-
minada por uma reta ideal em que a soma dos quadrados do desvio mnima.
103
Unidade 8 - Regresso
y
x
y
i
x
i
y
i
^
d = y - y
i i i
^
y
i
^
y = a + bx
^
Atravs do mtodo conhecido como mtodo dos mnimos quadrados po-
demos encontrar os valores de a e b. Este mtodo permite ajustar uma linha
reta a um grupo de dados de duas variveis quantitativas.
O mtodo foi desenvolvido no incio do sculo XIX, sendo que foi o mate-
mtico francs Legendre que chegou s frmulas matemticas para clculo de
a (coefciente de inclinao da reta) e b (intercepto), abaixo, que minimizam os
desvios dos pontos em relao reta (BRUNI, 2007).
n
X b Y
a
=
( ) ( )
( ) ( )
2
2
.
=
X X n
Y X XY n
b
Vamos adotar o mesmo exemplo que foi utilizado para clculo do coef-
ciente de correlao para demonstrar a utilizao da frmula. Para isso utili-
zamos a mesma tabela:
104
Curso de Ps-Graduao em Controle da Gesto Pblica
X Y X * Y X2 Y2
3,36 270,00 907,20 11,29 72.900,00
2,24 220,80 494,59 5,02 48.752,64
2,80 264,00 739,20 7,84 69.696,00
2,52 231,60 583,63 6,35 53.638,56
2,38 212,40 505,51 5,66 45.113,76
3,64 288,00 1.048,32 13,25 82.944,00
1,96 216,00 423,36 3,84 46.656,00
2,24 220,80 494,59 5,02 48.752,64
2,80 223,20 624,96 7,84 49.818,24
3,08 258,00 794,64 9,49 66.564,00
x
27,02
y
2.404,80
x.y
6616,01
x2
75,60
y2
584.835,84
Calculando b (coefciente angular da reta), temos:
( ) ( )
( ) ( )
2
2
.
=
X X n
Y X XY n
b
Onde:
n = 10 e
x = 27,02
y = 2.404,80
x.y = 6616,01
x
2
= 75,60
y
2
= 584.835,84
( ) ( )
( ) ( )
2
02 , 27 60 , 75 10
80 , 2404 02 , 27 06 , 6616 10
= b
6 , 45 = b
A partir de b podemos calcular a:
105
Unidade 8 - Regresso
n
X b Y
a
=
10
02 , 27 6 , 45 80 , 2404
= a
2 , 117 = a
Estes so os coefcientes que permitem o melhor ajuste da reta aos pontos
observados pelo mtodo estabelecido. A equao resultante :
x y . 6 , 45 2 , 117 + =
De mesma maneira que para o coefciente de correlao, temos alguns ele-
mentos que devem ser considerados ao proceder uma anlise de regresso linear:
deve existir para cada valor de X um valor de Y;
ambas as variveis devem ser medidas no nvel intervalar;
deve existir um relacionamento linear entre as variveis;
para empregar testes como o de signifcncia, os elementos que
compem a amostra devem ser aleatrios;
supe-se tambm uma distribuio normal para as duas variveis
ou dispor de um conjunto de dados bastante grande.
Chegamos ao fm da Unidade 8. Para fxar os conceitos aqui elencados,
faa a avaliao a seguir. Caso tenha dvidas sobre o contedo estudado,
procure esclarec-las antes de seguir em frente. Este contedo bsico
para os posteriores.
106
Curso de Ps-Graduao em Controle da Gesto Pblica
Atividades de Aprendizagem 1
Elabore um diagrama de disperso dos dados e tente construir sobre o
diagrama a reta que voc encontrou.
Lembre-se
Equao de Reta Y = a + b . X
Novamente utilize os dados em que voc calculou o coefciente de cor-
relao e tente encontrar os coefcientes que permitam o melhor ajuste
aos pontos.
Elabore um diagrama de disperso dos dados e tente construir sobre o
diagrama a reta que voc encontrou.
Lembre-se
Equao de Reta Y = a + b . X
Saiba mais
Para aprender um pouco mais sobre anlise de regresso, consulte os seguin-
tes sites:
http://pt.wikipedia.org/wiki/Regress%C3%A3o_linear
Alm disso, neste momento voc j deve estar apto a aprofun-
dar seus conhecimentos em mtodos quantitativos. Para isso, a lis-
ta de sites abaixo fornece informaes relacionadas a fontes de da-
dos e ferramentas estatsticas que voc pode usar no seu dia-a-dia:
http://www.math.uah.edu/stat/
http://www.itl.nist.gov/div898/handbook/
http://www.statsoft.com/textbook/stathome.html
http://www.r-project.org/
http://www.uis.unesco.org/ev.php?ID=2867_201&ID2=DO_TOPIC
http://lib.stat.cmu.edu/
107
Unidade 8 - Regresso
CONsiDERAEs FiNAis
Ao longo do curso voc se deparou com uma srie de ferramentas da Es-
tatstica que podem auxiliar uma pessoa a descrever melhor uma determina-
da realidade e, desse modo, tomar decises mais seguras dentro do contexto
de turbulncia em que vivemos. O ambiente profssional em que cada pessoa
atua fator condicionante das perspectivas de utilizao dos modelos que a
Estatstica apresenta; entretanto, independentemente deste contexto, fcil
perceber que seu campo de aplicao vastssimo, desde projetar receitas ou
custos, at orientar na elaborao de um oramento. O ferramental utilizado
pode ser bastante til para voc. A partir de agora tente utilizar os conheci-
mentos do Curso no seu dia-a-dia e boa sorte!
Refita sobre o vdeo Desperte para a Motivao:
http://www.youtube.com/watch?v=U7fSA-RNQaM&feature=related
REFERNCiAs
ANDERSON, D.R; SWEENEY, D.J.; WILLIAMS, T. A. Estatstica aplicada a
administrao e a economia. So Paulo: Pioneira Tomson Learning, 2005.
BARBETTA, P.A. Estatstica aplicada s cincias sociais. 6 ed. Florianpo-
lis: Ed. da UFSC, 2006.
BISQUERRA, R.; SARRIERA, J.C.; MARTINEZ, F. Introduo estatstica:
enfoque informtico com o pacote estatstico SPSS. Porto Alegre : Artmed,
2004.
BRUNI, A.L. Estatstica aplicada gesto empresarial. So Paulo: Atlas,
2007.
LAPPONI, J. C. Estatstica usando o Excel. Rio de Janeiro: Elsevier, 2005.
LARSON, R.; FARBER, B. Estatstica aplicada. So Paulo: Prentice Hall,
2004.
LEVIN, J.; FOX, J. A. Estatstica para cincias humanas. 9. ed. So Paulo:
Prentice Hall, 2004.
108
Curso de Ps-Graduao em Controle da Gesto Pblica
MAROCO, J. Anlise estatstica: com utilizao do SPSS. 2. ed. Lisboa: Abril,
2003.
MARTINS, G. de A. Estatstica geral e aplicada. 3. ed. So Paulo: Atlas,
2006.
NEUFELD, J. L. Estatstica aplicada administrao usando o Excel. So
Paulo: Prentice Hall, 2003.
RICHARDSON, R. J. Pesquisa social: mtodos e tcnicas. So Paulo: Atlas,
1999.
SMAILES, J.; MACGRANE, A. Estatstica aplicada administrao com
Excel. So Paulo: Atlas, 2002.