Vous êtes sur la page 1sur 154

MTODOS

QUANTITATIVOS EM
GESTO




Prof. Alceu Jobim
18/02/2013

1

Sumrio
Introduo ..................................................................................................................................... 7
Probabilidade ................................................................................................................................ 7
Experimentos, Resultados e Conjuntos ..................................................................................... 8
Abordagens Probabilidade ................................................................................................... 10
1) Abordagem Clssica .................................................................................................... 10
2) Abordagem da Frequncia Relativa ............................................................................ 13
3) Abordagem Subjetiva .................................................................................................. 14
Relacionamentos entre Eventos ................................................................................................. 15
Intercesses, Unies e Diagramas de Venn ............................................................................. 17
Regras da Probabilidade ......................................................................................................... 19
rvores de Probabilidade ....................................................................................................... 23
Tcnicas de Contagem ............................................................................................................. 25
Distribuies de Probabilidades .................................................................................................. 32
Distribuies Discretas e Contnuas de Probabilidades ........................................................... 34
Variveis Aleatrias ..................................................................................................................... 34
O Valor Esperado de uma Varivel Aleatria .............................................................................. 36
Tipos de Distribuies de Probabilidade ..................................................................................... 37
Distribuio Binomial .............................................................................................................. 38
Distribuio de Poisson ........................................................................................................... 42
Distribuio Exponencial ........................................................................................................ 44
Distribuio Normal................................................................................................................ 50
CAPTULO 2 ................................................................................................................................ 59
PREVISES ............................................................................................................................... 59
Relaes Funcionais entre Variveis ...................................................................................... 59
Relaes entre vrias variveis .......................................................................................... 98
CAPTULO 3 .............................................................................................................................. 126
SIMULAES.......................................................................................................................... 126
- SIMULAO COM O COMANDO ATINGIR META DO EXCEL ................................ 126
SIMULAO COM A FERRAMENTA SOLVER DO EXCEL .................................................. 127
SIMULAO COM O COMANDO TABELA DE DADOS DO EXCEL ..................................... 127
CAPTULO 4 .............................................................................................................................. 127
SRIES TEMPORAIS ................................................................................................................ 127
Mtodos de Previso atravs de Modelos com Nenhuma Tendncia ou Sazonalidade ... 135
2

Mdias Mveis .................................................................................................................. 135
Amortecimento (Suavizao) Exponencial ........................................................................ 137
Mtodos de Previso para Modelos com Tendncia e Nenhuma Sazonalidade .................. 139
Mdia Mvel Dupla (MMD) .............................................................................................. 140
Modelo de Previso por Alisamento Exponencial Duplo de Holt ...................................... 141
Mtodos de Previso para Sries Temporais Sujeitas a Fenmenos Sazonais e Nenhuma
Tendncia .............................................................................................................................. 143
Modelo de Previso com Sazonalidade Multiplicativa ...................................................... 145
Modelo de Previso com Sazonalidade Aditiva ................................................................. 146
Mtodo de Previso com Suavizao Exponencial de Holt-Winters ........................................ 147
Modelo Sazonal Multiplicativo de Holt-Winters ....................................................................... 148
Modelo Sazonal Aditivo de Holt-Winters .................................................................................. 151
Concluso .................................................................................................................................. 152
BIBLIOGRAFIA ............................................................................................................................ 153
















3

APRESENTAO

O presente texto foi desenvolvido para a disciplina Mtodos Quantitativos
do curso de mestrado em Gesto Financeira e Hospitalar da Faculdade de
Economia da Universidade Agostinho Neto. A gesto empresarial, em suas
vrias reas, tem-se beneficiado grandemente dos avanos de outras
reas do conhecimento voltadas para a abordagem quantitativa de
problemas organizacionais, financeiros e econmicos, tais como a
Econometria, a Estatstica, a Econometria de Sries Temporais, a Pesquisa
Operacional, etc. Assim, no se concebe hoje que um gestor (ou futuro
gestor) no domine algumas tcnicas essenciais de tomada de deciso
com o uso de modelagem quantitativa.
O curso aqui desenvolvido eminentemente prtico, evitando-se
demonstraes tediosas e utilizando-se do instrumental informtico
disposio de qualquer gestor, tal como a planilha Excel.
Embora o contedo constante deste texto seja relativamente extenso,
vrios outros assuntos importantes foram deixados de lado devido
limitao da carga horria da disciplina. Entretanto, esperamos que o que
foi apresentado motive os alunos a se aprofundarem neste campo
bastante frtil da soluo de problemas empresarias com o uso de
mtodos lgicos.

Alceu Jobim
Luanda, 2013






4

INTRODUO
Gestores tomam decises. para isso que so treinados. por isso que
so contratados, e para isso que so remunerados. Algumas dessas
decises so tomadas com base na intuio ou sentimento. Decidir
aumentar o preo do seu produto numa negociao com um cliente o
resultado mais provvel de uma anlise intuitiva do comportamento deste
do que o de uma anlise detalhada a partir de uma quantidade
considervel de dados. Por outro lado, decidir qual combinao de
mquinas, trabalho e empregados disponveis que geram uma produo
total de menor custo uma deciso que exige algumas das tcnicas
quantitativas que sero introduzidas neste curso.
Gestores de sucesso usam abordagens quantitativas para tomar decises
quando:
1. O problema complexo.
2. O problema envolve muitas variveis.
3. Existem dados que descrevem o ambiente de deciso;
4. Existem dados que descrevem o valor ou utilidade das diversas
alternativas possveis.
5. As metas do decisor ou de sua organizao podem ser descritas em
termos quantitativos.
6. Modelos quantitativos esto disponveis para determinadas
situaes.
O DESENVOLVIMENTO DA ABORDAGEM QUANTITATIVA GESTO
EMPRESARIAL
A Engenharia Industrial nasceu quando o mtodo cientfico foi aplicado a
problemas de gesto, mas a data exata em que isto aconteceu no certa.
Exemplos individuais nos quais a essncia do mtodo cientfico aplicado
aparece em escritos de milhares de anos atrs. O sogro de Moiss, Jetro,
escreveu sobre princpios organizacionais no Captulo 18 do Livro do
xodo. Os antigos navios de Veneza eram recondicionados e recarregados
usando-se linhas de produo bastante engenhosas. Cada navio era
movido ao longo da linha de produo e um grupo de trabalhadores
5

especializados desempenhava operaes especficas em cada estgio da
linha. Muito mais tarde, em 1832, Charles Babbage escreveu On the
Economy of Machinery and Manufacturers, mostrando muitas das
aplicaes da engenharia industrial.
Em fins do sculo 19, Frederick Winslow Taylor converteu a engenharia
industrial numa profisso. Ele pode, justificadamente, ser considerado o
pai da Administrao Cientfica. O seu estudo de tempos e movimentos
um excelente exemplo da aplicao do mtodo cientfico a problemas
administrativos, nomeadamente da produtividade dos homens em linhas
de produo e de outros materiais.
A mudana de interesse para alm de problemas especficos de produo
em direo a uma abordagem mais ampla de aplicao de mtodos
cientficos a problemas de gesto , na verdade, uma transferncia de
nfase da engenharia industrial Cincia da Administrao (CA)/Pesquisa
Operacional (PO), uma abordagem multidisciplinar problemas
complexos. Pode ser dito que a CA/PO emergiu como um campo separado
quando (1) os engenheiros industriais tornaram-se interessados nas
operaes gerais de uma empresa e (2) cientistas das cincias fsicas e
sociais interessaram-se por problemas gerenciais.
Cientistas e engenheiros estiveram envolvidos com atividades militares
por pelo menos tanto tempo quanto a Histria registrada. Um dos
exemplos mais conhecidos na histria antiga ocorreu em 212 A.C., quando
a cidade de Siracusa empregou Arquimedes (ento com 75 anos) para
elaborar meios de quebrar o cerco naval da cidade, que estava sob ataque
dos romanos.
Entretanto, foi ao longo da 2
a
Guerra Mundial que os mtodos
quantitativos foram largamente empregados no desenvolvimento de
novos mtodos de gesto da guerra. Alguns desses desenvolvimentos
foram:
1. No aperfeioamento de sistemas de radar.
2. Em armamentos antiartilharia.
3. Em ataques submarinos.
4. Em defesa civil.
6

5. Na especificao de tamanhos timos de comboios para transporte
de armamentos e alimentos.
6. Na conduo de ataques de bombas na Alemanha nazista.
Com o fim da guerra, os mtodos desenvolvidos passaram tambm a ser
utilizados em operaes empresariais e pblicas. Por exemplo, em 1947
George Dantzig desenvolveu o mtodo simplex ao problema da
programao linear anteriormente formulado por Vassily Leontieff. Desde
essa poca, essa soluo tornou-se a abordagem padro a uma variedade
enorme de problemas em empresas. Em 1958 o U.S. Navys Special
Project Office desenvolveu o mtodo das Redes (Networks). Poucos anos
mais tarde, o Secretrio de Defesa Robert McNamara liderou a utilizao
das Redes na Administrao Kennedy.
Em Finanas, os mtodos quantitativos so largamente empregados em
reas como:
1. Na construo de modelos de administrao de caixa.
2. Alocao de capital entre vrias alternativas de investimento.
3. Gesto de portfolio.
4. Previso de longo prazo para necessidades de capital.
5. Modelos de Planejamento Financeiro.
6. Determinao de tempo timo para reposio de equipamentos.
7. Deciso de polticas mais efetivas de distribuio de dividendos.

Muito do material que se segue exige um conhecimento prtico da Teoria
das Probabilidades. Por isso, desenvolvemos no prximo captulo
conceitos teis de probabilidade.





7

CAPTULO 1
TEORIA DAS PROBABILIDADES
(Reviso)
Introduo

Na nossa vida pessoal e profissional, mais frequentemente do que no,
temos de tomar decises em condies de incerteza e com conhecimento
incompleto de todos os fatores envolvidos e das consequncias da nossa
deciso. Por exemplo, investidores devem decidir-se por um dado
investimento baseado nas expectativas de retornos futuros; gerentes de
estoques devem decidir que nvel de estoques manter sem conhecer com
certeza o nvel futuro de vendas; decises sobre o nvel futuro de liquidez
(quantidade de moeda em circulao) a ser mantido no sistema
econmico so tomadas pelos bancos centrais baseadas em dados
amostrais do nvel atual de atividade econmica; decises sobre com
quem casar so baseadas na esperana de que o(a) parceiro(a) escolhido(a)
seja a pessoa ideal dentre vrias outras possveis.
Dessa forma, qualquer esforo no sentido de reduzir a incerteza no
processo de tomada de decises certamente ajudar a diminuir muito a
possibilidade de erro envolvida. o propsito desta parte de nosso estudo
ilustrar as formas pelas quais a possibilidade ou probabilidade de
ocorrncia de eventos incertos possa ser medida. Melhorando a nossa
capacidade de julgar a ocorrncia de eventos futuros, podemos minimizar
o risco e o perigo envolvidos no processo decisrio.
Probabilidade

Probabilidade a possibilidade numrica da ocorrncia (ou no ocorrncia)
de um evento incerto.

8

O desenvolvimento de uma teoria matemtica da probabilidade comeou
durante o sculo 17 quando o nobre francs Antoine Gombauld
(conhecido como Chevalier de Mr) levantou certas questes sobre jogos
de azar. Especificamente, ele estava intrigado sobre as possibilidades de
obter dois 6 pelo menos uma vez em 24 jogadas de um par de dados. de
Mr colocou a questo a um jovem matemtico francs, Blaise Pascal,
que a resolveu. Subsequentemente, Pascal discutiu esta e outras questes
da mesma natureza levantadas por de Mr com outro famoso
matemtico francs, Pierre de Fermat. No decurso de suas
correspondncias, a teoria matemtica da probabilidade nasceu.
A probabilidade de um evento medida por valores entre 0 e 1 (ou 100%).
Quanto maior a probabilidade de ocorrncia de um evento, mais prximo
de 1 (ou 100%) estar o valor de sua probabilidade. Assim, a probabilidade
de um evento certo 1, e a probabilidade de um evento impossvel 0.
Isto pode ser escrito da seguinte forma:
P (evento certo) = 1
P (evento impossvel) = 0

Dessa forma, a primeira propriedade da teoria das probabilidades afirma
que a probabilidade de ocorrncia de certo evento E
i
um nmero entre 0
e 1, ou seja, 0 s P (E
i
) s 1.
Experimentos, Resultados e Conjuntos

O processo que produz um evento chamado experimento. Um
experimento uma ao bem definida que leva a um nico resultado bem
definido. Rolar um dado um experimento bem definido. O resultado
tambm bem definido, um nmero de 1 a 6. Um experimento tambm
examinar um produto para determinar se ele atende a certas
especificaes de manufatura. O resultado : ou (1) ele apresenta defeito
ou (2) no apresenta defeito.

9

Um conjunto uma coleo qualquer de objetos, seres ou coisas. Os
alunos de um colgio so um conjunto. Os sete dias da semana so um
conjunto, assim como as molculas de ar num pneu Goodyear. Os objetos,
seres ou coisas de um conjunto so os seus membros ou elementos.
Existem 18 elementos no conjunto das provncias de Angola, e existem
infinitos elementos no conjunto de todos os nmeros inteiros positivos.
O conjunto de todos os resultados possveis de um experimento
chamado de espao amostral. O espao amostral do experimento rolar um
dado :
S = {1, 2, 3, 4, 5, 6}

O espao amostral do experimento atirar uma moeda no ar :

S = {Cara (Ca); Coroa (Co)}

No caso do experimento atirar uma moeda no ar, certo que ou sai Cara
ou sai Coroa. Dado que a probabilidade de um evento certo igual a 1,
ento a probabilidade de Cara ou Coroa igual a 1. Isto :

P (Ca ou Co) = 1

Da mesma forma, no experimento rolar um dado, um dos seis nmeros
ocorrer. No h outras possibilidades. Logo:

P (1 ou 2 ou...ou 6) = 1

10

Assim, a segunda propriedade das probabilidades afirma que se E
i
um
evento representativo de certo elemento de um espao amostral, ento:
P (E
i
) = 1.
Abordagens Probabilidade

Historicamente, trs abordagens foram desenvolvidas para quantificar a
ocorrncia de eventos incertos: a abordagem clssica (ou a priori); a da
frequncia relativa (ou a posteriori) e a abordagem subjetiva.

1) Abordagem Clssica

Por esta abordagem, a probabilidade de ocorrncia de certo evento
E definida como:

Nmero de maneiras em que o evento pode ocorrer
P (E) =
Nmero total de resultados possveis


Esta abordagem chamada clssica dado que foi a primeira a ser
desenvolvida e est diretamente ligada aos jogos em que a sorte (ou
o azar) desempenha papel preponderante, objeto inicial do
desenvolvimento da teoria das probabilidades, como visto acima.
tambm chamada de a priori dado que no h necessidade de
coleta de dados experimentais para a determinao do valor da
probabilidade de certo evento. Este valor inteiramente baseado
em pura lgica, uma vez conhecidos todos os resultados possveis
de certo experimento e o nmero de maneiras que certo evento
nesse experimento pode ocorrer.
11

Assim, por exemplo, qual a probabilidade de ocorrer Cara no
lanamento de uma moeda?
Se esta moeda for honesta (ou justa), ento os dois lados so
igualmente provveis de ocorrerem. Como a moeda tem dois lados,
ento o nmero total de resultados possveis igual a 2 (Cara e
Coroa). Como o lanamento feito uma nica vez, ento Cara s
pode ocorrer uma nica vez. Logo, utilizando a frmula acima:

P (E = sair cara num nico lanamento de uma moeda) =



Da mesma forma, qual a probabilidade de sair um 3 num nico
lanamento de um dado honesto?

O nmero total de resultados possveis de um dado 6. Num nico
lanamento, 3 s pode ocorrer uma vez, logo:
( )



necessrio que o significado dos resultados acima obtidos estejam
bem claros: embora a probabilidade de sair um 3 seja 1/6, isto no
significa que para cada seis jogadas de um dado, em uma delas saia
sempre um 3. Este 1/6 , na verdade, um valor mdio de longo
prazo, significando com isto que se um dado jogado um nmero
muito grande de vezes (digamos 10.000 ou 100.000), em um-sexto
dessas vezes aparece um 3.

12

Qual a probabilidade de se tirar um s num baralho honesto de 52
cartas?
Neste caso, o nmero total de resultados possveis 52. Como um
baralho tem 4 ases, a probabilidade de sair um s numa nica
retirada :

4
P (E =um s) = =0,0769 ou 7,69%
52

Um exerccio interessante
Craps um jogo de azar jogado com 2 dados. A regra de pelo menos
uma das verses do jogo (existem muitas variantes) diz que voc
ganha na primeira jogada se voc rolar craps, isto , tirar um 7 ou
um 11 na soma dos dois dados. Se voc tirar qualquer outro nmero,
voc tem que tirar este mesmo nmero outra vez (o qual
chamado de sua marca ou ponto) antes de rolar um 7 ou um 11. Se
voc rolar um 7 ou um 11 antes de rolar a sua marca, voc perde.
Dado isto, responda:
a. Qual a probabilidade de ganhar o jogo na primeira rodada?
b. Se voc tirar um 6, mais provvel ganhar ou perder o jogo?

O espao amostral de todos os resultados possveis a soma dos
dois dados, tal como mostrado abaixo:

Resultados do dado 1

1 2 3 4 5 6
Resultados do 1 2 3 4 5 6 7
dado 2 2 3 4 5 6 7 8
3 4 5 6 7 8 9
4 5 6 7 8 9 10
5 6 7 8 9 10 11
6 7 8 9 10 11 12

13

a. Existem 36 resultados possveis. Somente 8 desses resultados
somam 7 ou 11, no que resulta em ganho. Logo:

P (de vencer na primeira rodada) = 8/36 = 0,2222 = 22,22%

b. Se rolar um 6, a probabilidade de repeti-lo :

P (6) = 5/36 = 0,1389 = 13,89%

mais provvel perder o jogo.

Embora a concepo clssica da probabilidade seja til para resolver
problemas que envolvem jogos de azar, srias dificuldades
aparecem quando tentamos utiliz-la para resolver outros tipos de
problemas, tais como: (a) qual a probabilidade de que um homem,
de certa nacionalidade, de determinada cor, com dada idade,
morrer no prximo ano?; (b) qual a probabilidade de que um
consumidor, com certas caractersticas de consumo, vivendo em
certa rea metropolitana, comprar o produto de dada empresa no
ms que vem?; (c) qual a probabilidade de que o processo de
produo utilizado por certa empresa produzir um produto
defeituoso no prximo lote de produo?
Em nenhum desses casos factvel estabelecer um espao amostral
de todos os resultados possveis, cada um deles igualmente
provveis de ocorrer. Na verdade, para estimarmos este tipo de
probabilidade, necessitamos de dados histricos de ocorrncia.
2) Abordagem da Frequncia Relativa

Esta abordagem usa dados histricos empiricamente observados.
Observa-se a frequncia de ocorrncia passada do evento e estima-
se a probabilidade de sua ocorrncia com base nesses dados
histricos. Assim, a probabilidade de um evento baseada na sua
frequncia relativa determinada pela seguinte expresso:

14

Nmero de vezes em que o evento ocorreu no passado
P (E) =
Nmero total de observaes

Por exemplo, assuma que durante o ano passado nasceram 50
crianas em certo hospital, sendo que 32 dos recm-nascidos foram
meninas. A direo do hospital resolve estimar a probabilidade de
que o prximo nascimento (ou qualquer amostra de nascimentos
aleatoriamente selecionada) seja menina. Utilizando ento a
abordagem da frequncia relativa, temos:

32
P (E = menina) = = 0,64 = 64%
50

Podemos tambm utilizar a frequncia relativa para mostrar que a
probabilidade de sair cara no lanamento de uma moeda honesta
realmente tende para a probabilidade ou 0,50, conforme afirma a
abordagem clssica. Usando o Excel, realizamos a simulao do
lanamento de uma moeda 1500 vezes.
Um problema comum com a abordagem da frequncia relativa
que nem sempre dispomos de um nmero suficiente de
observaes para realizarmos estimativas de probabilidade de
eventos.
3) Abordagem Subjetiva

Em muitos casos, no dispomos de dados histricos suficientes nem
possvel estabelecer-se o espao amostral com todos os
resultados possveis de um experimento, e nem afirmar que estes
resultados sejam igualmente provveis. Ento, a nica alternativa
estimar probabilidades na base de nosso melhor julgamento. Esta
abordagem subjetiva requer a determinao de um valor de
probabilidade de certo evento na base da melhor evidncia possvel.
15

A abordagem subjetiva (ou ainda personalstica) uma concepo
relativamente recente. Sua aplicao a problemas estatsticos
ocorreu quase que inteiramente aps a Segunda Guerra Mundial.
Probabilidades subjetivas so determinadas na base de todas as
evidncias objetivas e subjetivas correntemente disponveis e
devem refletir o grau de crena corrente do tomador de decises.
Obviamente, pessoas diferentes chegaro a diferentes valores de
probabilidades para um mesmo evento devido a diferenas nas
percepes da realidade circundante, atitudes, valores, etc. Mais
ainda, estas probabilidades podem ser determinadas para eventos
que s ocorrero uma nica vez, em situaes onde nem a
abordagem clssica nem a da frequncia relativa so apropriadas.
Relacionamentos entre Eventos

Para compreender os princpios da probabilidade, precisamos tambm
compreender a maneira pela qual os eventos se relacionam entre si.
Dois eventos so ditos mutuamente exclusivos (ou excludentes) se a
ocorrncia de um deles implica na no ocorrncia do outro, ou seja, se um
ocorre, o outro no pode ocorrer. Se no lanamento de uma moeda uma
nica vez, sair Cara, ento no pode sair Coroa. Se no lanamento de um
dado, sai um 2, ento a ocorrncia dos outros 5 nmeros est eliminada.
Se na retirada de uma carta de um baralho com 52 cartas, sair um 10,
quaisquer uma das outras 51 cartas no podem sair. Entretanto, se o
evento for sair um 2 ou um nmero par no lanamento de um dado uma
nica vez, ento esses dois eventos no so mutuamente exclusivos, uma
vez que 2 um nmero par. Da mesma forma, se o evento for retirar um
10 ou uma carta de paus de um baralho de 52 cartas, estes tambm no
so eventos mutuamente exclusivos, dado que pode-se retirar um 10 de
paus num mesmo lance.
Eventos coletivamente exaustivos so aqueles que consistem de todos os
resultados possveis de um experimento. Os eventos coletivamente
exaustivos de rolar um dado so 1, 2, 3, 4, 5 e 6. Os eventos coletivamente
exaustivos de um experimento constituem-se no seu espao amostral.
16

A probabilidade combinada de eventos coletivamente exaustivos igual a
1, uma vez que certo que um desses eventos ocorrer. Assim, a
probabilidade de sair um 1, ou um 2, ou um 3, ou um 4, ou um 5, ou um 6,
no lanamento de um dado 1.

P (1 ou 2 ou 3 ou 4 ou 5) = 1

Dois eventos so ditos independentes quando a ocorrncia de um deles
no influncia a ocorrncia (ou a no ocorrncia) do outro. A ocorrncia
do evento tirar um cinco de um baralho com 52 cartas em nada afeta a
probabilidade de chover amanh. Logo, esses dois eventos so
independentes.
Agora, os resultados de tirar duas cartas de um mesmo baralho so
independentes? Depende de se a primeira carta recolocada ou no no
baralho antes da segunda carta sair. Seja o primeiro evento retirar uma
rainha e o segundo evento retirar um s.
Temos ento que a probabilidade do primeiro evento :

4
P (E = retirar uma rainha) = = 0,0769 = 7,69%
52

Se a carta retirada no for reposta no baralho antes da retirada da
segunda carta, ento a probabilidade do segundo evento :
4
P (E = retirar um s) = = 0,0784 = 7,84%
51

17

Ento podemos dizer que, quando fazemos retiradas em um conjunto
finito, como o caso de um baralho de cartas, dois eventos so
independentes se e somente se a retirada feita com reposio. Caso
contrrio, os dois eventos so dependentes.
Eventos complementares so eventos tais que se um evento no ocorre, o
outro necessariamente ocorre. Se o evento A saiu Coroa no lanamento
de um dado, ento o seu complementar ~A saiu Cara. Se o evento B
saiu um nmero par no lanamento de um dado (2, 4, 6), o evento
complementar ~B saiu um nmero mpar (1, 3, 5). Se voc no tira cara,
necessariamente tira coroa. Se no sai um nmero par no lanamento de
um dado, necessariamente sai um nmero mpar.
Obviamente, como j deve ter notado, eventos complementares so
tambm coletivamente exaustivos, dado que se A no ocorre, ento ~A
necessariamente ocorre. Assim:

P (A) + P (~A) = 1 P (A) = 1 P (~A)

Intercesses, Unies e Diagramas de Venn

Sejam dois conjuntos A e B, ambos com numerosos elementos. bem
possvel que alguns elementos de um dos conjuntos sejam tambm
elementos do outro. Estes elementos comuns a ambos os conjuntos A e B
so chamados intercesso de A e B e representados por A B.
Podemos representar a intercesso de A e B graficamente, utilizando os
chamados Diagramas de Venn, desenvolvidos por John Venn (1834-1923),
um matemtico ingls.



18






A B
A unio de A com B, representada por A B, o conjunto formado pelos
elementos que esto em A, em B, ou em ambos.






A B
Exemplo

Dado um baralho de 52 cartas, seja A o conjunto de todas as cartas ouro e
B o conjunto de todas as cartas rei. Identifique A B e A B.
Os dois conjuntos esto representados pelos dois diagramas de Venn





A
B
A
B
19






Rei de Ouro (A B)
A B consiste no conjunto de todas as cartas ouro (incluindo o rei) e de
todas as cartas rei (incluindo ouro).
A B contm somente aqueles elementos comuns a ambos os conjuntos.
Neste caso, A B composto de um nico elemento, o rei de ouro.
Regras da Probabilidade

A discusso anterior sobre intercesses e unies nos leva ao clculo das
probabilidades de eventos tais como P (A B) e P (A B). H duas regras
bsicas para o clculo de eventos combinados:
A Regra da Multiplicao utilizada para determinar a
probabilidade conjunta de A e B, isto , de A B;
A Regra da Adio utilizada para determinar a probabilidade
conjunta de A ou B, isto , de A B.

Regra da Multiplicao
1. Se A e B so eventos independentes, ento P (A B) = P (A) *
P (B). Isto , a probabilidade de A e B ocorrerem em conjunto o
produto de suas probabilidades individuais.
2. Se A e B so eventos dependentes, ento P (A B) = P (A) *
P (B/A). Isto , a probabilidade de A e B ocorrerem em conjunto
o produto da probabilidade de A pela probabilidade de B, dado
que o evento A j ocorreu.
Este pr-requisito dado que A j ocorreu baseado no princpio
da probabilidade condicional, que examinaremos adiante. A
notao B/A no significa diviso do evento B pelo evento A.
A
B
Ouros Reis
20

Significa que como os dois eventos no so independentes, a
ocorrncia do primeiro afeta a probabilidade de ocorrncia do
segundo, e que isto deve ser considerado quando do clculo da
probabilidade de ocorrncia conjunta.
Para entender o significado da probabilidade condicional, vejamos o
seguinte exemplo:
Uma carta retirada de um baralho. A probabilidade de ela ser um
valete :
P (Valete) = 4 / 52

Entretanto, se nos informassem de que a carta retirada era uma carta de
face (rei, dama, valete), ento teramos de rever essa probabilidade. A
pergunta agora : Qual a probabilidade da carta retirada ser um valete,
dado que (ou na condio de que) uma carta de face?.
Fazendo valete = V e carta de face = F, a pergunta acima pode ser
mostrada como P (V/F). Dado que h 12 cartas de face num baralho, 4 das
quais valetes, ento: P (V/F) = 4 / 12, que difere de P (Valete) = 4 / 52.
Em geral, a probabilidade condicional calculada como:
P (A e B) P (A B)
P (B/A) = =
P (A) P (A)

Se multiplicarmos ambos os termos da equao acima por P (A), obtemos
P (A B) = P (A) * P (B/A), a regra da multiplicao para eventos
dependentes apresentada anteriormente.
Voltando s duas regras da multiplicao, vejamos o seguinte:

21

Considere a probabilidade de tirar um rei (R) de um baralho com 52 cartas,
e sair um 5 no lanamento de um dado. Estes so, obviamente, eventos
independentes, uma vez que o que retirado do baralho no tem
nenhuma influncia sobre o nmero que sai no dado. Ento:
P (R 5) = P (R) * P (5) = 4/52 * 1/6 = 4/312 = 0,01282 = 1,282%
Duas cartas so retiradas de um baralho. A primeira um s (A); a
segunda, um rei (R). As retiradas so feitas sem reposio, o que significa
que a probabilidade da segunda retirada depende do que saiu na primeira
retirada. Ento:
P (A R) = P (A) * P (R/A)
= 4/52 * 4/51 = 0,603%
P (R/A) = 4/51 uma vez que, se um s foi retirado na primeira, 4 das 51
restantes so reis. Se o s fosse recolocado no baralho antes da segunda
retirada, ento os dois eventos seriam independentes.
Exerccio
Considere o seguinte caso. De 200 pessoas, 120 so homens e 80 so
mulheres. Dos 120 homens, 40 so acionistas de certa empresa, enquanto
das 80 mulheres, 20 so acionistas da mesma empresa. Assim, temos
120 homens, 40 dos quais acionistas.
80 mulheres, 20 das quais acionistas.
Determine a probabilidade de selecionar uma pessoa aleatoriamente que
seja um homem e que possua aes.
Resposta:
Fazendo H = homem, e A = ao, queremos P (H A).
Agora, os eventos so independentes ou dependentes? Claramente, so
dependentes, uma vez que a probabilidade do segundo evento (possuir
aes) afetada pela ocorrncia do primeiro evento (ser homem ou ser
mulher, j que as propores em que cada um possui aes so
22

diferentes). Logo: P (H A) = P (H) * P (A/H) = 120/200 * 40/120 =
40/200 = 0,20 ou 20%
Falaremos mais sobre probabilidades condicionais quando estudarmos o
Teorema de Bayes, adiante.

Regra da Adio

Esta regra usada quando queremos calcular a probabilidade de A ou B.
Se os dois eventos no so mutuamente exclusivos, ento o clculo a ser
utilizado o seguinte:

P (A B) = P (A) + P (B) P (A B)

Isto , somamos as duas probabilidades individuais de cada evento e
depois subtramos a probabilidade conjunta deles. Por qu? Porque os
dois eventos podem ocorrer juntos, logo quando somamos as
probabilidades individuais tambm estamos considerando a probabilidade
conjunta deles, e por isso, subtramos esta a fim de evitar dupla contagem.



(A B)

P (A) inclui P (A B)
P (B) inclui tambm P (A B)
Ento, subtramos P (A B) para evitar dupla contagem.

A
B
23

Entretanto, se os eventos so mutuamente exclusivos, ento sua
probabilidade conjunta zero. Por definio, eles no podem ocorrer
juntos e P (A B) = 0. Ento, a expresso a ser utilizada :


P (A B) = P (A) + P (B)
Exemplo
Encontre a probabilidade de tirar um s (A) ou uma carta de copas (C)
numa nica retirada de um baralho com 52 cartas.

Nosso objetivo encontrar P (A C). Existem 13 cartas de copas e 4 ases
num baralho com 52 cartas, sendo que um s de copas. Logo, os eventos
no so mutuamente exclusivos, e, portanto:

P (A C) = P (A) + P (C) P (A C)
= 4/52 + 13/52 1/52 = 16/52 = 30,77%

Agora, encontre a probabilidade de retirar uma carta de copas (C) ou uma
carta de espadas (E) numa nica retirada.
Claramente, esses eventos so mutuamente exclusivos; ento a expresso
a ser utilizada

P (E C) = P (E) + P (C) = 13/52 + 13/52 = 1/2 = 50%
rvores de Probabilidade

Quando necessrio encontrar probabilidades de vrios eventos
conjuntos, til construir uma rvore de probabilidades. Uma rvore de
24

probabilidades mostra todas as possibilidades associadas com todo um
conjunto de eventos especficos. Vejamos a seguinte ilustrao:

Todas as grandes empresas mantm departamentos de controle de
qualidade cuja principal funo assegurar que os seus produtos
atendam certas especificaes. responsabilidade dessas empresas
minimizar a produo de produtos defeituosos. Certa empresa tem uma
taxa de defeitos em seus produtos de 10%. Isto , 10% das unidades
produzidas no atendem s especificaes mnimas. Ento P (D) = 0,10
e P (~D) = 0,90. Duas peas so selecionadas aleatoriamente da linha de
produo.
a) Qual a probabilidade da primeira ser defeituosa e a segunda no?
b) Qual a probabilidade das duas serem defeituosas?


Primeira pea retirada Segunda pea retirada Resultado Final
D
1
(0,1) D
2
(0,1) D
1
* D
2
= 0,01
~D
2
(0,9) D
1
* ~D
2
= 0,09
~D
2
(0,9) D
2
(0,1) ~D
2
* D
2
= 0,09
~D
2
(0,9) ~D
2
* ~D
2
= 0,81

Com base na rvore acima:
a) D
1
* ~D
2
= 0,1*0,9 = 0,09 = 9%
b) D
1
* D
2
= 0,1*0,1 = 0,01 = 1%

25

Tcnicas de Contagem

As rvores de probabilidades so teis quando o espao amostral do
experimento relativamente pequeno, como foi o caso do exemplo acima.
Quando o nmero total de eventos possveis de determinado experimento
torna-se muito grande, a construo de rvores de probabilidades torna-
se um processo trabalhoso e pouco operacional, como por exemplo, no
seguinte experimento: lanamento de um dado trs vezes seguidas.
Cada lanamento de um dado tem seis resultados possveis;
Cada resultado dos seis resultados do segundo lanamento poder
ser combinado com os seis resultados do primeiro lanamento
totalizando trinta e seis possveis resultados;
Cada resultado dos seis resultados do terceiro lanamento poder
ser combinado com os trinta e seis resultados do segundo
lanamento totalizando duzentos e dezesseis possveis resultados.

Portanto, uma maneira mais racional de obter-se o nmero total de
resultados possveis (ou o espao amostral) de um experimento a fim de
calcularem-se probabilidades, se faz necessrio. O mtodo adequado so
as chamadas tcnicas de contagem.
Tcnica de Contagem 1 Arranjos
Sejam as duas sries ABC e ACB. Os elementos so os mesmos, apenas a
ordem em que aparecem que difere. Nos Arranjos, a ordem em que os
elementos aparecem importante. Dessa forma, no caso de Arranjos, ABC
e ACB so duas sries diferentes e, portanto, constituem diferentes
arrumaes de elementos. A pergunta agora : quantas arrumaes (ou
arranjos) podemos fazer com a srie ABC, considerando os trs elementos
dessa srie?
ABC BCA
ACB CAB
BAC CBA

26

Seis diferentes arranjos so obtidos simplesmente reordenando os
elementos. Podemos obter este total 6 utilizando o chamado princpio
multiplicativo: se a primeira de uma sequncia de arrumaes pode ser
feita de n
1
maneiras, a segunda de n
2
maneiras, e assim por diante para k
arrumaes, ento a sequncia de k arrumaes pode ser feita de
(n
1
)*(n
2
)*...*(n
k
) maneiras.
Se um dado jogado 3 vezes, existem 6 * 6 * 6 = 216 sequncias
diferentes.
Se uma moeda jogada e uma carta retirada aleatoriamente de um
baralho de 52 cartas, existem 2 x 52 = 104 sequncias possveis diferentes.
Aplicando o princpio multiplicativo ao nosso exemplo: qualquer uma das
3 letras pode ocupar a primeira posio, 2 das restantes pode ocupar a
segunda posio e somente uma pode ocupar a ltima posio, logo 3 * 2
*1 = 6. Assim, de um modo geral:
(n) * (n-1) *...* (2) *(1) = n!
onde n! lido como n fatorial.
Assim, quando queremos arrumar n objetos tomados n a n de uma vez,
sendo a ordem em que estes objetos aparecem importante, utilizamos a
expresso:
A
n, n
= n!
OBS: O Excel dispe da funo matemtica FATORIAL (n), sendo n um
nmero inteiro e no negativo.
Tcnica de Contagem 2 Permutaes
As permutaes so um caso particular dos arranjos. Nas permutaes, a
ordem em que os elementos n esto dispostos tambm importa, s que
agora os elementos so arranjados numa certa proporo r, com r = n. Por
exemplo, dispondo dos elementos ABC, quantas arrumaes 2 a 2
podemos fazer?
A frmula a ser utilizada (e aqui no demonstrada) a seguinte:
27

( )!
!
,
r n
n
P
r n

=


3!
Logo, P
3, 2
= = 6
(3 2)!

Note que quando r = n, P
n, r
= A
n, n
. Para verificar, resolva o exemplo das
letras ABC fazendo r = 3 utilizando a frmula das permutaes. Uma
observao: Por conveno, 0! = 1.
OBS: O Excel dispe da funo estatstica PERMUTAR (n, r).
Exerccios
a) Dadas as primeiras cinco letras do alfabeto, quantas arrumaes
desses elementos so possveis tomando-os 3 a 3?
Resp: 60
b) Num concurso, existem 10 concorrentes. Trs sero
selecionados. O primeiro lugar receber USD 10.000; o segundo,
USD 5.000, e o terceiro, USD 2.500. Quantas arrumaes so
possveis de primeiro-segundo-terceiro lugares com esses 10
concorrentes?
Resp: 720
c) A um consumidor perguntado sua preferncia sobre 5 tipos de
cervejas. Quantos diferentes rankings podem resultar?
Resp: 120
Tcnica de Contagem 3 Combinaes
No caso das Combinaes, a ordem em que os elementos esto dispostos
no importa. Isto quer dizer que, seguindo o nosso exemplo anterior, as
sries ABC e ACB so iguais, e ento apenas uma combinao gerada. No
caso das combinaes, em geral, o nmero de combinaes dos n
28

elementos tambm difere da proporo r em que eles so tomados, isto ,
n = r.
Ento, a pergunta agora : quantas combinaes so possveis com as
letras ABC tomadas 2 a 2?
A resposta pode ser obtida com a seguinte frmula (no demonstrada):
( )! !
!
,
r n r
n
C
r n

=


3!
Logo, C
3, 2
= = 3
2! (3 2)!

OBS: O Excel dispe da funo matemtica COMBINAR (n, r).
Exerccios
a) Quantos grupos de 5 estudantes podem ser formados de um
total de 7 estudantes na qual a ordem no importa?
Resp: 21
b) O presidente de certa empresa deve selecionar 4 de seus 6
diretores para formar um grupo de estudos sobre aquisies de
novos negcios. Quantas combinaes diferentes dos diretores o
presidente pode fazer?
Resp: 15
c) Suponha agora, relativamente ao exerccio b das permutaes,
que trs concorrentes sejam selecionados como vencedores, e a
cada um deles dado o mesmo prmio, sem distino de
primeiro-segundo-terceiro lugares. Quantas combinaes so
possveis?
Resp: 120

29

Tcnica de Contagem 4 Arranjos de Escolha Mltipla (AEM)
Nas tcnicas apresentadas anteriormente, a repetio (ou duplicao) de
elementos na srie no foi considerada. Por exemplo, no fizemos algo
como AABC ou AABBC.

Nos arranjos de escolha mltipla a ordem tambm faz diferena.
Distingue-se das permutaes pelo fato de que a duplicao considerada.
Nos AEM, o mesmo elemento pode ser usado mais de uma vez.
O nmero de AEM de n elementos tomados r a r :

M
n, r
= n
r


Para ilustrar, suponha que um pai deve escolher trs universidades de
uma lista de 5 universidades diferentes nas quais seus trs filhos iro
estudar. A ordem na qual essas universidades so escolhidas importante
porque ela determina qual estudante vai para qual universidade. Tambm,
dado que dois ou mais filhos podem ir para a mesma escola, a duplicao
permitida. Assim, o nmero de seleo das trs escolas de um total de
cinco :
M
5, 3
= 5
3
= 125

Existem 125 diferentes arranjos nos quais os trs filhos podem escolher
entre as 5 universidades.
30

OBS: O Excel dispe da funo matemtica POTNCIA (nm; potncia) que
pode ser utilizada para calcular AEM.
Exerccios
a) Um vendedor de carros tem trs tipos de automveis dos quais
dois clientes escolhero um. Quantas vendas diferentes o
vendedor pode fazer?
Resp: 9
b) Outro vendedor tem dois diferentes tipos de carros dos quais
trs clientes faro a seleo. Quantas vendas diferentes o
vendedor pode fazer?
Resp: 8
Teorema de Bayes
Quando a temporada do Campeonato de Futebol Nacional brasileiro abre,
os torcedores do campeo do ano anterior acham que seu time tem
grandes chances de ganhar o ttulo outra vez. Mas na medida em que a
temporada avana, alguns jogadores principais se machucam, a defesa
falha, e o time comea a perder jogos. L pelo final do campeonato, os
torcedores acham que devem alterar suas probabilidades anteriores (suas
probabilidades a priori) do time vencer.
No exemplo acima, as probabilidades foram alteradas aps as pessoas
envolvidas (os torcedores) obterem informao adicional. Estas novas
probabilidades so conhecidas como probabilidades revistas ou
posteriores. Porque probabilidades podem ser revistas medida que
novas informaes tornam-se disponveis, a teoria das probabilidades de
grande valor para a tomada de deciso.
A origem do conceito de obter probabilidade posterior com informao
limitada creditada ao Reverendo Thomas Bayes (1702-1761), e a frmula
bsica para probabilidade condicional sob condies de dependncia
estatstica :

31

()
( )
()

conhecida com Teorema de Bayes.
Vejamos o seguinte exemplo:
Assuma que temos dois tipos de dados viesados numa urna. Num deles, o
nmero 2 aparece 30% das vezes [ou seja, P(2) = 0,3]. No outro, o 2 surge
em 60% das vezes [P(2) = 0,6]. Chamemos o primeiro tipo de dado de Tipo
1 e o segundo de Tipo 2. Um dado retirado, rolado uma vez, e aparece
um 2. Qual a probabilidade de que seja o dado do Tipo 1? Bem, como
existem 2 dados, poderamos responder que a probabilidade 0,5. Mas
faamos melhor. Veja a tabela abaixo:

Evento Elementar Probabilidade do
evento elementar
P(2/evento
elementar)
P(2, evento)
Tipo 1 0,5 0,3 0,5*0,3 = 0,15
Tipo 2 0,5 0,6 0,5*0,6 = 0,30

1

P(2) = 0,45

A soma das probabilidades dos eventos elementares igual a 1, porque
existem somente dois tipos de dados, e a probabilidade de cada tipo 0,5.
Os dois tipos constituem uma lista mutuamente exclusiva e coletivamente
exaustiva.
A soma de P(2/evento elementar) no iguala a 1. Os valores 0,3 e 0,6
representam simplesmente as probabilidades condicionais de obter um 2,
dado o Tipo 1 e o Tipo 2, respectivamente.
A coluna 4 (a ltima da tabela) a probabilidade conjunta de que o 2 e o
dado do Tipo 1 ocorram juntos (0,5*0,3 = 0,15), e a probabilidade
conjunta de que o 2 e o dado do Tipo 2 ocorram juntos (0,5*0,6 = 0,30). A
soma destas probabilidades conjuntas (0,45) a probabilidade marginal
de se obter um 2. Note que em cada caso a probabilidade conjunta foi
obtida usando a frmula:
P(AB) = P(A/B) * P(B)
32

Para encontrar a probabilidade de que o dado retirado seja o do Tipo 1,
usamos a frmula da probabilidade condicional sob dependncia
estatstica:

()
( )
()

No caso do problema em questo:
( )
( )
()



A probabilidade de ser do Tipo 2 :
( )
( )
()



Distribuies de Probabilidades
Suponha que estejamos interessados em apresentar, de uma maneira
organizada, o nmero de coroas que possam resultar quando jogamos
uma moeda duas vezes. Estes resultados so apresentados na tabela
abaixo:
1
a
Jogada 2
a
Jogada Nmero de coroas
em duas jogadas
Probabilidade dos
4 possveis
resultados
Coroa Coroa
Coroa Cara 1 0,5*0,5 = 0,25
Cara Cara 0 0,5*0,5 = 0,25
Cara Coroa 1 0,5*0,5 = 0,25
1,00

Comeamos por notar na tabela acima qualquer resultado que no
contenha coroa. O nico resultado que no contm coroa est na terceira
linha: Cara, Cara. A seguir, os resultados que apresentam uma nica coroa
esto na segunda e quarta linhas. Finalmente, o resultado que contm
duas coroas est na primeira linha. Agora, rearranjamos estes resultados
33

de forma a enfatizar o nmero de coroas contidos em cada resultado. Isto
feito na tabela a seguir:
Nmero de coroas Co Jogadas Probabilidade destes
resultados P(Ca)
0 (Ca, Ca) 0,25
1 (Co, Ca) + (Ca, Co) 0,50
2 (Co, Co) 0,25

A terceira coluna da tabela acima denominada distribuio de
probabilidades porque fornece as probabilidades associadas com cada
resultado listado na segunda coluna se o experimento fosse repetido um
nmero muito grande de vezes.
A tabela acima pode ser reapresentada como abaixo:
Nmero de coroas Co Probabilidade destes resultados P(Ca)
0 0,25
1 0,50
2 0,25

e representada graficamente da seguinte forma:

0,50


0,25

0 1 2
Assim, uma distribuio de probabilidade uma listagem de
probabilidades associadas com os possveis resultados que poderiam
resultar se um experimento fosse realizado. Distribuies de
probabilidades podem ser baseadas em consideraes tericas (a jogada
de uma moeda, por exemplo) ou em afirmaes subjetivas da
34

possibilidade de ocorrncia de certos resultados (a noo pessoal de um
gestor financeiro sobre o nvel das taxas de juros futuros de bonds).
Distribuies de probabilidade tambm podem ser baseadas na
experincia: os aturios de companhias de seguros determinam prmios
para polticas de seguros de vida usando as taxas de mortalidade para
estabelecer probabilidades de falecimentos entre diferentes grupos.
Distribuies Discretas e Contnuas de Probabilidades
As distribuies de probabilidades podem ser classificadas em discretas ou
contnuas. As distribuies discretas ocorrem em intervalos limitados de
valores: um exemplo disto seria a afirmao de um gestor financeiro das
possveis taxas de juros de bonds na prxima semana (10,5%; 10,62%;
10,75%; 10,85%). Da mesma forma, a probabilidade de que voc nasceu
num dado ms do ano tambm discreta (s h 12 valores possveis).
Numa distribuio contnua a varivel sob considerao pode assumir
qualquer valor dentro de um dado intervalo. Por exemplo, se estivermos
examinando a concentrao de partculas de fumaa em chamins de
plantas industriais e medirmos esta concentrao usando partes de
partculas por milhes de partes de ar, esperaramos um intervalo
contnuo de partes por milho. Chamaramos esta distribuio (partes por
milho - ppm) de distribuio contnua. Na discusso sobre distribuies
contnuas, associamos probabilidades somente com intervalos, ao invs
de valores nicos da varivel em discusso. Ento, fazemos perguntas
como: qual a probabilidade de que a concentrao de partculas fique
entre 15 e 30 ppm?
Variveis Aleatrias
Uma varivel aleatria (V.A.) uma varivel que assume diferentes
valores como resultado de um experimento aleatrio. Uma V.A. tanto
pode ser discreta como contnua. Pode-se pensar numa V.A. como um
valor ou magnitude que muda de ocorrncia para ocorrncia numa
sequncia previsvel. Um vendedor de eletrodomsticos no tem como
saber, com certeza, quais sero as vendas de amanh. Assim, as vendas de
amanh uma varivel aleatria. Os valores de uma varivel aleatria so
os valores numricos correspondentes a cada resultado possvel de um
experimento aleatrio. No caso do vendedor, suponha que saibamos que
35

os dados passados de vendas indicam que os valores da V.A. vendas
dirias variem de 110 a 115. Neste caso, esta V.A. uma varivel
aleatria discreta.
O quadro a seguir ilustra o nmero de vezes que cada nvel de venda
alcanou nos ltimos 100 dias.

Se acreditarmos que os valores de vendas desses ltimos 100 dias foram
tpicos, podemos utilizar estes registros histricos para associar
probabilidades a cada possvel valor de venda e assim criar uma
distribuio de probabilidade. Na terceira coluna da tabela, normalizamos
a distribuio. Normalizar significa simplesmente dividir cada dia na
coluna 2 pelo total de dias, 100 (assim, 0,01 = 1/100; 0,02 = 2/100, etc.). A
distribuio grfica da tabela feita abaixo:


36


Note que a distribuio de probabilidade para uma varivel aleatria
fornece a probabilidade para cada valor possvel e que estas
probabilidades tem que somar 1. Lembre-se tambm que tanto a tabela
quanto o grfico nos do informao sobre a ocorrncia a longo prazo das
vendas dirias que esperaramos ver se este experimento fosse repetido.
O Valor Esperado de uma Varivel Aleatria
Valor Esperado ou Esperana Matemtica um conceito fundamental no
estudo das distribuies de probabilidade.
Para calcular o valor esperado de uma varivel aleatria discreta,
multiplicamos cada valor dessa varivel aleatria pela probabilidade de
ocorrncia de cada valor e ento somamos os produtos. A frmula do
valor esperado de uma varivel aleatria discreta :
E = E x * P (x)
No caso do exemplo anterior das vendas dirias de eletrodomsticos, o
valor esperado dessas vendas o apresentado na tabela abaixo:
37


O valor esperado das vendas dirias, 108,02, a soma dos produtos de
cada ocorrncia de vendas pela sua probabilidade de ocorrncia. A
Administrao da loja de eletrodomsticos poderia achar til basear suas
decises no valor esperado das vendas dirias porque o valor esperado
uma mdia ponderada dos resultados esperados no futuro. O valor
esperado pondera cada resultado possvel pela probabilidade associada
com este resultado. Desta maneira, a ocorrncias mais comuns so dadas
mais pesos do que ocorrncias menos comuns. Na medida em que as
condies se alterassem ao longo do tempo, a Administrao recalcularia
o valor esperado das vendas dirias e ento usaria este novo dado como
base para tomar decises.
Tipos de Distribuies de Probabilidade
Existem diferentes tipos de distribuies de probabilidade, tanto discretas
quanto contnuas. Entretanto, as mais geralmente utilizadas em tomada
de deciso so as seguintes:
- Distribuio Binomial esta distribuio descreve muitos processos
de interesse para a tomada de deciso;
38

- Distribuio de Poisson uma distribuio discreta
frequentemente utilizada para contar o nmero de ocorrncias de
algum evento num dado perodo de tempo;
- Distribuio Exponencial uma distribuio contnua
frequentemente utilizada para medir a extenso de tempo
necessria para desempenhar alguma atividade;
- Distribuio Normal - uma distribuio contnua utilizada para
descrever muitos fenmenos fsicos, biolgicos, econmicos,
financeiros, administrativos, etc.

Distribuio Binomial
A distribuio Binomial descreve dados discretos resultantes de um
experimento chamado de Processo de Bernoulli. O lanamento de uma
moeda honesta um nmero fixo de vezes um processo de Bernoulli, e os
resultados de tais lanamentos podem ser representados por uma
distribuio binomial de probabilidade. O sucesso ou fracasso de alunos
licenciados numa entrevista para um emprego tambm pode ser descrito
por um processo de Bernoulli.
Podemos utilizar os resultados de um nmero fixo de lanamentos de uma
moeda honesta como um bom exemplo de um processo de Bernoulli. Este
processo descrito como:
1. Cada lanamento tem somente dois resultados possveis: cara ou
coroa.
2. A probabilidade de um sucesso num lanamento mantm-se fixa ao
longo do tempo. No caso da moeda justa, a probabilidade de cara
mantm-se em 0,5 para cada lanamento, no importando quantas
vezes a moeda seja lanada.
3. Os lanamentos so estatisticamente independentes; isto significa
que o resultado de um lanamento no afeta o resultado de um
outro qualquer.

No caso de um processo de Bernoulli, o smbolo p representa a
probabilidade de um sucesso; o smbolo q representa a probabilidade de
39

um fracasso (ou, q = 1 p); o smbolo r representa um certo nmero de
sucessos; e o smbolo n representa o nmero total de tentativas. A
frmula binomial a seguinte:

()


Vejamos alguns exemplos desta distribuio:
1) Uma amostra aleatria de 15 pessoas obtida de uma populao
em que 40% tm uma determinada posio poltica. Qual a
probabilidade de exatamente 6 indivduos na amostra terem essa
determinada posio poltica?

Neste exemplo, temos que:

n = 15
p = 0,4 q = 0,6
r = 6
P(r = 6) =?

()

()



2) Estima-se que cerca de 30% dos frangos congelados contenham
suficiente nmero de bactrias salmonelas causadoras de doenas,
se forem assados inadequadamente. Um consumidor compra 12
frangos congelados. Qual a probabilidade do consumidor ter 6
frangos contaminados?
n = 12
p = 0,3 q = 0,7
r = 6
P(r = 6) =?
( )

( )


40


3) Uma cadeia de restaurantes classifica embarques de produtos
alimentcios. Um embarque de carne vem em caixas de 20 fatias. A
poltica da cadeia classificar como aceitvel se no mais do que
2 caixas estiverem estragadas. A cadeia assume que a probabilidade
de qualquer caixa estragada ser aleatoriamente selecionada
independente de qualquer outra caixa.
Se um embarque de 20 caixas de carne recebido, qual a
probabilidade de que este embarque ser aceito se a probabilidade
de que qualquer caixa estragada aleatoriamente escolhida de 10%?

n = 20
p = 0,10 *10% das caixas so sucessos (estragadas)+ q = 0,7
r= 0, 1, 2

P(r s 2) =?

Neste caso estamos interessados na probabilidade de no mximo 2
caixas estarem estragadas. Este evento ser satisfeito se nenhuma
caixa, ou uma ou duas estiverem estragadas. A presena de ou no
problema revela a necessidade de adicionar as respectivas
probabilidades de cada um destes eventos. Este procedimento
envolve probabilidade binomial acumulada. Assim, de acordo com a
frmula apresentada:

P(r = 0) = 0,12577

P(r = 1) = 0,27017

P(r = 2) = 0,28518

P(r s 2) = 0,12577 + 0,27017 + 0,28518 = 0,676927 ou 67,69%

Ou seja, existem 67,69% de probabilidade de que 2 ou menos caixas
estaro estragadas se 20 caixas so examinadas e a probabilidade
de qualquer uma nica caixa estar estragada de 10%.

4) Considere agora o caso de a cadeia de restaurantes estar
interessada em determinar a probabilidade de 2 ou mais caixas de
41

carne estarem estragadas. Isto , P(r > 2). Nesta situao, mais
fcil utilizar a lei dos complementos:

P (A) = 1 - P()

Veja que:

P (r > 2) = 1 [P (r = 0) + P (r = 1)]

P (r > 2) = 1 (0,12577 + 0,27017) = 1 0,391747 = 0,608253

Mdia e Varincia de uma Distribuio Binomial
A mdia e a varincia de uma distribuio binomial so dadas,
respectivamente, por:

= n*p

e

o
2
= n*p*(1-p)

Por exemplo, seja uma empresa que vende seus produtos por telefone.
Dados anteriores demonstram que a probabilidade de uma venda em
qualquer ligao de p = 0,15. Se um vendedor fizer 15 chamadas num dia,
qual a mdia de vendas dirias que se poderia esperar?
= 15*0,15 = 2,25 vendas por dia.

e

o
2
= 15*0,15*(1-0,15) = 1,9125 vendas ao quadrado.

Repare que a varincia eleva ao quadrado as unidades de medida originais.
Neste exemplo, teramos 1,9125 vendas ao quadrado, o que no tem o
menor interesse prtico. Por isso, mais til utilizarmos o desvio-padro
(o) que a raiz quadrada da varincia:


42


( )

Isto , em 15 ligaes teramos, em mdia, 2,25 vendas dirias, com uma
disperso, para menos ou para mais, de 1,38 vendas dirias.
Distribuio de Poisson
A distribuio de Poisson frequentemente usada para descrever o
nmero de chegadas de clientes por hora, o nmero de acidentes
industriais em cada ms, o nmero de defeitos em conexes eltricas por
milha de fios numa estao de fora, ou o nmero de mquinas que
quebraram e esto aguardando reparo. Em cada um desses casos, a
varivel aleatria (clientes, acidentes, defeitos, mquinas) medida por
unidade de tempo ou espao (distncia).
Duas hipteses so para a aplicao da distribuio de Poisson:
1. A probabilidade de ocorrncia do evento constante para
quaisquer dois intervalos de tempo ou espao.
2. A ocorrncia do evento em qualquer intervalo independente da
ocorrncia em outro intervalo qualquer.
Dadas estas hipteses, a funo probabilidade de Poisson pode ser
expressa como:
()


onde
x = nmero de vezes em que o evento ocorre
= nmero mdio de ocorrncias por unidade de tempo ou espao
e = 2,71828, base do sistema de logaritmos naturais.



43

Exemplos
1. Suponha que estejamos interessados na probabilidade de que
exatamente 5 clientes chegaro durante a prxima hora (ou em
qualquer outra hora) numa loja. Uma observao das 80 horas
anteriores mostrou que 800 clientes entraram na loja. Assim, = 10
por hora. Logo:
( )
()


2. Uma construtora obteve um contrato para manter as estradas de
determinada cidade. As estradas recentemente pavimentadas por
esta empresa revelou uma mdia de dois defeitos por km aps
serem usadas por 1 ano. Qual a probabilidade de 1 defeito em
qualquer km de estrada aps o trfico circular por 1 ano?

( )
()


3. Um departamento de polcia recebe em mdia 5 solicitaes por
hora. Qual a probabilidade de receber 2 solicitaes numa hora
selecionada aleatoriamente?
( )
()



Mdia e Varincia de uma Distribuio Binomial
A mdia e a varincia de uma distribuio de Poisson so:
mdia = varincia =

4. A experincia passada indica que um nmero mdio de 6 clientes
por hora param para colocar gasolina numa bomba.

44

a. Qual a probabilidade de 3 clientes pararem a qualquer hora?
b. Qual a probabilidade de 3 clientes ou menos pararem em
qualquer hora?
c. Qual o valor esperado, a mdia, e o desvio padro para esta
distribuio?
Soluo

a. ( )
()



b. P (x s 3) = P (x = 0) + P (x = 1) + P (x = 2) + P (x = 3) = 0,151204

c. A mdia e varincia so iguais a = 6. Logo, o desvio-padro =

= 6 = 2,45 clientes.

Distribuio Exponencial

A distribuio de Poisson uma distribuio discreta de probabilidade que
mede o nmero de ocorrncias de algum evento ao longo do tempo ou
espao. Descreve, por exemplo, o nmero de clientes que devem chegar
durante um dado perodo. A distribuio Exponencial , em contraste,
uma distribuio contnua. Ela mede a passagem de tempo entre
ocorrncias. Assim, enquanto a distribuio de Poisson descreve unidades
de taxas de chegada (pessoas, caminhes, chamadas telefnicas, etc.)
dentro de certo perodo, a distribuio exponencial estima o lapso de
tempo entre chegadas. A Exponencial pode medir o lapso de tempo como
(1) o tempo que passa entre duas chegadas sucessivas ou (2) o quanto de
tempo que leva para completar uma ao, tais como servir um
consumidor, carregar um caminho, ou atender uma chamada telefnica.

Uma representao grfica de uma distribuio Exponencial feita abaixo:





45


f (x)










1 2 3 4 ...
X (unidades de tempo)


Veja que a funo que descreve esta distribuio decrescente, o que
mostra que quanto maior o valor da varivel aleatria, tal como medida
em unidades de lapso de tempo, menor a probabilidade dela ocorrer.
Metade de uma hora mais provvel de ocorrer do que uma hora, uma
vez que meia hora deve ser completada antes de uma hora inteira passar.

Se o processo de chegada uma distribuio de Poisson, ento o lapso de
tempo entre chegadas exponencialmente distribudo. Seja o nmero
mdio de chegadas num dado perodo, e
*
a mdia de tempo entre
chegadas. Ento,



Por exemplo, se uma mdia de quatro caminhes chega a cada hora numa
estao de carregamento ( = 4), ento, em mdia, um caminho chega a
cada quarto de hora. Isto ,



Baseado na relao entre distribuio de Poisson e Exponencial, possvel
determinar a probabilidade de que um especfico perodo de tempo
passar dado o conhecimento da taxa mdia de chegada. A probabilidade
46

de que no mais do que t unidades de tempo passaro entre ocorrncias
sucessivas :

( )



sendo a taxa mdia de ocorrncia e e = 2,71828.
Exemplos
1. Caminhes estacionam numa estao de carregamento a uma taxa
mdia de 1,5 por hora. Qual a probabilidade de que no mais do
que duas horas se passaro entre a chegada de dois caminhes
sucessivos?
Fazendo t = 2, temos
( )
()


2. Uma empresa de txi programa a chegada de seus carros ao
aeroporto local numa distribuio de Poisson com taxa mdia de
chegada de 12 txis por hora. Voc acabou de chegar ao aeroporto
e tem que ir ao cento da cidade fechar um negcio. Qual a
probabilidade de que voc ter que esperar no mais do que cinco
minutos para tomar um txi?
Dado que expresso em termos de 12 por hora, ele deve ser
transformado em minutos para se conformar ao problema, que
especifica um perodo de tempo de cinco minutos. Assim, = 12/60
= 0,2 por minuto.
( )
()()


Existe uma probabilidade 63,21% de que um txi chegar dentro de
5 minutos.
OBS: sempre necessrio assegurar-se de que a unidade de tempo
na qual est expresso coincide com a unidade de tempo definida
no problema.
47

3. Uma das aplicaes mais teis e comuns da distribuio Exponencial
em problemas de filas de espera. Filas de espera ocorrem em
muitos setores: clientes que esperam numa fila para serem
atendidos nos caixas de uma agncia bancria; caminhes que
esperam para serem carregados numa estao; mquinas que
esperam para serem consertadas numa oficina; chamadas
telefnicas que esperam para entrar numa estao telefnica, etc.
Um negcio com problemas de fila de espera deve avalia-los e
melhorar seu desempenho.
Faamos A (a letra grega maiscula lambda) ser a taxa mdia a qual
unidades chegam de algum servio por unidade de tempo, e o
nmero mdio de unidades que podem ser servidas na mesma
unidade de tempo. Assim, podemos avaliar um sistema de filas na
base do seguinte critrio:



em que P
0
a probabilidade de que no h unidades no sistema.

[
A



em que Pn a probabilidade de que n unidades esto no sistema.


A
A


em que L o nmero mdio de unidades no sistema (aquelas
esperando pelo servio mais aquela recebendo o servio).

A


48

em que W o tempo mdio que uma unidade gasta no sistema
esperando pelo servio e recebendo aquele servio (tempo de
espera mais o tempo de servio).

( A)


em que L
q
o nmero mdio de unidades no sistema esperando
pelo servio.

A
( A)


em que W
q
o nmero mdio despendido na fila esperando para o
servio comear.

Repare que L difere de Lq j que este ltimo no inclui a unidade
que est sendo correntemente recebendo servio, mas conta
somente aquelas alinhadas esperando pelo servio.

Seja o seguinte exemplo: Uma loja de convenincia, que se orgulha
de seu atendimento rpido, notou que durante certos periodos do
dia, tais como a hora do almoo e a partir das 17 horas, horrio em
que as pessoas deixam o trabalho, grandes filas formavam-se na sua
caixa registradora. A Administrao da loja preocupada que as
demoras no pagamento arranhassem a sua imagem de rapidez no
atendimento, ordenou uma pesquisa que revelou que durante
aqueles horrios uma mdia de 72 clientes por hora entravam na
loja e que levava 35 segundos em mdia para atender um cliente na
fila. A loja queria saber o impacto que isto poderia causar em seu
negcio.

A = 72 / hora ou 1,2 por minuto
= 60 / 35 = 1,7 por minuto
49

a. A probabilidade de que ningum esteja na caixa registradora :


b. A probabilidade de que algum deve esperar a probabilidade
de que existem duas ou mais pessoas na fila (se h somente uma
pessoa na fila, ela no est esperando pelo servio, ela o est
recebendo).

P (n > 2) = 1 [P (n = 0) + P (n = 1)] = 0,2941

()

P (n > 2) = 1 (0,2941 + 0,2076) = 0,4983

c. A mdia de tempo despendido na espera no sistema (o momento
entre a chegada de um consumidor caixa registradora com
suas compras e o tempo que ele deixa a loja) :




d. O tempo mdio gasto esperando pelo servio (do perodo em que
um cliente chega caixa registradora com suas compras ao
momento em que atendido) :

( )


Com base nos valores acima, a Administrao da loja pode decidir,
por exemplo, se 2 minutos muito tempo para esperar o
atendimento, ou que, como a probabilidade de no ter ningum
50

sendo atendido relativamente baixa, se realmente o servio de
atendimento deve ser agilizado.

Distribuio Normal

A distribuio Normal , talvez, a distribuio de probabilidade mais
importante de todas as distribuies j examinadas (e das que no
examinamos aqui) em parte porque a distribuio Normal pode servir
como uma aproximao s demais distribuies, tal como a Binomial. Mas
a distribuio Normal prova ser de maior valor em sua habilidade de servir
como fundamento para anlises estatsticas mais avanadas. Da vantagem
fornecida pela distribuio Normal torna-se possvel desenvolver um nvel
de inferncia estatstica que de outra maneira no poderia ser alcanado.

A distribuio Normal uma distribuio contnua de probabilidade.
usada para refletir a distribuio de variveis tais como alturas, pesos,
distncias, e outras medidas que so divisveis infinitamente. Tais variveis
contnuas so geralmente resultado de medidas.

A distribuio Normal um arranjo nico de valores em que, se os valores
so plotados num grfico, a curva representativa assume uma forma
simtrica lembrando um sino, tal como mostrado abaixo:

f(X)

Mdia = Moda = Mediana X

Numa distribuio Normal trs coisas importantes devem ser notadas:

a. A mdia, a moda e a mediana so iguais.
51

b. 50% das observaes esto acima da mdia e 50% abaixo dela. Isto
significa que metade da rea sob a curva est esquerda da mdia,
e a outra metade direita da mdia.
c. Se os dados so normalmente distribudos, podemos utilizar a
chamada Regra Emprica da Distribuio Normal para tirar
concluses sobre tais dados. Esta regra diz o seguinte: se incluirmos
todas as observaes dentro de um desvio-padro da mdia (isto ,
um desvio-padro abaixo e um desvio-padro acima da mdia)
abrangeremos 68,3% de todas as observaes. Assim, no importa
qual a mdia e qual o desvio-padro, podemos estar certos de que
68,3% das observaes estaro dentro de um desvio-padro da
mdia. Naturalmente, se nos movermos mais do que um desvio-
padro acima e abaixo da mdia, abrangeremos uma porcentagem
maior de observaes. A Regra Emprica especifica que

68,3% das observaes esto a um desvio-padro da mdia;
95,5% das observaes esto a dois desvios-padro da mdia;
99,7% das observaes esto a trs desvios-padro da mdia;

Graficamente



52

em que s o desvio-padro.

Esta regra aplica-se tanto populaes quanto amostras.
Como exemplo, admita, considerando o tempo em minutos, que
chamadas telefnicas cheguem a uma central. Grafando as
frequncias em que as chamadas ocorrem, temos a forma
apresentada na figura abaixo:

Frequncia

X (minutos)
0 5 10 15 20
As observaes em cada um dos extremos da curva ocorrem com
relativa pouca frequncia, mas as observaes mais prximas do
centro da curva ocorrem com frequncia crescente, at o pico de 10
minutos, chamado de observao modal. Numa distribuio Normal,
Mdia, Moda e Mediana so iguais. Como a mdia de 10 minutos,
isto significa que metade das observaes est abaixo de 10 e
metade est acima.
Admita que o desvio-padro dessa distribuio seja de 2 minutos.
Assim, podemos estar certos de que:
68,3% das chamadas estaro contidas entre 8 e 12 minutos;
95,5% das chamadas estaro contidas entre 6 e 14 minutos;
99,7% das chamadas estaro contidas entre 4 e 16 minutos.
53

Assuma uma amostra de 1.000 chamadas. Assim, 997 das 1.000
levam entre 4 minutos e 16 minutos para entrar na central. Logo,
somente 3 de 1.000 chamadas levam menos de 4 minutos ou
mais do que 16 minutos para entrar.
Uma observao com mais de 3 desvios-padro para cima e para
baixo da mdia, uma raridade e ocorre em menos de 1% das
vezes se os dados so normalmente distribudos.

A equao para a funo de densidade normal :

()

(
()

)


Observando-se a funo acima podemos concluir que existe um nmero
infinito de distribuies normais, cada uma com sua mdia e desvio-
padro. Dado que no possvel examinar todas as possibilidades, til
converter todas essas distribuies numa forma padro. Esta distribuio
normal padronizada feita com a frmula de converso (ou frmula-Z):




em que Z o desvio normal e X algum valor especificado para a varivel
aleatria. Depois deste processo de converso, a mdia da distribuio
zero e o desvio-padro 1. Todas as distribuies normais podem ser
convertidas na forma padro.

Para ilustrar o processo de converso, suponha que uma companhia
telefnica descobriu que a mdia de mensagens telefnicas dura 150
segundos, com desvio-padro de 15 segundos. Tambm descobriu que a
extenso das mensagens uma varivel normalmente distribuda. Esta
distribuio mostrada graficamente a seguir:






54





X (segundos)
120 150 180


Z (valores)
-2 -1 0 1 2


A distribuio centrada em 150 segundos e simtrica em torno deste
ponto. Um segundo eixo aparece abaixo da distribuio. Este escalonado
no em unidades de tempo, mas em unidades de Z. Ele expressa
distncias ao longo do eixo em termos de valores de Z. Na escala Z a
distribuio centrada no ponto mdio zero, porque o numerador na
frmula de converso requer que seja subtrada a mdia 150.

Assuma que uma chamada telefnica particular leve 180 segundos. Isto
est a dois desvios-padro acima da mdia de 150. Podemos medir esta
distncia entre 150 e 180 segundos de duas maneiras. Podemos dizer que
este ponto de 180 segundos (1) 30 segundos acima da mdia, ou que (2)
este ponto 2 desvios-padro acima da mdia. Em ambos os casos,
estamos na mesma situao. Ao expressar a distncia em desvios-padro,
estamos dizendo que o valor de Z dois desvios-padro. Isto , Z = 2. O
valor Z o nmero de desvios-padro que um dado ponto (180 neste caso)
est acima ou abaixo da mdia. Usando a frmula de converso, temos:





De maneira semelhante, 120 segundos esto a dois desvios-padro abaixo
da mdia. Assim:





55

Padronizando a distribuio desta maneira oferece certas vantagens.
Agora existe somente uma distribuio para usar ao invs de um nmero
infinito delas. Evidentemente esta vantagem hoje est bem reduzida, pois
com programas tais como o Excel, possvel usar-se tanto a distribuio
normal quanto a normal padronizada para calcularem-se probabilidades.
Vejamos:

As chamadas telefnicas so, em mdia, 150 segundos com desvio-padro
de 15 segundos. Isto pode ser escrito como:

X~ N(150, 15)

Que significa que X uma varivel aleatria normalmente distribuda com
mdia de 150 e desvio-padro de 15.

Se a companhia telefnica deseja determinar a rea sob a curva entre 150
e 180 como mostrado na figura abaixo:


0,5





0,5
X (segundos)
150 180


Z (valores)
0 2

ela pode:

a) Utilizar a prpria distribuio normal: P (150 s X s 180)

Neste caso, abra uma planilha do Excel e selecione a funo
estatstica DIST.NORM.N (o Excel utilizado foi o de 2010) e preencha
os argumentos conforme a figura seguinte:


56



A rea sob a curva igual a 1 ou 100%. Assim, a distribuio
acumulada at 180 0,97725. Subtraindo 1 de 0,97725 temos
0,0228, que corresponde rea acima de 180. Como metade da
curva (de 150 em diante) corresponde a 50% (0,5), subtramos 0,5
de 0,0228. O valor, 0,4772, a rea desejada (entre 150 e 180). Veja
a figura abaixo:


0,5



0,0228
0,5
X (segundos)
150 180


Z (valores)
0 2


b) Utilizar a distribuio normal padro:

A equao de transformao nos d Z = 2. No Excel, abra a funo
estatstica DIST.NORMP.N, e preencha-a conforme mostrado a
seguir:
0,4772
57




O valor encontrado o mesmo, 0,9772. A seguir, os clculos so os
mesmos que os anteriores.

Agora que a companhia telefnica encontrou a rea de 0,4772 sob a curva
normal entre os valores 150 e 180 segundos, ela chega a duas concluses
ou interpretaes:

1. Existem 47,72% de probabilidade de que qualquer mensagem
telefnica durar entre 150 e 180 segundos;
2. 47,72% de todas as mensagens ficaro entre 150 e 180 segundos.

Por outro lado, a probabilidade de qualquer chamada durar mais de 180
segundos, ou seja, P (X > 180) = P (Z > 2) de 2,28%.

E qual a probabilidade de qualquer chamada estar entre 125 e 150
segundos, isto , P (125 s X s 150) = P (-1,67 s Z s 0)?




X (segundos)
125 150


Z (valores)
0 2

58


A rea abaixo de 125 corresponde a uma probabilidade de 0,0478. A rea
de 150 e abaixo corresponde a 0,5. Logo, a rea entre 150 e 125
corresponde diferena entre 0,5 e 0,0478, o que gera a probabilidade de
0,4522 ou 45,22%.

Qual a probabilidade de que qualquer chamada dure entre 145 e 155
segundos?





X (segundos)
145 150 155


Z (valores)
-0,33 0 0,33

P (145 s X s 155) = P (-0,33 s Z s 0,33) =?

A probabilidade acumulada at 145 0,369441. Como a rea sob a curva
esquerda de 150 corresponde a 0,5, subtramos deste valor 0,369441, o
que d 0,130559. Como a distribuio simtrica, do lado direito temos a
mesma proporo, ou seja, 0,130559. Assim, somando estes dois valores
temos:

P (145 s X s 155) = P (-0,33 s Z s 0,33) = 0,130559 + 0,130559 = 0,2611

Logo, a probabilidade de que qualquer chamada aleatoriamente
selecionada dure entre 145 e 155 segundos de 26,11%.









59


CAPTULO 2
PREVISES
Virtualmente todas as decises administrativas dependem de previses.
Os gestores estudam previses de vendas, por exemplo, para tomar
decises sobre necessidades de fundo de maneio, o tamanho da fora de
trabalho, nveis de stocks, a programao da rotina de produo, a
localizao das fbricas, o montante de propaganda e promoo de
vendas, a necessidade de alterao de preos, e muitos outros problemas.

Embora as previses sejam criticamente importantes, elas nunca so to
acuradas quanto os gestores gostariam. No entanto, decises tm que ser
tomadas todos os dias, e tm que ser tomadas com as melhores
informaes disponveis, no com previses perfeitas. A questo real em
previso no se a acurcia perfeita, mas como fazer o melhor uso da
metodologia de previso.

Numerosos mtodos quantitativos de previso tm sido desenvolvidos ao
longo do tempo. Os mtodos discutidos neste texto foram escolhidos
porque deram bons resultados na prtica.

Iniciamos com as chamadas Regresses.


Relaes Funcionais entre Variveis

Relaes entre duas variveis

Com frequncia, em nossa vida profissional, desejamos conhecer
respostas para questes como as seguintes:

- Qual o efeito de um aumento do dficit no oramento pblico
sobre o nvel das taxas de juro e da taxa de inflao?
- H alguma relao entre o nvel das taxas de juros e um ndice da
Bolsa de Valores?
- Qual o efeito do dficit da balana comercial sobre o nvel de
emprego?
60

- Qual a relao entre a quantidade de dinheiro na economia,
digamos M1, e o nvel da atividade econmica?
- Se o Banco Central aumentar a taxa de desconto, isso causar uma
estagnao com inflao?
- Qual o efeito, sobre a distribuio de renda, das modificaes na
legislao tributria?
- melhor investir em ttulos governamentais a longo prazo ou em
Letras do Banco Central a curto prazo?
- Aumentos em gastos com propaganda geram aumentos de venda?
- Aumentos na renda da populao geram aumentos no consumo de
bens e servios?

Respostas para estas e outras perguntas exigem que especifiquemos
relaes funcionais entre variveis. Neste item, estudaremos relaes
funcionais entre duas variveis (uma dependente e a outra independente).

Vejamos o seguinte exemplo (veja este exemplo e outros, na planilha
Excel Regresses Simples):

- Suponha que certo empresrio esteja interessado em comercializar
determinado produto em certa cidade. Ele ento recolhe dados
sobre os preos praticados no mercado para o tal produto, bem
como as quantidades vendidas ao longo dos ltimos 12 meses
mediante inquritos em estabelecimentos que j comercializam o
produto. Estas informaes esto apresentadas na Tabela 1, a
seguir:
Meses Consumo (Q
D
) Preos (P)
1 100 230
2 120 215
3 135 200
4 150 195
5 165 190
6 182 187
7 198 180
61

8 220 172
9 245 150
10 256 142
11 262 138
12 280 130
Tabela 1. Dados sobre preo e consumo de certa mercadoria.
Ele deseja agora saber se possvel representar os dados da Tabela
1 por uma relao matemtica que lhe permita fazer previses
sobre o consumo futuro do produto em funo de variaes em seu
preo. Os seguintes passos devem ser ento efetuados:
preciso, inicialmente, definir quem a varivel dependente (ou
explicada) e quem a varivel independente (ou explicativa). A
teoria econmica nos ensina que as quantidades demandadas de
certo bem ou servio (Q
D
) so uma funo de seu preo (P). Em
termos matemticos isto uma relao do tipo
Q
D
= f (P)
A relao acima uma relao perfeitamente geral, e o que
queremos , justamente, tentar especificar uma funo que se
adeque aos dados obtidos na Tabela 1.
Depois de definidas as variveis dependente e independente,
preciso fazer uma suposio do relacionamento entre elas. A
suposio mais simples a de que elas se relacionam linearmente
de acordo com uma funo do tipo
Q
D
= |
1
+ |
2
P
ou seja, uma funo linear, em que |
1
e |
2
so, respectivamente, o
coeficiente linear e angular da reta. A hiptese de linearidade
uma hiptese inicial, de referncia. Obviamente, teremos que
test-la posteriormente.
Um teste adequado o uso do chamado coeficiente de correlao.
62

Em teoria da probabilidade e estatstica, correlao indica a fora
e a direo do relacionamento linear entre duas variveis. No uso
estatstico geral, correlao ou co-relao se refere a medida da
relao entre duas variveis, embora correlao no implique
causalidade. Neste sentido geral, existem vrios coeficientes
medindo o grau de correlao, adaptados natureza dos dados.
Vrios coeficientes so utilizados para situaes diferentes. O mais
conhecido o coeficiente de correlao de Pearson, o qual
obtido dividindo a covarincia de duas variveis pelo produto de
seus desvios padro. Apesar do nome, ela foi apresentada
inicialmente por Francis Galton.
A frmula da correlao a seguinte:

( )
() ()

A correlao tem as seguintes caractersticas:
Os valores de r
XY
esto limitados entre 1 e +1, isto , a
correlao uma medida padronizada;
um valor nico para populao ou amostra, tomando o
cuidado de utilizar dados coerentes;
Da expresso de r
XY
pode-se obter a covarincia das mesmas
variveis, isto :
o
XY
= r
XY
*oX *oY
As propriedades mais importantes da correlao so as seguintes:
O coeficiente de correlao de uma varivel com ela mesma
igual a 1.

1
*
2
2
= = =
X
X
X X
XX
XX
r
o
o
o o
o


63

A permutao das variveis no altera o resultado do
coeficiente de correlao, se os mesmos pares de valores forem
mantidos:
r
XY
= r
YX

Se as variveis X e Y forem estatisticamente independentes,
ento o coeficiente de correlao destas variveis zero.
Se o resultado do coeficiente de correlao das variveis X e Y
for igual a zero, no se pode afirmar que as duas variveis sejam
estatisticamente independentes. Para confirmar essa
independncia deve-se verificar se todos os pares de valores de X e
Y cumprem a condio: P (X e Y) = P (X) *P (Y).
Dissemos acima que o coeficiente de correlao varia no intervalo
-1 a +1. Interpretemos agora esses valores.
a) r
XY
= +1. Correlao perfeita positiva.
Se duas variveis, X e Y, crescem ou decrescem na mesma
proporo e na mesma direo, ento elas estaro
perfeitamente correlacionadas de forma positiva, sendo seu
r
XY
= +1. Nesse caso, plotando os valores de X e Y num grfico,
seus pares de valores estariam perfeitamente alinhados
ascendentemente. Veja a Figura 1:
Y



X

Figura 1. Alinhamento perfeito ascendente, r
XY
= +1.

64

b) r
XY
= -1. Correlao perfeita negativa.
Se duas variveis, X e Y, crescem ou decrescem na mesma
proporo, mas em direes opostas, ento elas estaro
perfeitamente correlacionadas de forma negativa, sendo seu
r
XY
= -1. Nesse caso, plotando os valores de X e Y num grfico,
seus pares de valores estariam perfeitamente alinhados
descendentemente. Veja a Figura 2:
Y



X

Figura 2. Alinhamento perfeito ascendente, r
XY
= -1.
c) r
XY
= 0. Variveis no correlacionadas.
Se no h relao entre duas variveis X e Y ento seu r
XY
= 0.
Isto significa que no h um padro de formao entre os
pares das variveis. Se esses pares forem colocados num
grfico ver-se- uma nuvem de pontos sem tendncia
definida, tal como mostrado na Figura 3:
Y



X
Figura 3. Inexistncia de alinhamento, rXY = 0.
65

Trs observaes importantes se fazem necessrias sobre a
covarincia e a correlao:
1) Tanto o coeficiente da covarincia quanto o da correlao
medem o grau de dependncia linear entre duas variveis.
importante fixar isto. Ao utilizarmos a covarincia ou a
correlao, queremos medir quo bem duas variveis podem
ser representadas por uma funo linear. Tanto a covarincia
quanto a correlao no tm valor nenhum para descrever
relaes no lineares. Assim, o fato de rXY = 0 no significa
que duas variveis X e Y no tenham relao nenhuma, mas
sim que no tm relao linear;
2) Covarincia e Correlao no estabelecem uma relao de
causa e efeito entre duas variveis. Assim se, por exemplo,
num estudo estatstico qualquer descobrirmos uma forte
correlao positiva entre o aumento da produo de ovos no
Lubango e o aumento das vendas do Jornal de Angola em
Luanda, no podemos afirmar que o aumento da produo de
ovos causa o aumento nas vendas do jornal ou vice-versa. As
causas devem ser procuradas em outros fatores, tais como,
digamos, o aumento da renda, que permite maior consumo
de ovos e de compra de jornal.
3) Na vida real, dificilmente encontraremos coeficientes de
correlao tais como os apresentados acima. Em geral,
podemos encontrar relaes fortemente positivas, em que r
XY

est prximo de +1, relaes fracamente positivas, em que r
XY

est prximo de +0, relaes fortemente negativas, em que
r
XY
est prximo de -1, ou relaes fracamente negativas, em
que r
XY
est prximo de -0.
Utilizando a funo estatstica Correl do Excel, obtemos um
coeficiente de correlao de -0,989, o que significa que h
uma correlao negativa muito forte entre preos e
quantidades demandadas, como seria de se esperar.

66

A seguir, til representar graficamente Q
D
e P para analisarmos,
visualmente, como as duas variveis se distribuem
conjuntamente. O grfico utilizado para isso chamado de
diagrama de disperso porque mostra como as duas variveis
esto dispersas em relao uma outra. O diagrama de disperso
obtido no Excel para as duas variveis em questo est mostrado
no Grfico 1 a seguir:

Grfico 1. Diagrama de Disperso Preo x Consumo.

Notamos que medida que os preos sobem, as quantidades
demandadas caem, e vice-versa. Isto est de acordo com a teoria
econmica. Agora, de acordo com a nossa hiptese inicial de
linearidade, precisamos especificar uma funo linear que melhor
se ajuste aos pontos do Grfico 1. Existem vrias possibilidades,
mas o mtodo mais utilizado aquele baseado no princpio dos
mnimos quadrados ordinrios (MQO) desenvolvido pelo
matemtico alemo Carl Friedich Gauss. Este mtodo garante
que, dentre as infinitas retas que podem passar pelos pontos do
Grfico 1, a encontrada por mnimos quadrados a que melhor
se ajusta queles pontos. No Excel, clique em qualquer dos
pontos do Grfico 1 e, a seguir, pressione o boto direito do
mouse. No sub-menu que se abrir, selecione Adicionar linha de
tendncia. Na caixa Formatar Linha de Tendncia, escolha o Tipo
Linear (na verdade, este tipo j automaticamente pr-
selecionado). Selecione tambm Exibir Equao no grfico. O
resultado a reta y = - 1,8748x + 525,36. Veja o Grfico 3:
67


Grfico 3. Reta de regresso dos dados da Tabela 1.

em que y = Q
D
e x = P.

Vrias observaes, ainda que a nvel introdutrio, se fazem
necessrias antes que possamos utilizar a reta QD = -1,8748P +
525,36 para estimar quantidades demandadas futuras a partir de
variaes no preo do produto:

Obs 1: Os coeficientes -1,8748 e 525,36 so, respectivamente, os
coeficientes angular e linear da reta. A sua interpretao sabida
por qualquer um que tenha estudado lgebra a nvel
intermedirio - o coeficiente angular mede duas coisas em
relao ao comportamento da funo:

O coeficiente angular, em seu valor relativo, com o sinal de
mais ou de menos sua frente, indica a inclinao da reta. Se
positivo, a reta ascendente; se negativo, a reta descendente.
No exemplo, como o sinal negativo, vemos que a reta
negativamente inclinada, o que, no caso, est de acordo com a
teoria da demanda do consumidor.

O coeficiente angular, em seu valor absoluto, isto , apenas o
valor 1,8748, mede a variao de y por unidade de variao de x.
Assim, se x = P varia de 1 unidade monetria, y = Q
D
varia 1,8748
unidades. Como o sinal negativo, dizemos que se o preo
aumentar $ 1, as quantidades demandadas do produto cairo
68

1,8748 unidades. Assim, existe uma relao inversa entre o preo
e a quantidade demandada do produto.

Por outro lado, o coeficiente linear mede o valor de y quando x
zero. Assim, poderamos interpretar o coeficiente linear de
525,36 como as quantidades que seriam consumidas do produto
se o seu preo fosse zero. Mas ateno! No presente contexto,
esta interpretao deve ser feita com muito cuidado. Veja a seo
A questo da previso para entender o por que;

Obs 2: Embora possa parecer, a funo linear obtida no Grfico 3
no uma relao matemtica ou determinstica ente P e Q
D
. Ao
contrrio, trata-se de uma relao estatstica ou estocstica. Para
entender isso de forma simples, olhe para o Grfico 3 novamente.
Embora a reta ali encontrada seja a que melhor se ajusta quele
conjunto de pontos, nem todos os pontos esto sobre a reta.
Alguns esto acima, outros abaixo dela. Isto quer dizer que, se
usarmos a reta para fazer previses, estaremos sujeitos a
cometer erros em nossas previses. O mtodo dos mnimos
quadrados ordinrios visa, justamente, tornar esses erros os
menores possveis. E por que no podemos ter uma funo que
se ajuste perfeitamente aos dados? Porque, preos e quantidades,
assim como outras variveis econmicas e financeiras, so
variveis aleatrias ou estocsticas. Isso quer dizer que, mesmo
que fixemos um determinado preo, no podemos ter a certeza,
a priori, de quais sero as quantidades demandadas. Isto porque,
vrios outros fatores, que no apenas os preos influenciam o
comportamento da demanda, tais como a renda do consumidor,
o preo dos bens substitutos e complementares ao produto em
questo, hbitos de consumo, tamanho da famlia, propaganda,
condies climticas, fatores polticos, religio, etc.

Portanto, o nosso modelo Q
D
= |
1
+ |
2
P, que determinstico,
precisa ser reescrito para incorporar todos os outros fatores que
influenciam o consumo, que no apenas o preo do produto. Tal
modelo representado por

Q
D
= |
1
+ |
2
P +
i

69

em que
i
o chamado termo de erro estocstico ou perturbao
estocstica e rene todos os outros fatores que influenciam as
quantidades demandadas do produto e que fazem com que a
reta no se ajuste perfeitamente aos dados.

Obs 3: Devemos chamar a ateno ainda para o fato de que a
funo demanda gerada no Grfico 3 foi obtida com base numa
nica amostra. Portanto, o que temos, uma estimativa da
verdadeira relao entre preo e quantidades demandadas do
produto em questo. Assim, a funo gerada no Grfico 3 pode
ser genericamente representada da seguinte forma:


. . . .
+ + =
i i
i u X Y
2 1
| |


que chamada de funo de regresso amostral (FRA) e onde os
(Y
i
chapus) so os valores estimados das quantidades
demandadas com base na FRA; os |
i
, i = 1, 2, so, por sua vez, os
estimadores dos verdadeiros coeficientes |s da funo de
regresso que espelha a verdadeira relao entre preos e
quantidades demandadas do produto sob anlise, relao esta
que por ns desconhecida. Finalmente, os
.
i
u
so os termos de
resduos e podem ser considerados como as estimativas de
i
,
isto , os erros que cometeramos em nossas previses mesmo
que dispusssemos da verdadeira reta de regresso entre preos
e quantidades demandadas do produto, devido, como j vimos,
aos fatores que influenciam a demanda que no s o preo.

Ento, de acordo com as consideraes anteriores temos o
seguinte: Uma amostra foi recolhida do consumo e preos
praticados de certo produto durante certo perodo de tempo.
Com base nesta amostra, foi definida uma funo de regresso
amostral = -1,8748 + 525,36 +
.
i
u
. Queremos agora saber qual a
confiabilidade desta funo para previses. Para isso, precisamos
de instrumentos analticos adicionais que sero expostos a seguir:




70

Anlise da funo demanda

O Excel dispe da ferramenta Anlise de Dados para o tipo de
anlise que faremos a seguir. Entretanto, voc s ter acesso a
essa ferramenta se j tiver selecionado, previamente, no menu
Opes e, dentro deste, Suplementos, os suplementos Analysis
ToolPack e Analysis ToolPack VBA.

Digite os dados da Tabela 1 numa folha do Excel. Depois, no
menu Dados, selecione Anlise de Dados no bloco Anlise.
Depois de abrir a caixa de dilogo Analisar dados, escolha
Regresso. Preencha os dados da caixa Regresso conforme
indicado na Figura 4:

Figura 4. Ferramenta de anlise Regresso.

A seguir, pressione o boto OK da ferramenta. Os resultados
aparecem na Figura 5:

71





Figura 5. Resultados da ferramenta Regresso para os dados da Tabela 1.
72

A ferramenta Regresso realiza a anlise de regresso tanto
simples (uma nica varivel independente, que o nosso caso)
quanto mltipla (mais de uma varivel independente
1
) de um
conjunto de dados. Embora no seja um pacote economtrico
completo, pois outros resultados importantes para anlise no
esto disponveis, ela ainda assim til para uma anlise inicial e
acessvel dos dados. A ferramenta apresenta os resultados em
formato de blocos, que passamos a analisar em seguida:
Bloco Estatstica de Regresso
Nesse primeiro bloco, so apresentadas as estatsticas
fundamentais da regresso:
R mltiplo: o coeficiente de correlao entre as duas variveis.
O coeficiente de correlao (r) mede o grau de relacionamento
(dependncia) linear entre as duas variveis. r um nmero que
varia entre -1 e +1, isto , -1 s r s +1. Quanto mais prximo de +1
estiver r, mais linearmente relacionadas de forma positiva
estaro as variveis; quanto mais prximo de -1, mais
linearmente relacionadas de forma negativa elas estaro. Se as
duas variveis forem estatisticamente independentes
2
ento r = 0.
Mas a recproca no verdadeira. Se r = 0, isto no significa que
as duas variveis sejam independentes: elas podem ter outro tipo
de relacionamento que no o linear. No caso do exemplo, r = -
0,9890, indicando uma forte relao linear negativa entre Q
D
e P.
O coeficiente de correlao tambm pode ser calculado
utilizando-se a funo estatstica CORREL do Excel.
Quadrado de R: ou r
2
, o coeficiente de determinao da FRA.
Este coeficiente mede o grau de ajuste da reta de regresso ao
conjunto de dados. Ou, por outras palavras, quanto das variaes
em Q
D
so explicadas (ou determinadas) por P. O r
2
um
coeficiente que varia entre 0 e 1, isto , 0 s r
2
s 1. Quanto mais

1
A ferramenta aceita at 16 variveis independentes.
2
Duas variveis so estatisticamente independentes se a seguinte relao for verdadeira: f (x, y) = f (x) *
f (y). Isto , se o produto de sua funo de probabilidade conjunta for igual ao produto de suas funes
de probabilidade individuais.
73

prximo de 1, melhor o ajuste e, portanto, maior a influncia
da varivel independente sobre a dependente. Se r
2
= 0, ento
no h nenhuma relao entre as duas variveis, e a melhor
estimativa para qualquer valor de Q
D
ser o seu valor mdio. No
exemplo, r
2
= 0,9781, o que demonstra que, aproximadamente
97,81% das variaes nas quantidades demandadas do produto
so devidas s variaes de seu preo, e os restantes 2,19% so
devidos a outros fatores no considerados, os resduos
.
i
u
. Uma
forma simples de achar r
2
elevar ao quadrado o coeficiente de
correlao r.
Quadrado de R ajustado: ou
2
r , o coeficiente de
determinao utilizado para regresses mltiplas.
Erro Padro: o erro padro da estimativa (ep ou
.
o ), ou seja, o
desvio-padro dos valores Q
D
observados em relao reta de
regresso estimada. uma medida da preciso de nossas
estimativas. O erro padro da estimativa pode ser calculado pela
seguinte frmula:
2
2

|
.
|

\
|

=
.
n
Y Y
ep
i i


em que
i
Y
Y
i
.
so os desvios dos valores observados em relao
aos estimados pela regresso, e n-2 so os chamados graus de
liberdade [o termo nmero de graus de liberdade significa o
nmero total de observaes na amostra, ou seja, n, menos o
nmero de restries independentes (lineares) impostas a elas.
Em resumo, o nmero de observaes independentes de um
total de n observaes. Por exemplo, para que a soma dos
quadrados dos resduos (SQR) possa ser calculada, deve-se
primeiro obter

. Estas duas estimativas, portanto, impem


duas restries contra a SQR. Logo, h n 2 e no n observaes
independentes para calcular a SQR. Seguindo esta lgica, na
74

regresso de trs variveis, SQR ter n-3 gl, e o modelo de k
variveis ter n k gl. A regra esta: gl= n- nmero dos
parmetros estimados.] O erro padro tambm pode ser
calculado com a funo estatstica EPADYX do Excel. Por exemplo,
se usarmos a regresso
D
Q
.
= -1,8747549P + 525,362759 para
estimarmos o valor de Q
D
para P = $ 230, digamos,
encontraremos
D
Q
.
= -1,8747549*(230) + 525,362759~ 94,17.
Interpretamos esse resultado da seguinte maneira:
94,17 a estimativa da mdia de Q
D
que obteramos se
fizssemos P = $ 230 muitas vezes. Fazendo 94,17 ep = 94,17
9,33 ou [88,84; 103,50], temos que aproximadamente 68,3%
3
de
Q
D
estaro no intervalo 88,84 e 103,50. Os restantes 31,7%
estaro fora desse intervalo.
Verifique o verdadeiro valor de Q
D
para P = $ 230 na Tabela 1.
Bloco ANOVA (Analysis of Variance)
A ANOVA utilizada para testar hipteses relativas mdias
populacionais. No contexto da anlise de regresso, ela mede o
quantum de variao o modelo apresenta. Sem entrar numa
discusso tcnica que aqui no cabe, basta o leitor entender que
o objetivo desta anlise rejeitar ou aceitar a regresso como um
bom modelo de previso. Isto pode ser feito das seguintes
maneiras:
i) Se dividirmos a mdia dos quadrados (MQ) da regresso
(38981,30926) pela mdia dos quadrados dos resduos
(87,09407398) obtemos o rcio F ou F observado (447,5771). Esta
uma medida da acurcia da regresso, porque mede a relao
entre o que explicado e o que deixou de ser explicado pela
regresso. Vejamos o que isto significa:



3
Pela Regra Emprica da Distribuio Normal.
75

Y


Y
i

(





0 X
i
X
O grfico acima mostra a diviso da variao de Y
i
em duas
componentes:
(

= variao total dos valores efetivos de Y em relao


sua mdia da amostra. chamada de soma dos quadrados totais
(SQT).
(

= variao dos valores estimados de Y em relao


sua mdia da amostra. chamada de soma dos quadrados devido
regresso ou explicada pela regresso, ou simplesmente soma
dos quadrados explicada (SQE).
(

)

= variao residual ou no explicada, tambm chamada
de soma dos resduos (SQR).
Assim: SQT = SQE + SQR
Dividindo ambos os lados da equao por SQT, obtemos:




76

Ento, r
2
definido como:


A tabela ANOVA dispe as vrias somas dos quadrados e seus gls
associados.
Definimos agora a razo F (ou F observado) como:





em que SMQ a soma da mdia dos quadrados.
Quanto mais alto for esse rcio, melhor o poder explanatrio da
regresso. Para sabermos o que significa alto, precisamos de uma
medida de comparao. Tal feito utilizando a funo estatstica
INV.F.CD do Excel, que a funo inversa da distribuio F.
Fixando um nvel de significncia (o) de 5% (j que trabalhamos
com um nvel de confiana de 95%) preenchemos a INV.F. CD
conforme mostrado na Figura 6:

Figura 6. Funo INV.F. CD do Excel.

77

Onde, no argumento Probabilidade, digitamos o nvel de
significncia desejado, no caso, 5% ou 0,05. No argumento
Graus_liberdade1, digitamos os graus de liberdade (gl) da
regresso, 1; e no argumento Graus_liberdade2, os graus de
liberdade dos resduos, 10. Este F encontrado (4,9646) chamado
de F crtico, e a regra de deciso a seguinte:
Se F observado > F crtico, conclumos com 95% de confiana
que a varivel explicativa preo (P) tem poder explanatrio.
Como 447,5771 > 4,9646, aceitamos a regresso como um bom
modelo entre Q
D
e P.
ii) Uma outra forma de concluirmos pela validade ou no da
regresso utilizarmos o F de significncia. Este F de significncia
o menor valor de significncia (tambm chamado de p-value),
isto , de probabilidade, qual rejeitamos o F observado. O F de
significncia obtido com a funo DIST. F. CD do Excel,
conforme Figura 7:

Figura7. Funo estatstica DIST. F. CD.
No argumento X, digitamos o valor do F observado, 447,5771. Os
demais argumentos so os mesmos da Figura 3. O resultado
1,23815E-09 (ou seja, nove zeros antes do primeiro dgito
78

significativo) coincide com o resultado obtido com a ferramenta
Regresso. A regra de deciso agora :
Se o F de significncia < o (nvel de significncia) aceitamos a
regresso.
Como 1,23815E-09 < 0,05, aceitamos a regresso como um bom
modelo.
Os blocos seguintes apresentam as informaes:
Os valores dos coeficientes linear e angular e seus respectivos
erros-padro.
As frmulas para obter os coeficientes angular e linear da reta de
regresso so as seguintes:
( )( )
( )


=
.
2
2
X X
Y Y X X
i
i i
|
e X Y
2 1
| |
. .
=
em que X e Y so, respectivamente, os valores mdios de X e
Y.
As frmulas dos erros-padro dos coeficientes so:

( )


=
|
.
|

\
|
.
.
2
2
X X
ep
i
o
|
e
( )
. .

=
|
.
|

\
|
o |
X X n
X
ep
i
i
2
1

em que n o nmero de observaes e
.
o o erro-padro da
estimativa, cuja frmula j apresentamos anteriormente.
Stat t (estatstica t de Student) so os t observados dos
coeficientes. Para obter os valores apresentados na Figura 5,
basta dividir os valores dos coeficientes pelos seus respectivos
erros-padro:
Stat t de
1
|
.
= 525, 3627597/ 15, 95104831 = 32, 93593932
79

Stat t de
2
|
.
= -1, 8747549/0, 088615682 = -21, 15601703
Esses valores so ento confrontados com um t crtico para
aceitarmos ou rejeitamos a hiptese de que so estimadores
consistentes.
Para encontrar os ts crticos podemos utilizar a funo INV.T. BC,
que a inversa da funo distribuio t de Student. Esta funo
est mostrada na Figura 8:

Figura 8. ts crticos com a funo INV.T.BC.
No argumento Probabilidade, digitamos o nvel de significncia o
= 0,05. No argumento Graus_liberdade digitamos 10 (que
corresponde a n-2, onde n o nmero de observaes). A
representao grfica dos ts crticos est mostrada na Figura 9:



AR
0,025 0,025
-2,2281 0 2,2281
Figura 9. Distribuio t de Student com os valores crticos.
Com base na Figura 9, a regra de deciso a seguinte:
80

Rejeite os |s se os seus t observados estiverem entre -2,2281 e
2,2281. No os rejeite se os t observados estiverem fora do
intervalo.
Como ambos os ts observados esto fora do intervalo,
conclumos que existe uma relao entre Q
D
e P. Isto quer dizer
que, em 95 de 100 casos, os ts observados estaro fora do
intervalo especificado.
Os p-values (valores p) que aparecem a seguir confirmam as
concluses acima. Os p-values so os menores valores de
probabilidade aos quais aceitamos a hiptese de que os |s so
no consistentes. Tais p-values podem ser obtidos com a funo
DISTT do Excel. Como os p-values so virtualmente zero, no
rejeitamos a hiptese de consistncia dos |s. Repare que o p-
value do coeficiente angular tem o mesmo valor do F de
significncia. Isto no coincidncia. Pode-se demonstrar
(embora no o faremos) que isso sempre ocorrer quando se
trata de regresso simples.
Nas duas colunas seguintes, so apresentados os limites
inferiores e superiores, ao nvel de confiana de 95%, do intervalo
em que devero estar contidos os verdadeiros coeficientes da
reta de regresso. As frmulas so as seguintes:
|
.
|

\
|

. .
1 2 / 1
* | |
o
ep t
= 525,362759 2,2281*15,95104831 =
= 489,821 s
.
1
|
s 560,904
e
|
.
|

\
|

. .
2 2 / 2
* | |
o
ep t
= -1,8747549 2,2281*0,088615682 =
= -2,0722 s
.
2
|
s -1,6773
81

No bloco Resultado Residual so dadas:
O nmero de observaes: 12
Os valores previstos de Q
D
com base na reta de regresso
Os resduos, isto , a diferena entre os valores observados e os
estimados pela reta de regresso para cada valor Q
D
Os resduos padronizados para cada P
E, no bloco Resultado de Probabilidade, so ordenados os
valores de Q
D
observados em funo de seu percentil, numa
escala de 5 a 95% (valores aproximados). Por exemplo, a
quantidade 100 ocupa o percentil 4,2, enquanto a quantidade
280, o percentil 95,8.
A questo da previso
Um dos principais objetivos da construo de um modelo de
regresso utiliz-lo para fazer previses. Porm, antes de faz-lo,
devemos checar o nvel de ajustamento do modelo:
Primeiro, devemos observar se os sinais dos coeficientes da
reta de regresso esto de acordo com o que poderamos esperar
de uma funo demanda. Vimos no exemplo, que o sinal do
coeficiente angular (
.
2
| ) negativo, o que implica uma relao
inversa entre Q
D
e P, o que est de acordo com a teoria do
consumidor.
Segundo, precisamos identificar se a relao entre Q
D
e P
estatisticamente significante. Vimos isso de 3 maneiras: o F
observado bem superior ao F crtico; o F de significncia muito
inferior ao o estabelecido de 5%, e os p-values das estatsticas t
de ambos os coeficientes so praticamente zero.
Terceiro, precisamos saber quo bem o modelo explica a
variao nas quantidades demandadas. Isso pode ser informado
pelo r
2
. Como vimos, o r
2
~ 0,98, bastante alto, considerando que
este coeficiente tem um valor mximo de 1.
82

Portanto, temos um bom modelo para trabalharmos. Entretanto,
resta ainda uma ltima anlise. Uma das hipteses do modelo de
regresso linear a de que os resduos
i
.
se distribuem
normalmente (isto , seguem uma distribuio normal). A
verificao desta hiptese importante porque os testes t e F
realizados anteriormente se baseiam nesta hiptese. Dentre os
inmeros testes existentes, consideraremos um dos mais
conhecidos, o teste Jarque-Bera (JB), que utiliza os resduos
i
.
e
a distribuio qui-quadrado (_
2
) com 2 graus de liberdade (gl).
A frmula de JB a seguinte:
( )
(


+ =
24
3
6
2
2
C A
n JB

onde n o nmero de observaes, A a assimetria e C a
curtose da srie
4
. Sob a hiptese nula (H
0
) de que os resduos se
distribuem normalmente, a estatstica JB segue a distribuio _
2

com 2 gl. A regra a seguinte:
Se o p-value da _
2
da srie for baixo, rejeitamos a hiptese nula
de que os resduos se distribuem normalmente.
Se o p-value da _
2
da srie for alto, no rejeitamos a hiptese
nula de que os resduos se distribuem normalmente.
Utilizando o pacote GRETL, obtemos para JB o valor de 0,184343.
O valor p para obter tal valor de _
2
, com 2 gl, de 0,911949, um
valor bastante alto. Portanto, no h evidncias para rejeitar H
0
.
Previses por Ponto e por Intervalo
Uma vez verificado o ajuste do modelo, as estimativas ou
previses podem dar-se por ponto ou por intervalo.


4
A distribuio normal tem assimetria zero e curtose 3. Na frmula de JB, (C-3) o excesso de curtose.
83

Estimativas por ponto
Numa estimativa por ponto simplesmente especificamos um
valor para a varivel independente e a inserimos na reta de
regresso para encontrar o valor correspondente da varivel
dependente. Por exemplo, suponha que queiramos estimar as
quantidades demandadas do produto para um preo de $ 185:
D
Q
.
= 525,362759 -1,8747549*185 ~ 178
Entretanto, como
D
Q
.
um estimador, provavelmente diferir do
verdadeiro valor Q
D
dado um preo de $ 185. Portanto, uma
estimativa mais til aquela por intervalo ou intervalar. Neste
caso, h dois tipos de estimativa intervalar:
Estimativa da mdia condicional
Neste tipo de previso, estamos interessados em estimar a mdia
da populao para todas as quantidades de Q
D
e no apenas
daquelas referentes s 12 observaes, quando P for fixado em
certo valor. Isto , estamos interessados nas quantidades mdias
demandadas em todos os meses em que o preo for de certo
valor.
Fixemos P
0
= $ 185. A seguir, especifiquemos um intervalo de
confiana: 95%, por exemplo. Assim, o intervalo de confiana (IC)
para a mdia condicional dado por:
IC
QD / P = 185
=
D
Q
.
t ep
QD
em que ep
QD
o erro padro da mdia condicional e dado pela
seguinte expresso:

84

( )
( )
n
P
P
P P
n
ep ep
D
Q
2
2
2
0
1
*

+ =

onde ep o erro padro da estimativa (j calculado e igual a
9,3324); n o nmero de observaes (12, no caso); P o preo
mdio (aproximadamente 177,42); 811 . 388
2
=

P e
( ) 641 . 532 . 4
2
=

P .
Portanto, com os dados acima, encontramos ep
QD
~ 2,777. Como
D
Q
.
= 178 para P
0
= 185, nosso intervalo de confiana :

IC
QD / P = 185
= 178 t2,777
Para um intervalo de confiana de 95% (o = 0,05) e n-2 = 10 graus
de liberdade, a tabela de estatsticas t
5
fornece um t = 2,228.
Assim:
IC
QD / P = 185
= 178 (2,228)*2,777 = 178 6,1872

ou
172 <
QD / P = 185
< 184

Assim, dado P
0
= $ 185, em amostragem repetida, 95 entre 100
verdadeiras demandadas.
Se construirmos intervalos como o acima para cada P possvel,
formaremos uma banda de confiana tal como a representada na
Figura 8:


5
Utilize a funo INVT do Excel.
85


Q
D
525 Figura 8. Intervalos de confiana para
Q
D
mdio.


184


172

D
Q
.
=525,3627-1,8747
P
0 42 , 177 =

P P=185
Repare que, na Figura 8, as bandas tornam-se mais largas nos
extremos. A razo disto que a anlise de regresso baseada
no conceito de mdias. Assim, quanto mais nos afastamos da
mdia 42 , 177 =

P menos acurada (ou precisa) tornam-se as


previses e, portanto, para manter o IC de 95%, o intervalo deve
ampliar-se.
Estimativa para um nico valor de Q
D
Uma estimativa diferente da anterior quando queremos prever
a verdadeira quantidade Q
D
para um dado valor P, sob a hiptese
de que este valor P s ocorrer uma nica vez.
Fixemos P
0
= $ 185. A seguir, especifiquemos um intervalo de
confiana: 95%, por exemplo. Assim, o intervalo de confiana (IC)
para a mdia condicional dado por:
IC
QD / P = 185
=
D
Q
.
t ep
QD i
86

em que ep
QD i
o erro padro da mdia condicional e dado pela
seguinte expresso:
( )
( )
n
P
P
P P
n
ep ep
i
Q
D
2
2
2
0
1
1 *

+ + =

Fazendo os clculos, encontramos ep
QDi
~ 9,7367. Como
D
Q
.
= 178
para P
0
= 185, nosso intervalo de confiana :
IC
QD i/ P = 185
= 178 t9, 7367.
Para um intervalo de confiana de 95% (o = 0,05) e n-2 = 10 graus
de liberdade, a tabela de estatsticas t fornece um t = 2,228.
Assim:
IC
QD / P = 185
= 178 (2,228)*9,7367 = 178 21,6934

ou
156 <
QDi / P = 185
< 200
Assim, dado P
0
= $ 185 em qualquer ms, 95 entre 100 intervalos
como o acima, incluiro a quantidade verdadeira demandada.
A Figura 9, a seguir, apresenta a banda para um nico valor de Q
D

comparada com a banda da Figura 8. Repare que o intervalo de
confiana para a previso de um nico valor de Q
D
maior do que
o anterior. Isso ocorre porque estamos lidando com valores
menos previsveis.




87


Q
D

525

200

184


D
Q
.
=525,3627-1,8747
172

156

0 42 , 177 =

P 185
Figura 9. Intervalos ou bandas de confiana para
D
Q
.
mdio e
i
D
Q
.
individual.
Duas ltimas importantes observaes devem ser feitas quanto
aos procedimentos estudados anteriormente sobre a anlise de
regresso:
Como observamos acima, devemos interpretar o coeficiente
linear da reta de regresso com cuidado. Embora o coeficiente
linear seja significante, no podemos afirmar que as
quantidades demandadas sero de 525,36 se o preo do
produto for zero, j que no inclumos zero em nossa amostra.
Portanto, melhor interpretar o coeficiente linear como o
efeito que, em mdia, as outras variveis que influenciam a
88

demanda, e que no esto consideradas no presente modelo,
exercem sobre as quantidades demandadas.
Um modelo de regresso, tal como o desenvolvido
anteriormente, no deve ser usado para prever valores da
varivel dependente a partir de valores da varivel
independente que estejam fora dos limites observados na
amostra. Os valores de P, conforme apresentados na Tabela 1,
variam de $ 130 a $ 230. Portanto, isolamos nossas
observaes sobre a relao entre Q
D
e P neste intervalo. No
temos idia do que acontece entre essas variveis fora do
intervalo $ 130-$230.
Algumas extenses do modelo de duas variveis

Regresso pela origem

H ocasies em que a reta de regresso (da populao) assume a seguinte
forma:
Y
i
= |
2
X
i
+
i
(Eq. 1)

Neste modelo, o coeficiente linear est ausente ou nulo, da o nome de
regresso pela origem. Vejamos o seguinte exemplo:
Na teoria das carteiras, a equao da reta caracterstica, a partir da reta de
regresso :


Onde:
R
j
= retorno proporcionado pela ao j em cada ano do horizonte de
tempo estudado.
R
F
= taxa de juros de um ttulo livre de risco.
R
M
= retorno da carteira de mercado (o ndice da carteira terica de uma
Bolsa de Valores).
R
j
- R
F
; R
M
R
F
= so, respectivamente, o retorno adicional da ao j e do
mercado em relao ao retorno do ttulo sem risco.
89

| = coeficiente angular da reta de regresso que identifica o risco
sistemtico da ao j em relao ao mercado.
o = coeficiente linear da reta caracterstica.

O parmetro o indica o retorno esperado em excesso do ativo na hiptese
do retorno em excesso da carteira de mercado ser nulo (RM RF =0).
Representa, assim, o prmio pelo risco oferecido pelo ativo. Em equilbrio
de mercado, a reta caracterstica passa pela origem (validando assim, o
CAPM- Capital Asset Pricing Model).
Como estimamos modelos do tipo da Eq.1 e quais problemas eles
apresentam? Primeiro, estimamos a reta caracterstica com base em
dados amostrais:
(Eq. 2)

Algumas caractersticas da Eq. 2 precisam ser destacadas:

, que sempre zero no modelo com o termo de intercepto


(modelo convencional) no precisa ser zero quando o termo estiver
ausente.
r
2
, o coeficiente de determinao, que nunca negativo no modelo
convencional, pode ocasionalmente ser negativo no modelo sem o
intercepto. Esse resultado anmalo decorre do fato de o r
2
no
modelo convencional supor, explicitamente, que o intercepto est
includo no modelo. Portanto, o r
2
calculado convencionalmente
pode no ser apropriado para modelos de regresso pela origem.
Para tais modelos, podemos calcular o chamado r
2
bruto, definido
como:



Este coeficiente chamado de bruto porque so somas de
quadrados e produtos cruzados no corrigidos pela mdia.
90

Embora esse r
2
bruto satisfaa a relao 0 < r
2
< 1, ele no pode ser
comparado diretamente ao r
2
convencional.

Por causa das caractersticas especiais desse modelo, preciso
tomar muito cuidado ao usar o modelo de regresso com intercepto
zero. A menos que haja uma expectativa a priori bastante forte,
aconselha-se utilizar o modelo convencional com o intercepto. Isto
tem dupla vantagem. Primeira, se o termo de intercepto estiver
includo no modelo, mas se revelar estatisticamente insignificante
(isto , estatisticamente igual a zero), temos, para todos os fins
prticos, uma regresso pela origem. Segunda e mais importante, se
de fato houver um intercepto no modelo, mas insistirmos em ajustar
uma regresso pela origem estaremos cometendo um erro de
especificao, violando uma das hipteses do Modelo Clssico de
Regresso Linear.

Veja exemplo no ficheiro Extenses do Modelo de Duas Variveis
em Excel.

Formas Funcionais

1. O Significado do termo Linear
1.1. Linearidade nas Variveis
O primeiro e talvez mais natural significado de linearidade a de
que Y uma funo linear de X, como por exemplo, a equao a seguir:



Geometricamente, a curva de regresso neste caso uma reta. Por esta
interpretao, uma regresso como no uma funo
linear, pois a varivel X aparece com potncia 2.

1.2. Linearidade nos Parmetros
A segunda interpretao de linearidade a de que Y uma funo
linear dos parmetros, os | s; isso pode ou no ser linear na varivel X.
91

Nesta interpretao, um modelo de regresso linear,
mas, digamos, no . Este ltimo um modelo de
regresso no linear nos parmetros.
Estudaremos agora, alguns modelos de regresso que podem ser no
lineares nas variveis, mas lineares nos parmetros:

O Modelo Log-Linear

Considere o seguinte modelo, conhecido como modelo de regresso
exponencial:


que pode ser expresso alternativamente como:



Se escrevermos como:


em que o = ln |
1
, este modelo linear nos parmetros o e |2, linear
nos logaritmos, e pode ser estimado por MQO. Por causa dessa
linearidade, tais modelos so chamados de log-log ou log-linear.

Se as hipteses do MCRLN so satisfeitas, os parmetros da equao
anterior podem ser estimados pelo MQO, fazendo com que:



em que Y
i
*
= ln Y
i
e X
i
*
= ln X
i
.

Uma caracterstica interessante do modelo log-log que |
2
mede a
elasticidade de Y em relao X. Por exemplo, se a relao entre a
92

quantidade demandada de um bem e o seu preo for como a mostrada
no Grfico 1:

Grfico 1 Grfico 2









a transformao em log-linear, como mostra o Grfico 2, fornecer a
estimativa da elasticidade-preo (- |2).

Duas caractersticas especiais do modelo log-linear podem ser
observadas:
O modelo supe que o coeficiente de elasticidade |
2
permanea
sempre constante, da o nome alternativo de modelo de elasticidade
constante. Ou seja, como mostra o Grfico 2, a variao em ln Y por
mudana unitria em ln X permanece a mesma, no importa com qual
ln X medimos a elasticidade.
Embora e

sejam estimadores no enviesados de o e |


2
, |
1

quando estimado como

(), ele prprio um estimador


enviesado. Na maioria dos problemas prticos, porm, o termo de
intercepto tem importncia secundria e no precisamos nos preocupar
em obter sua estimativa no enviesada.
No modelo de duas variveis, o meio mais simples de julgar se o modelo
log-linear se ajusta aos dados fazer um diagrama de disperso de ln Y
i

e ln X
i
e ver se os pontos formam aproximadamente uma reta, como no
Grfico 2.



QD
Preo Preo
QD
ln Y = ln|1 - |2 ln
Xi
93

O Modelo Log-Lin

Economistas, homens de negcios e governos esto frequentemente
interessados em saber a taxa de crescimento de certas variveis
econmicas, tais como populao, PNB, oferta monetria, emprego,
produtividade, dficit comercial, etc.
Anteriormente, apresentamos dados sobre o PNB real para os EUA no
perodo 1970-2011. Suponha que queiramos calcular a taxa de
crescimento do PNB real nesse perodo. Sejam Y
t
=PNB real no instante
t e Y
0
= valor inicial (isto , em 1970) do PNB real. Lembrando da
famosa frmula da capitalizao a juros compostos:

Y
t
= Y
0
(1 + r)
t


em que r a taxa composta (isto , ao longo do tempo) de crescimento
de Y, calculamos agora o logaritmo natural daquela equao:

lnY
t
= lnY
0
+ t ln(1 + r) (Eq.3)
Sejam agora
|
1
= lnY
0

|
2
= ln (1 + r)

Assim, reescrevendo a Eq. 3 e acrescentando o termo de perturbao,
obtemos:
lnY
t
= |
1
+ |
2
t + i (Eq.4)

Este modelo parecido com qualquer outro modelo de regresso linear,
j que os |s so lineares. A nica diferena que a varivel
dependente (ou regressando) o logaritmo natural de Y e a varivel
independente (ou regressor) o tempo, que assumir valores 1, 2, 3,
etc.

Modelos como a Eq.4 so chamados de semilog, porque uma varivel, o
regressando, aparece na forma logartmica. Para fins descritivos, um
94

modelo no qual o regressando logartmico ser chamado de modelo
log-lin.

No modelo da Eq. 4, o coeficiente |
2
mede a variao proporcional
(ou relativa) constante em Y para uma dada variao absoluta no valor
do regressor, o tempo t, ou seja:

(Eq. 5)

Se multiplicarmos a variao relativa em Y por 100, a Eq.5 fornecer
ento a variao percentual, ou taxa de crescimento, em Y para uma
variao absoluta em X, o regressor.

Um modelo log-lin como a Eq.5 particularmente til em situaes em
que a varivel X o tempo, j que nesse caso, o modelo descreve a taxa
de crescimento (se|
2
> 0) relativo constante, ou taxa de declnio (|2 < 0),
na varivel Y. Da o motivo de modelos como a Eq. 4 serem chamados
de modelos de crescimento (constante).
Utilizando o Excel ou o GRETL, obtemos as seguintes estatsticas para o
PNB real dos EUA no periodo 1970-2011:

0,029441t + 8,353435 (Eq. 6)


ep = (0,000441) (0,010892)
r
2
= 0,9911
t = (66,71372) (766,9492)
p-value = (0,0000) (0,0000)

A interpretao desta regresso a seguinte:

No perodo 1970-2011, o PNB real dos EUA aumentou a uma taxa de
2,944% ao ano. Como 8,3534 =

, se calcularmos o antilog de 8,3534,


veremos que o antilog 8,3534 = 4244,95 (aproximadamente), ou seja,
no incio de 1970, o PNB real estimado era de cerca de 4.245 bilhes de
dlares.
95

Taxa de crescimento instantneo versus composta. O coeficiente de
inclinao 0,0294 fornece a taxa de crescimento instantnea (em um
ponto do tempo), e no a taxa de crescimento composta (ao longo de
um perodo). Mas esta ltima pode ser calculada facilmente: basta
calcular o antilog de 0,02975, subtrair 1 e depois multiplicar por 100.
Assim, no presente caso:

[antilog (0,0294) 1]*100 ~ 2,99%.

ou seja, no perodo em anlise, a taxa composta de aumento do PNB
real foi de cerca de 2,99% ao ano.

O modelo de tendncia linear. Em vez de estimar o modelo da Eq. 4, os
econometristas estimam, s vezes, o seguinte modelo:

(Eq. 7)

Isto , em vez de regredir o ln de Y sobre o tempo, eles calculam a
regresso de Y sobre o tempo. Tal modelo chamado de tendncia
linear e a varivel tempo t conhecida como varivel de tendncia. Por
tendncia entende-se um movimento sustentado crescente ou
decrescente no comportamento de uma varivel. Se o coeficiente de
inclinao da Eq. 7 for positivo, h uma tendncia crescente em Y; se for
negativo, h uma tendncia decrescente em Y.

Para os nossos dados do PNB real, os resultados baseados na Eq. 7 so
os seguintes:

( )
ep = (5,5366) (136,650)
r
2
= 0,9793
t = (43,5462) (24,3494)
p-value = (0,0000) (0,0000)

Em contraste com a Eq. 6, a interpretao desta regresso :
96


No perodo 1970-2011, o PNB real aumentou, em mdia, taxa
absoluta (no relativa) de cerca de 241,098 bilhes de dlares. Assim,
nesse perodo, houve uma tendncia crescente no PNB real.
A escolha entre o modelo de crescimento da Eq. 6 e o modelo linear da
Eq. 8 depender de estarmos interessados na variao relativa ou
absoluta do PNB real. Outra coisa importante: no podemos comparar
os valores r
2
dos dois modelos, porque os regressandos so diferentes
nos dois modelos.
Uma advertncia sobre os modelos log-lin e de tendncia linear.
Embora estes modelos sejam utilizados com bastante frequncia para
estimar a variao relativa na varivel dependente ao longo do tempo,
seu uso rotineiro para este fim tem sido questionado por analistas de
sries temporais. O principal argumento deles que tais modelos
podem ser adequados somente se uma srie temporal for estacionria.
Grosso modo, uma srie temporal estacionria se o seu valor mdio e
sua varincia no se alterarem sistematicamente com o tempo.

O Modelo Lin-Log

Na folha 4 do ficheiro em Excel Extenses do Modelo de Duas Variveis,
temos os dados do PNB real e da oferta monetria (conceito M2) dos
EUA para o perodo 1972-2011. Suponha que voc esteja interessado
em verificar quanto o PNB aumentar (em valores absolutos) se a oferta
de moeda aumentar em, digamos, 1%.
Ao contrrio do modelo anterior que acabamos de ver, no qual
estvamos interessados em achar o aumento percentual de Y para uma
variao absoluta unitria de X, queremos agora encontrar a variao
absoluta de Y para uma variao de 1% em X.

Um modelo capaz de cumprir este papel pode ser escrito como:

Y
i
= |
1
+ |
2
ln X
i
+
i
(Eq. 9)

Este tipo de modelo chamado de lin-log. Como de hbito:
97



A segunda forma de expressar |
2
resulta do fato de que uma variao
no ln de um nmero uma variao relativa.
Assim:
(Eq. 10)

ou equivalentemente:
(Eq. 11)

Deste modo, se numa aplicao obtivermos |
2
= 500, a variao
absoluta em Y (0,01) *500, ou 5,0. Portanto, quando regresses como
a Eq. 9 forem estimadas por MQO, multiplique o valor do coeficiente
estimado

por 0,01 ou, o que d no mesmo, divida-o por 100.



Com base nos dados de PNB real e M2, obtemos os seguintes
resultados:



ep = (171,0518) (1381,278)

t = (23,36949) ( -16,9702)
p-value = (0,0000) (0,0000)

Interpretado conforme acabamos de descrever, o |
2
de
aproximadamente 3997 significa que, no perodo da amostra, um
aumento em M2 de 1% foi, em mdia, seguido por um aumento no PNB
de cerca de 39,97 bilhes de dlares.

Se voc quiser calcular o coeficiente de elasticidade para modelos log-
lin ou lin-log, pode faz-lo a partir da definio de coeficiente de
elasticidade dada anteriormente: (dY/dX)*(X/Y). Alis, quando a forma
funcional de um modelo conhecida, podemos calcular elasticidades
aplicando essa definio.
98

Relaes entre vrias variveis

Vimos como uma nica varivel independente pode ser usada para prever
o valor de uma varivel dependente. Entretanto, uma regresso simples
nos limita a uma nica varivel independente. Em inmeros casos temos
que utilizar mais de uma varivel independente para explicar o
comportamento de uma nica varivel dependente. Isto precisamente o
que a regresso mltipla nos permite. Regresso Mltipla envolve o uso
de duas ou mais variveis independentes. O modelo de regresso simples
foi expresso como:



O modelo de regresso mltipla :

(Eq. 12)

Onde k o nmero de variveis independentes e os |
i
so os coeficientes
das variveis. Em ambos os modelos,
i
o componente de erro aleatrio
uma vez que nem todas as observaes se ajustam linha de regresso.
Desta maneira, a regresso mltipla uma extenso lgica do modelo de
regresso simples.

Na planilha em Excel REGRESSES MLTIPLAS, Plan 1, certa companhia
de aviao desenvolveu um modelo de regresso simples para ajud-la a
prever o nmero de passageiros que poderia esperar com base nos gastos
com propaganda de modo a planejar suas operaes dirias. A regresso
era:



O coeficiente angular da regresso de 1,0813 informa que para cada
$1000 de aumento na propaganda o nmero de passageiros aumentar
em 1080 usurios. O coeficiente de determinao r
2
= 0,9377 mostra que
o modelo explica 94% das alteraes no nmero de passageiros.

Entretanto, a companhia sentiu necessidade de expandir seu modelo de
modo a identificar outras variveis que poderiam explicar tambm as
alteraes no nmero de passageiros. Foram consideradas variveis tais
como os preos de comboios e de autocarros, renda dos consumidores,
99

populao, etc. Para simplificar a discusso, vamos supor que a
companhia inicie adicionando somente uma varivel, a renda do
consumidor, que a companhia supe poder melhorar o poder
explanatrio da regresso. Seu modelo ento passa a ser:

(Eq. 13)

onde

Y o nmero de passageiros medido em 1000 unidades
X
1
so os gastos em propaganda medidos em $1000
X
2
a renda nacional medida em $ trilhes

A regresso amostral ento:

(Eq. 14)

Os coeficientes |s so interpretados da seguinte forma: o valor de |
1
o
montante em que Y variar para cada unidade de mudana em X
1
se X
2
permanecer constante. Para cada unidade de variao em X
2
, Y mudar
em |
2
unidades se X
1
permanecer constante.

O modelo de regresso mltipla possui as mesmas hipteses do modelo
de regresso simples, mais duas. A primeira hiptese requer que o
nmero de observaes, n, exceda o nmero de variveis independentes,
k, por pelo menos 2. Na regresso mltipla existem k + 1 parmetros a
serem estimados: os coeficientes para as k variveis independentes mais o
intercepto. Portanto, os graus de liberdade associados ao modelo so gl =
n (k + 1). Se retivermos mesmo 1 grau de liberdade, n deve exceder k por
pelo menos 2, de modo que n (k + 1) seja pelo menos 1.

A segunda hiptese envolve a relao entre as variveis independentes.
Essa relao requer que nenhuma das variveis independentes seja
linearmente relacionada com as demais. Por exemplo, se X
1
= X
2
+ X
3
, ou
X
1
= 0,5X
2
, ento uma relao linear existiria entre duas ou mais variveis
independentes e um problema srio surgiria. Este problema chamado de
multicolinearidade. A multicolinearidade pode fazer com que os sinais
algbricos dos coeficientes sejam o oposto daqueles que seriam ditados
pela lgica, enquanto ao mesmo tempo aumentaria em muito os erros
padro dos coeficientes.
100

Quando utilizamos um modelo de regresso simples, sua representao
grfica uma reta. No modelo de regresso mltipla, entretanto, isto no
mais possvel. Se trs variveis esto envolvidas (duas independentes e
uma dependente) um plano de regresso usado. A presena de mais de
trs variveis requer um hiperplano.

A figura abaixo mostra um plano de regresso:



Y


|
1
|
0



|
2
X
1


X
2

O modelo de regresso mltipla para a companhia area o seguinte:

(Eq. 15)

que lido da seguinte forma: Se a propaganda aumentada em 1 unidade
e a renda nacional permanece constante, o nmero de passageiros
aumenta em 0,84 unidades. Dado que ambas as variveis so expressas
em unidades de 1.000, isto significa que se a empresa despender mais
(menos) $1.000 em propaganda, assumindo-se que a renda no mude, o
nmero de passageiros aumentar (decrescer) em 840. Por outro lado, se
a renda nacional sobe (desce) em 1 unidade ($1 trilho) e a propaganda
fica constante, os passageiros aumentaro (decrescero) em 1,44
unidades, ou 1.440.

Avaliando o modelo como um todo

Dado o modelo da Eq. 15, a pergunta : Este modelo tem algum poder
explanatrio?. Isto pode ser respondido pela ANOVA. O procedimento
ANOVA testar se quaisquer das variveis independentes tm relao com
101

a varivel dependente. Se uma varivel independente no estiver
relacionada com a varivel Y, seu coeficiente deve ser estatisticamente
igual a zero. Isto , se X
i
no estiver relacionado com Y, ento |
i
= 0. A
ANOVA testa a hiptese nula de que todos os |s so zero contra a
alternativa de que pelo menos um | no zero. Assim:

H
0
: |
1
= |
2
= |
3
=...= |
k
= 0

H
1
: pelo menos um | no zero

Se H
0
no for rejeitado, ento no existe relao linear entre Y e quaisquer
das variveis independentes. Por outro lado, se H
0
for rejeitado, ento
pelo menos uma das variveis independentes estar linearmente
relacionada a Y.

A tabela ANOVA da ferramenta Regresso do Excel apresenta os seguintes
resultados da regresso:


Para determinar se o modelo tem algum poder explanatrio, testamos as
seguintes hipteses:

H
0
: |
1
= |
2
= 0

H
1
: pelo menos um | no zero

Dado que o F observado (ou razo F) 81,81585/0,675135 = 121,1843772,
os graus de liberdade necessrios para realizar um teste F so 2 (gl da
Regresso) e 12 (gl do Resduo). Testando essas hipteses a um nvel de
5%, podemos utilizar a funo estatstica INV.F.CD, encontrando 3,8853,
conforme mostrado abaixo:
102



A regra de deciso no rejeitar H
0
se o F observado < 3,8853. Isto
mostrado na figura abaixo:

f (F)








0,05
F
3,8853
121,18

Como, claramente, F observado = 121,18 > 3,885, rejeitamos a hiptese
nula de que |
1
= |
2
= 0. A companhia pode concluir com 95% de confiana
de que uma relao linear existe entre a varivel dependente Passageiros
e pelo menos uma das variveis independentes.

Testando os Coeficientes da Regresso

A companhia viu que pelo menos uma das variveis independentes tem
alguma relao com o nmero de passageiros. O passo lgico seguinte
103

testar cada coeficiente individualmente para determinar qual (ou quais)
(so) significante (s).

O procedimento usa a distribuio t, dado que n < 30, e testa a hiptese:


H
0
: |
i
= 0

H
1
: |
i
= 0

A estatstica t :



em que

o erro padro de |
i
.

O erro padro usado porque se outra amostra de n = 15 fosse tomada,
resultariam diferentes coeficientes devido ao erro amostral. Isto , os
coeficientes variariam porque observaes selecionadas aleatoriamente
na segunda amostra no seriam as mesmas retiradas na primeira amostra.

usado para capturar a variao.



Testando os coeficientes da Propaganda e da Renda Nacional



Conforme mostrado na tabela ANOVA acima.

Dado que estamos trabalhando com um o = 5% e que o nmero de graus
de liberdade para o teste n k -1 = 15 2 1 = 12, os valores crticos de
t, utilizando a funo INV.T.BC 2,17881, conforme mostrado abaixo:

104



um teste bicaudal porque o valor t pode ser significativamente grande
ou significativamente pequeno. Veja ento a figura abaixo:






NO REJEITE
2,5% 2,5%

-2,1788 0 2,1788 5,917

Regra de Deciso: No rejeite H
0
se -2,1788 < t < 2,1788. Rejeite H
0
se t < -
2,1788 ou t > 2,1788.

O valor do teste de 5,917 calculado da amostra est claramente na parte
superior da rejeio de H
0
. Assim, a empresa pode estar 95% confiante de
que a H
0
para |
1
= 0 deve ser rejeitada. A propaganda realmente serve
como um fator explanatrio para o nmero de passageiros.

Este mesmo teste para significncia tambm pode ser desenvolvido para
|
2
, o coeficiente da Renda Nacional. De acordo com a tabela ANOVA a
Renda Nacional (RN) tem um valor-p (o valor p o menor nvel de
significncia ao qual H
0
seria rejeitado) de 0,07392 ou 7,392%. Assim, RN
deve ser significante a qualquer o acima de 7,39%. Testando a o = 5% e o t
crtico sendo 2,1788, a regra de deciso :

105

Regra de Deciso: No rejeite H
0
se -2,1788 < t < 2,1788. Rejeite H
0
se t < -
2,1788 ou t > 2,1788.

O valor t para a Renda Nacional conforme a tabela ANOVA 1,9577, que
est na regio de no rejeitar H
0
. Assim, a hiptese de que |
2
= 0 no
rejeitada e conclui-se que ao nvel de 5% de significncia a Renda Nacional
no tem poder explanatrio.

Entretanto, se o teste realizado ao nvel de significncia de 10%,
obtemos uma concluso diferente, como vemos nas figuras abaixo:



o = 5%




NO REJEITE
2,5% 2,5%

-2,1788 0 1,9577 2,1788





o = 10%



NO REJEITE
5% 5%

-1,782 0 1,782

Onde o t crtico = 1,782 foi obtido com a funo estatstica INV.T. BC
com 10% de probabilidade (nvel de significncia) e graus de liberdade
igual a 12.

Assim, a regra de deciso com o = 10% :
106

Regra de Deciso: No rejeite H
0
se -1,782 < t < 1,782. Rejeite H
0
se t < -
1,782 ou t > 1,782.

Dado que t = 1,9577, a companhia rejeitar H
0
ao nvel de 10% de
significncia e concluir com 90% de confiana que a Renda Nacional tem
poder explanatrio, ou seja, tem uma relao linear com o nmero de
passageiros.

O teste mostrou que a RN prova-se significante ao nvel de 10% mas ao
nvel de 5% H
0
no pode ser rejeitado. Estes resultados correspondem a
um valor-p para a RN que mostra que a hiptese nula |
2
= 0 pode ser
rejeitada a qualquer nvel de significncia acima de 7,39% (veja a tabela
ANOVA na linha da Renda Nacional).

Isto demonstra a necessidade de se escolher o valor de o antes da
realizao do teste. Dado que diferentes valores para o resultam em
diferentes concluses, a tica e a imparcialidade profissional requerem
que o valor de o seja determinado na base das consequncias de erros do
Tipo I relativamente queles de um erro do Tipo II. Rejeitar a hiptese nula
quando ela verdadeira um erro do Tipo I. Aceitar a hiptese nula
quando ela falsa um erro do Tipo II.

Em suma, a companhia conclui que, com o = 5%, a propaganda mostra-se
uma varivel explanatria significativa para o nmero de passageiros,
enquanto a renda nacional no. Com o = 10%, ambas as variveis
mostram-se significativas.

O Coeficiente de Determinao Ajustado

Em regresso mltipla usamos o coeficiente de determinao ajustado
(CDA) preferencialmente ao coeficiente de determinao. Por qu?
Porque possvel que, por descuido ou m-f, insira-se no modelo
variveis independentes sem nenhum sentido ou relao lgica com o
problema em questo, simplesmente para inflar o r
2
. Por exemplo, a
companhia area poderia aumentar o r
2
de seu modelo adicionando,
como varivel independente, as toneladas de atum pescadas no Oceano
Pacfico no perodo da amostra. Ou o nmero de filhotes de jacars
nascidos na Amaznia no mesmo perodo. Obviamente que pesca e
jacars tm pouco ou nada a haver com o nmero de passageiros da
empresa. Embora, entretanto, at possa haver uma leve correlao
107

coincidente entre passageiros e atuns ou jacars, tanto positiva quanto
negativa, o fato que adicionando variveis explanatrias absurdas,
podemos ilegitimamente aumentar r
2
. por isso que prtica comum em
regresses e correlaes mltiplas usar-se o CDA, simbolizado por

. Esta
estatstica ajusta a medida do poder explanatrio da regresso pelo
nmero de graus de liberdade. A regresso perde 1 grau de liberdade para
cada varivel independente adicionada ao modelo porque cada varivel
requer o clculo de outro |
i
e o

penalizar a regresso por incorporar
uma varivel que no adiciona poder explanatrio suficiente. O valor de


decrescer. Em casos extremos, o CDA pode, na verdade, tornar-se
menor do que zero.

A frmula do CDA :

)


( )

No caso do nosso exemplo, o CDA conforme mostrado na tabela ANOVA
0,94496 enquanto o r = 0,95282.
A presena de Multicolinearidade
Este problema aparece quando uma das variveis independentes est
linearmente relacionada a uma ou mais das outras variveis
independentes. Tal situao viola uma das condies da regresso
mltipla. Especificamente, multicolinearidade ocorre se existe uma alta
correlao entre duas variveis independentes, X
i
e X
j
. Anteriormente,
discutimos o coeficiente de correlao r entre a varivel dependente e
uma nica varivel independente. Se este mesmo conceito aplicado a
duas variveis independentes, X
i
e X
j
, em regresso mltipla, podemos
calcular o coeficiente de correlao r
ij
. Se r
ij
for alto, multicolinearidade
existe.
Mas o que alto? Infelizmente, no h resposta para esta questo crtica.
No h um ponto de corte no qual a correlao julgada muito alta e a
multicolinearidade est presente. Multicolinearidade um problema de
grau. Em qualquer modelo, alguma multicolinearidade sempre existe
entre duas variveis independentes. Se a sua presena torna-se muito
pronunciada, o modelo adversamente afetado. O que considerado
108

muito alto largamente uma questo de julgamento pelo analista ou
pesquisador.
Os problemas da Multicolinearidade
Um dos mais graves problemas de multicolinearidade surge justamente da
nossa inabilidade para separar os efeitos individuais de cada varivel
independente sobre Y. Na presena de multicolinearidade, impossvel
destrinchar os efeitos de cada X
i
. Suponha que no seguinte modelo



X
1
e X
2
mostrem um alto grau de correlao. Neste caso, o coeficiente 10
de X
1
pode no representar o efeito real de X
1
sobre Y. Os coeficientes da
regresso tornam-se no confiveis e no podem servir como estimativas
das mudanas de Y dada uma alterao de uma unidade na varivel
independente.

Mais ainda, os erros-padro dos coeficientes tornam-se inflados. Se duas
ou mais amostras de mesmo tamanho forem retiradas da mesma
populao, uma grande variao nos coeficientes seria encontrada. No
modelo especificado acima, ao invs de 10 como o coeficiente de X
1
, uma
segunda amostra geraria um coeficiente de 15 ou 20. Se

varia dessa
maneira de uma amostra para outra, devemos questionar sua acurcia.

Multicolinearidade pode inclusive provocar inverso dos sinais dos
coeficientes, tornando-os opostos queles que seriam ditados pela lgica.
Por exemplo, se inclussemos preo como uma das variveis num modelo
de uma curva de demanda, poderamos ver que o seu coeficiente assumiu
um sinal positivo. Isto implica que na medida em que o preo sobe, os
consumidores compram mais. Isto uma violao bvia da lgica da
Teoria do Consumidor.

Detectando Multicolinearidade

Talvez o caminho mais direto de testar multicolinearidade produzir uma
matriz de correlao para todas as variveis do modelo, conforme
mostrado a seguir na Figura 10, para o exemplo da companhia de aviao:



109


Figura 10. Matriz de Correlao entre Passageiros, Propaganda e Renda Nacional.

A matriz da Figura 10 foi obtida com a ferramenta Correlao do Excel. O
valor de r
12
= 0,8698 entre Propaganda e Renda Nacional indica que estas
duas variveis esto bastante relacionadas. Embora no exista nenhum
valor predeterminado para r
ij
que sinalize multicolinearidade, um r
ij
=
0,8698 provavelmente alto o suficiente para indicar um problema
significativo.

Alguns dos problemas de adivinhao podem ser eliminados usando-se
um teste t para determinar se o nvel de correlao entre Propaganda e
Renda Nacional difere significativamente de zero. Dado a relao
diferente de zero entre Propaganda e Renda Nacional (r = 0,8698) na
amostra, queremos testar a hiptese de que a correlao entre
Propaganda e Renda Nacional zero ao nvel da populao. Assim:

H
0
:
12
=0

H
1
:
12
= 0

onde
12
o coeficiente de correlao da populao entre Propaganda e
Renda Nacional. Deste modo, o t
OBSERVADO
:

()





Este t
OBSERVADO
de 6,36 comparado com um t
CRTICO
, que pode ser obtido
com a funo estatstica do Excel INV.T. BC, conforme mostra a Figura 11:



110


Figura 11. Obtendo t
CRTICO
com INV.T. BC.

Onde no argumento Probabilidade digitamos 0,05, ou seja, o valor de o (o
nvel de significncia), uma vez que o intervalo de confiana de 95%. No
argumento Graus_liberdade digitamos 13, j que gl = n -2 = 15 -2 = 13.

Regra de Deciso: No rejeite H
0
se -2,16 < t
OBSERVADO
< 2,16. Rejeite se
t
OBSERVADO
< -2,16 ou t
OBSERVADO
> 2,16.

Dado que t
OBSERVADO
= 6,36 > t
CRTICO
= 2,16, a empresa pode rejeitar a
hiptese nula de que no existe correlao entre Propaganda (X
1
) e Renda
Nacional (X
2
). Alguma multicolinearidade existe. Isto no significa que o
modelo est irremediavelmente perdido. De fato, muitos poucos modelos
esto totalmente livres de multicolinearidade. Como lidar com isso o
que veremos mais adiante.

Outra maneira de detectar multicolinearidade comparar os coeficientes
de determinao entre a varivel dependente (Passageiros, no caso) e
cada uma das variveis independentes. Se regredirmos Passageiros
apenas com Propaganda, encontramos um r
2
= 0,9378, enquanto entre
Passageiros e Renda Nacional temos que r
2
= 0,8152. Entretanto, juntas,
as duas variveis independentes revelam um R
2
de apenas 0,953. Se
tomadas separadamente, as duas variveis independentes explicam
93,78% e 81,52% das mudanas em Y (Passageiros). Mas combinadas
explicam 95,3%. Aparentemente existe uma sobreposio nos seus
poderes explanatrios. Incluir a Renda Nacional adiciona pouco ao poder
explanatrio da regresso. Muito da informao sobre passageiros j
fornecida pela propaganda est sendo meramente duplicada pela incluso
111

da Renda Nacional. Isto uma indicao de que a multicolinearidade deve
estar presente.

Uma terceira maneira de detectar multicolinearidade usar o chamado
Fator de Inflao de Variao (FIV). O FIV associado com qualquer varivel
X encontrado regressando esta varivel X com todas as outras variveis
X do modelo. O R
2
resultante ento usado para calcular o FIV dessa
varivel X. O FIV para qualquer varivel X
i
representa a influncia daquela
varivel na multicolinearidade. Logo:

O FIV para qualquer varivel independente uma medida do grau de
multicolinearidade contribudo por aquela varivel.

Dado que em nosso modelo existem somente duas variveis
independentes, e regressando X
1
(Propaganda) contra X
2
(Renda Nacional)
ou X
2
contra X
1
fornece o mesmo coeficiente de correlao (r
12
= 0,8698.
Veja Figura 10), o FIV para qualquer varivel independente X
i
:

(



Onde

o coeficiente de determinao obtido regressando X


i
sobre
todas as outras variveis independentes. Como j observado, a
multicolinearidade produz um incremento na variao, ou erro-padro, do
coeficiente de regresso. O FIV mede o aumento na variao do
coeficiente da regresso sobre aquele que ocorreria se a
multicolinearidade no estivesse presente.

Para o modelo em questo o FIV :

(

()



O mesmo FIV para X
2
seria encontrado dado que h somente duas
variveis independentes. Se uma varivel independente totalmente no
relacionada com qualquer outra varivel independente, seu FIV igual a 1.
A variao em |
1
e |
2
, portanto, quatro vezes o que deveria ser caso no
houvesse multicolinearidade no modelo. Entretanto, em geral,
multicolinearidade no considerado um problema significativo a menos
112

que o FIV de um nico X
i
mea pelo menos 10, ou a soma dos FIVs para
todos os X
i
seja pelo menos 10.

Outras indicaes de multicolinearidade incluem grandes alteraes nos
coeficientes ou seus sinais quando existe uma pequena mudana no
nmero de observaes. Mais ainda, se a razo F significante e os
valores t no, multicolinearidade pode estar presente. Se a adio ou
excluso de uma varivel produz grandes alteraes nos coeficientes ou
seus sinais, multicolinearidade pode tambm estar presente.

Tratando a Multicolinearidade

O que pode ser feito para eliminar ou mitigar a influncia da
multicolinearidade? Talvez a soluo mais lgica seja eliminar a varivel
que est a mais. Se X
1
e X
2
tm relao muito prxima, uma delas pode
ser simplesmente excluda do modelo. Afinal, devido sobreposio, a
incluso da segunda varivel adiciona muito pouco explicao do
comportamento de Y.

Em referncia ao modelo que estamos exemplificando, a companhia area
deveria retirar a Renda Nacional dado que a correlao com Y menor do
que com a Propaganda. Os testes ts realizados acima tambm sugerem
que a Renda no significante a um o = 5%.

Entretanto, simplesmente retirar uma das variveis pode levar a um vis
de especificao, no qual a forma do modelo est em desacordo com seus
fundamentos tericos. Multicolinearidade pode ser evitada, por exemplo,
se a renda for eliminada de uma expresso funcional para a demanda do
consumidor. Entretanto, a teoria econmica, assim como o senso comum,
diz-nos que a renda deveria ser includa em qualquer tentativa de explicar
o consumo.

Se retirar uma varivel levar a um vis de especificao, ns podemos com
frequncia reduzir a multicolinearidade mudando a forma da varivel.
Talvez dividindo os valores originais da varivel a mais pela populao
de forma a obter dados per capita prove-se benfico. Isto poderia ter sido
feito com a Renda Nacional. Adicionalmente, dividindo certas medidas
monetrias por um ndice de preos (tal como o IPC) e assim obtendo uma
medida em termos reais tambm um mtodo efetivo de eliminar a
multicolinearidade.
113

tambm possvel combinar duas ou mais variveis. Isto poderia ser feito
com um modelo para a demanda do consumidor, no qual X
1
= homens, X
2

= mulheres, e X
3
= populao total. As variveis X
1
e X
2
podem ser
adicionadas para formar X
3
. O modelo ento consistiria de uma nica
varivel explanatria.

Variveis Dummy e Anlise Residual

Em muitas pesquisas podemos encontrar variveis que so teis para
explicar o valor de uma varivel dependente. Por exemplo, anos de
educao, treinamento e experincia podem ser importantes na
determinao do nvel de renda de uma pessoa. Estas variveis podem ser
facilmente medidas numericamente e prontamente utilizadas para anlise
estatstica.

Entretanto, este no o caso de muitas outras variveis que tambm so
teis na explicao de nveis de renda. Estudos tm mostrado que o sexo e
a localizao geogrfica tambm carregam poder explanatrio
considervel. Uma mulher com o mesmo nmero de anos de educao e
treinamento de um homem no tem, em geral, o mesmo rendimento. Um
trabalhador no Bi pode no ganhar o mesmo que um trabalhador em
Luanda fazendo o mesmo servio. Ambos, sexo e geografia, podem provar
serem altamente teis como variveis explanatrias no esforo de prever
o rendimento de algum. Porm, nenhuma destas variveis pode ser
expressa numericamente e, portanto, serem imediatamente includas
num modelo de regresso. Assim, temos que modificar a forma dessas
variveis no numricas para inclu-las num modelo economtrico e,
dessa forma, ganhar o poder explanatrio adicional que possam oferecer.

Variveis que no so expressas numa forma quantitativa direta so
chamadas de variveis qualitativas ou variveis Dummy. Como outra
ilustrao, as vendas de uma firma podem depender da estao do ano.
Roupas de praia provavelmente vendero melhor no Vero do que no
Inverno, enquanto dar-se-ia o contrrio com guarda-chuvas e casacos.
Este fator sazonal s pode ser capturado levando-se em conta a estao
do ano, uma varivel que no pode ser medida numericamente. Se uma
pessoa casada, solteira ou divorciada pode afetar suas despesas para
propsitos recreacionais, enquanto o lugar de residncia (urbana,
suburbana, ou rural) provavelmente afetar suas despesas com
pagamento de impostos territoriais. Em todos estes casos, as variveis que
114

queremos medir no podem ser prontamente expressas numericamente.
Devemos ento, usar variveis Dummy para obter uma descrio mais
completa do impacto dessas variveis no numricas.

Na planilha 3 do ficheiro em Excel Regresses Mltiplas temos o seguinte
exemplo: Uma cadeia de lojas de departamentos deseja estudar a relao
entre despesas mdias de seus consumidores e aqueles variveis que
sentem, podem explicar o nvel dessas despesas. Em adio escolha
lgica da renda como uma varivel explanatria, os diretores sentem que
o sexo dos clientes tambm desempenha sua parte na explicao das
despesas. A Direo da rede coleta ento, 15 observaes (meses) para
trs variveis: despesas (em $), renda (em $), e sexo.

Mas como inclumos os dados sobre sexo no modelo? No se pode
simplesmente especificar M ou F para masculino e feminino porque estas
letras no podem ser manipuladas matematicamente. A soluo
encontrada atribuir valores 0 e 1 para cada observao baseada no sexo.
Assim, podemos por 0 se a especificao for para masculino e 1 se a
observao for feminino. Ou o inverso igualmente possvel (isto , 0 para
feminino e 1 para masculino).

A regresso obtida :



(0,000) (0,010)

os valores-p esto nos parnteses.

O uso de uma varivel Dummy para sexo produzir, na verdade, duas
linhas de regresso: uma para sexo masculino e outra para sexo feminino.
Estas linhas tm a mesma inclinao, mas diferentes interceptos. Em
outras palavras, a equao d duas linhas de regresso paralelas que se
iniciam em pontos diferentes no eixo vertical. Dado que 0 para
masculino, a equao torna-se:

()

para masculino. Veja a Figura 12:

115

Despesas

41,05



35,94




17,32

12,21


30 Renda

Figura 12. Duas linhas de regresso para consumidores.

Para mulheres, com o valor atribudo 1, a regresso :

()

Esta segunda regresso tem a mesma inclinao que a regresso
masculina, mas tem um intercepto de 17,32. Dado que S = 1 para
mulheres, o intercepto determinado como 12,21 + 5,11 = 17,32.

Isto significa que para qualquer nvel dado de renda, as consumidoras
dispendero $5,11 a mais, em mdia, do que os homens. Suponha uma
renda R = 30 ($ 30.000). Assim, para mulheres:

()
e para homens:

()


A diferena de $5,11 ocorre porque o valor do cdigo 0 para homens
cancela a varivel Sexo, com coeficiente 5,11, enquanto o cdigo 1 para
mulheres resulta na adio de 5,11 na regresso.

O valor-p de 0,010 diz-nos que o coeficiente de 5,11 para o Sexo
significante ao nvel de 1%. Entretanto, se o valor-p no fosse dado,
116

deveramos testar a hiptese de que ele difere significantemente de zero.
Isto :

H
0:
|
2
= 0

H
1
: |
2
= 0

Utilizando a funo estatstica INV.T. BC, para um o = 5% e gl = 12, temos
um t crtico ~ 2,179.

Regra de Deciso: no rejeite H
0
se -2,179 < t < 2,179. Rejeite se t < -2,179
ou t > 2,179.

O valor-p de 3,05 resulta numa rejeio de H
0
. Conclui-se ao nvel de
confiana de 95% que existe uma diferena significativa entre despesas
entre homens e mulheres.

Anlise Residual

Uma boa regresso exibe erros aleatrios que so normalmente
distribudos com mdia zero (0) e varincia constante o
2
. Se um exame
desses resduos revelar condies contrrias, isto pode sugerir que
existem problemas inerentes ao modelo. A deteco de qualquer padro
de correlao nos termos de erro pode significar que algumas das
assunes bsicas do modelo podem estar sendo violadas. Vejamos:

Autocorrelao

Uma das propriedades bsicas do modelo de regresso que os erros so
no correlacionados. O erro numa previso de que o modelo sofre num
ponto no tempo no est linearmente relacionado ao erro que o modelo
sofre em outro ponto no tempo. Idealmente, os erros deveriam aparecer
como mostrado na Figura 13:







117


+ e



0 tempo


- e

Figura 13. Ausncia de autocorrelao.

Na Figura 13 no h nenhum padro detectvel nos erros. Os termos de
erro parecem ser independentes no oferecem indicao de qualquer
relao entre eles.

A Figura 14 ilustra um padro tpico de autocorrelao. H um padro
distinto nos erros. Erros negativos sucessivos iniciam o padro, seguidos
de erros positivos e assim sucessivamente (na prtica, entretanto, no
podemos esperar padres to bvios).


+ e



0 tempo


- e

Figura 14. Presena de autocorrelao.

Na presena de autocorrelao, todas as hipteses e intervalos de
confiana so menos confiveis.

Como dito acima, detectar visualmente um padro de autocorrelao nem
sempre fcil. Precisamos de um mtodo mais confivel, e encontramos
um baseado na estatstica d de Durbin-Watson. A estatstica d de DW
usada para testar a hiptese de no autocorrelao:


118


H
0
:
et, et-1
= 0 Sem autocorrelao
H
1
:
et, et-1
= 0 Autocorrelao presente


e calculada como:


(

( )


A ferramenta Regresso do Excel nos d os seguintes resultados para os
erros (ou resduos):



Obtemos agora os resduos ao quadrado, (e
t
)
2
, a diferena (e
t
e
t-1
) e o
quadrado dessas diferenas, (e
t
e
t-1
)
2
:

119


A estatstica d d sempre um valor entre zero (0) e quatro (4), isto :

0s ds4

Como regra geral, se d est prximo de 2, assume-se que a autocorrelao
no um problema. Entretanto, aconselhvel determinar se o valor
encontrado para d usando a frmula 17 significante testando a hiptese
de que o coeficiente de correlao = 0. Ento:



Os valores crticos com os quais compararemos d = 2,18 so encontrados
usando-se dois valores: o nmero de variveis independentes, k, e o
nmero de observaes, n. No nosso exemplo, k = 2 (renda e sexo) e n =
15. Se o = 0,05, uma tabela de estatsticas de Durbin-Watson (o Excel no
possui uma tabela de estatsticas de DW. Voc pode usar o GRETL ou um
livro de Estatstica) nos d limite inferior (d
L
) = 0,95 e limite superior (d
U
) =
1,54. Uma escala simples pode ser construda agora, com o na Figura 15:








120


O teste O teste
+AC inconclusivo Sem AC inconclusivo -AC

d
L
d
U
2 4-d
U
4-d
L
0,95 1,54 2,46 3,05

Figura 15. Estatstica de Durbin-Watson.

Se d
U
< d < 4 d
U
, no h evidencia the autocorrelao e H
0
no
rejeitada.; d < d
L
evidencia AC positiva; d > 4 d
L
indica AC negativa. As
duas regies inconclusivas aparecem porque a distribuio de d depende
das caractersticas dos inter-relacionamentos entre as variveis
independentes.

Calculamos d = 2,18. Portanto, H
0
no deve ser rejeitada. Parece que a
correlao entre os erros no um problema.

Como vimos os clculos so bem tediosos. Eles podem ser simplificados
estimando o valo de d como:

d = 2(1-r) (Equao 18)

onde r o coeficiente de correlao entre e
t
e e
t-1
.

Heteroscedasticidade

Em adio a qualquer ausncia de correlao nos erros, outra propriedade
bsica dos modelos de regresso a homoscedasticidade.
Homoscedasticidade significa variao constante nos erros. A variao nos
erros experimentada quando X igual a algum valor, digamos 10, a
mesma quando X igual a qualquer outro valor. Na Figura 16 (a), como
mostrada pelas duas curvas normais, a distribuio dos valores de Y
i
acima
e abaixo da linha de regresso a mesma para X = 10 como para X = 11.
Assim, os erros que so representados pela diferena entre estes valores
de Y
i
e a linha de regresso so normalmente distribudos. Isto indica a
presena de homoscedasticidade.





121


Y








10 11 X

Figura 16 (a). Distribuio de erros. Homoscedasticidade.

Se a varincia nos erros no a mesma para todos os valores de X, a
heteroscedasticidade ocorre. A Figura 16 (b) mostra que medida que X
cresce, a varincia nos termos de erro torna-se mais pronunciada. A curva
normal em X = 11 mais aberta do que a curva em X = 10, indicando
grande disperso nos erros.


Y








10 11 X

Figura 16 (b). Distribuio de erros. Heteroscedasticidade.


A heteroscedasticidade comum em dados do tipo cross-section. Dados
cross-section so dados de uma ou mais variveis coletados no mesmo
ponto do tempo. Dados cross-section so usados, por exemplo, em
investigaes sobre despesas de consumidores. Em tais estudos, os dados
so tipicamente coletados para consumo e renda atravs de nveis de
renda que englobam pobres, ricos e aqueles entre estes dois extremos.
122

Isto constitui-se num conjunto de dados cross-section porque tais dados
cortam por entre diferentes grupos de renda. Como se poderia esperar, os
ricos apresentam um modelo comportamental com respeito ao seu
padro de consumo diferente do resto. Esta diferena causa a variao
nos termos de erro que evidencia heteroscedasticidade.

Na presena de heteroscedasticidade os coeficientes da regresso
tornam-se menos eficientes. Isto , h um aumento na varincia dos
valores |s. O valor | obtido com uma amostra difere daquele obtido com
uma amostra diferente. Em tal caso, difcil por muita f nos coeficientes
da regresso.

A heteroscedasticidade pode ser frequentemente detectada plotando os
valores de

contra os erros. Se qualquer padro apresentado, a


heteroscedasticidade provavelmente estar presente. A Figura 17 (a) e 17
(b) revela possveis padres frequentemente encontrados na presena de
heteroscedasticidade. A Figura 17 (c), entretanto, no sugere qualquer
padro detectvel; a heteroscedasticidade parece estar ausente.


+e

0



-e


Figura 17 (a)

+e

0



-e


Figura 17 (b)



123


+e

0



-e


Figura 17 (c)

Entretanto, no devemos confiar apenas na observao dos padres dos
resduos para identificar a presena ou no de heteroscedasticidade.
muito mais til (e cientfico) adotar um mtodo mais confivel de anlise,
tal como o Teste de White, desenvolvido em 1980 por Halbert White. Tal
mtodo envolve quatro passos bem definidos:

1. Rode a regresso original e obtenha os termos de erro para cada
observao;
2. Eleve ao quadrado os termos de erro para obter e
2
e regresse-os
sobre todas as variveis independentes, sobre os quadrados de
todas as variveis independentes, e sobre os produtos cruzados de
todas as variveis independentes. Se existirem trs variveis
independentes X
1
, X
2
e X
3
, devemos regredir e
2
sobre X
1
, X
2
, X
3
, X
1
2
,
X
2
2
, X
3
2
, X
1
X
2
, X
1
, X
3
e X
2
X
3
. Este modelo de regresso chamado de
modelo auxiliar;
3. Compute nR
2
, onde n o nmero de observaes e R
2
o
coeficiente de determinao (no ajustado) da equao auxiliar;
4. Se nR
2
> _
2
o, k
(distribuio Qui-Quadrado), rejeite a hiptese nula
de que as varincias dos erros so iguais e assuma que a
heteroscedasticidade existe.

Certas precaues devem ser observadas no desenvolvimento do Passo 2.
Principalmente para nossos propsitos o perigo envolvido se variveis
dummies so usadas no modelo. Se X
i
uma varivel Dummy, ento X
i
2

no deve ser includa na equao auxiliar porque X
i
igual a X
i
2
e
multicolinearidade perfeita existe. Em adio, o produto cruzado de duas
variveis Dummy tambm excludo, dado que igual a zero.

Podemos utilizar o exemplo da Plan 3 do ficheiro Regresses Mltiplas
para testar a existncia ou no de heteroscedasticidade. Note que X
2
2

excludo dado que X
2
uma varivel Dummy.
124

1. Rodando a regresso original e obtendo os termos de erro e os
termos de erro ao quadrado:




2. Rodamos e
2
sobre X
1
(renda), X
2
(sexo), X
1
2
e X
1
*X
2
:

125



A equao auxiliar ento:

e
2
= -51,7966 + 4,8789X
1
36,9278X
2
- 0,081256X
1
2
+ 0,6794X
1
X
2

3. Calculando nR
2
:

n = 15

R
2
= 0,2151

Logo, nR
2
= 15*0,2151 = 3,227

4. Utilizamos agora a funo estatstica INV.QUIQUA. CD, com
probabilidade (o) = 0,05 e graus de liberdade = 4. O resultado
9,4877.

Como nR
2
< _
2
0,05, 4
, isto , 3,227 < 9,4877, no rejeitamos a hiptese
nula de que os termos de erro tm varincias iguais, e conclumos
que a heteroscedasticidade no existe.





126

CAPTULO 3
SIMULAES
No contexto das cincias e tecnologias, simular recriar comportamentos
de um sistema ou processo o sistema simulado atravs de um sistema
computadorizado o simulador numa forma adequada para estudo e
interao (exemplos: simuladores de vo, pacientes virtuais para estudo
de medicina).
Todo o contexto empresarial influenciado por vrias foras (competio,
tendncias de consumo, polticas econmicas, entre outras), o que torna o
processo de tomada de deciso bastante complexo. Numa organizao, a
implementao de processos de melhoria sem um entendimento total do
impacto que as alteraes iro causar, pode ter consequncias
imprevisveis. Da a importncia do uso de ferramentas, como a Simulao
Empresarial, que auxiliam os gestores a compreenderem os seus
processos de negcio e como que as mudanas nesses processos se vo
refletir em toda a organizao.
A simulao um processo de projetar um modelo computacional de um
sistema real e realizar experincias com este modelo com o propsito de
entender seu comportamento e/ou avaliar estratgias para sua operao
Pegden (1990). A vantagem essencial das simulaes e de outros
ambientes de aprendizagem sintticos baseia-se na capacidade de
aumentar, substituir, criar e/ou gerir a vivncia que o indivduo tem com o
mundo que o rodeia, ao providenciar contedo realstico e instrumentos
educacionais (Cannon-Bowers e Bowers).
Nesta parte de nosso estudo, trataremos de alguns mtodos de Simulao
utilizando o Excel.
- SIMULAO COM O COMANDO ATINGIR META DO EXCEL
No ficheiro em Excel Comando Atingir Meta apresentamos exemplos de
utilizao deste comando.

127

SIMULAO COM A FERRAMENTA SOLVER DO EXCEL
No ficheiro em Excel SOLVER PROGRAMAO MATEMTICA,
apresentamos exemplos de utilizao desta ferramenta.
SIMULAO COM O COMANDO TABELA DE DADOS DO EXCEL
No ficheiro em Excel SOLVER PROGRAMAO MATEMTICA,
apresentamos um exemplo de utilizao deste comando.

CAPTULO 4
SRIES TEMPORAIS
Define-se srie temporal como um conjunto de observaes ordenadas no
tempo e que apresentam dependncia serial (isto , dependncia entre
instantes de tempo). Uma notao usada para denotar uma srie
temporal (dentre outras) Z
1
, Z
2
, Z
3
,..., Z
T
, que indica uma srie de
tamanho T. O instante T geralmente indica o ltimo instante disponvel.

De uma maneira um pouco mais formal dizemos que uma srie temporal
uma realizao de um processo estocstico.

Em geral, ao estudarmos uma srie temporal, estaremos interessados em
dois aspectos:

a) Anlise e Modelagem da Srie. Descrever a srie, verificar suas
caractersticas mais relevantes e suas possveis relaes com outras
sries;
b) Previso. A partir de valores passados da srie (e talvez de outras
sries tambm), encontrar boas previses (de curto prazo) de
valores futuros da srie. A previso da srie no instante T+K ser
denotada por

. O nmero de instantes frente para o qual


feita a previso (neste caso, K) chamado horizonte de previso.

A dependncia serial entre os valores da srie um aspecto essencial, pois
nos permite gerar previses de valores futuros da srie. Essas previses
seriam puro chute se no houvesse dependncia serial. Tambm,
diferentes sries possuem diferentes graus de previsibilidade; por
exemplo, frequentemente mais fcil prever uma srie de temperaturas
128

mdias mensais do que a taxa mensal de inflao. Logo, no se pode
garantir que a previso encontrada por este ou aquele mtodo ser
sempre boa, tudo depende das caractersticas da srie que est sendo
estudada! No entanto, um aspecto deve ser levado em conta ao fazermos
previses de sries temporais: o nvel de incerteza aumenta com o
horizonte de previso quanto mais longe futuro, maior a incerteza
associada previso. Isto intuitivamente razovel, pois sempre mais
difcil prever o futuro distante, e a nossa previso estar cercada de
incertezas.

Uma medida do acerto das nossas previses o erro de previso k-
passos frente, definido como:

O erro de previso k passos frente no instante k (onde k um inteiro
maior ou igual a 1) definido como a diferena entre o valor real da srie
no instante t e a previso feita k instantes antes, isto :

()

()

Um caso particular importante o erro de previso um passo frente,
dado por:

()

()

Um bom modelo de previso produz previses com erro pequeno, e assim
interessante acompanhar quantidades como a soma do quadrado dos
erros de previso, ou a soma dos valores absolutos dos erros de previso.

O que queremos ao modelar uma srie temporal?

- Capturar toda a estrutura de dependncia existente na srie;
- Logo, nos resduos no deve sobrar estrutura, pois ela j foi
capturada pelo modelo. Nota: o resduo apenas a diferena entre
o valor real e o ajustado por um modelo qualquer.
- Em particular, se o modelo bom, os resduos no devem
apresentar correlao serial (isto , correlao entre os resduos em
diferentes instantes de tempo);
- Explicar o comportamento da srie com o menor nmero de
parmetros.

129

Por onde comear

Em geral, a primeira coisa que fazemos ao estudar srie temporal
construir um grfico para mostrar a sua evoluo ao longo do tempo. Este
procedimento simples costuma ser bastante esclarecedor, e nos permite
identificar como evolui a tendncia da srie, se existe ou no sazonalidade,
se ocorrem observaes aberrantes, etc.

Podemos fazer uma distino bsica entre duas grandes classes de modelos:

- Modelos Univariados. A srie temporal explicada (prevista) apenas
pelos seus valores passados;
- Modelos Multivariados ou Causais. A srie temporal explicada
(prevista) pelos seus valores passados e tambm pelos valores
passados de outras variveis.

Neste texto consideraremos apenas modelos univariados

Alguns modelos univariados

1) Ingnuo (naive)

A previso de Z
T+1
(valor da srie no instante T+1) apenas a ltima
observao. claro que no preciso um software para ajustar isso e,
em alguns casos, o nico mtodo disponvel. Um exemplo
clssico a previso do preo de uma ao geralmente a melhor
previso para o preo de amanh o preo de hoje, o que
certamente frustrante.

2) Mdias Mveis de tamanho n

A cada instante, a previso apenas a mdia das ltimas n
observaes. Um dos problemas com este mtodo a escolha de n, o
tamanho da janela a ser utilizado. Quanto maior o valor de n, mais
suave a previso. Ao contrrio, se n pequeno, a previso tende
a ser meio nervosa, isto , oscila muito. Uma caracterstica
importante do mtodo de mdias mveis : todas as observaes
utilizadas para o clculo tm o mesmo peso 1/n. Mas, na prtica,
razovel supor que as observaes mais recentes sejam mais
relevantes para a previso dos prximos valores da srie e, portanto,
130

deveriam receber um peso maior do que as observaes mais antigas.
Esta idia de ponderar as observaes de acordo com as suas idades
leva aos diversos mtodos de amortecimento exponencial.

3) Amortecimento Exponencial (Exponential Smoothing)

Existem inmeras variaes destes mtodos para sries sazonais e
no sazonais. A idia geral parecida com a do mtodo das mdias
mveis, mas os pesos das observaes decrescem medida que as
observaes esto mais longe no passado. A taxa de decrscimo dos
pesos determinada por uma ou mais constantes de amortecimento.
A maior dificuldade na aplicao escolher a(s) constante(s) de
amortecimento, mas alguns softwares j ajustam os modelos de
amortecimento automaticamente com constantes de amortecimento
otimizadas.

Na prtica, os mtodos de amortecimento so os mtodos mais
usados no dia a dia das empresas, o que em parte explicado pela
sua facilidade de implementao e capacidade de gerar boas
previses.


4) Modelos ARIMA de Box e Jenkins

So modelos mais sofisticados, que usam as correlaes entre as
observaes em diversos instantes. A idia por trs dos modelos
ARIMA envolve filtros lineares e algum conhecimento de Teoria dos
Sistemas til. A identificao da estrutura do modelo um pouco
complicada, mas alguns softwares j identificam automaticamente a
estrutura do modelo ARIMA, evitando o passo mais complicado da
anlise. Como casos particulares dos modelos ARIMA temos os
processos AR (Autoregressivo) e MA (Mdias Mveis ou Moving
Average) modelos ARMA.

Os modelos ARIMA costumam apresentar melhores resultados que
os mtodos de amortecimento quando a srie relativamente
longa e bem comportada.
Se a srie muito irregular, os resultados so, geralmente,
inferiores aos obtidos por mtodos de amortecimento.

131

Existem tambm modelos ARIMA multivariados, geralmente
chamados de modelos de funo de transferncia, mas eles no
sero estudados aqui.

5) Decomposio de Srie Temporal

A maneira tradicional de analisar uma srie temporal atravs da
sua decomposio nas componentes: tendncia, sazonalidade,
ciclicidade e aleatoriedade.

A tendncia de uma srie temporal indica o seu comportamento a
longo prazo, isto , se ela sobe, desce ou permanece estvel, e qual
a velocidade destas mudanas. Nos casos mais comuns,
trabalhamos com tendncia constante, linear ou quadrtica,
conforme mostrado abaixo:

Z
t

t





t
Tendncia Constante.

Z
t
Z
t

t

tt





t t

Tendncia Linear Crescente. Tendncia Linear Decrescente.





132


Z
t

t





t
Tendncia Quadrtica.

A sazonalidade indica a repetio de um padro na srie dentro do
perodo de 1 ano (isto quer dizer que dados anuais no captam
possveis sazonalidades na srie. Os dados tm que ser dirios,
mensais, trimestrais ou semestrais). Por exemplo, sries de
consumo de sorvetes ou refrigerantes nos periodos de vero,
consumo de energia eltrica tambm nos periodos quentes do ano,
vendas de casacos e botas nos periodos frios, so claramente sries
com sazonalidade.

Por exemplo, a srie abaixo apresenta sazonalidade nos meses de
Novembro e Dezembro quando as vendas sobem mais do que nos
demais periodos do ano:

Vendas








J F M A M J J A S O N D J F M A M J J A S O N D J F
Meses
Srie com sazonalidade.


133

A ciclicidade (ou ciclos) indicam padres que se repetem na srie
superiores a 1 ano. Por exemplo, ciclos relacionados atividade
econmica e ciclos meteorolgicos.

A tabela abaixo lista os oito modelos clssicos de srie temporal,
separados por sazonalidade e tendncia. Por exemplo, se a varivel de
dados no possuir tendncia ou sazonalidade, um modelo de Mdia
Mvel Simples ou de Suavizao Exponencial Simples seria suficiente. No
entanto, se existir sazonalidade, mas nenhuma tendncia discernvel
estiver presente, um modelo Sazonal Aditivo ou Sazonal Multiplicativo
seria melhor, e assim por diante.


No Sazonalidade Com Sazonalidade

Sem Tendncia
Mdia Mvel Simples
Suavizao Exponencial
Simples
Sazonal Aditivo
Sazonal Multiplicativo

Com Tendncia
Mdia Mvel Dupla
Suavizao Exponencial
Dupla
Aditivo de Holt-Winter
Multiplicativo de Holt-
Winter
Os oito mtodos clssicos de srie temporal.

O que se pretende sempre testar cada um destes mtodos clssicos e
classific-los de acordo com o erro.

O mtodo com o erro mais baixo o melhor mtodo.

Existem dois tipos de mtodos sazonais: aditivo e multiplicativo. A
sazonalidade aditiva tem um padro estacionrio de amplitude, e a
sazonalidade multiplicativa tem um padro de amplitude crescendo ou
decrescendo no decorrer do tempo.

As Figuras abaixo mostram as diferentes curvas de sazonalidades:








134






Da esquerda para a direita:

(a) Sazonalidade aditiva sem tendncia
(b) Sazonalidade Aditiva com tendncia
(c) Sazonalidade Multiplicativa sem tendncia
(d) Sazonalidade Multiplicativa com tendncia

Existem duas tcnicas principais de previso de sries temporais:

1. Suavizao de No Sazonalidade que estima uma tendncia ou no
removendo dados extremos e reduzindo a aleatoriedade dos dados.

2. Suavizao de Sazonalidade que combina a suavizao dos dados com
um ajustamento para o comportamento sazonal.

A previso que os valores futuros sero constantes. Isto porque o
modelo no possui tendncia e assume-se que a oscilao de curto prazo
apenas rudo.

Aqui a srie temporal possui aleatoriedade, mas no possui sazonalidade.




(a)
(b)
(c) (d)
135

Mtodos de Previso atravs de Modelos com Nenhuma
Tendncia ou Sazonalidade

Mdias Mveis

Mdia Mvel Simples (ou Aritmtica, ou No Ponderada)

A mdia mvel uma tcnica usada para analisar dados em um intervalo
de tempo. aplicada nas finanas e principalmente na anlise tcnica de
aes. O principal objetivo da mdia mvel simples fornecer o valor
mdio de uma varivel dentro de um determinado perodo. Assim, para
cada valor includo no clculo da mdia, o valor mais antigo excludo. Na
mdia mvel simples (MMS), cada dado utilizado no clculo da mdia ter
o mesmo peso. Por exemplo, uma mdia mvel da cotao de fechamento
de 10 dias de determinada ao, calculada para a data x, ser:

MMS = [Fech(x) + Fech(x-1) + Fech(x-2) + + Fech(x-9)] 10

Em outras palavras, a mdia mvel simples calculada adicionando-se os
preos (geralmente os preos de fechamento) para um nmero de
perodos (horas, dias, semanas, etc.) e dividindo-se esse valor pelo
nmero de perodos.
FRMULA DA MMS

( )
onde
P
t+1
= previso para o perodo t + 1
X
t
= sries de dados para t periodos
N = nmero de periodos
Veja um exemplo na planilha Excel Mdias Mveis.
A MMS til em sries que no apresentam tendncia ou sazonalidade.

136

Mdia Mvel Ponderada
A mdia ponderada qualquer mdia que multiplica fatores para fornecer
diferentes pesos para diferentes dados. Na anlise tcnica de aes, a
mdia mvel ponderada (MMP) representa, especificamente, o valor de
pesos que diminuem aritmeticamente. Assim, em um dia x, a MMP do
ltimo dia tem peso x, do penltimo dia tem peso x-1 e assim
sucessivamente at o dia 0.
A mdia mvel ponderada utilizada para "solucionar" o problema de
igualdade de pesos. Este indicador calculado atravs da soma de todos
os dados de uma srie dividida por certo perodo de tempo e os
multiplicando pela soma dos valores (pesos) de cada perodo. Por exemplo,
para uma mdia ponderada de cinco dias, o valor de hoje ser
multiplicado por cinco, o de ontem por quatro e assim por diante at que
o primeiro dia na escala do perodo seja alcanado. Esses valores so
ento somados e divididos pela soma dos multiplicadores.
A mdia mvel ponderada calculada atravs da definio do fator peso n
para cada dia em uma mdia mvel de d dias. Dessa forma, em uma
mdia mvel pesada de d dias, o ltimo dia ter peso n, o penltimo ter
peso n-1, e assim sucessivamente. Considerando isso, tem-se que a mdia
mvel ponderada para o dia d ser:
MMPd = npd + (n-1)pd-1 + ... + 2pd-n+2 + pd-n+1 n + (n-1) +...+ 2 + 1
FRMULA DA MMP

(Equao 2)
Onde
o
i
, i=1, 2,...,n so os pesos
Veja um exemplo na planilha Excel Mdias Mveis.
Mdia Mvel Exponencial
Uma Mdia Mvel Exponencial (MME) similar a uma Mdia Mvel
Simples. Uma MME calculada aplicando uma pequena porcentagem do
137

valor atual ao valor anterior. Aplicando maior peso ao valor atual, a mdia
mvel exponencial reduz o atraso ao aplicar mais peso aos valores mais
recentes em relao aos dados anteriores. Portando ir reagir mais
rapidamente alterao de preos ou valores que uma mdia mvel
simples.
FRMULA DA MME
Pt+1 = c*(valor corrente) + (1-c)*MMEPerodo anterior (Equao 3)
onde
c = a chamada constante de amortecimento
A frmula para calcular c :




Amortecimento (Suavizao) Exponencial
Amortecimento Exponencial Simples
Muito usado nos dias de hoje o modelo de suavizao exponencial
simples por ser extremamente simples e possuir fcil capacidade de
ajustes em relao acurcia obtida com esse mtodo. Enquanto na
mdia mvel simples as observaes passadas so ponderadas igualmente
(1/N), a suavizao exponencial atribui pesos decrescendo
exponencialmente quando a observao ficar mais velha. Em outras
palavras, nas observaes recentes so dados relativamente mais peso na
previso do que nas observaes mais antigas.

Caso a srie temporal em estudo mantenha-se constante sobre um nvel
mdio, uma suavizao exponencial simples pode ser usada para a
previso de valores futuros dessa srie. A representao matemtica
desse modelo dada por:

( )

(Equao 3)

138

Onde

a previso para o tempo t+1, feita no perodo atual t; o a


constante de suavizao, assumindo valores entre zero e 1; y
t
o valor
observado (real) na srie temporal para o tempo t; e

o valor da
previso feita para o tempo t.

Uma forma de medir a acurcia da previso calculando o erro gerado
pela mesma, ou seja:

(Equao 4)

O valor da constante de suavizao o arbitrrio. Pode-se determinar o
melhor valor para esta atravs de mtodos iterativos para minimizar
alguma medida de qualidade da previso como, por exemplo, a mdia do
quadrado dos erros, EQM ou o a sua raiz quadrada, RMSE. Desta maneira,
seleciona-se, inicialmente, um valor aleatrio para a constante, a partir do
qual previses so geradas. Comparam-se os valores previstos com os
reais, e calcula-se a mdia do quadrado das diferenas entre os mesmos; o
parmetro que minimiza essa mdia utilizado no modelo final. A
magnitude da constante o determina a velocidade de resposta do modelo
frente a mudanas valores da srie. Valores baixos para a constante o
fazem com que o modelo demore a reagir s mudanas no
comportamento da srie. Com valores altos de o, o modelo responde
rapidamente.
Os modelos de suavizao exponencial simples requerem uma estimativa
inicial para

. Quando dados histricos esto disponveis, pode-se usar


uma mdia simples das N observaes mais recentes como

; caso
contrrio, pode-se utilizar a observao mais recente, ou fazer uma
estimativa subjetiva.

Uma medida de eficincia deste mtodo pode ser obtida sob a
considerao que o processo completamente estvel, assim que Y1,
Y2,..., so variveis aleatrias independentes e identicamente distribudas
(IID)
6
com varincia o
2
. Portanto, segue que (para t grande):

[

()
(Equao 5)


6
Duas variveis aleatrias so independentes se P (AB) = P(A* B)* P(B) = P(A)*P(B) .
139

Assim que a varincia estatisticamente equivalente para a mdia mvel
com (2 - o) /o = 19. Em termos de varincia, o Mtodo de Suavizao
Exponencial com este valor de o equivalente ao Mtodo da Mdia
Mvel que utiliza 19 observaes. Entretanto, se uma mudana no
processo ocorre, a Suavizao Exponencial ir reagir mais rapidamente
com melhor ajuste do que o Mtodo da Mdia Mvel.

Uma desvantagem deste Mtodo est na dificuldade em escolher um
valor apropriado para o. O Mtodo de Suavizao Exponencial pode ser
visto como um processo de filtragem com um filtro estatstico cujas
entradas so os dados puros a partir de um processo estocstico e a
sada so estimativas suavizadas de uma mdia que varia com o tempo.

Uma maneira de iniciar o processo recursivo utilizar



Vamos agora reescrever o problema da produo de leite do tio Joo.
Usemos uma suavizao exponencial simples com o = 0,3. Veja a planilha
Suavizao Exponencial.
.
Como pudemos ver naquele exemplo, o mtodo de Suavizao
Exponencial Simples um pouco mais complicado para se construir e d-
nos um resultado melhor.

A suavizao exponencial til quando no h tendncia. Entretanto, se
os dados tiverem tendncia, precisamos usar o mtodo de Suavizao
Exponencial Dupla que ser discutido abaixo.
.

Mtodos de Previso para Modelos com Tendncia e
Nenhuma Sazonalidade

A representao matemtica para o processo (que gera a srie temporal)
com valor constante, tendncia e flutuaes aleatrias pode ser dada por:

(Equao 6)

Com t = 1, 2,..., e onde:

X
t
uma varivel aleatria observada no tempo t;
a a tendncia do modelo;
140

t o valor constante do modelo;
c
t
o erro aleatrio ocorrido no tempo t (geralmente assumido ter valor
esperado igual a zero e varincia constante).
Mdia Mvel Dupla (MMD)
Aqui a tcnica de mdia mvel simples aplicada duas vezes, uma nos
dados originais e depois nos dados resultantes desta primeira aplicao.

Define-se a mdia mvel dupla de tamanho k como:

[]

[]

[]

[]

(Equao 7)

Onde

[]
a mdia mvel (simples) de tamanho p calculada usando
todas as observaes at o instante T(inclusive).
Por que usar mdias mveis duplas?

Se os dados exibem uma tendncia linear, o uso de mdias mveis simples
para a previso dos valores da srie induz a erros sistemticos, pois a
mdia mvel simples segue a tendncia com certo atraso, e este efeito
amplificado quando tentamos prever valores futuros. O mtodo de
mdias mveis duplas procura diminuir este efeito sistemtico.

A previso realizada por meio de uma reta inclinada, isto , h uma
expectativa de que o valor da varivel ser sempre crescente de modo a
ser compatvel com a tendncia nos dados histricos.

Os dados possuem aleatoriedade e tendncia de crescimento, mas veja
que no h sazonalidade. Atribui a todos os valores passados o mesmo
peso na previso. Veja que em previses o analista deve se preocupar com
a tendncia.

O modelo matemtico para a previso de k perodos com mdia mvel :

[]

[]

[]

[]
) (Equao 8)

141

[]
a mdia mvel (simples) de tamanho k calculada usando as k
observaes anteriores ao instante t (inclusive);

[]
a mdia mvel(dupla) de tamanho k calculada usando as k mdias
mveis simples

[]
anteriores ao instante t (inclusive).

p o perodo usado no clculo da mdia mvel;

k o nmero de perodos de previso variando de 1 at h (horizonte de
previso).
Modelo de Previso por Alisamento Exponencial Duplo de Holt
Quando uma determinada srie apresenta aleatoriedade e uma tendncia
linear de crescimento (ou decrescimento), o modelo de suavizao
exponencial dupla de Holt pode ser usado de maneira satisfatria para a
previso, caso os outros componentes da srie possam ser desprezados.
Este modelo emprega duas constantes de suavizao, o e | (com valores
entre 0 e 1), sendo representado por trs equaes):

( )(

) ( )

) ( )

( )

( )
onde:

E
t
a componente de nvel;

T
t
a componente de tendncia;

h o horizonte de previso;

k = 1, 2,..., h;

a previso;

o, com valores no intervalo 0<o<1, a constante de suavizao da
componente de nvel L
t
;
|, com valores no intervalo 0<|<1, a constante de suavizao da
componente tendncia T
t
;
142


Na equao 9, pode-se perceber que o valor de nvel E
t
a mdia
ponderada do prprio valor da srie y
t
e de E
t-1
e T
t-1
(nvel e tendncia
previstos no tempo t-1, respectivamente). Para uma srie isenta de erro
aleatrio, a quantidade (E
t-1
+ T
t-1
) exatamente o valor de E
t
, uma vez que
a variao de tempo entre t e t-1 obviamente 1. Assim, a expresso (9)
pode ser entendida como:

( )

( )
Onde:

) ( )

Em (10), a parcela E
t
E
t-1
a derivada discreta que representa, portanto,
a tendncia. Para o restante, o raciocnio anlogo ao realizado para a
expresso (9).

Considerando que a primeira amostra da srie temporal para t = 1, os
valores L
1
e T
1
so funes de L
0
e T
0
. Como no existe amostra da srie
para t = 0, faz-se necessrio inicializar L
1
e T
1
. H vrias maneiras de se
inicializar estas variveis, dentre as quais:
E1 = y1 (Equao 14)
T1 = y2 y1 (Equao 15)
Ou


( )

) (

) (

( )

OBS:- Uma vez que a componente de tendncia em uma srie
representada apenas por um coeficiente (coeficiente angular da reta) as
formas apresentadas em (15), (16), (17) para inicializar T
1
so possveis
representaes para a derivada discreta da srie calculada em t = 1.

143

O modelo muito usado para modelagem de produtos na fase de
divulgao quando comea a ser aceito pelo pblico consumidor.

As equaes (9) e (10) fazem uma estimativa do nvel e da inclinao da
srie temporal, respectivamente.

J a equao (11), calcula a previso da srie para os prximos k perodos.

Assim como na suavizao exponencial simples, o mtodo de Holt requer
valores iniciais, neste caso, E
0
e T
0
. Uma alternativa para estes clculos
iniciais igualar E
0
ao ltimo valor observado na srie temporal e calcular
uma mdia da declividade nas ltimas observaes para T
0
. Outra forma
de clculo a regresso linear simples aplicada aos dados da srie
temporal, onde se obtm o valor da declividade da srie temporal e de E
0

em sua origem.

As constantes de suavizao o e | no modelo de Holt podem ser
determinadas de maneira anloga obteno de o na suavizao
exponencial simples, ou seja, atravs da utilizao de um mtodo iterativo
que encontre a combinao de o e | que minimize o EQM.

Veja exemplo na planilha AEDH.

Como voc viu no exemplo da planilha AEDH, o mtodo de suavizao
exponencial dupla um pouco mais complicado de se construir e dever
dar-nos resultados melhores. O que acontece se os dados mostrarem
sazonalidade? Neste caso a suavizao exponencial dupla no funcionar.

Precisamos usar o mtodo da Suavizao Exponencial Tripla que ser
discutido a seguir.

Mtodos de Previso para Sries Temporais Sujeitas a Fenmenos
Sazonais e Nenhuma Tendncia

bastante comum existir padres sazonais com valores maiores em dados
instantes de tempo de que em outros em uma srie temporal. Por
exemplo, este fenmeno ocorre para o volume de vendas de panetones
(bolo-rei) entre outros produtos tpicos de festas natalinas na poca do
Natal, assim como roupas de l para o perodo de inverno, bronzeadores e
bons no perodo do vero, etc.

144

Este fenmeno viola a considerao de que o processo que gera a srie
por uma componente de valor constante ou com tendncia e outra
componente de flutuao aleatria, cujos mtodos anteriores de previso
(mdia mvel simples, suavizao exponencial simples, mdia mvel dupla,
suavizao exponencial dupla de Holt) no podem ser utilizados para
previso.

Uma maneira de realizar previses com padres sazonais corrigir a srie
temporal do efeito da sazonalidade e, depois ento, utilizar os mtodos de
previso de mdia mvel simples ou suavizao exponencial simples (para
modelos de sries de valor constante [sem tendncia] e sazonalidade),
como veremos nas prximas duas sees, ou ainda o mtodo de previso
com suavizao exponencial dupla de Holt (para modelos de sries com
tendncia e sazonalidade), como veremos mais a frente.

Considerando que o processo que gera a srie temporal no tenha
tendncia, mas tenha sazonalidade, o modelo ser dado por:

Xt = t + St + ct ( )


Onde: t = 1, 2,...

X
t
uma varivel aleatria observada no tempo t;
t o valor constante do modelo;
S
t
a componente sazonal no tempo t;
c
t
o erro aleatrio ocorrido no tempo t (geralmente assumido ter valor
esperado igual a zero e varincia constante).

Previso com Correo Priori da Sazonalidade

O procedimento pode ser resumido como:

1. Corrigir a srie temporal do efeito da sazonalidade atravs da diviso
(ou subtrao) dos valores da srie temporal pelos seus respectivos
fatores sazonais.

2. Realizar a previso atravs dos mtodos Mtodo de Previso de Mdia
Mvel Simples ou Suavizao Exponencial Simples.

3. Multiplicar (ou adicionar) a previso pelos fatores sazonais
incorporando a sazonalidade.
145


Quando o efeito da sazonalidade retirado e incorporado srie por meio
de diviso e multiplicao, respectivamente, dos valores da srie temporal
pelos fatores sazonais, o mtodo denominado multiplicativo.

Quando o efeito da sazonalidade retirado e incorporado srie por meio
de subtrao e adio, respectivamente, dos valores da srie temporal
pelos fatores sazonais, o mtodo denominado aditivo.

Modelo de Previso com Sazonalidade Multiplicativa

O uso deste modelo deve ser para dados que possuam sazonalidade
crescente ou decrescente, mas no possuam tendncia de crescimento ou
decrescimento.


O grfico acima tpico de dados de sazonalidade multiplicativa e sem
tendncia, mostrando o ajuste e a linha de previso.

Este mtodo utiliza a seguinte expresso:

()

( )

( )

( )

( )

Onde:

L
t
a componente de nvel da srie no tempo t;
S
t
a componente de sazonalidade no tempo t;
146

s o perodo sazonal ou durao da sazonalidade
h o horizonte de previso;
k = 1, 2,..., h, isto , o nmero de perodos da previso;

a previso;

o com valores no intervalo 0<o<1, a constante de suavizao da
componente de nvel Lt;

com valores no intervalo 0<<1, a constante de suavizao da
componente de sazonalidade S
t
.

As constantes de suavizao o e devem ser estimadas a partir dos dados.

Modelo de Previso com Sazonalidade Aditiva

Este modelo pode ser usado quando ocorre sazonalidade, mas onde no
se verifica a presena de tendncia. Alm disso, a amplitude da
sazonalidade aproximadamente constante ao longo do tempo.

O modelo pode ser usado para realizar a previso de diversas variveis tais
como a venda de sorvetes, brinquedos, preos de commodities, etc.



O grfico acima tpico de dados de sazonalidade aditiva e sem tendncia,
mostrando o ajuste e a linha de previso.

Este mtodo utiliza as seguintes expresses:

) ( )

( )

) ( )

( )

147

( )


Onde:

L
t
a componente de nvel da srie no tempo t;

S
t
a componente de sazonalidade no tempo t;

s o perodo sazonal ou durao da sazonalidade;

h o horizonte de previso;

k = 1, 2,..., h, isto , o nmero de perodos da previso;

a previso;

o com valores no intervalo 0<o<1, a constante de suavizao da
componente de nvel Lt;
com valores no intervalo 0<<1, a constante de suavizao da
componente de sazonalidade St.

As constantes de suavizao o e devem ser estimadas a partir dos dados.

Mtodo de Previso com Suavizao Exponencial de Holt-Winters

Os modelos de Holt-Winters so muito utilizados quando da existncia de
uma srie temporal que apresente, alm da tendncia, um componente
de sazonalidade. Uma srie com esse componente caracterizada pela
ocorrncia de padres cclicos de variao, que se repetem em intervalos
relativamente constantes de tempo. So muito observados (esses padres
cclicos) em indstrias do ramo alimentcio, de vesturio, cosmtico, entre
outros.
.
Os modelos de Holt-Winters tambm so classificados em dois grupos:
aditivo e multiplicativo. No modelo aditivo, a amplitude da variao
sazonal constante ao longo do tempo; ou seja, a diferena entre o maior
e menor valor de demanda dentro das estaes permanece relativamente
constante no tempo. No modelo multiplicativo, a amplitude da variao
sazonal aumenta ou diminui como funo do tempo.

148

Considerando que o modelo do processo que gera a srie temporal seja
dado por:

Xt = t + at + St + ct (Equao 25)

Onde: t = 1, 2,...

X
t
uma varivel aleatria observada no tempo t;

a a tendncia do modelo;

t o valor constante do modelo;

S
t
a componente sazonal no tempo t;

c
t
o erro aleatrio ocorrido no tempo t (geralmente assumido ter valor
esperado igual a zero e varincia constante).

Modelo Sazonal Multiplicativo de Holt-Winters

O modelo multiplicativo de Holt-Winters se ajusta, de maneira mais
adequada, a sries com tendncia e sazonalidade multiplicativa, ou seja,
quelas em que a amplitude da variao sazonal aumenta com o
acrscimo no nvel mdio da srie temporal. Vide figura abaixo:







Este mtodo utiliza a seguinte expresso:

( )(

) ( )

) ( )

( )
149

( )

( )

)
()
( )
onde:

L
t
a componente de nvel;
T
t
a componente de tendncia;
S
t
a componente de sazonalidade;
s o perodo sazonal;
h o horizonte de previso;
k = 1, 2,..., h;
mod(n,m) o resto da diviso de n por m;

a previso;
o com valores no intervalo 0<o<1, a constante de suavizao da
componente de nvel Lt;
| com valores no intervalo 0<|<1, a constante de suavizao da
componente tendncia Tt;
com valores no intervalo 0<<1, a constante de suavizao da
componente de sazonalidade S
t


Na equao (26), pode-se perceber que os valores da srie (x
t
) so
divididos pelos fatores sazonais, da mesma forma anterior em

para corrigir os valores da srie dos efeitos da sazonalidade, as demais


parcelas da expresso so anlogas as da expresso de Holt:

( )(

) ( )

A expresso (27) igual expresso (10) no mtodo de Holt:

) ( )

( )



Em (29) a sazonalidade incorporada srie atravs da multiplicao da
soma dos valores previstos para as componentes de Nvel (L
t
) e Tendncia
(T
t
) pela componente sazonal S
t-s+k
.

O mtodo multiplicativo de Winters, como os demais modelos descritos
anteriormente, funciona atravs da aplicao recursiva de suas equaes
aos dados da srie. Dessa forma, tal aplicao deve iniciar em algum
perodo no passado, onde os valores de L
t
, T
t
e S
t
devem ser estimados.
150

Uma maneira simples de se fazer essa estimativa atravs da inicializao
do nvel e da tendncia no mesmo perodo m:


- O nvel determinado atravs da mdia de primeira estao:

) ( )

- Para se inicializar a tendncia, recomendado o uso de duas
estaes completas, ou seja, 2s perodos:

) ( )


- Por ltimo, os ndices sazonais iniciais podem ser determinados
atravs da razo entre as primeiras observaes com a mdia do
primeiro ano:

( )

Nas expresses acima,

a previso para o perodo t+k, o, | e so


constantes de suavizao, cujos valores encontram-se entre 0 e 1, e y
t
a
mais recente observao. Nelas, temos:

L
t
representa uma estimativa do nvel da srie no tempo t,
Tt, uma estimativa da declividade da srie no mesmo perodo t e,
S
t
, o componente de sazonalidade tambm no perodo t.

A sazonalidade, ou seja, o nmero de subperodos por ano representado
por s. A escolha dos valores para as constantes de suavizao o, | e
condicionada a algum critrio que, na maioria das vezes, consiste no
mesmo citado anteriormente: a minimizao pelo uso de um algoritmo de
otimizao no linear, do erro quadrtico mdio (EQM) atribudo ao
desempenho do modelo usando a ferramenta Solver do Excel.

Vamos comear a construir o modelo. V ao ficheiro em Excel AEDH,
planilha 3.

Fizemos uma grande melhora aps a otimizao com o Solver do Excel.
151


Se no ms 36 vendermos 80 varas de pescar, como voc faria para prever
a venda no ms 37? Para prever, simplesmente preencha a frmula da
clula G39 na clula G40 ou entre com a frmula =(D39+E39)*F28.

Aqui o resultado 38,56 varas ou arredondando 39.

Se voc quiser prever k perodos adiante, use a seguinte lgica:



Neste exemplo queremos prever as vendas no ms 44, i.., 8 meses
adiante, ento entramos com =(D39+8*E39)*F35 como voc pode ver na
clula G47. O resultado 328,86, ou arredondando 329 varas de pescar.

E1 = D39 T1= E39 st+k-c = F35 k = 8 c = 12

Como voc pode ver neste exemplo, o mtodo da suavizao exponencial
tripla um pouco mais complicado de se construir e nos dar resultados
muito bons.

Modelo Sazonal Aditivo de Holt-Winters

Para sries que possuem tendncia e sazonalidade aditiva, o modelo que
apresenta maior capacidade de explicao o aditivo de Winters. Ou seja,
ele utilizado nas sries onde o efeito sazonal no funo do nvel
mdio corrente da srie temporal e pode ser adicionado ou subtrado de
uma previso que dependa apenas de nvel e tendncia. Veja figura abaixo:



152



O algoritmo de previso do modelo sazonal aditivo de Holt-Winters
baseado nas seguintes expresses:

) ( )(

) ( )

) ( )

( )

) ( )

( )

( )


Estas equaes so parecidas com aquelas a que se refere ao modelo
multiplicativo de Holt-Winters. A diferena nos dois modelos o fato das
outras equaes, agora, apresentarem os ndices de sazonalidade
somados e subtrados, ao invs de multiplicados e divididos.

As inicializaes de L
s
e T
s
so idnticas s do modelo multiplicativo. Os
valores iniciais para os ndices sazonais so determinados atravs das
seguintes expresses:

S
1
= x
1
L
s
; S
2
= x
2
L
s
;...; S
s
= x
s
- L
s

Concluso

A mdia mvel comumente usada com dados de sries temporais para
suavizar flutuaes de curto prazo e destacar tendncias ou ciclos de
longo prazo. O corte entre curto prazo e longo prazo depende da
aplicao, e os parmetros da mdia mvel sero definidos
apropriadamente. Por exemplo, frequentemente usado em anlise
tcnica de dados financeiros, como preos de aes, retornos ou volumes
transacionados. usado tambm em economia para examinar o produto
interno bruto, empregos e outras sries temporais macroeconmicas.

A suavizao exponencial tem-se provado atravs dos anos como muito
til em muitas situaes de previso. Ela foi sugerida primeiramente por
C.C.Holt em 1957 e tinha a inteno de ser usada para sries temporais
no sazonais e que no mostrassem tendncia. Mais tarde ele ofereceu
um procedimento (1958) que manipula tendncias. Winters (1965)
153

generalizou o mtodo para incluir sazonalidade, da o nome Mtodo de
Holt-Winters ou Suavizao Exponencial Tripla.

Todos estes mtodos de previso so muito bsicos, mas muito teis. Os
mtodos de previso de sries temporais podem ser mais avanados do
que estes considerados nos nossos exemplos acima. Eles so baseados nos
modelos Auto Regressive Integrated Moving Average (ARIMA) (tambm
conhecido como tcnica de Box-Jenkins). Essencialmente estes assumem
que as sries temporais foram geradas por um processo probabilstico
com valores futuros relacionados aos valores passados, como tambm aos
erros de previso passados. Para aplicar os modelos ARIMA a srie
temporal precisa ser estacionria. Uma srie temporal estacionria
aquela uma cujas propriedades estatsticas tais como mdia, varincia e
autocorrelao so constantes no decorrer do tempo.

BIBLIOGRAFIA

EHLERS, R.S. Anlise de Sries Temporais. Disponvel em:
< http://www2.icmc.usp.br/~ehlers/>. Acesso em 22 de dez 2012.

MAKRIDAKIS, S.; WHEELWRIGHT, S.; HYNDMAN, R. Forecasting: Methods
and Applications. 3. Ed., New York: John Wiley & Sons, 1998.

MORETTIN, P.A.; TOLOI, C.M.C. Anlise de Sries Temporais. So Paulo:
Editora Edgard Blucher Ltda., 2004.

TSAY, R.S. Analysis of Financial Times Series: Financial Econometrics. New
York: John Wiley & Sons, 2002.