Vous êtes sur la page 1sur 23

Paulo Ricardo

Bittencourt Guimares

Doutorando em Engenharia Florestal com


concentrao em Economia e Poltica Florestal
pela Universidade Federal do Paran (UFPR).
Mestre em Estatstica pela Universidade Esta-
dual de Campinas (Unicamp). Bacharel em Es-
tatstica pela Universidade Federal do Paran
(UFPR). Professor do Departamento de Estats-
tica da Universidade Federal do Paran (UFPR).
Especialista em avaliao do Programa Nacional
de Incluso de Jovens (Projovem) da Secretaria
Geral da Presidncia da Repblica. Consultor em
Bioestatstica e Pesquisa de Mercado.

Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br
Anlise de Regresso

Introduo
Os modelos de regresso so largamente utilizados em diversas reas do
conhecimento tais como: computao, administrao, engenharias, biologia,
agronomia sade, sociologia etc. O principal objetivo dessa tcnica obter
uma equao que explique satisfatoriamente a relao entre uma varivel
resposta e uma ou mais variveis explicativas, possibilitando fazer predio
de valores da varivel de interesse. Este relacionamento pode ser por uma
equao linear ou uma funo no linear, conforme figura abaixo:

y y

x x
Linear No linear
Figura 1 Formas lineares e no lineares de relao entre pares de variveis.

Regresso linear simples


Se uma relao linear vlida para sumarizar a dependncia observada
entre duas variveis quantitativas, ento a equao que descreve esta rela-
o dada por:
Y = a + b.X

Esta relao linear entre X e Y determinstica, ou seja, ela afirma que


todos os pontos caem exatamente em cima da reta de regresso. No entanto
este fato raramente ocorre, ou seja, os valores observados no caem todos
Este material parte integrante do acervo do IESDE BRASIL S.A., 209
mais informaes www.iesde.com.br
Anlise de Regresso

exatamente sobre esta linha reta. Existe uma diferena entre o valor obser-
vado e o valor fornecido pela equao. Essa diferena, denominada erro e re-
presentada por , uma varivel aleatria que quantifica a falha do modelo
em ajustar-se aos dados exatamente. Tal erro pode ocorrer devido ao efeito,
entre outros, de variveis no consideradas e de erros de medio. Incorpo-
rando esse erro equao anterior temos:

Y = a + b.X +

que denominado modelo de regresso linear simples. a e b so os parme-


tros do modelo.

A varivel X, denominada varivel regressora, explicativa ou indepen-


dente, considerada uma varivel controlada pelo pesquisador e medida
com erro desprezvel. J Y, denominada varivel resposta ou dependente,
considerada uma varivel aleatria, isto , existe uma distribuio de proba-
bilidade para Y em cada valor possvel de X. muito frequente, na prtica,
encontrarmos situaes em que Y tenha distribuio normal. Este um dos
principais pressupostos para aplicao desta tcnica.

Exemplo 1: O preo de aluguel de automveis de uma agncia defini-


do pela seguinte equao: Y = 8 + 0,15.X, onde Y = Taxa de aluguel (R$);
X = distncia percorrida (km).

Assim, a taxa de aluguel inicia com o preo de R$8,00 e vai aumentando


medida que a distncia percorrida aumenta. Assim, se fosse percorrida uma
distncia de 100km, a taxa de aluguel seria de 8 + 0,15 x 100 = R$23,00. No
entanto, como essa equao foi obtida baseada em dados de automveis
de diversas marcas, certamente haver uma variao no preo, por causa de
diversos outros fatores. Assim, essa equao ter uma margem de erro, que
devida a esses inmeros fatores que no foram controlados.

Exemplo 2: Um psiclogo investigando a relao entre o tempo que um in-


divduo leva para reagir a um certo estmulo e sua idade obteve os seguintes
resultados:

210 Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br
Anlise de Regresso

Tabela 1 Idade (em anos) e tempo de reao um certo estmulo


(em segundos)
Y Tempo de reao (segundos) X Idade (em anos)
96 20
92 20
106 20
100 20
98 25
104 25
110 25
101 25
116 30
106 30
109 30
100 30
112 35
105 35
118 35
108 35
113 40
112 40
127 40
117 40

Figura 2 Diagrama de disperso entre a idade (X) e o tempo de reao (Y).

Este material parte integrante do acervo do IESDE BRASIL S.A., 211


mais informaes www.iesde.com.br
Anlise de Regresso

A partir da representao grfica desses dados, mostrada na figura 2,


possvel visualizar uma relao linear positiva entre a idade e o tempo de
reao. O coeficiente de correlao de Pearson para esses dados resultou
em r = 0,768, bem como seu respectivo teste de significncia em tcal = 5,09,
que comparado ao valor tabelado ttab,5% = 2,1 , fornece evidncias de relao
linear entre essas duas variveis, ou seja, h evidncias de considervel rela-
o linear positiva entre idade e tempo de reao.

Podemos, ento, usar um modelo de regresso linear simples para des-


crever essa relao. Para isso, necessrio estimar, com base na amostra
observada, os parmetros desconhecidos a e b deste modelo. O mtodo de
estimao denominado Mnimos Quadrados Ordinrios (MQO) frequente-
mente utilizado em regresso linear, para essa finalidade, e ser apresentado
mais adiante.

Continuando a anlise dos dados do exemplo, possvel obter o seguinte


modelo de regresso linear simples ajustado:

Y = 80,5 + 0,9.X

Figura 3 Reta de regresso ajustada aos dados.

Como a variao dos dados em X no inclui x = 0, no h interpretao


prtica do coeficiente a = 80,5. Por outro lado, b = 0,9 significa que a cada au-
mento de 1 ano na idade das pessoas, o tempo de reao mdio (esperado)
aumenta em 0,9 segundos.
Assim, se: X = 20 anos, teremos Y = 98,5 seg.
Para X = 21 anos, Y = 99,4 seg.
X = 22 anos, Y = 100,3 seg.

212 Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br
Anlise de Regresso

Dessa maneira, de ano para ano, o aumento no tempo de reao espera-


do de 0,9 segundos.

Exemplo 3: Uma certa pea manufaturada por uma companhia, uma vez
por ms, em lotes, que variam de tamanho de acordo com as flutuaes na
demanda. A tabela abaixo contm dados sobre tamanho do lote e nmero
de horas gastas na produo de 10 recentes lotes produzidos sob condies
similares. Esses dados so apresentados graficamente na Figura 4, tomando-
se horas-homem como varivel dependente ou varivel resposta (Y) e o tama-
nho do lote como varivel independente ou preditora (X).

Tabela 2 Tamanho de lote e nmero de horas gastas na produo


de cada lote

Lote (i) Horas (Yi) Tamanho do lote (Xi)


1 73 30
2 50 20
3 128 60
4 170 80
5 87 40
6 108 50
7 135 60
8 69 30
9 148 70
10 132 60

Figura 4 Relao estatstica entre Y e X, referente aos dados da Tabela 2.

Este material parte integrante do acervo do IESDE BRASIL S.A., 213


mais informaes www.iesde.com.br
Anlise de Regresso

A figura 4 sugere claramente que h uma relao linear positiva entre o


tamanho do lote e o nmero de horas, de modo que, maiores lotes tendem
a corresponder a maiores nmeros de horas-homem consumidas. Porm, a
relao no perfeita, ou seja, h uma disperso de pontos sugerindo que
alguma variao no nmero de horas no dependente do tamanho do
lote. Por exemplo, dois lotes de 30 unidades (1 e 8) demandaram quantida-
des um pouco diferentes de horas. Na figura 4, foi traada uma linha (reta) de
relacionamento descrevendo a relao estatstica entre horas e tamanho do
lote. Ela indica a tendncia geral da variao em horas-homem quando h
trocas no tamanho do lote.

Observa-se que grande parte dos pontos da figura no cai diretamente sobre
a linha de relacionamento estatstico. A disperso dos pontos em torno da linha
de relacionamento representa a variao em horas que no associada ao ta-
manho do lote, e que usualmente considerada aleatria. Relaes estatsticas
so geralmente teis, mesmo no tendo uma relao funcional exata.

Mtodo dos mnimos quadrados ordinrios (MQO)


Para estimar os parmetros do modelo, necessrio um mtodo de esti-
mao. O mtodo estatstico utilizado e recomendado pela sua preciso o
mtodo dos mnimos quadrados que ajusta a melhor equao possvel aos
dados observados.

Com base nos n pares de observaes (y1 ,x1) , (y2,x2) ,... , ( yn, xn) , o mtodo
de estimao por MQO consiste em escolher a e b de modo que a soma dos
quadrados dos erros, i (i=10 ,..., n), seja mnima.

Para minimizar esta soma, que expressa por:

n n
SQ= Ei2  .y i a b.xi
i=1 I-1

devemos, inicialmente, diferenciar a expresso com respeito a a e b e, em


seguida, igualar a zero as expresses resultantes. Feito isso, e aps algumas
operaes algbricas, os estimadores resultantes so:

x i .y i n.y.x
b= 2 2
x i n.x
a = y b.x
onde y a mdia amostral dos yi s e x a mdia amostral dos xi s.
214 Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Regresso

Logo, E(Y|x) = a + b.x o modelo de regresso linear simples ajustado, em


que E(Y|x), denotado tambm Y por simplicidade, o valor mdio predito
de Y para qualquer valor X = x que esteja na variao observada de X.

No exemplo 2, as estimativas dos parmetros resultaram em a = 80,5 e


b = 0,9. Veja como esses valores foram obtidos:

Xi = 2 150 Yi = 600 n = 20 Xi Yi = 65 400

2
X = 30 Y = 107, 5 Xi = 19 000

x.i y i n.y.x 65 400 20 .107,5.30 900


b= 2 2
= 2
= = 0, 9
xi n.x 19 000 20 .(30) 1 000

a = y b.x = 107, 5 0, 9 . 30 = 80, 5

No exemplo 3, as estimativas dos parmetros a e b so:

Xi = 500 Yi = 1100 n = 10 Xi Yi = 61 800

2
X = 50 Y = 110 Xi = 28 400

x i .y i n.y.x 61 800 10 .110 . 50 6 800


b= 2 2
= 2
= =2
xi n.x 28 400 10 .(50) 3 400

Assim, a equao de regresso linear entre X e Y ser dada por:

Y = 10 + 2.X +

Interpretando o modelo acima, poderemos observar que, aumentando o


tamanho do lote em uma unidade, o nmero de horas gastas na produo
ser aumentado em 2 horas.

Obtendo a reta de regresso com ajuda da planilha Excel, teremos


que selecionar a opo REGRESSO no mdulo de Anlise de dados (em
ferramentas):

Este material parte integrante do acervo do IESDE BRASIL S.A., 215


mais informaes www.iesde.com.br
Anlise de Regresso

A sada fornecida pela planilha a seguinte:

216 Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br
Anlise de Regresso

Observe que o Excel fornece, alm dos coeficientes de correlao, a Anova


da regresso para testar a sua significncia e os coeficientes estimados com
seus respectivos testes de significncia.

Anlise de Varincia da Regresso


Para verificar a adequao do modelo aos dados, algumas tcnicas podem
ser utilizadas. A anlise de varincia da Regresso uma das tcnicas mais
usadas. Assim, podemos analisar a adequao do modelo pela ANOVA da
regresso a qual geralmente apresentada como na tabela a seguir:

Fonte de Variao g.l. S.Q. Q.M. F p-valor

Regresso p-1 SQreg SQreg/p-1


QMreg/QMres
Resduos n-p SQres SQres/n-p

Total n-1 SQtotal Sqtotal/n-1

Onde:

SQreg = soma dos quadrados devido regresso:


n
2
SQreg = (Yi y)
i=1

SQres = soma dos quadrados devido aos erros:


n
SQres = SQtotal Sqreg = (y i Yi )2
i=1

SQtotal = soma dos quadrados totais:


n
SQtotal = (y i y)2
i=1

p = nmero de variveis do modelo

n = numero de observaes.

Caso o p-valor seja inferior ao nvel de significncia estabelecido, ento


consideramos a regresso como significativa.

Uma maneira auxiliar de medir o ganho relativo introduzido pelo modelo


usar o coeficiente de determinao o qual definido por R2 que calculado
por SQreg/SQtotal.

Este material parte integrante do acervo do IESDE BRASIL S.A., 217


mais informaes www.iesde.com.br
Anlise de Regresso

Para os exemplos 2 e 3, a tabela da Anova seria construda de seguinte


forma:

Exemplo 2:
nn n
(Y
SQreg = y)22 = (80, 5 + 0, 9x i 107, 5)2 = 810
(Yii y)
i=1
i=1 i=1

Para obter a soma de quadrados acima, deveremos substituir em Xi todos


os valores de idade da Tabela 1.
n n
SQtotal = (y i y)2 = (y i 107, 5)2 = 1 373
i=1 i=1

Para obter a soma de quadrados acima, deveremos substituir em Yi todos


os valores de tempo de reao da Tabela 1.

SQres = 1 373 810 = 563

Fonte de Variao g.l. S.Q. Q.M. F p-valor


Regresso 1 810 810
25,90 < 0,01
Resduos 18 563 31,27

Total 9 1 373 72,26

O que indica que a regresso entre X e Y significativa. O modelo


Y = 80,5 +0,9.X pode ser considerado adequado para realizar predies de Y.
O coeficiente r2 de determinao para esse modelo de 0,59 o que represen-
ta um poder apenas razovel de explicao dos valores de tempo de reao
pela idade. Muito provavelmente outras variveis estejam influenciando o
tempo de reao.

Exemplo 3:
n n
2 2
Yii y) = (10 + 2x i 110) = 13 600
SQreg = (Y
i=1 i=1

Para obter a soma de quadrados acima, deveremos substituir em Xi


todos os valores do tamanho do lote da Tabela 2.

n n
2 2
SQtotal = (y i y) = (y i 107, 5) =13 660
i=1 i=1

Para obter a soma de quadrados acima, deveremos substituir em Yi


todos os valores de nmeros de horas gastas da Tabela 2.

218 Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br
Anlise de Regresso

SQres = 13 660 13 600 = 60

Fonte de Variao g.l. S.Q. Q.M. F p-valor


Regresso 1 13 600 13 600
1 813,33 < 0,01
Resduos 8 60 7,5

Total 9 13 660 1 517,78

O que indica que a regresso entre X e Y significativa. O modelo Y = 10 + 2.X


pode ser considerado de boa qualidade para realizar predies de Y. O coeficien-
te r2 de determinao para esse modelo de 0,996.

Erro-padro de estimao e intervalos de predio


O erro-padro da estimao um desvio-padro condicional, na medida
em que indica o desvio-padro da varivel dependente Y, dado um valor es-
pecfico da varivel dependente X. O erro-padro baseado em dados amos-
trais dado por:
2
(y Y)
S u =
n 2

Para fins de clculo, mais conveniente uma verso alternativa da


frmula:


Su = S2y . 1 r 2
n 2
y y
onde S2 = i=1
y
n

O erro-padro pode ser usado para estabelecer um intervalo de pre-


dio para a varivel dependente, dado um valor especfico da varivel
independente.

Uma vez que o erro-padro de estimao est baseado em dados de


amostra, apropriado o uso da distribuio t de Student com n-2 graus de
liberdade. Assim, um intervalo de predio para a varivel dependente Y, em
anlise de regresso simples :

Y t
n 2 ; A / 2 . Su

Este material parte integrante do acervo do IESDE BRASIL S.A., 219


mais informaes www.iesde.com.br
Anlise de Regresso

Para os dados do exemplo 2, teramos o erro-padro da estimao dado


por:

Dado que S2y = 68,65 e r2 = 0,59 ento


Su = S2y . 1 r 2 = 68, 65. 1 0, 59 = 5, 30

E o intervalo de predio, com 95% de confiana, para um valor de Y=112


seria:

[Y tn 2; A/2 .S
u ] = [112 2,10 . 5, 30] = [ 100, 87 ; 123,13 ]

Ou seja, para uma pessoa com 35 anos, o tempo de reao predito estaria
entre 100,87 e 123,13 segundos, com 95% de confiana.

Para os dados do exemplo 3 teramos o erro-padro da estimao dado


por:

Dado que S2y = 1 366 e r2 = 0,996 ento


Su = S2y . 1 r 2 = 1 366. 1 0, 996 = 2, 34
2

E o intervalo de predio, com 95% de confiana, para um valor predito


de Y = 110 seria:
u ] = [110 2,31.2,34] = 104,59; 115,41
[Y tn2;/2 . 

Ou seja, para um lote de tamanho 50, seriam necessrias de 104,59 a


115,41 horas, com 95% de confiana.

Anlise de Resduos
^
Os desvios ei = yi yi ( i = 1, ..., n) so denominados resduos e so conside-
rados uma amostra aleatria dos erros. Por esse fato, uma anlise grfica dos
resduos , em geral, realizada para verificar as suposies assumidas para os
erros i.

Para verificao dos pressupostos necessrios para ajuste de um modelo


de regresso necessrio realizar uma Anlise de Resduos. Os trs tipos de
resduos mais comumente utilizados so:

220 Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br
Anlise de Regresso

Resduos brutos;

Resduos padronizados;

Resduos estudentizados.

Ampliando seus conhecimentos

Anlise de Regresso Mltipla


A regresso mltipla envolve trs ou mais variveis, ou seja, uma nica vari-
vel dependente, porm duas ou mais variveis independentes (explicativas).

A finalidade das variveis independentes adicionais melhorar a capacida-


de de predio em confronto com a regresso linear simples. Mesmo quando
estamos interessados no efeito de apenas uma das variveis, aconselhvel
incluir as outras capazes de afetar Y, efetuando uma anlise de regresso ml-
tipla, por duas razes:

a) Para reduzir os resduos. Reduzindo-se a varincia residual (er-


ro-padro da estimativa), aumenta a fora dos testes de signifi-
cncia;

b) Para eliminar a tendenciosidade que poderia resultar se simples-


mente ignorssemos uma varivel que afeta Y substancialmente.

Uma estimativa tendenciosa quando, por exemplo, numa pesquisa em


que se deseja investigar a relao entre a aplicao de fertilizante e o volume
de safra, atribumos erroneamente ao fertilizante os efeitos do fertilizante,
mais a precipitao pluviomtrica.

O ideal obter o mais alto relacionamento explanatrio com o mnimo


de variveis independentes, sobretudo em virtude do custo na obteno de
dados para muitas variveis e tambm pela necessidade de observaes adi-
cionais para compensar a perda de graus de liberdade decorrente da introdu-
o de mais variveis independentes.

A equao da regresso mltipla tem a forma seguinte:

Y = a + b1x1 + b2x2 ++bk xk + ei , onde:

Este material parte integrante do acervo do IESDE BRASIL S.A., 221


mais informaes www.iesde.com.br
Anlise de Regresso

a = intercepto do eixo y;

bi = coeficiente angular da i-sima varivel;

k = nmero de variveis independentes.

Enquanto uma regresso simples de duas variveis resulta na equao de


uma reta, um problema de trs variveis resulta um plano, e um problema de
k variveis resulta um hiperplano.

Tambm na regresso mltipla, as estimativas dos mnimos quadrados so


obtidas pela escolha dos estimadores que minimizam a soma dos quadrados
dos desvios entre os valores observados Yi e os valores ajustados Y .

Na regresso simples:

b = aumento em Y, decorrente de um aumento unitrio em X.

Na regresso mltipla:

bi = aumento em Y se Xi for aumentado de 1 unidade, mantendo-se cons-


tantes todas as demais variveis Xj.

Atividades de aplicao
1. Os encargos dirios com o consumo de gs propano (Y) de uma em-
presa dependem da temperatura ambiente (X). A tabela seguinte apre-
senta o valor desses encargos em funo da temperatura exterior:

Temperatura (C) 5 10 15 20 25
Encargos (dlares) 20 17 13 11 9

Seja Y = 0 + 1X + o correspondente modelo de regresso linear.

a) Determine, usando o mtodo dos mnimos quadrados, a respecti-


va reta de regresso e represente-a no diagrama de disperso.

b) Quantifique a qualidade do ajuste obtido e interprete.

c) Determine um intervalo de confiana a 95% para os encargos m-


dios com gs propano num dia em que a temperatura ambiente
de 17oC.
222 Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Regresso

2. Suponha que um analista toma uma amostra aleatria de 9 carrega-


mentos feitos recentemente por caminhes de uma companhia. Para
cada carregamento, registra-se a distncia percorrida em km (X) e o
respectivo tempo de entrega (Y). Obteve-se:

x i
= 6.405; y i
= 23, 5; x 2
i
= 5.628.075; y 2
i
= 74, 75; x y y i = 20.295

a) Estime, usando o modelo de regresso linear, o tempo esperado


de entrega para uma distncia de 1 050km.

b) Comente a afirmao o tempo de entrega explicado em aproxi-


madamente 94% pela distncia percorrida.

3. Seja Y o nmero de chamadas telefnicas atendidas num determinado


servio de atendimento a clientes decorridos X minutos aps as 8h30.
Em determinado dia da semana observaram-se os seguintes pares de
valores:

Tempo aps 8h30(min) 1 3 4 5 6

Nmero de chamadas atendidas 2 5 10 11 12

Seja Y = 0 + 1X + o correspondente modelo de regresso linear.

a) Estime 0 e 1 usando o mtodo dos mnimos quadrados e re-


presente a correspondente reta de regresso no diagrama de
disperso.

b) Determine o correspondente coeficiente de determinao,


bem como o coeficiente de correlao; como voc interpreta
os valores obtidos?

c) Estime a varincia do erro.

d) Seja E [Y (2)] = E [Y | x = 2]. Estime E [Y (2)]; determine um inter-


valo de confiana para E [Y (2)] com 95% de confiana.

Este material parte integrante do acervo do IESDE BRASIL S.A., 223


mais informaes www.iesde.com.br
Anlise de Regresso

Gabarito

1. B 1 = x .y n.y.x = 910 5.14.15 = 0,56


i i

x n.x 1375 5.225


2
i
2

B 0 = y B 1.x = 14 ( 0,56).15 = 22,4


^
Ento Y = 22,4 0,56X.

70
b) Dado que y = =14
5
n n
2 2
SQreg = (Yi y) = (22,4 0,65xi 14) =78,4
i=1 i=1

n n
SQres = (y i Yi )2 = (y i 22,4 0,65xi )2 = 1,6
i=1 i=1

SQtotal = 78,4 + 1,6 = 80

Fonte de
g.l. S.Q. Q.M. F p-valor
Variao
Regresso 1 78,4 78,4 147 < 0,001
Resduos 3 1,6 0,53
Total 4 80 20

224 Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br
Anlise de Regresso

A regresso pode ser considerada altamente significativa (p < 0,001).


O coeficiente de determinao calculado a partir dos dados da Ano-
va, r2 = 78,4/80 = 0,98. Pode se considerar bastante satisfatria a
qualidade do ajuste.
n
y y
2
80
c) S2y = i=1
= =16
n 5
^ 2 2

= Sy . 1 r = 16. 1 0,98 =0,565
^
Y = 22,4 0,56 . 17 = 12,88

2.

a)
B 1 =
x .y n.y.x = 20 295 9.2,61.711,67 = 3 577,87 = 0,00334
i i

x n.x 5 628 075 9. 711,66 106 993,4


2 2 2
i

^
Ento Y = 0,234 + 0,00334.X = 0,234 + 0,00334 . 1 050 = 3,741 dias

b) Isto significa que 94% da variao do tempo de entrega est asso-


ciada distncia a ser percorrida e outras variveis como: regio
urbana ou rural, clima durante o percurso, treinamento do moto-
rista etc., so responsveis pelos demais 6%. No entanto, essas va-
riveis no foram observadas nesse estudo.

3.

a) B 1 =
x .y n.y.x = 184 5.8.3,8 = 32 =2,16
i i

x n.x 87 5. 3,8 14,8


2 2 2
i

B 0 = y B 1.x=8 2,16.3,8= 0,21


^
Ento Y = 0,21 + 2,16.X

Este material parte integrante do acervo do IESDE BRASIL S.A., 225


mais informaes www.iesde.com.br
Anlise de Regresso

n n
b) SQreg = (Yi y)2 = ( 0,21 +2,16xi 8)2 = 69,05
i=1 i=1

n n
SQres = (y i Yi )2 = (y i +0,21 2,16xi )2 = 4,8109
i=1 i=1

SQtotal = 69,05 + 4,8109 = 73,8609


SQres 69,05
Assim r2 = = =0,9349 e r = r 2 = 0,9668
SQtotal 73,86
O coeficiente de determinao calculado nos indica que bastante
satisfatria a qualidade do ajuste. A relao entre as duas variveis
pode ser considerada bastante forte, pela anlise do coeficiente de
correlao.

(y 2
Y) 4,8109
u=
c) S = = 1,266
n 2 3

d) E [Y (2)] = 0,21 + 2,16 . 2 = 4,11


^
u ] = [4,113,18.1,266] = [0,08; 8,13]
[ Y tn 2; A/2 .S

226 Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Referncias

BUSSAB, W. O.; MORETIN, P. A. Estatstica Bsica. 4. ed. So Paulo: Saraiva, 2003.

BARROS, Emilio. Aplicaes e Simulaes Monte Carlo e Bootstrap. Monografia


(Bacharelado em Estatstica) Universidade Estadual de Maring, Maring, 2005.
Disponvel em: <www.des.uem.br/graduacao/Monografias/Monografia_Emilio.
pdf.>. Acesso em: 23 nov. 2007.

CAMPOS, G. M. Estatstica Prtica para Docentes e Ps-Graduados. Disponvel em:


<www.forp.usp.br/restauradora/gmc/gmc_livro/gmc_livro_cap14.html>. Acesso
em: 23 nov. 2007.

COSTA NETO, P. L. de O. Estatstica Bsica. 2. ed. So Paulo: Edgard Blcher, 2002.

GONALVES, Lren Pinto Ferreira. Avaliao de Ferramentas de Minerao de


Dados como Fonte de Dados Relevantes para a Tomada de Deciso: aplica-
o na Rede Unido de Supermercados. Dissertao (Mestrado Interinstitucio-
nal em Administrao) Universidade da Regio da Campanha (Urcamp), So
Leopoldo, 2001. Disponvel em: <http://volpi.ea.ufrgs.br/teses_e_dissertacoes/
td/000410.pdf>

HOAGLIN, D. C.; MOSTELLER, F.; TUKEY, J. W. Anlise Exploratria de Dados


Tcnicas Robustas. Lisboa: Edies Salamandra, 1983.

HOEL, PORT & STONE. Introduo Teoria da Probabilidade. Rio de Janeiro: Edi-
tora Intercincia ,1981.

KAZMIER, L. J. Estatstica Aplicada Economia e Administrao. 4. ed. So


Paulo: Bookman 2007.

LANDIS JR, Koch GG. The measurement of observer agreement for categorical
data. Biometrics 1977.

LEVINE, D. M.; BERENSON, M. L.; STEPHAN, D. et al. Estatstica: Teoria e


Aplicaes Usando Microsoft Excel. 3. ed. Rio de Janeiro: LTC, 2005.

MATTAR, F. N. Pesquisa de Marketing. So Paulo: Atlas, 2001.

______. So Paulo: Atlas, 1996. (Edio compacta).

Este material parte integrante do acervo do IESDE BRASIL S.A., 247


mais informaes www.iesde.com.br
Referncias

MEYER, P. L. Probabilidade: Aplicaes Estatstica. 2. ed. Rio de Janeiro: LTC,


2000.

SIEGEL, S.; CASTELLAN JR., N. J. Estatstica No Paramtrica para Cincias do


Comportamento. Porto Alegre: Artmed, 2006.

TRIOLA, M. F. Introduo Estatstica. 9. ed. Rio de Janeiro: LTC, 2005.

VIEIRA, S., WADA, R. O que Estatstica? 3. ed. So Paulo: Brasiliense, 1991.

WONNACOT, T. H. WONNACOTT, R. J. Estatstica Aplicada Economia e Admi-


nistrao. Rio de Janeiro: LTC, 1981.

248 Este material parte integrante do acervo do IESDE BRASIL S.A.,


mais informaes www.iesde.com.br

Vous aimerez peut-être aussi