Académique Documents
Professionnel Documents
Culture Documents
Bittencourt Guimares
Introduo
Os modelos de regresso so largamente utilizados em diversas reas do
conhecimento tais como: computao, administrao, engenharias, biologia,
agronomia sade, sociologia etc. O principal objetivo dessa tcnica obter
uma equao que explique satisfatoriamente a relao entre uma varivel
resposta e uma ou mais variveis explicativas, possibilitando fazer predio
de valores da varivel de interesse. Este relacionamento pode ser por uma
equao linear ou uma funo no linear, conforme figura abaixo:
y y
x x
Linear No linear
Figura 1 Formas lineares e no lineares de relao entre pares de variveis.
exatamente sobre esta linha reta. Existe uma diferena entre o valor obser-
vado e o valor fornecido pela equao. Essa diferena, denominada erro e re-
presentada por , uma varivel aleatria que quantifica a falha do modelo
em ajustar-se aos dados exatamente. Tal erro pode ocorrer devido ao efeito,
entre outros, de variveis no consideradas e de erros de medio. Incorpo-
rando esse erro equao anterior temos:
Y = a + b.X +
Y = 80,5 + 0,9.X
Exemplo 3: Uma certa pea manufaturada por uma companhia, uma vez
por ms, em lotes, que variam de tamanho de acordo com as flutuaes na
demanda. A tabela abaixo contm dados sobre tamanho do lote e nmero
de horas gastas na produo de 10 recentes lotes produzidos sob condies
similares. Esses dados so apresentados graficamente na Figura 4, tomando-
se horas-homem como varivel dependente ou varivel resposta (Y) e o tama-
nho do lote como varivel independente ou preditora (X).
Observa-se que grande parte dos pontos da figura no cai diretamente sobre
a linha de relacionamento estatstico. A disperso dos pontos em torno da linha
de relacionamento representa a variao em horas que no associada ao ta-
manho do lote, e que usualmente considerada aleatria. Relaes estatsticas
so geralmente teis, mesmo no tendo uma relao funcional exata.
Com base nos n pares de observaes (y1 ,x1) , (y2,x2) ,... , ( yn, xn) , o mtodo
de estimao por MQO consiste em escolher a e b de modo que a soma dos
quadrados dos erros, i (i=10 ,..., n), seja mnima.
n n
SQ= Ei2 .y i
a
b.xi
i=1 I-1
x i .y i
n.y.x
b= 2 2
x i
n.x
a = y
b.x
onde y a mdia amostral dos yi s e x a mdia amostral dos xi s.
214 Este material parte integrante do acervo do IESDE BRASIL S.A.,
mais informaes www.iesde.com.br
Anlise de Regresso
2
X = 30 Y = 107, 5 Xi = 19 000
2
X = 50 Y = 110 Xi = 28 400
Y = 10 + 2.X +
Onde:
n = numero de observaes.
Exemplo 2:
nn n
(Y
SQreg = y)22 = (80, 5 + 0, 9x i
107, 5)2 = 810
(Yii
y)
i=1
i=1 i=1
Exemplo 3:
n n
2 2
Yii
y) = (10 + 2x i
110) = 13 600
SQreg = (Y
i=1 i=1
n n
2 2
SQtotal = (y i
y) = (y i
107, 5) =13 660
i=1 i=1
Su = S2y . 1
r 2
n 2
y
y
onde S2 = i=1
y
n
Y t
n
2 ; A / 2 . Su
Su = S2y . 1
r 2 = 68, 65. 1
0, 59 = 5, 30
[Y tn
2; A/2 .S
u ] = [112 2,10 . 5, 30] = [ 100, 87 ; 123,13 ]
Ou seja, para uma pessoa com 35 anos, o tempo de reao predito estaria
entre 100,87 e 123,13 segundos, com 95% de confiana.
Su = S2y . 1
r 2 = 1 366. 1
0, 996 = 2, 34
2
Anlise de Resduos
^
Os desvios ei = yi yi ( i = 1, ..., n) so denominados resduos e so conside-
rados uma amostra aleatria dos erros. Por esse fato, uma anlise grfica dos
resduos , em geral, realizada para verificar as suposies assumidas para os
erros i.
Resduos brutos;
Resduos padronizados;
Resduos estudentizados.
a = intercepto do eixo y;
Na regresso simples:
Na regresso mltipla:
Atividades de aplicao
1. Os encargos dirios com o consumo de gs propano (Y) de uma em-
presa dependem da temperatura ambiente (X). A tabela seguinte apre-
senta o valor desses encargos em funo da temperatura exterior:
Temperatura (C) 5 10 15 20 25
Encargos (dlares) 20 17 13 11 9
x i
= 6.405; y i
= 23, 5; x 2
i
= 5.628.075; y 2
i
= 74, 75; x y y i = 20.295
Gabarito
70
b) Dado que y = =14
5
n n
2 2
SQreg = (Yi
y) = (22,4
0,65xi
14) =78,4
i=1 i=1
n n
SQres = (y i
Yi )2 = (y i
22,4
0,65xi )2 = 1,6
i=1 i=1
Fonte de
g.l. S.Q. Q.M. F p-valor
Variao
Regresso 1 78,4 78,4 147 < 0,001
Resduos 3 1,6 0,53
Total 4 80 20
2.
a)
B 1 =
x .y
n.y.x = 20 295
9.2,61.711,67 = 3 577,87 = 0,00334
i i
^
Ento Y = 0,234 + 0,00334.X = 0,234 + 0,00334 . 1 050 = 3,741 dias
3.
a) B 1 =
x .y
n.y.x = 184
5.8.3,8 = 32 =2,16
i i
n n
b) SQreg = (Yi
y)2 = (
0,21 +2,16xi
8)2 = 69,05
i=1 i=1
n n
SQres = (y i
Yi )2 = (y i +0,21
2,16xi )2 = 4,8109
i=1 i=1
(y
2
Y) 4,8109
u=
c) S = = 1,266
n
2 3
HOEL, PORT & STONE. Introduo Teoria da Probabilidade. Rio de Janeiro: Edi-
tora Intercincia ,1981.
LANDIS JR, Koch GG. The measurement of observer agreement for categorical
data. Biometrics 1977.