Vous êtes sur la page 1sur 18

Aulas 10 Anlise de Correlao e regresso:

procedimentos e interpretao

Ciro de Miranda Pinto

Redeno, CE, 2014


1INTRODUO

O estudo da associao de variveis desdobrado em dois


componentes, anlise de regresso e anlise de correlao
que servem para partindo da amostra, inferir como as duas
ou mais variveis esto relacionadas.

A correlao apenas d o grau de relacionamentos.

A anlise de regresso, vai mais alm, pois descreve o


relacionamento atravs de uma equao matemtica.
1 INTRODUO
A anlise de regresso linear simples visa estudar o efeito de uma
varivel, designada varivel independente, explanatria e ou regressora
(X), sobre uma varivel, designada de varivel dependente ou varivel
resposta (Y).
Peso ao nascer (X) e peso ao desmame (Y) em bovinos
Peso dos animais (Y) e idade (X)
Peso ao abate (Y) e teor de fibra na rao (X) p/ coelhos
Produtividade de amendoim (Y) e nveis de irrigao (X)
Produtividade do milho (Y) e doses de nitrognio (X)
Demanda (Y) e preo (X) de um produto
Oferta (Y) e preo (X) de um produto
Despesa com gneros alimentcios (Y) e renda (X)
Correlao - utilizada para determinar se h alguma relao,
estatisticamente significativa, entre duas variveis.
Diagrama de Disperso
Coeficiente de Correlao
2 Regresso Linear Simples
Parmetro Populacional Estatstica Amostral

Intercepto Y da equao de regresso 0 b0


Coeficiente angular da equao de regresso 1 b1
Equao da reta de regresso Y 0 1X i
Y b 0 b 1 X

min d i
2
(Yi Yi ) 2
Equaes normais
Y nb b X
0 1

XY b X b XY
0 1

Frmulas de mnimos quadrados

XY
X Y
b1 n

2
X
X 2

n

b 0 Y b1 X
EXEMPLO
Um estudo foi realizado sobre zonas de compactao em perfis de um solo,
obtendo-se os seguintes dados de densidade (g/cm3) em diferentes profundidades
X (cm).

Total
X(cm) 10 15 20 25 30 35 40 45 50 55 325
Y(gcm3) 1,388 1,426 1,393 1,341 1,269 1,160 1,177 1,153 1,140 1,139 12,577
Desvios Produto
X Y x=Xi-X y=Yi-Y xy xx yy
10 1,388 -22,5 0,1303 -2,932 506,3 0,017
15 1,426 -17,5 0,1683 -2,945 306,3 0,028
20 1,393 -12,5 0,1353 -1,691 156,3 0,018
25 1,341 -7,5 0,0833 -0,625 56,25 0,007
30 1,26 -2,5 0,0023 -0,006 6,25 5E-06
35 1,16 2,5 -0,0977 -0,244 6,25 0,01
40 1,177 7,5 -0,0807 -0,605 56,25 0,007
45 1,153 12,5 -0,1047 -1,309 156,3 0,011
50 1,14 17,5 -0,1177 -2,06 306,3 0,014
55 1,139 22,5 -0,1187 -2,671 506,3 0,014

Total 325 12,58 -15,09 2063 0,126


Mdia 32,5 1,258 Sxy Sxx Syy
O modelo de regresso ajustado (estimado) :
3 Coeficiente de Correlao (r )
Mede o grau de relacionamento linear entre os valores emparelhados X e Y
em uma amostra.

XY
X Y
r n

2 2
X Y
X
2
Y
2

n n

Variao: -1 r 1
Exemplo

XY X Y
r n

2 2
X Y
X
2
Y
2

n n

TESTES DE HIPTESES
H 0 : 1 =0 vs. H 1 : 1 0

FV GL SQ QM F
Reg. Linear (RL) 1 SQRL QMRL QMRL/QMR
Resduo (R) n-2 SQR QMR
Total n-1 SQTotal
( Y )2
S Q T o tal = Y -
2
SQRL
n QMRL = QMRL
X Y
2
GLRL F=
X Y - QMR
n
S Q RL = SQR
2
X QMR =
2

X -
n GLR
S Q R = S Q T o ta l -S Q R L
FV GL SQ QM F
RL 1 0,1104 0,1104 58,10**

Resduo 8 0,0151 0,0019 -

Total 9 0,1255 -

Concluso: F calculado (58,10)>F crtico (F0,01(1; 8)=11,26) ento rejeito H0


Teste de significncia para r
H0: = 0 (no existe correlao linear entre X e Y)
H1: 0 (existe correlao linear entre X e Y).
n 2
t r
1 r2
Dados do exemplo de aplicao: r = -0,93 e n=10

Concluso
Como t calculado (= 7,1564 ) > t tabelado /2;n-2 (=2,306) ento
Rejeita-se H0: = 0

Coeficiente de Determinao
Valores crticos da distribuio t de Student
Regresso Linear para Dados Repetidos
Os dados abaixo se referem a um experimento em blocos ao acaso com a planta
medicinal conhecida popularmente como macela (Egletes viscosa) cujos valores
observados da produo de captulos (g planta-1), em sete pocas de colheita realizadas
aps o transplantio (dias aps o transplantio DAT) esto apresentados abaixo.

pocas Blocos
de Colheita (DAT) 1 2 3 4 Total Mdia
75 21,12 12,05 20,07 35,1 88,34 22,08
85 45,54 43,25 40,3 74,93 204,02 51,00
95 49,23 71,41 95,25 81,24 297,13 74,28
105 112,37 47,58 65,42 146,5 371,87 92,97
115 102,78 138,46 129,24 203,73 574,21 143,55
125 102,26 157,85 216,58 280,59 757,28 189,32
135 138,59 194,31 248,1 319,3 900,3 225,07
Total 571,89 664,91 814,96 1141,39 3193,15
a) Teste a hiptese H0: 1=0
b) Estime a equao de regresso linear e calcule o coeficiente de correlao
linear.
c) Verifique se o modelo representa adequadamente o fenmeno estudado
d) Comente sobre a aceitao ou rejeio das hipteses nula: H0: 1=0; H0: 0=0 e
H0: =0. Use o teste t de Student para fazer as inferncias.
e) Use o Excel para apresentar, graficamente, a reta estimada com a equao e o r2
(i) a) ANOVA para testar H0: 1=0 vs. H1: 10

X 75 4 85 4 95 4 105 4 115 4 125 4 135 4 2940


Y 3193,15
X 2
752 4 852 4 952 4 1052 4 1152 4 1252 4 1352 4 319900, 0
XY 75 88,34 85 204, 02 95 297,13 105 371,87 115 547, 21 125 757, 28 135 900,3
XY 373475,55
X Y
2
2940 3193,15
2

373475,55
XY
N 28 38194,82
SQRL 130253,8
X
2
29402 11200
319900
X 2

N 28

Fontes de Variao GL S.Q. Q.M. F F5% F1%


Regresso Linear 1 130253,80 130253,80 104,16** 4,41 8,29
Desvios de Regresso 5 3028,90 605,78 0,48 2,77 4,25
Tratamentos (6) 133282,70 - - - -
Blocos 3 26720,38 8906,79 7,12** 3,16 5,09
Resduo 18 22509,00 1250,50
Total 27 182512,08
b) Obteno da equao linear e do coeficiente de correlao linear
Coeficiente de regresso linear Coeficiente de correlao linear
X Y XY n
X Y
XY N 38194,8 r
38194,8
b1 3, 4102 11200 133282, 70

2 2 2
X 11200 X Y
X 2 Y 2
X 2

N

n

n

r 0,9886
Coeficiente linear da reta A reta estimada Y -244, 031 3, 4102 X
b0 Y b1 X
b0 114, 04 3, 4102 105 244, 031

c) Clculo do coeficiente de determinao


SQ RL 130253,80
R2 = = 0,9773 ou 97,73%
SQTrat 133282,70
d) Testes de hipteses para os parmetros do modelo
1a Hiptese: Inclinao H0: 1=0 vs. H1: 10
b 3, 4102 S R2 1250,5 ttabelado t0,005 (26) 2, 779
t 1 10, 207 Sb1 0,3341
Sb1 0,3341 S xx 11200
Como t=10,207 est fora do intervalo [-2.779 ; 2,779], a hiptese nula
rejeitada, ou seja, a inclinao da reta diferente de zero.
2a Hiptese: Interseo H0: 0=0 vs. H1: 00

b 244, 031 1 X2 1 1052


t 0 6,832 Sb0 S R 35,3624 35, 7176
Sb0 35, 7176 n S xx 28 11200
Como t =-6,832 est fora do intervalo [-2.779; 2,779], a hiptese nula rejeitada, ou seja, a
reta terica no passa pela origem.
3a Hiptese: Correlao Linear H0: =0 vs. H1: 0
n2 10 2
tr 0,9886 18,571
1 r 2
1 0,9886 2

Como t =18,571 est fora do intervalo [-2.779; 2,779], a hiptese nula rejeitada, ou seja, h
uma forte correlao linear entre a produo de captulos e a poca de colheita de macela.

Vous aimerez peut-être aussi