Vous êtes sur la page 1sur 30

Correlação e Regressão

Prof.: Evaldo Márcio


Relação entre variáveis
Procuramos identificar a relação entre duas variáveis,
como por exemplo:
– o peso pode estar relacionado com a idade das
pessoas;
– o consumo das famílias pode estar relacionados com
sua renda;
– a venda de um produto pode estar relacionado à
quantidade de anúncios/propaganda;
– a demanda pode estar relacionada com o preço.

A existência de relação entre as variáveis e grau de


relação é o que caracteriza o objeto da CORRELAÇÃO.
Uma vez caracterizada, procura-se descrever uma relação
sob forma matemática, através de uma função. A
estimação dos parâmetros dessa função matemática é o
objeto da REGRESSÃO.
Correlação Linear Simples
O estudo da correlação tem por objetivo medir e avaliar o grau de
relação existente entre duas variáveis aleatórias.
Assim, podemos medir se a relação entre os nºs de filhos de uma
família à sua renda é forte, fraca ou nula.

Σ
Variável independente será a variável X
Variável dependente será a variável Y
                                                                            
                                   y
 
Um dos instrumentos de medida da correlação linear simples é dado
pelo coeficiente de correlação de PEARSON:

                  ΣXY - (ΣX) (ΣY)


r = n .
X,Y        
ΣY² - (ΣY)² . ΣX² - (ΣX)²
n n
Correlação Linear Simples
É uma variação entre
 os elementos Sxy
 de X e Y. 

Σ                   ΣXY - (ΣX) (ΣY)


n .
r X,Y        
=
ΣX² - (ΣX)² . ΣY² - (ΣY)²
n n
Syy
É uma variação dos 
Sxx elementos de X e de Y.
Correlação Linear Positiva

x
A correlação será positiva se os valores crescentes
de X estiverem associados a valores crescentes de
Y, ou valores decrescente de X estiverem
associados a valores decrescentes da variável Y.
0 < rXY < 1
Correlação Linear Perfeita
Positiva
y

Acontece quando o os pontos X e Y estão


perfeitamente alinhados.

rXY = 1
Correlação Negativa

x
A correlação é considerada negativa quando valores
crescentes da variável X estiverem associados a valores
decrescentes da variável Y, ou valores decrescentes de X
associados a valores crescentes da variável Y.

-1 < rXY < 0


Correlação Perfeita Negativa

Quando os pontos estiverem perfeitamente


alinhados, mas em sentido contrário.

rXY = 1
Correlação Nula

Quando não houver relação entre as variáveis X e


Y, ou seja, quando as variações de X e Y
ocorrerem independentemente não existe correlação
entre elas.

rXY = 0
Os diagramas mostram que a
correlação poderá ser:

-1 -0,75 -0,5 0 0,5 0,75 1

FRACA quando rXY ≤ 0,5

MÉDIA quando 0,5 < rXY ≤ 0,75

FORTE quando rXY > 0,75


Exercício 1

Certa empresa estudando a variação da demanda 
de seu produto em relação à variação de preço de 
venda, obteve a tabela:
 
a)       Desenhe o gráfico de dispersão;
b)       Determine o coeficiente de correlação;
c)       Determine a reta ajustada;
d)       Determine o coeficiente de determinação R².
Vamos analisar o que já vimos neste
exercício:
PREÇO (X) DEMANDA (Y)
1 38 350
2 42 325
3 50 297
4 56 270
5 59 256
6 63 246
7 70 238
8 80 223
9 95 215
10 110 208
Σ 663 2628
Podemos observar :
• Que a medida que o preço aumenta a demanda diminui, ou seja, os
valores crescente da variável X estão associados aos valores
decrescente da variável Y;
• Então já podemos analisar que a Correlação será NEGATIVA.
Desenho do Gráfico de Dispersão
DEMANDA (Y)

500
400
300
200
100
0
0 20 40 60 80 100 120
PREÇO (X)

Y = a + bx
Determine o Coeficiente de Correlação

PREÇO DEMANDA
(X) (Y) X² Y² X.Y
1 38 350 1.444 122.500 13.300
2 42 325 1.764 105.625 13.650
3 50 297 2.500 88.209 14.850
4 56 270 3.136 72.900 15.120
5 59 256 3.481 65.536 15.104
6 63 246 3.969 60.516 15.498
7 70 238 4.900 56.644 16.660
8 80 223 6.400 49.729 17.840
9 95 215 9.025 46.225 20.425
10 110 208 12.100 43.264 22.880
663 2628 48.719 711.148 165.327

                  ΣXY - (ΣX) (ΣY)


r = n .
X,Y        
ΣY² - (ΣY)² . ΣX² - (ΣX)²
n n
Achando o Coeficiente de Correlação
                  ΣXY - (ΣX) (ΣY)
APLICA-SE A FÓRMULA :  r = n .
X,Y        
ΣY² - (ΣY)² . ΣX² - (ΣX)²
n n
Σ PREÇO (X)
663
DEMANDA (Y)
2628

48719

711148
X.Y
165327

                  165.327 - 663 . 2.628


10 . A
r = Correlação entre
X,Y        
o PREÇO e a DEMANDA
. 711.148 - (2.628)² . 48.719 - (663)²
é
r = - 8.909,4010 . 10
FORTE E NEGATIVA
X,Y         20.509,60 . 4.762,10

r = - 8.909,40
X,Y         9.882,75

r = - 0,9015
X,Y        
Correlação Ordinal

Uma medida alternativa da correlação é dada


pelo coeficiente de Spearman, que leva em
conta as posições que os valores das
variáveis ocupam ordenados na forma
crescente ou decrescente.

2
6d
r  1 i
n(n ²  1)
Análise de Regressão

A análise de regressão tem por objetivo descrever


através de um modelo matemático, a relação existente
entre duas variáveis, a partir de n observações dessas
variáveis.

A variável Y é a variável aleatória que é explicada pela


variável X.

A reta ajustada é representada por Υ = a + bx onde ae


b são os parâmetros do modelo.
Análise de Regressão

Para obter o valores de a e b usaremos as fórmulas


abaixo :

ΣYX - ΣY ΣX
a = ΣY - b ΣX b= n _
n n ΣX² - (ΣX)²
n

Depois que achar os valores de a e de b substitui na


equação da reta
Determinando a reta ajustada
Observe que
1º PASSO : achar o valor do coeficiente b  já calculamos no
 exercício anterior 
algumas variáveis.

b=
ΣYX - ΣY ΣX
n _
b =
Sxy
ΣX² - (ΣX)² 3º PASSO :
n
Sxx
Υ = a + bx
-8.909,40
b =   4.762,10 b = -1,87
Υ = 386,78 + -1,87x
2º PASSO : achar o valor do coeficiente a
a = ΣY - b ΣX
n n
2.628   -   (-1,87) .  663 a = 386,78
a =    10                           10
Achando os valores da equação ajustada

PREÇO DEMANDA RETA Υ


(X) (Y) X² Y² X.Y AJUSTADA
1 38 350 1.444 122.500 13.300 315,72
2 42 325 1.764 105.625 13.650 308,24
3 50 297 2.500 88.209 14.850 293,28
4 56 270 3.136 72.900 15.120 282,06
5 59 256 3.481 65.536 15.104 276,45
6 63 246 3.969 60.516 15.498 268,97
7 70 238 4.900 56.644 16.660 255,88
8 80 223 6.400 49.729 17.840 237,18
9 95 215 9.025 46.225 20.425 209,13
10 110 208 12.100 43.264 22.880 181,08
663 2.628 48.719 711.148 165.327 2.627,99

Υ = 386,78 + -1,87x
Υ = 386,78 + (-1,87). 38 = 315,72

Υ = 386,78 + (-1,87). 42 = 308,24


e assim.... até o último valor.
Incluindo os valores da reta
ajustada
400
350
300
250
200
150
100
50
0
0 20 40 60 80 100 120
PREÇO (X)

Y = a + bx Y = a + bx
Coeficiente de Determinação
O coeficiente de determinação tem por objetivo
avaliar a qualidade do ajuste.
Podemos observar que quanto mais próximo de
zero pior será o ajuste; quanto mais próximo de 1
ou 100 melhor será o ajuste.

         1 -    Σ ^
( y - y )²    b² . Sxx
R² = OU R² =
Σ  y² - (Σ y)²    Syy
        n
b² . Sxy 0 < R² 1
OU R² = Pior  Melhor
       Syy AJUSTE AJUSTE
Achando o Coeficiente de
Determinação
b² . SXX
R² =
   SYY
R² = (-1,87)² . 4.762,10 R² = 0,8119
      20.509,60
O ajuste é BOM, porque em em
81% dos casos a variável de
demanda explica a variável de
R² = 0,81 preço, sendo o restante explicado
por outra varáveis.
Ex.: tipo de produto; qualidade no
serviço, etc.
Exercício 2
Foi feito um estudo com 40 mulheres em duas cidades 
e  obteve-se as seguintes equações de regressão e seus 
respectivos de determinação. 
Cidade A Cidade B
Y = 80,78+1,138x Y = 50,79 + 2,311x
R² = 0,90 R² = 0,77

Sabe-se que a variável X indica as idades das mulheres 
e Y suas respectivas pressões arteriais. Com base 
nessas informações responda:
a) Qual será a pressão arterial de uma mulher de 45 
anos nas respectivas cidades?
Cidade A  Cidade B
Y= 80,78 + 1,138x Y = 50,79 + 2,311x
Y= 80,78 + 1,138 . 45 Y = 50,79 + 2,311. 45
Y= 131,99 pressão arterial Y = 154,78 pressão arterial

b) Na sua opinião qual é o melhor modelo ajustado? 
Justifique sua resposta! 
O modelo ajustado na cidade A é o que explica melhor o 
fenômeno pressão arterial em função da idade, pois na 
cidade A em 90% dos casos de pressão arterial é 
explicada em função da variável idade; enquanto que na 
cidade B em mais de 77% dos casos a variável pressão 
arterial é explicada em função da idade. 
Exercício 3
De acordo com os valores acima determine:

a) Qual o valor da Correlação? Interprete esse resultado;
b) Qual é a reta de regressão? Interprete esse resultado;
c) Na sua opinião o modelo ajustado é bom? Justifique 
sua resposta!
 
a)    r= 0,9971
Interpretação: 
A correlação é FORTE E POSITIVA entre as variáveis 
de demanda e o tempo da empresa no mercado. 

b)  y= a+bx
y= 1,1920 + 4,2954 x 
É a reta de regressão quanto ao resultado podemos
analisar que na abertura da empresa, ou seja, o
tempo igual a 0 (zero) , a demanda inicial da
empresa será de 1,2, de acordo com a variável tempo
da empresa no mercado multiplicado por da 4,3 + a
demanda inicial que é 1,2 , estaremos definidos a
demanda atual.
c)  R² = 0,9943
O modelo ajustado é BOM, porque em mais de
99% dos casos a variável demanda é explicada
pelo tempo da empresa no mercado e o restante
por outras variáveis a saber.
Ex.: localidade da empresa, qualidade no serviço,
tempo de produto etc.
d) calcule os valores previstos para a demanda 
e os seus respectivos erros, usando o modelo 
ajustado e os valores dos tempos  das empresas 
no mercado descritos abaixo.
ANÁLISE DOS RESÍDUOS (ERROS)

15
10
5
RESÍDUOS

0
RESÍDUOS
-5 0 5 10 15 20 25

-10
-15
-20
TEMPO
 
TEMPO DA EMPRESA NO DEMANDA RESÍDUOS
MERCADO y (y–y)
4 29,37 18,37 11
5 26,67 22,67 4
6 27,96 26,96 1
8 39,55 35,55 4
10 46,14 44,14 2
12 45,74 52,74 -7
15 58,62 65,62 -7
20 72,10 87,1 -15
80 346,15 344,82 5

( y-y ) = r
y – 18,37 = 11
Então:
Y = y + r
Y = 18,37 + 11 = 29

Vous aimerez peut-être aussi