Vous êtes sur la page 1sur 3

1

3. Correlação

Definição: Correlação é uma relação entre duas variáveis. Os dados podem ser
representados por pares ordenados (x, y), onde x é a variável independente
e y a variável dependente de x.

Mapa de dispersão pode ser usado para verificar se existe uma correlação
significativa entre duas variáveis.

3. Regressão Linear

MÉTODO DOS MÍNIMOS QUADRADOS

Após ter verificado que a correlação entre duas variáveis é significante, o


próximo passo é ajustar uma função que melhor represente os dados. Essa reta é
chamada de regressão linear e sua equação pode ser usada para prever o valor da
variável y.

Definição: Uma reta de regressão, também chamada de reta de ajuste ótimo, é a reta
ajustada de modo que a soma dos quadrados dos resíduos/erros/diferença
é mínima.

Considere a seguinte amostra referente a conformação de chapas. A tabela


abaixo apresenta os dados do comprimento da chapa em função da temperatura. Na
sequência, os dados são plotados e ajustados com a reta linear.

Temperatura (°C) 10 15 20 25
Comprimento (mm) 1003 1005 1010 1011

1
2

1013
1012
1011 - 0,5
1010

Comprimento (mm)
1009 1,2
1008
1007
1006
- 0,8
1005
1004
1003
1002
5 10 15 20 25 30
Temperatura (°C)

Em cada ponto obtemos um erro de predição:


1003 – 1002,9 = 0,1
1005-1005,8 = -0,8 Resíduo
1010-1008,8 = 1,2
1011-1011,5= -0,5
0,1 - 0,8 + 1,2 - 0,5 = 0 (0,1)2 +(-0,8)2 + (1,2)2 + (- 0,5)2 = 2,34

A equação da reta ajustada deve proporcionar a menor soma dos quadrados


dos erros. Por isso é chamada de ajuste pela reta de mínimos quadrados. A equação
da reta ajustada é dada por:

𝑦̂ = 𝑎 + 𝑏𝑥

∑𝑥 ∑𝑦 (∑ 𝑥)2 (∑ 𝑥).(∑ 𝑦)
onde, 𝑥̅ = , 𝑦̅ = , 𝑆𝑥𝑥 = ∑ 𝑥 2 − , 𝑆𝑥𝑦 = ∑ 𝑥𝑦 −
𝑛 𝑛 𝑛 𝑛

𝑆𝑥𝑦
e finalmente, 𝑏 = 𝑆 e 𝑎 = 𝑦̅ − 𝑏𝑥̅
𝑥𝑥

Exemplo: Obtenha a equação da reta de regressão pelo método dos mínimos


quadrados da distância (em metros) da frenagem em uma superfície seca,
em função do peso (em kg) do veículo.

Peso 2595 1837 2781 2268 2272 1937 2495 2517


Distância 0,67 0,41 0,79 0,53 0,54 0,52 0,55 0,57

Use a equação da reta ajustada para prever o valor de y se x = 2000 (interpolação)


kg e x = 3000 kg (extrapolação).

Coeficiente de Correlação (r)

2
3

Definição: O coeficiente de correlação é uma medida da intensidade da relação


entre duas variáveis. Os valores de r variam entre 0 < r < 1.

Assim, se r = 1 a correlação entre as variáveis é perfeita,


se r = 0 não existe correlação.
2
2 (𝑆𝑥𝑦 )
Cálculo do coeficiente de determinação: 𝑅 =𝑆
𝑥𝑥 .𝑆𝑦𝑦

𝑆𝑥𝑦
Cálculo do coeficiente de correlação: 𝑟=
√𝑆𝑥𝑥 .𝑆𝑦𝑦

(∑ 𝑥)2 (∑ 𝑦)2 (∑ 𝑥).(∑ 𝑦)


onde, 𝑆𝑥𝑥 = ∑ 𝑥 2 − , 𝑆𝑦𝑦 = ∑ 𝑦 2 − 𝑆𝑥𝑦 = ∑ 𝑥𝑦 −
𝑛 𝑛 𝑛

Exemplo: Determinar o coeficiente de determinação R2 do exemplo anterior.

Atividade.

1) Considere a amostra referente a variação do custo final (em reais) de produção de


lotes de lápis preto (exemplo fictício).

Custo 16 25 39 45 49 64 70 73 79 81
Grafite 109 122 143 132 199 185 199 203 245 253
Madeira 96 85 82 74 95 68 76 84 58 65

Determine:
a) Construa o gráfico de dispersão para o custo final em função do custo do grafite;
b) Construa o gráfico de dispersão para o custo final em função do custo da madeira
b) Ajuste linear e R2;
c) Compare os coeficientes de correlação e verifique quais custos (grafite ou madeira)
possuem maior correlação com o custo final do produto;
c) Qual seria o custo final de produção prevista para R$ 55,00 em grafite?
d) Qual seria o custo final de produção prevista para R$ 80,00 em madeira?
e) Qual seria o custo em madeira para um custo final de produção de R$ 70,00, R$
75,00 e R$ 100?

Vous aimerez peut-être aussi