Vous êtes sur la page 1sur 29

Korelasi dan Regresi Linier

1
Korelasi
 Menilai hubungan 2 variabel numerik
 Contoh:
1. Apakah ada hubungan antara umur
dengan tekanan darah sistolik
2. Apakah ada hubungan antara income
keluarga dengan IP mhs
3. Apakah ada hubungan antara umur
pasien dengan lama hari rawat
4. Apakah ada hubungan antara tinggi badan
(TB) dengan FEV1

 Diagram tebar (scatter-plot)


Sumbu X  Variabel Independen
Sumbu Y  Variabel Dependen
Page 2
Diagram tebar & garis regresi
Contoh Garis regresi FEV1 dengan tinggi badan
600

500

400

300

Yi  719,14  6,43 X i

200

100
140 150 160 170 180 190 200

height (cm)
Page 3
Korelasi
 Pola hubungan antara
2 variabel numerik
1. Linier:
- Positif
- Negatif

2. Non-Linier:
- Parabolik
- Exponensial Page 4
Korelasi
 Menilai kekuatan hubungan linier 2 var
numerik:
 Pearson’s Coefisien Correlation (r)
 Dari nilai r kita dapat menentukan:
a. Kekuatan hubungan(0 s.d 1)
b. Arah hubungan: (+/-)
 Kisaran nilai r antara 0 s.d 1:
0 = Tidak ada hubungan linier
1 = Ada hubungan linier sempurna
 Arah hubungan:
+ = Hubungan direct:semakin besar nilai X
semakin besar nilai Y
 - = Hubungan inverse:semakin besar nilai X
semakin kecil nilai Y
Page 5
Korelasi
ASUMSI
 Pearson’s Coef. Correlation hanya valid jika asumsi
berikut terpenuhi:
1. Untuk setiap nilai X, Nilai Y terdistribusi
secara normal
2. Untuk setiap nilai Y, Nilai X terdistribusi
secara normal
3. Perkalian antara nilai X dan Y terdistribusi
secara normal (bivariate normal distr.)

 Koefisien Determinasi (r2):


Melihat besarnya variasi variabel Y (dalam persen)
yang dapat dijelaskan oleh variabel X.
Misal r=0.8, r2=0.64. Artinya sebesar 64% variasi
nilai Y dapat dijelaskan oleh variabel X
Page 6
Korelasi: Data Lay-out dan perhitungan r
Subjek X X2 Y Y2 X.Y
1 X1 X12 Y1 Y12 XY1
. X. X. 2 Y. Y. 2 XY.
. X. X. 2 Y. Y. 2 XY.
n Xn Xn2 Yn Yn2 XYn
(X) = … (X2) … (Y)… (Y2)… (XY) = …

(  X ).(  Y )
(  XY ) 
r n
b
 xy * n   x y
 X     Y 
 x * n   x 
2 2 2
2
 ( X )   .  ( Y )  
2 2

 n   n 

r
 xy * n   x y
 x * n   x *  y * n   y 
2 2 2 2

Page 7
Korelasi
INTERPRETASI KOEF. KORELASI
 Kekuatan hubungan: (Subjektif)
r < 0.4 : Lemah
0.4< r <0.8 : Sedang
r > 0.8 : Kuat
 Korelasi tidak selalu berarti hubungan sebab
akibat (causality)
 Korelasi yang lemah tidak selalu berarti tidak
adanya hubungan
 Korelasi yang kuat tidak selalu berarti adanya
garis lurus

Page 8
Korelasi
CONTOH KORELASI:
Subjek (X) Usia (Y) Lama hari rawat X.Y
1 20 5
2 30 6
3 25 5
4 35 7
5 40 8
(X) = 150 (Y) = 31 (XY) = 970
(X2) = 4750 (Y2) = 199

970 * 5  150 * 31
r  0,97

[4750 * 5  (150) ] * 199 * 5  (31)
2 2

Page 9
Korelasi
CONTOH KORELASI:
Subjek (X) Usia (Y) Lama hari rawat X.Y
1 20 5
2 30 6
3 25 5
4 35 7
5 40 8
(X) = 150 (Y) = 31 (XY) = 970
(X2) = 4750 (Y2) = 199

(  X ).(  Y ) (150).(31)
(  XY )  (970) 
r n  5  0.97
 X   
2
 Y 
2
 150  
2
 31 
2

 ( X )   .  ( Y )    (4750)   .  (199)  
2 2

 n   n   5   5 
Page 10
Korelasi
 Uji hipotesis Koef. Korelasi (r):
1. Ho:  = 0 (Tidak ada hubungan/korelasi)
Ha:   0 (Ada hubungan/korelasi)
2. Uji statistik: t  r. n  2  0.97 5  2  6.91
1 r2 1  0.97 2

3. Critical Region: Ho ditolak jika,


|t (hitung) |>t (tabel: /2, df=n-2) atau p-value < 
> 3.182 p<0.005

4. Keputusan: Ho ditolak
5. Kesimpulan:Koef. Korelasi populasi () tidak
sama dengan nol
Ada korelasi antara umur dg lama hr rawat
Page 11
Regresi Linier
 Memprediksi nilai Y dari X:
1. Berapa tekanan darah sistolik, jika umur = 30 th
2. Berapa IP mhs, jika income keluarga = Rp 2 juta
3. Berapa lama hari rawat, jika pasien berumur 40 th
4. Berapa level FEV1, pada orang dengan TB=170 cm

 Asumsi pada regresi linier:


1. Nilai mean dari Y adalah fungsi garis lurus
(linierity) dari X  Yi =  + b1Xi + 
2. Nilai Y terdistribusi sec. Normal untuk setiap nilai X
(normality)
3. Varian Y adalah sama untuk setiap nilai X
(homoscedasticity)
4. Nilai X dan Y adalah tidak saling berkait
(independency)
Page 12
Regresi Linier
 Mencari garis terbaik regresi linier:
 Metoda Least Square (Persamaan garis dibuat
sedemikian rupa sehingga jumlah kuadrat dari selisih
nilai observasi dengan nilai pada garis adalah minimum)
 Persamaan garis regresi linier:
Yi =  + b1Xi + 
Yi adalah nilai Y yang diprediksi
 adalah intercept dan b1 adalah slope
 adalah posisi dimana garis regresi memotong sumbu y
b1 mengukur kemiringan garis = koefisien regresi
Nilai Y meningkat sebesar b1 unit untuk setiap kenaikan
nilai X sebesar 1 unit
 adalah error dari model dalam memprediksi rata-rata Y
Page 13
Regresi Linier: Data Lay-out
Subjek X Y X.Y
1 X1 X12 Y1 Y12 XY1
. X. X. 2 Y. Y. 2 XY.
. X. X. 2 Y. Y. 2 XY.
n Xn Xn2 Yn Yn2 XYn
(X) = … (X2) … (Y)… (Y2)… (XY) = …
• Persamaan garis


regresi linier:
Yi =  + b1Xi
  YbX
(  X ).(  Y ) Y
Y  mean _ Y 
(  XY )  n
b n
 X  2 X
X  mean _ X 
( X ) 
2
n
n Page 14
Regresi Linier: Data Lay-out
Subjek X Y X.Y
1 X1 X12 Y1 Y12 XY1
. X. X. 2 Y. Y. 2 XY.
. X. X. 2 Y. Y. 2 XY.
n Xn Xn2 Yn Yn2 XYn
(X) = … (X2) … (Y)… (Y2)… (XY) = …
• Persamaan garis
regresi linier:   YbX
• Yi =  + b1Xi
Y
b
 xy * n   x  y Y  mean _ Y 
n
 x * n   x 
2
X
2

X  mean _ X 
n
Page 15
Regresi
CONTOH REGRESI:
Subjek (X) Usia (Y) Lama hari rawat X.Y
1 20 5
2 30 6
3 25 5
4 35 7
5 40 8
(X) = 150 (Y) = 31 (XY) = 970
(X2) = 4750 (Y2) = 199

b
 xy * n   x  y 970 * 5  150 * 31
  0,16
 x * n   x  4750 * 5  (150)
2 2 2

  Y  b X  6.2  016
. .(30)  14
.
Page 16
Regresi Linier
 Persamaan garis regresi linier:
(  X ).(  Y ) (150).(31)
(  XY )  (970) 
b n  5  016
.
X  2
150 2

( X ) 
2
(4750) 
n 5

  Y  b X  6.2  016
. .(30)  14
.
Lama hari rawat (Y) =  + b1Xi
Lama hari rawat = 1.4 + 0.16 (Usia)

Page 17
Regresi Linier
 Komputer Out-put:
Model Summ aryb

St d. Error
Adjust ed of the
Model R R Square R Square Es timate
1 .970a .941 .922 .3651
a. Predic tors: (Constant), USIA
b. Dependent Variable: LAMA_RW T

ANOVAb

Sum of Mean
Model Squares df Square F Sig.
1 Regres sion 6.400 1 6.400 48.000 .006a
Residual .400 3 .133
Total 6.800 4
a. Predictors: (Constant), USIA
b. Dependent Variable: LAMA_RWT

Page 18
Regresi Linier
 Komputer Out-put:
Coefficientsa

Standardi
zed
Unstandardized Coefficien 95% Confidence
Coefficients ts Interval for B
Lower Upper
Model B Std. Error Beta t Sig. Bound Bound
1 (Constant) 1.400 .712 1.967 .144 -.865 3.665
USIA .160 .023 .970 6.928 .006 .087 .233
a. Dependent Variable: LAMA_RW T

Page 19
Contoh garis linier

Page 20
Diagram tebar dan regresi
Diagram tebar FEV1 dengan tinggi badan
600

500

400

300

200

100
140 150 160 170 180 190 200

height (cm)

Page 21
Prediksi dan residual
600
(X130,Y130)
e130
500
e105
Force expiratoty volume in 1 min (ml)

(X105,Y105)
400

300

200

100
140 150 160 170 180 190 200

height (cm)

Page 22
Koefisien determinasi
 Koefisien determinasi mengukur proporsi
varians Y yang dapat diterangkan oleh X:
2
S 
R2  Y 2
SY
 NilaiR2 berkisar antara 0 (tidak ada varians Y
yang dijelaskan) sampai 1 (seluruh varians Y
dapat dijelaskan)
 Untuk data FEV1, nilai R2 = 0,546 berarti
persamaan linier antara FEV1 dengan tinggi
badan dapat menjelaskan 54,6% varians
FEV1. Jadi sisa varians 45,4% tidak dapat
dijelaskan atau residual.

Page 23
Koefisien korelasi
 Jadi koefisien korelasi merupakan ukuran yang
terstandarisasi dari kuatnya hubungan linier antara Y
dengan X
 Nilai koefisien korelasi berkisar antara -1 (hubungan
negatif sempurna) sampai +1 (hubungan positif
sempurna)
 Koefisien korelasi negatif: semakin besar nilai X semakin
kecil nilai Y
 Koefisien korelasi positif: semakin besar nilai X semakin
besar nilai Y
 Contoh koefisien korelasi antara FEV1 dengan tinggi
badan adalah 0,739

Page 24
Prosedur regresi linier sederhana
pada SPSS/Windows
Statistics > Regression >Linear

Page 25
Hasil analisis regresi SPSS/Win
u

sr
q
R
s
u M
t
4
91a

a
P

Ob

m
dF
M
i
S
af
4
1
4
9
01R
6
8
6 R
0
9 T
a
P
b
D

Page 26
Hasil analisis regresi SPSS/Win
i a
c

a
eid
B
e
E
i
Mt
5
4
01(
0
9
5
0 h
a
D

Page 27
TUGAS: Gunakan data 15
karyawan
 Apakah ada hubungan antara umur
(X) dan lama hari absen (Y) tahun
2009?
 Jika seorang karyawan berumur 35
tahun, hitunglah perkiraan lama hari
absennya.
TUGAS: Gunakan data Kecamatan
Ikan gabus
1. Apakah ada hubungan antara umur anak
(X) dengan Tinggi Badannya (Y)?
2. Jika seorang anak berumur 15 bulan,
hitunglah perkiraan tinggi badannya.
3. Apakah ada perbedaan proporsi jenis
kelamin anak menurut kelompok umur
ibu (3 kelompok)

Vous aimerez peut-être aussi