Vous êtes sur la page 1sur 50

CORRELATION &

REGRESSION

STATISTIKA TEKNIK
LNK2016

! Correlation is a statistical method used to determine whether a

relationship between variables exists.


! Regression is a statistical method used to describe the nature of

the relationship between variables, that is, positive or negative,


linear or nonlinear.
! The purpose of this chapter is to answer these questions

statistically:
! 1. Are two or more variables related?
! 2. If so, what is the strength of the relationship?
! 3. What type of relationship exists?
! 4. What kind of predictions can be made from the
relationship?

KORELASI
! Korelasi menyatakan derajat hubungan antara dua

variabel tanpa memperhatikan variabel mana yang


menjadi peubah.

! Karena itu hubugan korelasi belum dapat dikatakan

sebagai hubungan sebab akibat

Analisis korelasi
q Analisis korelasi bertujuan untuk mengukur kekuatan

asosiasi (hubungan) linear antara dua variabel.

q VARIABLE X DAN Y BERKEDUDUKAN SAMA, BISA

DITUKARKAN X BISA MEMPENGARUHI Y, DAN


SEBALIKNYA

q Korelasi tidak menunjukkan hubungan fungsional atau

dengan kata lain, analisis korelasi tidak membedakan antara


variabel dependen dengan variabel independen.

correlation coefficient : a measure that REPRESENTS strength of the


relationship between or among the variables.

There are two types of relationships:


! simple and multiple.

In a simple relationship, there are two variables


!

an independent variable, also called an explanatory variable or a predictor


variable, and

-- a dependent variable, also called a response variable.

A simple relationship analysis is called simple regression, and there is one


independent variable that is used to predict the dependent variable.

In a multiple relationship, called multiple regression, two or more independent


variables are used to predict one dependent variable. This type of study involves
several variables.

! Simple relationships can also be positive or negative.


! A positive relationship exists when both variables increase or

decrease at the same time.

! For instance, a persons height and weight are related; and the

relationship is positive, since the taller a person is, generally, the


more the person weighs.

In a negative relationship, as one variable increases, the


other variable decreases, and vice versa.

! For example, if you measure the strength of people over 60 years of

age, you will find that as age increases, strength generally decreases.
The word generally is used here because there are exceptions.

! Some predictions are more accurate than others, due to

the strength of the relationship.


! That is, the stronger the relationship is between

variables, the more accurate the prediction is.

Scatter Plots and Correlation

The possibilities include a positive linear relationship, a


negative linear relationship, a curvilinear relationship, or no
discernible relationship.

examples

POSITIVE
RELATIONSHIP
TEND TO
LINEAR

Example 2
NEGATIVE
RELATIONSHIP
TEND TO
LINEAR

Example 3
NO PATTERN
NO SPECIFIC
RELATIONSHIP

KOEFISIEN KORELASI
u Koesien Korelasi ukuran seberapa kuat

hubungan antara dua variable atau lebih

u Macam Koesien Korelasi


u Pearson Product Moment (Korelasi

Pearson) : (untuk data variable berskala


interval atau rasio)
u Korelasi Spearman/Korelasi Kendall : untuk
data yg diolah dari hasil pengamatan/
berskala nominan/ordinal

STRONG POSITIF LINEAR RELATIONSHIP


0 TO +1
NO LINEAR RELATIONSHIP
= 0
STRONG NEGATIVE LINEAR RELATIONSHIP 0 TO -1

COEFFICIENT
CORRELATION

! Dalam analisis regresi, selain mengukur kekuatan

hubungan antara dua variabel atau lebih, juga


menunjukkan arah hubungan antara variabel
dependen dengan variabel independen.

! Variabel dependen diasumsikan random/stokastik,

yang berarti mempunyai distribusi probabilistik.

! Variabel independen/bebas diasumsikan memiliki

nilai tetap (dalam pengambilan sampel yang


berulang)

Korelasi Pearson

Interpretasi Koesien
Korelasi
q Nilai koesien korelasi terletak antara -1 dan +1
q Semakin besar nilai absolut koesien korelasi, maka

semakin kuat hubungan liniernya

q Semakin lemah kekuatan hubungannya, maka nilai

koef korelasi semakin mendekati nol

q Nilai korelasi positif artinya bila satu variable

meningkat nilainya, maka variable lainnya akan ikut


meningkat

q Nilai korelasi negatif artinya bila satu variable nilainya

membesar, maka variable lainnya menurun.

q Koef korelasi pearson hanya ukuran kuat lemahnya

hubungan. Korelasi 0 belum tentu berarti tidak ada

UJI KORELASI BERGANDA


! Berbeda dengan uji korelasi sederhana

yang hanya digunakan menguji hubungan


partial variabel bebas dengan variabel
terikat,
! Analisis korelasi ganda berfungsi untuk
mencari besarnya hubungan dan
kontribusi dua variabel bebas (X) atau
lebih secara simultan (bersama-sama)
dengan variabel terikat (Y).

TARAF SIGNIFIKANSI :
Adalah suatu formasi yang ditetapkan oleh peneliti/penulis.
Disimbolkan dengan :
Disesuaikan dengan isu/topik kajian dan tuntutan akurasi
data
Sesuai alasan pertimbangan yang rasional;
Untuk bidang eksakta/teknik = 5% = 0,05
bILA PROBAILITAS < (< 5%) MAKA H0 DITOLAK
DAN HA diterima

UJI HIPOTESIS

POSITIVE
STRONG
RELATIONSHIP

NEGATIVE
STRONG
RELATIONSHIP

POSITIVE
WEAK
RELATIONSHIP

DASAR KEPUTUSAN UJI


KORELASI BERGANDA
!

Pengambilan keputusan dalam uji korelasi berganda dapat


dengan : membandingkan antara nilai probabilitas 0,05
dengan nilai probabilitas Sig.

Dasar pengambilan keputusan sebagai berikut :


!

Jika nilai probabilias 0,05 lebih kecil atau sama dengan nilai
probabilitas sig. F change atau [0,05 < sig. Fchange], maka Ho
diterima dan Ha ditolak, artinya tidak ada hubungan yang
signikan antara variabel X dengan variabel Y.

Jika nilai probabilias 0,05 lebih besar dari nilai probabilitas


sig. F change atau [0,05 > sig. Fchange], maka Ho ditolak dan
Ha diterima, artinya ada hubungan yang signikan antara
variabel X dengan variabel Y.

REGRESSION
! If the value of the correlation coefficient is significant,

the next step is to determine the equation of the


regression line, which is the datas line of best fit.
! (Note: Determining the regression line when r is not

significant and then making predictions using the


regression line are meaningless.)
! The purpose of the regression line is to enable the

researcher to see the trend and make predictions on


the basis of the data.

Regresi alat ukur yang juga digunakan untuk


mengukur ada atau tidaknya korelasi antar
variabelnya.
Istilah regresi itu sendiri berarti ramalan atau
taksiran.
Persamaan yang digunakan untuk mendapatkan garis
regresi pada data diagram pencar disebut persamaan
regresi.
Untuk menempatkan garis regresi pada data yang
diperoleh maka digunakan metode kuadrat terkecil,
sehingga bentuk persamaan regresi adalah sebagai
berikut: Y = a + b X

ANALISIS REGRESI
! HAMPIR SAMA DENGAN ANALISIS KORELASI
! TUJUAN : MELIHAT HUBUNGAN SATU ARAH ANTAR

VARIABLE YANG LEBIH KHUSUS, DIMANA VARIABLE


X BERFUNGSI SBG VARIABLE BEBAS (YANG
MEMPENGARUHI) DAN VARIABLE ADALAH
VARIABLE TERIKAT (YANG DIPENGARUHI)

! X VARIABLE DEPENDEN, Y INDEPENDEN


! VARIABLE X DAN Y BERKEDUDUKAN SAMA, BISA

DITUKARKAN X BISA MEMPENGARUHI Y, DAN


SEBALIKNYA

! HUBUNGAN (ATAU PENGARUH) DLM ANALISIS REGRESI

DITUNJUKKAN DALAM BENTUK GARIS LURUS


(PLOTTING DATA VARIABEL)

! UNTUK MEYAKINKAN BAHWA MODEL PILIHAN ADALAH

LINIER, TERLEBIH DAHULU BUAT SCATTER PLOT (PLOT


HUB X DAN Y APAKAH CENDERUNG MEMBENTUK GARIS
LURUS)

! ASUMSIKAN KENORMALAN (ERROR)- TANPA UJI

NORMALITAS, KARENA VARIABEL X BESARAN YG


DITENTUKAN (BUKAN ACAK)

! MODEL REGRESI : PERSAMAAN : Y = a + b X


! ARTINYA SETIAP SATU NILAI VARIABEL X , MAKA NILAI

VARIABEL Y DAPAT DIPREDIKSI MENGGUNAKAN


PERSAMAAN TSB

! MODEL PILIHAN LINIER TIDAK MUTLAK. BILA SCATTER

PLOT TIDAK MENUNJUKKAN KECENDERUNGAN LINIER,


MAKA MODEL DENGAN POLA LAIN DAPAT

PERSAMAAN REGRESI

! HUBUNGAN (ATAU PENGARUH) DLM ANALISIS REGRESI

DITUNJUKKAN DALAM BENTUK GARIS LURUS


(PLOTTING DATA VARIABEL)

! UNTUK MEYAKINKAN BAHWA MODEL PILIHAN ADALAH

LINIER, TERLEBIH DAHULU BUAT SCATTER PLOT (PLOT


HUB X DAN Y APAKAH CENDERUNG MEMBENTUK GARIS
LURUS)

! ASUMSIKAN KENORMALAN (ERROR)- TANPA UJI

NORMALITAS, KARENA VARIABEL X BESARAN YG


DITENTUKAN (BUKAN ACAK)

! MODEL REGRESI : PERSAMAAN : Y = a + b X


! ARTINYA SETIAP SATU NILAI VARIABEL X , MAKA NILAI

VARIABEL Y DAPAT DIPREDIKSI MENGGUNAKAN


PERSAMAAN TSB

! MODEL PILIHAN LINIER TIDAK MUTLAK. BILA SCATTER

PLOT TIDAK MENUNJUKKAN KECENDERUNGAN LINIER,


MAKA MODEL DENGAN POLA LAIN DAPAT

DARI PERSAMAAN REGRESI Y = a + b X


Nilai konstan (a) nilai nol untuk variable observasi x
(negatif or positif)
Bilai nilai x jauh dari 0 maka nilai tersebut hanya
merupakan ekstrapolasi (penaksiran diluar jangkauan)
Nilai (b) merupakan koefisien regresi, nilai tersebut
menunjukkan kemiringan garis lurus yang ditemukan.
Makna nilai b, setiap x bertambah satu satuan,maka y
akan bertambah menjadi b kali satuan pengukuran

Kesamaan di antara garis regresi dan garis trend tidak


dapat berakhir dengan persamaan garis lurus.
Garis regresi (seperti garis trend dan nilai tengah
aritmatika) memiliki dua sifat matematis berikut :
(Y Y) = 0 dan (Y Y)2 = nilai terkecil atau
terendah.
Dengan perkataan lain, garis regresi akan
ditempatkan pada data dalam diagram sedemikian
rupa sehingga penyimpangan (perbedaan) positif titiktitik terhadap titik-titik pencar di atas garis akan
mengimbangi penyimpangan negatif titik-titik pencar
yang terletak di bawah garis, sehingga hasil
penyimpangan keseluruhan titik-titik terhadap garis
lurus adalah nol.

KOEFISIEN DETERMINASI
(R2)
! R2 PROPORSI DARI VARIAN VARIABLE

DEPENDEN, BAHWA VARIABLE DEPENDEN DAPAT


DIPERJELAS OLEH VARIABEL INDEPENDEN SEBESAR
NILAI KOEFISIEN DETERMINASI TERSEBUT

! RUMUS KOEF KORELASI:

KOEFISIEN DETERMINASI R2 = R *
R

SIFAT SIFAT KOEFISIEN


DETERMINASI
v NILAI R2 ANTARA 0 SAMPAI DENGAN 1
v R2 = 0 VARIABEL DEPENDEN TIDAK DAPAT

DITAFSIRKAN OLEH VARIABLE INDEPENDEN

v R2 =1 (100%) VARIABEL DEPENDEN DAPAT

DITAFSIRKAN OLEH VARIABEL INDEPENDEN SECARA


SEMPURNA TANPA ERROR

v UNTUK 0 < R2 < 1 CONTOH R2 = 0,6 = 60%, ARTINYA :

VARIABEL DEPENDEN (Y) DPT DITAFSIR ATAU


DIJELASKAN OLEH VARIBBEL X SEBESAR 60%, DAN 40%
LAINNYA TIDAK DAPAT DIJELASKAN OLEH VARIABEL X,
TAPI DAPAT DIJELASKAN OLEH VARIABLE INDEPENDEN
LAIN YANG TIDAK DIAMATI.

CONTOH
DATA X = KUALITAS
PELAYANAN,
Y = VOLUME PENJUALAN
PRODUK

TENTUKAN
A. Nilai korelasi dan determinasi
B. Persamaan Regresi Sederhana
C. Analisis dan Kesmpulan

hasil

! Given a scatter plot, you must be able to draw the line of best fit.
! Best fit means that the sum of the squares of the vertical distances

from each point to the line is at a minimum.

! The reason you need a line of best fit is that the values of y will be

predicted from the values of x; hence, the closer the points are to the
line, the better the fit and the prediction will be.

Vous aimerez peut-être aussi