Vous êtes sur la page 1sur 50

CORRELATION & REGRESSION

STATISTIKA TEKNIK

LNK2016

Correlation is a statistical method used to determine whether a relationship between variables exists.Regression is a statistical method used to describe the nature of the relationship between variables,

Regression is a statistical method used to describe the nature of the relationship between variables, that is, positive or negative, linear or nonlinear.determine whether a relationship between variables exists. The purpose of this chapter is to answer these

The purpose of this chapter is to answer these questions statistically:that is, positive or negative, linear or nonlinear. 1. Are two or more variables related? 2.

1. Are two or more variables related?of this chapter is to answer these questions statistically: 2. If so, what is the strength

2. If so, what is the strength of the relationship?statistically: 1. Are two or more variables related? 3. What type of relationship exists? 4. What

3. What type of relationship exists?related? 2. If so, what is the strength of the relationship? 4. What kind of predictions

4. What kind of predictions can be made from the relationship?two or more variables related? 2. If so, what is the strength of the relationship? 3.

KORELASI

Korelasi menyatakan derajat hubungan antara dua variabel tanpa memperhatikan variabel mana yang menjadi peubah. Korelasi menyatakan derajat hubungan antara dua variabel tanpa memperhatikan variabel mana yang menjadi peubah.

Karena itu hubugan korelasi belum dapat dikatakan sebagai hubungan sebab akibat Karena itu hubugan korelasi belum dapat dikatakan sebagai hubungan sebab akibat

Analisis korelasi

q Analisis korelasi bertujuan untuk mengukur kekuatan asosiasi (hubungan) linear antara dua variabel.

q VARIABLE X DAN Y BERKEDUDUKAN SAMA, BISA DITUKARKAN X BISA MEMPENGARUHI Y, DAN SEBALIKNYA

q Korelasi tidak menunjukkan hubungan fungsional atau dengan kata lain, analisis korelasi tidak membedakan antara variabel dependen dengan variabel independen.

correlation coefficient : a measure that REPRESENTS strength of the relationship between or among the variables.There are two types of relationships: simple and multiple. In a simple relationship, there are

There are two types of relationships:strength of the relationship between or among the variables. simple and multiple. In a simple relationship,

simple and multiple.among the variables. There are two types of relationships: In a simple relationship, there are two

In a simple relationship, there are two variablesThere are two types of relationships: simple and multiple. —an independent variable, also called an explanatory

—an independent variable, also called an explanatory variable or a predictor variable, andmultiple. In a simple relationship, there are two variables -- a dependent variable, also called a

-- a dependent variable, also called a response variable.called an explanatory variable or a predictor variable, and A simple relationship analysis is called simple

A simple relationship analysis is called simple regression, and there is one independent variable that is used to predict the dependent variable.-- a dependent variable, also called a response variable. In a multiple relationship, called multiple regression,

In a multiple relationship, called multiple regression, two or more independent variables are used to predict one dependent variable. This type of study involves several variables.is called simple regression, and there is one independent variable that is used to predict the

Simple relationships can also be positive or negative.A positive relationship exists when both variables increase or decrease at the same time. For

A positive relationship exists when both variables increase or decrease at the same time.Simple relationships can also be positive or negative. For instance, a person’s height and weight are

For instance, a person’s height and weight are related; and the relationship is positive, since the taller a person is, generally, the more the person weighs.when both variables increase or decrease at the same time. In a negative relationship, as one

In a negative relationship, as one variable increases, the other variable decreases, and vice versa.taller a person is, generally, the more the person weighs. For example, if you measure the

For example, if you measure the strength of people over 60 years of age, you will find that as age increases, strength generally decreases. The word generally is used here because there are exceptions. .

Some predictions are more accurate than others, due to the strength of the relationship.That is, the stronger the relationship is between variables, the more accurate the prediction is.

That is, the stronger the relationship is between variables, the more accurate the prediction is.Some predictions are more accurate than others, due to the strength of the relationship.

Scatter Plots and Correlation

Scatter Plots and Correlation The possibilities include a positive linear relationship, a negative linear relationship, a

The possibilities include a positive linear relationship, a negative linear relationship, a curvilinear relationship, or no discernible relationship.

examples

examples POSITIVE RELATION- SHIP TEND TO LINEAR

POSITIVE

RELATION-

SHIP

TEND TO

LINEAR

NEGATIVE RELATION- SHIP TEND TO LINEAR
NEGATIVE RELATION- SHIP TEND TO LINEAR

NEGATIVE

RELATION-

SHIP

TEND TO

LINEAR

NO PATTERN NO SPECIFIC RELATIONSHIP
NO PATTERN NO SPECIFIC RELATIONSHIP

NO PATTERN NO SPECIFIC RELATIONSHIP

KOEFISIEN KORELASI

u Koefisien Korelasi à ukuran seberapa kuat hubungan antara dua variable atau lebih

u Macam Koefisien Korelasi u Pearson Product Moment (Korelasi Pearson ) : (untuk data variable berskala interval atau rasio) u Korelasi Spearman /Korelasi Kendall : untuk data yg diolah dari hasil pengamatan/ berskala nominan/ordinal

STRONG POSITIF LINEAR RELATIONSHIP NO LINEAR RELATIONSHIP STRONG NEGATIVE LINEAR RELATIONSHIP è 0 TO +1

STRONG POSITIF LINEAR RELATIONSHIP NO LINEAR RELATIONSHIP STRONG NEGATIVE LINEAR RELATIONSHIP

è 0 TO +1 è = 0 è 0 TO -1

COEFFICIENT

CORRELATION

COEFFICIENT CORRELATION

Dalam analisis regresi, selain mengukur kekuatan hubungan antara dua variabel atau lebih, juga menunjukkan arah Dalam analisis regresi, selain mengukur kekuatan hubungan antara dua variabel atau lebih, juga menunjukkan arah hubungan antara variabel dependen dengan variabel independen.

Variabel dependen diasumsikan random/stokastik, yang berarti mempunyai distribusi probabilistik. Variabel dependen diasumsikan random/stokastik, yang berarti mempunyai distribusi probabilistik.

Variabel independen/bebas diasumsikan memiliki nilai tetap (dalam pengambilan sampel yang berulang) Variabel independen/bebas diasumsikan memiliki nilai tetap (dalam pengambilan sampel yang berulang)

Korelasi Pearson

Korelasi Pearson

Interpretasi Koefisien Korelasi

q Nilai koefisien korelasi terletak antara -1 dan +1

q Semakin besar nilai absolut koefisien korelasi, maka semakin kuat hubungan liniernya

q Semakin lemah kekuatan hubungannya, maka nilai koef korelasi semakin mendekati nol

q Nilai korelasi positif artinya bila satu variable meningkat nilainya, maka variable lainnya akan ikut meningkat

q Nilai korelasi negatif artinya bila satu variable nilainya membesar, maka variable lainnya menurun.

q Koef korelasi pearson hanya ukuran kuat lemahnya hubungan. Korelasi 0 belum tentu berarti tidak ada hubungan

UJI KORELASI BERGANDA

Berbeda dengan uji korelasi sederhana yang hanya digunakan menguji hubungan partial variabel bebas dengan variabel Berbeda dengan uji korelasi sederhana yang hanya digunakan menguji hubungan partial variabel bebas dengan variabel terikat,

Analisis korelasi ganda berfungsi untuk mencari besarnya hubungan dan kontribusi dua variabel bebas (X) atau Analisis korelasi ganda berfungsi untuk mencari besarnya hubungan dan kontribusi dua variabel bebas (X) atau lebih secara simultan (bersama-sama) dengan variabel terikat (Y).

TARAF SIGNIFIKANSI :

Adalah suatu formasi yang ditetapkan oleh peneliti/penulis. Disimbolkan dengan : α Disesuaikan dengan isu/topik kajian dan tuntutan akurasi data Sesuai alasan pertimbangan yang rasional;

Untuk bidang eksakta/teknik α = 5% = 0,05

; •   Untuk bidang eksakta/teknik α = 5% = 0,05 bILA PROBAILITAS < α (<

bILA PROBAILITAS < α (< 5%) MAKA H0 DITOLAK DAN HA diterima

eksakta/teknik α = 5% = 0,05 bILA PROBAILITAS < α (< 5%) MAKA H0 DITOLAK DAN

UJI HIPOTESIS

POSITIVE STRONG RELATIONSHIP

POSITIVE

STRONG

RELATIONSHIP

NEGATIVE STRONG RELATIONSHIP

NEGATIVE

STRONG

RELATIONSHIP

POSITIVE WEAK RELATIONSHIP

POSITIVE

WEAK

RELATIONSHIP

DASAR KEPUTUSAN UJI

KORELASI BERGANDA

!
!

Pengambilan keputusan dalam uji korelasi berganda dapat dengan : membandingkan antara nilai probabilitas 0,05 dengan nilai probabilitas Sig.

Dasar pengambilan keputusan sebagai berikut :

Jika nilai probabilias 0,05 lebih kecil atau sama dengan nilai probabilitas sig . F change atau nilai probabilias 0,05 lebih kecil atau sama dengan nilai probabilitas sig. F change atau [0,05 < sig. Fchange], maka Ho diterima dan Ha ditolak, artinya tidak ada hubungan yang signifikan antara variabel X dengan variabel Y.

Jika nilai probabilias 0,05 lebih besar dari nilai probabilitas sig . F change atau [0,05 > nilai probabilias 0,05 lebih besar dari nilai probabilitas sig. F change atau [0,05 > sig. Fchange], maka Ho ditolak dan Ha diterima, artinya ada hubungan yang signifikan antara variabel X dengan variabel Y.

REGRESSION

If the value of the correlation coefficient is significant, the next step is to determine the equation of the regression line, which is the data’s line of best fit.REGRESSION (Note: Determining the regression line when r is not significant and then making predictions using

(Note: Determining the regression line when r is not significant and then making predictions using the regression line are meaningless.)the regression line, which is the data’s line of best fit. The purpose of the regression

The purpose of the regression line is to enable the researcher to see the trend and make predictions on the basis of the data.the regression line when r is not significant and then making predictions using the regression line

Regresi à alat ukur yang juga digunakan untuk mengukur ada atau tidaknya korelasi antar variabelnya. Istilah regresi itu sendiri berarti ramalan atau taksiran. Persamaan yang digunakan untuk mendapatkan garis regresi pada data diagram pencar disebut persamaan regresi. Untuk menempatkan garis regresi pada data yang diperoleh maka digunakan metode kuadrat terkecil, sehingga bentuk persamaan regresi adalah sebagai berikut: Y’ = a + b X

ANALISIS REGRESI

HAMPIR SAMA DENGAN ANALISIS KORELASI HAMPIR SAMA DENGAN ANALISIS KORELASI

TUJUAN : MELIHAT HUBUNGAN SATU ARAH ANTAR VARIABLE YANG LEBIH KHUSUS, DIMANA VARIABLE X BERFUNGSI TUJUAN : MELIHAT HUBUNGAN SATU ARAH ANTAR VARIABLE YANG LEBIH KHUSUS, DIMANA VARIABLE X BERFUNGSI SBG VARIABLE BEBAS (YANG MEMPENGARUHI) DAN VARIABLE ADALAH VARIABLE TERIKAT (YANG DIPENGARUHI)

X à VARIABLE DEPENDEN, Y à INDEPENDEN X à VARIABLE DEPENDEN, Yà INDEPENDEN

VARIABLE X DAN Y BERKEDUDUKAN SAMA, BISA DITUKARKAN X BISA MEMPENGARUHI Y, DAN SEBALIKNYA VARIABLE X DAN Y BERKEDUDUKAN SAMA, BISA DITUKARKAN X BISA MEMPENGARUHI Y, DAN SEBALIKNYA

HUBUNGAN (ATAU PENGARUH) DLM ANALISIS REGRESI DITUNJUKKAN DALAM BENTUK GARIS LURUS (PLOTTING DATA VARIABEL) HUBUNGAN (ATAU PENGARUH) DLM ANALISIS REGRESI DITUNJUKKAN DALAM BENTUK GARIS LURUS (PLOTTING DATA VARIABEL)

UNTUK MEYAKINKAN BAHWA MODEL PILIHAN ADALAH LINIER, TERLEBIH DAHULU BUAT SCATTER PLOT (PLOT HUB X UNTUK MEYAKINKAN BAHWA MODEL PILIHAN ADALAH LINIER, TERLEBIH DAHULU BUAT SCATTER PLOT (PLOT HUB X DAN Y APAKAH CENDERUNG MEMBENTUK GARIS LURUS)

ASUMSIKAN KENORMALAN (ERROR)- TANPA UJI NORMALITAS, KARENA VARIABEL X BESARAN YG DITENTUKAN (BUKAN ACAK) ASUMSIKAN KENORMALAN (ERROR)- TANPA UJI NORMALITAS, KARENA VARIABEL X BESARAN YG DITENTUKAN (BUKAN ACAK)

MODEL REGRESI : PERSAMAAN : Y’ = a + b X MODEL REGRESI : PERSAMAAN : Y’ = a + b X

ARTINYA SETIAP SATU NILAI VARIABEL X , MAKA NILAI VARIABEL Y DAPAT DIPREDIKSI MENGGUNAKAN PERSAMAAN ARTINYA SETIAP SATU NILAI VARIABEL X , MAKA NILAI VARIABEL Y DAPAT DIPREDIKSI MENGGUNAKAN PERSAMAAN TSB

MODEL PILIHAN LINIER TIDAK MUTLAK. BILA SCATTER PLOT TIDAK MENUNJUKKAN KECENDERUNGAN LINIER, MAKA MODEL DENGAN MODEL PILIHAN LINIER TIDAK MUTLAK. BILA SCATTER PLOT TIDAK MENUNJUKKAN KECENDERUNGAN LINIER, MAKA MODEL DENGAN POLA LAIN DAPAT DIRUMUSKAN

PERSAMAAN REGRESI

PERSAMAAN REGRESI

HUBUNGAN (ATAU PENGARUH) DLM ANALISIS REGRESI DITUNJUKKAN DALAM BENTUK GARIS LURUS (PLOTTING DATA VARIABEL) HUBUNGAN (ATAU PENGARUH) DLM ANALISIS REGRESI DITUNJUKKAN DALAM BENTUK GARIS LURUS (PLOTTING DATA VARIABEL)

UNTUK MEYAKINKAN BAHWA MODEL PILIHAN ADALAH LINIER, TERLEBIH DAHULU BUAT SCATTER PLOT (PLOT HUB X UNTUK MEYAKINKAN BAHWA MODEL PILIHAN ADALAH LINIER, TERLEBIH DAHULU BUAT SCATTER PLOT (PLOT HUB X DAN Y APAKAH CENDERUNG MEMBENTUK GARIS LURUS)

ASUMSIKAN KENORMALAN (ERROR)- TANPA UJI NORMALITAS, KARENA VARIABEL X BESARAN YG DITENTUKAN (BUKAN ACAK) ASUMSIKAN KENORMALAN (ERROR)- TANPA UJI NORMALITAS, KARENA VARIABEL X BESARAN YG DITENTUKAN (BUKAN ACAK)

MODEL REGRESI : PERSAMAAN : Y’ = a + b X MODEL REGRESI : PERSAMAAN : Y’ = a + b X

ARTINYA SETIAP SATU NILAI VARIABEL X , MAKA NILAI VARIABEL Y DAPAT DIPREDIKSI MENGGUNAKAN PERSAMAAN ARTINYA SETIAP SATU NILAI VARIABEL X , MAKA NILAI VARIABEL Y DAPAT DIPREDIKSI MENGGUNAKAN PERSAMAAN TSB

MODEL PILIHAN LINIER TIDAK MUTLAK. BILA SCATTER PLOT TIDAK MENUNJUKKAN KECENDERUNGAN LINIER, MAKA MODEL DENGAN MODEL PILIHAN LINIER TIDAK MUTLAK. BILA SCATTER PLOT TIDAK MENUNJUKKAN KECENDERUNGAN LINIER, MAKA MODEL DENGAN POLA LAIN DAPAT

DARI PERSAMAAN REGRESI Y’ = a + b X

Nilai konstan (a) è nilai nol untuk variable observasi x (negatif or positif) Bilai nilai x jauh dari 0 maka nilai tersebut hanya merupakan ekstrapolasi (penaksiran diluar jangkauan) Nilai (b) merupakan koefisien regresi, nilai tersebut menunjukkan kemiringan garis lurus yang ditemukan. Makna nilai b, setiap x bertambah satu satuan,maka y akan bertambah menjadi b kali satuan pengukuran

Kesamaan di antara garis regresi dan garis trend tidak dapat berakhir dengan persamaan garis lurus. Garis regresi (seperti garis trend dan nilai tengah aritmatika) memiliki dua sifat matematis berikut :

Σ(Y – Y’) = 0 dan Σ(Y – Y’)2 = nilai terkecil atau terendah. Dengan perkataan lain, garis regresi akan ditempatkan pada data dalam diagram sedemikian rupa sehingga penyimpangan (perbedaan) positif titik- titik terhadap titik-titik pencar di atas garis akan mengimbangi penyimpangan negatif titik-titik pencar yang terletak di bawah garis, sehingga hasil penyimpangan keseluruhan titik-titik terhadap garis lurus adalah nol.

KOEFISIEN DETERMINASI

(R 2 )

R2 è PROPORSI DARI VARIAN VARIABLE DEPENDEN, BAHWA VARIABLE DEPENDEN DAPAT DIPERJELAS OLEH VARIABEL INDEPENDEN R2 è PROPORSI DARI VARIAN VARIABLE DEPENDEN, BAHWA VARIABLE DEPENDEN DAPAT DIPERJELAS OLEH VARIABEL INDEPENDEN SEBESAR NILAI KOEFISIEN DETERMINASI TERSEBUT

RUMUS KOEF KORELASI: RUMUS KOEF KORELASI:

SEBESAR NILAI KOEFISIEN DETERMINASI TERSEBUT   RUMUS KOEF KORELASI: KOEFISIEN DETERMINASI è R 2 = R

KOEFISIEN DETERMINASI è R 2 = R *

R

SIFAT SIFAT KOEFISIEN DETERMINASI

v NILAI R2 è ANTARA 0 SAMPAI DENGAN 1

v R2 = 0 à VARIABEL DEPENDEN TIDAK DAPAT DITAFSIRKAN OLEH VARIABLE INDEPENDEN

v R2 =1 (100%) è VARIABEL DEPENDEN DAPAT DITAFSIRKAN OLEH VARIABEL INDEPENDEN SECARA SEMPURNA TANPA ERROR

v UNTUK 0 < R2 < 1 è CONTOH R2 = 0,6 = 60%, ARTINYA :

VARIABEL DEPENDEN (Y) DPT DITAFSIR ATAU DIJELASKAN OLEH VARIBBEL X SEBESAR 60%, DAN 40% LAINNYA TIDAK DAPAT DIJELASKAN OLEH VARIABEL X, TAPI DAPAT DIJELASKAN OLEH VARIABLE INDEPENDEN LAIN YANG TIDAK DIAMATI.

CONTOH

DATA X = KUALITAS PELAYANAN, Y = VOLUME PENJUALAN PRODUK

TENTUKAN A.Nilai korelasi dan determinasi B.Persamaan Regresi Sederhana C.Analisis dan Kesmpulan

TENTUKAN A.   Nilai korelasi dan determinasi B.   Persamaan Regresi Sederhana C.   Analisis dan

hasil

hasil
hasil

Given a scatter plot, you must be able to draw the line of best fit.Best fit means that the sum of the squares of the vertical distances from each

Best fit means that the sum of the squares of the vertical distances from each point to the line is at a minimum.scatter plot, you must be able to draw the line of best fit. The reason you

The reason you need a line of best fit is that the values of y will be predicted from the values of x; hence, the closer the points are to the line, the better the fit and the prediction will be.fit. Best fit means that the sum of the squares of the vertical distances from each

from the values of x; hence, the closer the points are to the line, the better