Vous êtes sur la page 1sur 18

1.

0 Pengenalan

Dunia maklumat berkembang dengan pesat dan sebaran maklumat kini hanya memerlukan
beberapa saat. Apabila maklumat melaporkan nilai berangka, misalnya harga gula meningkat
sebanyak 30 peratus pada bulan ini berbanding dengan bulan lepas. Impak maklumat lebih
besar berbanding dengan maklumat tanpa nilai berangka kerana nombor menunjukkan
sejauh mana perubahan berlaku.

Websters Third New International Dictionary memberikan definasi statistik yang


komprenhensif sebagai sains yang berurusan dengan pungutan, analisis, tafsiran dan
persembahan data numeric. Statistik juga merupakan satu cabang matematik, dan banyak
daripada sains statistik berdasarkan kepada pemikiran matematik, dan terbitannya.
Perkataan statistik mempunyai pelbagai makna dalam bidang Matematik. Perkataan
statistik boleh merujuk kepada cabang matematik, kursus atau disiplin yang melibatkan
statistik. Selain itu, ia adalah kaedah yang digunakan untuk memungut atau mengumpul atau
memproses atau menginterpretasi data kuantitatif. Statistik juga dikatakan sebagai angka-
angka yang dikira (contoh,purata) daripada data yang dikumpul.

Banyak daripada bidang-bidang akademik, termasuk perniagaan, menawarkan kursus


statistik di dalam disiplinnya. Walau bagaimanapun, statistik telah menjadi satu bidang
pengajian di dalam bidangnya.

1.1 Jenis jenis statistik

Terdapat dua jenis statistic iaitu statistic perihalan dan statistic pentakbiran. Statistik perihalan
(deskriptif) ialah kaedah yang digunakan untuk meringkaskan atau menerangkan
pemerhatian yang dibuat. Statistik pentakbran ialah bidang statistik yang membuat anggaran
atau ramalan berdasarkan pemerhatian yang dibuat.

Memahami perbezaan antara populasi dengan sampel adalah amat berguna dalam bidang
statistik. Populasi dalam statistik merujuk semua atau setiap orang, item, objek atau situasi
secara keseluruhnya manakala sampel pula ialah sebahagian daripada populasi. Sampel
digunakan untuk mewakili populasi.

Populasi
Sampel

1.2 Pemboleh ubah

Populasi atau sampel terdiri daripada sekumpulan individu dan bilangan individu dalam
populasi atau sampel itu boleh dibilang. Perbezaan antara individu untuk sifat tertentu yang
dikaji, sifat atau ciri itu dipanggil pemboleh ubah. Pemboleh ubah ialah sifat atau ciri yang
mmbolehkan kita membezakan antara individu dalam sesuatu populasi atau sampel.

1.2.1 Jenis-jenis pemboleh ubah

Pemboleh ubah Kualitatif atau pemboleh ubah kategori

Ada ciri atau sifat tidak menggunakan nombor ataupun menggunakan nombor semata-mata
untuk mewakili sesuatu kategori. Pemboleh ubah, iaitu ciri atau sifat sedemikian dikelaskan
sebagai pemboleh ubah kualitatif.

Nombor yang mewakili pemboleh ubah kualitatif tidak sama dengan nombor yang mewakili
pemboleh ubah kuantitatif. Penghitungan seperti tambah, tolak dan sebagainya tidak boleh
dibuat ke atas nombor yang mewakili ciri atau sifat pemboleh ubah kualitatif.
Pemboleh ubah kuantitatif

Nomborlah yang mewakili ciri atau sifat pemboleh ubah kuantitatif. Perhitungan seperti
tambah, tolak dan sebagainya boleh dibuat ke atas nombor yang mewakili ciri atau sifat
pemboleh ubah kuantitatif.

Pemboleh ubah Diskret dan Selanjar

Pemboleh ubah kuantitaitf boleh dikelaskan sebagai pemboleh ubah diskret atau pemboleh
ubah selanjar bergantung pada nilai data yang diperoleh bagi pemboleh ubah itu. Pemboleh
ubah yang ditentukan melalui proses membilang disebut sebagai pemboleh ubah diskret.
Pemboleh ubah diskret tidak ada nilai perantaraan.

1.3 PENGENDALIAN DATA

Data statistik boleh dibahagikan kepada dua jenis, iaitu data berangka (kuantitatif) dan data
bukan berangka (kualitatif). Data berangka (kuantitatif) ialah data yang bersifat kuantitatif
diperoleh melalui proses pengukuan, misalnya panjang, masa, suhu, dan berat. Data
berangka terdiri daripada dua jenis, iaitu data diskret dan data selanjar. Data diskret diperoleh
secara membilang, manakala data selanjar diperoleh secara mengukur dan menyukat.

Data bukan berangka (kuanlitatif) diperoleh dengan cara pemerhatian atau temu bual,
misalnya warna, bangsa, gred, dan jenis kenderaan. Data statistik juga dibahagikan kepada
data primer dan data sekunder. Data primer ialah maklumat yang dikumpul oleh pengkaji
sendiri. Data sekunder ialah data yang dikumpul daripada sumber lain seperti diterbitkan,
rekod rasmi, dan sebagainya.

1.3.1 Data tak terkumpul

Data tak terkumpul satu set data mentah yang tidak terkumpul dalam kelas. Nilai cerapan
dalam tak terkumpul muncul secara individu.

BIL NAMA JUMLAH AIR (LITER)


1 SINTHU 2
2 NANTHINI 2.2
3 KARTHIGA 2.2
4 THARSHINI 2.3
5 RAJU 2.4
6 HARI 2.5
7 YAGNESWARY 2.5
8 RUBINIA 2.5
9 RAJESWARY 2.5
10 KUNAWATHI 2.8
11 JAYU 2.9
12 SARMALA 3
13 SANGEETHA 3
14 KOMALA 3.2
15 TAMILSELVI 3.3
16 TINESWARI 3.5
17 AISWARYA 3.5
18 KANNAN 3.9
19 KOGILA 4
20 SARMILA 4.4

1.3.2 Data terkumpul

Data terkumpul terdiri daripada data yang banyak dengan nilai-nilai yang berbeza dan
dikumpulkan ke dalam ke dalam beberapa kumpulan atau kelas tertentu. Biasanya, data ini
disusun dalam jadual untuk menunjukkan taburan kekerapan.

1.3.3 Taburan kekerapan

Taburan kekerapan merupakan jadual ringkas yang menyusun data ke dalam kelas-kelas
tertentu dengan menunjukkan bilangan cerapan dalam setiap kelas. Melalui kaedah ini, data
disusun berdasarkan kekerapan atau frekuensi kepada pemboleh ubah yang berkenaan.

1.3.4 Selang kelas

Satu set data menggambarkan satu kumpulan nilai atau cerapan yang berkaitan dan boleh
ditaktifkan dengan jelas berdasarkan ciri-ciri sepunya. Setiap kelas ini dirujuk sebagai selang
kelas atau saiz kelas. Selang kelas ini adalah penting untuk membina histogram dan graf
kekerapan.

1.3.5 Saiz kelas

Saiz kelas pula merujuk jarak di antara sempadan kelas atas dan sempadan kelas bawah iaitu
0.5.

selang kelas frequency


2.0-2.4 5
2.5-2.9 6
3.0-3.4 4
3.5-3.9 3
4.0-4.4 2

1.3.6 Perwakilan Data Secara Visual

Histogram

Histogram ialah satu bentuk perwakilan visual data yang digunakan untuk memerihal taburan
suatu set data selanjar. Sama seperti carta palang, sebuah histogram juga mewakili data
dengan lajur atau palang segi empat tepat. Dalam histogram pula, luas lajur itu berkadaran
dengan kekerapan. Semua lajur itu dilukis secara rapat bersebelahan satu sama lain.
Sekiranya terdapat ruang kosong di antara dua lajur bermakna kelas itu mempunyai
kekerapan sifar.
JUMLAH AIR YANG DIMINUM OLEH
PELAJAR DALAM 3 JAM MASA KULIAH (L)
7

5
KEKERAPAN

0
1.7 2.2 2.7 3.2 3.7 4.2 4.7
TITIK TENGAH

1.3.7 Ukuran Berangka

Ukuran berangka merupakan kaedah statistik deskriptif yang digunakan bagi menentukan
corak set data, meringkaskan maklumat daripada set data dan mempersembahan maklumat
yang dikumpulkan daripada sampel dalam bentuk yang menarik.

1.3.8 Sukatan Kecenderungan Memusat

Sukatan kecenderungan memusat bagi sekumpulan data atau satu taburan kekerapan
merujuk kepada merujuk kepada satu nilai yang sesuai digunakan untuk memerihalkan
keserluruhan set data itu. Sukatan ini digunakan untuk memberi gambaran secara
menyeluruh bagi sekumpulan data. Di samping, sukatan kecendungan memusat juga
digunakan untuk membuat perbandingan antara dua kumpulan data.

2.0 Ukuran Kecenderungan Memusat

2.1 Pengiraan Manual

Min

Min ialah nilai purata bagi suatu kumpulan dan merupakan sukatan kecenderungan memusat
yang paling kerap digunakan. Nilai min dihitung dengan menjumlahkan semua data dan
membahagikan jumlah tersebut dengan bilangan data. Pengiraannya adalah dengan

menggunakan formula, =
.


Min populasi, =

1+2+3++
=

(2+2.2+2.2+2.3+2.4+2.4+2.5+2.5+2.5+2.8+2.9+3.0+3.0+3.2+3.3+3.5+3.5+3.9+4.0+4.4)
= 20

58.5
= 20

= 2.925

Median

Median adalah nilai bagi data tidak terkumpul adalah nilai yang terletak ditengah-tengah
apabila data tersebut disusun secara manaik. Bagi data yang terkumpul, pengiraan median
agak rumit dan menggunakan formula berikut:



2
Median = L + ( )c

2 , 2.2 , 2.2 , 2.3 , 2.4 , 2.4 , 2.5 , 2.5 ,2.5 , 2.8 , 2.9 , 3.0 , 3.0 , 3.2 , 3.3 , 3.5 , 3.5 , 3.9 ,4 , 4.4

20+1
=cerapan ( 2
)

= cerapan ke-10.5

1
= (cerapan ke-10 + cerapan ke-11)
2

1
= 2 (2.5+2.8)

= 2.85
Mod

Mod ialah nilai atau cerapan yang mempunyai kekerapan tertinggi dalam satu set data.
Namun begitu, bukan semua set data mempunyai mod. Misalnya, set data yang setiap
cerapannya muncul sekali sahaja tidak mempunyai mod langsung. Mod sesuai digunakan
sebagai perwakilan set data apabila penyelidik lebih mementingkan nilaiyang paling kerap
berlaku, seperti corak pakaian yang paling popular.

Nilai yang paling kerap = 2.5

Julat

Julat digunakkan bagi mendapatkan perbezaan nilai tertinggi dengan nilai terendah. Ia adalah
ukuran serakan yang paling mudah dihitung dan bergantung pada dua data sahaja. Jika nilai
julat kecil,maka data lebih tertumpu. Jika nilai julat besar, maka data lebih besar.

Julat = skor tertinggi - skor terendah

Skor tertinggi = 4.4

Skor terendah = 2.0

= 4.4 2.0

= 2.4

2.2 Output Komputer

Mean 2.93
Standard Error 0.149402318
Median 2.85
Mode 2.5
Standard
Deviation 0.668147478
Sample Variance 0.446421053
Kurtosis -0.352904407
Skewness 0.677203635
Range 2.4
Minimum 2
Maximum 4.4
Sum 58.6
Count 20

3.0 Ukuran Serakan

3.1 Pengiran Manual

Varians

Varian ialah purata jumlah kuasa dua sisihan antara min dan set nombor. Populasi varian
ditandakan dengan huruf Greek, 2 dan formulanya ialah:

( )2
2= 1
. , dengan keadaan x= skor atau cerapan, = min sample dan N = saiz sample.

Varians ialah kuasa dua sisishan piawai. Sisihan piawai pula ialah sukatan serakan yang
paling kerap digunakan.

BIL NAMA x= x - 2
1 SINTHU 2 2 2.925 = - 0.925 0.8556
2 NANTHINI 2.2 - 0.725 0.5256
3 KARTHIGA 2.2 - 0.725 0.5256
4 THARSHINI 2.3 - 0.625 0.3906
5 RAJU 2.4 - 0.525 0.2756
6 HARI 2.5 - 0.425 0.1806
7 YAGNESWARY 2.5 - 0.425 0.1806
8 RUBINIA 2.5 - 0.425 0.1806
9 RAJESWARY 2.5 - 0.425 0.1806
10 KUNAWATHI 2.8 -0.125 0.01562
11 JAYU 2.9 - 0.025 6.25 104
12 SARMALA 3 0.075 5.625 103
13 SANGEETHA 3 0.075 5.625 103
14 KOMALA 3.2 0.275 0.07563
15 TAMILSELVI 3.3 0.375 0.1406
16 TINESWARI 3.5 0.575 0.3306
17 AISWARYA 3.5 0.575 0.3306
18 KANNAN 3.9 0.975 0.9506
19 KOGILA 4 1.075 1.1556
20 SARMILA 4.4 1.475 2.1756
total x = 58.6 x=0 2 = 8.482125

( )2
Varians sampel, 2 = 1

()2
=
1

8.482125
= 201

= 0.44628

Sisihan piawai

Sisihan piawai ialah pengukuran yang paling sesuai untuk mengukur serakan data. Nilai yang
diperoleh menggambarkan kedudukan data yang tertabur sekitar min. nilai sisihan piawai
yang tinggi memberikan gambaran bahawa data itu tertabur jauh daripada min (kurang padat).
Simbol untuk sisihan piawai bagi satu sampel ialah s. Rumus-rumus untuk sisihan piawai
adalah seperti berikut:

Sisihan piawai sampel,s = 2

2
Sisihan piawai =
- 2

(2+2.2+2.2+2.3+2.4+2.4+2.5+2.5+2.5+2.8+2.9+3.0+3.0+3.2+3.3+3.5+3.5+3.9+4.0+4.4)
Nilai min, =
20

58.5
= 20

= 2.925

Sisihan piawai, s = 2

= 0.44628
= 0.66804

3.2 Output Komputer

Mean 2.93
Standard Error 0.149402318
Median 2.85
Mode 2.5
Standard
Deviation 0.668147478
Sample Variance 0.446421053
Kurtosis -0.352904407
Skewness 0.677203635
Range 2.4
Minimum 2
Maximum 4.4
Sum 58.6
Count 20

4.0 Perbandingan Dan Interpretasi


JUMLAH AIR YANG DIMINUM OLEH
PELAJAR DALAM 3 JAM MASA KULIAH (L)
7

5
KEKERAPAN

0
1.7 2.2 2.7 3.2 3.7 4.2 4.7
TITIK TENGAH

Kuartil

Median sesuatu taburan membahagikan data yang telah disusun mengikut tertib kepada dua
bahagian yang sama saiz. Kuartil-kuartil pula ialah tiga nilai, K1,K2,K3, yang membahagikan
data kepada empat bahagian yang sama saiz. Perkara ini bermakna kuartil yang berada
ditengah-tengah, iaitu K2 adalah sama dengan median. Dalam kata lain, K1, K2, K3 masing-
masing menentukan nilai-nilai untuk 25%, 50%, dan 75% daripada data.

Hubungan antara Kuartil dengan Histogram

Kuartil berkait rapat dengan histogram yang mewakili sesuatu set data. Oleh sebab lebar
palang dalam histogram adalah sama, kuartil membahagikan histogram kepada empat
bahagian yang sama luas.

Kuartil pertama K1, atau kuartil bawah, membahagi data kepada 25% ke bawah (atau 75%
ke atas) dan sama dengan presentil ke-25. Kuartil kedua, K2, atau median membahagikan
data kepada setengah bahagian. Kuartil ketiga, K3, atau kuartil atas, membahagi data kepada
25% ke atas (atau 75% ke bawah). Perbezaan antara kuartl atas dengan kuartil bawah disebut
sebagai julat antara kuartil.

Hubungan antara kuartil dan plot kotak

Plot kotak dan misai ialah cara yang mudah untuk menunjukkan kuartil secara visual. Plot
kotak boleh menggambarkan lima nilai statistik, iaitu median, kuartil pertama, kuartil ketiga,
nilai maksimun dan nilai minimum sesuatu set data.
Rumus untuk menentukan kedudukan kuartil bagi sesuatu taburan data

Bagi satu set data dengan nilai atau pemerhatian yang tersusun mengikut magnitud secara
menaik atau menurun, kedudukan setiap kuartil boleh ditentkan dengan menggunakan rumus-
rumus yang ditunjukkan dalam jadual.

Nilai maksimun

Kuartil ketiga, K3
Kuartil kedua, K2

Nilai minimum=0

Kuartil pertama, K1

kuartil Kuartil pertama Median Kuartil ketiga


kedudukan 1 1 1 1 3 3
( + 1) = (20 + 1) ( + 1) = (20 + 1) ( + 1) = (20 + 1)
4 4 2 2 4 4
21 21 63
= 4
= 2
= 4

= 5.25 = 10.5 = 15.75


(kuartil pertama terletak (kuartil kedua terletak di (kuartil ketiga terletak di
di antara cerapan ke-5 antara cerapan ke-10 antara cerapan ke-15 dan
dan cerapan ke-6) dan cerapan ke-11) cerapan ke-16)
Interpolasi 2.4 + [0.25 (2.5 2.4)] 2.8 + [0.5 (2.9 2.8)] 3.3 + [0.75 (3.5 3.3)]
= 2.425 = 2.85 = 3.45

Nilai 1 = 2.425 2 = 2.85 3 = 3.45

Julat antara kuartil = 3 1 = 3.45 2.425 = 1.025

Ini bermaksud 50% daripada bilangan cerapan yang berada di pertengahan taburan berada
dalam julat antara 2.425 hinggan 3.45.
Julat antara kuartil = 3 - 1 = 3.75 2.9 = 0.85

Histogram Nilai kuartil Bentuk Taburan


Min > Median > Mod
Chart Title 2.925 >2.85 > 2.5
7 (3 2 > 2 1 )
6
5
1.9 - 2.4 (3.45 2.85 > 2.85 2.425
2.5 - 3.0
4 0.6 > 0.425 )
3 3.1 - 3.6
Jarak antara median kuartil
2 3.7 - 4.2
1 dan kuartil ketiga jauh
4.3 - 4.8
0
berbanding dengan jarak
frequency
antara median dan kuartil
pertama.

Graf tersebut memencong ke kiri kerana terdapat nilai-nilai ekstren ke kiri, iaitu ekor pada
hujung kiri. Mod terletak pada puncak taburan iaitu 6.

Desil

Desil bagi sesuatu taburan ialah Sembilan nilai iaitu, 1 hingga 9 , yang membahagi data
kepada sepuluh bahagian yang sama siaz. Desil digunakan sebagai sukatan kedudukan
untuk taburan data yang bersaiz besar. 1 hingga 9 digunakan bagi menentukan nilai-nilai
untuk 10% hingga 90%. 5 adalah sama dengan nilai median. Nilai desil dapat dihitungkan
dengan formula di bawah:



= + + ( 10 )
1

dengan

k = 1, 2, 3, .., 9 (bagi desil pertama, kedua, ketiga,.. kesembilan)

= sempadan bawah kelas desil pertama (atau ke-2, ke-3,., ke-9)

N = jumlah kekerapan/cerapan
F = kekerapan longgokan sebelum kelas desil pertama (atau ke-2, ke-3,..ke-9)

= kekerapan kelas desil pertama (ke-2, ke-3, ke-9)

C = saiz kelas

Kekerapan
Selang kelas kekerapan
longgokan
1.3 1.8 0 0
1.9 - 2.4 5 5
2.5 - 3.0 6 11
3.1 - 3.6 4 15
3.7 - 4.2 3 18
4.3 - 4.8 2 20

Desil, Kedudukan desil Nilai desil


Pertama , 1 1(20) 20
Cerapan ke- = cerapan ke- 2 1 = 1.9 + ( 5
)(0.5) = 2.1
10

Kedua , 2 2(20) 40
Cerapan ke- = cerapan ke- 4 2 = 1.9 + ( 5
)(0.5) = 2.3
10

Ketiga , 3 3(20) 65
Cerapan ke- = cerapan ke- 6 3 = 2.5 + ( 6
)(0.5) = 2.5454
10

Keempat , 4 4(20) 85
Cerapan ke- = cerapan ke- 8 4 = 2.5 + ( 6
)(0.5) = 2.6364
10

Kelima , 5 5(20) 105


Cerapan ke- = cerapan ke- 10 5 = 2.5 + ( 16
)(0.5) = 2.7273
10
Keenam , 6 6(20) 1211
Cerapan ke- = cerapan ke- 12 6 = 3.1 + ( 4
)(0.5) = 3.225
10
7(20) 1411
N Ketujuh , 7 Cerapan ke- = cerapan ke- 14 7 = 3.1 + ( )(0.5) = 3.475
10 4

Kelapan , 8 8(20) 1615


Cerapan ke- = cerapan ke- 16 8 = 3.7 + ( 63
)(0.5) = 3.8667
10

Kesembilan , 9 9(20) 1815


Cerapan ke- = cerapan ke- 18 9 = 3.7 + ( )(0.5) = 4.2
10 3

Persentil

Persentil terdiri daripada 99 nilai yang membahagi data kepada 100 bahagian dan digunakkan
untuk data yang kecil. Persentil menentukan nilai-nilai yang menandakan 1% hingga 99%
daripada data. Maka, 90% daripada nilai-nilai dalam satu taburan berada di bawah persentil
ke-90. Persentil 50 sama denan nilai median.



= + (100 )c
1

Dengan kedaan,

k = 1,2,3,.,99 (bagi persentil pertama, kedua, ketiga,. Ke-99)

= sempadan bawah kelas persentil pertama (atau ke-2, ke-3, . Ke-99)

N = jumlah kekerapan/cerapan

F = kekerapan longgokan bagi kelas sebelum kelas persentil pertama (atau ke-2, ke-3.ke-
99)

1 = kekerapan kelas persentil pertama (atau ke-2, ke-3,ke-99)

C = saiz kelas

Selang kelas kekerapan Kekerapan longgokan


1.3 1.8 0 0
1.9 - 2.4 5 5
2.5 - 3.0 6 11
3.1 - 3.6 4 15
3.7 - 4.2 3 18
4.3 - 4.8 2 20

25(20)
Persentil ke-25 = cerapan ke- [ 100
]

= cerapan ke-5

Maka, 25 berada dalam selang kelas 1.9-2.4

50
25 = 1.9 + ( 5
)(0.5)

= 2.4

50(20)
Persentil ke-50 = cerapan ke- [ ]
100

= cerapan ke-10

Maka, 50 berada dalam selang kelas 2.5 - 30

115
50 = 2.5 + ( )(0.5)
6

= 3.0

75(20)
Persentil ke-75 = cerapan ke- [ 100
]

= cerapan ke-15

Maka, 75 berada dalam selang kelas 3.1 3.6

1511
25 = 3.1 + ( 4
)(0.5)

= 3.6

Vous aimerez peut-être aussi