Académique Documents
Professionnel Documents
Culture Documents
PENGENALAN KEPADA STATISTIK Perkataan statistik mempunyai berbagai makna di dalam budaya kita. Websters Third New
International Dictionary memberikan definasi statistik yang komprenhensif sebagai sains yang berurusan dengan pungutan, analisis, tafsiran dan persembahan data numerik. Statistik juga adalah sebagai alat pengolah data angka, mengumpul , menyusun , menghurai, menganalisis data bernombor dan membuat kesimpulan , rumusan dan keputusan berdasarkan penganalisisan data tersebut. Statistik juga dapat membantu kita untuk merumuskan data yang banyak ini kepada bentuk lain yang mudah kita faham, seperti grafik atau angka rumusan . Pernyataan statistik digunakan sekurang-kurangnya di dalam dua cara yang penting. Pertama, statistik boleh merupakan pengukuran perihalan yang dikira daripada sampel dan digunakan untuk membuat penerangan terhadap populasi. Kedua, statistik merupakan taburan yang digunakan di dalam analisis data. Statistik digunakan dalam pelbagai bidang yang dengan sendirinya memberikan pengertian yang tertentu. Kepada orang ramai, statistik bermaksud angka yang direkodkan mengikut kategori tertentu. Contohnya, statistik kemalangan jalan raya memberikan kita maklumat tentang kemalangan jalan raya, yang dipecahkan kepada beberapa kategori, seperti maut, cedera parah, cedera ringan dan sebagainya. Pihak sekolah pula memberikan statistik pencapaian pelajar,misalnya, bilangan pelajar yang mendapat gred tertentu dalam peperiksaan UPSR. Kepada mereka yang menjalankan kajian pula, statistik merupakan kaedah yang boleh digunakan untuk menganalisis data kajian. Kepada ahli-ahli statistik, statistik merupakan satu bidang matematik yang dapat menghasilkan teori dan kaedah untuk menganalisis data. Seterusnya, penyelidik memerlukan pengetahuan statistik untuk merekabentuk (design) sesuatu penyelidikan, seperti merekabentuk eksperimen, dan menentukan kaedah analisis data yang sesuai untuk sesuatu rekabentuk. Pengetahuan statistik juga dapat digunakan oleh guru untuk memahami kajian-kajian yang ditulis dalam bentuk empirikal. Dalam bidang pengukuran pula, kaedah statistik digunakan untuk mengira indeks kebolehpercayaan, indeks keesahan atau indeks keesahan ramalan. Terdapat dua jenis statistik yang digunakan dalam bidang pendidikan, iaitu statistik deskriptif yang digunakan untuk menjelaskan sesuatu ukuran (seperti min dan bidang sisihanpiawai); dan statistik inferensi yang digunakan untuk menguji hipotesis. Statistik mempunyai kegunaan yang luas dalam bidang sains , perniagaan , perindustrian, ekonomi, perubatan, penyelidikan, pertanian dan lain-lain. Contohnya, dalam bidang sains, teknik statistik digunakan untuk menganalisis data yang dihasilkan daripada eksperimen. Dalam bidang 1
Y = f ( X1)
Y = a + bX 1 + cX 2
di mana Y = hasil jualan, X1 = perbelanjaan pengiklanan dan X2 = harga barang Analisis regresi linear merupakan kaedah statistik yang paling sering digunakan dalam penelitianpenelitian sosial, terutama penelitian ekonomi. Program komputer yang paling banyak digunakan adalah SPSS (Statistical Package For Service Solutions). Objektif regresi dijalankan adalah bertujuan menganggar min pemboleh ubah bersandar apabila nilai pemboleh ubah bebas diberikan, menguji hipotesis tentang sifat-sifat pemboleh ubah bersandar, mengunjur nilai min pemboleh ubah bersandar min pemboleh ubah bebas diberikan. Pemboleh ubah bersandar adalah pemboleh ubah yang cuba dijangka atau diterangkan manakala pemboleh ubah tidak bersandar atau bebas adalah pemboleh ubah yang digunakan untuk menerangkan pemboleh ubah bersandar. Contohnya : pemboleh ubah bersandar adalah gred pelajar dan pemboleh ubah tidak bersandar adalah jam belajar.
Perhubungan antara X dan Y juga dapat dilihat dengan melukis satu garis lurus yang paling sesuai dengan titik serakan tersebut. Garis best-fitting line ini berfungsi untuk:memberi gambaran 5
b=
y1
x1
Sebenarnya persamaan regresi adalah seperti berikut: Y = bX + a + ralat (error) Untuk mencari nilai a dan b yang akan menghasilkan garislurus yang sesuai (best-fitting).
Biasanya ralat diabaikan.Regresi ialah satu teknik statistik untuk mencari garislurus best-fitting
hubungan antara tinggi dan berat, markah matematik dengan statistik,dan sebagainya. Persamaan regresi dibentuk untuk menunjukkan hubungan antara dua pembolehubah bersandar(y) dan pembolehubah tidak bersandar(x). Pembolehubah bersandar ialah pembolehubah yang boleh dipengaruhi oleh perubahan pembolehubah yang lain manakala pembolehubah tidak bersandar ialah pemboleubah yang tidak dipengaruhi oleh pembolehubah yang lain. Selain daripada itu analisis regresi linear dapat mengukur ralat dalam menggunakan perhubungan yang ada untuk membuat ramalan/telahan pembolehubah bersandar Anggaran dan ramalan boleh dibuat berdasarkan persamaan yang diperolehi. Analisis regresi linear juga boleh digunakan untuk mengukur kekuatan perhubungan (ie. korelasi) antara pembolehubah bersandar dan tak bersandar Regresi linear turut dapat membantu untuk melihat sejauh mana pengaruh antara satu atau
beberapa pembolehubah terhadap sesuatu pembolehubah.Pembolehubah yang mempengaruhi disebut sebagai pembolehubah bebas manakala pembolehubah yang dipengaruhi pula dipanggil sebagai pembolehubah terikat. Antara contoh bidang-bidang yang menggunakan regresi linear adalah trend line, epidemiologi, kewangan, ekonomi, sains persekitaran dan banyak lagi. Trend line
Trend line menggunakan konsep regresi linear dan sering digunakan untuk menyatakan bahawa tindakan tertentu atau peristiwa (seperti latihan, atau kempen iklan) yang disebabkan perubahan yang diamati pada suatu titik waktu. Ini adalah teknik sederhana, dan tidak memerlukan kumpulan kawalan, rancangan percubaan, atau teknik analisis canggih. data. Epidemiologi dalam Namun, masalah kekurangan kesahihan saintifik dalam kes-kes di mana perubahan yang berpotensi lain boleh mempengaruhi
masyarakat.Contohnya, regresi linear digunakan untuk melihat kaitan antara merokok dengan kematian. Dalam rangka mengurangkan korelasi palsu ketika menganalisis data pemerhatian,
Regresi linear adalah alat empirikal dominan dalam bidang ekonomi. Misalnya, digunakan untuk menganggarkan pengeluaran konsumsi, pengeluaran pelaburan tetap, pelaburan persediaan, pembelian eksport suatu negara, pengeluaran untuk import, permintaan untuk permintaan tenaga kerja, dan ketersediaan tenaga kerja. Sains Alam Sekitar
Regresi linear mencari aplikasi dalam pelbagai aplikasi sains alam sekitar. Contohnya di Kanada, Kesan Persekitaran Program Pemantauan menggunakan analisis statistik pada ikan dan untuk mengukur kesan daripada kilang pulp atau sisa lombong logam pada ekosistem.
TUGASAN 1
1. Anda dikehendaki memilih satu pasangan pembolehubah bersandar dan tak bersandar yang terdapat dalam situasi harian sebenar .Kenalpasti pembolehubah yang dipilih. ( IPG, tadika, sekolah,dll.) 2. Tuliskan satu nota ringkas bagaimana anda merancang dan memperoleh maklumat tentang sumber anda. 3. Jika anda ingin mengumpul data dari sekolah anda boleh ke sekolah tersebut secara bersendirian berjumpa dengan guru besar atau ketua organisasi dan dapatkan keizinan untuk menjalankan proses pengumpulan data.Jika perlu, dapatkan surat kebenaran untuk membantu anda menjalankan tugas. 4. Menggunakan data yang telah dikumpul, (a) Lukiskan gambarajah serakan ( scatter diagram) untuk memperlihatkan serakan data tersebut dalam kertas graf dan menggunakan program Microsoft Excel. (b) Gunakan kaedah kuasadua terkecil untuk mencari persamaan bagi garis regresi penyesuaian terbaik bagi data anda dan program Microsoft Excel Toolpak untuk menyemak persamaan regresi yang diperolehi. (c) Gunakan kertas graf dan program Microsoft Excel untuk memplot graf bagi garis regresi yang mewakili set data anda dan seterusnya menuliskan persamaan garis regresi di atas graf anda. (d) Buatkan ramalan tentang pembolehubah bersandar berdasarkan situasi anda menggunakan persamaan garis regresi yang anda perolehi.
NOTA RINGKAS KAJIAN Data yang telah diambil oleh saya adalah data yang berkaitan pencapaian markah Kira Pantas berdasarkan penguasaan jumlah sifir. Data telah diperolehi dari SK Convent Sentul. Markah dari ujian Kira Pantas untuk murid tahun 3 Kepujian, SK Convent Sentul 1 telah dipengaruhi oleh penguasaan jumlah sifir oleh murid-murid tersebut. Saya telah melakukan ujian Kira Pantas ini kepada murid-murid 3 Kepujian setelah mereka diberi tempoh selama 5 hari untuk menghafal kesemua sifir 2 hingga 9. Murid-murid tersebut telah diberi masa selama 10 minit untuk menjawab soalan Kira Pantas. Melalui data, dapat dilihat bahawa semakin banyak jumlah sifir yang dikuasai oleh murid, semakin tinggilah markah mereka dalam ujian Kira Pantas tersebut. Di sini pembolehubah tidak bersandar yang diwakili oleh x adalah penguasaan jumlah sifir manakala pembolehubah bersandar yang diwakili oleh y adalah pencapaian markah ujian Kira Pantas murid.
10
DATA YANG DIKUMPUL MARKAH BIL 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. NAMA MURID Danial Izzatul Umairah Marsya Irdina Muhd. Ikhmal Nur Athirah Hazmi Aiman Nur Syazmimi Arrif Izzudin Nur Safiah Alya Maisarah Nur Nabilah Nur Akhmal Aidid Ahmad Najmie Qhudzairee Nadhirah Nurhaslim Daniel Hakim JUMLAH SIFIR (X) 9 9 9 9 9 9 9 9 9 8 8 8 8 7 7 7 7 7 MATEMATIK (Y) 100 100 100 100 100 100 95 95 95 90 90 90 90 85 85 85 85 85
11
SK CONVENT SENTUL 1 DATA STATISTIK PENCAPAIAN UJIAN KIRA PANTAS BERDASARKAN PENGUASAAN JUMLAH SIFIR KELAS : 3 KEPUJIAN BILANGAN MURID : 30 ORANG
12
Persamaan regresi linear yang merupakan garisan terbaik yang menepati taburan data tersebut. (line that best fits the data)
13
Dapatkan nilai b Min y = y/n = 2540/30 = 84.67 b=-m = 84.67 6.833 (6.97) = 84.67 47.63 = 37.04 Persamaan Regresi Linear y= 6.833x + 16.274 Lukiskan garisan regresi yang menepati taburan data tersebut ( line that best fits your data). Min x = x/n = 209/30 = 6.97
14
Graf scatter yang menggunakan kertas graf berdasarkan persamaan regresi linear iaitu y= 6.833x + 37.04
15
X 9 9 9 9 9 9 9 9 9 8 8 8 8 7 7 7 7 7 7 7 6 6 6 6 5 5 4 3 3 3
y= 6.833x + 37.04 y= 6.833(9) + 37.04 y= 6.833(9) + 37.04 y= 6.833(9) + 37.04 y= 6.833(9) + 37.04 y= 6.833(9) + 37.04 y= 6.833(9) + 37.04 y= 6.833(9) + 37.04 y= 6.833(9) + 37.04 y= 6.833(9) + 37.04 y= 6.833(8) + 37.04 y= 6.833(8) + 37.04 y= 6.833(8) + 37.04 y= 6.833(8) + 37.04 y= 6.833(7) + 37.04 y= 6.833(7) + 37.04 y= 6.833(7) + 37.04 y= 6.833(7) + 37.04 y= 6.833(7) + 37.04 y= 6.833(7) + 37.04 y= 6.833(7) + 37.04 y= 6.833(6) + 37.04 y= 6.833(6) + 37.04 y= 6.833(6) + 37.04 y= 6.833(6) + 37.04 y= 6.833(5) + 37.04 y= 6.833(5) + 37.04 y= 6.833(4) + 37.04 y= 6.833(3) + 37.04 y= 6.833(3) + 37.04 y= 6.833(3) + 37.04
Y 98.537 98.537 98.537 98.537 98.537 98.537 98.537 98.537 98.537 91.704 91.704 91.704 91.704 84.871 84.871 84.871 84.871 84.871 84.871 84.871 78.038 78.038 78.038 78.038 71.205 71.205 64.372 57.539 57.539 57.539
16
Mengira jarak garisan kuasadua terpendek di mana garisan kuasadua terpendek digunakan untuk mengira/ mendapat garisan bagi regresi tersebut. SIFIR BIL 1. 2. NAMA MURID Danial Izzatul Umairah (X) 9 9 17 MARKAH (Y) 100 100 98.537 98.537 1.463 1.463 2.14 2.14
bahawa titik-titik yang ada pada graf berada jauh dengan garis lurus regresi di mana titik-titik yang berada diatas garis lurus regresi bukan titik terbaik. Manakala jumlah hasil kuasa dua residual ( Y Y) ialah 157.309
Tafsirkan kecerunan garisan regresi. Persamaan regresi linear adalah y= 6.833x + 37.04. Nilai kecerunan bagi persamaan ini adalah 6.833 dan 37.04 adalah pintasan pada paksi y iaitu nilai y apabila nilai x adalah sifar. Nilai kecerunan adalah nilai tetap yang menerangkan perubahan (pertambahan) pada nilai y berbanding dengan seunit perubahan pada nilai x.
r=
nxy xy nx ( x )
2 2
ny 2 (y ) 2
18
553200 - 530860
22340
0.9802
Jika nilai r menghampiri kepada 1, ia menunjukkan wujudnya hubungan positif yang kuat di antara dua pemboleh ubah. Nilai r yang diperolehi untuk data saya adalah 0.9802 dan ianya hampir kepada 1. Ini menunjukkan terdapatnya hubungan yang kuat antara penguasaan jumlah sifir dengan markah pencapaian yang diperolehi pada ujian Kira Pantas. Ia juga menunjukkan terdapatnya hubungan positif regresi linear yang kuat kerana semua data berada berdekatan dengan garisan regresi. Melalui Scatter Diagram juga, dapat dilihat bahawa sekiranya nilai pembolehubah tidak bersandar meningkat maka nilai pembolehubah bersandar juga akan meningkat. Ini membawa makna sekiranya jumlah penguasaan sifir semakin banyak dihafal oleh murid maka murid tersebut akan memperolehi markah yang lebih tinggi dalam ujian Kira Pantas.
19
KESIMPULAN Daripada kajian yang telah dijalankan, dapatlah saya buat kesimpulan bahawa terdapat korelasi linear positif yang kuat antara jumlah penguasaan sifir terhadap pencapaian markah Ujian Kira Pantas murid dalam ujian yang telah dijalankan. Kesimpulannya, terdapat hubungan antara kedua-dua pembolehubah yang dikaji iaitu jumlah penguasaan sifir dengan pencapaian markah matematik. Nilai r yang diperolehi iaitu 0.9802 yang hampir kepada +1 membuktikan terdapat hubungan linear positif yang kuat di antara dua pembolehubah. Ini bermakna sekiranya seseorang murid itu dapat menghafal lebih banyak sifir, maka murid tersebut dapat memperolehi markah yang lebih tinggi.
20
TUGASAN 2
Soalan 1 Suatu sampel yang terdiri daripada 80 orang pelajar lelaki dan 150 orang pelajar perempuan telah dipilih secara rawak untuk ujian rabun warna.12 pelajar lelaki dan 5 pelajar perempuan didapati mempunyai rabun warna.Uji sama ada terdapat perkaitan antara rabun warna dan jantina pada aras keertian 1%. Binakan jadual kontigensi bagi ujian tersebut. Jantina Lelaki Perempuan Tidak Rabun Warna 68 145 213 Rabun Warna 12 5 17 Jumlah 80 150 230
E 17 X 80
O-E
(O-E)
(O-E) E
12
230
6.09 21
37.09
6.28
Darjah Kebebasan
Aras keertian = 0.01 x = 6.635 10.39 > 6.635 (penolakan) Oleh itu rabun warna dan jantina tiada kaitan
22
Soalan 2
Clean All ialah jenama pencuci baharu yang diperkenalkan dalam pasaran Pencuci ini sedang diuji di pasaran dengan mempamirkannya pada tiga lokasi yang berbeza dalam pasaraya. Jumlah jualan pencuci 12 oz di tunjukkan dalam jadual di bawah.
Lokasi Berhampiran dengan roti Berhampiran dengan minuman ringan Bersama dengan pencuci lain. .
20 12 25
15 18 28
Jualan 24 10 30
18 15 32
(a)
Lakukan ujian ANOVA satu hala untuk menguji hipotesis bahawa lokasi imemberi kesan berbeza kepada jualan pencuci Clean All .Lakukan ujian di atas pada aras keertian 5%. Ulang ujian ANOVA dari (a) menggunakan microsoft Excel dan seterusnya rumuskan dapatan dalam (b) dalam jadual ANOVA.
(b)
23
= =
20 + 15 + 24 + 18 4 19.25 12 + 18 + 10 + 15 4 13.75
= =
24
S A
= n -1 = (20 19.25) + (15 - 19.25) + (24 -19.25) + (18 19.25) 4-1 = 0.5625 + 18.0625 + 22. 5625 + 1.5625 3 = 42.75 3 = 14.25
S B
= n -1 = (12 13.75) + (18 13.75) + (10 -13.75) + (15 13.75) 4-1 = 3.0625 + 18.0625 + 14. 0625 + 1.5625 25
S C
= n -1 = (25 28.75) + (28 28.75) + (30 -28.75) + (32 28.75) 4-1 = 14.0625 + 0.5625 + 1. 5625 + 10.5625 3 = 26.75 3 = 8.917
(d.f) (N)
= = =
k1 3 -1 2 NK 12 -3 9
(d.f) (D)
= = =
26
MSSB = k -1 = 4(19.25- 20.58) + 4(13.75 20.58) + 4(28.75-20.58) 3-1 = 7.0756 + 186.5956 + 266.9956 2 = 460.6668 2 = 230. 33
27
F=
MSSB MSSW
230.33 11.8056
19.5102
28
Count 4 4 4
Sum 77 55 115
ANOVA Source of Variation Between Groups Within Groups SS 460.6667 106.25 df 2 9 MS 230.3333 11.80556 F 19.51059 P-value 0.000534 F crit 4.256495
Total
566.9167
11
29
Rumusan Setelah saya melakukan ujian ANOVA satu hala untuk menguji hipotesis bahawa lokasi memberi kesan berbeza kepada jualan pencuci Clean All dan mengulang semula ujian ANOVA ini menggunakan Microsoft Excel, maka saya memperolehi nilai-nilai Average, Variance, SS,df,MS, F, F Crit yang sama melalui kedua-dua ujian.
30