Académique Documents
Professionnel Documents
Culture Documents
Input
(Data)
Metode
(Algoritma Data Mining)
Output
(Pola/Model/ Knowledge)
Evaluation
(Akurasi, AUC, RMSE, etc)
Data Mining-2012-a@b
2. Prediction/Forecasting (Prediksi/Peramalan):
Linear Regression, Neural Network, Support Vector Machine, etc
3. Classification (Klasifikasi):
Naive Bayes, K-Nearest Neighbor, C4.5, ID3, CART, Random Forest, Linear Discriminant Analysis, Neural Network, etc
4. Clustering (Klastering):
K-Means, K-Medoids, Self-Organizing Map (SOM), Fuzzy C-Means, etc
5. Association (Asosiasi):
FP-Growth, A Priori, etc
Data Mining-2012-a@b 4
Output/pola/model/knowledge
1. Formula/Function (Rumus atau Fungsi Regresi)
WAKTU TEMPUH = 0.48 + 0.6 JARAK + 0.34 LAMPU + 0.2 PESANAN
4. Cluster (Klaster)
Data Mining-2012-a@b
Iteration 6
3 2.5
1.5
y
1 0.5 0 -2
-1.5
-1
-0.5
0.5
1.5
x
Data Mining-2012-a@b 6
Splitting Attributes
NO > 80K
Data mining-Estimasi
Estimasi merupakan fungsi minor kedua dari data mining. Suatu misal kita diberi sampel data volume air isi ulang yang diisi otomatis oleh mesin pengisi dengan isi yang bervariasi, sementara volume yang diharapkan adalah 2000 ml.
Data Mining-2012-a@b
11
Data Mining-Estimasi(lanj)
Data Mining-2012-a@b
12
Estimasi Titik
Estimasi titik : bentuk estimasi yang menghasilkan satu buah nilai estimasi saja yaitu berupa angka Populasi yang terus bertambah , tidak mungkin bagi kita untuk menghitung mean dan varians. Karena itu kita perlu sampel untuk melakukan estimasi/perkiraan pada parameter di atas Mengapa perkiraan? sebab bila kita memiliki perkiraan rata-rata dan varians yang akurat maka akan banyak pertanyaan yang dapat kita jawab dengan baik.
Data Mining-2012-a@b 15
Data Mining-2012-a@b
16
Rata-rata sampel = 24084/12 = 2007 ml Varians sampel = 10620/(12-1) = 965.45 ml2 Standar deviasi = sqrt (965.45) = 31.07 ml
Data Mining-2012-a@b 17
Data Mining-2012-a@b
18
Estimasi - selang
Estimasi titik hanya menghasilkan satu angka, bagaimana bila diinginkan angka yang selang agar lebih mengakomodasi error. Menggunakan batas bawah (L) dan batas atas (U) batas bawah (L) = X - z /2 . x batas atas (U) = X + z /2 . x
Data Mining-2012-a@b 19
Estimasi - selang
Rata-rata sampel = 24084/12 = 2007 ml Varians sampel = 10620/(12-1) = 965.45 ml2 Standar deviasi = sqrt (965.45) = 31.07 ml
Data Mining-2012-a@b 20
Data Mining-2012-a@b
21
Data Mining-2012-a@b
22
Data Mining-2012-a@b
23
Jadi selang kepercayaan 95% berdasarkan sampel tersebut adalah (1989.42 ; 2024.58 ) ml
Data Mining-2012-a@b
24
Data Mining-2012-a@b
25
latihan
Sebuah bagian dari depnaker bermaksud memperkirakan besarnya penghasilan penduduk di suatu daerah. Lima belas orang yang telah bekerja diambil secara acak dan ditanya penghasilan perbulan. Hasil yang diperoleh adalah
Data Mining-2012-a@b 26
latihan
1. Perkirakan rata-rata dan varians penghasilan penduduk daerah tersebut 2. Buatlah selang keyakinan 99%, dan 95% untuk rata-rata penghasilan. Bandingkan dari segi intervalnya
Data Mining-2012-a@b
27