Académique Documents
Professionnel Documents
Culture Documents
Data warehouse adalah kumpulan data dari berbagai sumber yang ditempatkan menjadi satu
dalam tempat penyimpanan berukuran besar lalu diproses menjadi bentuk penyimpanan
multidimensional dan didesain untuk querying dan reporting.
• Integrated, semua data diintegrasikan kedalam satu media penyimpanan, dalam hal ini
adalah database yang sangat besar, dimana formatnya diseragamkan,
Distributed data warehouse merupakan kumpulan data store yang dibangun secara terpisah yang
digabungkan secara fisik melalui jaringan. Tujuannya adalah agar komponen-komponen yang
terpisah ini terlihat sebagai satu kesatuan utuh sebuah sistem data warehouse . Suatu enterprise
data warehouse dapat dibentuk dari kumpulan data mart yang terpisah, jadi tidak selalu
membentuk sistem yang terpusat tetapi juga bisa terdistribusi. Dengan kecenderungan data-
oriented, data pada suatu perusahaan atau organisasi seharusnya merupakan data yang widely-
shareable.
Local Data Warehouse merepresentasikan data dan proses-proses pada remote site. Sedangkan
global Data Warehouse merepresentasikan bagian dari bisnis yang diintegrasikan.
2. Technologically Distributed Data Warehouse
Menunjukkan bahwa secara logic, ini merupakan single dw tapi pada kenyataannya secara fisik
terdapat beberapa dw yang diintegrasikan yang berasal dari beberapa prosesor/site yang berbeda.
Setiap bagian dari distributed data warehouse, memiliki otonomi untuk mengatur dan
mengembangkan bisnisnya tanpa harus memperhatikan bagian yang lain.
Distributed data warehouse terbentuk dari beberapa data mart yang diintegrasikan. Setiap data
mart ini memiliki skema ETL yang terpisah, bisa jadi satu data mart dengan data mart lainnya
berbeda, tetapi tidak menutup kemungkinkan dimana skema ETLnya sama, tergantung proses
bisnis yang terjadi didalamnya. Disini kita mengenal local data warehouse dan global data
warehouse. Dalam beberapa kasus, bagian data warehouse bisa berada di lingkungan terpusat
(global) sekaligus terdistribusi (local). Contohnya, suatu perusahaan yang besar yang memiliki
cabang yang tersebar di beberapa kota. Mereka membutuhkan global data warehouse sebagai
tempat informasi yang dikumpulkan. Sedangkan local data warehouse diperlukan untuk
menangani masalah bisnis yang terjadi ditiap cabangnya. Sehingga dapat dikatakan bahwa
distributed data warehouse ini memberikan otonomi kepada tiap local areanya untuk menjawab
persoalan bisnisnya sendiri. Setiap local data warehouse, dalam hal ini data mart, dapat
melakukan pekerjaannya dengan implementasi sendiri tanpa mengetahui apa yang sedang
dilakukan data meart lainnya. Dalam distributed data warehouse ini, share informasi hanya
dilakukan oleh local data warehouse dengan global data warehouse. Jadi tidak terjadi pertukaran
informasi antar local data warehouse. Akan tetapi, disini semua data mart harus didesain untuk
bekerja secara bersamaan menjadi satu warehouse yang utuh.
– Fragmentation,
– Allocation,
– Replication.
• Advantages of DDBMSs
– Reflects organizational structure
– Improved shareability and local autonomy
– Improved availability
– Improved reliability
– Improved performance
– Economics
– Modular growth
• Disadvantages of DDBMSs
– Complexity
– Cost
– Security
– Integrity control more difficult
– Lack of standards
– Lack of experience
– Database design more complex
• Types of DDBMS
– Homogeneous DDBMS
– Heterogeneous DDBMS
4. Berilah penjelasan perbedaan antara database terpusat, database parallel, dan database
terdistribusi berdasarkan kelebihannya, arsitekturnya, keamanannya, dan
implementasinya
database parallel
keuntungan
-linier scaleup
menyatakan bahwa performansi database bergantung pada ukuran database,processing dan
storage power
-linier speedup
munujukan peningkatan perpormansi untuk sebuah ukuran database yg tetap adalah linier dan
peningkatan linier didalam pemrosesan dan sumber daya
database terdistribusi
Database terpusat
• Keuntungan
– Efisien untuk share jumlah data yang besar. Tidak perlu kirim data secara langsung dari satu
sub sistem ke sub sistem yang lain
– Sub-sistem tidak perlu memikirkan bagaimana data digunakan oleh sub sistem lain.
– manajeman data seperti backup, keamanan, re-index, dan kontrol akses dilakukan secara
terpusat. Itu merupakan tanggung jawab manager repository
• Kerugian
– Sub-system harus mengikuti model yang sudah ditetapkan.Jadi jika ada sub sistem baru, maka
yang baru harus menyesuaikan dengan model yang ada.
– Evolusi data sulit dan mahal karena volume informasi yang besar dihasilkan dengan model
tertentu. Mengubahnya ke model yang lain pun tidak mudah
– Sulit untuk distribusi layanan secara efisien, karena yang melayani hanya satu.
5. Jelaskanlah yang dimaksud dengan database replication dan fungsi-fungsi yang harus
dimiliki
replikasi memiliki pengertian sebagai suatu proses mencopy atau mentransfer data dari suatu
database ke database lain yang tersimpan pada komputer berbeda.
• Availability
• Reliability
• Performance
• Load Reduction
• Disconnected computing
• Supports many users
• Supports advanced applications
Model Replikasi.
Ada beberapa model replikasi, yaitu:
2)One master, one slave.
Replikasi yang hanya terdiri dari satu master dan satu slave.
3)One master, many slave.
Replikasi yang terdiri sari satu master dan beberapa slave.
4)Master/slave circular relationship.
Replikasi dimana kedua komponen bias berfungsi sebagai slave atau master.
5)Master/slave “daisy chain”
C. Jenis Replikasi
1)Replikasi Synchronous
2)Replikasi Asynchronous
Replikasi Synchronous
•Proses dilakukan secara real-time antara master dengan slave.
•Keseluruhan proses penulisan pada disk master dan slave harus selesai terlebih dahulu sebelum
beranjak ke transaksi selanjutnya.
•Kebutuhan akan performansi sistem yang tinggi harus dipertimbangkan (kecepatan & jarak antar
site/node)
•Keuntungannya : menyediakan recovery yang konsisten karena sinkronisasi data terjaga.
Replikasi Asynchronous
•Proses replikasi terjadi setelah transaksi di master selesai.
•Pertukaran data secara buffering, data akan diletakkan dalam sebuah buffer terlebih dahulu,
kemudian pada jangka waktu tertentu akan direplikasi ke disk slave.
•Tidak menjamin kesinkronan data apabila salah satu site/node mengalami crash saat replikasi
belum selesai dilaksanakan.
•Keuntungan : efektifitas biaya proses transaksi
Kasus