10 Data Handling Distribution

10 Data Handling Distribution

Penempatan dan Pengalokasian Data
Tujuan: Penempatan dan pengalokasian file adalah menjamin obyektifitas data diletakkan pada tempat yang baik terhadap obyek lain yang direlasikan. Konsep “Well – Placedness”

Well - Placedness Jika data O1 dan O2 diperlukan berurutan dalam suatu query khusus, maka ‘diinginkan’ kedua obyek tersebut diletakkan berdekatan satu sama lain, misalnya pada single page atau site tertentu.

Well - Placedness Faktor yang mempengaruhi penempatan file :
Apa yang terjadi jika kapasitas storage lokal yang dapat dipakai terlalu kecil untuk menangani semua data dari query tertentu? Apa yang terjadi jika obyek O1 ingin didekatkan dengan obyek O2 dan O3 yang berbeda site? Efek apa yang terjadi jika query optimizer ada pada proses ini? Dapatkah kita memperbaiki Well – Placedness ini dalam kasus di mana dimungkinkan mengeksploitasi paralelisme alami pada jaringan komputer?

Single Relation Diasumsikan suatu relasi tunggal, di mana tuple-tuple diletakkan pada seluruh node network. Untuk mengawalinya, salah satu site dilibatkan dan terdapat banyak page data dimana tuple dapat disebar. Dengan menggunakan konsep “memaksimalkan lokalitas data” diharapkan tiap tuple diletakkan berdekatan dengan tuple lain.

Single Relation Contoh : Database komponen motor & supplier dituliskan dengan (angka, huruf). Dimana angka sebagai komponen motor dan huruf sebagai komponen supplier.

page-1 page-2 page-3 page-4
Single Relation Pertama kali penempatan file dirancang dengan supplier tertentu diletakkan pada tiap page. (1,P) (1,Q) (1,R) (1,S) (2,P) (2,Q) (2,R) (2,S) (3,P) (3,Q) (3,R) (3,S) (4,P) (4,Q) (4,R) (4,S) page-1 page-2 page-3 page-4

Single Relation Andaikan ada query “Tampilkan suplier yang mensupply komponen-1? Atau (1,*)? (2,*)? (3,*)? (4,*)? (*,P)? (*,Q)? … Jika menganalisa penempatan data seperti sebelumnya, maka semua page akan dievaluasi, sehingga unjuk kerja sistem menjadi LAMBAT

Single Relation Perbaikan penempatan file ke – 2, sebagai berikut: (1,P) (1,R) (3,P) (3,R) (1,Q) (1,S) (3,Q) (3,S) (2,P) (2,R) (4,P) (4,R) (2,Q) (2,S) (4,Q) (4,S) page-1 page-2 page-3 page-4 Kalau dianalisa maka hanya ada 2 page yang dievaluasi, sehingga unjuk kerja sistem LEBIH CEPAT

Single Relation Perbaikan penempatan file ke-3, sebagai berikut: (1,P) (2,P) (3,P) (4,P) (1,Q) (2,Q) (3,Q) (4,Q) (1,R) (2,R) (3,R) (4,R) (1,S) (2,S) (3,S) (4,S) page-1 page-2 page-3 page-4 Hanya ada 1 page yang dievaluasi, sehingga unjuk kerja sistem SEMAKIN LEBIH CEPAT

Single Relation Diasumsikan kita dapat menyebarkan tuple dari single relation yang sama ke sejumlah site dalam jaringan terdistribusi Disumsikan pula tidak ada aplikasi yang berhubungan dengan pola penempatan data di site. Tujuan yang akan diperoleh adalah : Memaksimalkan paralisme dari eksekusi query (banyak tuple yang dapat diproses persatuan waktu) Meminimalkan trafik data intersite (memproses banyak tuple pada satu site)

Single Relation (1,P) (1,R) (3,P) (3,R) (1,Q) (1,S) (3,Q) (3,S)
Dari penempatan tuple yang telah diperbaiki (2), page dialokasikan kesite sebagai berikut: Site 1 berisi page (1,4) Site 2 berisi page (2,3) (1,P) (1,R) (3,P) (3,R) (1,Q) (1,S) (3,Q) (3,S) (2,P) (2,R) (4,P) (4,R) (2,Q) (2,S) (4,Q) (4,S) SITE 1 SITE 2

Single Relation Sistem akan mengakses 1 site
Kemudian dilakukan query “Tampilkan suplier yang mensupply komponen-1” Penempatan file yang di perbaiki : Site 1 berisi page (1,2), Site 2 berisi page (3,4) Atau Site 1 berisi page (1,3), Site 2 berisi page (2,4) Sistem akan mengakses 1 site

Multiple Relation (a,P) (P,1) (b,Q) (Q,2) (c,R) (R,3) (d,S) (S,4)
Permasalahan akan lebih sulit jika kita mendistribusikan tuple dari relasi yang memiliki lebih dari 1 site ke site (a,P) (P,1) (b,Q) (Q,2) (c,R) (R,3) (d,S) (S,4) R R2 Page-1 (a,Q) (P,2) (b,R) (Q,3) (c,S) (R,4) (d,P) (S,1) R R2 Page-2 (a,R) (P,3) (b,S) (Q,4) (c,P) (R,1) (d,Q) (S,2) R R2 Page-3 (a,S) (P,4) (b,P) (Q,1) (c,Q) (R,2) (d,R) (S,3) R R2 Page-4 Lakukan query: Ambil semua tuple R2 dengan kolom 2 = ‘1’ match dengan (join column) tuple R1 dengan kolom 1 = ‘a’. (semua komponen = ‘1’ dan kota = ‘a’)  (R1)  (R2) Kalau dianalisa, sistem akan mengeksekusi ke-4 page tersebut, sehingga unjuk kerja sistem menjadi lambat.

Multiple Relation Alternatif penempatan: (a,P) (P,1) (b,Q) (Q,2)
(c,R) (R,3) (d,S) (S,4) R R2 Page-1 (a,Q) (P,2) (b,R) (Q,3) (c,S) (R,4) (d,P) (S,1) R R2 Page-2 (a,R) (P,3) (b,S) (Q,4) (c,P) (R,1) (d,Q) (S,2) R R2 Page-3 (a,S) (P,4) (b,P) (Q,1) (c,Q) (R,2) (d,R) (S,3) R R2 Page-4 Maka ketika dilakukan query, sistem hanya akan mengakses page 1 & page 3, maka unjuk kerja sistem semakin lebih cepat. Jika tuple di page disebar ke beberapa site? Misal Site 1 = page 1 &3 Site 2 = page 2 &4

10 Data Handling Distribution

Presentasi serupa

Presentasi berjudul: "10 Data Handling Distribution"— Transcript presentasi:

Presentasi serupa

Tentang proyek

Tanggapan

Masuk

Otorisasi melalui jaringan sosial:

10 Data Handling Distribution

Presentasi serupa

Presentasi berjudul: "10 Data Handling Distribution"— Transcript presentasi:

Presentasi serupa

Tentang proyek

Tanggapan