Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Simulasi Optimasi Query Menggunakan Histogram untuk Meminimalisasi Nilai Sumber Daya pada Database Terdistribusi Oleh: 06410100005 - Ignatius Hadi Prabowo.

Presentasi serupa


Presentasi berjudul: "Simulasi Optimasi Query Menggunakan Histogram untuk Meminimalisasi Nilai Sumber Daya pada Database Terdistribusi Oleh: 06410100005 - Ignatius Hadi Prabowo."— Transcript presentasi:

1 Simulasi Optimasi Query Menggunakan Histogram untuk Meminimalisasi Nilai Sumber Daya pada Database Terdistribusi Oleh: Ignatius Hadi Prabowo

2 Latar Belakang  Proses optimasi pada query dalam sebuah relasi database menjadi pekerjaan yang ’mahal’ saat berurusan dengan relasi dalam jumlah besar. Mencari cara terbaik dengan waktu eksekusi tercepat adalah sebuah kewajiban semenjak strategi yang salah diterapkan dalam sebuah. Dengan meningkatnya kompleksitas sebuah database, hal tersebut menjadi penting bagi metode-metode query optimizer untuk mengadopsi sebuah algoritma yang membutuhkan cost rendah dalam hal waktu eksekusi.  ”The selectivity of a predicate in a query is a decisive aspect for a query plan generation. The ordering of predicates can considerably affect the time needed to process a join query. To have the query plan ready at compile-time, we need to have the selectivities of all the query predicates. To calculate these selectivities, we use histograms.” (Li, Han, & Ding, 2010) Selektivitas predikat (where) dalam query adalah aspek yang menentukan untuk menghasilkan rencana query (query plan). Urutan predikat dapat mempengaruhi waktu yang dibutuhkan untuk proses query join. Untuk memiliki rencana query siap pada compile time, perlu dimiliki selektivitas dari semua query predikat. Untuk menghitung selektivitas ini, digunakan histogram.

3 Rumusan Masalah 1.Bagaimana menggabungkan model optimasi query menggunakan histogram dan model untuk determinasi biaya sumber daya yang digunakan pada sistem database terdistribusi. 2.Apakah model optimasi menggunakan histogram dapat membantu meminimalisasi biaya sumber daya yang akan diperhitungkan menggunakan model yang ada pada sistem database terdistribusi.

4 Batasan Masalah  Sample data yang digunakan adalah data mahasiswa, kurikulum, dan mata kuliah dari STIKOM Surabaya  Menggunakan DBMS Oracle Database 10g Express Edition  Tidak membangun aplikasi perangkat lunak  Membangun model simulasi optimasi query dengan bantuan dibangun histogram untuk mengestimasi susunan predikat dalam suatu query  Variabel yang ditekankan adalah CPU Cost sebagai asumsi mengurangi biaya eksekusi dalam suatu set query

5 Landasan Teori - Simulasi  Simulasi adalah sebuah model matematika yang menjelaskan tingkah laku sebuah sistem dalam beberapa waktu dengan mengobservasi tingkah laku dari sebuah model matematika untuk beberapa waktu seseorang analis bisa mengambil kesimpulan tentang tingkah laku dari sistem dunia nyata yang disimulasikan. Karena simulasi membahas tentang sistem maka perlu adanya pengertian mengenai sistem. Sistem merupakan himpunan dari subsistem-subsistem yang bermanfaat untuk mencapai suatu tujuan yang telah ditetapkan. (Utama, 2010)

6 Landasan Teori – Kelebihan dan Kekurangan Simulasi 1.Tidak semua sistem dapat direpresentasikan dalam model matematis, simulasi merupakan alternatif yang tepat 2.Dapat bereksperimen tanpa adanya resiko pada sistem nyata 3.Simulasi dapat mengestimasi kinerja sistem pada kondisi tertentu dan memberikan alternatif desain terbaik sesual dengan spesifikasi yang diberikan  Kontras dengan beberapa kelebihan yang disebutkan sebelumnya model simulasi juga memiliki beberapa kekurangan, antara lain: 1.Kualitas dan analisis model tergantung pada si pembuat model 2.Hanya mengestimasi karakteristik sistem berdasarkan masukan tertentu

7 Landasan Teori – Verifikasi dan Validasi Model Simulasi  Verifikasi : proses pengecekan terhadap model apakah sudah bebas dari error.  Validasi model merupakan proses pengujian terhadap model apakah model yang dibuat sudah sesuai dengan sistem nyatanya.  Model dianggap valid bila E1  5%

8 Landasan Teori – Vensim  Vensim Simulation merupakan bahasa simulasi yang dapat digunakan sebagai tool untuk membantu menyelesaikan masalah-masalah bisnis maupun teknis. Software ini dikembangkan oleh Ventana Systems, Inc yang dikembangkan sebagai respon terhadap kebutuhan dalam mengembagkan model-model simulasi. (Suryani, 2006)

9 Landasan Teori – Optimasi Query  Menurut dokumen tentang optimasi query yang diunduh dari internet menyatakan, “optimasi query adalah sebuah prosedur untuk meningkatkan strategi evaluasi dari suatu query untuk membuat evaluasi tersebut menjadi lebih efektif.” (Laila, 2011). Ada tiga aspek dasar yang mempengaruhi optimasi query, yaitu: 1.Search space 2.Cost model 3.Search strategy  Sedangkan untuk tujuan optimasi query tersebut, antara lain: 1.Untuk meminimumkan waktu proses 2.Untuk waktu respon, meminimumkan I/O dan meminimumkan penggunaan memory  Inti dari optimasi query adalah meminimalkan “jalur” pencarian untuk menemukan data yang disimpan dalam lokasi fisik.

10 Landasan Teori – Optimasi Query menggunakan Histogram

11 Landasan Teori – Pemeliharaan Histogram

12 Landasan Teori – Model Biaya pada Database Terdistribusi

13 Tahapan Penelitian

14 Perancangan model - Histogram Dalam jurnal ini menggunakan dari distribusi data yang ada lalu dibangun sebuah histogram yang berisikan frekuensi munculnya data tertentu dan dikelompokkan (buckets).

15 Perancangan model - Histogram Gambar di atas menunjukkan hubungan masing-masing variabel terhadap Miu a. Variabel S, Beta, N, dan x berpengaruh negatif terhadap Miu a, yang artinya semakin besar nilai variabel akan mengurangi Miu a. Sedangkan variabel f dan B berpengaruh positif terhadap x. Miu a sendiri akan berpengaruh positif terhadap Ti, semakin besar nilai Miu a maka akan menambah nilai Ti. Sedangkan Wn berpengaruh negatif terhadap Ti.

16 Perancangan model – Determinasi Dalam kasus query terdistribusi, query teruraikan dalam beberapa subquery dan data yang diperlukan dalam subquery tersebut dapat berada dalam beberapa titik dalam database terdistribusi pula. Dalam hal ini biaya transmisi juga dipertimbangkan. Dengan demikian fungsi biaya dalam mengeksekusi query pada sistem terdistribusi melibatkan tiga parameter utama, antara lain biaya komunikasi, biaya I/O dan biaya CPU.

17 Perancangan model – Determinasi Model yang pertama adalah model optimasi query menggunakan histogram dari distribusi data dalam suatu database. Pemodelan menggunakan Vensim tersebut menggambarkan variable-variabel yang digunakan untuk menghitung tingkat kesalahan dalam suatu histogram. Jika tingkat kesalahan dalam suatu histogram kurang dari 0,5 maka histogram tersebut akan valid dan diasumsikan sudah berhasil untuk mengoptimasi suatu set query.

18 Validasi  Explain Plan dengan Histogram explain plan set statement_id='query 1 with histogram' for select * from mhs_mf_ta m, kurlkl_mf_ta k, fak_mf_ta f where m.jur_id=f.id and k.fakul_id=f.id and m.nim=

19 Implementasi dan Evaluasi  Verifikasi

20 Validasi

21  Explain Plan tanpa Histogram explain plan set statement_id='query 1 without histogram' for select * from mhs_mf_ta m, kurlkl_mf_ta k, fak_mf_ta f

22 Validasi

23 Hasil Uji Query berdasarkan histogram Query sistem nyata Histogr am No Histogram % Error Variance Query 1 select * from mhs_mf_ta m, fak_mf_ta f, kurlkl_mf_ta k where m.jur_id=f.id and k.fakul_id=f.id and m.nim= ; select * from mhs_mf_ta m, fak_mf_ta f, kurlkl_mf_ta k where m.nim= and k.fakul_id=f.id and m.jur_id=f.id; Query 2 select * from mhs_mf_ta m, fak_mf_ta f where f.id=m.jur_id; Query 3 select * from mhs_mf_ta m, fak_mf_ta f where m.jur_id=f.id and m.nim= ; select * from mhs_mf_ta m, fak_mf_ta f where m.nim= and m.jur_id=f.id; Query 4 select * from mhs_mf_ta m, kurlkl_mf_ta k, fak_mf_ta f where m.jur_id=f.id and k.fakul_id=f.id and m.nim= select * from mhs_mf_ta m, kurlkl_mf_ta k, fak_mf_ta f where m.nim= and m.jur_id=f.id and k.fakul_id=f.id;


Download ppt "Simulasi Optimasi Query Menggunakan Histogram untuk Meminimalisasi Nilai Sumber Daya pada Database Terdistribusi Oleh: 06410100005 - Ignatius Hadi Prabowo."

Presentasi serupa


Iklan oleh Google