5
4
3
2
1
UNIVERSITAS MUHAMMADIYAH JAKARTA DATA WAREHOUSE Giftirul Aziz 2007470069 Mulyadi 2007470094 Hendra 20084700xx FAKULTAS TEKNIK UNIVERSITAS MUHAMMADIYAH JAKARTA 2011
Daftar ISI 1.Pengertian Data Warehouse 2.Alur Data Warehouse 3.Teknologi & Peralatan Warehouse 4.Metodologi Perancangan BD WH 5.Bahasa Query Warehouse
1.Pengertian Data Warehouse Adalah suatu sistem komputer untuk mengarsipkan dan menganalisa data historis suatu organisasi seperti data penjualan, gaji, dan informasi lain dari operasi harian. Karakteristik data warehouse: Subject Oriented (Berorientasi Subjek) Berorientasi terhadap subjek-subjek utama dalam suatu perusahaan, seperti data warehouse untuk customer, produk, dan sebagainya 2. Integrated (Integrasi) Menyimpan data-data dari sumber-sumber yang terpisah ke dalam suatu format yang konsisten saling terintegrasi satu sama lain. Data tidak dapat dipecah-pecah karena merupakan suatu kesatuan.
1.Pengertian Data Warehouse.. 3. Time Variant (Rentang Waktu) Setiap data yang dimasukkan ke data warehouse pasti memiliki dimensi waktu. Dimensi waktu ini akan dipergunakan sebagai pembanding dalam perhitungan untuk menghasilkan laporan. 4. Non Volatile Data pada data warehouse tidak di-update secara real time, tetapi dapat ditambah. Hanya terdapat dua kegiatan dalam data warehouse, yaitu mengambil data (loading data), dan akses data (mengakses data warehouse, seperti melakukan query untuk menampilkan laporan yang dibutuhkan, tidak ada kegiatan updating data).
1.Istilah Dalam Data Warehouse 1. Data Mart Adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan dan analisa data pada suatu unit, bagian atau operasi pada suatu perusahaan. 2. On-Line Analytical Processing (OLAP) Merupakan suatu pemrosesan database yang menggunakan tabel fakta dan dimensi untuk dapat menampilkan berbagai macam bentuk laporan, analisis, query dari data yang berukuran besar.
1.Istilah Dalam Data Warehouse 3. On-Line Transaction Processing(OLTP) Merupakan suatu pemrosesan yang menyimpan data mengenai kegiatan operasional transaksi sehari-hari. 4. Dimension Table Tabel yang berisikan kategori dengan ringkasan data detail yang dapat dilaporkan. Seperti laporan laba pada tabel fakta dapat dilaporkan sebagai dimensi waktu(yang berupa perbulan, perkwartal dan pertahun).
1.Istilah Dalam Data Warehouse 5. Fact Table Tabel yang umumnya mengandung angka dan data history dimana key (kunci) yang dihasilkan sangat unik, karena key tersebut terdiri dari foreign key(kunci asing) yang merupakan primary key (kunci utama) dari beberapa dimension table yang berhubungan. 6. DSS Merupkan sistem yang menyediakan informasi kepada pengguna yang menjelaskan bagaimana sistem ini dapat menganalisa situasi dan mendukung suatu keputusan yang baik.
2.Alur Data Warehouse 1. Inflow Pengekstrasian, pembersihan, dan pemuatan sumber data. 2. Upflow Menambahkan nilai data kedalam warehouse melalui ringkasan, pemaketan, dan pendistribusian data. 3. Downflow pengarsipan dan back up data ke dalam warehouse.Data Warehouse 4. Outflow Membuat data agar tersedia untuk pemakai akhir. 5. Meta-flow Pengaturan meta-dataData Warehouse.
3.Teknologi & Peralatan WH 1. Code generator Membuat program transformasi 3GL/4GL yang dapat disesuaikan berdasarkan sumber dan target pendefinisian data. 2. Database data replication tools Menggunakan database trigger dan recovery log untuk merekam perubahan terhadap sumber data tunggal pada satu system dan mengunakan perubahan tersebut ke suatu salinan sumber data yang dialokasikan pada sebuah sistem yang berbeda. 3. Dynamic transformation engines Merekam data dari sumber sistem pada interval yang telah definisikan pemakai, entransformasikan data kemudian mengirim dan memuat hasilnya kedalam target lingkungan.
4.Metodologi Perancangan Langkah 1 : Pemilihan proses Data mart yang pertama kali dibangun haruslah data mart yang dapat dikirim tepat waktu dan dapat menjawab semua pertanyaan bisnis yang penting. Langkah 2 : Pemilihan sumber Untuk memutuskan secara pasti apa yang diwakili atau direpresentasikan oleh sebuah tabel fakta. Misal, jika sumber dari sebuah tabel fakta properti sale adalah properti sale individual maka sumber dari sebuah dimensi pelanggan berisi rincian pelanggan yang membeli properti utama
4.Metodologi Perancangan Langkah 3 : Mengidentifikasi dimensi Set dimensi yang dibangun dengan baik, memberikan kemudahan untuk memahami dan menggunakan data mart Dimensi ini penting untuk menggambarkan fakta-fakta yang terdapat pada tabel fakta Langkah 4 : Pemilihan fakta Sumber dari sebuah tabel fakta menentukan fakta mana yang bisa digunakan dalam data mart. Semua fakta harus diekspresikan pada tingkat yang telah ditentukan oleh sumber
4.Metodologi Perancangan Langkah 5 : Menyimpan pre-kalkulasi di tabel fakta. Hal ini terjadi apabila fakta kehilangan statement Langkah 6 : Melengkapi tabel dimensi Pada tahap ini kita menambahkan keterangan selengkap-lengkapnya pada tabel dimensi Keterangannya harus bersifat intuitif dan mudah dipahami oleh pengguna Langkah 7 : Pemilihan durasi database Misalnya pada suatu perusahaan asuransi, mengharuskan data disimpan selama 10 tahun atau lebih
4.Metodologi Perancangan Langkah 8 : Menelusuri perubahan dimensi yang perlahan Tipe 1. Atribut dimensi yang telah berubah tertulis ulang Tipe 2. Atribut dimensi yang telah berubah menimbulkan sebuah dimensi baru Tipe 3. Atribut dimensi yang telah berubah menimbulkan alternatif sehingga nilai atribut lama dan yang baru dapat diakses secara bersama pada dimensi yang sama. Langkah 9 : Menentukan prioritas dan mode query Pada tahap ini kita menggunakan perancangan fisik. Dengan langkah-langkah tadi, seharusnya kita bisa membangun sebuah data warehouse yang baik.
5.Bahasa Query Warehuse Bahasa query adalah bahasa untuk meminta informasi dari basis data. Bahasa query merupakan bahasa antara yang digunakan basis data, dalam mengkonversi menjadi bahasa formal sehingga dapat diterapkan sekumpulan informasi untuk memperoleh query paling efisien. Relational Algebra (aljabar relasional) merupakan kumpulan operasi terhadap relasi dimana setiap operasi menggunakan satu atau lebih relasi untuk menghasilkan satu relasi yang baru dan termasuk kategori prosedural dan juga menyediakan seperangkat operator untuk memanipulasi data.
Sekian