Dimensional Modeling (Advance)
Update Pada Tabel Dimensi Setiap terjadi transaksi penjualan maka pada penambahan baris data juga akan dilakukan pada tabel fakta Bandikan dengan tabel dimensi, Tabel dimensi lebih stabil dibandingkan dengan tabel fakta. Transaksi OLTP meningkat update tabel fakta Update berdasarkan peningkatan data/rows Namun pada tabel dimensi update tidak hanya disebabkan oleh peningkatan data saja, tapi diakibatkan oleh perubahan data dan atribut
Tipe update data pada tabel dimensi Slowly Changing Dimensions Rapidly Changing Dimensions
Slowly Changing Dimensions (SCD) Kebanyakan dimensi konstan Banyak dimensi yang tidak konstan, tetapi change slowly Prymary key(product key) tidak berubah Deskripsi dan atribut yang lain, change slowly
Ada 3 macam SCD SCD1 : Record baru mengganti record lama. Hanya ada satu record pada database current data SCD2 : Record baru ditambahkan pada tabel dimensi. Terdapat dua record pada database – current record dan record/data sebelumnya. SCD3 : Data yang asli dimodifikasi dengan memasukkan informasi baru didalamnya. Pada database terdapat satu record yaitu data lama dan tambahan informasi baru pada baris yang sama
SCD1 Mempebaiki error pada sistem sumber seperti kesalahan data nama. Kesalahan penulisan data Kristin Daniels menjadi Kristin Samuelson Perubahan status Belum kawin menjadi Kawin (dilakukan hanya jika terjadi kesalahan data)
SCD1
SCD1 Ganti data pada atribut dengan data baru Data yang lama tidak perlu disimpan Perubahan lain tidak dilakukan pada tabel dimensi Kunci tidak terpengaruh oleh perubahan Mudah untuk dilakukan
SCD 2
SCD 2 Tambahkan baris baru pada dimensi beserta update data Effective data field masuk pada tabel dimensi Tidak ada perubahan pada baris dimensi yang asli Kunci baris asli tidak terpengaruh Tambahkan surrogate key pada baris baru yang ditambahkan.
Surrogate key kunci pengganti natural key Surrogate key kunci pengganti natural key. Merupakan kunci unique untuk setiap baris dan dapat digunakan sebagai pengganti primary key. Harus unique untuk setiap baris. Berguna karena primary key dapat berubah dan mengakibatkan update data menjadi sukar. Selalu integer atau numeric
SCD3
SCD3 Tambahkan atribut “old” pada dimensi Pindahkan curent data pada old atribut Masukkan data update pada current atribut Kunci tidak terpengaruh oleh perubahan
Hybrid slowly changing dimension Kombinasi dari SCD1 dan SCD2 Bida terjadi pada tabel, beberapa kolom yang penting dan kita perlu menyimpan data perubahannya.
Isu Seputar Dimensi Large Dimension Multiple Hierarchies Rapidly Changing Dimensions Junk Dimensions
Large Dimension Very deep mempunyai banyak baris Very Wide mempunyai banyak atribut Menyebabkan DW lambat dan tidak efisien Solusi : Lakukan index Memecah dimensi menjadi mini dimensi Laukan teknik-teknik optimasi lainnya
Multiple Hierarchies
Rapidly Changing Dimensions
Junk Dimensions Atribut yang mempunyai arti untuk menjaga constraint queri berdasarkan flag/kode text. Menggabungkan atribut-atribut tersebut menjadi sub dimensi disbut – junk dimension
AGGREGATE FACT TABLES
Query 1: Total sales for customer number 12345678 during the first week of December 2000 for product Widget-1. Query 2: Total sales for customer number 12345678 during the first three months of 2000 for product Widget-1. Query 3: Total sales for all customers in the South-Central territory for the first two quarters of 2000 for product category Bigtools. Query diatas akan menghitung total sales pada setiap kasus. Total akan dihitung dengan menambahkan sales quantitatives dan sales dollars
Query 1 Semua fact table dimana key berhubungan dengan custumer number 12345678, key product berelasi dengan product Widget-1, dan time key berelasi dengan 7 hari pada minggu pertama december 2000. Dengan asumsi tersebut seorang custumer bisa melakukan transaksi pembelian : sebuah produk pada satu hari, Maka maksimal 7 baris pada tabel fakta akan ikut dalam penghitungan
Query 2 Semua baris pada tabel fakta dimana kunci custumer adalah 12345678. kunci produk berhubungan dengan product Widget-1 dan kunci waktu berhubungan dengan sekitar 90 hari pada quarter pertama tahun 2000 Dari asusmsi tersebut maka Seorang custumer dapat melakukanpembelian sebuah prosuk Pada satu hari Dan maks 90 baris pada tabel faktayang akan diikutkan dalam perhitungan
Query 3 Semua baris pada tabel fakta dimana kunci custumer berhubungan dengan semua custumer pada South-Central territory, kunci product berelasi dengan semua product pada procut category, dan kunci waktu berelasi dengan sekitar 180 hari pada dua quarter pertama tahun. Sehingga query yang ketiga ini paling lama dieksekusi
Fact Table Sizes
Fact Table Sizes
Aggregating Fact Tables
One-Way Aggregates Product category by store by date Product department by store by date All products by store by date Territory by product by date Region by product by date All stores by product by date Month by store by product Quarter by store by product Year by store by product
Two-Way Aggregates All products by territory by date Product category by territory by date Product category by region by date Product category by all stores by date Product category by month by store Product category by quarter by store Product category by year by store Product department by territory by date Product department by region by date Product department by all stores by date Product department by month by store Product department by quarter by store Product department by year by store All products by territory by date All products by region by date All products by all stores by date All products by month by store All products by quarter by store All products by year by store District by month by product District by quarter by product District by year by product Territory by month by product Territory by quarter by product Territory by year by product Region by month by product Region by quarter by product Region by year by product All stores by month by product All stores by quarter by product All stores by year by product
Three-Way Aggregates Product category by region by quarter Product category by territory by month Product department by territory by month All products by territory by month Product category by region by month Product department by region by month All products by region by month Product category by all stores by month Product department by all stores by month Product category by territory by quarter Product department by territory by quarter All products by territory by quarter Product category by region by quarter Product department by region by quarter All products by region by quarter Product category by all stores by quarter Product department by all stores by quarter Product category by territory by year Product department by territory by year All products by territory by year Product category by region by year Product department by region by year All products by region by year Product category by all stores by year Product department by all stores by year All products by all stores by year