Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Dimensional Modeling (Advance)

Presentasi serupa


Presentasi berjudul: "Dimensional Modeling (Advance)"— Transcript presentasi:

1 Dimensional Modeling (Advance)

2 Update Pada Tabel Dimensi
Setiap terjadi transaksi penjualan maka pada penambahan baris data juga akan dilakukan pada tabel fakta Bandikan dengan tabel dimensi, Tabel dimensi lebih stabil dibandingkan dengan tabel fakta. Transaksi OLTP meningkat  update tabel fakta Update berdasarkan peningkatan data/rows Namun pada tabel dimensi update tidak hanya disebabkan oleh peningkatan data saja, tapi diakibatkan oleh perubahan data dan atribut

3 Tipe update data pada tabel dimensi
Slowly Changing Dimensions Rapidly Changing Dimensions

4 Slowly Changing Dimensions (SCD)
Kebanyakan dimensi konstan Banyak dimensi yang tidak konstan, tetapi change slowly Prymary key(product key) tidak berubah Deskripsi dan atribut yang lain, change slowly

5 Ada 3 macam SCD SCD1 : Record baru mengganti record lama. Hanya ada satu record pada database current data SCD2 : Record baru ditambahkan pada tabel dimensi. Terdapat dua record pada database – current record dan record/data sebelumnya. SCD3 : Data yang asli dimodifikasi dengan memasukkan informasi baru didalamnya. Pada database terdapat satu record yaitu data lama dan tambahan informasi baru pada baris yang sama

6

7 SCD1 Mempebaiki error pada sistem sumber seperti kesalahan data nama.
Kesalahan penulisan data  Kristin Daniels menjadi Kristin Samuelson Perubahan status  Belum kawin menjadi Kawin (dilakukan hanya jika terjadi kesalahan data)

8 SCD1

9 SCD1 Ganti data pada atribut dengan data baru
Data yang lama tidak perlu disimpan Perubahan lain tidak dilakukan pada tabel dimensi Kunci tidak terpengaruh oleh perubahan Mudah untuk dilakukan

10 SCD 2

11 SCD 2 Tambahkan baris baru pada dimensi beserta update data
Effective data field masuk pada tabel dimensi Tidak ada perubahan pada baris dimensi yang asli Kunci baris asli tidak terpengaruh Tambahkan surrogate key pada baris baru yang ditambahkan.

12 Surrogate key  kunci pengganti natural key
Surrogate key  kunci pengganti natural key. Merupakan kunci unique untuk setiap baris dan dapat digunakan sebagai pengganti primary key. Harus unique untuk setiap baris. Berguna karena primary key dapat berubah dan mengakibatkan update data menjadi sukar. Selalu integer atau numeric

13 SCD3

14 SCD3 Tambahkan atribut “old” pada dimensi
Pindahkan curent data pada old atribut Masukkan data update pada current atribut Kunci tidak terpengaruh oleh perubahan

15 Hybrid slowly changing dimension
Kombinasi dari SCD1 dan SCD2 Bida terjadi pada tabel, beberapa kolom yang penting dan kita perlu menyimpan data perubahannya.

16 Isu Seputar Dimensi Large Dimension Multiple Hierarchies
Rapidly Changing Dimensions Junk Dimensions

17 Large Dimension Very deep  mempunyai banyak baris
Very Wide  mempunyai banyak atribut Menyebabkan DW lambat dan tidak efisien Solusi : Lakukan index Memecah dimensi menjadi mini dimensi Laukan teknik-teknik optimasi lainnya

18 Multiple Hierarchies

19 Rapidly Changing Dimensions

20 Junk Dimensions Atribut yang mempunyai arti untuk menjaga constraint queri berdasarkan flag/kode text. Menggabungkan atribut-atribut tersebut menjadi sub dimensi disbut – junk dimension

21 AGGREGATE FACT TABLES

22 Query 1: Total sales for customer number during the first week of December 2000 for product Widget-1. Query 2: Total sales for customer number during the first three months of 2000 for product Widget-1. Query 3: Total sales for all customers in the South-Central territory for the first two quarters of 2000 for product category Bigtools. Query diatas akan menghitung total sales pada setiap kasus. Total akan dihitung dengan menambahkan sales quantitatives dan sales dollars

23 Query 1 Semua fact table dimana key berhubungan dengan custumer number , key product berelasi dengan product Widget-1, dan time key berelasi dengan 7 hari pada minggu pertama december 2000. Dengan asumsi tersebut seorang custumer bisa melakukan transaksi pembelian : sebuah produk pada satu hari, Maka maksimal 7 baris pada tabel fakta akan ikut dalam penghitungan

24 Query 2 Semua baris pada tabel fakta dimana kunci custumer adalah kunci produk berhubungan dengan product Widget-1 dan kunci waktu berhubungan dengan sekitar 90 hari pada quarter pertama tahun 2000 Dari asusmsi tersebut maka Seorang custumer dapat melakukanpembelian sebuah prosuk Pada satu hari Dan maks 90 baris pada tabel faktayang akan diikutkan dalam perhitungan

25 Query 3 Semua baris pada tabel fakta dimana kunci custumer berhubungan dengan semua custumer pada South-Central territory, kunci product berelasi dengan semua product pada procut category, dan kunci waktu berelasi dengan sekitar 180 hari pada dua quarter pertama tahun. Sehingga query yang ketiga ini paling lama dieksekusi

26 Fact Table Sizes

27 Fact Table Sizes

28 Aggregating Fact Tables

29

30 One-Way Aggregates Product category by store by date
Product department by store by date All products by store by date Territory by product by date Region by product by date All stores by product by date Month by store by product Quarter by store by product Year by store by product

31 Two-Way Aggregates All products by territory by date
Product category by territory by date Product category by region by date Product category by all stores by date Product category by month by store Product category by quarter by store Product category by year by store Product department by territory by date Product department by region by date Product department by all stores by date Product department by month by store Product department by quarter by store Product department by year by store All products by territory by date All products by region by date All products by all stores by date All products by month by store All products by quarter by store All products by year by store District by month by product District by quarter by product District by year by product Territory by month by product Territory by quarter by product Territory by year by product Region by month by product Region by quarter by product Region by year by product All stores by month by product All stores by quarter by product All stores by year by product

32 Three-Way Aggregates Product category by region by quarter
Product category by territory by month Product department by territory by month All products by territory by month Product category by region by month Product department by region by month All products by region by month Product category by all stores by month Product department by all stores by month Product category by territory by quarter Product department by territory by quarter All products by territory by quarter Product category by region by quarter Product department by region by quarter All products by region by quarter Product category by all stores by quarter Product department by all stores by quarter Product category by territory by year Product department by territory by year All products by territory by year Product category by region by year Product department by region by year All products by region by year Product category by all stores by year Product department by all stores by year All products by all stores by year


Download ppt "Dimensional Modeling (Advance)"

Presentasi serupa


Iklan oleh Google