METODE PENGEMBANGAN DATAWAREHOUSE Oleh : Rahmat Robi Waliyansyah, M.Kom.
Pengembangan model dilakukan berdasarkan eksplorasi model dan data dari sumber data. Model konseptual untuk sebuah data warehouse berasal dari model data sumber yang ditransformasi. Kebutuhan organisasi tidak diidentifikasi sama sekali atau diidentifikasi sebagian. . Data-driven Approach
Requirement-Driven Approach Dalam bidang data warehouse kebutuhan yang dimaksud adalah kebutuhan informasi, bukan kebutuhan fungsional sebagaimana digunakan dalam SDLC. Terdapat beberapa cara yang berbeda dalam memperoleh kebutuhan pengguna, yaitu : user-driven approach [Westerman, Goeken, dan Kimball ] process-driven approach [Kaldeich dan Oliveira ] goal-driven approach [Georgini] Sebuah metode dapat menggunakan lebih dari satu pendekatan.
goal-driven approach Pendekatan goal-driven : dengan cara menganalisis bisnis untuk memperoleh satu set visi dengan mewancarai manajemen puncak dan menengah. Kelemahan dari pendekatan ini bergantung pada manajemen puncak dan menengah yang terlibat.
PROCESS-DRIVEN APPROACH Pendekatan process-driven yaitu dengan cara mempelajari sumber data untuk menentukannya. Kelemahan dari pendekatan ini satu set struktur informasi dalam data warehouse memungkinkan tidak pernah digunakan.
USER-DRIVEN APPROACH Pendekatan user-driven yaitu dengan cara menentukan kebutuhan informasi dari beberapa pengguna bisnis lalu diintegrasikan untuk memperoleh schema multidimensional. Kelemahannya adalah dalam memetakan kebutuhan informasi dengan sumber data yang tersedia hanya sebuah posteriori. Kadang-kadang gagal dan dapat menyebabkan kekecewaan pengguna.
4 Tahap Awal Metodologi Dalam Perancangan Basis Data Untuk Data Warehouse : Predictive modeling Adalah untuk membantu model untuk memprediksi suatu nilai yang mempunyai ciri-ciri tertentu. Association analysis adalah untuk menghasilkan sejumlah rule yang menjelaskan sejumlah data yang terhubung kuat satu dengan yang lainnya.
4 Tahap Awal Metodologi Dalam Perancangan Basis Data Untuk Data Warehouse : Clustering Adalah untuk mengelompokan data yang sejenis sehingga data yang berada di cluster yang sama mempunyai banyak kesamaan dibandingkan dengan data yang ada di cluster yang berbeda. Anomaly detection adalah untuk menemukan anomaly atau outlier yaitu data yang berbeda dengan data-data yang lainnya.
Ada 2 pendekatan dalam membuat data warehouse: Skema Bintang (Star Schema) Mengikuti bentuk bintang. Skema bintang terdiri atas 1 tabel fakta (fact table) dipusat bintang dengan beberapa table dimensi (dimensional tables) mengelilinginya. Semua table dimensi secara langsung berhubung ke table fakta.
Skema Bintang (Star Schema)
2. Skema Bola Salju (Snowflake Schema) Skema bola salju merupakan perluasan dari skema bintang dengan tambahan berupa beberapa table dimensi yang tidak terhubung secara langsung ke tabel fakta, melainkan melalui tabel dimensi lainnya.
Skema Bola Salju (Snowflake Schema)
Tabel Fakta berisi field yang menunjukkan fakta dari suatu subjek, yang diidentifikasi bahwa dengan field ini kita bisa mengukur suatu aktivitas dalam subjek tertentu. Misalnya dalam subjek penjualan. Field dari tabel fakta ini bisa berisi total produk yang terjual, total pendapatan dari penjualan produk tertentu, dll. Tabel dimensi merupakan penjelasan dari data yang terdapat dalam tabel fakta. Misalnya dalam tabel fakta menyebutkan penjualan produk ke pelanggan PT.X, maka untuk melihat detail mengenai PT.X, kita bisa melihat dalam tabel dimensi Pelanggan yang berhubungan dengan tabel fakta tersebut.
Beberapa Contoh Metodologi NCR SAS Microsoft
NCR (Non Conform report)
Metode NCR (Non Conform report) 3NF dan model perusahaan (penekanan pada normalisasi dan DBMS standar). Penekanan pada arsitektur. Digunakan dalam beberapa sistem yang sangat besar.
Metode SAS
METODE SAS Memakai teknik time-box => Data warehousing cepat Keterkaitan selama 3 bulan (90 hari) Prototyping 2 bulan + 1 bulan untuk pengembangan ‘solid’ Banyak menggunakan prototyping dan workshop dengan pengguna Bergantung pada kemampuan analis sistem yang bagus METODE SAS
MICROSOFT
MICROSOFT Memberikan perhatian pada pengguna secara eksplisit. Terkait dengan beberapa tool yang spesifik yang mengintegrasikan RDBMS dan OLAP (misalnya SQL server dan Layanan Analisa/Pelaporan).
Perbadingan Beberapa Metodologi Pengembangan Data Warehouse (O’Donell, 2002)
Pengembangan Data Warehouse Mendefinisikan keperluan Mendesain data warehouse Pencarian dan pembersihan data Mengimplementasikan data warehouse