Arsitektur Data Warehouse Modern Database Management (Chapter 11), 7th Edition Jeffrey A. Hoffer, Mary B. Prescott, Fred R. McFadden
ARSITEKTUR DATA Arsitektur data menyediakan kerangka dengan mengidentifikasikan dan memahami bagaimana data akan pindah melalui sistem dan digunakan dalam perusahaan. Arsitektur data untuk data warehouse mempunyai komponen utama yaitu read-only basis data.
Karakterisitik arsitektur data warehouse Data diambil dari sistem asal (sistem informasi yang ada), basis data dan file. Data dari sistem asal diintegrasikan dan ditransformasi sebelum disimpan ke dalam Database Management System (DBMS) seperti Oracle,Ms SQL Server, Sybase dan masih banyak yang lainnya. Data warehouse merupakan sebuah basis data terpisah bersifat hanya dapat dibaca yang dibuat khusus untuk mendukung pengambilan keputusan Pemakai mengakses data warehouse melalui aplikasi front end tool.
Infrastruktur data warehouse Merupakan software, hardware, pelatihan dan komponen-komponen lainnya yang memberikan dukungan yang dibutuhkan untuk mengimplementasikan data warehouse Salah satu instrumen yang mempengaruhi keberhasilan pengembangan data warehouse adalah pengidentifikasian arsitektur mana yang terbaik dan infrasruktur apa yang dibutuhkan. Arsitektur yang sama, mungkin memerlukan infrastruktur yang berbeda.
Model Arsitektur Data Warehouse Generic Two-Level Architecture. Independent Data Mart. Dependent Data Mart. Logical Data Mart dan Active Data Warehouse.
Generic Two-Level Architecture Model arsitektur ini adalah data diekstrak dari berbagai sumber data (internal dan external), kemudian data tersebut ditransformasikan terlebih dahulu sebelum dimasukkan ke sebuah data warehouse yang besar.
Generic Two-Level Architecture One, company-wide warehouse T E Periodic extraction data is not completely current in warehouse
Independent Data Mart Model arsitektur independent data mart datanya tidak disimpan dalam sebuah data warehouse yang besar tetapi dalam beberapa data mart.
Independent Data Mart Data marts: L T E Mini-warehouses, limited in scope E T L Separate ETL for each independent data mart Data access complexity due to multiple data marts
Dependent Data Mart Pada arsitektur independent data mart ada keterbatasan dalam proses Extraction, Tranformation dan Loading (ETL). Dependent data mart dikembangkan untuk mengurangi keterbatasan tersebut. Dependent data mart menggunakan data warehouse yang terpusat untuk hasil ETLnya. kapabilitas melakukan drill-down pada independent data mart, dapat dihilangkan dengan menyediakan suatu sumber terintegrasi untuk seluruh operasional data dalam suatu operasional data store.
Dependent Data Mart L T E ODS provides option for obtaining current data Dependent Data Mart E T L Single ETL for enterprise data warehouse (EDW) Dependent data marts loaded from EDW Simpler data access
Logical Data Mart dan Real-Time Data Warehouse Karakteristik dari arsitektur ini meliputi: Logical data mart tidak secara fisik terpisah dengan basis data tetapi hanya perbedaan view terhadap fisik basis data. Beberapa data dipindahkan ke dalam data warehouse untuk meningkatkan utilisasi kinerja pada komputasi yang tinggi. Data mart baru dapat dibuat dengan cepat karena tidak ada basis data secara fisik dan tidak ada pemuatan data ke basis data secara rutin. Data mart selalu up-to-date karena data dibuat dari view ketika view diacu.
Logical Data Mart dan Real-Time Data Warehouse ODS and data warehouse are one and the same E T L Near real-time ETL for @active Data Warehouse Data marts are NOT separate databases, but logical views of the data warehouse Easier to create new data marts
Three-layer data architecture
Data Characteristics Status vs Event Data Event = a database action (create/update/delete) that results from a transaction
Data Characteristics Transient vs Periodic Data Changes to existing records are written over previous records, thus destroying the previous data content Data are never physically altered or deleted once they have been added to the store