Data Warehousing :: Overview

Slides:



Advertisements
Presentasi serupa
Enterprise Database :: Overview
Advertisements

Data Warehousing :: DWH Design
BASIS DATA RELATIONAL.
5.
OLAP - PERTEMUAN 8 – OLAP.
Database dan Managemen Informasi
BASIS DATA LANJUTAN.
Model Basis Data Pertemuan 6.
Data Warehouse dan Decision Support
Perancangan Basis Data MI 1133
Data Mart dan Metadata Data Warehouse
Pengenalan Data Warehouse
Dimensional Modeling Achmad Yasid.
Dimensional Modeling Achmad Yasid.
PEMODELAN DATA.
Data Mart dan Metadata Data Warehouse
Komponen, konsep, abstraksi dan bahasa
DATA MART.
Dika Anjar Pratiwi Ken Mentari Tilammura Agung Wibowo.
Arsitektur DWH Pertemuan ke-2.
Sumber Data untuk DW Data operasional dalam organisasi, misalnya basis data pelanggan dan produk, dan Sumber eksternal yang diperoleh misalnya melalui.
Data Warehouse, Data Mart, OLTP & OLAP
SISTEM INFORMASI Pertemuan 5.
Pertemuan 5-1 Database dan Sistem Manajemen Database
ONLINE ANALYTICAL PROCESSING (OLAP)
Pengenalan Datawarehouse
ARSITEKTUR SISTEM BASIS DATA
Perancangan Data Warehouse
SISTEM MANAJEMEN DATA Cherrya Dhia Wenny.
BASIS DATA 3 Model Data dan DBMS.
Informasi Dalam Praktik
DATA WAREHOUSE Pertemuan ke-1.
BASIS DATA 3 Model Data dan DBMS.
Datamart dan Datawarehouse
Analisa & Perancangan Sistem Informasi
MANAJEMEN DATA.
SISTEM BASIS DATA.
PENGEMBANGAN PERANCANGAN SISTEM
PENGELOLAAN DATA Roni Kurniawan M.Si.
04 Datawarehouse Transformasi Data Febrianti Supardinah, ST.MM.
DATA MART Pertemuan ke-3.
Suhadi Lili Tim Dapodik Ditjen Dikdas
Proses ETL (Extract-Transform-Load)
Sistem Pustaka Data (Data Warehouse)
Charitas Fibriani, S.Kom, M.Eng
ARSITEKTUR DATA WAREHOUSE
Perancangan Data Warehouse
Prinsip Data Warehouse
The Data Warehouse and The ODS
Data Warehouse Database Systems: Design, Implementation, and Management, Sixth Edition, Rob and Coronel.
PERTEMUAN 1 KONSEP SISTEM INFORMASI AKUNTANSI.
ETL (Extract Transform Load)
Perancangan Data Logis dan Fisik
DATA MART Nama Kelompok 3 : -Ulfha -Yuli -Sandi. Data mart adalah suatu bagian pada data warehouse yang mendukung pembuatan laporan dan analisa data pada.
METODE PENGEMBANGAN DATAWAREHOUSE
Business Intelligent Ramos Somya, S.Kom., M.Cs.
Gudang Data, dan Permasalahannya
Metodologi dan Pengembangan Data Warehouse
Analisis Multidimensional
Oleh : Rahmat Robi Waliyansyah, M.Kom.
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
ETL (Extract-Transform-Load)
Datawarehouse Planning
Business Intelligence Ramos Somya, S.Kom., M.Cs.
Presentasi oleh Adhisma Alzahra Siddinanda
Arsitektur Sistem Basis Data
Introduction to Data Warehouse By: Marcello Singadji
CORPORATE INFORMATION SYSTEM (Sistem Informasi Organisasi)
Business Intelligent Ramos Somya, S.Kom., M.Cs.
OLTP & ETL Data integration.
Transcript presentasi:

Data Warehousing :: Overview Mata Kuliah :: Data Warehousing Komposisi oleh Budi Prayitno September 2012 Batam Data Warehousing :: Overview

Data Warehouse Data Warehouse, dalam konteks Teknologi Informasi, adalah basis data yang digunakan untuk pelaporan dan analisis data Bahan dasar data yang digunakan untuk Data Warehouse berasal dari sistem operasional/transaksional

E :: T :: L E T L merupakan kependekan dari Extract, Transform and Load Data Warehouse berbasis ETL memiliki tiga tahap/layer proses: Staging Layer Integration Layer Access Layer

Staging Layer Staging Layer menyimpan data mentah yang diekstraksi dari berbagai sistem database yang saling lepas

Integration Layer Integration Layer mengitegrasikan berbagai set data yang saling lepas dengan mentransformasikannya dari Staging Layer dan menyimpannya pada Operational Data Store (ODS) Data yang sudah terintegrasi kemudian disimpan ke Data Warehouse dalam struktur hirarki yang disebut Dimension dan Fact Gabungan antara Dimension dan Facts dikenal dengan Star Schema

Access Layer Access Layer adalah tahap dimana data dapat diambil oleh pengguna sesuai kebutuhan

Kelebihan Penggunaan arsitektur data warehouse memberikan kelebihan: Disimpannya salinan informasi dari sistem sumber akan mempertahankan history data Penggabungan beberapa sistem sumber data memberikan sudut pandang menyeluruh terhadap perusahaan Memperbaiki kualitas data dengan menandai dan memperbaiki data rusak Secara konsisten menampilkan informasi terkini perusahaan Merestrukturisasi data menjadi informasi yang berguna bagi pengguna Merestrukturisasi data untuk mempercepat performa query, terutama untuk query analisis yang kompleks Semua dilakukan tanpa mengganggu sistem operasional

Sejarah Konsep Data Warehouse bermula pada akhir era 1980-an ketika peneliti IBM Barry Devlin dan Paul Murphy mengembangkan Business Data Warehouse

Dimensional v.s. Normalized Terdapat dua pendekatan umum dalam penyimpanan data di Data Warehouse: Pendekatan Dimensional Pendekatan Normalized

Pendekatan Dimensional… Pendekatan Dimensional, yang praktisinya dikenal sebagai kaum Kimballites, menggunakan pendekatan Ralph Kimball yang menyebutkan bahwa model data warehouse harus menggunakan model dimensional/Star Schema

Pendekatan Dimensional… Pada pendekatan Dimensional, data transaksi dibedakan menjadi Fact yang pada umumnya merupakan data numerik dan Dimension yang merupakan informasi yang memberi konteks terhadap Fact Sebagai contoh: data penjualan/Sales dapat dibedakan menjadi Fact seperti jumlah produk yang dijual dan harga produk, kemudian menjadi Dimension seperti tanggal penjualan, nama konsumen, kode produk, alamat tujuan, alamat tagihan serta nama wiraniaga yang menangani penjualan

Pendekatan Dimensional… Kelebihan pendekatan Dimensional untuk implementasi Data Warehouse: Data lebih mudah dimengerti dan digunakan oleh pengguna Pendekatan Dimensional lebih mudah dimengerti karena dibagi menjadi Fact/nilai dan Dimension/konteks terkait proses bisnis pada sistem operasional/transaksional Pengambilan data dari data warehouse cenderung lebih cepat Database untuk data warehouse yang diimplementasikan dengan pendekatan dimensional menggunakan struktur OLAP yang memberikan kelebihan performa untuk data retrieval

Pendekatan Dimensional… Kekurangan pendekatan Dimensional untuk implementasi Data Warehouse: Untuk menjaga integritas Fact dan Dimension, mengisi data dari berbagai sistem operasional yang berbeda sangat kompleks Perubahan struktur data warehouse, yang biasa terjadi karena perubahan proses bisnis, menjadi sangat rumit

Pendekatan Normalized… Pendekatan Normalized atau biasa disebut model 3NF, yang praktisinya disebut kaum Inmonites, mengikuti pendekatan yang dibuat oleh Bill Inmon yang menyatakan bahwa Data Warehouse harus dimodelkan dengan model E–R/model Normalized

Pendekatan Normalized… Pada pendekatan Normalized, data disimpan dalam data warehouse mengikuti aturan normalisasi Tabel dikelompokkan ke dalam kategori tertentu, misal: konsumen, produk dan keuangan Struktur yang ternormalisasi membagi data menjadi entitas yang menghasilkan tabel yang membentuk basis data relasional Pada organisasi yang besar, pendekatan ini menghasilkan banyak sekali tabel yang saling terhubung melalui jaringan JOIN karena setiap entitas diimplementasikan menjadi tabel fisik

Pendekatan Normalized… Kelebihan pendekatan Normalized dalam implementasi Data Warehouse, antara lain: Penambahan dan perubahan data dapat dilakukan ke dalam basis data seperti sistem transaksional biasa

Pendekatan Normalized… Kekurangan pendekatan Normalized dalam implementasi Data Warehouse, antara lain: Jumlah tabel menjadi sangat banyak Sulit melakukan JOIN terhadap tabel yang berasal dari berbagai sumber untuk memperoleh informasi yang bermakna Akses informasi memerlukan pemahaman menyeluruh terhadap data warehouse

Dimensional v.s. Normalized Persamaan antara pendekatan Dimensional dan pendekatan Normalized adalah bahwa keduanya dapat direpresentasikan dalam Entity Relationship Diagram Perbedaan antara pendekatan Dimensional dan pendekatan Normalized adalah tingkat normalisasi yang digunakan Pendekatan Dimensional menghasilkan ukuran fisik basis data yang relatif lebih besar daripada pendekatan Normalized untuk jumlah data yang sama

Data Warehouse v.s. Sistem Operasional Sistem operasional dibuat untuk menjaga integritas data serta performa dalam melakukan pencatatan transaksi bisnis, dengan memanfaatkan proses normalisasi dan penggunaan model E–R Normalisasi pada sistem operasional dilakukan menggunakan aturan Codd, yang jika diimplementasikan secara lengkap hingga 5 level, akan menghasilkan lusinan bahkan ratusan tabel fisik Sistem operasional memiliki performa sangat baik untuk data modification karena perubahan data hanya terkait dengan sebagian kecil data pada setiap tabel tersebut Data pada sistem operasional mengalami siklus backup dan purge secara berkala

Pemutakhiran Data Berdasarkan konteks siklus dan tingkat pemutakhiran data, Data Warehouse dapat dibedakan menjadi: Offline Data Warehouse Online Data Warehouse