INTRODUCTION OF DATA WAREHOUSE Presented by HANIM M.A. hanim03@gmail.com, hanim_maria@yahoo.com
Acknowledgments S. Sudarshan (Comp. Science and Engineering Dept, IIT, Bombay) Anindya Datta (Georgia Institute of Technology)
Overview Part 1 : Review data, informasi Part 2 : Pengenalan Data Warehouse Part 3 : Karakteristik Data Warehouse Part 4 : Task 1
Part 1: Review Data, Informasi
Data vs Information Data terdiri dari fakta dan angka yang relatif tidak mempunyai arti bagi pemakai Informasi adalah data yang telah diolah sehingga mempunyai arti yang lebih bagi pemakai
Part 2: Pengenalan Data Warehouse
Data is everywhere yet ... Saya tidak bisa menemukan data yang saya cari data tersebar dimana-mana (lintas jaringan) menggunakan versi yang berbeda Tidak bisa mendapatkan data yang diperlukan perlu orang yang expert untuk mendapatkan data tersebut Data sudah ditemukan, tapi tidak mengerti maksud data tersebut dokumentasi data yang kacau Data sudah ditemukan, tapi saya tidak bisa menggunakannya hasil data yang tidak terduga data perlu ditransformasi dari bentuk satu ke bentuk yang lain
What is a Data Warehouse? basis data yang menyimpan data sekarang dan data masa lalu yang berasal dari berbagai sistem operasional dan sumber yang lain (sumber eksternal) yang menjadi perhatian penting bagi manajemen dalam organisasi dan ditujukan untuk keperluan analisis dan pelaporan manajemen dalam rangka pengambilan keputusan
Why Data Warehousing? Konsumen mana yg memiliki margin tinggi/rendah? Siapa saja konsumen saya dan produk apa saja yang mereka beli? Jalur distribusi apa yang paling efektif? Promosi produk apa yang paling berpengaruh terhadap penghasilan perusahaan? Konsumen mana yang senang mengikuti berbagai kompetisi perusahaan? Apa dampak/pengaruh produk/layanan baru terhadap penghasilan perusahaan dan margin?
It’s all related with “Decision Support” Untuk mengatur dan mengontrol bisnis Datanya bersifat historical (past-now) Mengoptimalkan penyelidikan/analisa dari pada update Digunakan oleh manager dan end-users untuk memahami bisnisnya dan membuat keputusan/keputusan On-Line Analytical Processing (OLAP) merupakan elemen dari Decision Support System (DSS)
What are the users saying... Data yang tersebar di perusahaan harus diintegrasikan Summary data memiliki nilai yang nyata bagi perusahaan Data histori memegang peranan penting dalam memahami data Memerlukan kemampuan What-If
Data Warehousing -- It is a process to Teknik untuk mengumpulkan dan memanage data dari berbagai sumber dengan tujuan untuk menjawab permasalahan bisnis. Shg perusahaan mampu membuat keputusan yang sebelumnya tidak mungkin dilakukan. Database pengambilan keputusan ini didapatkan dari database operasional perusahaan dari berbagai lokasi yang terpisah-pisah.
Traditional RDBMS used for OLTP Sistem database yang digunakan untuk OLTP proses yang berhubungan dengan clerical data detail, datanya up to date read/update sedikit record Pemisahan, recovery, dan integritas data Disebut juga transaksi operasional
OLTP vs OLAP OLTP: roda penggerak organisasi OLAP: mengawasi gerak roda
OLAP, MDA Making Decisions Data Presentation Visualization Techniques End User Business Analyst Data DBA Making Decisions Data Presentation Visualization Techniques Data Mining Information Discovery Data Exploration OLAP, MDA Statistical Analysis, Querying and Reporting Data Warehouses / Data Marts Data Sources Paper, Files, Information Providers, Database Systems, OLTP Increasing potential to support business decisions
Characteristics of Data Warehouse Data warehouse merupakan kumpulan data yang subject-oriented, integrated, time-variant, dan nonvolatile yang menunjang manajemen dalam proses pengambilan keputusan.
Data Warehouse-Subject Oriented Fokusnya pada subjek utama dalam proses bisnis perusahaan, seperti customer, product, dan sales (penjualan). Fokus pada memodelkan dan menganalisa data yang akan digunakan oleh para pengambil keputusan, bukan pada operasi harian atau proses transaksional (transaction processing) Provide view yang simple dan ringkas atas persoalan dengan subjek tertentu dengan membuang data yang tidak berguna untuk proses pengambilan keputusan.
Data Warehouse-Integrated Didapatkan dengan mengintegrasikan multiple data, dari sumber data yang berbeda-beda (heterogeneous data source) relational databases, flat files, on-line transaction records Menggunakan teknik Data cleaning and data integration Memastikan konsistensi pada struktur encoding, pengukuran atribut, dll diantara data source yang berbeda. E.g., Hotel price: currency, tax, breakfast covered, etc. Ketika data dipindah ke data warehouse, data sudah berubah sesuai keinginan.
Data Warehouse-Time Variant Dari segi waktu, data warehouse memiliki waktu yang lebih lama dari pada operational system (transaksi operasional) Operational database: current value data (sekarang) Data warehouse data: historical data (5-10 tahun) Tiap struktur di data warehouse : Mengandung elemen waktu Sedangkan data operasional bisa mengandung elemen ‘time’ atau tidak.
Data Warehouse-Non Volatile Sekali masuk kedalam data warehouse, data- data, terutama data tipe transaksi, tidak akan pernah di update atau dihapus (delete)
Tugas Individu 1 Cari, baca dan pahami materi terkait DW dan OLAP Buat tulisan 1 halaman yg intinya menjawab pertanyaan berikut: DW: apa, kenapa ada, buat siapa, digunakan untuk apa, bagaimana bisa digunakan? DW: apa beda OLTP dan OLAP, jelaskan dengan bahasa sendiri Tugas diketik dalam word dan disimpan dengan format: tugas-individu-1.docx , kemudian disubmit melalui DropBox Elearning paling lambat Selasa 12/3/2013, jam 23.59.
Tugas Baca pertemuan berikutnya(2) Cari, baca materi terkait dengan : Arsitektur data warehouse Sumber data dari data warehouse Manajemen data warehouse Aplikasi pengguna data warehouse Pemodelan data multidimensi