Gudang Data, dan Permasalahannya Kel. 3
Pengertian Data Warehouse Ada banyak pengertian data warehouse namun memiliki inti yang sama, yaitu database yang saling bereaksi yang dapat digunakan untuk query dan analisisis, bersifat orientasi subjek, terintegrasi, time-variant, tidak berubah yang digunakan untuk membantu para pengambil keputusan.
Sejarah Data Warehouse Sejak awal 1990-an, data gudang yang berada di garis depan aplikasi teknologi informasi sebagai cara bagi organisasi untuk secara efektif menggunakan informasi digital untuk perencanaan bisnis dan pengambilan keputusan. Oleh karena itu, pemahaman tentang sistem arsitektur data warehouse adalah atau akan menjadi penting dalam peran dan tanggung jawab dalam pengelolaan informasi.
1960 – General Mills dan Dartmouth College , dalam proyek penelitian bersama, mengembangkan dimensi syarat dan fakta. 1970 – ACNielsen dan IRI menyediakan data mart dimensi untuk penjualan eceran. 1983 – Teradata memperkenalkan sistem manajemen database yang khusus dirancang untuk mendukung keputusan.
1988 – Barry Devlin dan Paul Murphy mempublikasikan artikel arsitektur An untuk dan sistem informasi bisnis di IBM Systems Journal mana mereka memperkenalkan istilah “data bisnis” gudang. 1990 – Memperkenalkan Sistem Bata Merah Red Brick Warehouse, sebuah sistem manajemen database khusus untuk data warehouse. 1991 – Memperkenalkan Prism Prism Solusi Gudang Manager, perangkat lunak untuk mengembangkan gudang data.
1995 – Data Warehousing Institute, sebuah organisasi nirlaba yang mempromosikan data warehouse, didirikan. 1996 – Ralph Kimball menerbitkan buku The Data warehouse Toolkit. 2000 – Daniel Linstedt melepaskan Vault Data, memungkinkan real time diaudit Data warehouse.
Karakteristik Data Warehouse Subject Oriented Integrated Time variant Non volatile
Komponen Utama Data Warehouse Data staging area Data presentation area Data access tools
Jenis Data Warehouse Functional Data Warehouse (Data Warehouse Fungsional)
Centralized Data Warehouse (Data Warehouse Terpusat)
Distributed Data Warehouse (Data Warehouse terdistribusi)
Perancangan Data Warehouse Menentukan misi dan sasaran bisnis bagi pembentukan data warehouse. Mengidentifikasi data dari basis data operasional dan sumber lain yang diperlukan bagi data warehouse. Menentukan item-item data dalam perusahaan dengan melakukan standarisasi penamaan data dan artinya Merancang basis data untuk data warehouse Membangun kebijakan dalam mengarsipkan data lama sehingga ruang penyimpanan tak menjadi terlalu besar dan agar pengambilan keputusan tidak menjadi terlalu lamban. Menarik data produksi (operasional) dan meletakkan ke basis data milik data warehouse
Kelebihan dan Kekurangan Data Warehouse Kelebihan Data Warehouse Menurut Ramelho Data diorganisir dengan baik untuk query analisis dan sebagai bahan untuk pemrosesan transaksi. Perbedaan diantara struktur data yang heterogen pada beberapa sumber yang terpisah dapat diatasi. Aturan untuk transformasi data diterapkan untuk memvalidasi dan mengkonsolidasi data apabila data dipindahkan dari database OLTP ke data warehouse. Masalah keamanan dan kinerja bisa dipecahkan tanpa perlu mengubah sistem produksi.
Kelebihan Menurut Sean Nolan Tom Huguelet Kemampuan untuk mengakses data yang besar Kemampuan untuk memiliki data yang konsistent Kemampuan kinerja analisa yang cepat Mengetahui adanya hasil yang berulang-ulang Menemukan adanya celah pada business knowledge atau business process. Mengurangi biaya administrasi Memberi wewenang pada semua anggota dari perusaahan dengan menyediakan kepada mereka informasi yang dibutuhkan agar kinerja bisa lebih efektif.
Kekurangan Data Warehouse Datawarehouse bukan merupakan lingkungan yang cocok untuk data yang tidak terstruktur. Data perlu di ekstrak, diubah (ETL) dan di load ke datawarehouse sehingga membutuhkan tenggang waktu untuk memindahkannya. Semakin lama dipelihara, semakin besar biaya untuk merawat sebuah datawarehouse. Datawarehouse dapat menjadi ketinggalan dari data terbaru yang relatif cepat, karena data yang digunakan di datawarehouse tidak di update secara cepat sehingga data yang ada tidak optimal.
Kekurangan/ Masalah Data Warehouse Datawarehouse bukan merupakan lingkungan yang cocok untuk data yang tidak terstruktur. Data perlu di ekstrak, diubah (ETL) dan di load ke datawarehouse sehingga membutuhkan tenggang waktu untuk memindahkannya. Semakin lama dipelihara, semakin besar biaya untuk merawat sebuah datawarehouse. Datawarehouse dapat menjadi ketinggalan dari data terbaru yang relatif cepat, karena data yang digunakan di datawarehouse tidak di update secara cepat sehingga data yang ada tidak optimal.
Masalah Data Warehouse Lainnya Underestimation of resources of data loading. Hidden problems with source systems. Required data not captured. Increased end-user demands. Data homogenization. High demand for resources Data ownership High maintenance Long-duration projects Complexity of integration
Hubungan Data warehouse Dengan DSS DSS memiliki banyak arti dengan maksud yang kurang lebih hampir sama, yaitu suatu sistem komputer yang berguna bagi para pengambil keputusan untuk memecahkan masalah mereka yang kurang lebih berhadapan dengan masalah non-struktur atau semi-struktur.
Setelah kita lihat dan selami tentang data warehouse, kita dapat menyimpulkan bahwa data warehouse adalah sebuah model database yang berguna untuk menyimpan dan memproses data dengan pendekatan kepada kegunaan data dalam pengambilan keputusan bagi EIS atau DSS. Sebuah DSS(tergantung dengan yang disupport-nya) membutuhkan data warehouse agar dapat menjalankan kerjanya dengan baik. Dan memang data warehouse sendiri dibangun untuk memenuhi kebutuhan DSS.
Siklus Data Warehouse
Pertanyaan Apa yang menjadi tujuan pembuatan data warehouse lebih dari sekali (Ratna) Kelemahan dan upaya pemecahan masalah (Titin) Apakah ada admin khusus yang digunakan untuk data warehouse (Dimas)
Perbaikan apa saja yang diperlukan dalam data warehouse (Teguh) Apakah sumber data warehouse berasal dari dalam atau luar perusahaan (Titin)