DATAWAREHOUSING & BUSINESS INTELLIGENT Pertemuan 11 -12 Matakuliah : Decision Support System Tahun : 2009 DATAWAREHOUSING & BUSINESS INTELLIGENT Pertemuan 11 -12
Sasaran Pembelajaran Mahasiswa menjelaskan sumberdaya data DSS dan pengelolaannya melalui datawrehouse dan intelijen bisnis, dengan : Menjelaskan isue-isue sumberdaya data dan manajemen data DSS. Menguasai konsep2 dan penggunaan DBMS. Memahami teknologi data warehousing dan data marts. Memahami interaksi antara Web dan teknologi database. Bina Nusantara University
- DSS Data Sources - Data Warehouse - Data aquisition - Data Mart Pokok Bahasan - DSS Data Sources - Data Warehouse - Data aquisition - Data Mart Bina Nusantara University
Horizontal dan vertical information sharing Improved communications Kasus : Information Sharing satu Principle Component dari National Strategy for Homeland Security Jejaring dari systems yang menyediakan integrasi dan distribusi Pengetahuan/knowledge Horizontal dan vertical information sharing Improved communications Mining data tersimpan dalam Web-enabled warehouse Bina Nusantara University
Data, Information, Knowledge Items adalah penjelasan paling elementer dari sesuatu, events, activities, dan transaksi2 Bisa internal ataupun external Informasi Organized data yang memiliki arti/meaning dan nilai/value Knowledge Processed data atau informasi yang menyampaikan pemahaman / understanding atau pembelajaran/learning yang dapat diaplikasikan pada suatu problem atau activitas Bina Nusantara University
Sumber data DSS Data Internal Data Eksternal Data Pengetahuan Personal Bersumber dari Legasi sistem Semua data perusahaan yang diolah oleh TPS yang ada Semua data mentah ataupun yang telah diproses untuk menghasilkan laporan Data Eksternal Data Pengetahuan Personal Bina Nusantara University
Sumber data External Web Commercial databases Intelligent agents Document management systems Content management systems Commercial databases Sell access to specialized databases Bina Nusantara University
Data dan Pengetahuan Personal Para pengguna atau user memiliki Pengetahuan, keahlian yang dapat disimpan untuk digunakan masa yang akan datang. Informasi subyektif, misalnya tentang : Penjualan Opini pasar Lingkungan persaingan Sosial dan budaya Bina Nusantara University
Pengumpulan Data Data dikumpulkan dengan cara manual maupun menggunakan alat sensor Metoda Pengumpulan data mentah Survei Observasi Wawancara Sumber ahli Sensor-scanner Dokumen resmi dll Bina Nusantara University
Masalah dan Kualitas Data Masalah Data Bina Nusantara University
Bina Nusantara University
Kualitas Data Kategori : Raw data dikumpulkan secara manual atau dengan instruments Kualitas menjadi kritis ? Kualitas menentukan kegunaan Kategori : Contextual data quality : relevansi, nilai tambah, batasan waktu, kelengkapan,jumlah data. Intrinsic data quality : akurasi, obyektivitas, kehandalan, reputasi Accessibility data quality : aksesabilitas, keamanan akses Representation data quality : interpretable, kemudahan dipahami, representasi tepat, konsisten Kadang diabaikan atau ditangani secara gampang Masalah terkuak ketika data disummarize Bina Nusantara University
Sumber Masalah Kualitas Sumber Masalah Kualitas Data % respons Entri data oleh karyawan 76 Perubahan pada sumber 53 Migrasi data atau proyek2 konversi 48 Berbagai Harapan para pengguna 46 Data Eksternal 34 Kesalahan sistem 26 Entri data oleh pelanggan 25 Lainnya 12 Sumber : Wayne Eckerson Bina Nusantara University
Masalah dan Kualitas Data Isue terkait Integritas Data, Keseragaman data yang ditangkap Versi, jaminan keaslian data Kelengkapan dan kebenaran data Kesesuaian data Drill down, pelacakan kembali ke sumber data Bina Nusantara University
Web dan Layanan Database Komersial Sumberdata Eksternal Mitra bisnis, Web/internet Bank data komersial Bina Nusantara University
Database Management Systems Software program Supplements operating system Manages data ; menambahkan, memperbaharui, menghapus, memanipulasi, menyimpan, dan mendapatkan kembali informasi Queries data dan generates reports Data security Kombinasi dengan bahasa pemodelan untuk konstruksi DSS Bina Nusantara University
Database Models Hierarchical Top down, like inverted tree Fields have only one “parent”, each “parent” can have multiple “children” Fast Network Relationships created through linked lists, using pointers “Children” can have multiple “parents” Greater flexibility, substantial overhead Relational Flat, two-dimensional tables with multiple access queries Examines relations between multiple tables Flexible, quick, and extendable with data independence Object oriented Data analyzed at conceptual level Inheritance, abstraction, encapsulation Bina Nusantara University
Database Models, continued Multimedia Based Multiple data formats JPEG, GIF, bitmap, PNG, sound, video, virtual reality Requires specific hardware for full feature availability Document Based Document storage dan management Intelligent Intelligent agents dan ANN Inference engines Bina Nusantara University
Bina Nusantara University
Karakteristik Data Warehouse Subject oriented Terintegrasi sehingga data dari sumber heterogen distandarisasi Time series; tidak ada current status Nonvolatile Read only Summarized Not normalized; boleh jadi redundan Data berasal baik dari sumber internal maupun external tersedia Metadata included Data tentang t data Business metadata Semantic metadata Bina Nusantara University
Architecture Dapat berupa satu tiers, atau lebih Determined by warehouse, s/w data acquisition (back end), dan s/w client (front end) One tier, semua dijalankan pada platform yang sama, ini jarang terjadi Two tier biasanya mengkombinasikan DSS engine (client) dengan warehouse More economical Three tier memisahkan bagian-bagian functional ( client - appl_server – database_server) Bina Nusantara University
Bina Nusantara University
Bina Nusantara University
Migrating Data Business rules Data extracted from all relevant sources Stored in metadata repository Applied to data warehouse centrally Data extracted from all relevant sources Loaded through data-transformation tools or programs Separate operation and decision support environments Correct problems in quality before data stored Cleanse and organize in consistent manner Bina Nusantara University
Data Warehouse Design Dimensional modeling Grain Retrieval based Implemented by star schema Central fact table Dimension tables Grain Highest level of detail Drill-down analysis Bina Nusantara University
Data Warehouse Development Data warehouse implementation techniques Top down Bottom up Hybrid Federated Projects may be data centric or application centric Implementation factors Organizational issues Project issues Technical issues Scalable Flexible Bina Nusantara University
Data Marts Subkumpulan /subset data warehouse umumnya dari sumber subject tunggal Data Mart Dibedakan : Dependent Created from warehouse Replicated Functional subset of warehouse Independent Scaled down, lebih murah, hemat waktu Dirancang untuk sebuah department atau SBU, informasi terbatas dan memungkinkan unit dapat membangaun DSS sendiri Organization dapat memiliki multiple data marts Sulit untuk diintegrasikan Bina Nusantara University