Data Warehousing, Akuisisi Data, Data Mining, Analitik Bisnis Kecerdasan Bisnis Data Warehousing, Akuisisi Data, Data Mining, Analitik Bisnis Visualisasi
Data dan Sumber Data Tidak ada data Tidak ada Keputusan yang baik Data perlu digali, diekstrak, disaring, divalidasi, dianalisa Sumber data -> Proses -> Informasi
Definisi Data Informasi Item mengenai sesuatu, kejadian, aktivitas, transaksi yang direkam, diklasifikasikan, disimpan namun tidak diorganisasi untuk menyampaikan makna spesifik Informasi Data yang telah diorganisasi dalam cara tertentu agar bermakna bagi penerima
Definisi Pengetahuan Pengetahan terdiri dari item data dan atau informasi yang diorganisasi dan diproses untuk menyampaikan pemahaman, pengalaman, pembelajran akumulatif dan keahlian yang dapat diaplikasikan pada sebuah masalah atau aktifitas saat ini
Sumber Data Data internal Data personal Data Eksternal Data tentang orang, produk, jasa dan proses Data personal Data yang merupakan keahlian, catatan-catatan serta opini yang dimiliki oleh perseorangan Data Eksternal Data yang berasal dari luar berupa database komersial sampai data yang dikumpulkan dengan sensor dan satelit, data yang tersedia pada cd/dvd, pada internet, berupa text, audio dan video
Pengumpulan Data Survei Observasi Wawancara …………………………………
Kualitas Data Prinsip Gigo (garbage in garbage out) Berhubungan dengan akurasi data, tidak lengkap, ambigu Tahun 2001 burukunya kualitas data menyebabkan bisnis di AS menghabiskan biaya $611 miliar dalam satu tahun untuk mengatasi (the datawarehose institute)
Masalah Kualitas Data Data tidak benar (data tidak dihasilkan hati hati, data tidak dientry dengan benar) Solusinya ? Otomatisasi entry data Membangun program kemanan dan validasi data
Masalah Kualitas Data Data tidak tepat waktu Metode menghasilkan data tidak cukup cepat untuk memenuhi kebutuhan Solusinya ? Menggunakan web untuk mendapatkan data yang tepat Memodifikasi sistem
Masalah Kualitas Data Data yang diperlukan tidak ada Tidak seorangpun memliki data yang dibutuhkan Data yang diperlukan tidak pernah dicatat sama sekali Solusinya Memprediksi data yang akan dibutuhkan masa depan Mengestimasi data baru
Sumber Masalah Kualitas Data Entry data karyawan :76% Perubahan pada sumber data :53% Migrasi data dan proyek konversi: 48% Harapan pengguna : 46% Data eksternal : 34% Kesalahan Sistem : 35% Entri oleh pelanggan : 25% Lainnya : 12%
Kategori Kualitas Data Menurut Strong dkk (1997) kualitas data dibagi menjadi 4 dimensi yaitu : Kontekstual : relevansi, nilai tambah, batasan waktu, kelengkapan, jumlah data Intrinsik : Akurasi, obyektivitas, kemampuan untuk dipercaya, reputasi Aksesibilitas : Kemampuan untuk diakses Representasi : Kemampuan untuk diintrepretasi, kemudahan pemahaman, representasi tepat, repesentasi konsisten
BAGAIMANA SEBAIKNYA ?
Bagaimana Sebaiknya Mulai dari awal Kualitas data harus dimulai sejak awal, tidak setelah data menjadi rumit Kenali Data anda : Pahami data apa yang dipunyai, tentukan tingkat presisi yang tepat yang dibutuhkan oleh tiap item data Jadikan proses itu terus berulang : membudayakan kualitas data Mengukur hasilnya