9 KUALITAS DATA
Mengelola Kualitas Data Data berkualitas tinggi: Akurat Konsisten Tersedia pada waktu yang tepat Fakta yang menunjukkan bahwa menjaga data yang berkualitas tinggi itu sulit: 2% record dalam data pelanggan kedaluarsa dalam satu bulan karena hal-hal seperti: Pelanggan meninggal Pelanggan berpindah lokasi Pelangan bercerai dsb
Problem Kualitas Data Sumber data eksternal Data yang berasal dari pihak luar mungkin tidak akurat, alah, atau tidak lengkap Penyimpanan data yang redundan Data tersebar dalam berbagai bentuk (spreadsheet, database, dokumen) dan ada kemungkinan tidak konsisten dan tidak kompatibel Kekurangan Komitmen Organisasi Pemakai internal tidak patuh terhadap aturan-aturan yang telah ditetapkan dan organisasi membiarkannya
Usaha untuk Menjaga Kualitas Data Membentuk komite yang menjamin bahwa kualitas data terjaga dengan baik Menerapkan prinsip TQM untuk selalu meningkatkan kualitas data Mengatasi hambatan-hambatan dalam organisasi
Data Dictionary dan Repository Data dictionary merupakan istilah lama dan repository adalah istilah yang lebih baru Data dictionary: Tempat penyimpanan informasi tentang database yang mendokumentasikan elemen-elemen data dalam database Repository: Istilah baru yang fungsinya lebih kompleks daripada data dictionary
Repository Repository atau dikenal dengan nama lengkap information repository tidak hanya mencakup metadata yang menjelaskan data dalam organisasi tetapi juga lingkungan pemrosesan informasi
IRDS IRDS (Information Repository Dictionary System) : S/W yang digunakan untuk mengelola dan mengontrol akses terhadap information repository IRDS menyediakan fasilitas untuk menyimpan dan memproses deskripsi data dan sumber pemrosesan data Sistem yang mengikuti IRDS dapat mentransfer definisi data yang dihasilkan oleh berbagai produk IRDS menjadi standar ISO (1990)
Mengatur Kinerja Database Ada 5 hal yang perlu diperhatikan agar kinerja database terjaga dengan baik: Pemasangan DBMS Pemakaian memori Penggunaan I/O Penggunaan CPU Tuning aplikasi
Pemasangan DBMS Instalasi DBMS harus benar-benar sesuai dengan lingkungan Biasanya tertera dalam file README Penggunaan nilai default untuk parameter tertentu seringkali membuat kinerja yang tidak optimal Sebelum melakukan instalasi DBMS, DBA harus memastikan ketersediaan ruang hard disk
Pemasangan DBMS (Lanjutan…) Baca manual DBMS untuk menerjemahkan parameter ukuran database secara logis (seperti panjang field, jumlah baris tabel, dan perkiraan pertumbuhan data) ke dalam kebutuhan ruang fisik Alokasi ruang disk untuk database perlu mendapat perhatian. Sistem backup pada sistem UNIX tertentu hanya mempunyai masalah pada file yang berukuran lebih dari 1 GB
Pemakaian Memori Supaya efisien, penggunaan memori oleh DBMS perlu juga diperhatikan Sebagai contoh, sistem Oracle menggunakan memori untuk menaruh data dictionary. Bila memori tidak cukup, sistem akan sering membaca struktur tabel dari disk. Hal ini mempengaruhi kinerja sistem
Penggunaan I/O Aplikasi database berpengaruh besar terhadap I/O Walapun kecepatan CPU tinggi, I/O tidak bersifat proporsional Suatu objek yang sering diakses secara bersamaan dapat dibagi ke dalam beberapa disk
Penggunaan CPU Hampir semua operasi database memerlukan aktivitas CPU Penggunaan CPU perlu dimonitor ketika melakukan tuning database Pemakaian lebih dari CPU merupakan alternatif untuk memperbaiki kinerja sistem Pemantauan perlu dilakukan pada saat beban puncak ataupun saat beban rendah
Tuning Aplikasi Selain penyetelan DBMS, aplikasi pun perlu diatur Memperhatikan dan memodifikasi SQL dalam aplikasi kadang perlu dilakukan Perubahan SQL dalam aplikasi acapkali dapat meningkatkan kinerja sistem Kadangkala penyelesaian dari masalah ini adalah dengan menggunakan denormalisasi
Tuning Aplikasi (lanjutan…) Kadangkala DBA perlu melakukan tindakaan seperti reindexing, mengubah ukuran blok data, mengalokasikan file-file pada peranti penyimpan. DBA juga mempunyai peran dalam mengarahkan pemrogram dengan memberikan teknik yang paling efektif dalam berinteraksi dengan database
Ketersediaan Data Ketersedian data merupakan tuntutan dengan prioritas yang paling tinggi Kegagalan dalam menyediakan ketersediaan data dapat menimbulkan keluhan/ketidaknyamanan bagi pemakai dan bahkan kerugian bisnis Pengoperasian e-business menuntut ketersedian data dalam 24 x 7 x 365 Tugas dari DBA adalah memastikan bahwa dampah dari downtime harus bisa diminimalkan
Penanganan untuk Menjaga Ketersediaan Data Mengantisipasi kegagalan H/W penggunaan clustered server Mengantisipasi data hilang atau rusak penggunaan disk mirroring Menjaga downtime pemilihan waktu yang tepat Beberapa DBMS menyediakan utilitas untuk melakukan pemeliharaan secara otomatis tanpa menghentikan sistem (nondisruptive utility) Mengantisipasi masalah yang terkait dengan jaringan Perlu strategi penanganan cepat manakala jaringan terganggu Penggunaan teknologi terbaru firewall dan router