Data Mining Definisi Data Mining Kemampuan Data Mining : Data mining adalah serangkaian proses untuk menggali nilai tambah dari suatu kumpulan data berupa pengetahuan yang selama ini tidak diketahui secara manual Kemampuan Data Mining : - Mengotomatisasi prediksi tren dan sifat-sifat bisnis Mengotomatisasi penemuan pola-pola yang tidak diketahui sebelumnya Cara Kerja Data Mining Tentang bagaimana tepatnya data mining “menggali” hal-hal penting yang belum diketahui sebelumnya atau memprediksi apa yang akan terjadi ?
Teknik-teknik Data Mining Clustering Induksi (pohon keputusan dan aturan induksi) Jaringan syaraf buatan (Neural Network) OLAP (On-line Analytical Processing) Visualisasi Data Peralatan Data Mining Karakteristik yang terpenting dari peralatan data mining: Fasilitas persiapan data Skalabilitas produk dan kinerja Fasilitas untuk visualisasi hasil
Perbedaan Data Mining Dengan DataWarehouse : Kualitas dan konsistensi data merupakan persyaratan untuk data mining untuk menjamin keakuratan model-model prediksi. Data warehouse dipopulasikan dengan data yang bersih dan konsisten. Data mining akan sangat berguna jika mendapatkan data dari banyak sumber untuk mendapatkan sebanyak mungkin keterhubungan antar data. Data warehouse hanya berisikan data dari beberapa sumber. Pemilihan subset-subset record dan field untuk data mining membutuhkan kemampuan query dari data warehouse. Hasil pembelajaran data mining berguna jika ada cara untuk menyelidiki lebih jauh lagi mengenai pola-pola yang ditemukan. Data warehouse menyediakan kemampuan untuk melihat sumber data masa lalu.
Contoh Kasus Data Mining - Telekomunikasi - Keuangan - Asuransi - Olah Raga - Astronomi Kesimpulan Data mining merupakan salah satu bidang yang berkembang pesat karena besarnya kebutuhan akan nilai tambah dari database dengan skala yang besar yang makin banyak terakumulasi sejalan dengan pertumbuhan teknologi informasi. Selain itu data mining merupakan perangkat lunak yang digunakan untuk menemukan pola tersembunyi maupun hubungan yang terdapat dalam basis data yang besar dan menghasilkan aturan yang digunakan untuk memperkirakan perilaku di masa medatang.