A rsitektur dan M odel D ata M ining
Arsitektur Data Mining
Keterangan : 1.Data cleaning (Pembersihan Data) : untuk membuang data yang tidak konsisten dan noise 2.Data integration : penggabungan data dari beberapa sumber 3.Data Mining Engine : Mentranformasikan data menjadi bentuk yang sesuai untuk di mining 4.Pattern evaluation : untuk menemukan pengetahuan yang bernilai melalui knowledge base 5.Graphical User Interface (GUI) : untuk end user
Model Data Mining Metode Prediksi Dengan menggunakan beberapa variabel, untuk memprediksi nilai yang belum diketahui (unknown ) atau nilai selanjutnya (future) dari variabel lain Classification Regression Deviation Detection / Deviation Analysis Contoh:
Model Data Mining Metode Deskripsi Menemukan pola pendeskripsian data yang dapat diinterpretasikan oleh manusia Clustering Association Rule Discovery Contoh:
Classification Proses untuk menemukan model atau fungsi yang membedakan kelas data, dengan tujuan untuk dapat memprediksi kelas dari suatu objek yang labelnya tidak diketahui
Examples of Classification Task Memprediksi sel tumor apakah jinak atau ganas Klasifikasi transaksi kartu kredit apakah sah atau penipuan Mengkategorikan artikel berita keuangan, cuaca, hiburan, olahraga, dll
Classification Techniques Decision Tree based Methods Neural Networks Rule-based Methods Memory based reasoning Naïve Bayes and Bayesian Belief Networks Support Vector Machines
Classification Techniques Example of a Decision Tree
Classification Techniques Example Type : SUV Minivan Car Door : 2, 4 Tires : Blackwall, Whitewall
Classification Techniques Example
Classification Techniques TypesDoorsTiresResult SUV2Whitewall+ MINIVAN4Whitewall- SUV2Blackwall- CAR4Blackwall- CAR4Blackwall- CAR2Blackwall+ CAR2Whitewall+ MINIVAN4Blackwall- SUV2Blackwall- MINIVAN4Whitewall- SUV4Blackwall- SUV4Whitewall+ CAR2Blackwall+ SUV2Blackwall-
Classification Techniques Example
Regression Digunakan untuk memetakan data dengan prediksi atribut bernilai real Metode Regression mirip dengan metode Classification, bedanya adalah regression tidak bisa mencari pola yang dijabarkan sebagai class (kelas).
Examples of Regression Task Memprediksi jumlah penjualan produk baru pada advertising expenditure (belanja iklan). Memprediksi kecepatan memutar (wind velocities) pada fungsi temperatur, tekanan udara, dll Memperkirakan metode distribusi dan kapasitas distribusi
Regression Techniques Linear Regression Logistic Regression SQL Server Data Mining mendukung teknik : Regression Trees (bagian Microsoft Decission Trees) Neural Network Oracle Data Mining mendukung teknik : Generalized Linear Models (GLM) Support Vector Machines (SVM)
Deviation Detection / Deviation Analysis Digunakan untuk mencari kasus yang bertindak sangat berbeda dari normalnya Mengidentifikasi kasus yang tidak normal diantara jutaan transaksi
Examples of Deviation Analysis Task Pendeteksian penyalah gunaan Kartu kredit. Pendeteksian gangguan jaringan komputer Analisa kesalahan produksi, dll Deviation Analysis Techniques Decision trees Neural network
Clustering Disebut juga sebagai Segmentation Clustering mendistribusikan obyek ke dalam kelompok, sehingga : derajat tingkat keterhubungan antar anggota cluster yang sama adalah kuat dan derajat tingkat keterhubungan antar anggota cluster yang berbeda adalah lemah Clustering adalah suatu alat untuk analisa data, yang memecahkan permasalahan penggolongan
Clustering Contoh : Sebelum di Cluster
Clustering Contoh : Setelah di Cluster
Clustering Clustering bermakna menggolongkan data atau membagi satuan data yang besar ke dalam satuan data yang lebih kecil yang memiliki kesamaan
Clustering Gambar dibawah ini menunjukkan kelompok data pelanggan yang berisi dua atribut, yaitu Age (Umur) dan Income (Pendapatan).
Clustering Algoritma Clustering mengelompokkan kelompok data kedalam tiga segment berdasarkan kedua atribut ini. Cluster 1 berisi populasi berusia muda dengan pendapatan rendah Cluster 2 berisi populasi berusia menengah dengan pendapatan yang lebih tinggi Cluster 3 berisi populasi berusia tua dengan pendapatan yang relatif rendah.
Association Rule Discovery Teknik Association Rule Association Rule →Teknik data mining untuk menemukan aturan asosiatif antara suatu kombinasi item
Example Association Rule Task Contoh : Analisis pembelian barang di suatu pasar swalayan yaitu : dapat diketahuinya besar kemungkinan seorang pelanggan membeli suatu barang dengan barang lainnya
Association Rule Techniques Tahap analisis asosiasi untuk menghasilkan algoritma adalah pola frekuensi tinggi (frequent pattern mining) Analisis asosiasi sering juga disebut market basket analysis