Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

A rsitektur dan M odel D ata M ining. Arsitektur Data Mining.

Presentasi serupa


Presentasi berjudul: "A rsitektur dan M odel D ata M ining. Arsitektur Data Mining."— Transcript presentasi:

1 A rsitektur dan M odel D ata M ining

2 Arsitektur Data Mining

3 Keterangan : 1.Data cleaning (Pembersihan Data) : untuk membuang data yang tidak konsisten dan noise 2.Data integration : penggabungan data dari beberapa sumber 3.Data Mining Engine : Mentranformasikan data menjadi bentuk yang sesuai untuk di mining 4.Pattern evaluation : untuk menemukan pengetahuan yang bernilai melalui knowledge base 5.Graphical User Interface (GUI) : untuk end user

4 Model Data Mining Metode Prediksi  Dengan menggunakan beberapa variabel, untuk memprediksi nilai yang belum diketahui (unknown ) atau nilai selanjutnya (future) dari variabel lain  Classification  Regression  Deviation Detection / Deviation Analysis Contoh:

5 Model Data Mining Metode Deskripsi  Menemukan pola pendeskripsian data yang dapat diinterpretasikan oleh manusia  Clustering  Association Rule Discovery Contoh:

6 Classification Proses untuk menemukan model atau fungsi yang membedakan kelas data, dengan tujuan untuk dapat memprediksi kelas dari suatu objek yang labelnya tidak diketahui

7 Examples of Classification Task  Memprediksi sel tumor apakah jinak atau ganas  Klasifikasi transaksi kartu kredit apakah sah atau penipuan  Mengkategorikan artikel berita keuangan, cuaca, hiburan, olahraga, dll

8 Classification Techniques  Decision Tree based Methods  Neural Networks  Rule-based Methods  Memory based reasoning  Naïve Bayes and Bayesian Belief Networks  Support Vector Machines

9 Classification Techniques Example of a Decision Tree

10 Classification Techniques Example Type : SUV Minivan Car Door : 2, 4 Tires : Blackwall, Whitewall

11 Classification Techniques Example

12 Classification Techniques TypesDoorsTiresResult SUV2Whitewall+ MINIVAN4Whitewall- SUV2Blackwall- CAR4Blackwall- CAR4Blackwall- CAR2Blackwall+ CAR2Whitewall+ MINIVAN4Blackwall- SUV2Blackwall- MINIVAN4Whitewall- SUV4Blackwall- SUV4Whitewall+ CAR2Blackwall+ SUV2Blackwall-

13 Classification Techniques Example

14 Regression  Digunakan untuk memetakan data dengan prediksi atribut bernilai real Metode Regression mirip dengan metode Classification, bedanya adalah regression tidak bisa mencari pola yang dijabarkan sebagai class (kelas).

15 Examples of Regression Task Memprediksi jumlah penjualan produk baru pada advertising expenditure (belanja iklan). Memprediksi kecepatan memutar (wind velocities) pada fungsi temperatur, tekanan udara, dll Memperkirakan metode distribusi dan kapasitas distribusi

16 Regression Techniques Linear Regression Logistic Regression SQL Server Data Mining mendukung teknik : Regression Trees (bagian Microsoft Decission Trees) Neural Network Oracle Data Mining mendukung teknik : Generalized Linear Models (GLM) Support Vector Machines (SVM)

17 Deviation Detection / Deviation Analysis Digunakan untuk mencari kasus yang bertindak sangat berbeda dari normalnya Mengidentifikasi kasus yang tidak normal diantara jutaan transaksi

18 Examples of Deviation Analysis Task Pendeteksian penyalah gunaan Kartu kredit. Pendeteksian gangguan jaringan komputer Analisa kesalahan produksi, dll Deviation Analysis Techniques Decision trees Neural network

19 Clustering Disebut juga sebagai Segmentation Clustering mendistribusikan obyek ke dalam kelompok, sehingga : derajat tingkat keterhubungan antar anggota cluster yang sama adalah kuat dan derajat tingkat keterhubungan antar anggota cluster yang berbeda adalah lemah Clustering adalah suatu alat untuk analisa data, yang memecahkan permasalahan penggolongan

20 Clustering Contoh : Sebelum di Cluster

21 Clustering Contoh : Setelah di Cluster

22 Clustering Clustering bermakna menggolongkan data atau membagi satuan data yang besar ke dalam satuan data yang lebih kecil yang memiliki kesamaan

23 Clustering Gambar dibawah ini menunjukkan kelompok data pelanggan yang berisi dua atribut, yaitu Age (Umur) dan Income (Pendapatan).

24 Clustering Algoritma Clustering mengelompokkan kelompok data kedalam tiga segment berdasarkan kedua atribut ini. Cluster 1 berisi populasi berusia muda dengan pendapatan rendah Cluster 2 berisi populasi berusia menengah dengan pendapatan yang lebih tinggi Cluster 3 berisi populasi berusia tua dengan pendapatan yang relatif rendah.

25 Association Rule Discovery Teknik Association Rule Association Rule →Teknik data mining untuk menemukan aturan asosiatif antara suatu kombinasi item

26 Example Association Rule Task Contoh : Analisis pembelian barang di suatu pasar swalayan yaitu : dapat diketahuinya besar kemungkinan seorang pelanggan membeli suatu barang dengan barang lainnya

27 Association Rule Techniques Tahap analisis asosiasi untuk menghasilkan algoritma adalah pola frekuensi tinggi (frequent pattern mining) Analisis asosiasi sering juga disebut market basket analysis


Download ppt "A rsitektur dan M odel D ata M ining. Arsitektur Data Mining."

Presentasi serupa


Iklan oleh Google