Chapter 9 ALGORITME Cluster dan WEKA

Slides:



Advertisements
Presentasi serupa
SULIDAR FITRI, M.Sc March 18,2014
Advertisements

FUNGSI KUADRAT Titik potong dengan sumbu-Y jika x = 0
KNOWLEGDE DISCOVERY in DATABASE (KDD)
Self Organizing Map.
K-Means Clustering.
Pengelompokan Jenis Tanah Menggunakan Algoritma Clustering K-Means
Diadaptasi dari slide Jiawei Han
Data Mining: Proses Data Mining
Model Datamining Dr. Sri Kusumadewi, S.Si., MT. Materi Kuliah [10]:
STATISTIK UJI ‘T’ DAN UJI ‘Z’
STATISTIKA CHATPER 4b (Ukuran Nilai Letak)
Latin Square Design Diah Indriani
Oleh I Putu Agus Hendra Krisnawan
DATA MINING 1.
Chapter 11 k- Fold Cross Validation
Sistem Informasi Strategis
STATISTIKA CHATPER 8 (FORECASTING / PERAMALAN)
HEALTHCARE DATAMINING
PENULISAN ALGORITMA dengan PSEUDOCODE & FLOWCHART
BUDIYONO Program Pascasarjana UNS
Chapter 10 ALGORITME for ASSOCIATION RULES
Pendahuluan Clustering adalah salah satu teknik unsupervised learning dimana kita tidak perlu melatih metoda tersebut atau dengan kata lain, tidak ada.
Function(2).
Aplikasi Model Jaringan Syaraf Tiruan dengan Radial Basis Function untuk Mendeteksi Kelainan Otak (Stroke Infark) Yohanes Tanjung S.
Teknik Numeris (Numerical Technique)
Beberapa Rumus Untuk Kebisingan
Pengenalan Pola/ Pattern Recognition Introduction
UKURAN PEMUSATAN MK. STATISTIK (MAM 4137) 3 SKS (3-0)
MULTILAYER PERCEPTRON
Clustering. Definition Clustering is “the process of organizing objects into groups whose members are similar in some way”. A cluster is therefore a collection.
Data Mining: Klasifikasi dan Prediksi Naive Bayesian & Bayesian Network . April 13, 2017.
STRUKTUR DATA DIMENSIONAL ARRAY
DATA MINING (Machine Learning)
Data Mining Junta Zeniarja, M.Kom, M.CS
STATISTIKA CHATPER 4 (Perhitungan Dispersi (Sebaran))
Clustering Suprayogi.
ABDUL AZIS ABDILLAH ABDUL AZIS ABDILLAH
Datamining - Suprayogi
Sistem Berbasis Fuzzy Materi 5
Pembimbing: Henri Harianja G Imas S. Sitanggang, S.Si M.Kom
Martin Budi G Di Bawah Bimbingan Rindang Karyadin, S.T., M.Kom.
PEMBUATAN POHON KEPUTUSAN
Data Mining Junta Zeniarja, M.Kom, M.CS
Pengaruh incomplete data terhadap
Data Mining.
Clustering Best Practice
Aplikasi Kecerdasan Komputasional
K-Nearest Neighbor dan K-means
T(ea) for Two Again Tests Between the Means of Related Groups
Clustering (Season 1) K-Means
Artificial Intelligence (AI)
Classification Supervised learning.
Jawaban Tidak harus bernilai = 1. tergantung kesepakatan
Analisis Klastering K-Means Model Datamining Kelompok 1 Eko Suryana
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
Data Mining-1.
Self-Organizing Network Model (SOM) Pertemuan 10
Metode Data Mining “ Self-Organizing Map [SOM] ” Taskum Setiadi ADVANCE MACHINE LEARNING STMIK Nusa Mandiri Jakarta2016 ADVANCE MACHINE LEARNING.
DATA MINING with W E K A.
ANALISIS CLUSTER Part 1.
Latar Belakang Pengalaman Mengajar Sejak 1976 Perlu Buku !
Target Pneumonia = 86 % = 28 x 100 % = 5,8% 480 Ket : Target = 480 / tahun, 40 / bulan, ada selisih 452 kasus ( 80,2% )
Konsep Aplikasi Data Mining
Konsep Aplikasi Data Mining
KOMPUTASI PEMROGRAMAN
Pertemuan 1 & 2 Pengantar Data Mining 12/6/2018.
K-MEANS ALGORITHM CLUSTERING
Pengelompokan Dokumen (Document Clustering)
By : Rahmat Robi Waliyansyah, M.Kom
Universitas Gunadarma
Transcript presentasi:

Chapter 9 ALGORITME Cluster dan WEKA Clustering K-Means Case Definition Sulidar Fitri, M.Sc

REFERENCES Jiawei Han and Micheline Kamber. Data Mining: Concepts and Techniques. 2006. Department of Computer Science University of Illinois at Urbana-Champaign. www.cs.uiuc.edu/~hanj Ian H. Witten, Eibe Frank, Mark A. Hall. Data Mining Practical Machine Learning Tools and Techniques Third Edition.2011. Elsevier Kusrini dan Luthfi, E., 2009, Algoritma Data Mining, Penerbit Andi Kusrini, Pattern Recognition. WEKA

Clustering Introduction The previous data mining task of classification deals with partitioning data based on a pre-classified training sample Clustering is an automated process to group related records together. Related records are grouped together on the basis of having similar values for attributes The groups are usually disjoint

Via (Yohana, 2011)

(Larose, 2005)

Contoh Kasus: Proses pendeskritan kelas kontinyu Input Data awal, berupa data kontinyu atau data diskret Delta, yaitu nilai yang digunakan untuk menentukan selisih centroid dan mean yang diijinkan Output: tabel pemetaan yang berisi kelas diskret beserta nilai centroidnya

Langkah Proses: Tentukan jumlah cluster Alokasikan data ke dalam cluster secara random Hitung centroid/rata-rata dari data yang ada di masing-masing cluster Alokasikan masing-masing data ke centroid/rata-rata terdekat Kembali ke Step 3, apabila masih ada data yang berpindah cluster atau apabila perubahan nilai centroid, ada yang di atas nilai threshold yang ditentukan atau apabila perubahan nilai pada objective function yang digunakan di atas nilai threshold yang ditentukan

Penentuan centroid: acak atau ditentukan dengan rumus

Input: 79, 85, 83, 90, 82, 81, 85, 87, 89 dan 84 Jumlah kelas target: 3 delta : 0,01 Proses: Min: 79 Max : 90 Toleransi error: 0.01 * (90-79) : 0.11

Min: 79, max: 90 Centroid awal C2 dan C3?

0,92 > error (0.11) Rerata menjadi centroid baru

WEKA PRACTICE

Clustering Buka weka dan input data .arff Pilih tab Cluster Choose algoritma kMeans Pilih Cluster/kelompok yang diinginkan berapa Start Baca outputnya

GET STARTED

Any Queries ?