IMPLEMENTASI ALGORITMA k-NN

Slides:



Advertisements
Presentasi serupa
GRAFIK RIFKI NANDA JURUSAN MATEMATIKA FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM UNIVERSITAS SYIAH KUALA DARUSSALAM, BANDA ACEH Mei, 2013.
Advertisements

Analisis Outlier.
K Nearest Neighbour. Nearest Neighbour Rule Tersedia beberapa data (x,y) yang terklasifikasi menjadi 2 kelas k = 1 k = 3 Diberikan query point q, titik.
Diadaptasi dari slide Jiawei Han
Model Datamining Dr. Sri Kusumadewi, S.Si., MT. Materi Kuliah [10]:
PENERAPAN ALGORITMA MODIFIED K-NEAREST NEIGHBOR (MKNN) UNTUK MENGKLASIFIKASIKAN LETAK PROTEIN PADA BAKTERI E.COLI Kelompok : Rosangelina / Prasetia.
Model Sistem Pengenalan Pola
GRAF TIDAK BERARAH PART 2 Dosen : Ahmad Apandi, ST
Computer Vision Materi 8
Klasifikasi (Season 2) Nearest Neighbor
Sistem Berbasis Fuzzy Materi 4
Introduction to Datamining using WEKA
Marselina Silvia Suhartinah / 4IA05
Source: Sorting Algorithms source:
Fuzzy Clustering Logika Fuzzy Materi Kuliah Prodi Teknik Informatika
Data Mining: Klasifikasi dan Prediksi Naive Bayesian & Bayesian Network . April 13, 2017.
Pengenalan Supervised dan Unsupervised Learning
A rsitektur dan M odel D ata M ining. Arsitektur Data Mining.
Tim Dosen Data Mining Fakultas Informatika
DATA MINING (Machine Learning)
MODUL KULIAH 10 Ekstraksi Fitur Bentuk
ANALISIS OUTLIER 1 Data Mining.
Sistem Berbasis Fuzzy Materi 4
Data Mining Junta Zeniarja, M.Kom, M.CS
K-SUPPORT VECTOR NEAREST NEIGHBOR UNTUK KLASIFIKASI BERBASIS K-NN
Klasifikasi.
STUDI KASUS KLASIFIKASI Algoritma C 4.5
Peran Utama Data Mining
PEMBUATAN POHON KEPUTUSAN
GRAF TIDAK BERARAH PART 2 Dosen : Ahmad Apandi, ST
Pertemuan 3 Pengolahan Citra Digital
Pengaruh incomplete data terhadap
Clustering Best Practice
Data Mining: Klasifikasi Naive Bayesian & Bayesian Network
Computer Vision Materi 7
Algoritma kNN (k-Nearest Neighbor)
Naïve Bayes Classification.
K-Nearest Neighbor dan K-means
Clustering (Season 1) K-Means
Classification Supervised learning.
Naïve Bayes Classification.
Oleh : Rahmat Robi Waliyansyah, M.Kom.
.:: NAive bayes ::. DSS - Wiji Setiyaningsih, M.Kom.
Analisis Klastering K-Means Model Datamining Kelompok 1 Eko Suryana
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
Algoritma kNN (k-Nearest Neighbor)
Klasifikasi Nearest Neighbor
Data dan Eksplorasi Data
USING DATA MINING TO MODEL PLAYER EXPERIENCE
Metode Data Mining “ Self-Organizing Map [SOM] ” Taskum Setiadi ADVANCE MACHINE LEARNING STMIK Nusa Mandiri Jakarta2016 ADVANCE MACHINE LEARNING.
DATA MINING with W E K A.
KLASIFIKASI.
Anggota Dwita Eprila ( ) Mayang Hermeiliza Eka Putri ( ) Nadiah Amelia ( ) Rafif Abdusalam ( ) Shofyan.
Perancangan Sistem Klasifikasi Masa Studi Mahasiswa Menggunakan Data Mining Berbasis Algoritma ID3 (Studi Kasus:Jurusan Teknik Komputer –Unikom) Oleh:
Data Mining: Klasifikasi dan Prediksi Naive Bayesian & Bayesian Network . November 8, 2018.
Klasifikasi dengan RapidMiner
K-Nearest Neighbourhood (KNN)
Pengetahuan Data Mining
Pertemuan 1 & 2 Pengantar Data Mining 12/6/2018.
CLUSTERING.
KLASIFIKASI.
Implementasi clustering K-MEANS (dengan IRIS dataset)
Hasil Temu Kembali Citra
DECISION SUPPORT SYSTEM [MKB3493]
Universitas Gunadarma
Klasifikasi dengan Naive Bayes
Universitas Gunadarma
Intro Algoritma K-Nearest Neighbor (K- NN) adalah sebuah metode klasifikasi terhadap sekumpulan data maupun dokumen berdasarkan pembelajaran  data yang.
Universitas Gunadarma
Algoritma kNN (k-Nearest Neighbor)
Transcript presentasi:

IMPLEMENTASI ALGORITMA k-NN Chastine Fatichah

Classification Algorithms Proses Klasifikasi Classification Algorithms No. Sepal width Sepal length Petal width Petal length Label Class 1 5,1 3,5 1,4 0,2 Iris-setosa 2 6 2,9 4,5 1,5 Iris-versicolor 3 4,7 3,2 1,3 4 5,7 2,6 5 4,9 5,5 2,4 3,8 1,1 7 4,6 3,1 8 3,7 1,2 9 6,3 3,3 2,5 Iris-virginica 10 5,8 2,7 1,9 Training Process Training Set Model No. Sepal width Sepal length Petal width Petal length Label Class 1 4,8 3,2 1,3 0,3 ? 2 5,6 2,9 4,2 1,2 3 5,7 2,5 5 4 7,1 5,9 2,1 Testing Process Test Set

Algortima k-NN Setiap data poin x Hitung jarak antara x dengan semua data poin pada training set Urutkan berdasarkan jarak terkecil Ambil sejumlah k data poin dengan jarak terkecil ke x (k tetangga terdekat) Tentukan label kelas dari x berdasarkan mayoritas kelas pada k data poin

Penentuan nilai k pada k-Nearest Neighbors Lecture 8 Penentuan nilai k pada k-Nearest Neighbors Sumber: Introduction to Data Mining © Tan,Steinbach, Kumar 2004 Jika nilai k terlalu kecil maka sensitif terhadap data noise Jika nilai k terlalu besar maka ada kemungkinan data poin dari kelas yang lain menjadi tetangga terdekat

Minkowski Distance n : jumlah atribut sedangkan pk dan qk adalah atribut ke k dari data poin p dan q r = 1 City block (Manhattan) distance, r = 2 Euclidean distance Perbedaan skala yang besar pada atribut menyebabkan atribut bernilai besar menjadi lebih dominan, hal ini dapat ditangani dengan proses Normalisasi terlebih dahulu

Contoh kasus pada algoritma k-Nearest Neighbors Training Set Euclidean distance: No. X1 X2 Kelas 1 5 4 + 2 6 3 - No. Jarak data 6 ke- Kelas 1 1,00 + 2 3 1,41 - 4 2,24 5 Testing Set k =3 No. X1 X2 Kelas 6 5 2 ? No. Jarak data 6 ke- Kelas 1 1,00 + 2 3 1,41 -

Deskripsi Dataset Iris Deskripsi dataset bunga Iris Atribut : Sepal length, Sepal width, Petal length, dan Petal width Jumlah data : 150 Kelas : Iris-setosa (50), Iris-versicolor (50), Iris-virginica (50) Sumber gambar : https://rpubs.com/wjholst/322258

Contoh implementasi python algoritma k-NN Buka file dataset Iris Visualisasi 2D data iris

Contoh implementasi python algoritma k-NN Visualisasi 3D dataset Iris

Contoh implementasi python algoritma k-NN Pembagian training set dan test set

Contoh implementasi python algoritma k-NN Fungsi perhitungan jarak

Contoh implementasi python algoritma k-NN Fungsi mencari ketetanggaan sejumlah k Sumber: https://www.python-course.eu/k_nearest_neighbor_classifier.php

Contoh implementasi python algoritma k-NN Fungsi menentukan mayoritas kelas (majority vote) Sumber: https://www.python-course.eu/k_nearest_neighbor_classifier.php

Contoh implementasi python algoritma k-NN Fungsi prediksi kelas dari testing set Sumber: https://www.python-course.eu/k_nearest_neighbor_classifier.php