Algoritma kNN (k-Nearest Neighbor)

Slides:



Advertisements
Presentasi serupa
Analisis Outlier.
Advertisements

K Nearest Neighbour. Nearest Neighbour Rule Tersedia beberapa data (x,y) yang terklasifikasi menjadi 2 kelas k = 1 k = 3 Diberikan query point q, titik.
Pengelompokan Jenis Tanah Menggunakan Algoritma Clustering K-Means
Model Datamining Dr. Sri Kusumadewi, S.Si., MT. Materi Kuliah [10]:
Self Organizing Maps Tim Asprak Metkuan
PENERAPAN ALGORITMA MODIFIED K-NEAREST NEIGHBOR (MKNN) UNTUK MENGKLASIFIKASIKAN LETAK PROTEIN PADA BAKTERI E.COLI Kelompok : Rosangelina / Prasetia.
Computer Vision Materi 8
Klasifikasi (Season 2) Nearest Neighbor
Sistem Berbasis Fuzzy Materi 4
DATA MINING 1.
Fachrul Reza ( ) Julpan ( ) M. Nur Cipta Hidayah Lubis ( ) Oleh:
SOSIOMETRIKA PERTEMUAN KE-4
BAB V (lanjutan) VEKTOR.
Fuzzy Clustering Logika Fuzzy Materi Kuliah Prodi Teknik Informatika
Clustering (Season 2) Self-Organizing Map
Data Mining: Klasifikasi dan Prediksi Naive Bayesian & Bayesian Network . April 13, 2017.
Fuzzy Clustering Materi Kuliah (Pertemuan 13 & 14) LOGIKA FUZZY
Pertemuan 3 JARINGAN PERCEPTRON
1 Pertemuan 8 Klasifikasi dan Rekognisi Pola (2) Matakuliah: T0283 – Computer Vision Tahun: 2005 Versi: Revisi 1.
DATA MINING (Machine Learning)
ANALISIS OUTLIER 1 Data Mining.
Sistem Berbasis Fuzzy Materi 4
PENGERTIAN STATISTIK DAN STATISTIKA
E. Haodudin Nurkifli Universitas Ahmad Dahlan Pertemuan :
SUPPORT VECTOR MACHINE
K-SUPPORT VECTOR NEAREST NEIGHBOR UNTUK KLASIFIKASI BERBASIS K-NN
Klasifikasi.
Pengenalan Pola Materi 1
Pertemuan 3 Pengolahan Citra Digital
Pengaruh incomplete data terhadap
PENGUKURAN Pengukuran :pemberian “angka” terhadap fenomena dengan mengikuti aturan tertentu Proses pengukuran : investigasi mengenai ciri-ciri yang mendasari.
Laten Semantic Indexing
Kuliah Sistem Fuzzy Pertemuan 7 “Fuzzy Clustering”
Mereka lebih suka berfikir...
SOM – KOHONEN Unsupervised Learning
Algoritma kNN (k-Nearest Neighbor)
Naïve Bayes Classification.
K-Nearest Neighbor dan K-means
Pemrograman Berorientasi Objek
Komputer Grafis by Muhammad R Babo
Clustering (Season 1) K-Means
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
Classification Supervised learning.
CLUSTERING.
Clustering (Season 2) Self-Organizing Map
Oleh : Rahmat Robi Waliyansyah, M.Kom.
Analisis Klastering K-Means Model Datamining Kelompok 1 Eko Suryana
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
Klasifikasi Nearest Neighbor
ASESMEN PEMAHAMAN KONSEP MATEMATIKA
ANALISIS CLUSTER Part 2.
KLASIFIKASI.
Anggota Dwita Eprila ( ) Mayang Hermeiliza Eka Putri ( ) Nadiah Amelia ( ) Rafif Abdusalam ( ) Shofyan.
Pembelajaran terbimbing dengan pendekatan parametriks dan nonparametriks Kuliah 3.
Pembimbing : Aziz Kustiyo, S.Si., M.Kom. Endang Purnama Giri, S.Kom.
JARINGAN SYARAF TIRUAN BERBASIS KOMPETISI
Pemrograman Berorientasi Objek
K-Nearest Neighbourhood (KNN)
Pertemuan 1 & 2 Pengantar Data Mining 12/6/2018.
KLASIFIKASI.
K-MEANS ALGORITHM CLUSTERING
REKOGNISI CITRA Konsep Dasar Rekognisi
IMPLEMENTASI ALGORITMA k-NN
Implementasi clustering K-MEANS (dengan IRIS dataset)
DECISION SUPPORT SYSTEM [MKB3493]
Universitas Gunadarma
Universitas Gunadarma
Intro Algoritma K-Nearest Neighbor (K- NN) adalah sebuah metode klasifikasi terhadap sekumpulan data maupun dokumen berdasarkan pembelajaran  data yang.
Universitas Gunadarma
Algoritma kNN (k-Nearest Neighbor)
Transcript presentasi:

Algoritma kNN (k-Nearest Neighbor)

Deskripsi kNN KNN adalah sebuah metode klasifikasi terhadap sekumpulan data berdasarkan pembelajaran  data yang sudah terklasifikasikan sebelumya. Termasuk dalam supervised learning, dimana hasil query instance yang baru diklasifikasikan berdasarkan mayoritas kedekatan jarak dari kategori yang ada dalam KNN.

Deskripsi kNN Diberikan titik query, akan ditemukan sejumlah k obyek atau (titik training) yang paling dekat dengan titik query. Klasifikasi menggunakan voting terbanyak diantara klasifikasi dari k obyek Algoritma k-nearest neighbor (KNN) menggunakan klasifikasi ketetanggaan sebagai nilai prediksi dari query instance yang baru.

Ukuran Jarak Dekat atau jauhnya tetangga biasanya dihitung berdasarkan Euclidean Distance. Dimana D(a,b) adalah jarak skalar dari dua buah vektor data a dan b yang berupa matrik berukuran d dimensi.

Kelebihan Kelebihan KNN: Simpel Efektif jika data besar Intuitif Peforma cukup baik Tahan terhadap data latih yang noisy

Kekurangan Kekurangan KNN : Waktu komputasi tinggi jika data latih besar. Disebabkan oleh semua data diukur jaraknya untuk setiap data uji. Sangat sensitive dengan ciri yang redundan atau tidak relevan. Ditanggulangi dengan seleksi ciri atau pembobotan ciri. Tidak diketahui perhitungan jarak apa yang paling sesuai untuk dataset tertentu.

Algoritma Menentukan parameter k (jumlah tetangga paling dekat). Menghitung kuadrat jarak eucliden objek terhadap data training yang diberikan. Mengurutkan hasil no 2 secara ascending Mengumpulkan kategori Y (Klasifikasi nearest neighbor berdasarkan nilai k) Dengan menggunakan kategori nearest neighbor yang paling mayoritas maka dapat dipredisikan kategori objek .

Contoh 1 Terdapat beberapa data yang berasal dari survey questioner tentang klasifikasi kualitas kertas tissue apakah baik atau jelek, dengan objek training menggunakan dua attribute yaitu daya tahan terhadap asam dan kekuatan. Dengan menggunakan K = 4.

Contoh 1 (k = 4) Akan diproduksi kembali kertas tisu dengan attribute X1=7 dan X2=4 tanpa harus mengeluarkan biaya untuk melakukan survey, maka dapat diklasifikasikan kertas tise tersebut termasuk yang baik atau jelek.

Ada 4 data yang paling dekat yaitu (8,4) , (6,5) , (5,6), dan (7,7) Ada 4 data yang paling dekat yaitu (8,4) , (6,5) , (5,6), dan (7,7). Kemudian hitung jumal kelas untuk ke empat data tersebut. Sehingga diperoleh baik = 3 dan jelek = 1. Dengan voting maka diperoleh bahwa tissue dengan daya tahan 7 dan Kekuatan 4 termasuk Kategori Baik.

Contoh 2 Tentukan class dari test data dengan nilai atribut (50,3,40)

Jika digunakan K = 4 maka voting akan seimbang Bagus = 2 dan Jelek = 2 Jika digunakan K = 4 maka voting akan seimbang Bagus = 2 dan Jelek = 2. Untuk menanggulangi hal tersebut maka nilai K dikurangi 1 untuk setiap ditemukan hasil voting yang seimbang. Dengan K = 3 maka voting kelas Bagus = 1 dan Jelek = 2. Maka class dari test data dengan nilai atribut (50,3,40) termasuk Kelas yang Jelek.