Algoritma kNN (k-Nearest Neighbor)

Slides:

Advertisements

Presentasi serupa

Analisis Outlier.

Advertisements

K Nearest Neighbour. Nearest Neighbour Rule Tersedia beberapa data (x,y) yang terklasifikasi menjadi 2 kelas k = 1 k = 3 Diberikan query point q, titik.

Pengelompokan Jenis Tanah Menggunakan Algoritma Clustering K-Means

Model Datamining Dr. Sri Kusumadewi, S.Si., MT. Materi Kuliah [10]:

Self Organizing Maps Tim Asprak Metkuan

PENERAPAN ALGORITMA MODIFIED K-NEAREST NEIGHBOR (MKNN) UNTUK MENGKLASIFIKASIKAN LETAK PROTEIN PADA BAKTERI E.COLI Kelompok : Rosangelina / Prasetia.

Computer Vision Materi 8

Klasifikasi (Season 2) Nearest Neighbor

Sistem Berbasis Fuzzy Materi 4

Fachrul Reza ( ) Julpan ( ) M. Nur Cipta Hidayah Lubis ( ) Oleh:

SOSIOMETRIKA PERTEMUAN KE-4

BAB V (lanjutan) VEKTOR.

Fuzzy Clustering Logika Fuzzy Materi Kuliah Prodi Teknik Informatika

Clustering (Season 2) Self-Organizing Map

Data Mining: Klasifikasi dan Prediksi Naive Bayesian & Bayesian Network . April 13, 2017.

Fuzzy Clustering Materi Kuliah (Pertemuan 13 & 14) LOGIKA FUZZY

Pertemuan 3 JARINGAN PERCEPTRON

1 Pertemuan 8 Klasifikasi dan Rekognisi Pola (2) Matakuliah: T0283 – Computer Vision Tahun: 2005 Versi: Revisi 1.

DATA MINING (Machine Learning)

ANALISIS OUTLIER 1 Data Mining.

Sistem Berbasis Fuzzy Materi 4

PENGERTIAN STATISTIK DAN STATISTIKA

E. Haodudin Nurkifli Universitas Ahmad Dahlan Pertemuan :

SUPPORT VECTOR MACHINE

K-SUPPORT VECTOR NEAREST NEIGHBOR UNTUK KLASIFIKASI BERBASIS K-NN

Pengenalan Pola Materi 1

Pertemuan 3 Pengolahan Citra Digital

Pengaruh incomplete data terhadap

PENGUKURAN Pengukuran :pemberian “angka” terhadap fenomena dengan mengikuti aturan tertentu Proses pengukuran : investigasi mengenai ciri-ciri yang mendasari.

Laten Semantic Indexing

Kuliah Sistem Fuzzy Pertemuan 7 “Fuzzy Clustering”

Mereka lebih suka berfikir...

SOM – KOHONEN Unsupervised Learning

Algoritma kNN (k-Nearest Neighbor)

Naïve Bayes Classification.

K-Nearest Neighbor dan K-means

Pemrograman Berorientasi Objek

Komputer Grafis by Muhammad R Babo

Clustering (Season 1) K-Means

PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN

Classification Supervised learning.

Clustering (Season 2) Self-Organizing Map

Oleh : Rahmat Robi Waliyansyah, M.Kom.

Analisis Klastering K-Means Model Datamining Kelompok 1 Eko Suryana

PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN

Algoritma kNN (k-Nearest Neighbor)

Klasifikasi Nearest Neighbor

ASESMEN PEMAHAMAN KONSEP MATEMATIKA

ANALISIS CLUSTER Part 2.

Anggota Dwita Eprila ( ) Mayang Hermeiliza Eka Putri ( ) Nadiah Amelia ( ) Rafif Abdusalam ( ) Shofyan.

Pembelajaran terbimbing dengan pendekatan parametriks dan nonparametriks Kuliah 3.

Pembimbing : Aziz Kustiyo, S.Si., M.Kom. Endang Purnama Giri, S.Kom.

JARINGAN SYARAF TIRUAN BERBASIS KOMPETISI

Pemrograman Berorientasi Objek

K-Nearest Neighbourhood (KNN)

Pertemuan 1 & 2 Pengantar Data Mining 12/6/2018.

K-MEANS ALGORITHM CLUSTERING

REKOGNISI CITRA Konsep Dasar Rekognisi

IMPLEMENTASI ALGORITMA k-NN

Implementasi clustering K-MEANS (dengan IRIS dataset)

DECISION SUPPORT SYSTEM [MKB3493]

Universitas Gunadarma

Universitas Gunadarma

Intro Algoritma K-Nearest Neighbor (K- NN) adalah sebuah metode klasifikasi terhadap sekumpulan data maupun dokumen berdasarkan pembelajaran data yang.

Universitas Gunadarma

Transcript presentasi:

Algoritma kNN (k-Nearest Neighbor)

Deskripsi kNN KNN adalah sebuah metode klasifikasi terhadap sekumpulan data berdasarkan pembelajaran data yang sudah terklasifikasikan sebelumya. Termasuk dalam supervised learning, dimana hasil query instance yang baru diklasifikasikan berdasarkan mayoritas kedekatan jarak dari kategori yang ada dalam KNN.

Deskripsi kNN Diberikan titik query, akan ditemukan sejumlah k obyek atau (titik training) yang paling dekat dengan titik query. Klasifikasi menggunakan voting terbanyak diantara klasifikasi dari k obyek Algoritma k-nearest neighbor (KNN) menggunakan klasifikasi ketetanggaan sebagai nilai prediksi dari query instance yang baru.

Ukuran Jarak Dekat atau jauhnya tetangga biasanya dihitung berdasarkan Euclidean Distance. Dimana D(a,b) adalah jarak skalar dari dua buah vektor data a dan b yang berupa matrik berukuran d dimensi.

Kelebihan Kelebihan KNN: Simpel Efektif jika data besar Intuitif Peforma cukup baik Tahan terhadap data latih yang noisy

Kekurangan Kekurangan KNN : Waktu komputasi tinggi jika data latih besar. Disebabkan oleh semua data diukur jaraknya untuk setiap data uji. Sangat sensitive dengan ciri yang redundan atau tidak relevan. Ditanggulangi dengan seleksi ciri atau pembobotan ciri. Tidak diketahui perhitungan jarak apa yang paling sesuai untuk dataset tertentu.

Algoritma Menentukan parameter k (jumlah tetangga paling dekat). Menghitung kuadrat jarak eucliden objek terhadap data training yang diberikan. Mengurutkan hasil no 2 secara ascending Mengumpulkan kategori Y (Klasifikasi nearest neighbor berdasarkan nilai k) Dengan menggunakan kategori nearest neighbor yang paling mayoritas maka dapat dipredisikan kategori objek .

Contoh 1 Terdapat beberapa data yang berasal dari survey questioner tentang klasifikasi kualitas kertas tissue apakah baik atau jelek, dengan objek training menggunakan dua attribute yaitu daya tahan terhadap asam dan kekuatan. Dengan menggunakan K = 4.

Contoh 1 (k = 4) Akan diproduksi kembali kertas tisu dengan attribute X1=7 dan X2=4 tanpa harus mengeluarkan biaya untuk melakukan survey, maka dapat diklasifikasikan kertas tise tersebut termasuk yang baik atau jelek.

Ada 4 data yang paling dekat yaitu (8,4) , (6,5) , (5,6), dan (7,7) Ada 4 data yang paling dekat yaitu (8,4) , (6,5) , (5,6), dan (7,7). Kemudian hitung jumal kelas untuk ke empat data tersebut. Sehingga diperoleh baik = 3 dan jelek = 1. Dengan voting maka diperoleh bahwa tissue dengan daya tahan 7 dan Kekuatan 4 termasuk Kategori Baik.

Contoh 2 Tentukan class dari test data dengan nilai atribut (50,3,40)

Jika digunakan K = 4 maka voting akan seimbang Bagus = 2 dan Jelek = 2 Jika digunakan K = 4 maka voting akan seimbang Bagus = 2 dan Jelek = 2. Untuk menanggulangi hal tersebut maka nilai K dikurangi 1 untuk setiap ditemukan hasil voting yang seimbang. Dengan K = 3 maka voting kelas Bagus = 1 dan Jelek = 2. Maka class dari test data dengan nilai atribut (50,3,40) termasuk Kelas yang Jelek.

LATIHAN Kita diberikan data baru yang akan kita klasifikasikan, yaitu X = 3 dan Y = 5. Jadi termasuk klasifikasi apa data baru ini ? Bad atau Good ? (K=3)