PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN KLASIFIKASI PERTEMUAN - 6 NOVIANDI PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
KEMAMPUAN AKHIR YANG DIHARAPKAN Menjelaskan konsep klasifikasi dan contoh penerapan pada data Klasifikasi adalah sebuah proses untuk menemukan model yang menjelaskan atau membedakan konsep atau kelas data Tujuan untuk dapat memperkirakan kelas dari suatu objek yang kelasnya tidak diketahui (Tan et all, 2004)
KLASIFIKASI Proses untuk menyatakan suatu objek ke salah satu kategori yang sudah didefinisikan sebelumnya. Proses untuk memetakan setiap sekumpulan atribut ke salah satu kelas yang sudah didefiniskan sebelumnya.
KLASIFIKASI Proses untuk menyatakan suatu objek ke salah satu kategori yang sudah didefinisikan sebelumnya. Proses untuk memetakan setiap sekumpulan atribut ke salah satu kelas yang sudah didefiniskan sebelumnya.
KLASIFIKASI Klasifikasi terdiri dari sekumpulan record yang merupakan data latih (training set). Setiap record terdiri atas sekumpulan atribut. Salah satu atribut adalah kelas. Mencari model untuk atribut kelas merupakan fungsi dari nilai-nilai atribut lain. Model klasifikasi digunkaan untuk: - Pemodelan deskriptif untuk membedakan objek-objek dari kelas yang yang berbeda - Pemodelan prediktif digunakan untuk memprediksi kelas label untuk record yang tidak diketahui
KLASIFIKASI Tujuan dari klasifikasi adalah untuk: Menemukan model dari training set yang membedakan record kedalam kategori atau kelas yang sesuai, model tersebut kemudian digunakan untuk mengklasifikasikan record yang kelasnya belum diketahui sebelumnya pada test set. Mengambil keputusan dengan memprediksikan suatu kasus, berdasarkan hasil klasifikasi yang diperoleh .
KLASIFIKASI Tahapan dari klasifikasi dalam data mining terdiri dari Pembangunan model, dalam tahapan ini dibuat sebuah model untuk menyelesaikan masalah klasifikasi class atau attribut dalam data, model ini dibangun berdasarkan training set-sebuah contoh data dari permasalahan yang dihadapi, training set ini sudah mempunyai informasi yang lengkap baik attribut maupun classnya Penerapan model, pada tahapan ini model yang sudah dibangun sebelumnya digunakan untuk menentukan attribut / class dari sebuah data baru yang attribut / classnya belum diketahui sebelumnya Evaluasi, pada tahapan ini hasil dari penerapan model pada tahapan sebelumnya dievaluasi menggunakan parameter terukur untuk menentukan apakah model tersebut dapat diterima
CONTOH KLASIFIKASI Test Set Learn Classifier Training Set Model Data latih adalah data yang sudah ada sebelumnya berdasarkan fakta yang sudah terjadi (predefined class) Data uji adalah data yang sudah berkelas/berlabel yang digunakan untuk menghitung akurasi model klasifikasi yang dibentuk Training Set Learn Classifier Model
PENGAPLIKASIAN KLASIFIKASI PADA KEHIDUPAN SEHARI-HARI Memprediksi sel tumor sebagai sel yang jinak atau ganas Mengklasifikasi struktur sekunder protein sebagai alpha-helix, beta-sheet, or random coil Pengenalan tulisan tangan Mengkategorikan berita sebagai berita keuangan, cuaca, olahraga, dll.
KLASIFIKASI MENGGUNAKAN JARAK Menaruh item-item kedalam kelas yang mana mereka memiliki jarak “terdekat” Menentukan jarak antara sebuah item dengan kelas Algoritme klasifikasi yang menggunakan jarak adalah KNN
K-Nearest Neighbor (KNN) K-Nearest Neighbour atau KNN adalah salah dari algoritma instance based learning atau case-based reasoning. Case based reasoning adalah metodologi lainnya yang digunakan untuk mengindentifikasikan kluster dari even-even yang sama di database yang besar. KNN juga merupakan algoritme supervised learing dimana hasil dari instance yang baru diklasifikasikan berdasarkan mayoritas dari ketegori K-tetangga terdekat.
K-Nearest Neighbor (KNN) Tujuan dari algoritma ini adalah mengklasifikasikan objek baru berdasarkan atribut dan sample-sample dari data latih. Algoritme KNN menggunakan neighborhood classification sebagai nilai prediksi dari nilai instance yang baru..
ALGORITME KNN Tentukan parameter K. Hitung jarak antara data yang akan dievaluasi dengan semua pelatihan. Urutkan jarak yang terbentuk dari yang terkecil hingga terbesar. Tentukan jarak terdekat sampai urutan K. Pasangkan kelas yang bersesuaia. Cari jumlah kelas dari tetangga yang terdekat dan tetapkan kelas tersebut sebagai kelas data yang akan dievaluasi.
CONTOH SOAL KLASIFIKASI DATA Berikut ini merupakan data latih. Tentukan kelas pada data baru yang memiliki nilai X =3 dan Y=7. X Y Kelas 7 Buruk 4 3 Baik 1
LANGKAH-LANGKAH Tentukan parameter K= Jumlah tetangga terdekar. Misalkan K=3 Hitung jarak antara data baru dengan data latih. X Y Jarak dengan data baru (3,7) 7 (7-3)2 + (7-7) 2 = 16 4 (7-3)2 + (4-7) 2 = 25 3 (3-3)2 + (4-7) 2 = 9 1 (1-3)2 + (4-7) 2 = 13
LANGKAH-LANGKAH 3. Urutkan jarak tersebut dan tetapkan tetangga terdekat berdasarkan jarak minimum ke-K X Y Jarak dengan data baru (3,7) Peringkat jarak minimum 7 (7-3)2 + (7-7) 2 = 16 3 4 (7-3)2 + (4-7) 2 = 25 (3-3)2 + (4-7) 2 = 9 1 (1-3)2 + (4-7) 2 = 13 2
Jarak dengan data baru (3,7) Peringkat jarak minimum LANGKAH-LANGKAH 4. Periksa kelas dari tetangga terdekat. X Y Jarak dengan data baru (3,7) Peringkat jarak minimum Kelas 7 (7-3)2 + (7-7) 2 = 16 3 Buruk 4 (7-3)2 + (4-7) 2 = 25 - (3-3)2 + (4-7) 2 = 9 1 Baik (1-3)2 + (4-7) 2 = 13 2 Kesimpulan: Data baru tersebut termasuk dalam kelas BAIK
TEKNIK-TEKNIK KLASIFIKASI LAINNYA
TERIMA KASIH