Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Pembimbing : Aziz Kustiyo, S.Si., M.Kom. Endang Purnama Giri, S.Kom.

Presentasi serupa


Presentasi berjudul: "Pembimbing : Aziz Kustiyo, S.Si., M.Kom. Endang Purnama Giri, S.Kom."— Transcript presentasi:

1 Pembimbing : Aziz Kustiyo, S.Si., M.Kom. Endang Purnama Giri, S.Kom.
SELEKSI FITUR PADA VOTING FEATURE INTERVALS 5 MENGGUNAKAN FAST CORRELATION BASED FILTER HIDA NUR FIRQIANI G Usahakan slidenya jangan terlalu banyak nge-click… Pembimbing : Aziz Kustiyo, S.Si., M.Kom. Endang Purnama Giri, S.Kom. 9 November 2018

2 Metodologi Penelitian Hasil dan Pembahasan Kesimpulan dan Saran
Pendahuluan Tinjauan Pustaka Metodologi Penelitian Hasil dan Pembahasan Kesimpulan dan Saran Daftar Pustaka 9 November 2018

3 PENDAHULUAN 9 November 2018

4 maka dilakukan seleksi fitur
LATAR BELAKANG Klasifikasi adalah menemukan model dari kelas tersebut sebagai fungsi dari fitur-fitur yang lain tidak semua fitur relevant terhadap hasil klasifikasi ditambah lagi jika data yang digunakan memiliki dimensi yang besar sehingga mempengaruhi akurasi Permasalahan Klasifikasi Penelitian yang dilakukan yaitu melakukan seleksi fitur pada algoritma VFI5 menggunakan FCBF maka dilakukan seleksi fitur 9 November 2018

5 TUJUAN Tujuan dari penelitian ini adalah untuk menerapkan seleksi fitur menggunakan Fast Correlation Based Filter pada klasifikasi data menggunakan Voting Feature Intervals 5. 9 November 2018

6 RUANG LINGKUP Ruang lingkup penelitian ini yaitu penerapan seleksi fitur menggunakan algoritma FCBF pada klasifikasi data menggunakan algoritma VFI5 dengan bobot setiap fitur pada semua data diasumsikan seragam yaitu 1 9 November 2018

7 MANFAAT Penelitian ini diharapkan dapat memberikan informasi, pengetahuan serta kontribusi terutama untuk memperbaiki kinerja algoritma klasifikasi menggunakan seleksi fitur sehingga menjadi lebih efektif dan efisien. 9 November 2018

8 TINJAUAN PUSTAKA 9 November 2018

9 SELEKSI FITUR Seleksi Fitur adalah salah satu tahapan praproses dalam klasifikasi yang berguna terutama dalam mengurangi dimensi data, menghilangkan data-data yang tidak relevant, meningkatkan learning accuracy serta memperbaiki hasil secara komprehensif (Yu 2003). Jain 1997 mendefinisikan masalah fitur selection sebagai berikut: diberikan sekumpulan fitur lalu pilih beberapa fitur yang mampu memberikan hasil yang terbaik pada klasifikasi. 9 November 2018

10 SELEKSI FITUR… Seleksi fitur digunakan memberikan karakterisik dari data sehingga mampu memberikan hasil maksimal pada saat klasifikasi. F1 F2 F3 F4 Kelas F1 F3 Kelas 9 November 2018

11 FAST CORELATION BASED FILTER SOLUTION (FCBF)
Algoritma FCBF adalah algoritma seleksi fitur yang dikembangkan oleh Lei Yu dan Huan Liu pada tahun 2003. Algoritma ini didasarkan pada pemikiran bahwa suatu fitur yang baik adalah fitur-fitur yang relevant terhadap kelas tapi tidak redundant terhadap fitur-fitur relevant yang lain. 9 November 2018

12 input : S(F1, F2,…, FN,C) // a training data set
 // a predefined threshold output : Sbest // an optimal subset begin for i = 1 to N do begin calculate SUi,c for Fi; if ( ) append Fi to S’list; end; order S’list in descending SUi,c value; Fp = getFirstElement(S’list); do begin Fq = getNextElement(S’list, Fp); if ( Fq < > NULL) F’q = Fq; remove Fq from S’list; Fq = getNextElement(S’list, F'q’); else Fq = getNextElement(S’list, Fq); end until (Fq = NULL); Fp = getNextElement(S’list, Fp); end until (Fp==NULL) Sbest=S’list; 9 November 2018

13 Input : Fitur F1 , F2, F3, F4, F5, F6, F7, Kelas Threshold  F1 F2 F3
S’list F5 F1 F7 F4 F3 1. Hitung nilai SUi,c masing-masing fitur 2. Cek SUi,c   S’best F5 F1 F7 F3 4. Ambil elemen pertama dan kedua pada S’list 3. fitur masuk ke dalam S’list dan diurut secara menurun 5. Cek SU p,q < SUq,c 9 November 2018

14 VOTING FEATURE INTERVAL 5 (VFI5)
Voting Feature Interval 5 adalah salah satu algoritma klasifikasi yang merepresentasikan deskripsi sebuah konsep oleh sekumpulan interval dari setiap fitur (Guvenir 1998). Klasifikasi menggunakan algoritma ini didasarkan pada vote dari nilai-nilai pada fitur yang lain. Algoritma ini disebut non incremental classification algorithm karena semua data training hanya diproses satu kali. 9 November 2018

15 Fitur : F1 , F2 Kelas : A , B Data 2,2,A 7,8,B 3,5,A 6,3,B 4,6,A 5,4,B
Diurutkan 2,2,A 3,5,A 4,6,A 5,4,B 6,3,B 7,8,B 8,6,B End Point A B F 4 8 F 6 8 End Point F1 2,4,5,8 F2 2,3,6,8 9 November 2018

16 2 4 5 8 3 6 F1 F2 2 4 5 8 F1 3 6 F2 9 November 2018

17 i13 i15 i17 i19 2 4 5 8 F1 i11 i23 i25 i27 i29 3 6 F2 i21 diurutkan
5,4,B 6,3,B 7,8,B 8,6,B i13 i15 i17 i19 2 4 5 8 F1 i11 A: 0 B: 0 A: 1 B: 1 B: 2 i23 i25 i27 i29 3 6 F2 i21 9 November 2018

18 2,2,A 3,5,A 4,6,A 5,4,B 6,3,B 7,8,B 8,6,B 3 4 i13 i15 i17 i19 2 4 5 8 F1 i11 A: 0 B: 0 A: 0.33 B: 0.25 B: 0.5 i23 i25 i27 i29 3 6 F2 i21 9 November 2018

19 i13 i15 i17 i19 2 4 5 8 F1 i11 A: 0 B: 0 A: 1 B: 1 i23 i25 i27 i29 2 3 6 8 F2 i21 A: 0 B: 0 A: 1 B: 1 A: 0.57 B: 0.43 9 November 2018

20 Instance tes t 5,6,? i13 i15 i17 i19 2 4 5 8 F1 i11 i23 i25 i27 i29 2
B: 0 A: 1 B: 1 i23 i25 i27 i29 2 3 6 8 F2 i21 A: 0 B: 0 A: 1 B: 1 A: 0.57 B: 0.43 9 November 2018

21 kelas A kelas B fitur vote => F1 : 0 1
Total Vote : Peluang : Instance tes t diklasifikasikan sebagai kelas B 9 November 2018

22 METODOLOGI PENELITIAN
9 November 2018

23 Pengumpulan Data Dengan Seleksi Fitur Tanpa Seleksi Fitur
Praproses Data Data Training Pelatihan VFI5 Klasifikasi Data Uji Akurasi 9 November 2018

24 PENGUMPULAN DATA Nama data Jumlah Fitur Jumlah Kelas Jumlah Instance Dermatology 34 6 366 Lung Cancer 54 3 32 Promoters 57 2 106 Splice 61 3190 Data yang digunakan pada penelitian ini diambil dari UCI repository of machine learning database ( 9 November 2018

25 PRAPROSES DATA Menghilangkan fitur-fitur yang memiliki nilai-nilai yang kosong Data yang tidak mengalami seleksi fitur langsung diklasifikasi menggunakan VFI5 Untuk data yang akan seleksi fitur menggunakan FCBF Penentuan nilai threshold Output : fitur-fitur yang akan digunakan pada tahapan klasifikasi selanjutnya 9 November 2018

26 KLASIFIKASI DENGAN VFI5
Data Uji dan Data Latih Data dibagi menjadi tiga subset; tiap-tiap subset memiliki jumlah instance dan perbandingan kelas yang sama Dilakukan tiga kali iterasi; untuk setiap iterasi satu subset digunakan untuk pengujian dan subset sisanya untuk pelatihan Iterasi 1 : S1 data uji; S2 dan S3 data latih Iterasi 2 : S2 data uji; S1 dan S3 data latih Iterasi 3 : S3 data uji; S1 dan S1 data latih 9 November 2018

27 KLASIFIKASI DENGAN VFI5…
Pelatihan Menentukkan nilai endpoint Membuat interval untuk masing-masing fitur Melakukan voting pada setiap interval Normalisasi 9 November 2018

28 KLASIFIKASI DENGAN VFI5…
Pengujian/ Klasifikasi dan Akurasi Data diperiksa letaknya pada interval; kemudian nilai pada interval yang bersesuaian akan dijumlahkan Kelas dengan nilai vote tertinggi menjadi kelas prediksi dari data pengujian tersebut. Akurasi 9 November 2018

29 HASIL DAN PEMBAHASAN 9 November 2018

30 PRAPROSES DATA Jumlah fitur yang akan digunakan setelah mengalami penghilangan fitur-fitur yang memiliki nilai kosong Nama Data  Fitur  Fitur yang dibuang  Fitur yang diguna kan Lung Cancer 56 2 54 Dermatology 34 1 33 Promoters 58 57 Splice 61 60 9 November 2018

31 PEMBAGIAN DATA Data dibagi sesuai dengan jumlah instance masing-masing data menjadi tiga subset Nama Data S1 S2 Total Lung Cancer 11 10 32 Dermatology 122 366 Promoters 36 35 106 Splice 1064 1063 3190 9 November 2018

32 KLASIFIKASI TANPA SELEKSI FITUR
Nama Data Iterasi 1 (%) Iterasi 2 (%) Iterasi 3 (%) Rataan Akurasi (%) Lung Cancer 45.45 63.63 60 56.36 Dermatology 92.62 95.08 98.36 95.35 Promoters 83.33 88.57 82.85 84.92 Splice 89.75 89.55 90.68 90 Rataan Total 81.66 9 November 2018

33 SELEKSI FITUR DENGAN FCBF
Nilai Threshold Lung Cancer Dermatology Promoters Splice 3 14 6 22 0.1 13 0.13 2 4 5 0.2 10 0.3 0.4 0.5 Kenaikan nilai threshold menyebabkan jumlah fitur yang digunakan akan semakin berkurang 9 November 2018

34 PERBANDINGAN ANTARA KLASIFIKASI DENGAN SELEKSI FITUR DAN TANPA SELEKSI FITUR
Rataan akurasi ( % ) Fullsets Nilai threshold 0 Nilai threshold 0.1 Nilai threshold 0.13 Nilai threshold 0.2 Nilai akurasi menggunakan seleksi fitur untuk beragam nilai threshold lebih baik daripada tanpa seleksi fitur 9 November 2018

35 9 November 2018

36 Presentasi Pengurangan Fitur
PERBANDINGAN ANTARA KLASIFIKASI DENGAN SELEKSI FITUR DAN TANPA SELEKSI FITUR… Akurasi menggunakan seleksi fitur untuk setiap data lebih baik daripada tanpa seleksi fitur Nama Data (%)  Fitur Asal Akurasi Fullsets  Fitur Terseleksi Akurasi dengan FCBF Presentasi Pengurangan Fitur Lung Cancer 54 56.36 3 68.18 94.44 Dermatology 33 95.35 14 94.81 57.58 Promoters 57 84.92 6 91.48 89.47 Splice 60 90.0 22 90.28 63.33 Rataan 81.66 86.18 76.20 9 November 2018

37 PERBANDINGAN ANTARA KLASIFIKASI DENGAN SELEKSI FITUR DAN TANPA SELEKSI FITUR…
9 November 2018

38 PERBANDINGAN ANTARA KLASIFIKASI DENGAN SELEKSI FITUR DAN TANPA SELEKSI FITUR…
9 November 2018

39 KESIMPULAN DAN SARAN 9 November 2018

40 KESIMPULAN Seleksi fitur digunakan untuk mengurangi dimensi data dan meningkatkan akurasi Penentuan nilai threshold yang berbeda menghasilkan nilai akurasi yang berbeda pula. Nilai akurasi tertinggi terdapat pada nilai threshold 0 Dari keempat data yang digunakan, tingkat akurasi yang diperoleh antara lain Lung Cancer 56.4% menjadi 61.2%, Dermatology 95.35% menjadi 94.81%, Promoters 84.92% manjadi 91.48% dan Splice 90% menjadi 90.28%. Rataan dari keempat nilai akurasi tersebut yaitu 81.66% menjadi 86.2%. Hal ini menunjukkan bahwa seleksi fitur mampu meningkatkan nilai akurasi 9 November 2018

41 SARAN Penelitian selanjutnya dapat mencoba menerapkan seleksi fitur pada algoritma klasifikasi yang lain. Algoritma seleksi fitur yang digunakan pun bisa bermacam-macam. Agar hasil akurasi dapat terlihat perbedaanya, maka sebaiknya data yang digunakan harus memiliki ukuran dimensi yang sangat besar, misalnya data DNA manusia,dll. 9 November 2018

42 DAFTAR PUSTAKA Guvenir, H.A., Demiroz, G., Ilter, N Learning Diagnosis of Erythemato-Squamous Diseases using Voting Feature Interval. Artificial Intelligence in Medicine, 13(3), Jain, A., Zongker, D Feature Selection: Evaluation, Application, and Small Sample Performance. IEEE Transaction on Pattern Analysis and Machine Intteligence, 19(2): Langley, P Selection of Relevant Features in Machine Learning. Proceedings of the AAAI Fall Symposium on Relevance. AAAI Press. Yu, L., Liu, H Feature Selection for High Dimensional Data: A Fast Correlation-Based Filter Solution. 9 November 2018

43 TERIMA KASIH 9 November 2018


Download ppt "Pembimbing : Aziz Kustiyo, S.Si., M.Kom. Endang Purnama Giri, S.Kom."

Presentasi serupa


Iklan oleh Google