FEATURE SELECTION.

Slides:



Advertisements
Presentasi serupa
DAMPAK TEKNOLOGI INFORMASI PADA PROSES AUDIT
Advertisements

MATERI 9 PERILAKU ORGANISASI
KNOWLEDGE TRANSFER IN THE e - WORLD
DATA MINING 1.
LANDASAN DAN PRINSIP PENGEMBANGAN KURIKULUM
Manajemen Pengetahuan (Knowledge Management)
Pengenalan Datawarehouse
11. Saran Masukan untuk Kajian Pengaruh Media Massa) Halaman Bentuk keterbukaan, ketidakpedulian, atau oposisi, kecanggihan atau kenaifan dan skema.
Data Mining.
METODOLOGI PENELITIAN BISNIS
Data Warehouse dan Data Mining
Disusun oleh Puput Candra Utami Teknik Industri
Pengenalan Datawarehouse
KEEFEKTIFAN INQUIRY BASED LEARNING
Lecture Note: Mulyati, SE, M.T.I
PROSES PERANGKAT LUNAK DAN METRIK PROYEK
Pertemuan 8, 9, 10 TAHAP TESTING SISTEM.
Tahapan dan Pengelompokan Data Mining
Tim Dosen Data Mining Fakultas Informatika
DASAR – DASAR SISTEM INFORMASI
DATA MINING (Machine Learning)
Penganggaran Modal dan Analisis Biaya
Data Warehouse dan Data Mining
PENELITIAN EPIDEMIOLOGI
Materi – 04 Prosedur Kantor.
Keputusan Penetapan Harga dan Manajemen Biaya
PENERAPAN METODE TAGUCHI UNTUK PROSES OPTIMISASI TERHADAP DAYA TAHAN SPOT WELDING OLEH : NOVI RAMADHANNY
STUDI KASUS KLASIFIKASI Algoritma C 4.5
ALTERNATIVE EVALUATION AND SELECTION
Pengantar Statistik dan Probabilitas
STRATEGI PEMBELAJARAN DISCOVERY
Model problem based learning
EFEKTIFITAS SELEKSI FITUR DALAM SISTEM TEMU-KEMBALI INFORMASI
ENTERPRISE RESOURCE PLANNING
UNIVERSITAS MERCU BUANA JAKARTA 2012
Stoplist dan Stemming Anggota Kelompok :
STEGANOGRAFI.
STRATEGI MENGAJAR HANSISWANY KAMARGA.
Dasar – Dasar Perencanaan
STEGANOGRAFI Kriptografi, Week 12.
LANDASAN DAN PRINSIP PENGEMBANGAN KURIKULUM
Statistika dan Probabilitas
BAB 5 PROSES PERENCANAAN DI SUSUN OLEH: HILMAN PRAKARSA S
Manajemen Sistem Informasi
CLUSTERING.
TEXT OPERATION Muhammad Yusuf Teknik Multimedia dan Jaringan
LANDASAN DAN PRINSIP PENGEMBANGAN KURIKULUM
Analisis Klastering K-Means Model Datamining Kelompok 1 Eko Suryana
Pengantar Statistik Juweti Charisma.
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
Model problem based learning
ANALISIS CLUSTER Part 1.
Representasi Data Wilayah
FIKES – MANAJEMEN INFORMASI KESEHATAN
KLASIFIKASI.
Pembelajaran terbimbing dengan pendekatan parametriks dan nonparametriks Kuliah 3.
Perancangan Sistem Klasifikasi Masa Studi Mahasiswa Menggunakan Data Mining Berbasis Algoritma ID3 (Studi Kasus:Jurusan Teknik Komputer –Unikom) Oleh:
Pengumpulan DATA.
DATA PREPARATION Kompetensi
Pembimbing : Aziz Kustiyo, S.Si., M.Kom. Endang Purnama Giri, S.Kom.
Oleh: Selvia Lorena Br Ginting
DASAR – DASAR SISTEM INFORMASI
DATA PREPARATION.
REKOGNISI CITRA Konsep Dasar Rekognisi
Universitas Gunadarma
Intro Algoritma K-Nearest Neighbor (K- NN) adalah sebuah metode klasifikasi terhadap sekumpulan data maupun dokumen berdasarkan pembelajaran  data yang.
Fathiah, S.T.,M.Eng Universitas Ubudiyah Indonesia
BIAYA KUALITAS DAN PRODUKTIVITAS
PIHAK-PIHAK YANG BERPERAN DALAM KASUS.
EVALUASI PEMBELAJARAN
Transcript presentasi:

FEATURE SELECTION

Variabel Subset Selection Feature Selection = Proses pemilihan subset dari fitur yang relevan (variabel, prediktor) untuk digunakan dalam konstruksi model. Variabel Selection = Teknik pemilihan fitur digunakan untuk empat alasan: Variabel Subset Selection Penyederhanaan model agar lebih mudah ditafsirkan oleh peneliti / pengguna Waktu pelatihan yang lebih pendek Untuk menghindari kutukan dimensi Generalisasi yang disempurnakan dengan mengurangi overfitting (secara formal, pengurangan varians) = Attribute Selection

Feature Selection Fitur dianggap relevan bila nilainya bervariasi secara sistematis dengan keanggotaan kategori. Algoritma seleksi fitur mempunyai peran kritis dalam banyak aplikasi machine learning, CRM, data mining secara umum dan analisis genomic. Subsetyang didapat dari seleksi fitur adalah urutan peringkat dari semua fitur yang dipilih dari masing-masing algoritma. (Algoritma C4.5)

Feature Selection Premis utama saat menggunakan teknik pemilihan fitur adalah: Data berisi banyak fitur yang bersifat berlebihan atau tidak relevan, dan karenanya dapat dihapus tanpa menimbulkan banyak kehilangan informasi. Fitur selection mengembalikan subset dari fitur. Teknik pemilihan fitur sering digunakan di domain di mana terdapat banyak fitur dan sedikit sampel (atau titik data) Kasus pola dasar untuk penerapan seleksi fitur mencakup analisis teks tertulis dan data microarray DNA, dimana terdapat ribuan fitur, dan beberapa puluh sampai ratusan sampel.

Feature Selection Algoritma pemilihan fitur dapat dilihat sebagai kombinasi teknik pencarian untuk mengusulkan subset fitur baru Bersama dengan ukuran evaluasi yang memberi nilai pada subset fitur yang berbeda. Algoritma yang paling sederhana adalah menguji setiap kemungkinan subset fitur yang menemukan yang meminimalkan tingkat kesalahan Algoritma pemilihan fitur dapat dilihat sebagai kombinasi teknik pencarian untuk mengusulkan subset fitur baru Bersama dengan ukuran evaluasi yang memberi nilai pada subset fitur yang berbeda. Algoritma yang paling sederhana adalah menguji setiap kemungkinan subset fitur yang menemukan yang meminimalkan tingkat kesalahan Metrik evaluasi yang mempengaruhi algoritme pemilihan fitur, Wrappers Filters Embedded methods Metrik evaluasi yang mempengaruhi algoritme pemilihan fitur, Wrappers Filters Embedded methods

Feature Selection Tujuan feature selection adalah: Mengurangi jumlah fitur yang terlibat dalam menentukan suatu nilai kelas target. Mengurangi fitur irelevan Mengurangi data yang berlebihan Mengurangi data yang menyebabkan salah pengertian terhadap kelas target yang membuat efek segera bagi aplikasi Aplikasi data mining bisa dipercepat Mempertinggi kinerja mining, seperti akurasi peramalan

Feature Selection Metrik evaluasi yang mempengaruhi algoritme pemilihan fitur, Wrappers Metode pembungkus (wrapper) menggunakan model prediktif untuk memberi nilai subset fitur. Filters Mengandalkan karakteristik umum data pelatihan dan melaksanakan proses pemilihan fitur sebagai langkah preprocessing dengan independensi algoritma induksi. Embedded methods Teknik menangkap semua kelompok yang melakukan pemilihan fitur sebagai bagian dari proses konstruksi model.

Teknik Feature Selection

Filter Method Metode filter didasarkan pada metrik evaluasi kinerja yang dihitung secara langsung dari data, tanpa umpan balik langsung dari prediktor yang akhirnya dapat digunakan pada data dengan jumlah fitur yang berkurang. 1. Chi-Squared Mengevaluasi setiap fitur secara independent 2. Information Gain 3. Correlation Based Feature Selection, CFS 4. Consistency-Based Filter 5. Fast Correlation Based Filter, FCBF

Terima Kasih