Klasifikasi dengan RapidMiner Business Intelligence Ramos Somya
Data Set Simpan dalam .xls (misal: datasetKlasifikasi.xls)
Langkah 1 Buka RapidMiner Studio – File – New Process
Langkah 2 Import data dalam .xls tadi ke dalam Repository.
… Klik Next – Next - Next
Langkah 3 Ubah attribute pada kolom “Dipilih” menjadi label - Next
Langkah 4 Berikan nama data set tersebut dalam repository - Finish
…
Langkah 5 Kembali ke bagian Main Process, drag and drop data dari Repository ke Main Process
Langkah 6 Pada bagian Operator, cari operator X-Valiadation dan drag and drop ke Main Process
Langkah 7 Hubungkan data set dengan operator X-Validation dan ke bagian Result:
Langkah 8 Double Click pada bagian icon Inner Source Double Click
… Akan muncul tampilan seperti berikut ini:
Langkah 9 Pada bagian Operators, cari operator Naïve Bayes dan drag and drop ke bagian Training:
Langkah 10 Tambahkan operator Apply Model dan drag and drop ke bagian Testing:
Langkah 11 Drag and drop operator Performance ke bagian Testing:
Langkah 12 Hubungkan setiap operator seperti berikut dan klik Run
Hasil Hasil yang dikeluarkan oleh RapidMiner adalah tingkat keakuratan training set. Pada hasil tersebut, tingkat akurasi adalah 80%, di mana ada 2 data yang tidak dipakai dalam perhitungan Naïve Bayes.
… Untuk mengetahui rule yang dihasilkan, kita dapat mengganti operator Naïve Bayes dengan Rule Induction. Kembali ke jendela desain, klik kanan pada operator Naïve Bayes – Replace Operator – Modelling – Classification and Regression – Rule Induction – Rule Induction.
… Pada jendela Main Process, ubah koneksi seperti berikut: Run
Hasil Rule yang dihasilkan:
… Test Set: Berdasarkan data tersebut, apabila diketahui suatu daerah dengan harga tanah MAHAL, jarak dari pusat kota SEDANG, dan ADA angkutan umum, maka hasil klasifikasinya adalah: TIDAK.
Terima Kasih