USING DATA MINING TO MODEL PLAYER EXPERIENCE Nur Fajri Azhar (201010370311003)
General Problem Apakah data mining dapat digunakan untuk menganalisis telemetri yang memungkinkan desainer untuk mengukur pengalaman pemain dalam sebuah game?
Spesific Menggunakan data mining untuk membangun model prediksi retensi pemain. Model player ini digunakan untuk mengevaluasi hubungan yang berbeda antar fitur gameplay.
Metode Teknik Robust Unique Effect Analysis Telemetry-Supported Game design
Hasil Tahap pertama dari RUnEA menemukan regresi aditif untuk menjadi model prediksi yang paling akurat dengan koefisien korelasi mencukupi dari 0,76 . Tahap kedua RUnEA mengidentifikasi Tingkat maksimum yang dihasilkan , dengan korelasi positif , dan tingkat minimum yang dihasilkan , dengan korelasi negatif , sebagai fitur yang paling signifikan dalam menjaga retensi pemain .
Kesimpulan Dengan UnEA, suatu pendekatan untuk modeling player experience dari gameplay telemetry, dan menunjukkan bahwa membangun models dari player experience/ pengalaman pemain memungkinkan player-based feedback untuk designers.
Fitur Representasi Player Madden NFL Infinite Mario Mode Preference Feature Control Usage feature Performance features Playcalling feature Infinite Mario
Metode Evaluasi Dengan subjek penelitian Madden NFL 11 and Infinite Mario
Hasil Evaluasi Madden NFL 11
Hasil Evaluasi (Lanjutan) Infinite Mario
Multi-document extraction based summarization Sri Miranti ( 201010370311012)
General problem Kebutuhan untuk mendapatkan informasi yang maksimal dengan waktu yang minimal.
Spesific problem Mengetahui tingkat evisiensi waktu dari masing – masing teknik (stack decoder based formulation, clustering based generation, graph based formulation).
Metode preprocessing Tokenization of the sentence (alongwith stop words removal). Part-of-speech tagging. Stemming words. Find appropriate word sense for each word in sentence (Lesk word sense disambiguation). Sentence similarity based on word pair similarity.
Metode data mining Jaccard similarity Cosine similarity Tf-idf distance k-means sentence dis-similarity graph
fitur tf-idf sum sentence length named entities count top-k important words sentence position numerical literals count upper case letters count nouns count verbs count adjectives count
results Time taken to generate a summary by each method (not including the data loading time)
Metode evaluasi & hasil evaluasi Metode : rouge Hasil (*- hand set parameters)
kesimpulan Metode stack decoder dan graph decoder menunjukkan hasil yang tidak berbeda jauh. Similarity metrics dan data training yang lebih baik untuk memperkirakan parameter, akan membantu untuk mencapai skor yang lebih tinggi.
A Comparison Study between Data Mining Tools over some Classification Methods MILPA (201010370311046)
General Problem Database saat ini dan repositori data yang mengandung begitu banyak data dan informasi yang menjadi hampir mustahil untuk secara manual menganalisis mereka untuk berharga pengambilan keputusan.
spesific Melakukan studi perbandingan antara sejumlah tersedia perangkat lunak data mining dan alat tergantung pada kemampuan mereka untuk mengklasifikasikan data yang benar dan akurat.
Metode Algoritma Naive Bayes ( NB ) Decision Tree ( C4.5 ) Support Vector Machine ( SVM ) K Nearest Neighbor ( KNN ) Satu Aturan ( OneR ) , dan Zero Aturan ( Zeror )
Hasil Untuk mengevaluasi alat yang dipilih menggunakan dataset yang diberikan , beberapa percobaan yang dilakukan. Bagian ini menyajikan hasil yang diperoleh setelah menjalankan alat pertambangan empat data menggunakan data yang dipilih set dijelaskan pada Tabel 1 .
Metode Evaluasi Tabel 3 menunjukkan hasil setelah menjalankan algoritma menggunakan toolkit Weka. Untuk NB classifier, ukuran akurasi berkisar antara 44% -97%, sedangkan akurasi classifier OneR telah berkisar antara 5% -92%.
Tabel 4. Itu NB classifier telah mencapai langkah-langkah akurasi berkisar antara52% -96%. The OneR classifier tidak memiliki hasil karena tidak memiliki implementasi.
Tabel 5 menggunakan toolkit KNIME, untuk pengklasifikasi hasil NB telah berkisar antara 42% -95%. Di sisi lain, Zeror dan OneR pengklasifikasi tidak memiliki hasil karena mereka tidak memiliki implementasi.
Untuk alat Tanagra, hasilnya ditunjukkan pada Tabel 6 di mana NB classifier telah mencapai akurasi berkisar antara 60% dan 96%. Zeror dan OneR pengklasifikasi tidak memiliki hasil, karena mereka tidak memiliki implementasi.
Hasil Evaluasi Pada gambar 2. menunjukkan bahwa toolkit KNIME telah mencapai tingkat terbaik dalam hal jumlah langkah akurasi menurun , hanya 4 langkah akurasi yang menurun ketika bergerak dari tes split persentase uji CV di KNIME . Untuk Orange dan WEKA toolkit , jumlah langkah akurasi menurun di mana 6 dan 7 masing-masing Akhirnya, Tanagra toolkit telah mencapai setidaknya tingkat dengan sebagian menggunakan dua pengklasifikasi yaitu; SVM dan pengklasifikasi KNN , sementara ia tidak memiliki kemampuan untuk menjalankan dua pengklasifikasi terakhir yaitu; OneR dan Zeror pengklasifikasi
Kesimpulan Penelitian ini telah melakukan perbandingan antara empat toolkit data mining untuk keperluan klasifikasi , sembilan set data yang berbeda yang digunakan untuk menilai empat toolkit diuji dengan menggunakan enam algoritma diatas. Penelitian ini menyimpulkan bahwa tidak ada alat yang lebih baik daripada yang lain jika digunakan untuk tugas klasifikasi , karena tugas klasifikasi itu sendiri dipengaruhi oleh jenis dataset dan cara classifier dilaksanakan dalam toolkit . Namun , dalam hal penerapan pengklasifikasi ' , kami menyimpulkan bahwa WEKA toolkit adalah alat terbaik dalam hal kemampuan untuk menjalankan classifier dipilih diikuti oleh Orange , Tanagra , dan akhirnya KNIME masing-masing.