Daftar Topik Skripsi (1) VSM01: Klasifikasi Emoji pada Big Data Indonesia pada Sistem Tersebar Hadoop VSM02: Algoritma Pengelompokan DBSCAN Paralel dengan MapReduce pada Sistem Terdistribusi Hadoop VSM03: Klasifikasi Big Data dengan Algoritma Naïve Bayes pada Sistem Terdistribusi Hadoop VSM04: Konstruksi Graf Secara Paralel dari Data Tidak Terstruktur pada Sistem Terdistribusi Hadoop VSM05: Konstruksi Dendrogram dan Pengelompokan dgn Algoritma Agglomerative pada Sistem Terdistribusi Hadoop VSM06: Studi dan Implementasi Pola Desain MapReduce
Daftar Topik Skripsi (2) VSM07: Perangkat Lunak e-CRM utk e-Commerce: Newsletter dan Promosi Produk via Ponsel dan Media Sosial (*) VSM08: Sistem Business Intelligent untuk Perusahaan X (*) VSM09: Perangkat Lunak Analitik Click Stream (*)
VSM01: Klasifikasi Emoji pada Big Data Indonesia pada Sistem Tersebar Hadoop Tujuan: Membangun perangkat lunak di lingkungan sistem tersebar Hadoop utk mengumpulkan big data text Indonesia (dari sistem e-commerce dan/atau media sosial) dan menganalisis sentiment pesan dgn teknik klasifikasi pada emoji emoji. Prasyarat: Mengambil MK Temu Kembali Informasi atau Penambangan Data Sistem memiliki kemampuan: Mengambil “data training mentah” (big data) dari media sosial tertentu yang relevan dengan tujuan analisis. Mem-praolah “data training mentah” pada (1) dan menyimpan hasil ringkasan pada sistem Hadoop. Mengklasifikasi data training (hasil pra-olah) dgn algoritma klasifikasi k-Nearest Neighbor (kNN) Menampilkan hasil klasifikasi dari pesan/dokumen baru.
Contoh Emoji:
VSM01: Klasifikasi Emoji pada Big Data Indonesia pada Sistem Tersebar Hadoop Mhs mengerjakan (a.l.): Studi literatur: Konsep data tidak terstruktur, teks, Hadoop, teknik pra-pengolahan data dan analisis data tidak terstruktur, algoritma klasifikasi k-NN, dll. Mengumpulkan big data text berbahasa Indonesia utk studi kasus Mempelajari pemanfaatan Hadoop dgn membuat program2 kecil yang relevan utk analisis data tsb. Merancang dan mengimplementasikan teknik pra-pengolahan big data text pada lingkungan Hadoop. Merancang dan mengimplementasikan teknik klasifikasi parallel berbasis k-NN pada big data di lingkungan Hadoop. Melakukan eksperimen utk menguji performance perangkat lunak utk analisis emoji , pada cluster jaringan Hadoop dengan jumlah node yg bervariasi. Untuk: 1 mhs
Makalah referensi:
Makalah referensi:
VSM02: Algoritma Pengelompokan DBSCAN Paralel dengan MapReduce pada Sistem Terdistribusi Hadoop Tujuan: Membangun aplikasi clustering dgn alg DBSCAN paralalel dgn memanfaatkan MapReduce pada lingkungan Hadoop Prasyarat: Mengambil MK Penambangan Data (Data Mining) atau Mesin Belajar Fitur-fitur aplikasi yg dikembangkan a.l.: Mengimport beberapa jenis data mentah studi kasus ke HDFS; Menampilkan sampel data; Mengelompokkan set data; Menguji kualitas kelompok2 hasil clustering; Menampilkan ringkasan/pola hasil pengelompokan
VSM02: Algoritma Pengelompokan DBSCAN Paralel dengan MapReduce pada Sistem Terdistribusi Hadoop Mhs mengerjakan (a.l.): Studi literatur: Konsep data tidak terstruktur, Hadoop, dll. Mendalami teknik clustering, khususnya DBSCAN dan pengukuran kualitas kelompok2. Mengumpulkan beberapa jenis data tidak terstruktur untuk eksperimen Merancang dan mengimplementasikan aplikasi clustering dgn DBSCAN paralel. Melakukan eksperimen dgn beberapa data tidak terstruktur utk mengukur kinerja DBSCAN paralel pd cluster /jaringan Hadoop dgn beberapa jumlah node/komputer. Untuk: 1 mhs
Makalah referensi:
VSM03: Klasifikasi Big Data dengan Algoritma Naïve Bayes pada Sistem Terdistribusi Hadoop Tujuan: Membuat aplikasi di lingkungan sistem tersebar Hadoop utk mengklasifikasikan beberapa jenis big data (numeric, text, dll). Prasyarat: Mengambil MK Penambangan Data atau Mesin Belajar atau Temu Kembali Informasi Deskripsi fitur-fitur program yg dikembangkan: Mengimport beberapa jenis data mentah studi kasus (data pelatihan ke HDFS Mem-praolah big data mentah agar siap diklasifikasi Mengklasifikasi big data hasil pra-olah Menampilkan hasil klasifikasi objek baru
VSM03: Klasifikasi Big Data dengan Algoritma Naïve Bayes pada Sistem Terdistribusi Hadoop Mhs mengerjakan (a.l.): Studi literatur: Konsep data tidak terstruktur, big data, Hadoop, algoritma Naïve Bayes, dll. Mempelajari pemanfaatan Hadoop dan pemrograman MapReduce. Mengumpulkan beberapa jenis big data untuk eksperimen Merancang dan mengimplementasikan teknik-teknik pra-olah data utk beberapa jenis big data. Merancang dan mengimplementasikan teknik klasifikasi Naïve Bayes parallel di lingkungan Hadoop. Melakukan eksperimen utk mengklasifikasi beberapa jenis big data , pada cluster jaringan Hadoop dengan jumlah node yg bervariasi. Untuk: 1 mhs
Thesis referensi:
VSM04: Konstruksi Graf Secara Paralel dari Data Tidak Terstruktur pada Sistem Terdistribusi Hadoop Tujuan: Membuat program aplikasi utk mengkonstruksi graf dari data teks dgn memanfaatkan MapReduce di lingkungan Hadoop. Prasyarat: - (tidak ada syarat khusus) Deskripsi program-program yg dikembangkan: Mengimport beberapa big data studi kasus ke HDFS Mengkonstruksi graf dari big data dan menampilkan hasilnya dalam bentuk teks dan visual. Mencari jarak terdekat dari antar 2 node dgn lebih dari satu pendekatan. Memanfaatkan pencarian jarak pada beberapa big data studi kasus untuk penyelesaian masalah tertentu.
VSM04: Konstruksi Graf Secara Paralel dari Data Tidak Terstruktur pada Sistem Terdistribusi Hadoop Mhs mengerjakan (a.l.): Studi literatur: Analisis data teks, Hadoop. Mendalami konsep graf dan konstruksi graf pada teks. Mengumpulkan beberapa jenis data teks untuk eksperimen Merancang dan mengimplementasikan program sesuai fitur-fitur yg ditetapkan. Melakukan eksperimen utk mengukur kinerja aplikasi , pada cluster jaringan Hadoop dengan jumlah node yg bervariasi. Untuk: 1 mhs
Referensi: Section 7.1 pada buku “Hadoop in Practice”:
Makalah referensi:
Makalah referensi:
VSM05: Konstruksi Dendrogram dan Pengelompokan dgn Algoritma Agglomerative pada Sistem Terdistribusi Hadoop Tujuan: Membuat aplikasi di lingkungan sistem tersebar Hadoop utk mengkonstruksi dendrogram dan mengelompokkan objek2 pada beberapa jenis big data (numeric, text, dll). Prasyarat: Mengambil MK Penambangan Data atau Mesin Belajar atau Temu Kembali Informasi Deskripsi fitur-fitur program yg dikembangkan: Mengimport beberapa jenis data mentah studi kasus ke HDFS Mem-praolah big data mentah agar siap dikelompokkan Mengelompokkan big data hasil pra-olah Menampilkan hasil pengelompokan
VSM05: Konstruksi Dendrogram dan Pengelompokan dgn Algoritma Agglomerative pada Sistem Terdistribusi Hadoop Mhs mengerjakan (a.l.): Studi literatur: Hadoop, algorima agglomerative, teknik2 pra-olah data. Merancang dan mengimplementasikan program sesuai fitur-fitur yg ditetapkan. Melakukan eksperimen utk mengukur kinerja aplikasi pada beberapa jenis big data, pada cluster jaringan Hadoop dengan jumlah node yg bervariasi. Untuk: 1 mhs
VSM06: Studi dan Implementasi Pola Desain MapReduce Tujuan: Mempelajari dan mengimplementasikan MapReduce Design Patterns Prasyarat: - (sesuai ketentuan pd kurikulum) PL yg dikembangkan berupa modul-modul program yg mengimplementasikan patterns/pola (lihat ebook referensi pd halaman slide berikutnya): Summarization Filtering Join Meta Input dan Output
VSM06: Studi dan Implementasi Pola Desain MapReduce Mhs mengerjakan (a.l.): Studi literatur konsep Hadoop Menginstalasi Hadoop pada computer pribadi Mempelajari dan mengimplementasikan MapReduce Design Patterns (lihat eBook pada halaman slide setelah ini) Mengimplementasikan patterns untuk kasus-kasus nyata tertentu Melakukan eksperimen hasil implementasi pada jaringan Cluster Hadoop di Lab FTIS untuk mengukur kinerja dari setiap pattern yg diimplementasikan. Untuk: 1 mhs
Referensi utama topik “Studi dan Implementasi Pola Desain MapReduce”:
VSM07(*): Perangkat Lunak e-CRM utk e-Commerce: Newsletter dan Promosi Produk via Ponsel dan Media Sosial Tujuan: Membangun PL e-CRM utk perusahaan e-Commerce yg berfungsi utk merancang dan mengirimkan newsletter dan promosi produk via ponsel dan media sosial Prasyarat: - Kemampuan sistem yg dikembangkan: Membuat dan mengirim newsletter (email): menampilkan form utk beberapa jenis newsletter, mengambil masukan dari pengguna (berupa data teks, gambar, link, peta, dll.), membuat pesan email, mengirim ke pengguna. Membuat dan mengirim promosi produk: menampilkan form utk beberapa jenis promosi dan media promosi, mengambil masukan dari pengguna (berupa data teks, gambar, link, peta, dll.), membuat pesan promosi, mengirim ke pengguna via sms dan/atau media social (WA, Twitter, FB, dll).
VSM07(*): Perangkat Lunak e-CRM utk e-Commerce: Newsletter dan Promosi Produk via Ponsel dan Media Sosial Mhs mengerjakan (a.l.): Studi literatur: konsep e-commerce, e-CRM (Electronic Customer Relationship Management), API utk pengiriman email, pengiriman pesan via sms, WA dan ke media social, juga API utk Google Map. Mencari perusahaan e-commerce studi kasus untuk dipelajari produk-produk yg dijual, promosi yg dibutuhkan, sistem e-commerce yg dimiliki dan sistem e-CRM yg diterapkan. Merancang template-template newsletter dan pesan promosi produk-produk ke beberapa tipe media promosi. Membangun PL (dgn kemampuan minimal yg sudah didefinisikan) untuk perusahaan e-commerce studi kasus. PL ini haruslah dapat diintegrasikan dengan sistem e-commerce milik perusahaan. Untuk: 1 mhs
VSM08: Sistem Business Intelligent untuk Perusahaan X (*) Tujuan: Membangun Sistem Business Intelligent (BI) untuk sebuah perusahaan studi kasus dgn memanfaatkan tool/kakas Microsoft SQL Data Tools Prasyarat: Mengambil MK Kecerdasan Bisnis Kemampuan sistem yg dikembangkan a.l.: Melakukan ETCL (first load & incremental load) dari basisdata operasional ke data warehouse dgn menggunakan graphical tool MS Integration Services; Menampilkan laporan-laporan (dari data yang tersimpan di data warehouse) dengan tool MS Report; Menjalankan fungsi-fungsi OLAP dan data mining utk analisis data (yang tersimpan di data warehouse) dgn tool MS Analysis Services Multidimensional & Data Mining;
VSM08: Sistem Business Intelligent untuk Perusahaan X (*) Mhs mengerjakan (a.l.): Studi literatur: Business Intelligent, data warehouse, data mining, pemrograman utk lingkungan MS Integration Services, dll. Mencari perusahaan studi kasus yg memiliki basisdata operasional yg boleh ditelaah dan meminta skema basisdata beserta rekord2 isinya. Mempelajari kakas Microsoft Data Tools. Merancang dan mengimplementasikan data warehouse di SQL Server Merancang dan mengimplementasikan fungsi-fungsi ETCL (first load & incremental load). Membuat laporan2 dg tool MS Report. Merancang dan mengimplementasikan Cube dgn tool MS Analysis Services Multidimensional & Data Mining Menjalankan fungsi2 OLAP (drill down, roll up, slide, dice) dan analisis data dgn teknik data mining (dgn tool MS Analysis Services Multidimensional & Data Mining) Untuk: 1 mhs
VSM09: Perangkat Lunak (PL) Analitik Click Stream (*) Tujuan: Mengembangkan PL untuk menganalisis log akses website dan menampilkan hasilnya dalam format grafis, teks dan tabular. Prasyarat:- Kemampuan PL: Membaca dan mengolah log akses website (mis. Apache) Menghitung dan menampilkan statistik akses website berdasar: Waktu Perangkat utk akses (desktop, tablet, …) Software (Chrome, Mozila, Android, Opera, Safari, UC Browser, dll) Lokasi akses Referer (langsung, search engine, twitter, dll.) Keterangan: Contoh-contoh tampilan hasil analitis PL diberikan pd halaman2 slide berikutnya
Statistik kunjungan web berdasar waktu:
Statistik kunjungan web berdasar device:
Statistik kunjungan web berdasar software:
Statistik kunjungan web berdasar lokasi:
Statistik kunjungan web berdasar waktu:
Statistik kunjungan web berdasar tipe referer:
Statistik kunjungan web berdasar referer:
VSM09: Perangkat Lunak (PL) Analitik Click Stream (*) Yang dilakukan mhs: Studi literatur tentang analisis akses website (secara umum) dan click stream (secara khusus). Studi literature ttg konsep web server Membuat website simulasi yg sederhana yg memanfaatkan webserver tertentu (mis. Apache) dan meluncurkannya agar diakses pengguna. Membangun PL untuk membaca dan menganalisis log web (yg menganalisis log web pada website simulasi). Melakukan eksperimen dengan log website nyata studi kasus (selain website simulasi di atas). Untuk: 1 mhs
Good Luck!