DATA WAREHOUSE DAN APLIKASI OLAP DATA AKADEMIK ILMU KOMPUTER IPB BERBASIS WEB MENGGUNAKAN PALO 2.0 Yaghi Amanda Permana G64104008 Pembimbing : Hari Agung Adrianto, S.Kom, M.Si Imas S. Sitanggang, S.Si, M.Kom Bogor, 1 Agustus 2008 Ruang Sidang ILKOM Darmaga Fakultas Matematika dan Ilmu Pengetahuan Alam Departemen Ilmu Komputer
Latar Belakang Data yang tersimpan belum dimanfaatkan secara maksimal untuk dijadikan suatu informasi dan pengetahuan yang penting. Proses analisis data nilai akademik masih dilakukan secara manual dengan melihat data yang saling berhubungan.
Tujuan Membangun sebuah data warehouse dan sebuah aplikasi OLAP berbasis web untuk data akademik Program Studi Ilmu Komputer IPB dengan menggunakan Palo 2.0 sebagai OLAP server.
Ruang Lingkup & Manfaat Ruang lingkup penelitian dibatasi pada pembuatan data warehouse dan aplikasi OLAP berbasis web data akademik Program Studi Ilmu Komputer IPB tahun masuk 2001 sampai 2004 (Passing Out). Diharapkan bermanfaat bagi pihak-pihak terkait di Departemen Ilmu Komputer dalam memberikan informasi konklusif, cepat, dan menarik.
Tinjauan Pustaka Praproses Data Teknik pemrosesan data yang dapat membantu meningkatkan kualitas data secara konsekuen sehingga meningkatkan efesiensi proses pengolahan data selanjutnya (Han & Kamber 2006). Tahapan : Pembersihan data, integrasi data, transformasi data, dan reduksi data.
Tinjauan Pustaka (lanjutan) Data Warehouse Sekumpulan informasi yang disimpan dalam basis data, memiliki karakteristik berorientasi subyek, terintegrasi, time- variant, dan non-volatile yang mendukung proses pembuatan keputusan dalam organisasi (Inmon 1996). Model Data Multidimensi Terdiri dari satu atau lebih tabel dimensi dan tabel fakta yang ditampilkan dalam bentuk kubus dan dapat digambarkan dalam bentuk skema. Dimensi perspektif atau entitas yang digunakan sebagai tempat menyimpan beberapa record yang saling berhubungan Fakta suatu pengukuran data numerik dan data historis yang terdiri dari facts, measures dan keys dari tabel dimensi yang bersangkutan
Tinjauan Pustaka (lanjutan) Online Analytical Processing (OLAP) Terdiri dari seperangkat tool untuk membantu proses analisis dan perbandingan data dalam basis data. Operasi–operasi OLAP (Han & Kamber 2006) : Roll up : menaikkan konsep hirarki, reduksi dimensi Drill down : melihat data lebih detail Slice : pemilihan satu dimensi kubus data bersangkutan Dice : sub kubus dengan memilih dua dimensi atau lebih Pivot : merotasikan sumbu data pada x-axis dan y-axis
Tinjauan Pustaka (lanjutan) Roll-up (Han & Kamber 2006)
Tinjauan Pustaka (lanjutan) Drill-down (Han & Kamber 2006)
Tinjauan Pustaka (lanjutan) Slice (Han & Kamber 2006)
Tinjauan Pustaka (lanjutan) Dice (Han & Kamber 2006)
Tinjauan Pustaka (lanjutan) Pivot (Han & Kamber 2006)
Metode Penelitian Analisis data Pemrosesan data dengan praproses data : Integrasi dan reduksi data menggabung data, dan membuang atribut-atribut yang tidak terpilih Pembersihan data memperbaiki data null, terdapat noise, dan data tidak konsisten Transformasi data penyeragaman nama atribut, generalisasi, agregasi, dan konstruksi atribut/dimensi Pembangunan aplikasi OLAP dengan Palo server
Metode Penelitian (lanjutan) Arsitektur aplikasi OLAP server berbasis web
Data source / data warehouse Hasil dan Pembahasan Alur pengolahan data Data source / data warehouse Tabel MS SQL server mdf Data mentah mdb load dan seleksi data Praproses data Kubus data load dan import data Palo ExceL Add-in
Hasil dan Pembahasan (lanjutan) Analisis data Pemilihan data dan atribut data krs, data krsmk, dan data mahasiswa Penentuan dimensi dan tabel fakta 6 dimensi dan 2 tabel fakta Hirarki dimensi dan skema model data multidimensi
Hasil dan Pembahasan (lanjutan) Hirarki dimensi Waktu Angkatan Jenis Kelamin Mata Kuliah Root Root Root Root Tahun akademik Angkatan Jenis kelamin Kriteria Status Studi Mutu semester Mata kuliah Root Root Status studi Nilai mutu Kelas IPK
Hasil dan Pembahasan (lanjutan) Skema galaksi dengan tabel fakta MataKuliah_Mutu dan IndexPrestasi
Hasil dan Pembahasan (lanjutan) Praproses data Integrasi dan reduksi data Integrasi I data KRS mahasiswa (krs) + data KRS mata kuliah (krsmk) + data mahasiswa (mhs). Integrasi II data KRS mahasiswa (krs) + data mahasiswa (mhs) Reduksi data membuang atribut-atribut yang tidak terpilih berdasarkan hasil analisis data dan menyeleksi data dengan hanya mengambil data mahasiswa Ilmu Komputer sebagai data yang ingin dianalisis
Hasil dan Pembahasan (lanjutan) Pembersihan data data kosong : atribut IP dan IPK di-update menjadi 0, nilai huruf mutu yang bernilai null ‘BM’, nilai F dan T E mengandung noise dan tidak konsisten : atribut namamk diseragamkan nilai dari atributnya Transformasi data Penyeragaman nama atribut sesuai dengan skema model data multidimensi yang dibuat. Generalisasi : Nokrs kode tahun akademik dan semester Nrp kode tahun masuk IPB
Hasil dan Pembahasan (lanjutan) Transformasi data (lanjutan) Konstruksi atribut baru : konstruksi atribut status dengan mengategorikan range nilai IPK tertentu ke dalam status yang ingin dibuat. Agregasi : Fakta1 jumlah mahasiswa Fakta2 jumlah mahasiswa, rataan IP, dan rataan IPK Konstruksi dimensi dim_time dimensi Waktu dim_mk dimensi MataKuliah dim_mutu dimensi Mutu dim_jk dimensi JenisKelamin dim_statusstudi dimensi StatusStudi
Hasil dan Pembahasan (lanjutan) Pembuatan struktur kubus data kubus data MataKuliah_Mutu Dimensi : Waktu, Angkatan, JenisKelamin, MataKuliah, Mutu. Ukuran : jumlah mahasiswa kubus data IndexPrestasi Dimensi : Waktu, Angkatan, JenisKelamin, StatusStudi Ukuran : jumlah mahasiswa, rataan IP, rataan IPK Pemuatan data Data warehouse dimuat ke Palo server kubus data Kubus data Palo disimpan di file : C:\Documents and Settings\All Users\Documents\Jedox\Palo\data\ akademik_ilkom
Hasil dan Pembahasan (lanjutan) Implementasi Apache PHP (Web Server) Palo 2.0 (OLAP server) JP Graph (presentasi grafik) Fitur Aplikasi Menu OLAP : menentukan kubus data, ukuran, dan dimensi. Filter dimensi : menyaring dimensi yang ditampilkan pada axis x dan axis y. Crosstab dan grafik.
Hasil dan Pembahasan (lanjutan) Contoh presentasi hasil Tren perkembangan Huruf Mutu mata kuliah (misal kuliah basis data dari tahun 2000 hingga 2004), Tren perkembangan indeks prestasi tiap angkatan mahasiswa berdasarkan status studi.
Hasil dan Pembahasan (lanjutan) Contoh operasi-operasi OLAP dalam aplikasi: Roll-up : dimensi Waktu, mengetahui nilai rataan IPK angkatan mahasiswa per tahun akademik. Drill-down : dimensi StatusStudi, melihat jumlah mahasiswa dengan kelas IPK tertentu pada status studi tanpa syarat. Slice : keseluruhan mahasiswa jumlah mahasiswa yang mengambil mata kuliah Basis Data. Dice : nilai rataan IPK angkatan mahasiswa dari tahun akademik 2001/2002 sampai 2004/2005, dan untuk status studi Drop Out.
Hasil dan Pembahasan (lanjutan) Contoh operasi-operasi OLAP dalam aplikasi: Roll-up Genap 2004/2005 Roll-up dimensi waktu (dari semester ke tahun akademik) Ganjil 2003/2004 2004/2005 Genap 2002/2003 2003/2004 Semester (Waktu) Th akademik (Waktu) TPB 2001/2002 2002/2003 Ganjil 2001/2002 2001/2002 Genap 2001/2002 2003 2003 2002 2001 Peringatan Tanpa syarat 2002 Drop Out 2001 Tanpa syarat Angkatan Peringatan Angkatan Drop Out Status studi Status studi mengetahui nilai rataan IPK angkatan mahasiswa per tahun akademik
Hasil dan Pembahasan (lanjutan) Contoh operasi-operasi OLAP dalam aplikasi: Drill-down Genap 2004/2005 Genap 2004/2005 Drill down dimensi status studi ‘tanpa syarat’ (dari status ke kelas IPK) Ganjil 2003/2004 Ganjil 2003/2004 Semester (Waktu) Genap 2002/2003 Genap 2002/2003 Semester (Waktu) TPB 2001/2002 TPB 2001/2002 Ganjil 2001/2002 Ganjil 2001/2002 Genap 2001/2002 Genap 2001/2002 2003 2003 Tanpa Syarat 2002 2002 Tanpa syarat 2001 IPK ≥ 3,51 2001 Peringatan Angkatan Drop Out Angkatan 2,76 ≤ IPK < 3,51 2,00 ≤ IPK < 2,76 Status studi Status studi melihat jumlah mahasiswa dengan kelas IPK tertentu pada status studi ‘tanpa syarat’
Hasil dan Pembahasan (lanjutan) Contoh operasi-operasi OLAP dalam aplikasi: Slice Struktur Data Slice dimensi MataKuliah untuk mata kuliah = ‘Basis Data’ Mata Kuliah Bahasa Pemrograman Matematika Diskret Basis Data Mata Kuliah Basis Data A 2003 B Metode Statistika 2002 2001 C Mutu Angkatan Organisasi Komputer A 2003 B 2002 C Mutu 2001 Angkatan jumlah mahasiswa yang mengambil mata kuliah Basis Data
Hasil dan Pembahasan (lanjutan) Contoh operasi-operasi OLAP dalam aplikasi: Dice 2006/2007 Dice dimensi Waktu dan StatusStudi (tahun akademik= ‘2001/2002–2004/2005’ dan status studi=‘Drop Out’) th Akademik (Waktu) 2005/2006 2004/2005 2004/2005 2003/2004 Th akademik (Waktu) 2003/2004 2002/2003 2002/2003 2001/2002 2001/2002 2003 2003 2002 2001 2002 Drop Out 2001 Peringatan Tanpa syarat Angkatan Drop Out Angkatan Status Studi Status Studi nilai rataan IPK angkatan mahasiswa dari tahun akademik 2001/2002 sampai 2004/2005, dan untuk status studi Drop Out
Kesimpulan Tahap praproses data menghasilkan 2 kubus data, yaitu kubus MataKuliah-Mutu dan IndexPrestasi. Aplikasi OLAP memudahkan pengguna untuk mengeksplorasi data akademik dengan hanya memilih kubus data, ukuran, dan dimensi yang diinginkan. Aplikasi OLAP dapat menampilkan informasi data akademik dalam bentuk crosstab, grafik batang, garis, dan pie.
Saran Memperbanyak jumlah data, yaitu dengan melibatkan semua data mahasiswa di setiap tahun akademik. Dibangun modul program untuk pemasukan data baru yang nantinya diintegrasikan ke dalam aplikasi OLAP. Dikembangkan operasi-operasi OLAP dalam aplikasi. Operasi dice dan slice lebih disempurnakan, sehingga setiap axis dari Crosstab dapat diisi lebih dari dua dimensi. Penambahan operasi pivot untuk memutar axis.
Daftar Pustaka Herlambang A. 2007. Pembangunan Data Warehouse dan Aplikasi OLAP Berbasis Web Menggunakan Palo. [Skripsi]. Bogor : Departemen Ilmu Komputer, FMIPA, Institut Pertanian Bogor. Han J, Kamber M. 2006. Data Mining : Concepts and Techniques. San Francisco : Morgan Kaufman Publisher. Inmon WH. 1996. Building the Data Warehouse. New York, USA : Jhon Wiley and Sons, Inc. Kantardzic M. 2003. Data Mining : Concepts, Models, Methods, and Algorithms. New Jersey : Jhon Wiley and Sons, Inc.
DeMo
TERIMA KASIH
DATA WAREHOUSE DAN APLIKASI OLAP DATA AKADEMIK ILMU KOMPUTER IPB BERBASIS WEB MENGGUNAKAN PALO 2.0 Yaghi Amanda Permana G64104008 Pembimbing : Hari Agung Adrianto, S.Kom, M.Si Imas S. Sitanggang, S.Si, M.Kom Bogor, 29 Juli 2008 Ruang Seminar2 ILKOM Darmaga Fakultas Matematika dan Ilmu Pengetahuan Alam Departemen Ilmu Komputer