Topik-Topik Lanjutan Sistem Informasi Johanes Kevin Lumadi Deny Setiawan Machliza Devi Sasmita Silvia Line Billie Enceil Data Mining 06-PFM/01
Data mining merupakan suatu proses yang digunakan untuk mendapatkan informasi dan pengetahuan yang bermanfaat dimana informasi tersebut didapatkan dari data-data yang telah dikumpulkan. Data mining seringkali digunakan untuk melakukan praktek profil seperti pemasaran, pengawasan, penipuan deteksi dan penemuan ilmiah.
Data mining menjadi suatu alat yang penting karena selain dapat digunakan untuk mengubah data menjadi informasi, data mining juga dapat digunakan untuk menganalisis kumpulan penelitian perilaku.
Kemampuan Data Mining yaitu kemampuan untuk mereduksi data. Dapat dilakukan dengan Katalogisasi klasifikasi Segementasi
Pemanfaatan data mining dapat dilihat dari dua sudut pandang, yaitu : Sudut pandang komersial Sudut pandang keilmuan
Manfaatnya yaitu : Menangani meledaknya volume data (menyimpan, mengestrak serta memanfaaatkan) Menghasilkan informasi yang dapat menjadi asset untuk meningkatkan daya saing suatu institusi. Menggudangkan data tanpa kehilangan informasi yang penting (warehousing) Menyelesaikan permasalahan atau menjawab kebutuhan bisnis itu sendiri
Manfaatnya yaitu : Mengcapture, menganalisis serta menyimpan data yang bersifat real-time dan sangat besar
Kelebihan Data Mining : Kemampuan dalam mengolah data dalam jumlah yang besar. Pencarian Data secara otomatis. Kekurangan Data Mining : Kendala Database ( Garbage in garbage out ). Tidak bisa melakukan analisa sendiri.
Berikut adalah cara kerja dalam data mining : 1. Identify the business problems Pada tahap pertama ini, kita harus mengidentifikasi masalah bisnis yang terjadi karena data tidak bisa diolah apabila kita tidak mengetahui permasalahan yang sedang dihadapi. Setelah mengetahui masalah tersebut, maka kita dapat menentukan data- data apa saja yang diperlukan.
2. Mine the data for afectionable information setelah mengetahui masalah yang dihadapi dan data apa saja yang diperlukan maka pada tahap ini akan dilakukan analisa pada data- data tersebut. Melalui tahap analisa ini, kita mendapatkan pengetahuan(knowledge) baru yang akan digunakan dalam mengambil suatu keputusan.
3. Take the action Dari keputusan yang telah diambil tersebut, maka kita akan melakukan implementasi yang berupa sebuah tindakan yang konkrit ke dalam suatu proses bisnis.
4. Measure the results tahap ini merupakan tahap terakhir dalam proses data mining. Pada tahap ini, kita akan memantau hasil dari implementasi tersebut apakah hasil tersebut sudah mencapai target yang diinginkan atau belum dan apakah hasil tersebut dapat menjadi solusi pemecahan masalah atau dapat mengatasi masalah-masalah yang sedang dihadapi.
1. Market Basket analysis Merupakan teknik data mining yang digunakan untuk melakukan analisis pada kebiasaan pelanggan yang menyimpan produk yang diinginkannya kedalam cart/keranjang belanja. Teknik ini juga menganalisis data transaksi penjualan untuk mencari pola dari Produk yang terdapat dalam suatu transaksi kemudian pola tersebut akan digunakan untuk merancang strategi penjualan maupun pemasaran agar menjadi lebih efektif.
2. Memory-based reasoning Merupakan suatu teknik yang melakukan penalaran berbasis memori dengan menggunakan sekumpulan data untuk mengasumsikan pembuatan objek baru.
3. Cluster detection Dalam teknik ini terdapat 2 pendekatan, yaitu: - Memberikan asumsi bahwa kumpulan cluster sudah disimpan ke dalam data. Tujuan pendekatan ini adalah untuk membagi data kedalam bentuk cluster. -Clustering agglomerative, pendekatan ini melakukan penggabungan pada cluster meskipun menggunakan proses komputasi yang sama dan proses tersebut dilakukan secara berulang-ulang.
4. Link analysis Merupakan suatu teknik yang mengidentifikasi dan membangun hubungan suatu objek dengan sekumpulan data serta menganilisis sifat yang berhubungan antara kedua objek tersebut. Teknik ini biasanya digunakan untuk mengambil suatu kesimpulan dengan mengandalkan teori grafik dan sering juga dipakai untuk melakukan proses optimasi.
5. Rule induction Teknik yang digunakan untuk mengidentifikasi aturan- aturan bisnis yang telah disimpan kedalam data. 6. Neural Networks Merupakan sebuah teknik yang berbentuk struktur jaringan neural dan berguna dalam mengubah data yang rumit/sulit dipahami oleh manusia menjadi data yang dapat dimengerti selain itu juga dapat digunakan untuk mendeteksi tren yang rumit tetapi sering didiskusikan/dicari.
Classification Membagi data menjadi beberapa bagian/kelas kemudian mengecek atribut-atribut dari objek setelah itu memutuskan objek tersebut masuk ke kelas yang mana. Estimation Melakukan estimasi/memperkirakan nilai numerik secara terus menerus. Dapat dikatakan sebagai bagian dari klasifikasi.
Prediction prediksi ini berbeda dengan klasifikasi maupun estimasi karena dalam prediksi, objek akan dibagi sesuai dengan behaviour yang telah ditetapkan/ diinginkan dari candidate behaviour. Affinity Grouping Melakukan evaluasi hubungan atau mengelompokkan unsur-unsur data yang terdiri dari atribut/behaviour yang akan menunjukkan tingkat afinitas antar objek tersebut.
Clustering Sering disebut dengan segmentasi/pembagian. Hampir sama dengan klasifikasi namun dalam clustering, data dibagi menjadi beberapa bagian kemudian dilakukan indentifikasi setelah itu data akan dikelompokkan sesuai dengan atribut yang sama. Description Mendeskripsikan atau memberikan gambaran secara umum mengenai hasil akhir dari proses data mining.
data-mining-bab-01.pdf manullang.blogspot.com/2011/04/dasar-data- mining.html