Data mining Pengantar data mining
THE ORIGIN OF DATA MINING
Apa itu data miining? Penggalian data (data mining) adalah ekstraksi pola yang menarik, dari data dalam jumlah besar. Suatu pola dikatakan menarik apabila pola tersebut tidak sepele, implisit, tidak diketahui sebelumnya, dan berguna. Pola yang disajikan haruslah mudah dipahami, berlaku untuk data yang akan diprediksi dengan derajat kepastian tertentu, berguna, dan baru.
Apa itu Data mining? Data mining memiliki beberapa nama alternatif, meskipun definisi eksaknya berbeda, seperti: KDD (knowledge discovery in database), analisis pola, arkeologi data, pemanenan informasi, intelegensia bisnis.
Kenapa butuh data mining Perkembangan yang pesat di bidang pengumpulan data dan teknologi penyimpanan di berbagai bidang, menghasilkan basis data yang terlampau besar. Namun, data yang dikumpulkan jarang dilihat lagi, karena terlalu panjang, membosankan, dan tidak menarik. Dan intuisi yang yang digunakan untuk pembuatan keputusan sudah tidak dapat diterapkan.
Kenapa butuh data mining secara komersial Banyak data yang sudah dikumpulkan dan disimpan Web data, e-commerce Data penjualan dan pembelian dan toko retail Transaksi bank dan kartu kredit Komputer lebih murah lebih powerful Tekanan kompetisi sangat kuat
Kenapa butuh data mining dari sisi sains Data dikumpulkan dan disimpan dalam kecepatan tinggi Sensor remote pada satelit Telescop scanner untuk langit Simulasi sains penghasil data Terabytes Membantu sains Klasifikasi dan segmentasi data Formasi hipotesis
Pengaplikasian data mining dalam games
Pengaplikasian data mining dalam industri bisnis
Pengaplikasian data mining dalam teknologi medis
Dimanakah letak datamining?
Klasifikasi Kluster Asociation Rule Sequential Pattern Regressing Apa TUGAS DATA MINING? Klasifikasi Kluster Asociation Rule Sequential Pattern Regressing Deviation Detection
tugas Buat dengan anggota berjumlah 5-7 orang / kelompok. Dikepalai oleh teman yang sering kali membawa laptop. Sebisa mungkin setiap orang membawa. Cari software yang dapat digunakan untuk melakukan proses data mining boleh bersifat opensource, freeware, atau berbayar. Misalnya: Rapid Mind, R, Tanagra, SPSS, Oracle, Wika (tidak boleh sama antar kelompok) Cari data yang berkaitan / dapat diolah dengan data mining menurut anda. Misalnya: data perusahaan atau bank atau kartu kredit, saham, medical record, gambar medis atau gambar scene, data kependudukan, data properti (tidak boleh sama antar kelompok) Setiap minggunya data tersebut harus dibawa bersama laptop yang sudah diinstall perangkat lunak yang telah ditentukan. Dipertemuan ke-9 dipresentasikan hasilnya Pertemuan ke-12 laporan dikumpulkan, berupa modul tahap-tahap yang sudah dilakukan berdasarkan praktik sehari-hari.