M ANAJEMEN D ATA “Pengaksesan Data”
P ENDAHULUAN Selama beberapa waktu, teknologi informasi berkonsentrasi pada pembangunan sistem bermisi kritis,- sistem yang mendukung pemrosesan transaksi perusahaan (corporate Transaction Processing) Solusi berikutnya adalah penyediaan sistem yang mendukung online Transaction Procession(OLTP)
Karena sering timbulnya masalah, maka beberapa perusahaan memilih untuk menggunakan tool-tool yang inovatif untuk pengaksesan data. Dimana tool ini berbasiskan PC yang murah, jaringan, pendekatan client server. Beberapa orang menyebutnya data dipper/data mining, sebab sistem ini mengijinkan user untuk mengaduk-ngaduk apa saja didalam database untuk mendapatkan apa yang mereka perlukan
Kemampuan teknologi informasi untuk mengumpulkan dan menyimpan berbagai tipe data jauh meninggalkan kemampuan untuk menganalisis, meringkas dan mengekstraksi “pengetahuan” dari data. Metodologi tradisional untuk menganalisis data yang ada, tidak dapat menangani data dalam jumlah besar. Sementara para pelaku bisnis memiliki kebutuhan-kebutuhan untuk memanfaatkan gudang data yang sudah dimiliki, para peneliti melihat peluang untuk melahirkan sebuah teknologi baru yang menjawab kebutuhan ini, yaitu data mining. Teknologi ini sekarang sudah ada dan diaplikasikan oleh perusahaan-perusahaan untuk memecahkan berbagai permasalahan bisnis.
Data mining lebih memperhatikan tentang bagaimana mandapatkan dan menampilkan data, dari pada bagaimana data disimpan
D EFINISI Data mining didefinisikan sebagai satu set teknik yang digunakan secara otomatis untuk mengeksplorasi secara menyeluruh dan membawa ke permukaan relasi-relasi yang kompleks pada set data yang sangat besar Data mining dapat juga didefinisikan sebagai pemodelan dan penemuan polapola yang tersembunyi dengan memanfaatkan data dalam volume yang besar Data mining merupakan suatu proses yang interaktif atau terotomatisasi untuk menemukan pola ( pattern ) data tersebut dan memprediksi kelakuan ( trend ) di masa mendatang berdasarkan pola data tersebut.
T UGAS D ATA M INING Enam Tugas Data Mining: Deskripsi Estimasi Prediksi Klasifikasi Pengelompokan (Clustering) Asosiasi
D ESKRIPSI Tugas ini menuntut DM untuk mampu mengungkapkan pola atau kecenderungan pada data Dengan kemampuannya menjalankan tugas deskripsi maka DM mampu menunjukkan field- field mana yang perlu/tidak perlu dipertimbangkan
T UGAS K E -2&3 DM: E STIMASI DAN P REDIKSI Estimasi memiliki persamaan maupun perbedaan dengan Prediksi Persamaan antara keduanya adalah dalam hal memperkirakan sesuatu hal Bila yang diperkirakan berbentuk numerik, misalnya berat badan seseorang, jumlah hutang seseorang, luas sebuah lahan, maka hal ini disebut Estimasi Bila yang diperkirakan berbentuk kategorial, misalnya pangkat seseorang, status perkawinan seseorang, asal-usul kota kelahiran seseorang, maka hal ini disebut Prediksi
K LASIFIKASI Pada hakekatnya klasifikasi adalah juga hal memperkirakan Lalu, apa bedanya dengan Prediksi ? Pada prediksi variabel peramal (variabel independen)nya seluruhnya bersifat numerik Pada klasifikasi variabel peramal (variabel independen)nya dapat berupa kombinasi numerik dan kategori
P ENGELOMPOKAN ( CLUSTERING ) Pengelompokan ( clustering) merupakan tugas deskripsi yang banyak digunakan dalam mengidentifikasi sebuah himpunan terbatas pada kategori atau cluster untuk mendeskripsikan data yang ditelaah. Kategori- kategori ini dapat bersifat eksklusif dan ekshaustif mutual, atau mengandung representasi yang lebih kaya seperti kategori yang hirarkis atau saling menumpu ( overlapping).
A SOSIASI Asosiasi didasarkan pada Affinity Analysis, yaitu studi terhadap karakteristik atau atribut yang sering muncul bersama-sama Affinity Analysis sering juga disebut Market Basket Analysis, yang digunakan untuk mengungkap asosiasi antara beberapa atribut (yang masih tersembunyi) Analisis ini akan menghasilkan aturan ( Rules ) yang diharapkan dapat mengungkap relasi antara dua atau lebih atribut
‘