Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Computer Science Centre University of Indonesia Data Mining Arrianto Mukti Wibowo, 2003 Sumber penulisan: Turban & Aronson, “Decision Support Systems and.

Presentasi serupa


Presentasi berjudul: "Computer Science Centre University of Indonesia Data Mining Arrianto Mukti Wibowo, 2003 Sumber penulisan: Turban & Aronson, “Decision Support Systems and."— Transcript presentasi:

1 Computer Science Centre University of Indonesia Data Mining Arrianto Mukti Wibowo, 2003 Sumber penulisan: Turban & Aronson, “Decision Support Systems and Intelligent Systems”, chap. 4 Robert Groth, “Data Mining: Building Competitive Advantage”, chap 2

2 Alasan Dulu analisa data dilakukan dengan cara memasukkannya ke dalam model. Hubungan antar variabel jelas! Tapi ada kasus, kita tidak tahu hubungan antar variabel…

3 Data Mining Term used to describe knowledge discovery in databases. Includes: –Knowledge extraction –Data pattern processing, etc. Automatic discovery even by non- programmers

4 Karakteristik Sumber data terkubur dalam data historis yang besar. Usernya kebanyakan adalah end-user. Karena ukuran data historis yang besar, sering menggunakan paralel processing. Sering menghasilkan “unexpected result”, hasil yang tak disangka- sangka…

5 Beberapa Aplikasi Analisa kebangkrutan: –Menggunakan neural net untuk menganalisa performa keuangan perusahaan, dan memprediksi kebangkrutannya Help-desk application: –Menggunakan case based reasoning (seperti expert system), untuk menemukan kasus serupa yang pernah terpecahkan masalahnya dari sekitar kasus sebelumnya.

6 Common types of information from data mining Classification Clustering Association Sequencing Forecasting

7 Classification Infers the defining characteristics of a certain groups Example: customers who have been lost to competition Istilah penting: –Study: ruang lingkup data mining –Goal: pertanyaan tanpa harus ada korelasi antar variabel

8 Contoh goal di sebuah perusahaan telco: “I want to understand what makes customers likely to keep being my customers or leave” Dataset yang tersedia dibeberkan sampai ke tingkat customer, dengan atribut –Customer ID –Cust_Type: loyal, lost (dependant variable) –Time_used: penggunaan telepon per bulan average –Survey_result: hasil feedback form –Type_service: jenis layanan yang dipakai –Area: lokasi customer –Trend penggunaan telepon

9 Clustering Unsupervised learning: we do not tell the computer anything about the variables Process of dividing a set of data into distinctive groups. Sangat berguna untuk memahami karakeristik pelanggan Clusters are generated automatically Kita bisa menentukan signifikansi dari setiap cluster

10 Example: Clustering of Car Sales Cluster 2 Income: Low Children: 0 Car: Compact Cluster 1 Income: High Children: 1 Car: Luxury Cluster 3 Income: Medium Children: 3 Car: MPV Cluster 4 Income: Medium Children: 2 Car: Sedan

11 Example: Price vs Product- Line More menu variety Limited menu variety Low Price High Price Warteg McDonalds TaKor FISIP UI Ichiban Lotus Mie Ayam KFC

12 Association (Market Basket) Terutama dipakai untuk menentukan, “Kalau customer membeli produk A, maka kemungkinan produk B terbeli juga adalah …%” Contoh: –Cereal dengan susu –DVD player dengan piringan film DVD Tapi asosiasi juga bisa untuk menganalisa hal lain seperti: –Hubungan antara demografi dengan produk terjual

13 Assortment Optimization Proses menentukan produk-produk apa yang akan kita jual Semakin beraneka, harusnya semakin menguntungkan Tapi semakin beraneka, akan ada yang saling mensubtitusi  keuntungan berkurang Padahal semakin beraneka produk yang dijual, carrying cost dan COGS makin besar.

14 Sales volume & cost vs. product variety Gross Margin Cost Sales Variety of products Dollars

15 Padahal kita harus menentukan produk mana yang akan kita –Tambahkan –Hilangkan Dari etalase kita Masing-masing memiliki dampak pada sales dan biaya Harus dicari titik yang paling menguntungkan!

16 Sequencing Mirip dengan asosiasi, tetapi berkaitan dengan waktu Misalnya: –Kunjungan berulang ke sebuah gerai/toko/supermarket dalam waktu yang berbeda

17 Text Mining Serupa dengan “text retrieval”

18 Tips dalam Data Mining Anda harus memahami domain masalah Sangat dianjurkan untuk memahami statistik Tidak mungkin membuat implementasi dan mengoperasikan data mining dengan benar, tanpa memahami domain masalah. Mengapa?


Download ppt "Computer Science Centre University of Indonesia Data Mining Arrianto Mukti Wibowo, 2003 Sumber penulisan: Turban & Aronson, “Decision Support Systems and."

Presentasi serupa


Iklan oleh Google