Pengantar Data Mining (DM)

Slides:



Advertisements
Presentasi serupa
KNOWLEGDE DISCOVERY in DATABASE (KDD)
Advertisements

Data Mining S2 Kom.
Aplikasi Basis Data.
Using Data Warehouse for Customer Relationship Management
Oleh : Weny Pravita sari
Pertemuan-1.
BASIS DATA LANJUTAN.
Topik-Topik Lanjutan Sistem Informasi Johanes Kevin Lumadi Deny Setiawan Machliza Devi Sasmita Silvia Line Billie.
Data mining Pengantar data mining.
MENJALIN KEAKRABAN DENGAN PELANGGAN
Data Mining Definisi Data Mining Kemampuan Data Mining :
Knowledge Discovery in Databases
BAB I Pendahuluan.
Data Warehouse, Data Mart, OLAP, dan Data Mining
SISTEM BISNIS ELEKTRONIK
Pengenalan Data Warehouse
Pengenalan Datawarehouse
M ANAJEMEN D ATA “Pengaksesan Data”. P ENDAHULUAN Selama beberapa waktu, teknologi informasi berkonsentrasi pada pembangunan sistem bermisi kritis,- sistem.
Data Mining.
Data Warehouse dan Data Mining
SISTEM INFORMASI Pertemuan 5.
Customer Relationship Management
E-Commerce Materi ke 1.
TUGAS MAKALAH E – commerce dan E - business
Pengenalan Datawarehouse
Pertemuan X DATA MINING
Lecturer Note: Retno Budi Lestari,SE,M.Si
E-Business & E-Commerce
12 Oktober 2006Data Mining : Konsep dan Teknologi1 Aplikasi dan Kecenderungan dalam Data Mining ■Aplikasi data mining ■Sistem produk dan protetipe riset.
CUSTOMER PORTOFOLIO ANALYSIS (CPA).
PENGANTAR DATA MINING.
Pengenalan Data Mining
Informasi Dalam Praktik
DATA MINING 25 Januari 2008.
Data Warehouse dan Data Mining
Penambangan data Pertemuan 2.
CRM CRM kependekan dari Customer Relationship Management. Dalam bahasa indonesia dapat kita artikan sebagai Manajemen Hubungan Pelanggan. Merupakan strategi.
E - Business “CRM” Sistem Informasi STMIK AMIKOM Purwokerto 2013.
KECERDASAN BISNIS Data Warehouse, Data Mart, OLAP, dan Data Mining
E-Marketing.
Data dan Informasi Daurat Sinaga, M.Kom.
Memahami Proses Pemasaran Dan Perilaku Konsumen
Data Warehouse, Data Mart, OLAP, dan Data Mining
Konsep Data Mining Ana Kurniawati.
Pengantar DATA MINING • Mengapa data mining? Apa data mining?
CUSTOMER INTIMACY.
KECERDASAN BISNIS (Data Warehouse, Data Mart, OLAP, dan Data Mining)
MELAKSANAKAN RISET PEMASARAN DAN MERAMALKAN PERMINTAAN
Aspek Pemasaran Menganalisis pemasaran secara komprehensif bertujuan untuk merinci pemasaran secara lebih jelas dimulai dari memahami dan mengerti betul.
Aplikasi Business Intelligence & Data Mining
Business Intelligent Ramos Somya, S.Kom., M.Cs.
KNOWLEGDE DISCOVERY in DATABASE (KDD)
BUSINESS INTELLIGENCE
KELOMPOK 6 Nama Kelompok: Lulus Irmawati ( )
INTRODUCTION OF DATA WAREHOUSE
VIVI NILA SARI, SE, MM NIDN :
Database Server & Terdistribusi
Data Mining 1 S2 Kom.
SISTEM PERENCANAAN SUMBER DAYA PERUSAHAAN
CRM CRM kependekan dari Customer Relationship Management. Dalam bahasa indonesia dapat kita artikan sebagai Manajemen Hubungan Pelanggan. Merupakan strategi.
BUSINESS INTELLIGENCE
CUSTOMER PORTOFOLIO ANALYSIS.
Business Performance Management (BPM) Kompetensi
Database Server & Terdistribusi
CRM CRM kependekan dari Customer Relationship Management. Dalam bahasa indonesia dapat kita artikan sebagai Manajemen Hubungan Pelanggan. Merupakan strategi.
Arsitektur dan Model Data Mining
Pertemuan 1 & 2 Pengantar Data Mining 12/6/2018.
CRM CRM kependekan dari Customer Relationship Management. Dalam bahasa indonesia dapat kita artikan sebagai Manajemen Hubungan Pelanggan. Merupakan strategi.
Konsep Data Mining Ana Kurniawati.
Data Mining.
Transcript presentasi:

Pengantar Data Mining (DM) Motivasi Mengapa? Apa? Aplikasi Proses KDD Tinjauan DM Isu Utama

Merupakan Sumber Penemuan” Motivasi: “Kebutuhan Merupakan Sumber Penemuan” Problem ledakan data Tool koleksi data otomatis dan perkembangan teknologi database menyebabkan banyak sekali data yang bisa dikumpulkan di dalam database, data warehouse, dan alat peyimpanan informasi lainnya, untuk dianalisa Kita berkubang data tetapi kelaparan pengetahuan!

Merupakan Sumber Penemuan” Motivasi: “Kebutuhan Merupakan Sumber Penemuan” Solusi: Penggudangan data dan penambangan data (Data warehousing and data mining) Data warehousing dan on-line analytical processing (OLAP) Penyaringan pengetahuan yang menarik (kaidah, keberaturan, pola, kendala) dari data dalam database yang besar

Apa Itu Data Mining? Pada dasarnya: Perolehan pengetahuan dari data “Ekstraksi informasi atau pola yang menarik (tidak sepele, implisit, tak-diketahui sebelumnya, mungkin bermanfaat) dari data didalam database yang besar" Seringkali hanya: “Memberitahu sesuatu yang menarik dari data ini", “Menguraikan data ini" Penyelidikan: analisa data semi-otomatis atas sekumpulan data yang besar

Apa Itu Data Mining? Istilah yang rada baku: Data mining Biasanya DM adalah salah satu proses KDD Knowledge discovery in databases (KDD) Istilah umum yang meliputi, preprocessing data, DM, dan postprocessing Istilah yang tidak terlalu sering digunakan: Ekstraksi pengetahuan, arkeologi data, pengerukan data, penuaian informasi, analisa data/pola Publisitas terbaru: Kecerdasan bisnis, manajemen pengetahuan

Mengapa Data Mining? Ketersediaan data dalam jumlah yang sangat besar: Tool koleksi data otomatis dan perkembangan teknologi database menyebabkan banyak sekali data yang bisa dikumpulkan di dalam database, data warehouse, dan alat peyimpanan informasi lainnya Pemeriksaan data manual adalah membosankan dan terkadang tidak masuk akal

Apa Manfaat Dari DM? Marketing Meningkatkan pengetahuan agar bisa membuat keputusan berdasarkan: Misal, pengaruh pada marketing Peran dan pengaruh DM yang bertumbuh pesat dan masih bertumbuh! Tetapi DM tidaklah sekedar marketing... Marketing Database Data Warehousing KDD & Data Mining

Potensi Aplikasi? Analisis database dan dukungan keputusan: Analisis dan manajemen pasar Target pasar, manajemen relasi customer (CRM), analisis keranjang pasar, penjualan silang, segmentasi pasar Analisis dan manajemen resiko Peramalan, tindakan mempertahankan customer, peningkatan asuransi, kontrol kualitas, analisis kompetitif Deteksi dan manajemen kecurangan

Potensi Aplikasi? Aplikasi lain: Text mining (news group, email, dokumen) dan Web mining Stream data mining Analisis DNA dan bio data

Analisis dan Manajemen Pasar Dari mana data berasal? Transaksi kartu kredit, loyalty cards, kupon discount, keluhan customer, kajian lifestyle publik Target Pasar Mendapatkan kelompok model customer yang berbagi karakteristik yang sama: minat, tingkat pendapatan, kebiasaan belanja, dsb. Menentukan pola pembelian customer berdasarkan waktu Analisis lintas pasar Asosiasi/korelasi antara penjualan produk & taksiran berdasarkan asosiasi demikian

Analisis dan Manajemen Pasar Profil customer Tipe customer apa membeli produk apa (pengelompokan atau klasifikasi) Analisa kebutuhan customer Mengenali produk terbaik untuk customer berbeda Meramalkan faktor apa yang akan memikat customer baru Penyediaan rangkuman informasi Rangkuman laporan multidimensi Rangkuman informasi statistik (kecenderungan data terpusat dan variasi)

Analisis dan Manajemen Resiko Perusahaan Perencanaan keuangan dan evaluasi aset Analisis dan peramalan cash flow Analisis ganti rugi yang mungkin untuk mengevaluasi aset Analisis cross-sectional dan time series (financial-ratio, analisa trend, dsb.) Perencanaan sumberdaya Merangkum dan membandingkan sumberdaya dan pengeluaran

Analisis dan Manajemen Resiko Perusahaan Kompetisi Memantau pesaing dan arah pasar Mengelompokkan customer kedalam kelas dan prosedur harga berbasis kelas Menetapkan strategi harga dalam suatu pasar dengan kompetitif tinggi

Aplikasi Lain Olah raga IBM Advanced Scout menganalisa statistik (shots blocked, assists, dan fouls) pertandingan NBA untuk mendapatkan keuntungan kompetitif bagi New York Knicks dan Miami Heats Astronomi Observatory JPL dan Palomar menemukan 22 quasars dengan bantuan data mining Internet Web Surf-Aid IBM Surf-Aid menerapkan algoritma data mining untuk akses logs halaman Web yang terkait dengan pasar dalam upaya mendapatkan kesukaan dan perilaku customer, mengenalisa efektifitas pemasaran Web, perbaikan situs Web organisasi, dsb.

Contoh (1) Anda seorang manajer marketing untuk perusahaan telepon cellular: Pelanggan menerima sebuah telepon gratis (nilai 1.5 juta) dengan kontrak satu tahun; anda memberikan suatu komisi penjualan sebesar 2.5 juta per kontrak Problem: Turnover (setelah kontrak berakhir) adalah 25% Memberikan suatu telepon baru ke setiap orang yang kontraknya habis sangatlah mahal Membawa kembali customer setelah keluar adalah juga sukar dan mahal

Contoh (1) Tiga bulan sebelum suatu kontrak berakhir, cari tahu customer mana yang akan keluar: Jika anda ingin mempertahankan customer yang diduga akan keluar, tawarkan customer tersebut suatu telepon baru Yippee! I won't leave!

Contoh (2) Anda seorang petugas asuransi dan anda harus mendefinisikan suatu pembayaran bulanan yang pantas untuk seorang pemuda berusia 18 tahun yang membeli sebuah Ferrari … apa yang anda akan lakukan? Oh, yes! I love my Ferrari!

Contoh (2) Kaji seluruh data customer dan data kompensasi pembayaran sebelumnya Kaji peluang penyebab kecelakaan paling banyak berdasarkan dugaan… Kelamin pengendara (pria/wanita) dan usia Model dan usia mobil, tempat tinggal dsb. Jika peluang kecelakaan lebih besar dari rata-rata, aturlah pembayaran bulanan yang sesuai!

Contoh (3) Anda berada diluar negeri dan seseorang mencuri atau menggandakan kartu kredit atau telepon mobile anda … Perusahaan kartu kredit … Menggunakan data histori untuk membangun model prilaku penipuan dan gunakan data mining untuk membantu didalam mengenali kejadian yang mirip Perusahaan telepon … Menganalisis pola yang menyimpang dari suatu kebiasaan yang diharapkan (tujuan, durasi, dsb.)

Contoh (4) Log pengaksesan Web bisa dianalisis untuk … Demikian pula … Mendapatkan apa kesukaan customer Memperbaiki situs Web organisasi Demikian pula … Seluruh jenis analisis log informasi Adaptasi antarmuka/layanan user Excellent surfing experience!

Data Mining: Suatu Proses KDD Pengetahuan Data mining—inti dari proses penemuan pengetahuan Evaluasi Pola Data Mining Task-relevant Data Pemilihan Data Warehouse Pembersihan Data Integrasi Data Databases

Langkah-Langkah dari Proses KDD (1) Pemahaman domain Pembuatan suatu data set target Pembersihan/preprocessing data Reduksi/proyeksi data Pemilihan tugas DM

Langkah-Langkah dari Proses KDD (2) Pemilihan Algoritma DM Data mining: Pencarian Evaluasi pola Penyajian pengetahuan Penggunaan pengetahuan yang diperoleh

Ciri Khas Proses KDD 2 3 1 Seleksi Berdasarkan waktu Raw data Database Operasional 1 3 Seleksi Eval. of interes- tingness Data mining Input data Hasil-Hasil Preprocessing Postprocessing Bersih Benar Fokus 2 Seleksi Pola berguna yg terpilih Utilisasi

Utilisasi Pembuatan keputusan Penyajian Data Teknik Visualisasi Peningkatan potensi untuk mendukung keputusan bisnis Pembuatan keputusan End User Penyajian Data Business Analyst Teknik Visualisasi Data Mining Data Analyst Penemuan informasi Eksplorasi data Analisa statistik, query, dan pelaporan Data Warehouses / Data Marts OLAP, MDA DBA Sumber data Kertas, Files, Penyedia informasi, Sistem database, OLTP

Antarmuka user grafis (GUI) Arsitektur: Sistem Data Mining Antarmuka user grafis (GUI) Evaluasi Pola Mesin data mining Database atau data warehouse server Basis pengetahuan Penyaringan Pembersihan & integrasi data Data Warehouse Databases

Rantai Nilai Kirim iklan ke keluarga dengan profil P Keputusan Promosikan produk A di Z. Kirim iklan ke keluarga dengan profil P Jual silang layanan B ke klien C Pengetahuan Sebanyak Y produk A digunakan di Z Customer dari kelas Y menggunakan x% dari C selama periode D Informasi X tinggal di Z S berumur Y tahun X dan S pindah W punya uang di Z Data Data customer Simpanan data Data grafis Data geografis

Fungsionalitas Data Mining Konsep deskripsi: karakterisasi & diskriminasi Generalisasi, rangkuman, dan karakteristik data kontras Daerah kering vs. Daerah basah Asosiasi (korelasi dan hubungan sebab akibat)

Fungsionalitas Data Mining Klasifikasi dan prediksi Membangun model (fungsi) yang menguraikan dan membedakan kelas atau konsep untuk peramalan kedepan Misal, mengklasifikasikan negara berdasarkan iklim, atau mengklasifikasikan mobil berdasarkan gas mileage Presentasi: pohon-keputusan, kaidah klasifikasi, neural network Menaksir beberapa nilai numerik yang tidak diketahui atau hilang

Fungsionalitas Data Mining Analisis cluster (analisis pengelompokan) Label kelas tidak diketahui: kelompokkan data untuk membentuk kelas baru, misal mengelompokkan rumah untuk mendapatkan pola distribusi Memaksimalkan kemiripan antar kelas dan meminimumkan kemiripan didalam kelas Analisis outlier Outlier: suatu objek data yang tidak mengikuti perilaku umum dari data Gangguan atau pengecualian? Tidak! Berguna dalam deteksi kecurangan, analisis peristiwa yang jarang terjadi

Fungsionalitas Data Mining Analisis trend dan evolusi Trend dan deviasi: analisis regresi Penggalian pola sekuensial, analisis periodisitas Analisis arah pola lain atau statistik

Adakah Seluruh Pola Yang Ditemukan Menarik? Penambangan data bisa membuat ribuan pola: tidak semua pola tersebut menarik Pendekatan yang disarankan: berpusatkan kepada manusia, berbasis query, penggalian terfokus Ukuran ketertarikan Suatu pola adalah menarik jika pola tersebut mudah dipahami oleh manusia, valid (berlaku) pada data baru atau uji dengan suatu derajat kepastian, potensial berguna, baru atau membenarkan suatu hipotesa yang dicari user untuk konfirmasi

Adakah Seluruh Pola Yang Ditemukan Menarik? Ukuran ketertarikan objektif vs. subjektif Objektif: berdasarkan statistik dan struktur pola, misal, dukungan, kepercayaan, dsb. Subjektif: berdasarkan keyakinan user terhadap data, misal, ketakterdugaan, pengalaman baru, tindakan yang bisa diperkarakan, dsb.

Bisakah Memperoleh Seluruh Atau Hanya Pola Yang Menarik? Dapatkan seluruh pola yang menarik: Kelengkapan Bisakah suatu sistem data mining mendapatkan seluruh pola yang menarik? Pencarian heuristik vs. exhaustive (melelahkan) Asosiasi vs. klasifikasi vs. clustering

Bisakah Memperoleh Seluruh Atau Hanya Pola Yang Menarik? Cari hanya pola yang menarik: suatu problem optimasi Bisakah suatu sistem data mining mendapatkan hanya pola yang menarik? Pendekatan Pertama dapatkan seluruh pola lalu saring atau keluarkan yang tidak diminati Buatlah hanya pola yang diminati—optimisasi query penggalian

Data Mining: Tempat Pertemuan Banyak Disiplin Sistem Database Statistik Data Mining Mesin Pembelajaran Visualisasi Algoritma Disiplin Lainnya

Tinjauan Data Mining: Skema Klasifikasi Fungsionalitas umum: Uraian data mining: Uraikan hal menarik apa yang bisa ditemukan dalam data ini! Terangkan data ini ke saya! Peramalan data mining: Berdasarkan data ini dan sebelumnya, beritahu saya apa yang akan terjadi kemudian! Tunjukkan ke saya trend kedepan!

Tinjauan Data Mining: Skema Klasifikasi Tinjauan multi-dimensi … Databases yang akan digali Pengetahuan yang akan dicari Teknik-teknik yang digunakan Aplikasi yang disesuaikan Mari kita lihat lebih dekat pada tinjauan ini ...

Databases yang akan digali Tinjauan Data Mining Databases yang akan digali Relasional Data warehouse Transaksional Object-oriented Object-relational Aktif Spasial Time-series Teks, XML Multi-media Heterogen Warisan Induktif WWW dsb. Databases

Aplikasi yang disesuaikan Tinjauan Data Mining Aplikasi yang disesuaikan Retail (supermarkets etc.) Telecom Banking Fraud analysis DNA mining Analisa stock market Web mining Analisa data log dsb. Applic.

OLAP Mining: Integrasi Dari Data Mining dan Data Warehouse Sistem data mining, DBMS, Data warehouse systems coupling No coupling, loose-coupling, semi-tight-coupling, tight-coupling Data on-line analytical mining (OLAM) Integrasi dari penggalian dan teknologi OLAP

OLAP Mining: Integrasi Dari Data Mining dan Data Warehouse Penggalian pengetahuan multi-level secara interaktif Kebutuhan penggalian pengetahuan dan pola pada suatu level berbeda dari abstraksi dengan drilling/rolling, pivoting, slicing/dicing, dsb. Integrasi dari banyak fungsi penggalian Klasifikasi berkarakter, pertama clustering dan kemudian asosiasi

Isu Utama dalam Data Mining Metodologi dan interaksi penambangan Penambangan berbagai jenis pengetahuan Penambangan pengetahuan secara interaktif Penggabungan latar belakang pengetahuan Bahasa query DM dan DM khusus Visualisasi hasil DM Penanganan gangguan dan data tak lengkap Ketertarikan problem Kinerja dan skalabilitas: Efisiensi dan skalabilitas dari algoritma DM Metoda penambangan paralel, tersebar dan bertumbuh

Isu Utama dalam Data Mining Aneka ragam tipe data: Penanganan tipe data kompleks Penambangan informasi dari database heterogen (Web misalnya) Aplikasi dan integrasi pengetahuan yang didapat: Tool DM khusus domain Jawaban query cerdas dan pembuatan keputusan Integrasi dari pengetahuan yang didapat dengan pengetahuan yang ada Proteksi data … Keamanan Integritas Kerahasiaan

Historis Aktivitas Data Mining 1989 IJCAI Workshop 1991-1994 KDD Workshops 1995-1998 KDD Conferences 1998 ACM SIGKDD 1999- SIGKDD Conferences dan banyak lagi konferensi kecil / baru dari DM … PAKDD, PKDD SIAM-Data Mining, (IEEE) ICDM dsb.

Rujukan Yang Berguna untuk Data Mining “Standards” DM: Conferences: KDD, PKDD, PAKDD, ... Journals: Data Mining and Knowledge Discovery, CACM DM/DB: Conferences: ACM-SIGMOD/PODS, VLDB, ... Journals: ACM-TODS, J. ACM, IEEE-TKDE, JIIS, ... AI/ML: Conferences: Machine Learning, AAAI, IJCAI, ... Journals: Machine Learning, Artific. Intell., ...

Kesimpulan Data mining: penemuan pola menarik dari data set yang besar secara semi-otomatis Knowledge discovery adalah suatu proses: Preprocessing Data mining Postprocessing Untuk digali, digunakan atau dimanfaatkan … Databases (relasional, object-oriented, spasial, WWW, …) Pengetahuan (karakterisasi, pengumpulan, asosiasi, …) Teknik (mesin pembelajaran, statistik, visualisasi, …) Aplikasi (retail, telecom, Web mining, analisa log, …)