DATA MINING 1.

Slides:



Advertisements
Presentasi serupa
Analisis Outlier.
Advertisements

STATISTIKA DAN PELUANG
Peran Utama Data Mining
DESKRIPSI DATA Pertemuan 9 1. Pendahuluan : Sering digunakan peneliti, khususnya dalam memperhatikan perilaku data dan penentuan dugaan-dugaan yang selanjutnya.
Market Basket Analysis
Pengenalan Datawarehouse
Pertemuan XIV FUNGSI MAYOR Assosiation. What Is Association Mining? Association rule mining: –Finding frequent patterns, associations, correlations, or.
Market Basket Analysis - #3
Pertemuan XII FUNGSI MAYOR Classification.
Pengenalan Datawarehouse
Pertemuan X DATA MINING

Clustering. Definition Clustering is “the process of organizing objects into groups whose members are similar in some way”. A cluster is therefore a collection.
Denny Agustiawan JURUSAN TEKNIK INFORMATIKA STMIK ASIA MALANG
1. Statistika dan Statistik
Review Statistik (pertemuan 7). Konsep Tendensi Pusat Ukuran tendensi pusat adalah sembarang ukuran yang menunjukkan pusat segugus data, yang telah.
Tahapan dan Pengelompokan Data Mining
A rsitektur dan M odel D ata M ining. Arsitektur Data Mining.
MENGHITUNG STATISTIKA DESKRIPTIF
NOTASI PENJUMLAHAN ()
ALGORITMA A PRIORI Wahyu Nurjaya WK, S.T., M.Kom.
Datamining - Suprayogi
Peran Utama Data Mining
Data Mining.
UKURAN GEJALA PUSAT DAN UKURAN LETAK
Assocation Rule Data Mining.
Harga Deviasi (Ukuran Penyebaran).
BAB 3 UKURAN PEMUSATAN.
(UKURAN PEMUSATAN DAN UKURAN PENYEBARAN)
METODE PENELITIAN KUANTITATIF (13) FIKOM UNIVERSITAS BUDILUHUR.
Konsep Data Mining Ana Kurniawati.
(UKURAN PEMUSATAN DAN UKURAN PENYEBARAN)
Clustering Best Practice
TENDENSI PUSAT Pertemuan ke-3.
Statistika Pertemuan ke – 8 dan ke – 9.
Analisa
STATISTIK1 Pertemuan 3: Ukuran Pemusatan dan Penyebaran
EKSTRAKURIKULER : DATA ANALYSIS
UKURAN SIMPANGAN, DISPERSI & VARIASI
.: ALGORITMA APRIORI :. DSS - Wiji Setiyaningsih, M.Kom
Analisis Data Statistik Deskriptif
STATISTIKA DESKRIPTIF
? 1. Konsep Statistika STATISTIKA : Kegiatan untuk : mengumpulkan data
BAB 4 UKURAN PENYEBARAN.
Aplikasi Komputer & Pengolahan Data UKURAN TENDENSI SENTRAL
STATISTIKA OLEH : DHANU NUGROHO SUSANTO.
NURRATRI KURNIA SARI, M.Pd
Analisis Data Statistik Deskriptif
STATISTIKA Pertemuan 3: Ukuran Pemusatan dan Penyebaran
STATISTIKA Pertemuan 3: Ukuran Pemusatan dan Penyebaran
(UKURAN PEMUSATAN DAN UKURAN PENYEBARAN)
PENGANTAR BIOSTATISTIK
Analisis Klastering K-Means Model Datamining Kelompok 1 Eko Suryana
(UKURAN PEMUSATAN DAN UKURAN PENYEBARAN)
STATISTIKA DESKRIPTIF
Ukuran Pemusatan dan Ukuran Penyebaran
Statistika Deksriptif
ANALISIS ASOSIASI APRIORI.
ANALISIS CLUSTER Part 1.
Pembelajaran tak-terbimbing dan klustering
Konsep Aplikasi Data Mining
MODUL 10 APRIORI.
SAMPLING DAN PENGANTAR STATISTIKA
Pertemuan 1 & 2 Pengantar Data Mining 12/6/2018.
Konsep Data Mining Ana Kurniawati.
ASSOCIATION RULE DAN PENERAPANNYA
DESKRIPSI DATA Pertemuan 3.
DECISION SUPPORT SYSTEM [MKB3493]
PEMUSATAN DAN LETAK DATA
STATISTIKA DESKRIPTIF Tendensi Sentral & Ukuran Dispersi KELOMPOK 2.
Transcript presentasi:

DATA MINING 1

Data Mining adalah usaha penemuan pengetahuan di intelejensia buatan (bidang machine learning) atau analisis statistik dengan mencari atau menemukan aturan-aturan, pola-pola dan struktur dari himpunan data yang besar.

Fungsi Data Mining 1. Fungsi Minor atau fungsi tambahan * Deskription (deskripsi) * Estimation (estimasi) * Prediction (prediksi) 2. Fungsi Mayor atau fungsi utama * Classification (klasifikasi) * Clustering (pengelompokan) * Association (asosiasi)

Desciption Deskripsi Grafis * Diagram Titik * Histogram Deskripsi Lokasi * Rata-rata * Median * Modus * Kuartil, Desil dan Persentil Deskripsi Keberagaman Range (rentang Varians dan Standar Deviasi

Estimation Rata-rata sampel sebagai estimasi rata-rata populasi Varians sampel sebagai estimasi varians populasi Standar Deviasi sampel sebagai standar deviasi populasi

Prediction Regresi Linier Sederhana Regresi Linier Berganda

Classification Dalam klasifikasi, terdapat target variabel kategori, misal penggolongan pendapatan dapat dipisahkan dalam beberapa kategori. Beberapa algoritma klasifikasi diantaranya adalah Mean Vector, K-Nearest Neighbour, C.45, dan Bayessian.

Data Historis Data historis disebut juga data latihan atau data pengalaman, karena dari data tersebut akan didapat latihan untuk mendapatkan pengetahuan. Data historis juga disebut data lampau yang merupakan data pengalaman bagi user. Algoritma klasifikasi akan menggunakan data latihan untuk pengetahuan yang hendak dihasilkan dalam klasifikasi data mining. Data terdiri atas dua jenis, yaitu predictor variable/pemrediksi dan target variable/tujuan.

Algoritma Klasfikasi, CART (Classification and Regression Tres) Langkah-langkah Algoritma CART: Susunlah calon cabang (candidate split) yang dilakukan terhadap seluruh variabel prediktor. Daftar yang berisi calon cabang disebut calon cabang mutakhir. Berikan penilaian keseluruhan calon cabang mutakhir dengan menghitung besaran (s|t) Tentukan cabang yang memiliki kesesuaian (s|t). Setelah noktah kepuusan tidak ada lagi, algoritma CART dihentikan.

Kesesuaian(goodness) (s|t) dari calon cabang s pada noktah keputusan t tL = cabang kiri dari noktah keputusan t tR = calon cabang kanan dari noktah keputusan t

Clustering Pengklusteran merupakan pengelompokan record, pengamatan, atau memperhatikan dan membentuk kelas objek-objek yang memiliki kemiripan. Beberapa algoritma pengelompokkan diantaranya adalah EM dan Fuzzy C-Means

Algoritma Pengelompokan K-Means Langkah-langkah algoritma K-Means: Tentukan berapa kelompok yang akan dibuat sebanyak k kelompok. Secara sembarang pilih k buah catatan yang ada sebagai pusat-pusat keompok awal. Setiap catatan akan ditentukan pusat kelompok terdekatnya. Perbarui pusat-pusat kelompok. Pusat kelompok yang terdekat pada setiap catatan akan ditentukan, dan seterusnya sampai nilai rasio tidak membesar lagi.

Rumus Jarak dua titik: Between Cluster Variation (BCV): BCV=d(m1,m2)+d(m1,3)+d(m2,m3) Dalam hal ini, d(mi,j) menyatakan jarak mi ke mj Within Cluster Variation (WCV): WCV=(jarak pusat tiap cluster yang paling minimum)2

Assosiation Tugas asosiasi data mining adalah menemukan atribut yang muncul dalam satu waktu.

Algoritma Asosiasi MBA (Market Basket Analysis) Langkah-langkah algoritma MBA: Tetapkan besaran  dari konsep itemset sering, nilai minimum besaran support dan besaran confidence yang diinginkan. Menetapkan semua itemset sering, yaitu itemset yang memiliki frekuensi itemset minimal sebesar bilangan  sebelumnya. Dari semua itemset sering, hasilkan aturan asosiasi yang memenuhi nilai minimum support dan confidence

Support (AB) = P(AB) Confidence(AB) = P(B|A)