Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Langkah Pasti Menuju Sukses Data Mining D icky N ofriansyah, S.Kom., M.Kom Materi : C lustering H ierarki A lgoritmatif.

Presentasi serupa


Presentasi berjudul: "Langkah Pasti Menuju Sukses Data Mining D icky N ofriansyah, S.Kom., M.Kom Materi : C lustering H ierarki A lgoritmatif."— Transcript presentasi:

1 Langkah Pasti Menuju Sukses Data Mining D icky N ofriansyah, S.Kom., M.Kom Materi : C lustering H ierarki A lgoritmatif

2 Langkah Pasti Menuju Sukses Metode-Metode Terkait Pengelompokan Hierarki Aglomeratif Kunci operasi metode AHC (Algoritma Hierarki Cluster) adalah penggunaan ukuran kedekatan (proximity) diantara dua kelompok” (Hartini dalam Prasetyo, 2012 : 214). Ada tiga tehnik kedekatan yang dijelaskan disini: Single Linkage Complete Linkage Average Linkage

3 Jarak Terdekat atauTautan tunggal memberikan hasil bila kelompok-kelompok digabungkan menurut jarak antara anggota-anggota yang terdekat diantara dua kelompok. Single Linkage Jarak Terjauh atau Tautan lengkap terjadi bila kelompok-kelompok digabungkan menurut jarak antara anggota-anggota yang terjauh di antara dua kelompok. Complete Linkage Jarak Rata-rata atau Tautan rata-rata digabungkan menurut jarak rata-rata pasangan- pasangan anggota masing-masing pada himpunan di antara dua kelompok Average Linkage

4 Langkah Pasti Menuju Sukses Tehnik Pengukuran Jarak Ada beberapa macam ukuran jarak yang biasa dipakai dalam analisis cluster, diantaranya : Eucladian DistanceManhattanPearson

5 Langkah Pasti Menuju Sukses 1. Pembentukan kelompok tergantung apakah jarak dari objek kekelompok pertama lebih dekat dibandingkan dengan jarak objek tersebut dengan objek lainnya yang belum terkelompok Keterangan Rumus : X= Rata-rata data X Xi= Data X ke-i N = Banyak data X Std (X) = Standar deviasi data X Zi= Data standar (skor standar) X ke-i

6 Langkah Pasti Menuju Sukses 2. Menentukan ukuran kemiripan atau ketidakmiripan antar data dengan metode jarak Euclidean n d AB = ∑ | x 1 - y 1 | 2 i = 1 Keterangan Rumus : dAB = Ukuran kemiripan / ketidakmiripan antara objek ke-x dengan objek ke-y.

7 Langkah Pasti Menuju Sukses Analisis cluster termasuk dalam analisis multivariat yang mewakili seluruh hubungan interdependensi, tidak ada perbedaan variabel bebas dan variabel tidak bebas (independent and dependent variables) dalam analisis ini. Analisis cluster adalah teknik yang digunakan untuk mengidentifikasi objek atau individu yang serupa dengan memperhatikan beberapa kriteria.

8 Langkah Pasti Menuju Sukses NoLaguWaktu Putar Negara Asal Genre Musik 1Timmy Thomas - You Are All I Need BaratPop 2 Lighthouse Family - Ain't No Sunshine BaratAudioPhille 3 Cake - I Will Survive BaratPop Mix 4 Anggun - Still Reminds Me IndonesiaPop 5 Aloe Blacc - Hello World BaratPop 6 One Direction – Story of My Life BaratPop Mix 7 Rihanna - Diamonds BaratR & B 8 Hayley Westenra - Prayer BaratAudioPhille 9 Feel Fascinated - Peng You ChineseMandarin 10 Lisa Ono - I Feel Good BaratJazz 11 James Morrison – I Won't Let You Go BaratPop 12 Nidji - Laskar Pelangi IndonesiaPop 13 Jason Mraz - Im Yours BaratPop 14 Titi DJ - Tak Kan Ada Cinta Yang Lain IndonesiaPop 15 The Beatles - Dont Let Me Down BaratPop 16 Diana Krall - All Night Long BaratAudioPhille 17 Cymande - Brother On The Side BaratJazz 18 Maliq&D'essentials - Terdiam IndonesiaPop 19 Norah Jones - Don't Know Why BaratAudioPhille 20Citra Shcolastika IndonesiaJazz

9 Langkah Pasti Menuju Sukses M aka berdasarkan data music playlist diatas terlebih dahulu dikelompokkan sesuai set objek dan variabelnya beserta asumsi nilai yang dipergunakan seperti pada tabel-tabel berikut DataKategori LaguObjek Waktu PutarVariabel 1 (x1) Negara AsalVariabel 2 (x2) Genre MusikVariabel 3 (x3) Tabel Set Objek Dan Variabel

10 NoObjekAsumsi 1Timmy Thomas - You Are All I NeedA 2 Lighthouse Family - Ain't No Sunshine B 3 Cake - I Will Survive C 4 Anggun - Still Reminds Me D 5 Aloe Blacc - Hello World E 6 One Direction – Story of My Life F 7 Rihanna - Diamonds G 8 Hayley Westenra - Prayer H 9 Feel Fascinated - Peng You I 10 Lisa Ono - I Feel Good J 11 James Morrison – I Won't Let You Go K 13 Jason Mraz - Im Yours M 14 Titi DJ - Tak Kan Ada Cinta Yang Lain N 15 The Beatles - Dont Let Me Down O 16 Diana Krall - All Night Long P 17 Cymande - Brother On The Side Q 18 Maliq&D'essentials - Terdiam R 19 Norah Jones - Don't Know Why S 20 Citra Scholastika T Tabel Asumsi Objek

11 Langkah Pasti Menuju Sukses X1Nilai Pagi ( ) 1 Siang ( ) 2 Sore ( ) 3 Malam ( ) 4 Tabel Asumsi Waktu Putar Tabel Asumsi Negara Asal X2Nilai Barat1 Indonesia2 Chinese3

12 Langkah Pasti Menuju Sukses Genre Musik (V3)Nilai Pop6 AudioPhille5 Pop Mix4 R & B3 Jazz2 Mandarin1 Tabel Asumsi Genre Musik Dalam tabel-tabel diatas dapat dilihat bahwa objek atau lagu dimisalkan dengan huruf (A, B, C, D dan seterusnya) dan variabel dimisalkan dengan kode (x1, x2 dan x3) begitu juga dengan nilai asumsi adalah sebagai perumpamaan, agar mempermudah perhitungan

13 Langkah Pasti Menuju Sukses Setelah pengelompokkan objek dan variabel nilai, maka langkah selanjutnya adalah melakukan perhitungan sesuai algoritma yang dipilih. Namun untuk menghindari terjadinya kesalahan, terlebih dahulu beberapa tabel asumsi diatas digabungkan menjadi satu tabel yang lebih terperinci seperti berikut ini

14 Tabel Asumsi Data dan Variabelnya No ObjekX1X2X3 1A116 2B115 3C114 4D126 5E116 6F114 7G213 8H215 9I231 10J212 11K316 12L326 13M316 14N326 15O416 16P415 17Q412 18R426 19S415 20T412

15 Langkah Pasti Menuju Sukses Algoritma Single Linkage Method Dengan Jarak Euclidean Distance 1. Menstandarisasi data-data yang terkumpul dalam tabel menggunakan rumus-rumus yang telah tersedia : a. Mencari rata-rata data dari setiap variabel

16 b. Mencari standar deviasi data dari setiap variabel

17 Langkah Pasti Menuju Sukses

18 Langkah Pasti Menuju Sukses c. Mencari skor standar (zero standar) dari masing-masing objek setiap variabel.

19 ObjekX1X2X3 A -1,214-0,5090,824 B -1,214-0,5090,236 C -1,214-0,509-0,353 D -1,2141,1880,824 E -1,214-0,5090,824 F -1,214-0,509-0,353 G -0,405-0,509-0,942 H -0,405-0,5090,236 I -0,4052,884-2,120 J 0,4051,188-1,531 K 0,405-0,5090,824 L 0,4051,1880,824 M 0,405-0,5090,824 N 0,4051,1880,824 O 1,214-0,5090,824 P 1,214-0,5090,236 Q 1,214-0,509-1,531 R 1,2141,1880,824 S 1,214-0,5090,236 Tabel Data Music Playlist Standar

20 Langkah Pasti Menuju Sukses 2.Menentukan ukuran kemiripan atau ketidakmiripan antara data dengan jarak Euclidean distance.

21

22 Langkah Pasti Menuju Sukses 3.Melakukan algoritma pengelompokkan euclidean single linkage clustering, dengan langkah-langkah sebagai berikut : a.Mencari nilai terkecil dari matriks jarak. ACEFKLMNPQST mempunyai nilai terkecil yakni 0, maka objek ini menjadi satu cluster. b. Menghitung jarak antar cluster ACEFKLMNPQST dengan objek lainnya.

23 Langkah Pasti Menuju Sukses d(ACEFKLMNPQST)B= min {dAB,dCB,dEB,dFB,dKB,dLB,dMB, dNB,dPB,dQB,dSB,dTB}= dAB,dCB,dEB,dFB = 0,589 d(ACEFKLMNPQST)D= min {dAD,dCD,dED,dFD,dKD,dLD,dMD, dND,dPD,dQD,dSD,dTD}= dLD,dND= 1,619 d(ACEFKLMNPQST)G = min {dAG,dCG,dEG,dFG,dKG,dLG,dMG, dNG,dPG,dQG,dSG,dTG}= dCG,dFG= 1,001 d(ACEFKLMNPQST)H = min {dAH,dCH,dEH,dFH,dKH,dLH,dMH, dNH,dPH,dQH,dSH,dTH} = dAH,dCH,dEH,dFH,dKH,dMH = 1,001 d(ACEFKLMNPQST)I = min {dAI,dCI,dEI,dFI,dKI,dLI,dMI,dNI, dPI,dQI,dSI,dTI} = dLI,dNI= 3,493

24 Langkah Pasti Menuju Sukses d(ACEFKLMNPQST)J= min{dAJ,dCJ,dEJ,dFJ,dKJ,dLJ,dMJ,dNJ, dPJ,dQJ,dSJ,dTJ} = dQJ, dTJ= 1,880 d(ACEFKLMNPQST)O= min{dAO,dCO,dEO,dFO,dKO,dLO,dMO, dNO,dPO,dQO,dSO,dTO} = dPO,dSO= 0,589 d(ACEFKLMNPQST)R= min {dAR,dCR,dER,dFR,dKR,dLR,dMR, dNR,dPR,dQR,dSR,dTR} = dLR,dNR= 0,809

25 Setelah melakukan perhitungan diatas, maka terbentuk matriks jarak yang baru yang menjadi sebuah cluster antara ACEFKLMNPQST pada table di bawah, yaitu cluster 1. ACEFK LMNP QST BDGHIJOR 00,5891,6191,001 3,4931,8800,5890,809 B0,58901,7661,5751,0464,2122,9892,5113,013 D1,6191,76602,6442,0533,5412,9312,9552,441 G1,0011,5752,64401,1783,5331,8992,2512,800 H1,0011,0462,0531,17804,0802,5261,5142,251 I3,4934,2123,5413,5334,08001,8994,6593,659 J1,8802,9892,9311,8992,5261,89902,9682,456 O0,5892,5112,9552,2511,5144,6592,96801,665 R0,8093,0132,4412,8002,2513,6592,4561,6650 Tabel Cluster 1

26 c. Mencari nilai terkecil dari matriks jarak, objek ACEFKLMNPQST dan BO yang memiliki nilai terkecil yaitu 0,589. Maka ACEFKLMNPQST dan BO bergabung menjadi satu cluster baru. d(ACEFKLMNPQST-BO)D = min{dACEFKLMNPQST-D, dBD, dOD} = dACEFKLMNPQST-D= 1,619 d(ACEFKLMNPQST-BO)G= min{dACEFKLMNPQST-G, dBG, dOG} = dACEFKLMNPQST-G= 1,001 d(ACEFKLMNPQST-BO)H= min{dACEFKLMNPQST-H, dBH, dOH} = dACEFKLMNPQST-H= 1,001 d(ACEFKLMNPQST-BO)I= min {dACEFKLMNPQST - I, dBI, dOI} = dACEFKLMNPQST-I= 3,493 d(ACEFKLMNPQST-BO)J= min { dACEFKLMNPQST - J, dBJ, dOJ} = dACEFKLMNPQST-J= 1,880 d(ACEFKLMNPQST-BO)R= min{dACEFKLMNPQST-R, dBR, dOR} = dACEFKLMNPQST-R= 0,809

27 Langkah Pasti Menuju Sukses Setelah pengelompokkan tersebut maka terbentuk matriks jarak baru yang menjadi sebuah cluster antara ACEFKLMNPQST dan BO seperti pada table di bawah yaitu cluster 2. ACEFKLMNPQSTBO DGHIJR 01,6191,001 3,4931,8800,809 D1,61902,6442,0533,5412,9312,441 G1,0012,64401,1783,5331,8992,800 H1,0012,0531,17804,0802,5262,251 I3,4933,5413,5334,08001,8993,659 J1,8802,9311,8992,5261,89902,456 R0,8092,4412,8002,2513,6592,4560 Tabel Cluster 2

28 d. S etelah itu kembali lagi mencari nilai terkecil dari matriks jarak, untuk objek ACEFKLMNPQSTBO dan R yang memiliki nilai terkecil yaitu 0,809. Maka objek ACEFKLMNPQSTBO dan R akan bergabung menjadi satu cluster d(ACEFKLMNPQSTBO - R)D=min {dACEFKLMNPQSTBO-D,dRD} = dACEFKLMNPQSTBO-D= 1,619 d(ACEFKLMNPQSTBO - R)G=min {dACEFKLMNPQSTBO-G,dRG} = dACEFKLMNPQSTBO-G= 1,001 d(ACEFKLMNPQSTBO - R)H=min {dACEFKLMNPQSTBO-H,dRH} = dACEFKLMNPQSTBO-H= 1,001 d(ACEFKLMNPQSTBO - R)I= min {dACEFKLMNPQSTBO-I, dRI} = dACEFKLMNPQSTBO-I= 3,493 d(ACEFKLMNPQSTBO - R)J= min {dACEFKLMNPQSTBO-J, dRJ} = dACEFKLMNPQSTBO-J= 1,880

29 Langkah Pasti Menuju Sukses ACEFKLMNPQST BORGHDJI 01,899 I 0 Cluster Akhir

30 Langkah Pasti Menuju Sukses Berdasarkan tabel matriks jarak diatas, dari pengelompokan euclidean distance yang dilakukan telah sesuai dengan langkah-langkah dalam pengelompokkan tehnik tersebut. Sebab, telah tersisa 2 objek dalam satu cluster, yakni ACEFKLMNPQSTBORGHDJ dan I

31 Langkah Pasti Menuju Sukses S EKIAN DAN TERIMA K ASIH


Download ppt "Langkah Pasti Menuju Sukses Data Mining D icky N ofriansyah, S.Kom., M.Kom Materi : C lustering H ierarki A lgoritmatif."

Presentasi serupa


Iklan oleh Google