Mesin Pembelajaran Achmad Basuki PENS – ITS 2006.

Slides:



Advertisements
Presentasi serupa
Pencarian Rekaman pada Berkas
Advertisements

ARRAY 1 DIMENSI Array 1 dimensi
Distribusi Binomial.
Pohon Keputusan (Decision Tree)
DASAR PEMROGRAMAN (VTI 301)
Machine Learning Team PENS – ITS 2006
Moch. Rif'an.,ST.,MT Logika Kombinasional. Proses DigitalEncoder Saluran Transmisi Sistem Digital.
BENTUK NORMAL CHOMKY.
Uji Chi-square dan Korelasi peringkat Spearman
Mulai Baca x x>x; if(x
Array Dimensi Banyak Gerlan A. Manu, ST.,MKom
STRUKTUR DATA.
Formula dan Fungsi Microsoft Excel.
Paket Program Aplikasi
ADMINISTRASI DAN INVENTARISASI BARANG DAN ALAT LABORATORIUM IPA
Perceptron.
Bab 3. Penyelesaian Sistem Persamaan Linier (SPL)
ARRAY (LARIK)
Metode Eliminasi Gauss Jordan
Case.
Algoritma Genetik (lanjutan)
Mentari Puji Lestari TI 2B D3
Queue.
Bab 2 – b PERINTAH 2 B Percabangan. PERCABANGAN Tidak setiap baris program akan dikerjakan Hanya yang memenuhi syarat (kondisi) Syarat terdiri dari operand-operand,
ARRAY 2 DIMENSI #12 STIKOM Searching Pengantar Inisialisasi Matrik
LARIK ( ARRAY ).
Array dan String.
SUBROUTINE SUBROUTINE program bagian : suatu bagian dari program yang didefinisikan secara terpisah dari program utama (umumnya diletakkan di bagian bawah.
By Adnan Purwanto, S.Kom.  Langkah-langkah yang kita lakukan dalam memberikan instruksi kepada komputer untuk memecahkan masalah  Manusia harus menggunakan.
BAB X BENTUK NORMAL CHOMSKY.
CHORD KNOWLEDGE BASE DEVELOPMENT
Support Vector Machine (SVM)
1 PELATIHAN IMPLEMENTASI KURIKULUM KURIKULUM 2013 KEMENTERIAN PENDIDIKAN DAN KEBUDAYAAN.
Distribusi Binomial. 2 Pendahuluan Diantara sekian banyak distribusi barangkali distribusi normal merupakan distribusi yang secara luas banyak digunakan.
SISTEM CERDAS Jaringan Syaraf Tiruan
C 6 H 5 NH 2.
Data Mining Algoritma C4.5. Penjelasan metode Kelebihan dan kekurangan.
Structure English dan Decision Table
Decision Tree.
ALGORITMA PEMROGRAMAN LANJUTAN
Presented by Team Basis Data
Algoritma C4.5. Algoritma C4.5 Object-Oriented Programming Introduction Algoritma C4.5 merupakan algoritma yang digunakan.
Pertemuan 4 PROGRAMMING LANGUAGE.
Probabilitas & Diagram Pohon Keputusan
Pengurutan (Sorting).
Klasifikasi Berdasarkan Teorema Bayes
Materi ini dapat diunduh di LOGIKA MATEMATIKA By GISOESILO ABUDI Materi ini dapat diunduh di
Rahmat Deddy Rianto Dako, ST, M.Eng
PROBABILITAS dan DISTRIBUSI
ARRAY.
Array Buat algoritma untuk mencari nilai terbesar dari 5 nilai mahasiswa yang diinputkan dengan array.
MULTIDIMENSI ARRAY Struktur Data
Matematika Pascal Nilai dari 40 siswa Identifier Nilai memuat 40 data
Langkah – Langkah Metode Ilmiah :
Sorting (Pengurutan).
PRODI MIK | FAKULTAS ILMU-ILMU KESEHATAN
Langkah – Langkah Metode Ilmiah :
Lossless Join Decomposition
M-File Sebagai Fungsi.
PHP dan MySql query Pertemuan
Pengenalan Pola secara Neural (PPNeur)
Data Mining DATA SET. Set Data Ada bermacam –macam cara untuk merepresentasikan data, Misalnya, atribut yang digunakan untuk menggambarkan jenis objek.
ARRAY 2d (matriks) MERISKA DEFRIANI, S.KOMP
Langkah – Langkah Metode Ilmiah :
Kuliah ke-4 Program Studi Ekstensi DTE FTUI Slides©2008
Selection Sort Merupakan sebuah algoritma pengurutan yang mencari element terkecil dari suatu list data tidak terurut (unsorted list) kemudian menukarnya.
Arsitektur jaringan Hebb Jaringan syaraf tiruan
SEARCHING Universitas Dian Nuswantoro Semarang 12/7/2018.
Sorting (Pengurutan).
Simple Networks Jaringan Sederhana Machine Learning Team PENS - ITS 2006 Modification By Agus SBN.
Transcript presentasi:

Mesin Pembelajaran Achmad Basuki PENS – ITS 2006

Ide Mesin Pembelajaran #CuacaTemperaturKecepatan AnginBerolah-raga 1CerahNormalPelanYa 2CerahNormalPelanYa 3HujanTinggiPelanTidak 4CerahNormalKencangYa 5HujanTinggiKencangTidak 6CerahNormalPelanYa Fakta harian dalam 6 hari dan keputusan untuk berolah-raga sebagai berikut: (1)Ketika cuaca cerah, apakah akan berolah-raga? (2)Ketika cuaca cerah dan temperatur normal, apakah akan berolah-raga? Penyajian keputusan berdasarkan fakta inilah yang mengilhami konsep dari mesin pembelajaran

Data Training •Attribut adalah kolom data, ada atribut dan target •Instance adalah isi dari attribut sebagai contoh attribut cuaca mempunyai instance “cerah” dan “hujan”, sering ditulis dengan cuaca={cerah,hujan} •Record/tuple adalah baris data DayCuacaTemperaturKecepatan AnginBerolah-raga D1CerahNormalPelanYa D2CerahNormalPelanYa D3HujanTinggiPelanTidak D4CerahNormalKencangYa D5HujanTinggiKencangTidak D6CerahNormalPelanYa Key Attribut Target

Pengisian Data Dalam Matlab DayCuacaTemperaturKecepatan AnginBerolah-raga D1CerahNormalPelanYa D2CerahNormalPelanYa D3HujanTinggiPelanTidak D4CerahNormalKencangYa D5HujanTinggiKencangTidak D6CerahNormalPelanYa dtTraining(1,:) = {‘D1’, ’cerah’, ’normal’, ‘pelan’, ‘ya’} dtTraining(2,:) = {‘D2’, ’cerah’, ’normal’, ‘pelan’, ‘ya’} dtTraining(3,:) = {‘D3’, ’hujan’, ’tinggi’, ‘pelan’, ‘ya’} dtTraining(4,:) = {‘D4’, ’cerah’, ’normal’, ‘kencang’, ‘ya’} dtTraining(5,:) = {‘D5’, ’hujan’, ’tinggi’, ‘kencang’, ‘tidak’} dtTraining(6,:) = {‘D6’, ’cerah’, ’normal’, ‘pelan’, ‘ya’}

Menyimpan dan Memanggil Data •Untuk menyimpan data training yang sudah dibuat: •Untuk memanggil data training yang sudah disimpan: save dataTraining dtTraining nama filenama variabel yang disimpan load dataTraining nama file

Mengambil Ukuran data Setiap data di dalam MATLAB dinyatakan sebagai matrik, sehingga dapat diambil ukuran data yang berupa jumlah baris data dan jumlah kolom (attribut). nData=size(dtTraining,1); nAttribut=size(dtTraining,2); nData adalah jumlah data (baris) nAttribut adalah jumlah attribut (kolom)

Membaca Instance Keputusan % Instance pertama diambil dari data pertama nInstance=1; instance{1}=dtTraining{1,nAttribut}; % Membaca semua baris data for i=2:nData % Cek apa instance data ke I adalah instance baru sw=0; for k=1:nInstance if strcmp(dtTraining{i,nAttribut},instance{k})==1 sw=1; end % Jika instance baru, maka tambahkan data instance if(sw==0) nInstance=nInstance+1; instance(nInstance)=dtTraining(i,nAttribut); end

Data Konsisten #CuacaTemperaturKecepatan AnginBerolah-raga 1CerahNormalPelanYa 2CerahTinggiPelanYa 4HujanNormalKencangYa 6CerahNormalPelanYa Tidak satupun attibut yang mempunyai nilai yang sama dalam satu keputusan (berolah-raga), maka data ini adalah data yang tidak konsisten. #CuacaTemperaturKecepatan AnginBerolah-raga 3HujanTinggiPelanTidak 5HujanTinggiKencangTidak Attribut cuaca dan temperatur mempunyai nilai yang sama dalam satu keputusan (berolah-raga), maka data ini adalah data yang konsisten.

Data Bias #CuacaTemperaturKecepatan AnginBerolah-raga 1CerahNormalPelanYa 2CerahNormalPelanYa 3HujanNormalPelanYa 4CerahNormalPelanTidak Perhatikan data ke 4, data ini mempunyai keputusan yang berbeda dengan data 1 dan data 2, tetapi instance pada semua attributnya sama, sehingga data ini disebut dengan data bias.

Hipotesa Hipotesa dituliskan dengan: H(attribut 1, attribut 2, …, attribut n ) = keputusan H(cuaca=cerah, temperatur=normal, kec.angin=pelan) = ya Hipotesa ini menunjukkan bahwa keputusan untuk berolahraga bila cuaca=cerah, temperatur=normal dan kec.angin=pelan, untuk singkatnya dituliskan hanya instance pada setiap attibut dengan H(cerah,normal,pelan)=ya H(cuaca=cerah, kec.angin=pelan) = ya Hipotesa ini menunjukkan bahwa keputusan untuk berolahraga bila cuaca=cerah, dan kec.angin=pelan, untuk singkatnya dituliskan hanya instance pada setiap attibut dengan H(cerah,*,pelan)=ya H(cuaca=cerah) = ya Hipotesa ini menunjukkan bahwa keputusan untuk berolahraga bila cuaca=cerah, untuk singkatnya dituliskan hanya instance pada setiap attibut dengan H(cerah,*,*)=ya

Penulisan Hipotesa Dalam Matlab Penulisan untuk hipotesa H(cerah, normal, pelan)=ya dalam MATLAB adalah: H(1,:) = {‘cerah’, ‘normal’, ‘pelan’ } Penulisan ini menggunakan format cell-array dengan array 1 baris dan 3 kolom (sesuai jumlah attribut yang dimasukkan). Nilai 1 berarti keputusan untuk YA. Untuk hipotesa dengan keputusan tidak seperti H(hujan)=tidak dituliskan dengan indeks 2 sebagai berikut: H(2,:) = {‘hujan’, ‘*’, ‘*’ }

Ide Mesin Pembelajaran Pada dasarnya semua algoritma yang dikembangkan dalam mesin pembelajaran adalah algoritma yang menghasilkan hipotesa dari suatu keputusan berdasarkan data pembelajaran yang diberikan.

Find-S •Find-S adalah suatu metode paling sederhana yang dapat digunakan untuk mendapatkan suatu hipotesa berdasarkan data. •Find-S mencari kesamaan nilai attribut untuk memperoleh suatu hipotesa •Kelemahan dari Find-S adalah data yang digunakan harus bersifat konsisten dan tidak bias ??? (Terlalu sulit untuk dapat memperoleh data semacam ini pada persoalan nyata)

(1) Langkah Find-S DayCuacaTemperaturKecepatan AnginBerolah-raga D1CerahNormalPelanYa D2CerahNormalPelanYa D3HujanTinggiPelanTidak D4CerahNormalKencangYa D5HujanTinggiKencangTidak D6CerahNormalPelanYa Untuk memperoleh hipotesa dengan Find-S dari data training di atas, langkah pertama yang harus dilakukan adalah memcah data berdasarkan keputusannya, sehingga akan diperoleh 2 data: pertama untuk keputusan=ya dan kedua untuk keputusan=tidak

(2) Langkah Find-S DayCuacaTemperaturKecepatan AnginBerolah-raga D1CerahNormalPelanYa D2CerahNormalPelanYa D4CerahNormalKencangYa D6CerahNormalPelanYa DayCuacaTemperaturKecepatan AnginBerolah-raga D3HujanTinggiPelanTidak D5HujanTinggiKencangTidak Dari hasil pemisahan tersebut, terlihat bahwa data training tersebut Konsisten dan tidak bias. Langkah berikutnya adalah membuat hipotesa untuk masing-masing keputusan. Pembuatan hipotesa ini dilakukan dengan mengambil data pertama sebagai hipotesa awal yang dianggap sebagai hipotesa spesifik, dan diteruskan hingga data terakhir dengan memperhatikan kesamaan sampai didapatkan hipotesa umum.

[3] Langkah Find-S Langkah ini digunakan untuk menentukan hipotesa dari keputusan=ya DayCuacaTemperaturKecepatan AnginBerolah-raga D1CerahNormalPelanYa D2CerahNormalPelanYa D4CerahNormalKencangYa D6CerahNormalPelanYa Hipotesa awal disamakan dengan data pertama: H(Cerah, Normal, Pelan) = Ya 1 Data kedua, tidak ada perubahan karena semua nilai instancenya sama: H(Cerah, Normal, Pelan) = Ya 2 Data ketiga, ada perubahan di attribut kec angin, sehingga : H(Cerah, Normal, *) = Ya 3 Data keenam, ada perubahan di attribut kec angin, sehingga : H(Cerah, Normal, *) = Ya 4

[4] Langkah Find-S Langkah ini digunakan untuk menentukan hipotesa dari keputusan=tidak Hipotesa awal disamakan dengan data pertama (D3): H(Hujan, Tinggi, Pelan) = Tidak 1 Data kelima, ada perubahan di kec.angin H(Cerah, Normal, *) = Tidak 2 DayCuacaTemperaturKecepatan AnginBerolah-raga D3HujanTinggiPelanTidak D5HujanTinggiKencangTidak

Hasil Find-S DayCuacaTemperaturKecepatan AnginBerolah-raga D1CerahNormalPelanYa D2CerahNormalPelanYa D3HujanTinggiPelanTidak D4CerahNormalKencangYa D5HujanTinggiKencangTidak D6CerahNormalPelanYa Hasil Find-S adalah: H(Cerah, Normal, *) = Ya H(Hujan, Tinggi, *) = Tidak

Contoh Keputusan Dari Hipotesa H(Cerah, Normal, *) = Ya H(Hujan, Tinggi, *) = Tidak HIPOTESA Bila cuaca cerah, apakah akan berolahraga? CEK JAWAB : YA

Proses Dilakukan Untuk Setiap Instance for n=1:nInstance % Menyeleksi data sesuai instance ke-I nh=0; for i=1:nData if strcmp(dtTraining{i,nAttribut},instance{n})==1 nh=nh+1; dataH(nh,:)=dtTraining(i,:); end % Proses Find-S untuk menentukan hipotesa % dari keputusan ke-I …………………………………………………… end

Proses Find-S % Hipotesa awal diambil dari data pertama dari data terseleksi hipotesis(n,:)=dataH(1,2:nAttribut-1); % Proses pembentukan hipotesa berdasarkan semua % data terseleksi for i=2:nh for j=2:nAttribut-1 % Penentuan apakah ada instance yang berbeda % pada attribut yang sama % Bila ada maka hipotesa dijadikan * % Proses ini hanya dilakukan untuk hipotesa bukan * if strcmp(hipotesis(n,j-1),'*')==0 if strcmp(hipotesis{n,j-1},dataH{i,j})==0 hipotesis{n,j-1}='*'; end

Algoritma Berikutnya BAGAIMANA BILA DATA TIDAK KONSISTEN DAN BIAS? METODE BAYES JARINGAN SYARAF TIRUAN ALGORITMA GENETIKA