Departemen Ilmu Komputer FMIPA IPB

Slides:



Advertisements
Presentasi serupa
Menggambarkan Data: Tabel Frekuensi, Distribusi Frekuensi, dan Presentasi Grafis Chapter 2.
Advertisements

INTRO (TO BPOS). What is BPOS? Apakah BPOS itu? •BPOS = (Microsoft) Business Productivity Online Suite (Service) •adalah sebuah layanan online Microsoft,
Developing Knowledge Management dalam perusahaan Week 10 – Pert 19 & 20 (Off Class Session)
Introduction Hany Ferdinando Dept. of Electrical Engineering Petra Christian University.
INTRO TO BPOS ( Coffey’s Project Portal). What is BPOS? Apakah BPOS itu? •BPOS = (Microsoft) Business Productivity Online Suite (Service) •adalah sebuah.
Pengujian Hipotesis untuk Satu dan Dua Varians Populasi
This document is for informational purposes only. MICROSOFT MAKES NO WARRANTIES, EXPRESS OR IMPLIED, IN THIS DOCUMENT. © 2006 Microsoft Corporation. All.
Algoritma & Pemrograman #10
Mata Kuliah : ALGORITMA dan STRUKTUR DATA 1.
PEMOGRAMAN BERBASIS JARINGAN
Hypertext & Hypermedia
Program Keahlian I – SI By Antonius Rachmat C, S.Kom
Peta Kontrol (Untuk Data Variabel)
Chapter Nine The Conditional.
 N YU Stern Finance Professor, Edward Altman, developed the Altman Z-score formula in In 2012, he released an updated version called the Altman.
PERULANGANPERULANGAN. 2 Flow of Control Flow of Control refers to the order that the computer processes the statements in a program. –Sequentially; baris.
Slide 3-1 Elmasri and Navathe, Fundamentals of Database Systems, Fourth Edition Revised by IB & SAM, Fasilkom UI, 2005 Exercises Apa saja komponen utama.
Estimasi Prob. Density Function dengan EM Sumber: -Forsyth & Ponce Chap. 7 -Standford Vision & Modeling Sumber: -Forsyth & Ponce Chap. 7 -Standford Vision.
Review IS & Software System Concept Diah Priharsari PTIIK – Universitas Brawijaya Source: 1.Obrien & Marakas, Management Information.
Introduction to The Design & Analysis of Algorithms
Artificial Intelligence
PROSES PADA WINDOWS Pratikum SO. Introduksi Proses 1.Program yang sedang dalam keadaan dieksekusi. 2.Unit kerja terkecil yang secara individu memiliki.
KIMIA ORGANIK II ELFI SUSANTI VH.
Review Operasi Matriks
Jeff Howbert Introduction to Machine Learning Winter Classification Nearest Neighbor.
Understanding The nature of PBI Courses Nury S, MA Presented at UAD workshop August 10 –
Internal dan Eksternal Sorting
Pengantar/pengenalan (Introduction)
Could not load an object because it is not avaliable on this machine. Tidak dapat memuat sebuah benda karena tidak tersedia pada mesin ini.
Interface Nur Hayatin, S.ST Jurusan Teknik Informatika Universitas Muhammadiyah Malang Sem Genap 2010.
Bilqis1 Pertemuan bilqis2 Sequences and Summations Deret (urutan) dan Penjumlahan.
PROGRAM AND MATERIALS DEVELOPMENT in ODL. How to design and develop the ODL programs and courses? Use systematic and systemic design know well the students.
JAVA CLASS Bahasa Pemrogramam BAHASA PEMROGRAMAN PERTEMUAN #9.
Collabnet Overview v Informatika Introduction.
Risk Management.
Implementing an REA Model in a Relational Database
Pendugaan Parameter part 2
MEMORY Bhakti Yudho Suprapto,MT. berfungsi untuk memuat program dan juga sebagai tempat untuk menampung hasil proses bersifat volatile yang berarti bahwa.
3 nd Meeting Chemical Analysis Steps and issues STEPS IN CHEMICAL ANALYSIS 1. Sampling 2. Preparation 3. Testing/Measurement 4. Data analysis 2. Error.
Basisdata Pertanian. After completing this lesson, you should be able to do the following Identify the available group functions Describe the use of group.
1 Magister Teknik Perencanaan Universitas Tarumanagara General View On Graduate Program Urban & Real Estate Development (February 2009) Dr.-Ing. Jo Santoso.
2nd MEETING Assignment 4A “Exploring Grids” Assignment 4 B “Redesign Grids” Create several alternatives grid sysytem using the provided elements: (min.
Project 4: Influence of the Block Size for Different Cache Sizes Oleh : Mohd Aziz Shah Bin Mohd Basir.
These courseware materials are to be used in conjunction with Software Engineering: A Practitioner’s Approach, 6/e and are provided with permission by.
LOGO Manajemen Data Berdasarkan Komputer dengan Sistem Database.
AUSTRALIA INDONESIA PARTNERSHIP FOR EMERGING INFECTIOUS DISEASES Excel tingkat menengah – Bagan (lanjutan) Location Date Name.
PEMROGRAMAN PPBD (UAS) SEBELUM MELANGKAH KE TAHAP SELANJUTNYA BERDOA DULU BIAR LANCAR DAN GA EROR
Linked List dan Double Linked List
Metodologi Penelitian dalam Bidang Informatika
3.1 © 2007 by Prentice Hall OVERVIEW Information Systems, Organizations, and Strategy.
Contentment Philippians 4: Contentment What does it mean to be content? What does it mean to be content? Are you a content person? Are you a content.
SMPN 2 DEMAK GRADE 7 SEMESTER 2
© 2007 Cisco Systems, Inc. All rights reserved.Cisco Public 1 Fungsi dan Protokol Layer Aplikasi Network Fundamentals – Chapter 3.
1. 2 Work is defined to be the product of the magnitude of the displacement times the component of the force parallel to the displacement W = F ║ d F.
Lecture 8 Set and Dictionary Sandy Ardianto & Erick Pranata © Sekolah Tinggi Teknik Surabaya 1.
Romans 1: Romans 1:16-17 New Living Translation (NLT) 16 For I am not ashamed of this Good News about Christ. It is the power of God at work, saving.
Via Octaria Malau Transfer (Internal Transfers) Transfer (Transfers Internal) Select the account from which funds are to be transferred FROM and then select.
1 PENGANTAR APLIKASI KOMPUTER Haryoso Wicaksono, S.Si. MICROSOFT WINDOWS #2.
PENJUMLAHAN GAYA TUJUAN PEMBELAJARAN:
© 2007 Cisco Systems, Inc. All rights reserved.Cisco Public ITE PC v4.0 Chapter 1 1 Pengalamatan Jaringan – IPv4 Dosen Pengampu: Resi Utami Putri, S.Kom.,
The intensive state of a PVT system containing N chemical species and  phases in equilibrium is characterized by the intensive variables, temperature.
TCP, THREE-WAY HANDSHAKE, WINDOW
Menu Standard Competence Based Competence.
Retrosintetik dan Strategi Sintesis
Web Teknologi I (MKB511C) Minggu 12 Page 1 MINGGU 12 Web Teknologi I (MKB511C) Pokok Bahasan: – Text processing perl-compatible regular expression/PCRE.
Slide 1 Chapter 1: Introduction to Systems Analysis and Design Alan Dennis, Barbara Wixom, and David Tegarden John Wiley & Sons, Inc.
MICROSOFT EXCEL 2000 Bagian #4 GRAPHICS : OBJECT & CHART.
WISNU HENDRO MARTONO,M.Sc
KLASIFIKASI.
Lecture 8 Normal model.
Transcript presentasi:

Departemen Ilmu Komputer FMIPA IPB Metode Klasifikasi Kuliah Metode Kuantitatif Aziz Kustiyo Departemen Ilmu Komputer FMIPA IPB

7.1. Pendahuluan We need learning in cases where we cannot directly write a computer program to solve a given problem, but need example data or experience. One case where learning is necessary is when human expertise does not exist, or when humans are unable to explain their expertise.

7.1. Pendahuluan Consider the recognition of spoken speech, that is, converting the acoustic speech signal to an ASCII text; we can do this task seemingly without any difficulty, but we are unable to explain how we do it. In machine learning, the approach is to collect a large collection of sample utterances from different people and learn to map these to words.

7.1. Pendahuluan Another case is when the problem to be solved changes in time, or depends on the particular environment. We would like to have general purpose systems that can adapt to their circumstances, rather than explicitly writing a different program for each special circumstance.

7.1. Pendahuluan The goal of machine learning is to program computers to use example data or past experience to solve a given problem. Many successful applications of machine learning exist already, including systems that analyze past sales data to predict customer behavior, recognize faces or spoken speech, optimize robot behavior so that a task can be completed using minimum resources, and extract knowledge from bioinformatics data.

7.1. Pendahuluan We can only imagine what future applications can be realized using machine learning: Cars that can drive themselves under different road and weather conditions, phones that can translate in real time to and from a foreign language, autonomous robots that can navigate in a new environment, for example, on the surface of another planet. Machine learning is certainly an exciting field to be working in!

7.1. Pendahuluan. Supervised learning, dikenal juga sebagai klasifikasi, merupakan tugas utama yang dipelajari pada penelitian machine learning. Algoritma supervised learning menerima himpunan contoh pelatihan yang telah diklasifikasikan sebelumnya, setiap contoh diberi label kelas tertentu. Tujuan dari algoritma ini adalah mempelajari aturan klasifikasi yang dapat menentukan kelas dengan tepat apabila diberikan contoh kasus baru.

7.1. Pendahuluan.. Sebagai ilustrasi, misalkan diberikan contoh berupa deskripsi gejala-gejala penyakit seorang pasien serta kondisi apabila pasien tersebut sudah sehat. Kelas pada kasus tersebut adalah “sakit” dan “sehat” dan tugas dari algoritma pembelajaran adalah menghasilkan aturan yang secara akurat memprediksi apakah pasien baru sakit atau sehat.

7.1. Pendahuluan… Pada unsupervised learning, contoh data latih belum ditetapkan kelasnya dari awal oleh “guru”. Data yang diberikan hanya deskripsi dari contoh-contoh tersebut dan tujuan dari sistem pembelajaran induktif adalah mencari keteraturan dan pengelompokan alami (clustering) di antara contoh-contoh tersebut.

7.1. Pendahuluan…. Ukuran kesuksesan unsupervised learning berbeda dengan supervised learning. Untuk menguji apakah algoritme supervised learning telah berhasil, secara sederhana dapat dilakukan dengan menguji algoritma tersebut dengan data baru untuk melihat apakah hasil klasifikasinya sama dengan klasifikasi yang telah ditetapkan dari awal. Pada unsupervised learning, harus diperiksa apakah contoh data yang diujikan memiliki keteraturan yang sama dengan keteraturan yang ditemukan pada data training.

7.1. Pendahuluan… Beberapa algoritma yang termasuk ke dalam supervised learning di antaranya adalah: linear discriminant analysis (LDA), k-nearest neighbour (KNN), jaringan syaraf tiruan propagasi balik, voting feature interval 5 (VFI5), dan lain-lain.

7.1. Pendahuluan…… Demikian juga pada unsupervised learning, terdapat beberapa algoritma seperti: K-means clustering, Fuzzy c-means clustering, Self Organinzing map Kohonen (SOM Kohonen), dan lain-lain.

7.2. Algoritma KNN Algoritma K-nearest neighbor (KNN) merupakan algoritma supervised learning di mana hasil kalsifikasi data baru berdasar kepada kategori mayoritas tetangga terdekat ke-K. Tujuan dari algoritma ini adalah mengklasifikasikan objek baru berdasarkan atribut dan data training. Klasifikasi dilakukan tanpa menggunakan model namun hanya berdasarkan memori.

7.2. Algoritma KNN. Misalkan diberikan sebuah query, akan didapatkan sejumlah K objek data training yang terdekat dengan query tersebut. Klasifikasi dilakukan dengan menggunakan mayoritas suara (seperti dalam pemilu) di antara klasifikasi dari K objek. Algoritma KNN menggunakan kalsifikasi ketetenggaan sebagai prediksi terhadap data baru.

7.2.1 Cara kerja algoritma KNN Algoritma KNN sangat sederhana. Algoritma ini bekerja berdasarkan jarak minimum dari data baru terhadap K tetangga terdekat yang telah ditetapkan. Setelah diperoleh K tetangga terdekat, prediksi kelas dari data baru akan ditentukan berdasarkan mayoritas K tetangga terdekat.

7.2.1 Cara kerja algoritma KNN. Data untuk KNN terdiri dari beberapa atribut multivariat Xi yang akan digunakan untuk mengklasifikasikan Y. Data untuk KNN dapat berupa data ordinal, nominal sampai dengan skala kuantitatif namun yang akan dibahas hanya skala kuantitatif Xi dan biner (nominal) Y.

???? Nominal Ordinal Skala kuantitatif Bagaimana konsep jarak pada data dengan skala pengukuran: Nominal Ordinal Skala kuantitatif

7.2.2 Contoh aplikasi KNN Algoritma KNN: Tentukan parameter K = jumlah tetangga terdekat hitung jarak antara data baru dengan semua data training urutkan jarak tersebut dan tetapkan tetangga terdekat berdasarkan jarak minimum ke-K periksa kelas dari tetangga terdekat gunakan mayoritas sederhana dari kelas tetangga terdekat sebagai nilai prediksi data baru

7.2.2 Contoh aplikasi KNN. Contoh Diberikan data training berikut, terdiri dari 2 atribut dengan skala kuantitatif yaitu X1 dan X2 serta 2 kelas yaitu baik dan buruk. Jika terdapat data baru dengan nilai X1=3 dan X2=7, tentukan kelasnya!

7.2.2 Contoh aplikasi KNN.. X1 X2 Y 7 7 Buruk 7 4 Buruk 3 4 Baik

7.2.2 Contoh aplikasi KNN... Tentukan parameter K = jumlah tetangga terdekat Misalkan ditetapkan K = 3

7.2.2 Contoh aplikasi KNN.... hitung jarak antara data baru dengan semua data training

7.2.2 Contoh aplikasi KNN_ urutkan jarak tersebut dan tetapkan tetangga terdekat berdasarkan jarak minimum ke-K

7.2.2 Contoh aplikasi KNN_. periksa kelas dari tetangga terdekat

7.2.2 Contoh aplikasi KNN_.. gunakan mayoritas sederhana dari kelas tetangga terdekat sebagai nilai prediksi data baru Hasil pada no 4 menunjukkan bahwa dari 3 tetangga terdekat, terdapat 2 kelas Baik dan 1 kelas Buruk, maka disimpulkan bahwa data baru termasuk ke dalam kelas Baik.

7.3. Kelebihan dan kelemahan algoritma KNN Beberapa kelebihan algoritma KNN antara lain adalah: Robust terhadap data training yang memiliki noise (terutama jika digunakan invers kuadrat jarak terboboti sebagai “jarak”) Efektif jika data training berukuran besar

7.3. Kelebihan dan kelemahan algoritma KNN. Beberapa kelemahan dari KNN antara lain: Perlu menentukan parameter K Jarak sebagai basis pembelajaran tidak jelas, tipe jarak apa yang harus digunakan dan atribut mana saja yang harus digunakan untuk mendapatkan hasil yang optimal. Apakah semua atribut harus digunakan atau hanya atribut tertentu saja? Computation cost sangat tinggi karena harus menghitung jarak antara data baru dengan semua data training. Beberapa metode pengindeksan (misal, . K-D tree) mungkin dapat mengurangi computational cost.

7.4. Bahan bacaan yang relevan untuk KNN Softwares/Codes Auton Project provide free software of Dense K nearest neighbor for Windows and Linux (registration is needed to download) Xlminer (using MS Excel add Ins- Commercial ). See its online help. Check also my free Excel tutorial for K nearest Neighbor (you may also download the worksheet program) Agent Building and Learning Environment (ABLE) Java framework contains K nearest neighbor . Download Java code from Alphawork IBM research Nearest Neighbor Java Applet (with Java source code) BioPython contain KNN code in Python ANN - Approximate Nearest Neighbor Searching contain C++ code (under GNU) Roger Jang provide Matlab code for both Fuzzy Nearest Neighbor and K nearest neighbor

7.4. Bahan bacaan yang relevan untuk KNN. Tutorial Instance-based learning and k-Nearest neighbor algorithm Greg Grudic lecture note on Nearest Neighbor Learning (PDF) Tsechansky lecture note on Data Mining (PPT) Stefan Carlsson lecture note on Nearest Neighbor density estimation (PDF) Buku dan referensi lain Mitchell, Tom M. Machine Learning , Mc Graw Hill Read futher about machine learning books from Google Print

7.4. Bahan bacaan yang relevan untuk KNN.. Paper Teknis K-Local Hyperplane and Convex Distance Nearest Neighbor Algorithms by Pascal Vincent and Yoshua Bengio: Compare K nearest neighbor with Vector Support Machine (SVM) An Investigation of Practical Approximate Nearest Neighbor Algorithms by Ting Liu, Andrew W. Moore, Alexander Gray and Ke Yang (PDF): k-NN search algorithm using Locally sensitive hashing A Fast Algorithm for Finding k-Nearest Neighbors with Non-metric Dissimilarity by Bin Zhang and Sargur N. Srihari An Enhancement of k-Nearest Neighbor Classification Using Genetic Algorithm by Anupam Kumar Nath Syed M. Rahman Akram Salah (PDF) K-Nearest Neighbor Search for Moving Query Point by Zhexuan Song and Nick Roussopoulos (PDF)

7.4. Bahan bacaan yang relevan untuk KNN… Aplikasi Chinese text categorization using K nearest neighbor (PDF) by Li Baoli, Yu Shiwen, and Lu Qin Profiles and fuzzy k-nearest neighbor algorithm for protein secondary structure prediction by Rajkumar Bondugula, Ognen Duzlevski, and Dong Xu (PDF): application of fuzzy k-nearest neighbor to prediction of protein structure Exemplar-based learning in adaptive optical music recognition system by Ichiro Fujinaga (PDF): Using K nearest Neighbor and Genetic Algorithm to recognize music Application of Genetic Algorithm/K-Nearest Neighbor Method to the Classification of Renal Cell Carcinoma by Dongqing Liu et al (PDF): Using K nearest neighbor and GA to classify tumor cells Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases by Mohammad Kolahdouzan and Cyrus Shahabi (PDF): K nearest neighbor for spatial analysis

7.5 Pustaka Teknomo, Kardi. K-Nearest Neighbors Tutorial. http:\\people.revoledu.com\kardi\ tutorial\KNN\

Contoh soal x1 x2 Kelas 1 3 2 4 ?