Reduksi dimensi menggunakan PCA
2 Dimensionality Reduction Satu pendekatan terkait dengan dimensi yang tinggi adalah mengurangi dimensi data tersebut. Memproyeksikan data dimensi tinggi ke dimensi yang rendah menggunakan transformasi linier dan non-linier
3 Dimensionality Reduction Transformasi linier adalah sederhana dalam perhitungan dan mudah dilakukan Pendekatan yang sederhana adalah – Principal Component Analysis (PCA) – Fisher Discriminant Analysis (FDA) k x 1 k x d d x 1 (k<<d)
4 Principal Component Analysis (PCA) Setiap teknik reduksi dimensi adalah menemukan transformasi yang memenuhi ketentuan/kriteria tertentu (misal information loss, data discrimination, dll) Tujuan dari PCA adalah mengurangn dimensi data dengan mempertahankan variasi data yang ada
5 Principal Component Analysis (PCA) Carilah basis dalam sub ruang dimensi rendah −Proyeksikan ke ruang dimensi yang rendah : (1) Original space : (2) Lower-dimensional sub-space dinyatakan Note: if K=N, then
6 Principal Component Analysis (PCA) Contoh (K=N):
7 Principal Component Analysis (PCA) Information loss −Reduksi dimensi menyebabkan informasi hilang !! −PCA mempertahankan informasi:
8 Principal Component Analysis (PCA) Methodology −misalkan x 1, x 2,..., x M adalah N x 1 vectors
9 Principal Component Analysis (PCA) Metodologi – cont.
10 Principal Component Analysis (PCA) Eigenvalue spectrum λiλi K λNλN
11 Principal Component Analysis (PCA) Tranformasi linier dengan PCA −Transformasi linier R N R K yaitu melakukan reduksi dimensi
12 Principal Component Analysis (PCA) Interpretasi Geometri −.−.
13 Principal Component Analysis (PCA) Berapa banyak Principal Component? −Untuk memilik K, anda dapat menggunakan kriteria berikut:
14 Principal Component Analysis (PCA) Error karena reduksi dimensi: average error karena reduksi dimensi adalah: