Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

DATA MINING : PREDIKSI 1.Overview 2.Regresi Linear Regresi Linear Sederhana Regresi Linear berganda 3.Analisis Garis Regresi menggunakan Koesifien Determinasi.

Presentasi serupa


Presentasi berjudul: "DATA MINING : PREDIKSI 1.Overview 2.Regresi Linear Regresi Linear Sederhana Regresi Linear berganda 3.Analisis Garis Regresi menggunakan Koesifien Determinasi."— Transcript presentasi:

1 DATA MINING : PREDIKSI 1.Overview 2.Regresi Linear Regresi Linear Sederhana Regresi Linear berganda 3.Analisis Garis Regresi menggunakan Koesifien Determinasi 4.Conclusion

2 Overview Sbg gambaran, diberikan data mengenai lamanya wkt yg dihabiskan oleh seorang pegawai resto cepat saji utk mengantarkan pesanan ke rumah pelanggan. Wkt sejak pegawai meninggalkan resto hingga mencapai pintu rmh pelanggan di tampilkan sbb:

3 Overview No pesanan Jarak (km) Waktu (Menit) 10,509,95 21,1024,45 31,2031,75 45,5035,00 52,9525,02 62,0016,86 73,7514,38 80,529,60 91,0024,35 103,0027,50 114,1217,08 124,0037,00 135,0041,95 No Pesanan Jarak (km) Waktu (Menit) 143,6011,66 152,0521,65 164,0017,89 176,0069,00 185,8510,30 195,4034,93 202,5046,59 212,9044,88 225,1054,12 235,9056,23 241,0022,13 254,0021,15 261,5?

4 Overview Berapa waktu yg ditempuh utk pesanan ke- 26? Dlm prediksi menggunakan data yg sdh ada utk memprediksi hasil dari satu hal yg baru yg akan muncul selanjutnya. Prediksi dapat memperkirakan hasil dari hal yg belum terjadi. Cara prediksi  Regresi Linear

5 Regresi Linear Regresi Linear (RL) yg dibahas: – RL Sederhana  melibatkan 1 variabel pemberi pengaruh – RL Berganda  melibatkan >1 variabel pemberi pengaruh Variabel  besaran yg berubah2 nilainya Contoh variabel: nomor rmh pelanggan, luas rmh pelanggan, jam pemesanan, suhu udara saat pemesanan, jumlah anggota keluarga pemesan, dll Belum tentu semua variabel relevan dgn kasus yg dihadapi Variabel dipilah 2  – Variabel pemberi pengaruh  dianalogikan sbg “sebab” – Variabel terpengaruh  dianalogikan sbg “akibat”

6 Regresi Linear No pesanan Jarak (km)Waktu (Menit) 10,509, ,0021,15 Variabel pemberi pengaruh (Sebab) Variabel terpengaruh (akibat)

7 RL Sederhana RL Sederhana  salah satu cara prediksi menggunakan garis lurus utk menggambarkan hubungan di antara 2 atw lebih variabel Sbg contoh: Berdasarkan tabel, kita coba menggambarkan jarak sbg sumbu x (dlm km) dan Waktu sbg sumbu y (dlm menit) Setiap pasang jarak dan waktu di gambarkan sebagai titik.

8 Tujuan: Membuat garis lurus sedekat mungkin dgn titik2 tsb  B lebih baik Scr umum, grs tsb dpt kita tulis dlm bentuk persamaan: Y = β0 + β1x

9 β 0 = y - β 1 x _ _ β1 = n ∑ yixi i=1 n ∑ yi i=1 n ∑ xi i=1 n ∑ xi i=1 n ∑ xi 2 i=1 n n 2

10 Perincian perhitungan RL-S No i Jara k X Waktu Y YiXiXi 2 10,509,954,980,25 21,1024,4526,901,21 31,2031,7538,101,44 45,5035,00192,5030,25 52,9525,0273,818,70 62,0016,8633,724,00 73,7514,3853,9314,06 80,529,604,990,27 91,0024,35 1,00 103,0027,5082,509,00 114,1217,0870,3716,97 124,0037,00148,0016,00 135,0041,95209,7525,00 143,6011,6641,9812,96 No i Jara k X Waktu Y YiXiXi 2 152,0521,6544,384,20 164,0017,8971,5616,00 176,0069,00414,0036,00 185,8510,3060,2634,22 195,4034,93188,6229,16 202,5046,59116,486,25 212,9044,88130,158,41 225,1054,12276,0126,01 235,9056,23331,7634,81 241,0022,13 1,00 254,0021,1584,6016,00 Jmlh82,94725,422745,81353,18 Rata-2 3,3229,02

11 β1 = n ∑ yixi i=1 n ∑ yi i=1 n ∑ xi i=1 n ∑ xi i=1 n ∑ xi 2 i=1 n n 2 No i Jara k X Waktu Y YiXiXi ,9056,23331,7634,81 241,0022,13 1,00 254,0021,1584,6016,00 Jmlh82,94725,422745,81353,18 Rata-2 3,3229,02 = = 2745,81 (725,42)(82,94) ,18 (82,94) ,35 β 0 = y - β 1 x __ = 29,02 – (4,35)(3,32) = 14,58

12 Persamaan grs regresi yg kita cari berbentuk: Y = β0 + β1x Berdasarkan perhitungan tsd, maka diperoleh: Y = 14,58 + 4,35 x Pengetahuan apa yg didapat? Bhw wkt tempuh pengiriman  14,58 menit ditambah 4,35 kali jarak rumah pelanggan. Artinya bila jaraknya 1 km maka, wkt tempuhnya jadi 18,93 menit Maka, utk pelanggan ke-26 dgn jarak 1,5 km  Y = 14,58 + 4,35 (1,5) Y = 21,1 menit

13 Regresi Linear Berganda Menyusun persamaan linear dgn byk variabel X (pemberi pengaruh) Bila kita memiliki k buah variabel pemberi pengaruh, maka bentuk persamaan garis regresinya: Y = β0 + β1x1 + β2x βkxk Sehingga kita dpt menyelesaikan persamaan, sbb:

14 n n n n nβ0 + β1 ∑ xi1 + β2 ∑ xi βk ∑ xik = ∑ yi i=1 i=1 i=1 i=1 n n n n n β0 ∑ xi1 + β1 ∑ xi1 2 + β2 ∑ xi1xi βk ∑ xi1xik = ∑ xi1yi i=1 i=1 i=1 i=1 i= n n n n n β0 ∑ Xik + β1 ∑ XikXi1 + β2 ∑ XikXi βk ∑ Xik 2 = ∑ XikYi i=1 i=1 i=1 i=1 i=1

15 Penambahan variabel pemberi pengaruh  banyaknya lampu merah NoLampu Jarak (km) Waktu (Menit) 120,509,95 281,1024, ,2031, ,5035,00 582,9525,02 642,0016,86 723,7514,38 820,529,60 991,0024, ,0027, ,1217, ,0037, ,0041,95 NoLampu Jarak (km) Waktu (Menit) 1423,6011, ,0521, ,0017, ,0069, ,8510, ,4034, ,5046, ,9044, ,1054, ,9056, ,0022, ,0021, ,5?

16 No i Lampu Xi Jarak X2 Waktu y Xi1 2 Xi1Xi2Xi1YiXi2 2 Xi2Yi 120,509,95 4,001,0019,900,254,98 281,1024,45 64,008,80195,601,2126, ,2031,75 121,0013,20349,251,4438, ,5035,00 100,0055,00350,0030,25192,50 582,9525,02 64,0023,60200,168,7073,81 642,0016,86 16,008,0067,444,0033,72 723,7514,38 4,007,5028,7614,0653,93 820,529,60 4,001,0419,200,274,99 991,0024,35 81,009,00219,151,0024, ,0027,50 64,0024,00220,009,0082, ,1217,08 16,0016,4868,3216,9770, ,0037,00 121,0044,00407,0016,00148, ,0041,95 144,0060,00503,4025,00209,75 Perhitungan RL-B

17 No i Lampu Xi Jarak X2 Waktu y Xi1 2 Xi1Xi2Xi1YiXi2 2 Xi2Yi 1423,6011,66 4,007,2023,3212,9641, ,0521,65 16,008,2086,604,2044, ,0017,89 16,00 71,5616,0071, ,0069,00 400,00120, ,0036,00414, ,8510,30 1,005,8510,3034,2260, ,4034,93 100,0054,00349,3029,16188, ,5046,59 225,0037,50698,856,25116, ,9044,88 225,0043,50673,208,41130, ,1054,12 256,0081,60865,9226,01276, ,9056,23 289,00100,30955,9134,81331, ,0022,13 36,006,00132,781,0022, ,0021,15 25,0020,00105,7516,0084,60 Jumlah20682,94725, ,00771, ,67353, ,81 Perhitungan RL-B (lanjutan)

18 No i Lampu Xi Jarak X2 Waktu y Xi1 2 Xi1Xi2Xi1YiXi1 2 Xi2Yi 2461,0022,13 36,006,00132,781,0022, ,0021,15 25,0020,00105,7516,0084,60 Jumlah20682,94725, ,00771, ,67353, ,81 n n n β0 + β1 ∑ xi1 + β2 ∑ xi2 = 725,42 i=1 i=1 n n n β0 ∑ xi1 + β1 ∑ xi1 2 + β2 ∑ xi1xi2 = 8.001,67 i=1 i=1 i=1 n n n β0 ∑ Xik + β1 ∑ XikXi1 + β2 ∑ XikXi2 = 2.745,81 i=1 i=1 i=1

19 β β β2 82,94 = 725,42 β β β2 771,77 = 8.001,67 β0 82,94 + β1 771,77 + β2 353,18 = 2.745,81 Ketiga persamaan diatas diselesaikan shg diperolehdiselesaikan β0 = 2,31 ; β1 = 2,74 ; β2 = 1,24 Maka persamaan RL nya: Y = β0 + β1x1 + β2x2 menjadi Y = 2,31 + 2,74 x1 + 1,24 x2

20 Pengetahuan yg diperoleh: Dari 2,31 waktu tempuh, akan melewati 2,74 kali lampu merah ditambah 1,24 kali jarak rmh pelanggan Dari kasus diatas diketahui 1 lampu merah dan 1,5 km jaraknya, maka X1= 1 (lampu) dan X2=1,5 (jarak) shg kita dpt memprediksi lamanya wkt pesanan tiba di rmh pelanggan dgn cara: Y = 2,31 + 2,74 X1 + 1,24 X2 Y = 2,31 + 2,74 (1) + 1,24 (1,5) = 6,91 menit

21 Analisis Garis Regresi Menggunakan Koefisien Determinasi Kita telah pelajari subbab sblmnya bhw: Pers. Grs linear pertama dgn var. pemberi pengaruh x = jarak  Y = 14,58 + 4,35 X Pers. Grs linear kedua dgn var. pemberi pengaruh x1 = jml lampu merah dan x2 = jarak tempuh  Y = 2,31 + 2,74 X1 + 1,24 X2 Pertanyaan  manakah yg lebih baik? Solusi  dpt menggunakan ukuran koefisien determinasi yg dinotasikan sbg R 2

22 Koefisien Determinasi dpt dihitung dgn rumus: R 2 = 1 - SS E S yy n n SS E = ∑ e i 2 = ∑ (yi – yi) 2 i=1 i=1 n S yy = ∑ (yi – y) 2 i=1 ^

23 Perhitungan Koefisien Determinasi No i Lampu Xi Jarak X2 Waktu y ŷi(yi-ŷi) 2 ŷi(yi-ŷi) 2 (yi-ȳ) 2 120,509,95 16,7646,318,412,37363,66 281,1024,45 19,3725,8625,591,3120, ,2031,75 19,80142,8033,944,797, ,5035,00 38,5112,2936,532,3435,76 582,9525,02 27,415,7227,898,2316,00 642,0016,86 23,2841,2215,751,23147,87 723,7514,38 30,89272,6612,443,76214,33 820,529,60 16,8452,458,431,36377,14 991,0024,35 18,9329,3828,2114,9021, ,0027,50 27,630,0227,950,202, ,1217,08 32,50237,8418,381,69142, ,0037,00 31,9825,2037,410,1763, ,0041,95 36,3331,5841,390,31167, ,6011,66 30,24345,2212,250,35301,37 Y = 14,58 + 4,35 XY = 2,31 + 2,74 X1 + 1,24 X2

24 No i Lampu Xi Jarak X2 Waktu y ŷi(yi-ŷi) 2 ŷi(yi-ŷi) 2 (yi-ȳ) ,6011,6630,24345,2212,250,35301, ,0521,6523,503,4115,8134,0854, ,0017,8931,98198,5318,230,12123, ,0069,0040,68802,0264,5519, , ,8510,3040,03883,7212,304,02350, ,4034,9338,079,8636,412,1834, ,5046,5925,46446,6946,510,01308, ,9044,8827,20312,7647,014,52251, ,1054,1236,77301,2052,472,71630, ,9056,2340,25255,5256,210,00740, ,0022,1318,9310,2419,994,5847, ,0021,1531,98117,2920,970,0361,94 Jumlah20682,94725,42725, ,78725,04115, ,02 Rata-23,3229,02 Perhitungan Koefisien Determinasi (2)

25 Hasil No i Lampu Xi Jarak X2 Waktu y ŷi(yi-ŷi) 2 ŷi(yi-ŷi) 2 (yi-ȳ) ,0022,1318,9310,2419,994,5847, ,0021,1531,98117,2920,970,0361,94 Jumlah20682,94725,42725, ,78725,04115, ,02 Rata-23,3229,02 Pers. Regresi pertama (Y=14,58 + 4,35 X): R 2 = 1 - SS E S yy = 1 – (4.609,78 / 6.084,02) = 0,2423 = 24,23 % Pers. Regresi kedua (Y = 2,31 + 2,74 X1 +1,24 X2): R 2 = 1 - SS E S yy = 1 – (115,05 / 6.084,02) = 0,9811 = 98,11 %

26 Hasil Grs regresi kedua ternyata memiliki Koefisien Determinasi yg lebih tinggi, grs tsb lbh dpt menjelaskan keberagaman wkt pengantaran pesanan. Utk memprediksi wkt pengantaran sebaiknya menggunakan garis regresi kedua yg mempertimbangkan dua variabel pemberi pengaruh, yaitu banyaknya lampu merah dan jarak rumah pelanggan

27 Kesimpulan Kegunaan fungsi prediksi Cara membuat persamaan garis regresi utk satu atw lbh variabel pemberi pengaruh Cara melakukan analisis perbandingan antara dua garis regresi berdasarkan koefisien determinasi


Download ppt "DATA MINING : PREDIKSI 1.Overview 2.Regresi Linear Regresi Linear Sederhana Regresi Linear berganda 3.Analisis Garis Regresi menggunakan Koesifien Determinasi."

Presentasi serupa


Iklan oleh Google