Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

DATA MINING : PREDIKSI Overview Regresi Linear

Presentasi serupa


Presentasi berjudul: "DATA MINING : PREDIKSI Overview Regresi Linear"— Transcript presentasi:

1 DATA MINING : PREDIKSI Overview Regresi Linear
Regresi Linear Sederhana Regresi Linear berganda Analisis Garis Regresi menggunakan Koesifien Determinasi Conclusion

2 Overview Sbg gambaran, diberikan data mengenai lamanya wkt yg dihabiskan oleh seorang pegawai resto cepat saji utk mengantarkan pesanan ke rumah pelanggan. Wkt sejak pegawai meninggalkan resto hingga mencapai pintu rmh pelanggan di tampilkan sbb:

3 Overview No pesanan Jarak (km) Waktu (Menit) 1 0,50 9,95 2 1,10 24,45
3 1,20 31,75 4 5,50 35,00 5 2,95 25,02 6 2,00 16,86 7 3,75 14,38 8 0,52 9,60 9 1,00 24,35 10 3,00 27,50 11 4,12 17,08 12 4,00 37,00 13 5,00 41,95 No Pesanan Jarak (km) Waktu (Menit) 14 3,60 11,66 15 2,05 21,65 16 4,00 17,89 17 6,00 69,00 18 5,85 10,30 19 5,40 34,93 20 2,50 46,59 21 2,90 44,88 22 5,10 54,12 23 5,90 56,23 24 1,00 22,13 25 21,15 26 1,5 ?

4 Overview Berapa waktu yg ditempuh utk pesanan ke-26?
Dlm prediksi menggunakan data yg sdh ada utk memprediksi hasil dari satu hal yg baru yg akan muncul selanjutnya. Prediksi dapat memperkirakan hasil dari hal yg belum terjadi. Cara prediksi  Regresi Linear

5 Regresi Linear Regresi Linear (RL) yg dibahas:
RL Sederhana  melibatkan 1 variabel pemberi pengaruh RL Berganda  melibatkan >1 variabel pemberi pengaruh Variabel  besaran yg berubah2 nilainya Contoh variabel: nomor rmh pelanggan, luas rmh pelanggan, jam pemesanan, suhu udara saat pemesanan, jumlah anggota keluarga pemesan, dll Belum tentu semua variabel relevan dgn kasus yg dihadapi Variabel dipilah 2  Variabel pemberi pengaruh  dianalogikan sbg “sebab” Variabel terpengaruh  dianalogikan sbg “akibat”

6 Regresi Linear Variabel pemberi pengaruh Variabel terpengaruh(akibat)
(Sebab) Variabel terpengaruh(akibat) No pesanan Jarak (km) Waktu (Menit) 1 0,50 9,95 ... 25 4,00 21,15

7 RL Sederhana RL Sederhana  salah satu cara prediksi menggunakan garis lurus utk menggambarkan hubungan di antara 2 atw lebih variabel Sbg contoh: Berdasarkan tabel, kita coba menggambarkan jarak sbg sumbu x (dlm km) dan Waktu sbg sumbu y (dlm menit) Setiap pasang jarak dan waktu di gambarkan sebagai titik.

8 Scr umum, grs tsb dpt kita tulis dlm bentuk persamaan:
Tujuan: Membuat garis lurus sedekat mungkin dgn titik2 tsb  B lebih baik Scr umum, grs tsb dpt kita tulis dlm bentuk persamaan: Y = β0 + β1x

9 β0 = y - β1x _ n ∑ yi i=1 n ∑ xi i=1 n ∑ yixi i=1 n 2 n ∑ xi i=1 n
β1 = 2 n ∑ xi i=1 n ∑ xi2 i=1 n

10 Perincian perhitungan RL-S
No i Jara k X Waktu Y YiXi Xi2 1 0,50 9,95 4,98 0,25 2 1,10 24,45 26,90 1,21 3 1,20 31,75 38,10 1,44 4 5,50 35,00 192,50 30,25 5 2,95 25,02 73,81 8,70 6 2,00 16,86 33,72 4,00 7 3,75 14,38 53,93 14,06 8 0,52 9,60 4,99 0,27 9 1,00 24,35 10 3,00 27,50 82,50 9,00 11 4,12 17,08 70,37 16,97 12 37,00 148,00 16,00 13 5,00 41,95 209,75 25,00 14 3,60 11,66 41,98 12,96 No i Jara k X Waktu Y YiXi Xi2 15 2,05 21,65 44,38 4,20 16 4,00 17,89 71,56 16,00 17 6,00 69,00 414,00 36,00 18 5,85 10,30 60,26 34,22 19 5,40 34,93 188,62 29,16 20 2,50 46,59 116,48 6,25 21 2,90 44,88 130,15 8,41 22 5,10 54,12 276,01 26,01 23 5,90 56,23 331,76 34,81 24 1,00 22,13 25 21,15 84,60 Jmlh 82,94 725,42 2745,81 353,18 Rata-2 3,32 29,02

11 No i Jara k X Waktu Y YiXi Xi2 ... 23 5,90 56,23 331,76 34,81 24 1,00 22,13 25 4,00 21,15 84,60 16,00 Jmlh 82,94 725,42 2745,81 353,18 Rata-2 3,32 29,02 β0 = y - β1 x _ = 29,02 – (4,35)(3,32) = 14,58 n ∑ yi i=1 n ∑ xi i=1 n ∑ yixi i=1 (725,42) (82,94) 2745,81 25 n β1 = 4,35 = = 2 (82,94) 2 n ∑ xi i=1 353,18 25 n ∑ xi2 i=1 n

12 Persamaan grs regresi yg kita cari berbentuk:
Y = β0 + β1x Berdasarkan perhitungan tsd, maka diperoleh: Y = 14,58 + 4,35 x Pengetahuan apa yg didapat? Bhw wkt tempuh pengiriman  14,58 menit ditambah 4,35 kali jarak rumah pelanggan. Artinya bila jaraknya 1 km maka, wkt tempuhnya jadi 18,93 menit Maka, utk pelanggan ke-26 dgn jarak 1,5 km  Y = 14,58 + 4,35 (1,5) Y = 21,1 menit

13 Regresi Linear Berganda
Menyusun persamaan linear dgn byk variabel X (pemberi pengaruh) Bila kita memiliki k buah variabel pemberi pengaruh, maka bentuk persamaan garis regresinya: Y = β0 + β1x1 + β2x βkxk Sehingga kita dpt menyelesaikan persamaan, sbb:

14 nβ0 + β1 ∑ xi1 + β2 ∑ xi2 + ... + βk ∑ xik = ∑ yi i=1 i=1 i=1 i=1
n n n n nβ0 + β1 ∑ xi1 + β2 ∑ xi βk ∑ xik = ∑ yi i= i= i= i=1 n n n n n β0 ∑ xi1 + β1 ∑ xi12 + β2 ∑ xi1xi βk ∑ xi1xik = ∑ xi1yi i= i= i= i= i=1 . n n n n n β0 ∑ Xik + β1 ∑ XikXi1 + β2 ∑ XikXi βk ∑ Xik2 = ∑ XikYi i= i= i= i= i=1

15 Penambahan variabel pemberi pengaruh  banyaknya lampu merah
No Lampu Jarak (km) Waktu (Menit) 1 2 0,50 9,95 8 1,10 24,45 3 11 1,20 31,75 4 10 5,50 35,00 5 2,95 25,02 6 2,00 16,86 7 3,75 14,38 0,52 9,60 9 1,00 24,35 3,00 27,50 4,12 17,08 12 4,00 37,00 13 5,00 41,95 No Lampu Jarak (km) Waktu (Menit) 14 2 3,60 11,66 15 4 2,05 21,65 16 4,00 17,89 17 20 6,00 69,00 18 1 5,85 10,30 19 10 5,40 34,93 2,50 46,59 21 2,90 44,88 22 5,10 54,12 23 5,90 56,23 24 6 1,00 22,13 25 5 21,15 26 1,5 ?

16 Perhitungan RL-B Xi12 Xi1Xi2 Xi1Yi Xi22 Xi2Yi No i Lampu Xi Jarak X2
Waktu y Xi12 Xi1Xi2 Xi1Yi Xi22 Xi2Yi 1 2 0,50 9,95 4,00 1,00 19,90 0,25 4,98 8 1,10 24,45 64,00 8,80 195,60 1,21 26,90 3 11 1,20 31,75 121,00 13,20 349,25 1,44 38,10 4 10 5,50 35,00 100,00 55,00 350,00 30,25 192,50 5 2,95 25,02 23,60 200,16 8,70 73,81 6 2,00 16,86 16,00 8,00 67,44 33,72 7 3,75 14,38 7,50 28,76 14,06 53,93 0,52 9,60 1,04 19,20 0,27 4,99 9 24,35 81,00 9,00 219,15 3,00 27,50 24,00 220,00 82,50 4,12 17,08 16,48 68,32 16,97 70,37 12 37,00 44,00 407,00 148,00 13 5,00 41,95 144,00 60,00 503,40 25,00 209,75

17 Perhitungan RL-B (lanjutan)
No i Lampu Xi Jarak X2 Waktu y Xi12 Xi1Xi2 Xi1Yi Xi22 Xi2Yi 14 2 3,60 11,66 4,00 7,20 23,32 12,96 41,98 15 4 2,05 21,65 16,00 8,20 86,60 4,20 44,38 16 17,89 71,56 17 20 6,00 69,00 400,00 120,00 1.380,00 36,00 414,00 18 1 5,85 10,30 1,00 34,22 60,26 19 10 5,40 34,93 100,00 54,00 349,30 29,16 188,62 2,50 46,59 225,00 37,50 698,85 6,25 116,48 21 2,90 44,88 43,50 673,20 8,41 130,15 22 5,10 54,12 256,00 81,60 865,92 26,01 276,01 23 5,90 56,23 289,00 100,30 955,91 34,81 331,76 24 6 22,13 132,78 25 5 21,15 25,00 20,00 105,75 84,60 Jumlah 206 82,94 725,42 2.396,00 771,77 8.001,67 353,18 2.745,81

18 β0 ∑ Xik + β1 ∑ XikXi1 + β2 ∑ XikXi2 = 2.745,81 i=1 i=1 i=1
No i Lampu Xi Jarak X2 Waktu y Xi12 Xi1Xi2 Xi1Yi Xi2Yi 24 6 1,00 22,13 36,00 6,00 132,78 25 5 4,00 21,15 25,00 20,00 105,75 16,00 84,60 Jumlah 206 82,94 725,42 2.396,00 771,77 8.001,67 353,18 2.745,81 n n n β0 + β1 ∑ xi1 + β2 ∑ xi2 = 725,42 i= i=1 n n n β0 ∑ xi1 + β1 ∑ xi12 + β2 ∑ xi1xi2 = 8.001,67 i= i= i=1 n n n β0 ∑ Xik + β1 ∑ XikXi1 + β2 ∑ XikXi2 = 2.745,81 i= i= i=1

19 β β β2 82,94 = 725,42 β β β2 771,77 = 8.001,67 β0 82,94 + β1 771,77 + β2 353,18 = 2.745,81 Ketiga persamaan diatas diselesaikan shg diperoleh β0 = 2,31 ; β1 = 2,74 ; β2 = 1,24 Maka persamaan RL nya: Y = β0 + β1x1 + β2x2 menjadi Y = 2,31 + 2,74 x1 + 1,24 x2

20 Pengetahuan yg diperoleh:
Dari 2,31 waktu tempuh, akan melewati 2,74 kali lampu merah ditambah 1,24 kali jarak rmh pelanggan Dari kasus diatas diketahui 1 lampu merah dan 1,5 km jaraknya, maka X1= 1 (lampu) dan X2=1,5 (jarak) shg kita dpt memprediksi lamanya wkt pesanan tiba di rmh pelanggan dgn cara: Y = 2,31 + 2,74 X1 + 1,24 X2 Y = 2,31 + 2,74 (1) + 1,24 (1,5) = 6,91 menit

21 Analisis Garis Regresi Menggunakan Koefisien Determinasi
Kita telah pelajari subbab sblmnya bhw: Pers. Grs linear pertama dgn var. pemberi pengaruh x = jarak Y = 14,58 + 4,35 X Pers. Grs linear kedua dgn var. pemberi pengaruh x1 = jml lampu merah dan x2 = jarak tempuh  Y = 2,31 + 2,74 X1 + 1,24 X2 Pertanyaan  manakah yg lebih baik? Solusi  dpt menggunakan ukuran koefisien determinasi yg dinotasikan sbg R2

22 Koefisien Determinasi dpt dihitung dgn rumus:
SSE Syy R2 = 1 - n n SSE = ∑ ei2 = ∑ (yi – yi)2 i= i=1 ^ n Syy = ∑ (yi – y)2 i=1

23 Perhitungan Koefisien Determinasi
Y = 14,58 + 4,35 X Y = 2,31 + 2,74 X1 + 1,24 X2 No i Lampu Xi Jarak X2 Waktu y ŷi (yi-ŷi)2 (yi-ȳ)2 1 2 0,50 9,95 16,76 46,31 8,41 2,37 363,66 8 1,10 24,45 19,37 25,86 25,59 1,31 20,88 3 11 1,20 31,75 19,80 142,80 33,94 4,79 7,45 4 10 5,50 35,00 38,51 12,29 36,53 2,34 35,76 5 2,95 25,02 27,41 5,72 27,89 8,23 16,00 6 2,00 16,86 23,28 41,22 15,75 1,23 147,87 7 3,75 14,38 30,89 272,66 12,44 3,76 214,33 0,52 9,60 16,84 52,45 8,43 1,36 377,14 9 1,00 24,35 18,93 29,38 28,21 14,90 21,81 3,00 27,50 27,63 0,02 27,95 0,20 2,31 4,12 17,08 32,50 237,84 18,38 1,69 142,56 12 4,00 37,00 31,98 25,20 37,41 0,17 63,68 13 5,00 41,95 36,33 31,58 41,39 0,31 167,18 14 3,60 11,66 30,24 345,22 12,25 0,35 301,37

24 Perhitungan Koefisien Determinasi (2)
No i Lampu Xi Jarak X2 Waktu y ŷi (yi-ŷi)2 (yi-ȳ)2 14 2 3,60 11,66 30,24 345,22 12,25 0,35 301,37 15 4 2,05 21,65 23,50 3,41 15,81 34,08 54,32 16 4,00 17,89 31,98 198,53 18,23 0,12 123,88 17 20 6,00 69,00 40,68 802,02 64,55 19,80 1.598,40 18 1 5,85 10,30 40,03 883,72 12,30 4,02 350,44 19 10 5,40 34,93 38,07 9,86 36,41 2,18 2,50 46,59 25,46 446,69 46,51 0,01 308,70 21 2,90 44,88 27,20 312,76 47,01 4,52 251,54 22 5,10 54,12 36,77 301,20 52,47 2,71 630,01 23 5,90 56,23 40,25 255,52 56,21 0,00 740,38 24 6 1,00 22,13 18,93 10,24 19,99 4,58 47,47 25 5 21,15 117,29 20,97 0,03 61,94 Jumlah 206 82,94 725,42 725,29 4.609,78 725,04 115,05 6.084,02 Rata-2 3,32 29,02

25 Hasil Pers. Regresi pertama (Y=14,58 + 4,35 X): SSE Syy R2 = 1 - SSE
No i Lampu Xi Jarak X2 Waktu y ŷi (yi-ŷi)2 (yi-ȳ)2 24 6 1,00 22,13 18,93 10,24 19,99 4,58 47,47 25 5 4,00 21,15 31,98 117,29 20,97 0,03 61,94 Jumlah 206 82,94 725,42 725,29 4.609,78 725,04 115,05 6.084,02 Rata-2 3,32 29,02 Pers. Regresi pertama (Y=14,58 + 4,35 X): SSE Syy R2 = 1 - = 1 – (4.609,78 / 6.084,02) = 0,2423 = 24,23 % Pers. Regresi kedua (Y = 2,31 + 2,74 X1 +1,24 X2): SSE Syy R2 = 1 - = 1 – (115,05 / 6.084,02) = 0,9811 = 98,11 %

26 Hasil Grs regresi kedua ternyata memiliki Koefisien Determinasi yg lebih tinggi, grs tsb lbh dpt menjelaskan keberagaman wkt pengantaran pesanan. Utk memprediksi wkt pengantaran sebaiknya menggunakan garis regresi kedua yg mempertimbangkan dua variabel pemberi pengaruh, yaitu banyaknya lampu merah dan jarak rumah pelanggan

27 Kesimpulan Kegunaan fungsi prediksi
Cara membuat persamaan garis regresi utk satu atw lbh variabel pemberi pengaruh Cara melakukan analisis perbandingan antara dua garis regresi berdasarkan koefisien determinasi


Download ppt "DATA MINING : PREDIKSI Overview Regresi Linear"

Presentasi serupa


Iklan oleh Google