DATA MINING : PREDIKSI Overview Regresi Linear

Slides:



Advertisements
Presentasi serupa
UKURAN NILAI PUSAT UKURAN NILAI PUSAT ADALAH UKURAN YG DAPAT MEWAKILI DATA SECARA KESELURUHAN JENIS UKURAN NILAI PUSAT : MEAN , MEDIAN, MODUS KUARTIL,
Advertisements

Teori Graf.
Statistika Deskriptif: Distribusi Proporsi
(Matematika Al-Quran)
INTERAKTIF INTERAKTIF
START.
Chapter 8 Kompresi Video Kompresi video dipengaruh dari data video tersebut dan hardware yang digunakan pada video tersebut – pada pengambilan gambar –
Wido Hanggoro ` Research and Development Department Indonesia Meteorological Climatological and Geophysical Agency.
Bulan maret 2012, nilai pewarnaan :
TEKNIK REGRESI BERGANDA
Tugas: Perangkat Keras Komputer Versi:1.0.0 Materi: Installing Windows 98 Penyaji: Zulkarnaen NS 1.

Subnetting Cara Cepat I (IP Kelas C)
UKURAN PEMUSATAN Rata-rata, Median, Modus Oleh: ENDANG LISTYANI.
1 Diagram berikut menyatakan jenis ekstrakurikuler di suatu SMK yang diikuti oleh 400 siswa. Persentase siswa yang tidak mengikuti ekstrakurikuler.
Korelasi dan Regresi Ganda
Bab 11A Nonparametrik: Data Frekuensi Bab 11A.
BADAN KOORDINASI KELUARGA BERENCANA NASIONAL DIREKTORAT PELAPORAN DAN STATISTIK DISAJIKAN PADA RADALGRAM JAKARTA, 4 AGUSTUS 2009.
Interval Prediksi 1. Digunakan untuk melakukan estimasi nilai X secara individu 2. Tidak digunakan untuk melakukan estimasi parameter populasi yang tidak.
PEMBANDINGAN BERGANDA (Prof. Dr. Kusriningrum)
Bab 11B
BOROBUDUR (4) FAHMI BASYA
Mari Kita Lihat Video Berikut ini.
Statistika Deskriptif
Bab 6B Distribusi Probabilitas Pensampelan
ANALISA NILAI KELAS A,B,C DIBUAT OLEH: NAMA: SALBIYAH UMININGSIH NIM:
FPB DAN KPK KELAS 7 SEMESTER 1 ( SMPK PENABUR KOWIS )
HITUNG INTEGRAL INTEGRAL TAK TENTU.
ANALISIS PROSES BISNIS 7
STATISTIK - I.
UKURAN PENYEBARAN DATA
Persamaan Linier dua Variabel.
DISTRIBUSI FREKUENSI oleh Ratu Ilma Indra Putri. DEFINISI Pengelompokkan data menjadi tabulasi data dengan memakai kelas- kelas data dan dikaitkan dengan.
Pengolahan Citra Digital: Konsep Dasar Representasi Citra
Rabu 23 Maret 2011Matematika Teknik 2 Pu Barisan Barisan Tak Hingga Kekonvergenan barisan tak hingga Sifat – sifat barisan Barisan Monoton.
Soal Latihan.
PENINGKATAN KUALITAS PEMBELAJARAN DAN PEMAHAMAN PERANCANGAN PERCOBAAN MAHASISWA SEMESTER VI FAKULTAS KEDOKTERAN HEWAN UNIVERSITAS AIRLANGGA SURABAYA PENANGGUNG.
Bab 11B
Nonparametrik: Data Peringkat 2
PERKEMBANGAN KELULUSAN SMP/MTS, SMA/MA DAN SMK KOTA SEMARANG DUA TAHUN TERAKHIR T.P DAN 2013.
Pengujian Hipotesis Parametrik 2
Luas Daerah ( Integral ).
SEGI EMPAT 4/8/2017.
DATA DIRI DOSEN Nama : AFIJAL, S.Kom, M.Kom NIDN : TTL : Pulau Kayu, 25 Agustus 1984 Alamat : Jl. Medan – B. Aceh Lr. Sawah Gampong Uteun Geulinggang.
Analisis Regresi Kelompok 3 3SK1
P E R C O B A A N F A K T O R I A L D E N G A N RANCANGAN ACAK LENGKAP
PERWAKILAN BADAN KEPENDUDUKAN DAN KELUARGA BERENCANA NASIONAL
UKURAN PEMUSATAN DATA Sub Judul.
Bab 16 Sekor Komposit dan Seleksi Sekor Komposi dan Seleksi
Regresi dan Korelasi Linier
Bulan FEBRUARI 2012, nilai pewarnaan :
AREAL PARKIR PEMERINTAH KABUPATEN JEMBRANA
KINERJA SAMPAI DENGAN BULAN AGUSTUS 2013
DISTRIBUSI NORMAL.
Bab 13A Nonparametrik: Data Peringkat I Bab 13A
Nonparametrik: Data Peringkat 2
TOKOFEROL DAN FENOLIK TOTAL PADA 10 JENIS KACANG
Koefisien Korelasi Pearson dan Regresi Linier Sederhana
SEGI EMPAT Oleh : ROHMAD F.F., S.Pd..
Graf.
Statistika Deskriptif: Statistik Sampel
DISTRIBUSI FREKUENSI.
Statistika Deskriptif: Distribusi Proporsi
Nilai Ujian Statistik 80 orang mahasiswa Fapet UNHAS adalah sebagai berikut:
Teknik Numeris (Numerical Technique)
BAB2 QUEUE 6.3 & 7.3 NESTED LOOP.
Bab 7 Nilai Acuan Norma.
Bab 3B Statistika Deskriptif: Parameter Populasi 2.
Korelasi dan Regresi Ganda
DISTRIBUSI PELUANG Pertemuan ke 5.
Transcript presentasi:

DATA MINING : PREDIKSI Overview Regresi Linear Regresi Linear Sederhana Regresi Linear berganda Analisis Garis Regresi menggunakan Koesifien Determinasi Conclusion

Overview Sbg gambaran, diberikan data mengenai lamanya wkt yg dihabiskan oleh seorang pegawai resto cepat saji utk mengantarkan pesanan ke rumah pelanggan. Wkt sejak pegawai meninggalkan resto hingga mencapai pintu rmh pelanggan di tampilkan sbb:

Overview No pesanan Jarak (km) Waktu (Menit) 1 0,50 9,95 2 1,10 24,45 3 1,20 31,75 4 5,50 35,00 5 2,95 25,02 6 2,00 16,86 7 3,75 14,38 8 0,52 9,60 9 1,00 24,35 10 3,00 27,50 11 4,12 17,08 12 4,00 37,00 13 5,00 41,95 No Pesanan Jarak (km) Waktu (Menit) 14 3,60 11,66 15 2,05 21,65 16 4,00 17,89 17 6,00 69,00 18 5,85 10,30 19 5,40 34,93 20 2,50 46,59 21 2,90 44,88 22 5,10 54,12 23 5,90 56,23 24 1,00 22,13 25 21,15 26 1,5 ?

Overview Berapa waktu yg ditempuh utk pesanan ke-26? Dlm prediksi menggunakan data yg sdh ada utk memprediksi hasil dari satu hal yg baru yg akan muncul selanjutnya. Prediksi dapat memperkirakan hasil dari hal yg belum terjadi. Cara prediksi  Regresi Linear

Regresi Linear Regresi Linear (RL) yg dibahas: RL Sederhana  melibatkan 1 variabel pemberi pengaruh RL Berganda  melibatkan >1 variabel pemberi pengaruh Variabel  besaran yg berubah2 nilainya Contoh variabel: nomor rmh pelanggan, luas rmh pelanggan, jam pemesanan, suhu udara saat pemesanan, jumlah anggota keluarga pemesan, dll Belum tentu semua variabel relevan dgn kasus yg dihadapi Variabel dipilah 2  Variabel pemberi pengaruh  dianalogikan sbg “sebab” Variabel terpengaruh  dianalogikan sbg “akibat”

Regresi Linear Variabel pemberi pengaruh Variabel terpengaruh(akibat) (Sebab) Variabel terpengaruh(akibat) No pesanan Jarak (km) Waktu (Menit) 1 0,50 9,95 ... 25 4,00 21,15

RL Sederhana RL Sederhana  salah satu cara prediksi menggunakan garis lurus utk menggambarkan hubungan di antara 2 atw lebih variabel Sbg contoh: Berdasarkan tabel, kita coba menggambarkan jarak sbg sumbu x (dlm km) dan Waktu sbg sumbu y (dlm menit) Setiap pasang jarak dan waktu di gambarkan sebagai titik.

Scr umum, grs tsb dpt kita tulis dlm bentuk persamaan: Tujuan: Membuat garis lurus sedekat mungkin dgn titik2 tsb  B lebih baik Scr umum, grs tsb dpt kita tulis dlm bentuk persamaan: Y = β0 + β1x

β0 = y - β1x _ n ∑ yi i=1 n ∑ xi i=1 n ∑ yixi i=1 n 2 n ∑ xi i=1 n β1 = 2 n ∑ xi i=1 n ∑ xi2 i=1 n

Perincian perhitungan RL-S No i Jara k X Waktu Y YiXi Xi2 1 0,50 9,95 4,98 0,25 2 1,10 24,45 26,90 1,21 3 1,20 31,75 38,10 1,44 4 5,50 35,00 192,50 30,25 5 2,95 25,02 73,81 8,70 6 2,00 16,86 33,72 4,00 7 3,75 14,38 53,93 14,06 8 0,52 9,60 4,99 0,27 9 1,00 24,35 10 3,00 27,50 82,50 9,00 11 4,12 17,08 70,37 16,97 12 37,00 148,00 16,00 13 5,00 41,95 209,75 25,00 14 3,60 11,66 41,98 12,96 No i Jara k X Waktu Y YiXi Xi2 15 2,05 21,65 44,38 4,20 16 4,00 17,89 71,56 16,00 17 6,00 69,00 414,00 36,00 18 5,85 10,30 60,26 34,22 19 5,40 34,93 188,62 29,16 20 2,50 46,59 116,48 6,25 21 2,90 44,88 130,15 8,41 22 5,10 54,12 276,01 26,01 23 5,90 56,23 331,76 34,81 24 1,00 22,13 25 21,15 84,60 Jmlh 82,94 725,42 2745,81 353,18 Rata-2 3,32 29,02

No i Jara k X Waktu Y YiXi Xi2 ... 23 5,90 56,23 331,76 34,81 24 1,00 22,13 25 4,00 21,15 84,60 16,00 Jmlh 82,94 725,42 2745,81 353,18 Rata-2 3,32 29,02 β0 = y - β1 x _ = 29,02 – (4,35)(3,32) = 14,58 n ∑ yi i=1 n ∑ xi i=1 n ∑ yixi i=1 (725,42) (82,94) 2745,81 25 n β1 = 4,35 = = 2 (82,94) 2 n ∑ xi i=1 353,18 25 n ∑ xi2 i=1 n

Persamaan grs regresi yg kita cari berbentuk: Y = β0 + β1x Berdasarkan perhitungan tsd, maka diperoleh: Y = 14,58 + 4,35 x Pengetahuan apa yg didapat? Bhw wkt tempuh pengiriman  14,58 menit ditambah 4,35 kali jarak rumah pelanggan. Artinya bila jaraknya 1 km maka, wkt tempuhnya jadi 18,93 menit Maka, utk pelanggan ke-26 dgn jarak 1,5 km  Y = 14,58 + 4,35 (1,5) Y = 21,1 menit

Regresi Linear Berganda Menyusun persamaan linear dgn byk variabel X (pemberi pengaruh) Bila kita memiliki k buah variabel pemberi pengaruh, maka bentuk persamaan garis regresinya: Y = β0 + β1x1 + β2x2 + ... + βkxk Sehingga kita dpt menyelesaikan persamaan, sbb:

nβ0 + β1 ∑ xi1 + β2 ∑ xi2 + ... + βk ∑ xik = ∑ yi i=1 i=1 i=1 i=1 n n n n nβ0 + β1 ∑ xi1 + β2 ∑ xi2 + ... + βk ∑ xik = ∑ yi i=1 i=1 i=1 i=1 n n n n n β0 ∑ xi1 + β1 ∑ xi12 + β2 ∑ xi1xi2 + ... + βk ∑ xi1xik = ∑ xi1yi i=1 i=1 i=1 i=1 i=1 . n n n n n β0 ∑ Xik + β1 ∑ XikXi1 + β2 ∑ XikXi2 + ... + βk ∑ Xik2 = ∑ XikYi i=1 i=1 i=1 i=1 i=1

Penambahan variabel pemberi pengaruh  banyaknya lampu merah No Lampu Jarak (km) Waktu (Menit) 1 2 0,50 9,95 8 1,10 24,45 3 11 1,20 31,75 4 10 5,50 35,00 5 2,95 25,02 6 2,00 16,86 7 3,75 14,38 0,52 9,60 9 1,00 24,35 3,00 27,50 4,12 17,08 12 4,00 37,00 13 5,00 41,95 No Lampu Jarak (km) Waktu (Menit) 14 2 3,60 11,66 15 4 2,05 21,65 16 4,00 17,89 17 20 6,00 69,00 18 1 5,85 10,30 19 10 5,40 34,93 2,50 46,59 21 2,90 44,88 22 5,10 54,12 23 5,90 56,23 24 6 1,00 22,13 25 5 21,15 26 1,5 ?

Perhitungan RL-B Xi12 Xi1Xi2 Xi1Yi Xi22 Xi2Yi No i Lampu Xi Jarak X2 Waktu y Xi12 Xi1Xi2 Xi1Yi Xi22 Xi2Yi 1 2 0,50 9,95 4,00 1,00 19,90 0,25 4,98 8 1,10 24,45 64,00 8,80 195,60 1,21 26,90 3 11 1,20 31,75 121,00 13,20 349,25 1,44 38,10 4 10 5,50 35,00 100,00 55,00 350,00 30,25 192,50 5 2,95 25,02 23,60 200,16 8,70 73,81 6 2,00 16,86 16,00 8,00 67,44 33,72 7 3,75 14,38 7,50 28,76 14,06 53,93 0,52 9,60 1,04 19,20 0,27 4,99 9 24,35 81,00 9,00 219,15 3,00 27,50 24,00 220,00 82,50 4,12 17,08 16,48 68,32 16,97 70,37 12 37,00 44,00 407,00 148,00 13 5,00 41,95 144,00 60,00 503,40 25,00 209,75

Perhitungan RL-B (lanjutan) No i Lampu Xi Jarak X2 Waktu y Xi12 Xi1Xi2 Xi1Yi Xi22 Xi2Yi 14 2 3,60 11,66 4,00 7,20 23,32 12,96 41,98 15 4 2,05 21,65 16,00 8,20 86,60 4,20 44,38 16 17,89 71,56 17 20 6,00 69,00 400,00 120,00 1.380,00 36,00 414,00 18 1 5,85 10,30 1,00 34,22 60,26 19 10 5,40 34,93 100,00 54,00 349,30 29,16 188,62 2,50 46,59 225,00 37,50 698,85 6,25 116,48 21 2,90 44,88 43,50 673,20 8,41 130,15 22 5,10 54,12 256,00 81,60 865,92 26,01 276,01 23 5,90 56,23 289,00 100,30 955,91 34,81 331,76 24 6 22,13 132,78 25 5 21,15 25,00 20,00 105,75 84,60 Jumlah 206 82,94 725,42 2.396,00 771,77 8.001,67 353,18 2.745,81

β0 ∑ Xik + β1 ∑ XikXi1 + β2 ∑ XikXi2 = 2.745,81 i=1 i=1 i=1 No i Lampu Xi Jarak X2 Waktu y Xi12 Xi1Xi2 Xi1Yi Xi2Yi 24 6 1,00 22,13 36,00 6,00 132,78 25 5 4,00 21,15 25,00 20,00 105,75 16,00 84,60 Jumlah 206 82,94 725,42 2.396,00 771,77 8.001,67 353,18 2.745,81 n n n β0 + β1 ∑ xi1 + β2 ∑ xi2 = 725,42 i=1 i=1 n n n β0 ∑ xi1 + β1 ∑ xi12 + β2 ∑ xi1xi2 = 8.001,67 i=1 i=1 i=1 n n n β0 ∑ Xik + β1 ∑ XikXi1 + β2 ∑ XikXi2 = 2.745,81 i=1 i=1 i=1

β0 25 + β1 206 + β2 82,94 = 725,42 β0 206 + β1 2.396 + β2 771,77 = 8.001,67 β0 82,94 + β1 771,77 + β2 353,18 = 2.745,81 Ketiga persamaan diatas diselesaikan shg diperoleh β0 = 2,31 ; β1 = 2,74 ; β2 = 1,24 Maka persamaan RL nya: Y = β0 + β1x1 + β2x2 menjadi Y = 2,31 + 2,74 x1 + 1,24 x2

Pengetahuan yg diperoleh: Dari 2,31 waktu tempuh, akan melewati 2,74 kali lampu merah ditambah 1,24 kali jarak rmh pelanggan Dari kasus diatas diketahui 1 lampu merah dan 1,5 km jaraknya, maka X1= 1 (lampu) dan X2=1,5 (jarak) shg kita dpt memprediksi lamanya wkt pesanan tiba di rmh pelanggan dgn cara: Y = 2,31 + 2,74 X1 + 1,24 X2 Y = 2,31 + 2,74 (1) + 1,24 (1,5) = 6,91 menit

Analisis Garis Regresi Menggunakan Koefisien Determinasi Kita telah pelajari subbab sblmnya bhw: Pers. Grs linear pertama dgn var. pemberi pengaruh x = jarak Y = 14,58 + 4,35 X Pers. Grs linear kedua dgn var. pemberi pengaruh x1 = jml lampu merah dan x2 = jarak tempuh  Y = 2,31 + 2,74 X1 + 1,24 X2 Pertanyaan  manakah yg lebih baik? Solusi  dpt menggunakan ukuran koefisien determinasi yg dinotasikan sbg R2

Koefisien Determinasi dpt dihitung dgn rumus: SSE Syy R2 = 1 - n n SSE = ∑ ei2 = ∑ (yi – yi)2 i=1 i=1 ^ n Syy = ∑ (yi – y)2 i=1

Perhitungan Koefisien Determinasi Y = 14,58 + 4,35 X Y = 2,31 + 2,74 X1 + 1,24 X2 No i Lampu Xi Jarak X2 Waktu y ŷi (yi-ŷi)2 (yi-ȳ)2 1 2 0,50 9,95 16,76 46,31 8,41 2,37 363,66 8 1,10 24,45 19,37 25,86 25,59 1,31 20,88 3 11 1,20 31,75 19,80 142,80 33,94 4,79 7,45 4 10 5,50 35,00 38,51 12,29 36,53 2,34 35,76 5 2,95 25,02 27,41 5,72 27,89 8,23 16,00 6 2,00 16,86 23,28 41,22 15,75 1,23 147,87 7 3,75 14,38 30,89 272,66 12,44 3,76 214,33 0,52 9,60 16,84 52,45 8,43 1,36 377,14 9 1,00 24,35 18,93 29,38 28,21 14,90 21,81 3,00 27,50 27,63 0,02 27,95 0,20 2,31 4,12 17,08 32,50 237,84 18,38 1,69 142,56 12 4,00 37,00 31,98 25,20 37,41 0,17 63,68 13 5,00 41,95 36,33 31,58 41,39 0,31 167,18 14 3,60 11,66 30,24 345,22 12,25 0,35 301,37

Perhitungan Koefisien Determinasi (2) No i Lampu Xi Jarak X2 Waktu y ŷi (yi-ŷi)2 (yi-ȳ)2 14 2 3,60 11,66 30,24 345,22 12,25 0,35 301,37 15 4 2,05 21,65 23,50 3,41 15,81 34,08 54,32 16 4,00 17,89 31,98 198,53 18,23 0,12 123,88 17 20 6,00 69,00 40,68 802,02 64,55 19,80 1.598,40 18 1 5,85 10,30 40,03 883,72 12,30 4,02 350,44 19 10 5,40 34,93 38,07 9,86 36,41 2,18 2,50 46,59 25,46 446,69 46,51 0,01 308,70 21 2,90 44,88 27,20 312,76 47,01 4,52 251,54 22 5,10 54,12 36,77 301,20 52,47 2,71 630,01 23 5,90 56,23 40,25 255,52 56,21 0,00 740,38 24 6 1,00 22,13 18,93 10,24 19,99 4,58 47,47 25 5 21,15 117,29 20,97 0,03 61,94 Jumlah 206 82,94 725,42 725,29 4.609,78 725,04 115,05 6.084,02 Rata-2 3,32 29,02

Hasil Pers. Regresi pertama (Y=14,58 + 4,35 X): SSE Syy R2 = 1 - SSE No i Lampu Xi Jarak X2 Waktu y ŷi (yi-ŷi)2 (yi-ȳ)2 24 6 1,00 22,13 18,93 10,24 19,99 4,58 47,47 25 5 4,00 21,15 31,98 117,29 20,97 0,03 61,94 Jumlah 206 82,94 725,42 725,29 4.609,78 725,04 115,05 6.084,02 Rata-2 3,32 29,02 Pers. Regresi pertama (Y=14,58 + 4,35 X): SSE Syy R2 = 1 - = 1 – (4.609,78 / 6.084,02) = 0,2423 = 24,23 % Pers. Regresi kedua (Y = 2,31 + 2,74 X1 +1,24 X2): SSE Syy R2 = 1 - = 1 – (115,05 / 6.084,02) = 0,9811 = 98,11 %

Hasil Grs regresi kedua ternyata memiliki Koefisien Determinasi yg lebih tinggi, grs tsb lbh dpt menjelaskan keberagaman wkt pengantaran pesanan. Utk memprediksi wkt pengantaran sebaiknya menggunakan garis regresi kedua yg mempertimbangkan dua variabel pemberi pengaruh, yaitu banyaknya lampu merah dan jarak rumah pelanggan

Kesimpulan Kegunaan fungsi prediksi Cara membuat persamaan garis regresi utk satu atw lbh variabel pemberi pengaruh Cara melakukan analisis perbandingan antara dua garis regresi berdasarkan koefisien determinasi