Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Analisa Data Statistik Chap 14: Regresi Linear Jamak (Multiple Linear Regression) Agoes Soehianie, Ph.D.

Presentasi serupa


Presentasi berjudul: "Analisa Data Statistik Chap 14: Regresi Linear Jamak (Multiple Linear Regression) Agoes Soehianie, Ph.D."— Transcript presentasi:

1 Analisa Data Statistik Chap 14: Regresi Linear Jamak (Multiple Linear Regression) Agoes Soehianie, Ph.D

2 LATAR BELAKANG Sering kali ada lebih dari 1 variabel independen (X k ) yang menentukan variabel dependen (Y). Sehingga model Regresi Jamak (Multiple Regression Model) diperlukan. Jikalau hubungan antara Y dan X k linear maka model disebut Model Regresi Linear Jamak (Multiple Linear Regression Model). Untuk populasi model tsb, berarti nilai rata-rata Y akan diberikan oleh Y = β 0 + β 1 X 1 + β 2 X 2 + ….+ β k X k Dan estimasi bagi Y yang diperoleh dari sampel adalah:

3 MENGHITUNG KOEFISIEN Misalkan dari sampel diperoleh data {Y i, X 1i, X 2i, …, X ki } untuk i=1,n maka model regresi linear jamaknya adalah: Dengan e i adalah random error. Memakai cara yg sama dengan regresi linear, didefinisikan SSE: Dengan diferensiasi thd b 0, b 1, dst hasilnya = 0, maka diperoleh satu set sistem persamaan linear bari b 0,b 1, ….

4 Persamaan Bagi Koefisien Sistem Persamaan Linear ini diselesaikan dengan metoda yg dikenal, misalnya Eliminasi-Gauss atau Gauss-Jordan, Dekomposisi LU dll

5 Contoh Sebuah studi tentang emisi NOx dari sebuah truk dilakukan untuk melihat pengaru dari kelembaban, suhu, dan tekanan udara mempengaruhi emisi NOx. Model yg ingin dites adalah: Dengan Y adalah kadar (ppm) dari NOx yg diemisi truk, X 1 : kelembaban, X 2 : suhu dan X 3 : tekanan udara saat percobaan. Y = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3 NOX(ppm)Kelembaban(%)Suhu(F)Tekanan (Psi) NoYX1X2X Sum Average

6 Matrix SPL bagi Koefisien Y = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3

7 Tabel Perhitungan Manual X 1 *X 2 X 1 *X 3 X 2 *X 3 X12X12 X22X22 X32X32 X1YX1YX2YX2YX3YX3Y Σ Mean

8 Matrix SPL dan SOlusi b b b b = Mb = N Salah satu cara solusi : b =M -1 N M -1 Y = X 1 – X X 3

9 Perluasan : Regresi Polinomial Model multiple regresi linear juga bisa langsung diterapkan untuk model regresi polinomial: Y = b 0 + b 1 x + b 2 x 2 +b 3 x 3 + ….+ b n x n Dengan analogi : x = x 1 x 2 =x 2 x 3 = x 3 …. X n = x n dengan Substitusi ini semua rumus yang dipakai untuk menghitung koefisien b 0, b 1 dst bisa dipergunakan dengan penyesuaian seperlunya. Soal. Diberikan data berikut X Y Buatlah kurva regresi Y thd X jika Y = b 0 +b 1 X + b 2 X 2 + b 3 X 3

10 Hipotesa yg ingin diperiksa adalah : H0 : β 1 = β 2 = β 3 = β 4 =… 0 berarti Y tidak bergantung semua X k H1 : Paling tidak ada 1 nilai β k ≠ 0 Untuk memeriksa kebenaran hipotesa ini bisa digunakan F-test, dengan nilai F: Dengan v1=k dan v2=n-(k+1) dan test 1 ekor bagian atas. Jadi H0 ditolak Jika F > F kritis ANOVA UNTUK REGRESI JAMAK LINEAR SUmber Variasi Sum Squares Derajat Kebebasan Mean SquareF RegresiSSRkMSR= SSR/kMSR/MSE ErrorSSEn-(k+1)MSE=SSE/ {n-(k+1)} TOTALSSTn-1

11 ANOVA: Sumber-sumber Variansi X : mean (X,Y) SSE SSR SSTot

12 TESTING INVIDUAL KOEFISIEN Untuk masing-masing koefisien, dapat dilakukan test hipotesa H0 : β k = 0 H1 : β k ≠ 0 Dengan mempergunakan variabel test: Variabel t ini terdistribusi menurut student-t dengan derajat kebebasan v=n-(k+1). Dengan S bk adalah standard error dari koefisien b k. Perhitungan S bk secara manual rumit, melibatkan elemen diagonal dari matrix variansi-kovariansi. (Lihat Text Book)

13 INTERVAL BAGI KOEFISIEN Interval kepercayaan 100(1-α)% bagi koefisien β k adalah: Variabel t ini terdistribusi menurut student-t dengan derajat kebebasan v=n-(k+1).

14 Contoh. X1X2X3YPrediksi No TempInsulAgeCostY' (Y-Y' ) 2 (Y-Ym) 2 (Y' - Ym) Sum Mean Y’: Y Prediksi Ym: Y mean

15 Hipotesa Testing (Global) Hipotesa yg ingin diperiksa adalah : H0 : β1= β2= β3=0 berarti Y tidak bergantung semua Xk H1 : Paling tidak ada 1 nilai βk ≠ 0 Untuk memeriksa kebenaran hipotesa ini bisa digunakan F-test, dengan nilai F: Dengan jumlah data n=20 dan jumlah variabel independen k=3

16 Contoh. Dilakukan multiple regresi linear: Y = b 0 + b 1 X 1 + b 2 X 2 + b 3 X 3 Hasilnya adalah: b 0 b 1 b 2 b 3 Persamaan Regresinya: Y prediksi = Y = – 4.583X X X 3 Dari model ini kemudian bisa dihitung: SStot=SSE+SSR

17 Contoh. Dari tabel diperoleh: SSE = SSR = SSTot = Banyak data n=20, banyak variabel bebas k=3 SUmber Variasi Sum Squares Derajat Kebebasan Mean SquareF RegresiSSRkMSR= SSR/kMSR/MSE ErrorSSEn-(k+1)MSE=SSE/ {n-(k+1)} TOTALSSTotn-1 SUmber Variasi Sum Squares Derajat Kebebasan Mean SquareF Regresi Error (3+1) TOTAL

18 Contoh. Dari tabel F untuk v1=3 danv2=16, dan tingkat signifikan α= 0.05 Diperoleh nilai kritis F adalah F(3,16) = Hasil perhitungan menunjukkan F=21.9. Karena 21.9 > 3.24 maka H0 ditolak, sehingga tidak benar kalau dikatakan bahwa X1, X2 dan X3 seluruhnya tidak menentukan nilai Y.

19 Line Fit

20 Koefisien Korelasi Jamak dan Determinasi Jamak Koefisien Determinasi Jamak (Multiple Determination) R 2 adalah total variasi data Y yang bisa dijelaskan oleh model regresi, yaitu: Yaitu variansi karena regresi dibagi variasi total. Sedangkan R : koefisien korelasi jamak = Selain itu juga didefinisikan Adjusted R 2 R 2 selalu bertambah dengan penambahan variabel independen. R 2 adj memperhitungkan pengaruh ini, sehingga akan “menghukum” overfitted model.

21 Dari tabel diperoleh: SSE = SSR = SSTot = Banyak data n=20, banyak variabel bebas k=3 Selain itu juga didefinisikan Adjusted R 2 Koefisien adjusted R 2 baru berarti bilamana dalam pembentukan model ingin diketahui apakah penambahan variabel independen baru memang memperbaiki model atau tidak. Koefisien Korelasi Jamak dan Determinasi Jamak

22 Hasil Output Excell

23 TESTING INVIDUAL KOEFISIEN Untuk masing-masing koefisien, dapat dilakukan test hipotesa H0 : β 1 = 0 H0 : β 2 = 0 H0 : β 3 = 0 H1 : β 1 ≠ 0H1 : β 2 ≠ 0H1 : β 3 ≠ 0 Dari output Excell S b1 = standard error b 1 = 0.772, maka t 1 Hasil ini bisa dilihat juga di output Excell tsb (kolom t stat ), demikian juga untuk t 2 = dan t 3 = Dari Output Excell hal itu bisa secara cepat dilihat pada nilai P-value yang menyatakan luas daerah sebelah kanan nilai t-hitung

24 TESTING INVIDUAL KOEFISIEN Test ini adalah test 2 ekor dengan derajat kebebasan v=n-(k+1) = 20- (3+1)=16. Untuk tingkat signifikan α = 0.05 maka t (v=16) = (dari tabel). Berarti H0 di tolak jika t hitung Berarti dari t 1 = t 2 = dan t 3 = 1.521, H0 ditolak untuk t 1, t 2 dan diterima untuk t 3. Berarti variabel X 1 (temp) dan X 2 (insulasi) memiliki pengaruh signifikan pada biaya Y (cost), sedangkan X 3 (age) tidak berkontribusi secara signifikan thd Y(cost).

25 INTERVAL BAGI KOEFISIEN Interval bagi koefisien β k untuk tingkat kepercayaan 95% dapat juga disusun. Nilai t =2.12 untuk v=20-(3+1) Hasil tsb juga dapat dilihat pada output Excell. Pada kolom lower95% dan Upper 95%. Terlihat memang interval 95% bagi koefisien Age membentang dari hingga !


Download ppt "Analisa Data Statistik Chap 14: Regresi Linear Jamak (Multiple Linear Regression) Agoes Soehianie, Ph.D."

Presentasi serupa


Iklan oleh Google