Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Analisa Data Statistik Chap 13: Regresi Linear (Lanjutan) Agoes Soehianie, Ph.D.

Presentasi serupa


Presentasi berjudul: "Analisa Data Statistik Chap 13: Regresi Linear (Lanjutan) Agoes Soehianie, Ph.D."— Transcript presentasi:

1 Analisa Data Statistik Chap 13: Regresi Linear (Lanjutan) Agoes Soehianie, Ph.D

2 ANOVA UNTUK ANALISA KUALITAS REGRESI Misal kita punya n data {X i,Y i }, dan kemudian dilakukan analisa regresi, sehingga bisa ditaksir besarnya variansi bagi Y: Atau secara ringkas ditulis sbb: SST = SSR + SSE SST : tak lain adalah SYY SSR : Regression Sum Squares merupakan variasi dari Y yg bisa dijelaskan oleh model regresi SSE : random error squares yg mencerminkan variasi di sekitar garis regresi Sehingga bisa dituliskan : SYY = SSR + SSE atau SSR = SYY – SSE Padahal SSE =SYY – b*SXY (lihat bab sebelumnya) Sehingga SSR = b*SXY

3 ANOVA UNTUK ANALISA KUALITAS REGRESI Hipotesa yg ingin diperiksa adalah apakah memang ada kaitan antara X dan Y, jadi : H0 : β = 0berarti Y tidak bergantung X! H1 : β ≠ 0 Untuk memeriksa kebenaran hipotesa ini bisa digunakan F-test, dengan nilai F: Dengan nilai S 2 = SSE/(n-2). H0 akan ditolak pada tingkat signifikan α, jika F α (1,n-2). Secara skematik komputasinya disajikan dalam tabel berikut ini: SUmber Variasi Sum Squares Derajat Kebebasan Mean Square F RegresiSSR1SSR/1SSR/{SSE/(n-2)} ErrorSSEn-2SSE/(n-2) TOTALSSTn-1

4 ANOVA UNTUK ANALISA KUALITAS REGRESI Jikalau H0 berhasil ditolak artinya terdapat jumlah variasi data Y yg signifikan yg bisa dijelaskan oleh model regresi yaitu kebergantungan Y secara linear thd X Test-F ini merupakan alternatif terhadap test yang menggunakan distribusi student t. Dalam Bab yg sebelumnya telah ditunjukkan kita bisa memeriksa hipotesa: H0 : β = β 0 H1 : β ≠ β 0 Dengan mempergunakan variabel test: Jikalau β 0 =0, maka testnya menjadi

5 ANOVA UNTUK ANALISA KUALITAS REGRESI Sedikit pengolahan menunjukkan: Tetapi: b= SXY/SXX, sehingga Tetapi yang terakhir ini tak lain adalah nilai F.

6 Data dengan Pengulangan Pengukuran

7 Data Dengan Pengulangan Pengukuran Seringkali dalam pengukuran dimungkinkan untuk sebuah nilai X i diulang beberapa kali untuk mendapatkan beberapa nilai Y i1, Y i2, dst. Pengukuran ulang ini memberi cara untuk mengevaluasi model regresi linear secara lebih akurat. Dengan cara ini Error Sum Squares terdiri dari dua komponen: a) variasi dari Y untuk sebuah nilai X  error murni (pure) krn experiment b) dan kontribusi yg disebut Lack of Fit  variasi sistematik yg disebabkan suku order tinggi (non linear) Misalkan ada k grup data berdasarkan kesamaan X. Variansi yg murni (pure) dari experiment, SSE (pure) adalah: dan variansi Y= S 2 =SSE(pure)/(n-k)

8 Data Dengan Pengulangan Pengukuran Sedangkan variansi SSE yg umum adalah: Dengan derajat kebebasan = n-2. Dan variansi karena Lack of Fit adalah = SSE – SSE (pure), dengan derajat kebebasan (k-2).

9 KONSEP LACK of FIT Sedangkan variansi SSE yg umum adalah: BELUM SELESAI

10 Tabel Perhitungan Lack of Fit SUmber Variasi Sum Squares Derajat Kebebasan Mean Square F Error RegresiSSR SSE 1 n-2 SSR/1SSR/S 2 Lack of FitSSE- SSE (pure) k-2 Pure ErrorSSE (pure)n-k TOTALSSTn-1

11 Contoh. Lack of Fit xyXe=X-XmYe=Y-YmXe^2Ye^2Xe*YeYteori(Y-Yteor)i^2Ygrup(Y-Ygrup)^2 115077.4-75-9.085625.0082.51681.2577.740.1277.430.00 215076.7-75-9.785625.0095.71733.7577.741.0977.430.54 315078.2-75-8.285625.0068.61621.2577.740.2177.430.59 420084.1-25-2.38625.005.6859.5883.570.2884.100.00 520084.5-25-1.98625.003.9349.5883.570.8684.100.16 620083.7-25-2.78625.007.7569.5883.570.0284.100.16 725088.9252.42625.005.8460.4289.400.2589.270.13 825089.2252.72625.007.3867.9289.400.0489.270.00 925089.7253.22625.0010.3580.4289.400.0989.270.19 1030094.8758.325625.0069.17623.7595.220.1895.130.11 1130094.7758.225625.0067.51616.2595.220.2795.130.19 1230095.9759.425625.0088.67706.2595.220.4695.130.59 Sum27001037.80 37500513.124370.001037.803.871037.802.66 Mean22586.483330 312542.76364.1786.480.3286.480.22 SSE (pure) SSE SXY SXX SYY

12 Contoh.

13 TRANSFORMATION Bentuk Fungsi Asal TransformasiRegresi Y=A exp (Bx) Exponen Ln(Y) = Ln(A) + BxY* = Ln(Y) vs X Y=Ax B Pangkat Log(Y)=Log(A)+ B*log(X)Y*=Log(Y) vs X* = Log(X) Y= A + B/X Resiprok Y = A + B (1/X)Y*=Y vs X*=1/X Y=X/(A+BX) Hiperbola (1/Y)=B+A(1/X)Y*=1/Y vs X*=(1/X)

14 Bentuk Fungsi

15 Implikasi Transformasi Pada Regresi Linear Beberapa definisi variasi. 3. Variasi Random Jumlah total kuadrat selisih data dengan rata-rata sampel yg terkait Dengan G adalah banyak group, n g adalah banyak sampel di group-g. Dapat dibuktikan bahwa ketiga variasi tsb saling terkait: SS total = SST + SSE

16 TEST ANOVA 1. Hipotesa H0: μ 1 = μ 2 = μ 3 = …. H1: tidak semua rata-rata populasi sama 2. Tentukan tingkat signifikan α 3. Daerah kritis Test statistiknya adalah F-test dengan dimana MST : Mean Squares of Treatments (between groups) MSE : Mean Squares of Errors (within errors) Dengan k : jumlah grup dan n adalah banyak total semua data. Derajat kebebasan F adalah (v 1 =k-1) untuk pembilang dan (v 2 =n-k) untuk penyebut. Tentukan nilai kritis F α (v 1,v 2 ) = F kritis. Tolak H0 jika F hitung > F kritis

17 TEST ANOVA 4. Perhitungan 5. Keputusan Bandingkan F hitung dengan F kritis 6. Kesimpulan TABEL ANOVA Sumber variasi Sum of Squares Derajat kebebasan Mean Squares F hitung Treatment (antar grup) SSTk-1MST=SST/(k-1)MST/MSE Error (dalam grup) SSEn-kMSE=SSE/(n-k) TotalSS totaln-1

18 TEST ANOVA – Contoh Prof. Xsentrik memiliki 22 murid di kuliah Statistik. Murid-murid tsb diminta memberikan rating thd perkuliahannya dalam 4 kategori: Baik sekali, Baik, Cukup dan Jelek. Setelah itu diakhir kuliah diperoleh data nilai akhir Statistik para murid tsb. GRUP Baik sekaliBaikCukupJelek 1234 94757068 90687370 85777672 80837865 888074 6865

19 SOlusi - Excell Anova: Single Factor SUMMARY GroupsCountSumAverageVariance Baik sekali434987.2536.91667 Baik539178.258.7 Cukup751072.8571430.14286 Jelek64146913.6 ANOVA Source of VariationSSdfMSFP-valueF crit Between Groups890.68383296.89468.9906430.0007433.159908 Within Groups594.40711833.02262 Total1485.09121

20 SOlusi – Manual (menghitung rata-rata dalam grup dan grand) GRUP Baik sekaliBaikCukupJelek 1234 ------------------------------------------------------------------------------ 94757068 90687370 85777672 80837865 888074 6865 65 ---------------------------------------------------------------------------------------------------- Σ349391510414 Rata-rata87.2578.272.8669 Rata-rata dalam grup Rata-rata grand

21 SOlusi – Menghitung SSE (variasi antar grup) SST = 890.68 Jumlah data di Grup1 : 4 Grup 2 : 5 Grup 3 : 7 Grup 4 : 6

22 SOlusi – Menghitung Variasi Dalam Grup 45.5610.248.161.00 7.56104.040.021.00 5.061.449.889.00 52.5623.0426.4516.00 96.0451.0225.00 23.5916.00 61.73 ---------------------------------------------------------------------------------- 110.75234.8180.8668 SSE = 110.75+234.8+180.86+68 = 594.41

23 SOlusi – Menghitung Variasi Total SStotal = 1485.09 337.220.4031.7758.31 206.3158.316.9531.77 87.681.860.1313.22 19.0454.225.59113.13 152.8619.042.68 58.31113.13 113.13 ---------------------------------------------------------------------------------------------- 650.26267.66234.93332.25

24 SOlusi – Ringkasan Hitungan Variasi antar grup : SST = 890.68 v 1 = 4-1=3 MST= SST/v 1 =296.89 Variasi dalam grup : SSE = 594.41 v 2 = 22-4=18MSE=SSE/v 2 =33.02 Variasi total : SSTotal = 1485.09 F hitung = MST/MSE = 296.89/33.02 = 8.99 Dengan derajat kebebasan v 1 =3 dan v 2 =18

25 SOlusi – Testing Hipotesis 1. Hipotesa H0: μ 1 = μ 2 = μ 3 = μ 4 H1: tidak semua rata-rata populasi sama 2. tingkat signifikan α = 5% 3. Daerah kritis Test statistiknya adalah F-test. F(v 1,v 2 ) = MST/MSE dengan dengan v 1 =k-1 = 4-1 = 3 dan v 2 = n-k = 22-4 = 18 Nilai kritis F 0.025 (3,18) = 3.16 Tolak H0 jika F> 3.16 4. Perhitungan F hitung = MST/MSE = 296.89/33.02 = 8.99 5. Keputusan : Karena F > 3.16 maka H0 ditolak 5. Kesimpulan : Tidak semua rata-rata grup sama


Download ppt "Analisa Data Statistik Chap 13: Regresi Linear (Lanjutan) Agoes Soehianie, Ph.D."

Presentasi serupa


Iklan oleh Google