Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

1 ANALISIS REGRESI (REGRESSION ANALYSIS) Oleh: Erni Tri Astuti Sekolah Tinggi Ilmu Statistik Jakarta 2004.

Presentasi serupa


Presentasi berjudul: "1 ANALISIS REGRESI (REGRESSION ANALYSIS) Oleh: Erni Tri Astuti Sekolah Tinggi Ilmu Statistik Jakarta 2004."— Transcript presentasi:

1 1 ANALISIS REGRESI (REGRESSION ANALYSIS) Oleh: Erni Tri Astuti Sekolah Tinggi Ilmu Statistik Jakarta 2004

2 2 HUBUNGAN ANTAR VARIABEL Transformasi

3 3 REGRESI DAN KORELASI (Keduanya mempelajari hubungan antar variabel) Regresi Mempelajari bentuk hubungan antar variabel melalui persamaan matematis (RLS, RLB, Regresi non Linear). Hubungan bisa berupa hubungan sebab akibat. Dapat mengukur seberapa besar suatu variabel mempengaruhi variabel lain Dapat digunakan untuk melakukan peramalan nilai suatu variabel berdasarkan variabel lain

4 4 REGRESI DAN KORELASI (Keduanya mempelajari hubungan antar variabel) Korelasi Mempelajari keeratan hubungan antar 2 variabel kuantitatif yang bisa dilihat dari besarnya angka, bukan tandanya Dapat mengetahui arah hubungan yang terjadi (berbanding lurus jika tandanya positif, dan berbanding terbalik jika tandanya negatif) Nilainya berkisar -1 sampai dengan 1 Tidak bisa menyatakan hubungan sebab akibat

5 5 Contoh: (1) # kematian karena kekeringan di musim panas # soft drink yang dikonsumsi di musin panas High positive correlation Apakah soft drink menyebabkan kematian? (2)Gaji guru dan jumlah $ yang diperoleh dalam penjualan minuman keras. High positive correlation Apakah guru membelanjakan uangnya untuk membeli minuman keras? Korelasi yang tinggi tidak selalu berarti bahwa suatu variabel menyebabkan/mempengaruhi variabel yang lain

6 6 Regression Line and Regression Equation Dependent and Independent Variable Dependent Variable/Variabel Tak Bebas (Y): Variabel yang nilainya ditentukan oleh variabel lain. Diasumsikan bersifat random/stochastic Independent Variable/Variabel Bebas (X): Variabel yang nilainya ditentukan secara bebas (variabel yang diduga mempengaruhi variabel tak bebas). Diasumsikan bersifat fixed/non stochastic.

7 7 An Example Effect of Car Age on its Price (to what degree can Car Age predict Its Price) Effect of Woman Age on Her Fertility (to what degree can Woman Age predict Her Fertility level) Effect of A Person Height on His/Her Weight (to what degree can A Person Height predict His/Her Weight) Effect of Household Income to Their Consumption Expenditure (to what degree can Household Income predict Their Consumption Expenditure) Effect of Dow Jones Performance on Darts performance (to what degree can Dow Jones predict Dart performance) etc.

8 8 Relationship can be represented by line of best fit Contoh Ploting Data Dow vs Dart

9 9 Keterangan Ternyata titik-titik (plotting data) tersebut terlihat mengelompok di sekitar garis lurus Pada scatter plot tersebut, sebenarnya bisa ditarik beberapa garis yang dekat terhadap titik-titik tersebut Tujuan kita di sini adalah 1. Mencari garis yang paling tepat 2. Melakukan Peramalan 3. Ingin mengetahui hubungan yang terjadi (seberapa cepat Darts berubah pada saat Dow Jones berubah sebesar satu unit)

10 10 Beberapa Model Regresi Linear Models in which the parameters (  0,  1,...,  k ) all have exponents of one are called linear models. First-Order Model with One Predictor Variable Second-Order Model with One Predictor Variable Second-Order Model with Two Predictor Variables with Interaction etc.

11 11 Persamaan Regresi Linear Sederhana Model :  Y|X =  0 +  1 X = E(Y|X) Jika (X i,Y i ) merupakan data berpasangan, maka titik tersebut akan menyimpang terhadap garis regresinya, sehingga persamaan regresinya menjadi Y i =  0 +  1 X i +  i Untuk sampel berukuran n, maka akan terdapat pasangan {(x i, y i ); i = 1, 2, …, n} sehingga  0 dan  1 harus diestimasi menjadi b 0 dan b 1 Persamaan regresi sampelnya adalah y i = b 0 + b 1 x i + e i

12 12 Beberapa Asumsi Y i (Variabel Tak Bebas/Dependent Variable) merupakan random variable/bersifat stochastic Xi (Variabel bebas/Independent Variable) bersifat fixed/non stochastic (bukan merupakan random variable) E(  i ) = 0 E(  i  j ) =  2 untuk i = j (Homoscedastic) E(  i  j ) = 0 untuk i  j (Non autocorrelation)

13 13 Beberapa Asumsi (Lanjutan)  i merupakan random variable yang terdistribusi secara bebas dan indentik mengikuti distribusi normal dengan rata-rata 0 dan varian  2 atau biasa dituliskan sebagai  i ~ N ID (0,  2 ) Y i terdistribusi normal dengan varian sama seperti pada  i (BUKTIKAN!) iid BAGAIMANA JIKA ADA ASUMSI YANG TIDAK TERPENUHI? BAGAIMANA MENDETEKSINYA? BAGAIMANA MENGUJI? BAGAIMANA ALTERNATIF SOLUSINYA?

14 14 Pendugaan/Estimasi Parameter

15 15 Least Squares Criterion Prinsipnya: Min Pada model regresi linear sederhana dengan asumsi yang telah diberlakukan, maka dipakai Metode Ordinary Least Squares (OLS) untuk mengestimasi parameter model Dengan OLS akan diperoleh

16 16 Pada Kasus Dow vs Dart diperoleh hasil b 1 = b 0 = Suppose that we want to predict Darts score for a new Dow Score of 25 We predict that Darts will be at when Dow is at 25 Check with data: what is real value of Darts when Dow is 25

17 17 Residual Prediction

18 18 Example: Relationship between Car Age (X) and its Price (Y)

19 19 Prosedur Penghitungan untuk Estimasi Parameter

20 20

21 21 Regression line and data points for Car Age and Price Data

22 22 Sifat-sifat Estimator Least Squares Jika semua asumsi yang diberlakukan terhadap model regresi terpenuhi, maka menurut suatu teorema (Gauss Markov theorem) estimator tersebut akan bersifat BLUE (Best Linear Unbiased Estimator). Best = Terbaik, mempunyai varian yang minimum Linear = Linear dalam Variabel Random Y Unbiased = Tak bias Artinya estimator tersebut akan unbiased dan mempunyai varian yang minimum diantara semua estimator unbiased yang lain. BUKTIKAN!

23 23 Residual

24 24 Inferensi dalam Analisis Regresi Model Regresi Linear Sederhana Yi =  0 +  1 X i +  i Dimana  i merupakan random variabel yang terdistribusi N ID (0,  2 ) Contoh: Sebuah Perusahaan, Westwood Company, sedang meneliti tentang hubungan antara jumlah sparepart yang diproduksi (X) dengan jumlah jam kerja yang diperlukan (Y) dari 10 proses produksi terakhir. (Data ada di buku Neter and Wasserman, halaman 40)

25 25 Inferensi Tentang  1 Confidence Interval dan Uji Hipotesis Distribusi Sampling  1 Teorema:Kombinasi Linear dari r.v. normal akan terdistribusi normal. BUKTIKAN! Estimasi Varian=

26 26 Distribusi Sampling untuk BUKTIKAN! CI (1-  ) untuk Pada contoh Westwood Company, diperoleh n = 10 SSE = 60MSE = 7.5 Sehingga CI 95 % untuk  1 adalah P(1.89 ≤  1 ≤ 2.11) = 95 %

27 27 Uji Hipotesis Tentang  1 a.H 0 :  1 = 0b.H 0 :  1 ≤ 0c. H 0 :  1 ≥ 0 H 1 :  1 ≠ 0H 1 :  1 > 0 H 1 :  1 < 0 Statistik Uji: Keputusanpada tingkat sign.  : Tolak H 0 jika a. b. c. Pada contoh Westwood Co., diperoleh t* = t (0.975,8) = dan t (0.95,8) = Keputusan? Kesimpulan?

28 28 Inferensi Tentang  0 Akan mempunyai arti jika cakupan model memuat X = 0 Distribusi Sampling  0 BUKTIKAN! Est. Varian = Distribusi Sampling Untuk BUKTIKAN! CI (1-  ) untuk  0

29 29 Pendekatan ANOVA dalam Analisis Regresi Dasar: Partisi dari Sum Squares Total (SST) dan derajat bebas SST SSE SSR df n – 1 n – 2 1 Rumus untuk penghitungan

30 30 Ilustrasi Geometris Partisi Jumlah Kuadrat YiYi

31 31 Mean Squares (MS): SS dibagi dengan derajat bebasnya Pada Westwood Co., diperoleh SSR = dan SSE = 60, sehingga Tabel ANOVA untuk Regresi Linear Sederhana Source of Variation SSdfMSE{MS}F* Regression1MSR Errorn–2MSE Totaln–1

32 32 Anova tersebut dapat digunakan untuk menguji H 0 :  1 = 0 vs H 1 :  1 ≠ 0 Tabel ANOVA untuk Kasus Westwood Company Keputusan: Tolak H 0 jika F* > F (1-  ;1, n-2) Dari tabel F, diperoleh F (0.95;1, 8) = 5,32 Kesimpulan? Source of VariationSSdfMSF* Regression Error Total136609

33 33 Equivalence of F Test and t Test Untuk  tertentu, Statistik Uji F untuk H 0 :  1 = 0 vs H 1 :  1 ≠ 0 adalah equivalent dengan statistik uji t dua arah. Bukti: Koefisien Determinasi (r 2 ) Mengukur proporsi keragaman total dari nilai observasi Y di sekitar rataannya yang dapat diterangkan oleh garis regresinya. Nilainya: 0 ≤ r 2 ≤ 1

34 34 Linear Correlation Coefficient - Measure of strength of linear relationship The linear correlation coefficient ranges between –1 and 1.

35 35 Various degrees of linear correlation

36 36 Various degrees of linear correlation

37 37 Example: linear correlation coefficient for Car Age and Price Data

38 38 SPSS Printout for one Predictor R 2, Percentage of Variance

39 39 Intercept Slope Is regression Significant? Error of prediction


Download ppt "1 ANALISIS REGRESI (REGRESSION ANALYSIS) Oleh: Erni Tri Astuti Sekolah Tinggi Ilmu Statistik Jakarta 2004."

Presentasi serupa


Iklan oleh Google