Analisis Korelasi dan Regresi linier
Definisi Hubungan antara 2 variabel X dan Y. X Y X Y X Y hubungan pengaruh X Y pengaruh
Analisis Korelasi Product Moment dari Pearson (r) Analisis hubungan/korelasi antara 2 variabel. Persyaratan harus dipenuhi adalah data berskala interval atau rasio, dan berdistribusi normal .
Tanda – dan + menunjukkan arah, artinya Koefisien korelasi antara –1 s.d +1. Tanda – dan + menunjukkan arah, artinya (-) : Nilai salah satu variabel meningkat maka variabel lain akan menurun. (+) : Nilai salah satu variabel meningkat maka variabel lain juga meningkat atau nilai salah satu variabel menurun maka variabel lain akan menurun. Nilai koefisien mendekati 1, (–) / (+), menunjukkan koefisien yang makin besar, nilai koefisien mendekati 0, menunjukkan koefisien yang mengecil.
Dibuat grafik akan terlihat arah tanda koefisien korelasi
Uji Kemaknaan untuk koefisien Korelasi Uji Hipotesis : H0 : = 0 H1 : 0 H0 ditolak bila r > r (n-2) lihat tabel r CONTOH : Apakah ada korelasi antara badan yang gemuk (diukur adalah Berat Badan ) dengan kadar kholesterol darah ( = 0,05). Data secara random didapatkan sebagai berikut:
Ho: tidak ada korelasi antara berat badan dengan kadar kolesterol darah ( = 0) XY - X . Y/n r = ---------------------------------------------- [X2 - (X)2/n ] [ Y2 - (Y) 2/n] 122300 - 600 . 1980 / 10 r = ------------------------------------------------- [37550 - 6002/10] [ 406600 - 19802/10] r = 0,737 df = n - 2 = 8 Titik kritis r0,05 (df=8) = 0,632 Ho ditolak, r = 0,737 bermakna
Cara lain untuk uji kemaknaan koefisien r adalah dengan uji t Cara lain untuk uji kemaknaan koefisien r adalah dengan uji t. Rumus t = r Vn-2/V1-r kuadrat Komputer menunjukkan
Analisis Regresi Linier Tentang pengaruh variabel bebas terhadap variabel tergantung. Variabel bebas: X Variabel tergantung: Y Variabel X sebagai variabel penyebab Variabel Y sebagai variabel akibat.
variabel bebas disebut juga variabel eksogen atau variabel prediktor, Variabel akibat atau efek juga disebut variabel respons, terikat, tergantung, atau variabel endogen
Contoh: Tingkat pendidikan apakah berpengaruh terhadap pendapatan? Apakah tingkat pendidikan ibu berpengaruh terhadap gizi anaknya?
variabel pendapatan merupakan variabel respons. Pada studi sosio-ekonomi, variabel tingkat pendidikan merupakan variabel prediktor, variabel pendapatan merupakan variabel respons.
Gizi anaknya adalah variabel respon. Pada studi kesehatan, tingkat pendidikan ibu merupakan variabel prediktor Gizi anaknya adalah variabel respon.
y= b0 + b1x b0 : intercept b1: Slope Berdasarkan hubungan yang bersifat linier tersebut maka hubungan yang bersifat linier tersebut dapat dirumuskan menjadi y= b0 + b1x b0 : intercept b1: Slope
b0 : intercept (perpotongan) garis regresi terhadap axis y b1: slope garis regresi, atau perubahan per unit y terhadap perubahan per unit x.
ESTIMASI PARAMETER METODE : (Pada umumnya) LEAST SQUARES (KUADRAT TERKECIL)
b0 = Y – b 1X atau b 0 = Yi /n –b 1. Xi /n Perhitungan : (Xi -X) (Yi - Y) b1 = ---------------------------- (Xi - X ) 2 atau Xi Yi - ( Xi) ( Yi)/n b1 = ---------------------------------------- Xi2 - ( Xi)2 /n b0 = Y – b 1X atau b 0 = Yi /n –b 1. Xi /n
Nilai kualitas pelayanan apakah akan mempengaruhi jumlah penjualan barang. Contoh perhitungan lihat buku materi
Xi Yi - ( Xi) ( Yi)/n 288380 – (1782)(5485)/34 b1 = ------------------------- = ---------------------------- = 1,29 Xi2 - ( Xi)2 /n 94098 – (1782)2/ 34 b0 = Yi /n -1. Xi /n = 161,32 – (1,29 . 52,41) = 93,85 Y= 93,85 + 1,29 X Misalkan nilai kualitas layanan =64 maka jumlah penjualan barang sebesar Y= 93,85 + 1,29 (64) = 176,41.
Analisis komputer hasil sebagai berikut: Model Summary a Predictors: (Constant), X R 2 (Koefisien determinasi) sebesar 0,477 artinya 47,7% Y dipengaruhi oleh X, sedang sisanya 52,3% dipengaruhi variabel lain.
ANOVA(b) a Predictors: (Constant), X b Dependent Variable: Y Secara umum model persamaan regresi adalah fit dengan tingkat signifikansi p < 0,05.
Model yang ada menunjukkan, Harga Konstanta: 93,85 p=0,000 Coefficients(a) a Dependent Variable: Y Model yang ada menunjukkan, Harga Konstanta: 93,85 p=0,000 Harga X : 1,287 p=0,000 Ada pengaruh layanan terhadap penjualan Maka persamaan regresi adalah: Y= 93,85 + 1,287 X
Terdapat lebih dari 1 variabel bebas (X). ANALISIS REGRESI LINIER BERGANDA (Multiple Linear Regression) Terdapat lebih dari 1 variabel bebas (X). Penelitian yang memerlukan kajian berbagai macam variabel yang bisa mempengaruhi satu variabel lain
Model statistik untuk regresi linier berganda : Y = 0 + 1X1 + 2X2 + 3X3 + ... + i
Beberapa uji asumsi : 1. i berdistribusi normal dan merupakan variabel random dengan ( i ) = 0
2. Homoskedasitas Tidak terjadi korelasi antara residu dengan variabel bebas Cara uji dgn analisis korelasi Spearman: antara nilai residu dengan masing-masing variabel independen, Jika tidak didapatkan korelasi yang signifikan, maka dikatakan tidak terjadi heteroskedasitas.
3. Tidak ada otokorelasi error term atau galat i dan j yang berkaitan dengan pengamatan ke i dan ke j adalah tidak berhubungan. Pengujian dengan Durbin Watson
4.Tidak ada multikolinearitas Berarti tidak ada hubungan yang signifikan antara variabel bebas Mendeteksi terjadinya multikolinear adalah dengan korelasi Pearson Apabila terdapat korelasi yang signifikan antara variabel bebas berarti terjadi multikolinear.
5. Linearitas. Mendeteksi linieritas ada beberapa cara, diantaranya melihat diagram pencar (scatter plot) antara masing-masing variabel bebas dengan variabel tergantung.
Contoh Variables Entered/Removed(b) a All requested variables entered. b Dependent Variable: Y
Model Summary a Predictors: (Constant), X2, X1 ANOVA(b) b Dependent Variable: Y
Harga parameter semuanya sig > 0,05 Model regresi tidak fit sehingga tidak bisa digunakan untuk memprediksi Pengaruh variabel X1, X2 terhadap variabel Y tidak bermakna