ANALISIS REGRESI DAN KORELASI Pertemuan 13 dan 14
Dalam ilmu statistika, teknik yang umum digunakan untuk menganalisis hubungan antara dua atau lebih variabel adalah analisis regresi. Model matematis dalam menjelaskan hubungan antar variabel dalam analisis regresi menggunakan persamaan regresi.
Perbedaan dasar antara korelasi dan regresi Korelasi hanya menunjukkan sekedar hubungan. Dalam korelasi variabel tidak ada istilah tergantung dan variabel bebas. Regresi menunjukkan hubungan pengaruh. Dalam regresi terdapat istilah tergantung dan variabel bebas.
Dalam suatu persamaan regresi terdapat 2 macam variabel, yaitu : Variabel dependen (variabel tak bebas) adalah variabel yang nilainya bergantung dari variabel lain. Biasanya dinyatakan dengan Y. Variabel independen (variabel bebas) adalah variabel yang nilainya tidak bergantung dari variabel lain. Biasanya dinyatakan dengan X.
Prinsip dasar Dalam membangun suatu persamaan regresi adalah bahwa antara variabel dependen dengan variabel independennya mempunyai sifat hubungan sebab akibat (hubungan kausalitas = causal relationship), baik yang didasarkan pada teori, hasil penelitian sebelumnya, ataupun yang didasarkan pada penjelasan logis tertentu.
Analisis Korelasi Sederhana : Adalah teknik statistik yang digunakan untuk mengukur keeratan hubungan (korelasi) antara dua variabel. Ukuran yang menyatakan keeratan hubungan adalah koefisien korelasi. Koefisien ini bernilai antara –1 sampai dengan +1. Sebuah langkah awal yang sangat bermanfaat dalam melihat hubungan antara dua variabel adalah menampilkan informasi data ke dalam bentuk diagram pencar.
Koefisien korelasi : dimana
Koefisien Determinasi Dihitung dengan mengkuadratkan koefisien korelasi (r2). Menyatakan besarnya kontribusi variabel X terhadap perubahan variabel Y.
Uji signifikansi koefisien korelasi Hipotesis nol dan hipotesis alternatifnya adalah : H0 : = 0 H1 : 0 Statistik uji : dengan
Daerah kritis, H0 ditolak bila atau Kesimpulan
Analisis Regresi Linier Sederhana : adalah suatu teknik yang digunakan untuk membangun suatu persamaan garis lurus dan menentukan nilai perkiraannya Hanya ada 1 variabel X dan 1 variabel Y. Suatu persamaan garis lurus yang menyatakan hubungan antara variabel bebas X dan variabel tidak bebas Y, dan digunakan untuk memperkirakan nilai Y berdasarkan nilai X disebut sebagai persamaan regresi
Metode kuadrat terkecil digunakan untuk menentukan persamaan linier estimasi, berarti memilih satu garis linier dari beberapa kemungkinan garis linier yang dapat dibuat dari data yang ada yang mempunyai kesalahan (error) paling kecil dari data aktual dengan data estimasinya. Kriteria ini dikenal dengan prinsip kuadrat terkecil (principle of least square). Prinsip pemilihan garis regresi ini adalah “pilih garis yang mempunyai jumlah kuadrat deviasi nilai observasi Y terhadap nilai Y prediksinya yang minimum sebagai garis regresi yang paling baik”
Persamaan regresi estimasi yang baik secara umum dimana adalah nilai estimasi Y berdasarkan X yang dipilih. a adalah titik potong Y. Merupakan nilai perkiraan bagi Y ketika X = 0. b adalah kemiringan garis, atau perubahan rata-rata pada untuk setiap satu unit perubahan (baik naik atau turun) pada variabel X. X adalah sembarang nilai variabel bebas yang dipilih
Nilai a dan b adalah :
Pengujian Terhadap Koefisien Regresi Menentukan H0 dan H1 H0 : = 0. H1 : 0. Taraf nyata Statistik uji : Tabel Anova Daerah kritis : jika F hitung > F ; (1, n-2), maka H0 ditolak Kesimpulan
Tabel Anova Sumber Variasi db Jumlah Kuadrat Kuadrat rata-rata F hitung Regresi 1 JKR JKR / 1 JKR / s2 Galat n – 2 JKG s2 = JKG / (n-2) Total n - 1 JKT
JKR = b JXY JKT = JYY JKG = JKT - JKR
Contoh 1: Seorang manajer pemasaran akan meneliti apakah terdapat pengaruh iklan terhadap penjualan pada perusahaan-perusahaan di Kabupaten WaterGold, untuk kepentingan penelitian tersebut diambil 8 perusahaan sejenis yang telah melakukan promosi. Penjualan (Y) 64 61 84 70 88 92 72 77 Promosi (X) 20 16 34 23 27 32 18 22
Latihan 1: Dalam suatu praktikum fisika dasar diperoleh data yang menghubungkan variabel bebas X dan variabel terikat Y seperti ditunjukkan dalam tabel dibawah ini: Uji ke- X Y 1 6 30 2 9 49 3 18 4 8 42 5 7 39 25 41 10 52
Analisis Regresi Linier Berganda Bentuk umum :
Membangun Persamaan Regresi Linier Berganda dengan Manual Besarnya koefisien a , b1, dan b2 dapat ditentukan dengan menggunakan tiga persamaan berikut ini
dimana A-1 adalah invers dari A. Persamaan di atas dapat dinyatakan dalam persamaan matriks A b H Jadi = A b = H b = A-1 H , dimana A-1 adalah invers dari A.
Contoh 1: Hubungan antara pendapatan, pengeluaran, dan banyaknya anggota keluarga VARIABEL RUMAH TANGGA I II III IV V VI VII Pengeluaran (Y) 3 5 6 7 4 9 Pendapatan (X1) 8 10 11 Jumlah Anggota Keluarga (X2) 2
Membangun Persamaan Regresi Linier Berganda dengan Komputer The regression equation is y = - 11.5 + 1.47 x1 + 6.59 x2 Predictor Coef StDev T P Constant -11.452 9.231 -1.24 0.255 x1 1.4671 0.5491 2.67 0.032 x2 6.588 4.550 1.45 0.191 S = 7.889 R-Sq = 88.7% R-Sq(adj) = 85.5% Analysis of Variance Source DF SS MS F P Regression 2 3427.9 1714.0 27.54 0.000 Error 7 435.7 62.2 Total 9 3863.6
Koefisien Korelasi Linier Berganda (KKLB) Jika ingin diketahui kuatnya hubungan antara variabel Y dengan beberapa variabel X lainnya. Apabila KKLB dikuadratkan, maka akan diperoleh Koefisien Penentuan (Koefisien Determinasi), yaitu suatu nilai untuk mengukur besarnya sumbangan dari beberapa variabel X terhadap variasi (naik turunnya) variabel Y.