Regresi dan Korelasi Linier Oleh Azimmatul Ihwah
Regresi dan Korelasi Linier Jika relasi (hubungan) antara dua atau lebih variabel dapat dinyatakan dalam persamaan matematika, maka dapat dilakukan prediksi dengan menggunakan persamaan itu. Prediksi ini sangat bergantung pada kekuatan relasi antar variabel-variabel itu. Ada dua hal mengenai yang akan dibahas mengenai permasalahan ini yaitu ANALISIS REGRESI dan ANALISIS KORELASI.
Analisis Regresi ANALISIS REGRESI bertujuan untuk menentukan model matematika yang dapat dipakai untuk memprediksi nilai-nilai variabel terikat (dependen), dinotasikan dengan Y, berdasarkan nilai-nilai dari variabel-variabel bebas (variabel prediktor), dinotasikan dengan π 1 , π 2 ,β¦, π π . Perhatikan bahwa yang dibicarakan disini adalah mengenai hubungan satu variabel terikat Y dengan satu atau lebih variabel bebas. Jika hanya ada satu variabel bebas yang digunakan untuk memprediksi nilai-nilai variabel terikat maka disebut ANALISIS REGRESI LINIER SEDERHANA, jika ada dua atau lebih variabel bebas maka disebut ANALISIS REGRESI LINIER GANDA.
Analisis Regresi Linier Sederhana Untuk membangun model linier dari hubungan antara satu variabel bebas dan satu variabel terikat, dimisalkan terdapat n pasangan observasi yang independen π 1 , π 1 , π 2 , π 2 ,β¦, π π , π π , dimana π π adalah nilai ke-i dari variabel bebas X dan π π adalah nilai ke-i dari variabel terikat Y. Misalnya data pada tabel berikut, variabel terikat Y adalah presentase kemurnian oksigen yg diproduksi dalam proses distilasi kimia, dan variabel bebas X adalah presentase hidrokarbon yg terdapat dalam alat distilasi.
Data dan Scatter Diagram
Scatter Diagram Dari scatter diagram berdasarkan data di atas, memang tidak ada kurva sederhana yang dapat tepat melalui semua titik data, namun terdapat indikasi yang kuat bahwa titik-titik data tersebut berada/menyebar secara random (acak) disekitar garis linier (garis lurus). Maka dari itu, ada alasan yang masuk akal untuk mengasumsikan bahwa terdapat hubungan linier antara variabel terikat dengan variabel bebas.
Persamaan Regresi Linier Sederhana Model hubungan linier antara variabel X dan Y pada populasi adalah: π π = π½ 0 + π½ 1 π π + π π Pada sampel: π π = π½ 0 + π½ 1 π π + π π dimana: π π = nilai ke-i variabel Y π½ 0 = suku tetap, yang merupakan rataan populasi jika π π =0 π½ 1 = suku tetap, disebut dengan koefisien regresi π π = random error dari Y pada observasi ke-i π½ 0 = penduga dari π½ 0 π½ 1 = penduga dari π½ 1 π π = random eror yang diperoleh dari Y sampel pada observasi ke-i
Nilai Y prediktif Garis regresi merupakan model matematika yang dapat dipakai untuk memprediksi nilai Y (Y prediktif, dinotasikan π ) berdasarkan nilai X. sehingga persamaan garis regresinya menjadi: π = π½ 0 + π½ 1 π dimana nilai Y prediktif ( π ) ini berbeda dengan nilai Y sebenarnya (the actual value of Y), jadi π π = π¦ π β π¦ π Untuk mencari persamaan garis regresi, maka harus ditemukan nilai π½ 0 dan π½ 1 , yang dicari dengan metode kuadrat terkecil dengan meminimumkan kuantitas: π·= π=1 π π π 2 = π=1 π π π β π½ 0 β π½ 1 π π 2
Formula untuk mencari nilai π½ 0 dan π½ 1 pada persamaan Regresi Linier Sederhana π π 2 β π ππ π π 2 β π 2 Formula untuk mencari nilai π½ 1 : π ππ β π π π π 2 β π 2 Atau menggunakan
Contoh Cari nilai π½ 0 dan π½ 1 pada data di slide 5! Jawab Diperoleh Model regresinya:
Interpretasi Hasil Garis regresi dapat dibuktikan melalui titik π , π . π =74,283+14,947 1,1960 =92,159612 (Selisih angka karena pembulatan) Setelah diperoleh persamaan garis regresi, maka model tersebut dapat digunakan untuk melakukan prediksi. Misal jika X = 1,50 maka dapat diprediksi nilai Y ( π )=72.283+ 14,497 1,50 =96,0285.
Koefisien Determinasi Menjelaskan seberapa besar nilai-nilai Y dapat dijelaskan oleh model regresi linier berdasarkan nilai-nilai X. Disajikan dengan π 2 , dihitung dengan formula: π 2 = πππ πππ =1β πππΈ πππ dimana SSπ = π β π 2 = π½ 0 π + π½ 1 ππ β π 2 π SSπ= πβ π 2 = π 2 β π 2 π
Contoh Pada contoh diperoleh πππ πππ = 152,13 173,38 =0,877 Jadi dapat dikatakan sebesar 87,7% nilai Y (kemurnian oksigen) dapat dijelaskan oleh nilai X (persentase hidrokarbon) melalui model regresi liniernya.
Kesalahan Baku Taksiran dan Kesalahan Baku Koefisien Regresi Linier Sederhana Kesalahan baku taksiran dinotasikan dengan π π¦.π₯ ππ‘ππ’ π dicari dengan formula: πππΈ πβ2 dimana πππΈ= πβ π 2 = π 2 β π½ 0 π β π½ 1 ππ Kesalahan baku koefisien regresi untuk π½ 1 dinotasikan dengan π π π½ 1 dan untuk π½ 0 dinotasikan dengan π π π½ 0 , didefinisikan sebagai berikut: π π π½ 1 = π π¦.π₯ 2 π 2 β π 2 π dan π π π½ 0 = π π¦.π₯ 2 1 π + πΏ 2 π 2 β π 2 π
Contoh Dari data di atas diperoleh nilai SSE = 21,25; sehingga π π¦.π₯ ππ‘ππ’ π = 21,125 20β2 =1,09 π π π½ 1 = 1,18 0.68088 =1,317 π π π½ 0 = 1,18 1 20 + 1.1960 2 0.6088 =1,593
Persyaratan pada Uji Regresi Linier Sederhana Normalitas Mensyaratkan bahwa untuk setiap X, nilai-nilai Y yang bersesuaian harus berdistribusi normal. Dapat diperiksa dengan analisis residu. Caranya dengan membuat distribusi frekuensi data bergolong dari residu-residu yang ada. Beberapa paket statistik menyediakan prosedur untuk melihat normalitas ini.
Persyaratan pada Uji Regresi Linier Sederhana 2. Uji Signifikansi Koefisien Regresi dan Regresi Uji Signifikansi Koefisien Regresi π½ 1 Hipotesis yang diuji π» 0 : π½ 1 =0 π» 1 : π½ 1 β 0 Statistik uji yang digunakan π‘= π½ 1 π π π½ 1 Keputusan uji: π» 0 ditolak jika π‘<β π‘ πΌ 2 ;πβ2 ππ‘ππ’ π‘> π‘ πΌ 2 ;πβ2
Persyaratan pada Uji Regresi Linier Sederhana Untuk menguji signifikansi π½ 0 , menggunakan prosedur yang hampir sama Hipotesis yang diuji π» 0 : π½ 0 =0 π» 1 : π½ 0 β 0 Statistik uji yang digunakan π‘= π½ 0 π π π½ 0 Keputusan uji: π» 0 ditolak jika π‘<β π‘ πΌ 2 ;πβ2 ππ‘ππ’ π‘> π‘ πΌ 2 ;πβ2 . Bila pada uji signifikansi π» 0 : π½ 1 =0 tidak ditolak maka ekuivalen dengan tidak terdapat hubungan linier antara X dan Y.
Persyaratan pada Uji Regresi Linier Sederhana Uji Signifikansi Regresi Hipotesis yang diuji: π» 0 : hubungan linier antara X dan Y tidak signifikan π» 1 : hubungan linier antara X dan Y signifikan Statistik uji πΉ 0 = πππ πππΈ Dimana πππ = πππ 1 dan πππΈ= πππΈ πβ2 Keputusan uji: π» 0 ditolak jika πΉ 0 > πΉ πΌ;1;πβ2
Contoh Untuk data pada slide 5 akan dilakukan uji signifikansi koefisien regresi dan signifikansi regresi pada taraf signifikansi 5%. π» 0 : π½ 1 =0 π» 1 : π½ 1 β 0 Statistik uji: π‘= 14,947 1,317 =11,35 Keputusan uji: karena π‘=11,35> π‘ 0,025;20β2 = 2,101 maka π» 0 ditolak. Kesimpulan koefisien regresi π½ 1 signifikan (berarti)
Contoh Uji Signifikansi Regresi Hipotesis: π» 0 : hubungan linier antara presentase hidrokarbon dan kadar kemurnian oksigen tidak signifikan π» 1 : hubungan linier antara presentase hidrokarbon dan kadar kemurnian oksigen signifikan Statistik uji: πΉ 0 = πππ πππΈ = 152,127 1,181 =128,862 Keputusan uji: karena πΉ 0 =128,862> πΉ 0,05;1;20β2 = 4,41 maka π» 0 ditolak Kesimpulan: hubungan linier antara presentase hidrokarbon dan kadar kemurnian oksigen signifikan
Persyaratan pada Uji Regresi Linier Sederhana 3. Linieritas Linieritas dapat diperiksa dengan menggambarkan scatter diagram pada bidang bilangan. Kalau titik-titik data tersebar disekitar garis lurus, maka dapat disimpulkan bahwa hubungan fungsional antara X dan Y linier. Atau dapat diperikasa pula dengan menggambarkan scatter diagram antara residu versus π . Jika scatter diagramnya tidak berpola, maka disimpulkan hubungan fungsionalnya linier. Namun, dengan dilakukan uji signifikansi koefisien regresi π½ 1 dapat dilihat apakah terdapat hubungan linier antara X dan Y atau tidak, jika π» 0 ditolak maka disimpulkan terdapat hubungan linier antara X dan Y. Linieritas dapat diuji secara formal menggunakan prosedur uji hipotesis. Untuk menguji linieritas ini diperlukan syarat adanya beberapa nilai variabel bebas X yang sama (berulang).
Persyaratan pada Uji Regresi Linier Sederhana 4. Independensi Mengatakan bahwa nilai-nilai aktual Y pada X tertentu harus saling independen. Misal untuk π= π 1 maka ada beberapa nilai Y yang berkaitan dgn π 1 dan nilai Y ini harus independen satu dengan yg lain. Cara memeriksa independensi adalah dengan menggambarkan residu-residu dengan urutan berdasar urutan nilai X. jika terdapat pola tertentu (keteraturan) pada plot residu, maka mengindikasikan independensi tidak dipenuhi. 5. Homoskedastisitas Mengatakan bahwa variasi nilai-nilai Y di sekitar garis regresi harus konstan (menyebar secara seragam/uniform). Persyaratan ini juga dinamakan persyaratan konstan variasi.
Koefisien Korelasi Linier Kuantitas ini berguna untuk mengetahui besarnya kekuatan relasi linier antara variabel X dan variabel Y setelah dilakukan uji regresi linier. Koefisien korelasi linier antara X dan Y dapat dihitung dengan menggunakan formula koefisien korelasi product moment Karl Pearson sebagai berikut: π π₯π¦ = π ππ β π π π π 2 β π 2 π π 2 β π 2 Dapat dibuktikan bahwa β1β€πβ€1
Koefisien Korelasi Linier Nilai koefisien korelasi ada dua kemungkinan, yaitu r>0 (korelasinya positif) atau r<0 (korelasinya negatif). Jika korelasinya positif, maka terdapat indikasi bahwa semakin tinggi nilai X maka semakin tinggi pula nilai Y. sebaliknya jika korelasinya negatif, maka terdapat indikasi semakin tinggi nilai X maka semakin rendah nilai Y. Namun jika r berada di sekitar 0, maka dikatakan tidak terdapat korelasi antara X dan Y. Sedangkan jika r = 1 maka dikatakan korelasinya positif sempurna dan jika r = -1 maka dikatakan korelasinya negatif sempurna.
Catatan mengenai Koefisien Korelasi Linier Adanya korelasi antara variabel X dan variabel Y tidak boleh diartikan sebagai terdapat efek (pengaruh). Misalkan diperiksa bahwa terdapat korelasi positif antara variabel motivasi belajar dan variabel prestasi belajar. Maka yang dapat disimpulkan adalah bahwa siswa yang motivasinya tinggi, maka diprediksikan bahwa siswa tersebut akan berprestasi tinggi.
Uji Signifikansi Koefisien Korelasi Linier Sederhana Hipotesis yang diuji: Jika yang ingin diperiksa apakah terdapat korelasi positif atau tidak π» 0 :πβ€0 π» 1 :π>0 2. Jika yang ingin diperiksa apakah terdapat korelasi negatif atau tidak π» 0 :πβ₯0 π» 1 :π<0 3. Jika yang ingin diperiksa terdapat korelasi atau tidak π» 0 :π=0 π» 1 :πβ 0
Uji Signifikansi Koefisien Korelasi Linier Sederhana Statistik uji π‘= π π₯π¦ πβ2 1β π π₯π¦ 2 Keputusan uji: Untuk hipotesis (1): π» 0 ditolak jika bila π‘> π‘ πΌ;πβ2 Untuk hipotesis (2) π» 0 ditolak jika bila π‘<β π‘ πΌ;πβ2 Untuk hipotesis (3) π» 0 ditolak jika bila π‘<β π‘ πΌ 2 ;πβ2 atau π‘> π‘ πΌ 2 ;πβ2
Uji Signifikansi Koefisien Korelasi Linier Sederhana Atau dapat menggunakan statistik uji: πΉ= πππ πππΈ = πππ 1 πππΈ πβ2 dimana πππ= π 2 β π 2 π πππ = π 2 πππ πππΈ= 1β π 2 πππ Keputusan uji: π» 0 ditolak apabila πΉ> πΉ πΌ;1;πβ2
Catatan Koefisien determinasi π 2 merupakan kuadrat dari koefisien korelasi linier π π₯π¦ . Pada contoh sebelumnya, dicari koefisien korelasi linier antara presentase hidrokarbon dengan kadar kemurnian oksigen π π₯π¦ = 20 2214,6566 β 23.92 1843,21 20 29,2892 β 2214,6566 2 20 170044,5321 β 1843,21 2 =0,937 Telah dihitung koefisien determinasi π 2 =0,877; dapat dilihat bahwa 0,937 2 =0,877
Contoh Pada data di slide 5 telah diuji signifikansi koefisien regresi dan signifikansi regresinya, selanjutnya juga akan dilakukan uji signifikansi koefisien korelasi linier pada taraf signifikansi 5%. Hipotesis yang diuji: π» 0 :πβ€0 π» 1 :π>0 Statistik uji: π‘= 0,937 20β2 1β 0,937 2 = 3,975 0,351 =11,325 Keputusan uji: karena π‘=11,325> π‘ 0,05;20β2 =1,734 maka π» 0 ditolak. Kesimpulan : terdapat korelasi positif antara variabel Y (kemurnian oksigen) dengan variabel X (presentase hidrokarbon)
Analisis regresi linier pada data di slide 5 dengan menggunakan SPSS 20 Input data variabel dependen (hidrokarbon) dan variabel independen (oksigen) pada kolom yg berbeda. Pilih Analyze-Regression-Linier-masukkan variabel dependen pada kotak βDependentβ dengan mengklik tanda panah, dan variabel independen pada kotak βIndependentβ-klik βStatisticsβ selanjutnya pilih βDescriptivesβ dan βPart and Partial Correlationsβ-klik OK
Output