Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Regresi dan Korelasi Linier

Presentasi serupa


Presentasi berjudul: "Regresi dan Korelasi Linier"— Transcript presentasi:

1 Regresi dan Korelasi Linier
Oleh Azimmatul Ihwah

2 Regresi dan Korelasi Linier
Jika relasi (hubungan) antara dua atau lebih variabel dapat dinyatakan dalam persamaan matematika, maka dapat dilakukan prediksi dengan menggunakan persamaan itu. Prediksi ini sangat bergantung pada kekuatan relasi antar variabel-variabel itu. Ada dua hal mengenai yang akan dibahas mengenai permasalahan ini yaitu ANALISIS REGRESI dan ANALISIS KORELASI.

3 Analisis Regresi ANALISIS REGRESI bertujuan untuk menentukan model matematika yang dapat dipakai untuk memprediksi nilai-nilai variabel terikat (dependen), dinotasikan dengan Y, berdasarkan nilai-nilai dari variabel-variabel bebas (variabel prediktor), dinotasikan dengan 𝑋 1 , 𝑋 2 ,…, 𝑋 𝑝 . Perhatikan bahwa yang dibicarakan disini adalah mengenai hubungan satu variabel terikat Y dengan satu atau lebih variabel bebas. Jika hanya ada satu variabel bebas yang digunakan untuk memprediksi nilai-nilai variabel terikat maka disebut ANALISIS REGRESI LINIER SEDERHANA, jika ada dua atau lebih variabel bebas maka disebut ANALISIS REGRESI LINIER GANDA.

4 Analisis Regresi Linier Sederhana
Untuk membangun model linier dari hubungan antara satu variabel bebas dan satu variabel terikat, dimisalkan terdapat n pasangan observasi yang independen 𝑋 1 , 𝑌 1 , 𝑋 2 , 𝑌 2 ,…, 𝑋 𝑛 , 𝑌 𝑛 , dimana 𝑋 𝑖 adalah nilai ke-i dari variabel bebas X dan 𝑌 𝑖 adalah nilai ke-i dari variabel terikat Y. Misalnya data pada tabel berikut, variabel terikat Y adalah presentase kemurnian oksigen yg diproduksi dalam proses distilasi kimia, dan variabel bebas X adalah presentase hidrokarbon yg terdapat dalam alat distilasi.

5 Data dan Scatter Diagram

6 Scatter Diagram Dari scatter diagram berdasarkan data di atas, memang tidak ada kurva sederhana yang dapat tepat melalui semua titik data, namun terdapat indikasi yang kuat bahwa titik-titik data tersebut berada/menyebar secara random (acak) disekitar garis linier (garis lurus). Maka dari itu, ada alasan yang masuk akal untuk mengasumsikan bahwa terdapat hubungan linier antara variabel terikat dengan variabel bebas.

7 Persamaan Regresi Linier Sederhana
Model hubungan linier antara variabel X dan Y pada populasi adalah: 𝑌 𝑖 = 𝛽 0 + 𝛽 1 𝑋 𝑖 + 𝜀 𝑖 Pada sampel: 𝑌 𝑖 = 𝛽 0 + 𝛽 1 𝑋 𝑖 + 𝑒 𝑖 dimana: 𝑌 𝑖 = nilai ke-i variabel Y 𝛽 0 = suku tetap, yang merupakan rataan populasi jika 𝑋 𝑖 =0 𝛽 1 = suku tetap, disebut dengan koefisien regresi 𝜀 𝑖 = random error dari Y pada observasi ke-i 𝛽 0 = penduga dari 𝛽 0 𝛽 1 = penduga dari 𝛽 1 𝑒 𝑖 = random eror yang diperoleh dari Y sampel pada observasi ke-i

8 Nilai Y prediktif Garis regresi merupakan model matematika yang dapat dipakai untuk memprediksi nilai Y (Y prediktif, dinotasikan 𝑌 ) berdasarkan nilai X. sehingga persamaan garis regresinya menjadi: 𝑌 = 𝛽 𝛽 1 𝑋 dimana nilai Y prediktif ( 𝑌 ) ini berbeda dengan nilai Y sebenarnya (the actual value of Y), jadi 𝑒 𝑖 = 𝑦 𝑖 − 𝑦 𝑖 Untuk mencari persamaan garis regresi, maka harus ditemukan nilai 𝛽 0 dan 𝛽 1 , yang dicari dengan metode kuadrat terkecil dengan meminimumkan kuantitas: 𝐷= 𝑖=1 𝑛 𝜀 𝑖 2 = 𝑖=1 𝑛 𝑌 𝑖 − 𝛽 0 − 𝛽 1 𝑋 𝑖 2

9 Formula untuk mencari nilai 𝛽 0 dan 𝛽 1 pada persamaan Regresi Linier Sederhana
𝑌 𝑋 2 − 𝑋 𝑋𝑌 𝑛 𝑋 2 − 𝑋 2 Formula untuk mencari nilai 𝛽 1 : 𝑛 𝑋𝑌 − 𝑋 𝑌 𝑛 𝑋 2 − 𝑋 2 Atau menggunakan

10 Contoh Cari nilai 𝛽 0 dan 𝛽 1 pada data di slide 5! Jawab Diperoleh
Model regresinya:

11 Interpretasi Hasil Garis regresi dapat dibuktikan melalui titik 𝑋 , 𝑌 . 𝑌 =74,283+14,947 1,1960 =92,159612 (Selisih angka karena pembulatan) Setelah diperoleh persamaan garis regresi, maka model tersebut dapat digunakan untuk melakukan prediksi. Misal jika X = 1,50 maka dapat diprediksi nilai Y ( 𝑌 )= ,497 1,50 =96,0285.

12 Koefisien Determinasi
Menjelaskan seberapa besar nilai-nilai Y dapat dijelaskan oleh model regresi linier berdasarkan nilai-nilai X. Disajikan dengan 𝑟 2 , dihitung dengan formula: 𝑟 2 = 𝑆𝑆𝑅 𝑆𝑆𝑇 =1− 𝑆𝑆𝐸 𝑆𝑆𝑇 dimana SS𝑅= 𝑌 − 𝑌 2 = 𝛽 𝑌 + 𝛽 𝑋𝑌 − 𝑌 2 𝑛 SS𝑇= 𝑌− 𝑌 2 = 𝑌 2 − 𝑌 2 𝑛

13 Contoh Pada contoh diperoleh 𝑆𝑆𝑅 𝑆𝑆𝑇 = 152,13 173,38 =0,877
Jadi dapat dikatakan sebesar 87,7% nilai Y (kemurnian oksigen) dapat dijelaskan oleh nilai X (persentase hidrokarbon) melalui model regresi liniernya.

14 Kesalahan Baku Taksiran dan Kesalahan Baku Koefisien Regresi Linier Sederhana
Kesalahan baku taksiran dinotasikan dengan 𝑠 𝑦.𝑥 𝑎𝑡𝑎𝑢 𝜎 dicari dengan formula: 𝑆𝑆𝐸 𝑛−2 dimana 𝑆𝑆𝐸= 𝑌− 𝑌 2 = 𝑌 2 − 𝛽 𝑌 − 𝛽 𝑋𝑌 Kesalahan baku koefisien regresi untuk 𝛽 1 dinotasikan dengan 𝑠𝑒 𝛽 1 dan untuk 𝛽 0 dinotasikan dengan 𝑠𝑒 𝛽 0 , didefinisikan sebagai berikut: 𝑠𝑒 𝛽 1 = 𝑠 𝑦.𝑥 𝑋 2 − 𝑋 2 𝑛 dan 𝑠𝑒 𝛽 0 = 𝑠 𝑦.𝑥 𝑛 + 𝑿 𝑋 2 − 𝑋 2 𝑛

15 Contoh Dari data di atas diperoleh nilai SSE = 21,25; sehingga 𝑠 𝑦.𝑥 𝑎𝑡𝑎𝑢 𝜎 = 21,125 20−2 =1,09 𝑠𝑒 𝛽 1 = 1, =1,317 𝑠𝑒 𝛽 0 = 1, =1,593

16 Persyaratan pada Uji Regresi Linier Sederhana
Normalitas Mensyaratkan bahwa untuk setiap X, nilai-nilai Y yang bersesuaian harus berdistribusi normal. Dapat diperiksa dengan analisis residu. Caranya dengan membuat distribusi frekuensi data bergolong dari residu-residu yang ada. Beberapa paket statistik menyediakan prosedur untuk melihat normalitas ini.

17 Persyaratan pada Uji Regresi Linier Sederhana
2. Uji Signifikansi Koefisien Regresi dan Regresi Uji Signifikansi Koefisien Regresi 𝛽 1 Hipotesis yang diuji 𝐻 0 : 𝛽 1 =0 𝐻 1 : 𝛽 1 ≠0 Statistik uji yang digunakan 𝑡= 𝛽 1 𝑠𝑒 𝛽 1 Keputusan uji: 𝐻 0 ditolak jika 𝑡<− 𝑡 𝛼 2 ;𝑛−2 𝑎𝑡𝑎𝑢 𝑡> 𝑡 𝛼 2 ;𝑛−2

18 Persyaratan pada Uji Regresi Linier Sederhana
Untuk menguji signifikansi 𝛽 0 , menggunakan prosedur yang hampir sama Hipotesis yang diuji 𝐻 0 : 𝛽 0 =0 𝐻 1 : 𝛽 0 ≠0 Statistik uji yang digunakan 𝑡= 𝛽 0 𝑠𝑒 𝛽 0 Keputusan uji: 𝐻 0 ditolak jika 𝑡<− 𝑡 𝛼 2 ;𝑛−2 𝑎𝑡𝑎𝑢 𝑡> 𝑡 𝛼 2 ;𝑛−2 . Bila pada uji signifikansi 𝐻 0 : 𝛽 1 =0 tidak ditolak maka ekuivalen dengan tidak terdapat hubungan linier antara X dan Y.

19 Persyaratan pada Uji Regresi Linier Sederhana
Uji Signifikansi Regresi Hipotesis yang diuji: 𝐻 0 : hubungan linier antara X dan Y tidak signifikan 𝐻 1 : hubungan linier antara X dan Y signifikan Statistik uji 𝐹 0 = 𝑀𝑆𝑅 𝑀𝑆𝐸 Dimana 𝑀𝑆𝑅= 𝑆𝑆𝑅 1 dan 𝑀𝑆𝐸= 𝑆𝑆𝐸 𝑛−2 Keputusan uji: 𝐻 0 ditolak jika 𝐹 0 > 𝐹 𝛼;1;𝑛−2

20 Contoh Untuk data pada slide 5 akan dilakukan uji signifikansi koefisien regresi dan signifikansi regresi pada taraf signifikansi 5%. 𝐻 0 : 𝛽 1 =0 𝐻 1 : 𝛽 1 ≠0 Statistik uji: 𝑡= 14,947 1,317 =11,35 Keputusan uji: karena 𝑡=11,35> 𝑡 0,025;20−2 = 2,101 maka 𝐻 0 ditolak. Kesimpulan koefisien regresi 𝛽 1 signifikan (berarti)

21 Contoh Uji Signifikansi Regresi
Hipotesis: 𝐻 0 : hubungan linier antara presentase hidrokarbon dan kadar kemurnian oksigen tidak signifikan 𝐻 1 : hubungan linier antara presentase hidrokarbon dan kadar kemurnian oksigen signifikan Statistik uji: 𝐹 0 = 𝑀𝑆𝑅 𝑀𝑆𝐸 = 152,127 1,181 =128,862 Keputusan uji: karena 𝐹 0 =128,862> 𝐹 0,05;1;20−2 = 4,41 maka 𝐻 0 ditolak Kesimpulan: hubungan linier antara presentase hidrokarbon dan kadar kemurnian oksigen signifikan

22 Persyaratan pada Uji Regresi Linier Sederhana
3. Linieritas Linieritas dapat diperiksa dengan menggambarkan scatter diagram pada bidang bilangan. Kalau titik-titik data tersebar disekitar garis lurus, maka dapat disimpulkan bahwa hubungan fungsional antara X dan Y linier. Atau dapat diperikasa pula dengan menggambarkan scatter diagram antara residu versus 𝑌 . Jika scatter diagramnya tidak berpola, maka disimpulkan hubungan fungsionalnya linier. Namun, dengan dilakukan uji signifikansi koefisien regresi 𝛽 1 dapat dilihat apakah terdapat hubungan linier antara X dan Y atau tidak, jika 𝐻 0 ditolak maka disimpulkan terdapat hubungan linier antara X dan Y. Linieritas dapat diuji secara formal menggunakan prosedur uji hipotesis. Untuk menguji linieritas ini diperlukan syarat adanya beberapa nilai variabel bebas X yang sama (berulang).

23 Persyaratan pada Uji Regresi Linier Sederhana
4. Independensi Mengatakan bahwa nilai-nilai aktual Y pada X tertentu harus saling independen. Misal untuk 𝑋= 𝑋 1 maka ada beberapa nilai Y yang berkaitan dgn 𝑋 1 dan nilai Y ini harus independen satu dengan yg lain. Cara memeriksa independensi adalah dengan menggambarkan residu-residu dengan urutan berdasar urutan nilai X. jika terdapat pola tertentu (keteraturan) pada plot residu, maka mengindikasikan independensi tidak dipenuhi. 5. Homoskedastisitas Mengatakan bahwa variasi nilai-nilai Y di sekitar garis regresi harus konstan (menyebar secara seragam/uniform). Persyaratan ini juga dinamakan persyaratan konstan variasi.

24 Koefisien Korelasi Linier
Kuantitas ini berguna untuk mengetahui besarnya kekuatan relasi linier antara variabel X dan variabel Y setelah dilakukan uji regresi linier. Koefisien korelasi linier antara X dan Y dapat dihitung dengan menggunakan formula koefisien korelasi product moment Karl Pearson sebagai berikut: 𝑟 𝑥𝑦 = 𝑛 𝑋𝑌 − 𝑋 𝑌 𝑛 𝑋 2 − 𝑋 𝑛 𝑌 2 − 𝑌 2 Dapat dibuktikan bahwa −1≤𝑟≤1

25 Koefisien Korelasi Linier
Nilai koefisien korelasi ada dua kemungkinan, yaitu r>0 (korelasinya positif) atau r<0 (korelasinya negatif). Jika korelasinya positif, maka terdapat indikasi bahwa semakin tinggi nilai X maka semakin tinggi pula nilai Y. sebaliknya jika korelasinya negatif, maka terdapat indikasi semakin tinggi nilai X maka semakin rendah nilai Y. Namun jika r berada di sekitar 0, maka dikatakan tidak terdapat korelasi antara X dan Y. Sedangkan jika r = 1 maka dikatakan korelasinya positif sempurna dan jika r = -1 maka dikatakan korelasinya negatif sempurna.

26 Catatan mengenai Koefisien Korelasi Linier
Adanya korelasi antara variabel X dan variabel Y tidak boleh diartikan sebagai terdapat efek (pengaruh). Misalkan diperiksa bahwa terdapat korelasi positif antara variabel motivasi belajar dan variabel prestasi belajar. Maka yang dapat disimpulkan adalah bahwa siswa yang motivasinya tinggi, maka diprediksikan bahwa siswa tersebut akan berprestasi tinggi.

27 Uji Signifikansi Koefisien Korelasi Linier Sederhana
Hipotesis yang diuji: Jika yang ingin diperiksa apakah terdapat korelasi positif atau tidak 𝐻 0 :𝜌≤0 𝐻 1 :𝜌>0 2. Jika yang ingin diperiksa apakah terdapat korelasi negatif atau tidak 𝐻 0 :𝜌≥0 𝐻 1 :𝜌<0 3. Jika yang ingin diperiksa terdapat korelasi atau tidak 𝐻 0 :𝜌=0 𝐻 1 :𝜌≠0

28 Uji Signifikansi Koefisien Korelasi Linier Sederhana
Statistik uji 𝑡= 𝑟 𝑥𝑦 𝑛−2 1− 𝑟 𝑥𝑦 2 Keputusan uji: Untuk hipotesis (1): 𝐻 0 ditolak jika bila 𝑡> 𝑡 𝛼;𝑛−2 Untuk hipotesis (2) 𝐻 0 ditolak jika bila 𝑡<− 𝑡 𝛼;𝑛−2 Untuk hipotesis (3) 𝐻 0 ditolak jika bila 𝑡<− 𝑡 𝛼 2 ;𝑛−2 atau 𝑡> 𝑡 𝛼 2 ;𝑛−2

29 Uji Signifikansi Koefisien Korelasi Linier Sederhana
Atau dapat menggunakan statistik uji: 𝐹= 𝑀𝑆𝑅 𝑀𝑆𝐸 = 𝑆𝑆𝑅 1 𝑆𝑆𝐸 𝑛−2 dimana 𝑆𝑆𝑇= 𝑌 2 − 𝑌 2 𝑛 𝑆𝑆𝑅= 𝑟 2 𝑆𝑆𝑇 𝑆𝑆𝐸= 1− 𝑟 2 𝑆𝑆𝑇 Keputusan uji: 𝐻 0 ditolak apabila 𝐹> 𝐹 𝛼;1;𝑛−2

30 Catatan Koefisien determinasi 𝑟 2 merupakan kuadrat dari koefisien korelasi linier 𝑟 𝑥𝑦 . Pada contoh sebelumnya, dicari koefisien korelasi linier antara presentase hidrokarbon dengan kadar kemurnian oksigen 𝑟 𝑥𝑦 = ,6566 − , ,2892 − 2214, ,5321 − 1843, =0,937 Telah dihitung koefisien determinasi 𝑟 2 =0,877; dapat dilihat bahwa 0,937 2 =0,877

31 Contoh Pada data di slide 5 telah diuji signifikansi koefisien regresi dan signifikansi regresinya, selanjutnya juga akan dilakukan uji signifikansi koefisien korelasi linier pada taraf signifikansi 5%. Hipotesis yang diuji: 𝐻 0 :𝜌≤0 𝐻 1 :𝜌>0 Statistik uji: 𝑡= 0, −2 1− 0, = 3,975 0,351 =11,325 Keputusan uji: karena 𝑡=11,325> 𝑡 0,05;20−2 =1,734 maka 𝐻 0 ditolak. Kesimpulan : terdapat korelasi positif antara variabel Y (kemurnian oksigen) dengan variabel X (presentase hidrokarbon)

32 Analisis regresi linier pada data di slide 5 dengan menggunakan SPSS 20
Input data variabel dependen (hidrokarbon) dan variabel independen (oksigen) pada kolom yg berbeda. Pilih Analyze-Regression-Linier-masukkan variabel dependen pada kotak ‘Dependent’ dengan mengklik tanda panah, dan variabel independen pada kotak ‘Independent’-klik ‘Statistics’ selanjutnya pilih ‘Descriptives’ dan ‘Part and Partial Correlations’-klik OK

33 Output


Download ppt "Regresi dan Korelasi Linier"

Presentasi serupa


Iklan oleh Google