Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

KORELASI DAN REGRESI. KORELASI Analisis korelasi bertujuan untuk mengetahui pola dan keeratan hubungan antara dua atau lebih variabel. “Correlation does.

Presentasi serupa


Presentasi berjudul: "KORELASI DAN REGRESI. KORELASI Analisis korelasi bertujuan untuk mengetahui pola dan keeratan hubungan antara dua atau lebih variabel. “Correlation does."— Transcript presentasi:

1 KORELASI DAN REGRESI

2 KORELASI Analisis korelasi bertujuan untuk mengetahui pola dan keeratan hubungan antara dua atau lebih variabel. “Correlation does not imply causation”, atau korelasi tidak mengisyaratkan kejadian sebab akibat.

3 ARAH KORELASI Arah korelasi menunjukkan pola gerakan variabel Y terhadap gerakan variabel X. Terdapat tiga arah korelasi, yaitu 1. Positive correlation. 2. Negative correlation. 3. Nihil correlation.

4 ARAH KORELASI

5 Inverse Correlation (Negative Correlation)

6 KOEFISIEN KORELASI Koefisien korelasi sering dilambangkan dengan huruf (r). Koefisien korelasi dinyatakan dengan bilangan, bergerak antara 0 sampai +1 atau 0 sampai -1. Notasi positif (+) atau negatif (-) menunjukkan arah hubungan antara kedua variabel.  Notasi positif (+) berarti hubungan antara kedua variabel searah (positive correlation), jika variabel satu naik maka variabel yang lain juga naik.  Notasi negatif (-) berarti kedua variabel berhubungan terbalik (negative correlation), artinya kenaikan satu variabel akan dibarengi dengan penurunan variabel lainnya.

7 KOEFISIEN KORELASI Jika nilai r > 0, artinya telah terjadi hubungan yang linier positif (positive correlation), yaitu makin besar nilai variabel X makin besar pula nilai variabel Y, atau makin kecil nilai variabel X makin kecil pula nilai variabel Y. Jika nilai r < 0, artinya telah terjadi hubungan yang linier negative (negative correlation), yaitu makin besar nilai variabel X makin kecil nilai variabel Y, atau makin kecil nilai variabel X maka makin besar pula nilai variabel Y. Jika nilai r = 0, artinya tidak ada hubungan sama sekali antara variabel X dan variabel Y. Jika nilai r = 1 atau r = -1, maka dapat dikatakan telah terjadi hubungan linier sempurna, berupa garis lurus, sedangkan untuk r yang makin mengarah ke arah angka 0 (nol)maka garis makin tidak lurus.

8 KORELASI PRODUCT MOMENT Analisis korelasi Pearson digunakan untuk jenis statistik parametrik. Beberapa asumsi yang digunakan apabila dilakukan analisis korelasi product moment atau korelasi Pearson,antara lain : 1.Distribusi nilai dari variabel berdistribusi normal atau mendekati normal. 2. Dua variabel yang akan dicari korelasinya adalah variabel kontinu yang bersifat rasional atau minimal bersifat interval. 3. Hubungan dari kedua variabel yang akan dikorelasikan adalah linier.

9 Contoh : Berikut data umur domba produktif, dengan produksi susu yang diteliti. Hasil penelitian sebagai berikut : Umur (Bulan) Susu (Mili liter)

10 Langkah-langkah SPSS adalah sebagai berikut : 1. Entrilah data ke lembar kerja SPSS. 2. Klik Analyze, Correlate, Bivariate.  Pindahkan variabel umur dan susu ke kolom Variables, pada Correlation Coefficients, pilih Pearson.  Test of Significance, pilih Two- tailed.  Aktifkan Flag significant correlations, ini berguna untuk menampilkan tanda apabila hasilnya signifikan.

11 Langkah-langkah SPSS 3. Klik Options. Aktifkan pilihan Means and Standard deviations. 4. Klik Continue, OK.

12 OUTPUT Descriptive Statistics MeanStd. DeviationN umur susu Correlations umursusu umurPearson Correlation1.951 ** Sig. (2-tailed).000 N11 susuPearson Correlation.951 ** 1 Sig. (2-tailed).000 N11 **. Correlation is significant at the 0.01 level (2-tailed).

13 INTERPRETASI Angka koefisien korelasi adalah 0,951, sangat signifikan artinya hubungan antara umur dengan susu sangat erat. Koefisien korelasi bertanda positif (+) artinya terdapat hubungan antara umur dengan susu sangat erat. Koefisien korelasi bertanda positif (+) artinya terdapat hubungan positif antara umur domba dengan produksi susu, semakin tua domba pada umur produktif maka produksi susu juga meningkat. Tanda ** menunjukkan bahwa koefisien korelasi tersebut signifikan pada taraf kepercayaan 99%. Kalau tanda bintangnya hanya satu (*) menunjukkan signifikan pada level kepercayaan 95%.

14 Soal Latihan Berikut ini data mengenai hubungan antara hasil penjualan dan biaya iklan dari sebuah perusahaan. (a)Buatlah diagram pencar dari data-data tersebut! (b)Dengan menggunakan korelasi Pearson, carilah nilai korelasi dan tentukan jenisnya! Biaya Iklan (juta Rp) Biaya Penjualan (juta Rp)

15 KORELASI RANK SPEARMAN Metode ini mengukur keeratan hubungan berdasarkan ranking dari masing-masing data sehingga disebut rank correlation coefficient. Sebelum dianalisis, terlebih dahulu data disusun berdasarkan ranking terhadap data lain.

16 Contoh : Akan diteliti hubungan antara tinggi semai (cm) dengan jumlah helai daun (helai) pada suatu persemaian. No.TinggiDaun

17 Penyelesaian dengan SPSS : 1. Entrilah data ke lembar kerja SPSS. 2. Klik Analyze, Correlate, Bivariate 3. Pindahkan variabel tinggi dan daun ke kolom Variables pada Correlation Coefficients pilih Spearman. 4. Klik OK.

18 OUTPUT Correlations tinggidaun Spearman's rhotinggi Correlation Coefficient ** Sig. (2-tailed)..000 N15 daun Correlation Coefficient.943 ** Sig. (2-tailed).000. N15 **. Correlation is significant at the 0.01 level (2-tailed).

19 INTERPRETASI Koefisien korelasi antara tinggi dengan jumlah daun adalah 0.943, biasanya angka yang mendekati nilai 1 atau (-1) berarti sangat signifikan. Tanda ** menunjukkan bahwa koefisien korelasi tersebut signifikan pada taraf kepercayaan 99%. Nilai 0,943 (positif), artinya bahwa semakin tinggi semai akan mempunyai jumlah daun yang lebih banyak (positive correlation).

20 Soal Latihan Berikut ini data mengenai nilai matematika dan statistika dari 10 mahasiswa. (a)Hitunglah koefisien korelasi ranknya (dengan korelasi Spearman)! (b)Sebutkan jenis korelasinya dan apa artinya! Mat Stat

21 REGRESI Analisis regresi menjadi sangat terkenal dan banyak digunakan karena ada beberapa yang istimewa di dalam analisis regresi, di antaranya : Di dalam analisis regresi sudah termasuk analisis korelasi antara variabel independen (X) yang juga sering disebut faktor-faktor penyebab, dengan variabel dependen (Y). Selanjutnya dengan persamaan regresi yang didapat kita bisa membuat peramalan apa yang akan terjadi dengan Y apabila terjadi perubahan pada X, sebaliknya jika kita menginginkan nilai Y tertentu, kita dapat mengestimasi seberapa besar faktor-faktor X akan diubah untuk mewujudkan tujuan kita.

22 ASUMSI DALAM REGRESI Beberapa asumsi yang harus dipenuhi dalam melakukan analisis regresi adalah : 1.Variabel random diasumsikan independen terhadap X. Artinya bahwa nilai kovarian adalah nol antara variabel independen dan tingkat kesalahan yang berhubungan untuk tiap pengamatan. 2.Variasi random diasumsikan terdistribusi secara normal. Artinya bahwa untuk masing-masing variabel independen kesalahan dari prediksi diasumsikan terdistribusi normal. 3.Variabel random diasumsikan memiliki varian yang terbatas. 4.Rata-rata variabel random sama dengan nol. 5.Kesalahan prediksi terhadap X tidak bergantung dari masing-masing variabel X. 6.Variabel-variabel independen tidak saling berkorelasi. 7.Jumlah data harus lebih besar dari jumlah variabel.

23 REGRESI LINIER SEDERHANA Disebut regresi sederhana karena analisis ini hanya berkaitan dengan dua variabel saja, satu disebut variabel independen atau variabel bebas, biasanya diberi notasi X, sedangkan variabel satunya disebut sebagai variabel dependen atau variabel bergantung yang biasa diberi notasi Y. Regresi linier sederhana mengikuti persamaan di bawah ini : Y = a + bX + e Dimana : Y = merupakan variabel bergantung (dependent variable) X = sebagai variabel bebas (independent variable) a = sebagai konstanta regresi b = slope atau kemiringan garis regresi e = error

24 Contoh : Sebuah perusahaan yang bergerak di bidang perikanan sedang menganalisis tingkat keasinan atau salinitas tambak dengan produktivitas tambaknya, data-datanya sebagai berikut : No.Salinitas (mmgram/liter) (X)Produksi (ton) (Y)

25 PENYELESAIAN DENGAN SPSS 1.Entrilah data ke lembar kerja SPSS. 2.Klik Variable View di pojok kiri bawah. 3.Pada kolom Name isikan sesuai dengan nama variabelnya, variabel pertama diberi nama Salinitas dan variabel kedua diberi nama Produksi. 4.Klik Analyze, Regression, Linear. 5.Pindahkan variabel Salinitas sebagai variabel bebas ke kolom independent(s), dan variabel Produksi sebagai variabel tergantung ke kolom dependent. 6.Klik menu Statistics, tandai Estimates, Confidence intervals, Model fits dan Descriptives. Kemudian klik Continue.

26 PENYELESAIAN DENGAN SPSS Pada kotak Regression Coefficients terdapat beberapa item yaitu : 1.Estimates, berguna untuk memperkirakan hasil analisis regresi. Jika pilihan ini tidak diaktifkan, koefisien regresi tidak akan ditampilkan sehingga kita sulit membuat persamaan regresinya. 2.Confidence intervals, merupakan interval taraf kepercayaan dari persamaan regresi yang didapat. Pada interval taraf kepercayaan akan ditampilkan lower bound dan upper bound kurva normal. 3.Covariance matrix, akan menampilkan matrik varian/kovarian. 4.Model fit, akan menampilkan analisis regresi yang disertakan analisis varian atau uji F regresi. Uji F ini berguna untuk mengetahui semua variabel independen (variabel bebas) yang berpengaruh terhadap variabel dependen (variabel bergantung).

27 PENYELESAIAN DENGAN SPSS 7. Klik Options. Use probability of F digunakan untuk menentukan taraf kesalahan berapa variabel independen yang akan dikeluarkan dari persamaan dan taraf kesalahan berapa variabel independen yang akan dimasukkan dalam persamaan. Pada kondisi default, variabel independen akan masuk dalam persamaan jika kesalahannya kurang dari 0.05 (5%) dan dikeluarkan jika lebih dari 0.1 (10%). Use F value juga digunakan untuk menentukan taraf kesalahan berapa variabel independen yang akan dikeluarkan dari persamaan dan taraf kesalahan berapa variabel independen yang akan dimasukkan dalam persamaan. Kalau pada Use probability of F, angka yang digunakan adalah angka probabilitas, Use F value menggunakan nilai F pada tabel. Include constant in equation digunakan untuk menampilkan konstanta persamaan garis regresi. 8. Pada pilihan Missing Values pilih Replace with mean artinya data-data yang hilang digantikan dengan rata-rata. 9.Klik Continue, OK

28 OUTPUT Descriptive Statistics MeanStd. DeviationN Produksi Salinitas Tabel Descriptive Statistics Produktivitas tambak rata-rata = 68,63 ton Salinitas/Kadar garam rata-rata = 285,63 Standar deviasi produktivitas = 10,059 ton Standar deviasi kadar garam = 87,785 n (jumlah seluruh data) = 16 data

29 OUTPUT Correlations ProduksiSalinitas Pearson CorrelationProduksi Salinitas Sig. (1-tailed)Produksi..000 Salinitas.000. NProduksi16 Salinitas16 Tabel Correlation Korelasi Pearson (Pearson Correlation) = 0,891 Nilai 0,891 adalah nilai r hitung. Angka tersebut menunjukkan terjadi korelasi yang sangat kuat antara kadar garam dengan produktivitas udang di tambak. Hubungan bersifat positive correlation, artinya penambahan kadar garam akan menambah produktivitas udang. Sig (1-tailed) atau probabilitas = 0,000 Untuk mengetahui apakah nilai r hitung tersebut signifikan atau tidak, maka perlu dibandingkan dengan r tabel atau dengan melihat probabilitasnya. Korelasi dikatakan signifikan, jika r hitung lebih besar dari r tabel (r hitung > r tabel) atau nilai probabilitas kurang dari taraf kesalahan (0,05). Terlihat probabilitasnya 0,000 < taraf signifikansi 0,05,berarti menunjukkan korelasi/hubungan yang signifikan. n atau jumlah yang dianalisis = 16

30 OUTPUT Variables Entered/Removed b ModelVariables EnteredVariables RemovedMethod 1Salinitas a.Enter a. All requested variables entered. b. Dependent Variable: Produksi Model Summary ModelRR Square Adjusted R Square Std. Error of the Estimate a a. Predictors: (Constant), Salinitas

31 INTERPRETASI Tabel Variables Enteres/Removed Variables Entered (variabel yang masuk persamaan). Variabel independen akan dimasukkan dalam persamaan berdasarkan kriteria Use Probability of F Entry 0,05 dan Removal 0,10. Dari hasil analisis, dapat dilihat bahwa variabel salinitas memenuhi syarat sehingga dimasukkan dalam persamaan. Variables Removed (variabel yang dikeluarkan dalam persamaan). Dapat dilihat tidak ada variabel predictor yang dikeluarkan. Method (metode) merupakan pilihan metode yang digunakan dalam hal ini yaitu metode Enter. Sebenarnya masih terdapat beberapa metode lain, tetapi akan lebih relevan jika metode-metode tersebut dibahas dalam bagian regresi berganda. Tabel Model Summary Salah satu tabel yang mempunyai arti sangat penting dalam analisis regresi adalah Tabel Model Summary, karena menyangkut nilai koefisien korelasi dan koefisien determinasi. R disebut juga dengan koefisien korelasi. Nilai R menerangkan tingkat hubungan antara variabel independent (X) dengan variabel dependent (Y). Dari hasil analisis didapat nilai koefisien korelasi sebesar 0,891, berarti bahwa hubungan antara salinitas dan produksi adalah sebesar 89,1% (pada tabel ini tidak dituliskan nilai korelasi tersebut positif atau negatif). R Square disebut koefisien determinasi. Koefisien determinasi menerangkan seberapa variasi Y yang disebabkan oleh x. Dari tabel dapat dibaca nilai R square (R 2 ) sebesar 0,793, artinya bahwa variasi yang terjadi terhadap banyak produktivitas tambak sebesar 79,35 disebabkan oleh variasi kadar garam di tambak dan sisanya hanya sebesar 20,7% dipengaruhi oleh hal-hal lain di luar persamaan ini. Adjusted R square merupakan nilai R 2 yang disesuaikan sehingga gambarannya lebih mendekati mutu penjajakan model dalam populasi. Dimana n = jumlah sampel k = jumlah parameter Std. Error of the Estimation merupakan kesalahan standar dari penaksiran, bernilai 4,372.

32 OUTPUT ANOVA b Model Sum of Squaresdf Mean SquareFSig. 1Regression a Residual Total a. Predictors: (Constant), Salinitas b. Dependent Variable: Produksi

33 INTERPRETASI Tabel Anova Pada analisis kali ini kita menggunakan model regresi linier sederhana dengan model persamaan Y = a + bX. Apakah pilihan model tersebut sudah tepat? Dapat diterima? Mengapa tidak menggunakan model lain saja? Pertanyaan tersebut dijawab dengan melihat nilai F hitung pada tabel ANOVA di atas. Dari hasil komputasi didapat nilai F hitung sebesar 53,791. Untuk menguji apakah model linier Y = a + bX tersebut sudah tepat atau belum, maka F hitung pada tabel anova perlu dibandingkan dengan F tabel. F hitung = 53,791 F tabel dilihat pada : Taraf signifikansi 5% -df pembilang = jumlah variabel – 1 = (2 – 1) = 1 -df penyebut = jumlah data – jumlah variabel = (16 – 2) = 14 F tabel = 4,60 Karena F hitung > F tabel, dapat disimpulkan bahwa model linier Y = a + bx sudah tepat dan dapat digunakan. Selain membandingkan F hitung dengan F tabel ada cara yang lebih mudah untuk menentukan ketepatan model di atas, yaitu dengan membandingkan probabilitas (pada tabel Anova tertulis Sig) dengan taraf nyatanya (α = 0,05 atau 0,01). Jika probabilitas > 0,05 maka model ditolak. Jika probabilitas < 0,05 maka model diterima. Dapat dilihat nilai probabilitas (Sig) adalah 0,000 < 0,05 berarti model diterima atau dapat disimpulkan bahwa bentuk persamaan linier Y = a + bX sudah tepat dan dapat dipertanggungjawabkan.

34 OUTPUT Coefficients a Model Unstandardized Coefficients Standar dized Coeffici ents tSig. 95.0% Confidence Interval for B B Std. ErrorBeta Lower Bound Upper Bound 1 (Const ant) Salinit as a. Dependent Variable: Produksi

35 INTERPRETASI Tabel Coefficients Kolom Unstandardized Coefficients Constant (Konstanta) = 39,471 Konstanta untuk X (salinitas) = 0,102 Dari sini didapatkan persamaan regresi Y = 39, ,102X Kolom t Uji t berguna untuk menguji signifikansi koefisien regresi (b), apakah variabel independent (X) berpengaruh secara nyata atau tidak. Hipotesis Ho = kadar garam tidak berpengaruh nyata terhadap produktivitas tambak. Ha = kadar garam mempengaruhi produktivitas tambak. Pengambilan Keputusan Jika –t tabel < t hitung < t tabel, maka Ho diterima. Jika t hitung t tabel, maka Ho ditolak. t hitung sebesar 7,334 t tabel tingkat signifikansi 0,05 derajad bebas = jumlah sampel – jumlah variabel = (16 – 2) = 14 dimana dilakukan 2 sisi (2 tailed) t tabel (0.05; 14) = 2,510 Karena t hitung > t tabel maka Ho ditolak, artinya bahwa kadar garam berpengaruh secara nyata (signifikan) terhadap produktivitas tambak. Pengambilan keputusan juga dapat dengan melihat probabilitasnya dimana nilainya 0,000 < 0,05.

36 Soal Latihan Berikut ini data mengenai pengalaman kerja dan penjualan. X : pengalaman kerja (tahun) Y : omzet penjualan (ribuan) (a)Apakah pengalaman kerja berpengaruh secara signifikan terhadap omzet penjualan? (b)Tentukan nilai a dan b serta tentukan persamaan regresinya! (c)Berapa omzet penjualan dari seorang karyawan yang pengalaman kerjanya 3,5 tahun? X Y

37 REGRESI LINIER BERGANDA Membahas hubungan antara satu variabel dependen dengan beberapa variabel independen atau yang sering disebut sebagai regresi berganda. Dinamakan berganda bukan berarti variabel bebasnya berjumlah dua, tetapi bisa berjumlah dua atau lebih. Rumus matematis untuk regresi berganda adalah sebagai berikut : Y = a +b 1 X 1 + b 2 X 2 + b 3 X 3 + … + b n X n Atau secara lengkap dapat juga ditulis sebagai berikut : Y = a +b 1 X 1 + b 2 X 2 + b 3 X 3 + … + b n X n + e Dimana : Y = variabel dependen (bergantung) a = koefisien/konstanta regresi b 1,2,3 = koefisien untuk variabel X1, X2, X3 dan seterusnya X 1,2,3 = variabel independen pertama, kedua, ketiga dan seterusnya. e = error

38 Contoh : Faktor utama yang mempengaruhi produktivitas padi tadah hujan adalah curah hujan dan dosis pemupukan. Berbasis data yang telah dikumpulkan, seseorang ingin mengetahui seberapa besar curah hujan dan pemupukan berpengaruh terhadap produktivitas padi. PRODUKSI PADI (KUINTAL) (Y) CURAH HUJAN (mm/hari) (X1) PEMUPUKAN (kg/ha) (X2)

39 PENYELESAIAN DENGAN SPSS 1.Entrilah data dalam lembar kerja SPSS. 2.Klik Variable View di sebelah kiri bawah lembar kerja. 3.Kolom label digunakan untuk memperjelas informasi tentang variabel yang dimaksud. Pada kolom Label, berilah nama produktivitas untuk variabel Y, curah hujan untuk X1, dan pemupukan untuk X2. 4.Klik Analyze, Regression, Linear. Pindahkan variabel produktivitas (Y) sebagai variabel bergantung ke kolom Dependent serta variabel curah hujan (X1) dan pemupukan (X2) sebagai variabel bebas ke kolom Independent(s).

40 Perhatikan pada kolom Method. Menu ini merupakan menu pilihan metode regresi yang hendak digunakan, terdapat beberapa metode yang disajikan dalam SPSS, yaitu : 1.Metode Enter Adalah metode analisis biasa dimana semua variabel bebas dimasukkan sebagai variabel prediktor, tidak memandang pengaruh apakah variabel tersebut berpengaruh besar atau kecil pada variabel bergantung (kriterium). 2. Metode Stepwise Digunakan untuk analisis regresi secara bertahap dengan tujuan pokok untuk mencari variabel yang paling dominan. 3. Metode Remove Digunakan untuk mencari prediktor yang dominan dan bila variabel prediktor tidak berpengaruh, akan dibuang(di-remove). 4. Metode Backward Menganalisis variabel dari belakang, artinya semua variabel dianalisis kemudian dilanjutkan menganalisis pengaruh variabel-variabel bebasnya lalu variabel yang tidak berpengaruh dibuang. 5. Metode Forward Menganalisis variabel dari depan, maksudnya semua variabel pertamanya dianggap tidak berpengaruh semua, kemudian variabel yang berpengaruh dimasuk-masukkan.

41 PENYELESAIAN DENGAN SPSS 5. Klik Options a)Use Probability of F menunjukkan nilai probabilitas dimana sebuah variabel akan dimasukkan dalam persamaan atau dikeluarkan dari persamaan harga entry di sini adalah 0,05. Artinya, jika nilai probabilitas X1 atau X2 kurang dari 0,05, akan dimasukkan dalam persamaan. Harga removal 0,1 artinya jika nilai probabilitas X1 dan X2 lebih dari 0,1, variabel tersebut akan dikeluarkan dari persamaan. b)Use F Value, jika memilih opsi ini, Anda harus memasukkan harga entry dan harga removal. Nilai entry harus lebih besar daripada nilai removal. Dalam keadaan default, harga entry = 3,84 dan harga removal 2,71. c)Exclude cases listwise menganalisis case-case yang hanya memiliki harga valid dari semua variabel. d)Exclude cases pairwise menganalisis koefisien korelasi dari seluruh case yang berharga valid dari semua variabel yang dikorelasikan. e)Replace with mean menggantikan missing value dengan rata-rata variabel. 6. Pilih probabilitas entry 0,05 dan harga removal 0,1; exclude case listwise, kemudian klik Continue. 7. Klik Statistic. 8. Aktifkan kotak estimates dan model fit, abaikan yang lain,klik continue. 9. Klik OK.

42 OUTPUT Variables Entered/Removed b ModelVariables EnteredVariables RemovedMethod 1 pemupukan, curah hujan.Enter a. All requested variables entered. b. Dependent Variable: produktivitas Model Summary ModelRR SquareAdjusted R Square Std. Error of the Estimate a a. Predictors: (Constant), pemupukan, curah hujan ANOVA b ModelSum of SquaresdfMean SquareFSig. 1Regression a Residual Total a. Predictors: (Constant), pemupukan, curah hujan b. Dependent Variable: produktivitas Coefficients a Model Unstandardized Coefficients Standardized Coefficients tSig. BStd. ErrorBeta 1(Constant) curah hujan pemupukan a. Dependent Variable: produktivitas

43 INTERPRETASI Tabel Variables Entered/Removed Tabel ini memberikan informasi tentang variabel-variabel independen yang kurang berpengaruh terhadap variabel dependen sehingga akan dikeluarkan dari persamaan. Dapat dilihat pada kolom variables removed tidak terdapat variabel yang dikeluarkan. Tabel Model Summary  Menerangkan besarnya korelasi (R), koefisien determinasi (R 2 ), koefisien determinasi yang disesuaikan (adjusted R 2 ) dan standar error.  Koefisien korelasi (R) sebesar 0,975, mendekati nilai1 artinya hubungan antara variabel-variabel independen (X 1, X 2 ) dan dependen (Y) sangat erat. Korelasi antara variabel dependen dan independen bersifat positif. Artinya, jika nilai X naik, maka akan direspon dengan kenaikan nilai Y.  Koefisien determinasi (R 2 ) sebesar 0,951, artinya bahwa 95,1% produksi padi tadah hujan dipengaruhi oleh faktor curah hujan dan pemupukan. Sedangkan 4,9% (100% - 95,1%) karena faktor-faktor lain yang tidak dapat dijelaskan dalam persamaan regresi tersebut.  Koefisien determinasi dapat dihitung dengan mengkuadratkan koefisien korelasi.

44 INTERPRETASI Tabel ANOVA Persamaan regresi yang kita gunakan adalah : Y = a + b 1 X 1 + b 2 X 2 Apakah model hubungan antara X 1, X 2 dan Y hanya ada model linier seperti di atas? Jelas tidak, sebenarnya model-model persamaan masih sangat banyak. Jadi, mengapa kita menggunakan persamaan linier? Apakah model tersebut sesuai? Pertanyaan tersebut akan terjawab dari tabel ANOVA. F hitung digunakan untuk menguji apakah model persamaan Y = a + b 1 X 1 + b 2 X 2 yang diajukan dapat diterima atau tidak. Caranya dengan membandingkan F hitung tersebut dengan F tabel. Jika F hitung > F tabel, maka model di atas dapat diterima dan sebaliknya. -F hitung = 115,62 -F tabel dapat dilihat pada α = 0,05 dengan Derajad bebas pembilang = (k – 1)= 3 – 1 = 2 Derajad penyebut = (n – k) = 15 – 3 = 12 -F tabel 0,05 (2;12) = 3,89 Karena F hitung > F tabel, dapat disimpulkan bahwa model yang digunakan sudah tepat. Untuk lebih mudahnya dapat dengan melihat probabilitasnya. Jika probabilitas < taraf signifikansi (α =0,05),maka model diterima. Dan sebaliknya, dapat dilihat probabilitasnya adalah 0,000 < 0,05 maka model persamaan Y = a + b 1 X 1 + b 2 X 2 yang digunakan dapat diterima.

45 INTERPRETASI Tabel Coefficients Setelah menguji signifikansi persamaan regresi, selanjutnya perlu diuji apakah masing-masing variabel independen (X 1, X 2 ) mempunyai pengaruh yang nyata terhadap Y. Untuk itu dilakukan uji t. Hipotesis : Ho : Variabel independen tidak mempengaruhi variabel dependen secara nyata. Ha : Variabel bebas berpengaruh nyata terhadap variabel dependen. Pengambilan Keputusan : Jika –t tabel < t hitung < t tabel, Ho diterima. Jika t hitung t tabel, Ho ditolak. t tabel dilihat dengan derajad bebas = n – k n = jumlah sampel dalam hal ini = 15 k = jumlah variabel yang digunakan = 3 sehingga derajad bebasnya = 15 – 3 = 12 Uji t dilakukan uji dua arah (2 tailed) sehingga cara membaca t tabelnya sedikit berbeda, t tabel dibaca pada t ½ α atau t ½ (0,05) atau t 0,025. -t tabel = 2,560 -t hitung (X 1 ) =4,062 -t hitung (X 2 ) = 4,741

46 INTERPRETASI Keputusan : Variabel Curah Hujan (X 1 ) Karena t hitung (4,062) > t tabel (2,560) maka Ho ditolak, artinya curah hujan berpengaruh nyata terhadap produktivitas padi. Variabel Pemupukan (X 2 ) Karena t hitung (4,741) > t tabel (2,560) maka Ho ditolak, artinya produktivitas dapat dipengaruhi secara nyata oleh faktor pemupukan.

47 INTERPRETASI Persamaan regresi dapat diperoleh pada kolom B pada tabel coefficients. Baris pertama menunjukkan konstanta (a), baris kedua adalah konstanta untuk faktor X 1, dan baris ketiga adalah konstanta untuk faktor X 2. Persamaan dasarnya adalah : Y = a + b 1 X 1 + b 2 X 2 Dengan melihat hasil pada tabel coefficients,maka : Persamaan regresi Y = 8, ,078X 1 + 0,327X 2 Dimana ; Y = Produksi Padi X 1 = Curah Hujan X 2 = Pemupukan Dari persamaan dapat diuraikan sebagai berikut : 1.Konstanta (a) = 8,754, artinya jika padi tidak dilakukan pemupukan dan tidak ada hujan, produksi padi adalah 8,754 kuintal. 2.Koefisien regresi X 1 (b 1 ) = 0,078, artinya jika terjadi curah hujan sebanyak 1 satuan, produksi padi akan meningkat sebesar 0,078 kuintal. 3.Koefisien regresi X 2 (b 2 ) = 0,327, artinya jika padi dipupuk sebesar 1 satuan, produksi padi meningkat sebesar 0,325 kuintal.

48 Soal Latihan 12 orang mahasiswa di Jakarta ditanya tentang berat badan, tinggi dan umur mereka. Y = berat badan dalam kg. X1 = tinggi dalam cm. X2 = umur, dibulatkan dalam tahun. Hasil wawancara adalah sbb. (a)Carilah nilai a, b1 dan b2 serta tentukan persamaan regresi berganda! (b)Apakah tinggi dan umur masing-masing berpengaruh signifikan terhadap berat badan? (c)Berapa berat seseorang yang tingginya 153 cm dan umurnya 23 tahun? Y X X

49 REGRESI LINIER DENGAN VARIABEL BONEKA (DUMMY VARIABLE) Dalam menganalisis data, terkadang kita dihadapkan pada data-data yang bukan data rasio tetapi berupa data-data kategori yang bersifat kualitatif. Data-data kategori misalnya jenis kelamin,pekerjaan,pendidikan dan lain-lain. Jenis kelamin kita hanya mempunyai dua laki-laki atau perempuan, pendidikan misalnya dibedakan menjadi SD, SMP, SMA dan sarjana, data- data tersebut bukan data yang berbentuk angka dan tidak mempunyai nilai kuantitatif. Analisis regresi tidak serta merta dapat menganalisis data-data semacam ini. Untuk menganalisis data-data kategori,maka data-data tersebut harus “diangkakan” sehingga mempunyai nilai. Misalnya untuk variabel jenis kelamin, laki-laki diberi angka 1 sedangkan perempuan diberi angka 0. Angka 1 dan angka 0 tersebut bukan merupakan nilai sebenarnya, angka tersebut hanya berupa kategori sehingga disebut sebagai variabel boneka atau dummy. Regresi dummy digunakan dalam persamaan regresi dimana variabel independennya (X) berupa variabel kualitatif. Sebaliknya, jika yang merupakan variabel kualitatif adalah variabel dependennya (Y), regresi yang digunakan adalah regresi logistik.

50 Contoh : Perusahaan Silva Wood Industries, merupakan produsen bubur kertas (pulp). Selama bertahun- tahun perusahaan telah memproduksi pulp dengan kualitas “prima” Perusahaan telah berhasil meningkatkan kualitas produksi menjadi kualitas “super”. Dengan kekuatan promosi perusahaan telah merambah dunia ekspor. Perusahaan hendak mengetahui peranan kualitas, produksi dan promosi di dalam meningkatkan pendapatan perusahaan. Data-datanya sebagai berikut. KualitasProduksi (Ton)Promosi (Juta Rupiah)Pendapatan (milyar Rupiah) Super Prima

51 PENYELESAIAN DENGAN SPSS 1.Entrilah data ke halaman kerja SPSS dengan format sebagai berikut. 2.Klik Variable View pada pojok kiri bawah. 3.Beri nama dan label untuk masing-masing variabel : Baris pertama : nama X1, Label : Kualitas Baris kedua : nama X2, Label : Produksi Baris ketiga : nama X3, Label : Promosi Baris keempat : nama Y, Label : Pendapatan 4.Khusus pada variabel X1, karena variabel tersebut merupakan variabel kategori, artinya angka 1 tersebut bukan benar-benar sebagai angka satu melainkan hanya kode untuk kualitas super dan angka dua untuk kualitas prima, maka variabel X1 perlu diberi keterangan sebagai berikut.

52 PENYELESAIAN DENGAN SPSS 5.Pada bagian kolom Value : Keterangan pada variabel X1 (Kualitas) : -Super diberi kode 1 -Prima diberi kode 2 6. Klik Analyze, Regression, Linear. 7. Pindahkan variabel Pendapatan (Y) ke kolom Dependent, variabel Kualitas (X1), Produksi (X2) dan Promosi (X3) ke kolom Independent(s). 8. Klik OK.

53 OUTPUT Model Summary ModelRR SquareAdjusted R Square Std. Error of the Estimate a a. Predictors: (Constant), Promosi, Kualitas, Produksi ANOVA b Model Sum of SquaresdfMean SquareFSig. 1Regression a Residual Total a. Predictors: (Constant), Promosi, Kualitas, Produksi b. Dependent Variable: Pendapatan Coefficients a Model Unstandardized Coefficients Standardized Coefficients tSig. BStd. ErrorBeta 1(Constant) Kualitas Produksi Promosi Variables Entered/Removed b ModelVariables EnteredVariables RemovedMethod 1 Promosi, Kualitas, Produksi.Enter a. All requested variables entered. b. Dependent Variable: Pendapatan

54 INTERPRETASI Tabel Variables Entered/Removed Semua variabel masuk di dalam kolom variables entered,artinya semua variabel dimasukkan dalam persamaan dan tidak ada variabel yang dikeluarkan. Tabel Model Summary Pada tabel ini dapat dilihat nilai koefisien korelasi (R) sebesar 0,912 menunjukkan hubungan yang sangat kuat. Koefisien determinasi (R 2 ) sebesar 0,831 artinya naik turunnya pendapatan perusahaan 83,1% disebabkan pengaruh Kualitas, Produksi dan Promosi. Hanya 16,9% yang tidak diketahui. Adjusted R Square merupakan koreksi dari R 2 sehingga gambarannya lebih mendekati mutu penjajakan model populasi. R 2 yang disesuaikan dirumuskan sebagai berikut : Dimana n = jumlah sampel k= jumlah parameter

55 INTERPRETASI Tabel Anova Dari tabel Anova dapat dilihat nilai F hitung 26,265. F tabel 0.05 (3;16) adalah 3,24. Karena F hitung > F tabel atau melihat probabilitasnya (Sig) yang lebih kecil dari taraf signifikansi (0,000 < 0,05), dapat disimpulkan bahwa model persamaan Y = a + b 1 X 1 + b 2 X 2 + b 3 X 3 yang diajukan dapat diterima.

56 INTERPRETASI Tabel Coefficients Dilakukan uji t untuk menguji signifikansi koefisien regresi dari setiap variabel independen. Hipotesis Ho = Variabel bebas tidak berpengaruh nyata terhadap variabel dependen. Ha = Variabel bebas berpengaruh nyata terhadap variabel dependen. Pengambilan Keputusan Jika –t tabel < t hitung < t tabel, maka Ho diterima. Jika t hitung t tabel, maka Ho ditolak. Keputusan : t tabel t 0,05 dengan derajad bebas (n – k). dimana : n = jumlah sampel =20 k = jumlah variabel bebas dan bergantung = 4 karena uji dilakukan 2 sisi,maka t tabel dengan α 0,025. t(0,025; 16) = 2,473 t hitung untuk variabel Kualitas (X1) = -3,070 (minus) Karena t hitung < -t tabel, maka Ho ditolak, berarti pengaruh kualitas signifikan. t hitung untuk variabel Produksi =4,478. Karena t hitung > t tabel, maka Ho ditolak, artinya pengaruh kapasitas produksi terhadap pendapatan perusahaan signifikan. t hitung untuk variabel Promosi = 4,291. Karena t hitung > t tabel, maka Ho ditolak, artinya promosi mempengaruhi kenaikan pendapatan perusahaan secara signifikan.

57 INTERPRETASI Persamaan Dengan melihat pada table coefficient kita dapatkan persamaan sebagai berikut. Y = 3,332 – 0,559X 1 + 1,486X 2 + 0,019X 3 Dimana : Y =Pendapatan perusahaan X 1 = Kualitas X 2 = Produksi X 3 = Promosi Dari persamaan di atas, bisa dikembangkan menjadi dua model regresi sesuai dengan kualitas produksi. Kualitas Super (kode 1) Y = 3,332 – 0,559X 1 + 1,486X 2 + 0,019X 3 Y = 3,332 – 0,559(1) + 1,486X 2 + 0,019X 3 Y = 2, ,486X 2 +0,019X 3 Kualitas Prima (kode 2) Y = 3,332 – 0,559X 1 + 1,486X 2 + 0,019X 3 Y = 3,332 – 0,559(2) + 1,486X 2 + 0,019X 3 Y = 2, ,486X 2 +0,019X 3

58 Soal Latihan Berikut data jenis kelamin, hasil produksi dan skor tes kecerdasan dari 8 karyawan pabrik mainan anak-anak “Tackey”. (a)Tentukan a,b1 dan b2 serta persamaan regresi linier berganda! (b)Apakah jenis kelamin dan skor tes kecerdasan berpengaruh secara signifikan terhadap hasil produksi? Hasil Produksi (lusin) (Y) Jenis KelaminSkor Tes Kecerdasan 30Perempuan6 49Laki-laki9 18perempuan3 42Perempuan8 39Laki-laki7 25Laki-laki5 41Perempuan8 52Laki-laki10


Download ppt "KORELASI DAN REGRESI. KORELASI Analisis korelasi bertujuan untuk mengetahui pola dan keeratan hubungan antara dua atau lebih variabel. “Correlation does."

Presentasi serupa


Iklan oleh Google