Chapter 11 Sulidar Fitri, M.Sc STATISTIK KORELASI Chapter 11 Sulidar Fitri, M.Sc
Pengantar Analisis Regresi adalah Analisis statistika yang memanfaatkan hubungan antara dua atau lebih peubah kuantitatif sehingga salah satu peubah dapat diramalkan dari peubah lainnya. Analisis korelasi merupakan analisis yang dapat menunjukkan besarnya hubungan keeratan antara dua peubah atau lebih.
Korelasi
Korelasi
Korelasi
Definitions: Correlation exists between two variables when the values of one variable depend on the values of the other variable in a certain way. as the values of x grow (to the right), so do the values of y grow (up) – positive (linear) correlation: Linear Correlation Coefficient (r) measures the strength of the linear relationship between the values of paired data.
there may be no correlation between the values of paired data, such as the values of x grow (to the right), the values of y decrease (down) and increase (up) forming a vague cloud: Page 519 of Elementary Statistics, 10th Edition
or the correlation between the two variables may be non-linear – points on the scatter-gram hugging a curve:
Koefisien Korelasi Pearson (r)
Properties of the Linear Correlation Coefficient r 2. r does not change if all values of either variable are converted to a different scale. 3. r is not affected by the choice of x and y. 4. r measures strength of a linear relationship. page 524 of Elementary Statistics, 10th Edition If using a graphics calculator for demonstration, it will be an easy exercise to switch the x and y values to show that the value of r will not change. The value of r2 is the proportion of the variation in y that is explained by the linear relationship between x and y.
Contoh Jarak Emisi 31 553 38 590 48 608 52 682 63 752 67 725 75 834 84 752 89 845 99 960
Correlation?
Scatter plot diagram
Apabila tidak memenuhi asumsi misalnya data tidak berdistribusi normal (atau ada nilai data pencilan), kita bisa menggunakan korelasi Spearman (Spearman rank correlation), korelasi untuk analisis non-parametrik.
Interval Kekuatan. : Sejumlah penulis statistik membuat interval kategorisasi kekuatan hubungan korelasi. Jonathan Sarwono, misalnya, membuat interval kekuatan hubungan sebagai berikut:
Interprestasi angka korelasi menurut Prof. Sugiyono (2007) 0 - 0,199 : Sangat lemah 0,20 - 0,399 : Lemah 0,40 - 0,599 : Sedang 0,60 - 0,799 : Kuat 0,80 - 1,0 : Sangat kuat Dalam Bivariate model, korelasi yang umum digunakan adalah Pearson, Kendall, dan Rank Spearman, namun yang dibahas kali ini adalah Pearson r Correlation aja..
Atau penulis lain seperti D Atau penulis lain seperti D.A de Vaus menginterpretasikannya sebagai berikut:
Interpretasi Hasil Uji Korelasi Penelitian (contoh) hendak menguji apakah terdapat hubungan antara Budaya Organisasi (x1) dan Iklim Organisasi (x2) dengan Kepuasan Kerja (y). Hasil uji statistik menggunakan Pearson Product Moment? Korelasi. Jika suatu hubungan tidak sama dengan 0, maka dapat dikatakan terjadi hubungan. Perhatikan baris-baris Pearson Correlation, di mana dihasilkan hasil-hasil berikut: Budaya Organisasi berhubungan secara positif dengan Kepuasan Kerja sebesar 0,451 (r = 0,451). Iklim Organisasi berhubungan secara positif dengan Kepuasan Kerja sebesar 0,838 (r = 0,838). Dengan demikian, terdapat hubungan antara variabel x1 dan x2 dengan y. Hipotesis-hipotesis 0 di atas, sebab itu, ditolak.
Signifikansi. Nilai r hubungan Budaya Organisasi dengan Kepuasan Kerja adalah 0,000. Artinya, 0,000 < 0,05 dan dengan demikian korelasi antara kedua variabel signifikan. Nilai r hubungan Iklim Organisasi dengan Kepuasan Kerja adalah 0,000. Artinya, 0,000 < 0,05 dan dengan demikian korelasi antara kedua variabel signifikan.
Koefisien Determinasi (r2) Menafsirkan skor korelasi Pearson (r). Caranya dengan mengkuadratkan nilai r tersebutkarena ia bukan berada dalam skala Rasio, Akibatnya, kita tidak bisa melakukan operasi aritmetika (kurang, bagi, kali, tambah) terhadap nilai r tersebut. Guna mencari nilai Koefisien Determinasi, dilakukan langkah berikut: Nilai r Budaya Organisasi – Kepuasan Kerja = 0,451 x 0,451 = 0,2034. Kalikan nilai ini dengan 100% maka 0,2034 x 100% = 20,34%. Nilai r Iklim Organisasi – Kepuasan Kerja = 0,838 x 0,838 = 0,7022. Kalikan nilai ini dengan 100% maka 0,7022 x 100% = 70,22%.
Penafsiran Koefisien Determinasi adalah: Sebesar 20,34% varians Kepuasan Kerja dapat dijelaskan oleh Budaya Organisasi. Sebesar 70,22% varians Kepuasan Kerja dapat dijelaskan oleh Iklim Organisasi. Dan sisa dari persen tersebut disebabkan oleh faktor lain
CONTOH KASUS: Individual Age Weight Systolic Pressure A 34 45 108 B 43 44 129 C 49 56 126 D 58 57 149 E 64 65 168 F 73 63 161 G 78 55 174 Untuk kasus ini, kita ingin melihat apakah terdapat hubungan linier antara usia dengan tekanan darah sistolik? Taraf nyata yang digunakan adalah 5%.
Perhitungan nilai koefisien korelasi (r) No Age (X) Systolic Pressure (Y) X2 Y2 XY 1 34 108 1156 11664 3672 2 43 129 1849 16641 5547 3 49 126 2401 15876 6174 4 58 149 3364 22201 8642 5 64 168 4096 28224 10752 6 73 161 5329 25921 11753 7 78 174 6084 30276 13572 Jumlah 399 1015 24279 150803 60112 Rata-rata 57 145
Hipotesis: H0: ρ = 0 vs H1: ρ ≠ 0
EXPLORASI DATA Berdasarkan diagram pencar (scatterplot), tampak bahwa sebaran titik-titik mengikuti pola linier dengan kemiringan positif, yang berarti terdapat hubungan yang sejalan antara usia dengan tekanan darah sistolik. Dengan demikian, kita bisa menggunakan koefisien korelasi untuk menentukan apakah hubungan linier kedua variabel tersebut bermakna atau tidak. Apabila pola hubungannya tidak linier, kita tidak tepat menggunakan koefisien korelasi karena nilai r hanya untuk mengukur kekuatan dan arah hubungan linier antara kedua varibel kuantitatif.
Tabel Nilai Kritis untuk Koefisien Korelasi Peringkat Spearman
NOTE: Reject H0 if observed r equals or exceed critical r Bandingkan nilai |r| dengan nilai tabel kritis r untuk n = 7. Nilai r pada tabel kritis = 0.714. Dari hasil perhitungan, diperoleh nilai r = 0.956. Jelas bahwa |r|> 0.714 dan p<0.05 sehingga kita bisa menyimpulkan bahwa terdapat hubungan linier antara usia dengan tekanan darah sistolik secara signifikan. NOTE: Reject H0 if observed r equals or exceed critical r
Nilai koefisien determinasi diatas menyatakan proporsi keragaman Tekanan darah sistolik yang dapat diterangkan/dijelaskan oleh hubungan linier antara variabel usia dan tekanan darah sistolik. Berdasarkan hasil analisis, kita yakin 95% bahwa sekitar 91% variasi tinggi rendahnya tekanan darah sistolik ditentukan oleh usia seseorang.
Any Queries ? Source: 1. essensial dan muohio 2. internet /berbagai sumber