MENENTUKAN GARIS LURUS TERBAIK TUJUAN MENJELASKAN TEHNIK MEMILIH GARIS LURUS TERBAIK DAN PEMECAHAN MASALAH THE BEST-FIT
SEBELUMNYA TELAH DIJELASKAN ASUMSI-ASUMSI YANG HARUS DIPENUHI DIDALAM ANALISIS REGRESI. Perhatikan bahwa Y= b0 + b1X + E Dimana E merupakan error atau besaran kejauhan response individu (Xi) terhadap nilai garis regresi populasi. Dengan perkataan lain, pada satu titik observasi Xi terdapat error (penyimpangan) dari nilai harapan yaitu mYlX sebesar E, yang merupakan random variabel dari satu titik dengan titik lain. Karena E merupakan komponen ‘error’ maka dapat dibuat rumus: E = Y – (b0 + b1X) Atau E = Y – mYlX
Pelajari lagi gambar berikut
Tehnik menentukan ‘the best fitting straight line’ yang utama adalah ‘the Least-square method’. Tehnik ini menggunakan ‘line which minimizes the sum square of the lengths of the vertical line segment’ berdasarkan titik observasi dalam diagram sebar seperti terlihat dalam gambar tadi dan yang berikut. Idenya adalah semakin kecil penyimpangan satu observasi terhadap garis lurus (semakin kecil kuadrat simpangan) semakin dekat (‘snugger’) the best-fitting line yang diperoleh dari data yang dimiliki.
Perhatikan notasi statistik berikut Bila adalah estimasi nilai Xi dalam model regresi, maka dimana adalah intercept adalah slope
Jarak vertikal antara titik observasi (Xi,Yi) dan titik pada fitted line dari nilai absolut adalah Jumlah kuadrat dari semua jarak titik Xi’s adalah
Deviations of observed points from the fitted regression line Perhatikan gambar berikut Deviations of observed points from the fitted regression line
Least square didefinisikan bahwa pemilihan nilai2 b0 dan b1 didasarkan atas jumlah kuadrat minimum (yang terkecil). Jumlah kuadrat minimum (minimum sum of squares) merupakan estimasi least square dari dan juga disebut sebagai ‘the sum of squares about the regression line’ atau ‘the residual sum of square’ atau ‘the sum of squares due to error (SSE)’. Besaran SSE berperan besar dalam menilai kualitas ‘the straight line fit’, makin besar nilai SSE makin besar error, makin tidak fit garis lurus regresinya
Dalam menentukan ‘the Best-Fitting Straight Line digunakan:
The Least-squares line bisa ditulis
Perhatikan Contoh Soal Data TDS dan Umur No TDS Age 1 144 39 11 162 64 21 136 36 2 220 47 12 150 56 22 142 50 3 138 45 13 140 59 23 120 4 145 14 110 34 24 5 65 15 128 42 25 160 44 6 46 16 130 48 26 158 53 7 170 67 17 135 27 63 8 124 18 114 28 29 9 19 116 20 125 10 154 30 175 69
=142.53 –(0.97)(45.13)= 98.71
Scatter plot
Persamaan Garis Lurus