Oleh : DR. LEDY SETIAWATI, SE., M. Si. S T A T I S T I K Oleh : DR. LEDY SETIAWATI, SE., M. Si.
PENGERTIAN STATISTIK Statistika adalah ilmu yang mempelajari tekhnik maupun metode-metode yang digunakan untuk penelitian yang bersifat ilmiah agar diperoleh suatu analisis yang sesuai dengan pengamatan yang sebenarnya serta menghasilkan suatu ketajaman/ akurasi dalam pengukuran nilai data yang dihasilkan Statistika tidak hanya menyajikan data dalam bentuk tabel atau grafik, tapi juga berusaha menganalisis data yang ada serta mangambil kesimpulan dan menentukan seberapa jauh kebenaran daripada kesimpulan yang sudah ada itu
Statistika pada dasarnya dibagi ke dalam 2 pokok masalah, yaitu : Statistika Deskriptif, merupakan ilmu yang mempelajari bagaimana cara menyajikan, menyusun, maupun mengukur nilai-nilai data yang tersedia/ terkumpul dari suatu penelitian yang akhirnya dapat diperoleh suatu gambaran yang jelas terhadap objek yang diteliti sehingga mudah dimengerti oleh banyak orang Statistika Induktif, merupakan ilmu statistik yang mempelajari mengenai cara-cara dalam pengambilan kesimpulan suatu populasi, dimana penarikan kesimpulan ini berdasarkan pada suatu test (pengujian) yang dilakukan terhadap hasil observasi.
DISTRIBUSI FREKUENSI Tujuannya adalah untuk mengorganisasikan data secara sistematik ke dalam berbagai macam klasifikasi tanpa mengurangi informasi yang ada dari data tersebut. Data yang jumlahnya banyak dilakukan dengan membagi data ke dalam beberapa kelas sesuai dengan data yang diperoleh. Untuk mempermudah pembuatan distribusi frekuensi, maka dapat dipergunakan pendekatan STURGES dengan mempertimbangkan hal-hal sebagai berikut :
Jumlah kelas yang dapat dibuat dari sejumlah data (N) adalah : Range (R) = Nilai data maksimum-Nilai data minimum Interval kelas :
Contoh : Berikut data mengenai pengeluaran konsumsi rumah tangga di DIY selama 1 bulan dari 80 rumah tangga (dalam ribuan rupiah) 68 84 75 82 90 62 88 76 93 73 79 71 59 85 65 87 74 95 78 63 72 66 94 77 69 96 89 83 67 97 80 57 53 86 81
Jawab : Menentukan jumlah kelas dengan rumus Sturgess Setelah menghitung jumlah kelas kemudian menghitung range Range = 97-53 = 44 Menghitung interval kelas menunjukkan interval nilai dalam suatu kelas tertentu
Setelah perhitungan no 1, 2, dan 3 selesai, maka selanjutnya adalah membuat tabel distribusi frekuensi yang sesuai dengan jumlah kelas dan intervalnya. FKKD = Frekuensi Kumulatif Kurang Dari KELAS F NILAI TENGAH FKKD FKLD 80 53 – 58 1 55,5 79 59 – 64 2 61,5 3 77 65 – 70 17 67,5 20 60 71 – 76 13 73,5 33 47 77 – 82 24 79,5 57 23 83 – 88 9 85,5 66 14 89 – 94 7 91,5 73 95 - 100 97,5 JUMLAH FKLD = Frekuensi Kumulatif Lebih Dari
GAMBAR HISTOGRAM frekuensi Nilai tengah
GAMBAR POLIGON Nilai tengah
KURVA OGIVE FKKD FKLD FKKD = Frekuensi Kumulatif Kurang Dari FKLD = Frekuensi Kumulatif Lebih Dari
PENGUKURAN NILAI SENTRAL Merupakan suatu usaha yang ditujukan untuk mengukur besarnya nilai rata-rata dari distribusi data yang telah diperoleh dalam penelitian. Untuk mengukur besarnya nilai rata-rata, maka perlu dibedakan secara jelas pengelompokkan data tersebut ke dalam data yang berkelompok atau data yang tidak berkelompok Ukuran rata-rata yang biasanya digunakan dapat dibedakan menjadi : Rata-rata hitung (mean) Median Modus
Rata-Rata Hitung (mean) Rumus untuk data tidak berkelompok Contoh : Besarnya jumlah penjualan satu hari dari 5 toko kelontong di jalan Solo adalah sbb : toko X₁ = Rp100.000,00 X₂ = Rp 80.000,00 X₃ = Rp120.000,00 X₄ = Rp125.000,00 X₅ = Rp 75.000,00 maka rata-rata hitungnya :
Rumus untuk data berkelompok Contoh : Jadi KELAS F Xi F. Xi 53 – 58 1 55,5 59 – 64 2 61,5 123 65 – 70 17 67,5 1147,5 71 – 76 13 73,5 955,5 77 – 82 24 79,5 1908 83 – 88 9 85,5 769,5 89 – 94 7 91,5 640,5 95 - 100 97,5 682,5 JUMLAH 80 6282
b) Median Rumus untuk data yang tidak berkelompok Rumus untuk data yang berkelompok dimana : TKB = tepi bawah kelas median N = banyaknya data FKSM = frekuensi kumulatif sebelum kelas median FM = frekuensi kelas median i = interval Untuk jumlah data ganjil Untuk jumlah data genap
Contoh : Letak Median TKB = 76,5 FKSM= 33 FM = 24 I = 6 Jadi Modus Untuk data berkelompok
Dimana : TKB = Tepi bawah kelas modus d1 = selisih frekuensi kelas modus dengan frekuensi kelas sebelumnya d2 = selisih frekuensi kelas modus dengan frekuensi kelas sesudahnya i = interval Contoh : Letak kelas modus adalah kelas yang memiliki frekuensi terbesar, jika ada lebih dari satu maka dipilih salah satunya. Dalam tabel di depan diketahui bahwa kelas modus terletak pada kelas ke-5
TKB = 76,5 d1 = 24 – 13 = 11 d2 = 24 – 9 = 15 i = 6 Jadi
UKURAN DISPERSI (PENYEBARAN) Ukuran dispersi merupakan suatu metode analisis data yang ditunjukkan untuk mengukur besarnya penyimpangan/ penyebaran dari distribusi data yang diperoleh terhadap nilai sentralnya. Macam-macam ukuran dispersi : Range (Jangkauan) Mean Deviation (deviasi rata-rata) Standard Deviation (standar deviasi) dan Variance Koefisien Variasi
Range Merupakan ukuran penyebaran yang didasarkan pada perbedaan antara nilai data tertinggi dengan nilai yang terendah. Perhitungan ini hanya berdasarkan dua pengamatan saja dan menghasilkan perhitungan yang relatif kasar. Range yang penyebarannya kecil berarti bahwa suatu distribusi memiliki rangkaian data yang lebih homogen. Range yang penyebarannya besar berarti bahwa suatu distribusi memiliki rangkaian data yang lebih bersifat heterogen (bervariasi cukup besar)
Contoh 1 : berikut data keuntungan yang diperoleh dari 8 Toko Kelontongan di jalan Solo Toko A = Rp4.000,00 Toko E = Rp4.000,00 B = Rp5.000,00 F = Rp6.000,00 C = Rp6.000,00 G = Rp5.500,00 D = Rp5.000,00 H = Rp4.500,00 Dari data di atas diperoleh bahwa rata-rata keuntungan= Range = 6.000 – 4.000 = 2.000
Contoh 2 : berikut data keuntungan yang diperoleh dari 8 Toko Kelontongan di jalan Yogya Toko A = Rp1.000,00 Toko E = Rp6.000,00 B = Rp9.000,00 F = Rp5.000,00 C = Rp5.000,00 G = Rp9.500,00 D = Rp4.000,00 H = Rp500,00 Dari data di atas diperoleh bahwa rata-rata keuntungan= Range = 9.500 – 500 = 9.000 Contoh 1 dan 2 memiliki nilai rata-rata Rp5.000,00 tetapi kedua macam data tersebut memiliki perbedaan dalam penyebarannya di mana dalam contoh 1 rangkaian data lebih bersifat homogen dibanding contoh 2
Mean Deviation Merupakan penyebaran dari data atas dasar jarak (deviasi) dari berbagai angka-angka dari rata-ratanya. Rumus untuk data tidak berkelompok Contoh : berikut data keuntungan dari 5 toko Toko A = Rp4.000,00 B = Rp5.000,00 C = Rp6.000,00 D = Rp5.000,00 E = Rp5.000,00
Jawab : 1. Xi 4.000 1.000 5.000 0 6.000 1.000 2.000 3. Jadi
Rumus untuk data yang berkelompok dimana : MD = Mean Deviation F = frekuensi masing-masing kelas Xi = nilai tengah = nilai rata-rata (mean)
Dari tabel diatas maka
Standard Deviation dan Variance Merupakan ukuran penyimpangan dari suatu rangkaian data X₁, X₂,…,Xn terhadap nilai rata-rata (mean) Rumus Standard Deviasi untuk data yang tidak berkelompok dimana : = nilai standar deviasi = nilai rangkaian data = nilai rata-rata n = jumlah data
Rumus Variance untuk data tidak berkelompok ² contoh : berikut data keuntungan yang diperoleh dari 5 toko di daerah X : Toko A Rp4.ooo,00 B Rp5.000,00 C Rp6.000,00 D Rp5.000,00 E Rp4.000,00 μ = Rp5.000,00
Jadi besarnya standar deviasi keuntungan Toko Kelontong di daerah X adalah sebesar Rp774,69,00 Sedangkan besarnya varians keuntungan Toko Kelontongan di daerah X adalah sebesar Rp600.000,00
3. Rumus Standard deviasi untuk data berkelompok dimana : = deviasi standar Xi = nilai tengah masing-masing kelas = nilai rata-rata N = banyaknya data 4. Rumus Variance untuk data berkelompok
Contoh : Dari tabel diatas, maka diketahui standar deviasi dari pengeluaran konsumsi per bulan untuk 80 tangga adalah sebesar Rp9.790,00 Sedangkan besarnya variance dari pengeluaran konsumsi per bulan untuk 80 rumah tangga adalah sebesar Rp9.580,00
Koefisien Variasi Koefisien variasi merupakan standar deviasi dari suatu distribusi yang dinyatakan dalam persentase dari nilai mean Dalam kehidupan sehari-hari angka koefisien variasi sangat penting untuk diketahui karena dapat digunakan untuk mengukur besarnya variabilitas distribusi data yang diperoleh terhadap nilai rata-ratanya. Angka tersebut juga bisa digunakan sebagai dasar pengawasan kualitas (mutu) suatu barang/ produk yang dihasilkan oleh perusahaan tertentu Rumus :
Contoh : Lembaga Konsumen Indonesia melakukan pengujian terhadap beberapa sampel bola lampu yang dipilih secara randomdari merek A, B, dan C. Hasil pengujian sampel memberikan informasi sebagai berikut : Ditanya : Menurut hasil pengujian di atas bola lampu merek manakah yang mutunya paling baik ? SAMPEL MEREK A MEREK B MEREK C 1 2 3 4 5 800 Jam 820 Jam 790 Jam 760 Jam 830 Jam 810 Jam 805 Jam 795 Jam 850 Jam 750 Jam 875 Jam 725 Jam JUMLAH 4000 Jam
Jawaban MEREK A : MEREK B :
MEREK C : Jadi dapat disimpulkan bahwa KVA = 3,4%, KVB = 0,98%, KVC = 7,96%. Hal ini berarti bahwa variabilitas bola lampu merek B yang paling rendah sehingga bola lampu manapun yang dipilih dari merek rata-rata memiliki kekuatan sebesar 800 jam (kualitasnya lebih seragam) Bola lampu merek A dan C memiliki koefisien variasi yang lebih besar dari B. Hal ini berarti bahwa produksi bola lampu merek A dan C kualitasnya lebih bervariasi (tidak seragam) dibandingkan dengan merek B. Sehingga dapat disimpulkan bahwa kualitas bola lampu yang terbaik adalah merek B
ANALISIS TIME SERIES (TREND) Analisis deret berkala (time series) merupakan suatu metode yang ditujukan untuk melakukan suatu estimasi maupun peramalan pada masa mendatang. Analisis time series dapat digolongkan ke dalam analisis jangka pendek dan jangka panjang. Apabila analisis yang dipakai jangka pendek, maka ada kecendrungan model analisisnya berbentuk persamaan garis linear. Sedangkan dalam jangka panjang banyak faktor yang ikut mempengarhi fluktuasi dari data time series yang diperoleh, sehingga analisisnya bersifat non linear
METODE- METODE ANALISIS TREND LINEAR Free Hand Method Semi Average Method Least Square Method Dalam metode ini penarikan garis linear secara bebas adalah penarikan garis trend tanpa menggunakan rumus-rumus matematika tertentu. Contoh : Berikut data mengenai jumlah penjualan sabun setiap tahun selama 12 tahun di PT Unilever (dalam ribuan unit)
Misalkan tahun dasar yang digunakan adalah tahun 1990. JUMLAH PENJUALAN X 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 180 196 215 228 300 270 325 340 363 276 385 399 1 2 3 4 5 6 7 8 9 10 11 Misalkan tahun dasar yang digunakan adalah tahun 1990. Dari tabel tersebut, persamaan garis linear Y = a + bX dapat dibuat melaui dua buah koordinat yang dipilih secara bebas. Misalnya koordinat tahun 1990 yaitu (0,180) dan koordinat tahun 2001 (11,399)
Dari dua titik koordinat tersebut, dapat diselesaikan seperti berikut : Y = a + bX 180 = a + b (0) a = 180 399 = a + b (11) Dari persamaan 1 diperoleh nilai a sebesar 180. Sedangkan nilai b diperoleh dengan mensubsitusikan nilai a ke persamaan 2 sbb : 399 = a + b 11 399 = 180 + b 11 b = 19,9 Sehingga persamaannya menjadi Y = 180 + 19,9 X a = 180 menunjukkan besarnya taksiran penjualan pada tahun dasar yaitu 1990 sebesar 180.000 unit b = 19,9 menunjukkan besarnya rata-rata kenaikan penjualan setiap tahun yaitu sebesar 19.900 unit
Semi Average Method Dalam metode ini, yang perlu dilakukan pertama kali adalah membagi dua data deret berkala tersebut:
Y = a + bX 1. 231,5 = a + b (2,5) 2. 348 = a + b (8,5) -116,5 = -6 b b = 19,41 Setelah mendapatkan nilai a maka subsitusikan ke salah satu persamaan, misalnya ke persamaan pertama : 231,5 = a + 2,5 b 231,5 = a + 2,5 (19,41) a = 183
Jadi persamaan regresinya adalah Y = 183 + 19,41 X Artinya : Jika X bertambah satu tahun maka penjualan akan meningkat sebesar 19.410 unit Jika ingin mengestimasi berapa penjualan pada tahun 2003 ? Y = 183 + 19,41 (13) = 435,3 Jadi besarnya estimasi penjualan pada tahun 2003 adalah sebesar 435.300 unit.
Least Square Method Metode ini ditujukan agar jumlah kuadrat dari semua deviasi antara variabel X dan Y yang masing-masing memiliki koordinat sendiri akan berjumlah seminim mungkin, sehingga akan diperoleh suatu persamaan garis trend yang lebih akurat dibanding dengan metode sebelumnya. Persamaan garis linearnya Y = a + bX dapat dicari dengan rumus berikut : ∑Y = na + b∑X ∑XY = a∑X + b∑X²
Contoh : Berikut data volume penjualan sabun per hari oleh seorang agen dari PT Unilever : Ditanya : buatlah trend volume penjualan sabun tersebut dgn tahun dasar 1977 dengan metode least square
Subsitusikan nilai b kedalam salah satu persamaan : 2460 = 9a + 18b Jawaban : Rumus : 2460 = 9a + 18b x 2 5695 = 18a + 96b x 1 4920 = 18a + 36b 5695 = 18a + 96b 775 = -60b b = 12,91 Subsitusikan nilai b kedalam salah satu persamaan : 2460 = 9a + 18b 2460 = 9a + 18(12,91) a = 247,51 ∑Y = na + b∑X ∑XY = a∑X + b∑X²
Sehingga persamaan regresinya adalah Y = 247,51 + 12,91 X Artinya : a = 247,51 menunjukkan taksiran volume penjualan sebesar 247.510 unit sabun pada tahun dasar 1977 b = 12,91 menunjukkan taksiran rata-rata kenaikan volume penjualan setiap tahun yaitu sebesar 12.910 unit Apabila ingin diramalkan besarnya volume penjualan pada tahun 1990 adalah : Y = 247,51 + 12,91 (13) = 415,34
METODE –METODE ANALISIS TREND NON LINEAR Trend non-linear adalah garis trend yang tidak linear, misalnya : Trend kuadratik dan Trend eksponensial. (a) Trend Kuadratik Persamaan trend kuadratik adalah sebagai berikut : Yt = a + b.x + c.x2
Untuk mencari a, b dan c digunakan rumus Rumus ini digunakan dengan asumsi ∑X = 0
Berikut tentang data jumlah uang yang disimpan di Bank X (dalam Jutaan Rupiah) : TAHUN DEPOSIT X XY X² X²Y X4 UANG 1998 71 -13 -923 169 11999 28561 1999 49 -11 -539 121 5929 14641 2000 -9 -639 81 5751 6561 2001 95 -7 -665 4655 2401 2002 128 -5 -640 25 3200 625 2003 156 -3 -468 9 1404 2004 192 -1 -192 1 2005 217 2006 301 3 903 2709 2007 378 5 1890 9450 2008 520 7 3640 25480 2009 726 6534 58806 2010 804 11 8844 97284 2011 1328 13 17264 224432 JUMLAH 5036 35226 910 451508 105742
Jawaban : I. 5036 = 14a+910c 35226 = 910b 451508 = 910a+105742c Dari persamaan kedua diperoleh sebagai berikut : 910b = 35226 b = 35226/910 b = 38,71
Nilai konstanta a dan c diperoleh sebagai berikut : 585.183,2 = 1626,8a + 105.742c I x 116,2 451.508,0 = 910,0a + 105.742c III 133.675,2 = 716,8a a = 133.675,2/716,8 a = 186,49 Nilai c diperoleh dengan cara sebagai berikut : 5.036 = 14 (186,49) + 910c c = 2,665 Jadi Persamaan Kuadratiknya : Y‘=186,49+38,71X+2,665X²
(b) Trend Eksponensial Persamaan trend ekponensial adalah sebagai berikut: Y1 = a . bx Atau : Log Yt = Log a + X . Log b Dimana : Log adalah logaritma bilangan alam atau elog. Untuk mencari a dan b digunakan rumus :
UJI CHI KUADRAT (χ²) Analisa uji chi kuadrat atau analisa tabel r x k : dimana r menunjukkan banyaknya baris suatu tabel dan k menunjukkan banyknya kolom dalam tabel Distribusi χ² dalam pengujian hipotesis biasanya digunakan untuk mengetahui perbedaan antara frekuensi pengamatan dan frekuensi yang diharapkan Tahap-tahap penyelesaian analisa uji kuadrat : Merumuskan hipotesis Ho : P₁₁ = P₁₂ = P₁₃ = P₁₄ P₂₁ = P₂₂ = P₂₃ = P₂₄ P₃₁ = P₃₂ = P₃₃ = P₃₄ P₄₁ = P₄₂ = P₄₃ = P₄₄ (semua proporsi sama) Ha : Tidak semua proporsi sama
Menentukan Level of Signifikan (α) = 0,05 atau 0,01 χ² tabel = (α ; (r-1)(k-1)) Kriteria pengujian Ho diterima jika χ² hitung < χ² tabel Ho ditolak jika χ² hitung > χ² tabel 4. Menghitung χ² hitung dengan tahap-tahap Menghitung proporsi baris Menghitung expected frequency (eij) Rumus Menghitung nilai χ² hitung dengan rumus :
Membandingkan χ² hitung dan χ² tabel Kesimpulan
Contoh : Pemilik perusahaan PT Maju berpendapat bahwa sikap para karyawan mengenai kondisi kerja yang diperolehnya di berbagai divisi adalah sama. Berikut data para karyawan di berbagi divisi mengenai kondisi kerja. Pertanyaan : Ujilah pendapat tersebut dengan taraf nyata 1% DIV. A DIV. B DIV. C DIV. D JUMLAH Baik Cukup Buruk 76 25 12 85 32 15 91 40 10 75 28 11 327 125 48 113 132 141 114 500
Jawaban : Formulasi hipotesis Ho : P₁₁ = P₁₂ = P₁₃ = P₁₄ P₂₁ = P₂₂ = P₂₃ = P₂₄ P₃₁ = P₃₂ = P₃₃ = P₃₄ Ha : Tidak semua proporsi sama Menentukan LOS dan χ² tabel α = 0,01 dengan db = (3-1)(4-1)=6 χ² tabel = 16,812 Menentukan kriteria pengujian Ho diterima jika χ² hitung < χ² tabel Ho ditolak jika χ² hitung > χ² tabel
Menghitung nilai χ² hitung : Menghitung expected frequency n₁ = 327 n₂ = 125 n₃ = 48 n = 500 n₋₁ = 113 n₋₂ = 132 n₋₃ = 141 n₋₄ = 114 i = 1,2,3 j = 1,2,3,4
χ² Hitung = 2,6257
Kesimpulan Karena χ² hitung = 2,6257 < χ² tabel = 16,812, maka H0 diterima. Jadi pendapat pemilik perusahaan bahwa proporsi sikap para karyawan mengenai kondisi kerja yang diperolehnya di berbagai divisi sama adalah benar
REGRESI LINEAR SEDERHANA Persoalan pokoknya adalah mencari suatu persamaan garis dengan bentuk persamaan Y = a + b X dimana Y adalah variabel dependen, X adalah variabel independen, sedangkan “a” dan “b” adalah koefisien regresi yang harus dihitung nilainya. Persamaan ini digunakan untuk peramalan.
Formulasi rumus untuk mencari “a” dan “b” adalah sebagai berikut : Dimana :
PENGUJIAN HIPOTESIS Pengujian hipotesis dilakukan terhadap β, dimana dalam perhitungan garis regresi β ditaksir dengan b. Dalam hal ini digunakan uji “t” yang tujuannya untuk mengetahui ada tidaknya hubungan yang cukup berarti antara variabel X terhadap variabel Y Tahap-tahap pengujian hipotesis adalah sebagai berikut : Merumuskan Hipotesis H₀ : β = 0 (X tidak mempengaruhi Y) Ha : β ≠ 0 (X mempengaruhi Y)
Menentukan Level Of Signifikant (LOS) atau α LOS biasanya sebesar 1% dan 5% sedangkan nilai t tabel ditentukan seperti berikut : t (α/2 ; n-2 ) Menentukan kriteria pengujian H0 diterima jika –t α/2 ≤ th ≤ t α/2 H0 ditolak jika th > t α/2 atau th < -t α/2 4. Menghitung nilai t hitung dengan rumus :
Dimana : Sb = standar error dari koefisien regresi SY.X = standar error of estimate Membandingkan t tabel dan t hitung Kesimpulan
KORELASI Koefisien korelasi (r) mengukur keeratan hubungan antara dua variabel yang diteliti. Rumus untuk menghitung Koefisien korelasi adalah sebagai berikut : I
Berikut contoh data biaya produksi (dalam ribuan Rp)dan luas areal tanah (ha) dari 10 orang petani : Pertanyaan : Hitung nilai a dan b serta tentukan persamaan regresinya! Ujilah hipotesisnya dengan α = 0,05 Hitunglah koefisien korelasinya!
Jawaban : Dari data di atas diketahui : n = 10 ; ∑Y = 554 ; ∑Y₂ = 52322, 86 ; ∑X = 8,1 ; ∑X² = 11,51 ; ∑XY = 765,64
t tabel = (α/2 ; n-2) = (0,05/2 ; 10-2) = 2,306 Jadi nilai a dan b adalah sebagai berikut : a = 55,4 – (64,03)0,81 = 3,536 persamaan regresinya adalah Ý = 3,536 + 64,03X 1. Ho : β = 0 tidak ada hub yang cukup berarti Ha : β ≠ 0 ada hub yang cukub berarti 2. Menentukan LOS = 5% t tabel = (α/2 ; n-2) = (0,05/2 ; 10-2) = 2,306 3. Menghitung nilai t hitung :
4. Membandingkan t hitung dan t tabel t hitung = 11,04 dan t tabel = 2,306 sehingga t hitung > t tabel maka hipotesis ditolak 5. Kesimpulan Hasil ini menunjukkan adanya hubungan yang cukup berarti antara luas tanah dengan biaya produksi
Menghitung nilai koefisien korelasi : artinya : Terdapat korelasi positif antara luas tanah dengan biaya produksi. Koefisen korelasi = 0,97 menunjukkan bahwa hubungan antara variabel sangat erat karena mendekati r =1, atau dengan kata lain hubungan yang sempurna antara dua variabel
REGRESI LINEAR BERGANDA Model regresi digunakan jika variabel independen mempunyai hubungan terkait dengan variabel dependent. Hubungan kausal antara variabel independent terhadap variabel dependent sering dikenal dengan hubungan fungsional yang dapat diformulasikan dalam persamaan fungsi seperti berikut : Y = f (X1, X2, ...., Xn) dimana : Y = variabel dependen X1, X2, ...., Xn = variabel independen
Bentuk Persamaanya adalah sebagai berikut : Secara konsep untuk mengetahui besarnya pengaruh variabel bebas terhadap variabel terikat dengan menggunakan nilai koefisien regresi secara partial misalnya nilai b1 dan b2 serta b. nilai tersebut dapat diperoleh dari rumus seperti berikut :
KOEFISIEN DETERMINASI Selanjutnta untuk mengetahui variansi pengaruh yang dijelaskan oleh variabel independent terhadap dependen dapat dilihat dari nilai koefisien diterminasi ( r square) yang dirumuskan seperti berikut KOEFISIEN KORELASI Untuk mengetahui keeratan hubungan antara variabel independent terhadap variabel dependent dapat dilihat dari nilai koefisien korelasi ( r) yang dikemukakan sebagai berikut :
Pengujian statistik dalam model regresi berganda Untuk membuktikan adanya pengaruh secara simultan antara variabel independent terhadap dependent variabel dapat dilakukan pendekatan Statistik uji F dengan menggunakan Rumus seperti berikut : (Supranto, 2001:258) Di mana: R2 = Koefisien determinasi berganda di mana R dinamakan koefisien berganda. k = Jumlah variabel independen n = Banyaknya sampel
Sedangkan untuk menguji secara individual atau parsial dengan pendekatan statistik uji t dengan tahapan sebagai berikut : Merumuskan Hipotesis H₀ : β₁ = 0 ; Ha ≠ 0 H₀ : β₂ = 0 ; Ha ≠ 0 Menetukan LOS dan t tabel t tabel = (α/2 ; (n-k)) Menghitung nilai t hitung
Dimana : n = banyaknya data k = banyaknya variabel
Contoh : Seorang petani mempunyai catatan mengenai kegiatan usahanya sebagai berikut : Y : 2 5 7 8 5 X₁ : 8 8 6 5 3 X₂ : 0 1 1 3 4 Dimana : Y = hasil per Ha (ton) X₁ = jumlah pupuk yang dipakai (10 kg) X₂ = curah hujan (cm/ thn) Ditanya : Susunlah persamaan regresi berganda Hitung koefisien korelasinya Ujilah keberartian hubungan tersebut dengan uji t dan uji F dengan α = 0,05