MODUL STATISTIKA BISNIS DAN INDUSTRI ANALISIS REGRESI LINIER ANALISIS REGRESI LINIER SEDERHANA ANALISIS REGRESI LINIER BERGANDA Haryono PROGRAM MAGISTER MANAJEMEN TEKNOLOGI PROGRAM PASCA SARJANA ITS
ANALISIS REGRESI LINIER SEDERHANA TUJUAN Membuat model peramalan Mengetahui faktor (variabel) yang berpengaruh
Contoh 1 : Data berikut menunjukkan besar iklan dan penjualan untuk suatu perusahaan yang dicatat selama 10 bulan (dalam satuan Rp. 10 juta). Bulan Ke- Besar Iklan Besar Penjualan 1 2 3 4 5 6 7 8 9 10 1,2 0,8 1,0 1,3 0,7 0,9 0,6 1,1 101 92 110 120 90 82 93 91 75 105
Plot Antara Volumen Penjualan dengan Pengeluaran
Model regresi linier sederhana : Yi = 0 + 1Xi + I Dimana : 0 dan 1 adalah parameter-parameter model Ei adalah residual yang memenuhi asumsi-asumsi : Rata-rata Ei = 0 Ei saling independen Ei mempunyai ragam konstan Ei berdistribusi normal
Berikut ini output komputer data penjualan : Hasil Regresi Volume Penjualan terhadap Pengeluran The regression equation is Penj. = 46.5 + 52.6 Peng. Predictor Coef SE Coef T P Constant 46.486 9.885 4.70 0.002 Peng. 52.57 10.26 5.12 0.001 S = 6.837 R-Sq = 76.6% R-Sq(adj) = 73.7% Analysis of Variance Source DF SS MS F P Regression 1 1226.9 1226.9 26.25 0.001 Residual Error 8 374.0 46.7 Total 9 1600.9
Berdasarkan output komputer diperoleh : a). Model Regresi : = 46,5 + 52,6 % b). Koefisien Determinasi : R2 = 76,6 % c). Uji Hipotesis : Perumusan H0 : 1 = 0 versus H1 = 1 > 0 Statistiknya : T = 5,12 Daerah Penolakan : Nilai tabel t8; 0,05 = 1,860 Jadi H0 ditolak, yang berarti bahwa iklan mempunyai kontribusi penting terhadap penjualan. d). Analisis Varians : Perumusan hipotesis : H0 : Model regresi linier sederhana tidak sesuai H1 : Model regresi linier sederhana sesuai Nilai p_value = 0,000 < = 5 % maka H0 ditolak
e). Meramalkan Nilai Rata-Rata Y : Dapatkan taksiran interval keyakinan 95 % untuk nilai rata- rata penjualan bila dianggarkan iklan Rp. 10 juta. Diperoleh antara Rp. 938.700.000,00 sampai dengan Rp. 1.042.400,00. f). Meramalkan Nilai Y untuk Nilai X Tertentu : Dapatkan interval keyakinan 95 % untuk penjualan perusahaan mendatang bila dianggarkan iklan Rp. 10 juta. Diperoleh antara Rp. 824.600.000,- sampai dengan Rp. 1.156.000.000,-.
Contoh 2 : Anggaran adalah ekspresi harapan manajemen dan target mengenai keuntungan dan biaya. Untuk meningkatkan keefektifan banyak anggaran dibuat fleksibel, termasuk pengeluaran-pengeluaran karena adanya pengaruh dari variasi variabel-variabel yang terkendali. Misal, biaya dan keuntungan dari produksi sangat dipengaruhi oleh banyak unit yang diproduksi selama periode anggaran belanja, dan hal ini di luar batas pengendalian manajemen. Prosedur standar akuntansi biaya dapat digunakan untuk melakukan penyesuaian biaya langsung sebagai bagian dari anggaran pada tingkat produksi, tetapi pada umunya sering sulit dikendalikan. Dalam banyak hal, metode statistik sering digunakan untuk menaksir hubungan antara biaya overhead (Y) dan banyak unit yang diproduksi (X) berdasarkan data historis. Data berikut adalah merupakan data historis dari perusahaan Galaxy yang memproduksi komponen elektronika tertentu, yang dicatat selama 7 bulan tertentu.
Data sebagai berikut : Banyak Produksi (10.000 unit) 5 6 7 8 9 10 11 Biaya Overhead (dalam $ 1000) 12 11,5 14 15 15,4 15,3 17,5 Plot Antara Produksi dengan Overhead
Output Komputer Contoh 2 Regression Analysis: Y versus X The regression equation is Y = 7.10 + 0.911 X Predictor Coef SE Coef T P Constant 7.100 1.184 6.00 0.002 X 0.9107 0.1436 6.34 0.001 S = 0.7597 R-Sq = 88.9% R-Sq(adj) = 86.7% Analysis of Variance Source DF SS MS F P Regression 1 23.223 23.223 40.24 0.001 Residual Error 5 2.885 0.577 Total 6 26.109
c). Simpulkan apakah ada bukti kuat banayk unit yang Berdasarkan ouptu komputer jawablah pertamyaan- pertanyaan berikut : a). Tulis persamaan regresinya dan interpretasikan b). Tulis besar koefisien determinasi dan interpretasikan c). Simpulkan apakah ada bukti kuat banayk unit yang diproduksi mempengaruhi biaya Overhead. Rumuskan hipotesis yang sesuai dan simpulkan hasilnya dengan = 5 %. d). Simpulkan apakah ada bukti yang kuat biaya produksi mempunyai hubungan linier dengan biaya overhead e). Dapatkan nilai taksiran biaya overhead bila produksi sebanyak 80.000 unit
f). Dapatkan nilai taksiran interval keyakinan 95 % untuk rata- rata biaya overhead bila produksi sebanyak 80.000 unit. g). Dapatkan nilai interval ramalan 95 % untuk rata-rata biaya overhead bila produksi sebanyak 80.000 unit. h). Jelaskan mengapa interval peramalan lebih lebar dari interval keyakinan.
Contoh 3 : Dalam analisis sistem transportasi adalah penting untuk menaksir ekspektasi waktu perjalanan antar lokasi, Cook dan Russel (Transportation Research, Juni 1990) mengumpulkan data di kota Tulsa mengenai waktu perjalanan dan jarak antara lokasi untuk 2 jenis kendaraan, yaitu mobil penumpang dan truk. Digunakan model regresi linier sederhana untuk kedua jenis kendaraan tersebut (Y = waktu perjalanan dalam menit, X = jarak antara lokasi dalam mil). Hasilnya diberikan sebagai berikut : Tabel 3 Mobil Penumpang Truk = 2,50 + 1,93 X R2 = 0,676 ; p_value < 0,05 = 1,85 + 3,86 X R2 = 0,758 ; p_value < 0,01
Pertanyaan : Simpulkan apakah ada bukti kuat yang menujukkan bahwa jarak antara lokasi mempunyai hubungan linier dengan waktu perjalanan untuk mobil penumpang. Gunakan = 5 %. Rumuskan hipotesis yang sesuai. Simpulkan apakah ada bukti yang kuat yang menunjukkan bahwa jarak antara lokasi mempunyai hubungan linier dengan waktu perjalanan truk. Gunakan = 5 %. Rumuskan hipotesis yang sesuai. Interpretasikan R2 untuk kedua jenis kendaraan tersebut. Taksir rata-rata waktu perjalanan mobil penumpang bila menempuh jarak 3 mil. Taksir rata-rata waktu perjalanan truk bila menempuh jarak 3 mil. Jelaskan informasi apa yang dapat diperoleh dari kedua p_value di atas.
ANALIIS REGRESI LINIER BERGANDA Dalam model regresi ganda, variabel bebas atau eksplanatori terdiri atas 2 variabel atau lebih. Model Regresi Linier Berganda : Yi = 0 + 1X1i + 2X2i + … + kXki + Ei Ei adalah sesatan/residual/galat Asumsi-asumsi mengenai Ei : Ei berdistribusi normal Nilai ekspektasi Ei adalah nol Variansi masing-masing Ei adalah konstan Ei adalah saling independen Tidak ada multikolinieritas antara variabel-variabel bebas Tidak ada outlier
Contoh 4 : Ms. Karen Ainsworth adalah karyawan konsultan manajemen yang terkenal. Dia ditugaskan ke Apex Corporation, suatu perusahaan yang memproduksi corrugated papar yang digunakan untuk membuat karton box dan material pengemasan yang lain. Apex berniat untuk mengembangkan dan memperbaiki program pengendalian biaya produksinya. Untuk itu Karen melakukan analisis terhadap biaya produksi agar ia dapat mengetahui faktor-faktor yang mempengaruhinya, digunakan analisis regresi untuk membantunya mengetahui bagaimana variabel-varibel tersebut berhubungan dengan biaya produksi. Variabel-variabel yang dipilih dalam penelitian ini adalah :
Y : Total biaya produksi tiap bulan (ribuan dollar) COST X1 : Produksi kertas karton total tiap bulan (ton) PAPER X2 : Jam total mesin yang digunakan tiap bulan MACHINE X3 : Total biaya overhead tiap bulan (ribuan dollar) OVERHEAD X4 : Total jam kerja karyawan langsung yang digunakan tiap bulan LABOR
COST PAPER MACHINE OVERHEAD LABOR 1102 1008 1227 1395 1710 1881 1924 1246 1255 1314 1557 1887 1204 1211 550 502 616 701 838 919 939 622 626 659 740 901 610 598 218 199 249 277 363 399 411 248 259 266 334 401 238 246 112 99 126 143 191 210 216 124 127 135 181 117 325 301 376 419 682 751 813 371 383 402 546 655 351 370
Lanjutan Data Contoh 4 COST PAPER MACHINE OVERHEAD LABOR 1287 1451 1828 1903 1997 1363 1421 1543 1774 1929 1317 1302 1388 646 732 891 932 964 680 723 784 841 922 647 656 704 259 286 389 404 430 271 317 376 415 260 255 281 127 155 208 216 233 129 146 158 199 228 126 117 142 387 433 878 660 694 405 426 478 601 679 378 380 429
Data dikumpulkan bulan Januari 2002 sampai 2004. Berdasarkan output komputer berikut jawab pertanyaan- pertanyaan berikut : Jika Karen ingin menggunakan fungsi biaya yang dibuat dengan analisis regresi ganda, maka pertanyaan apa yang dapat dijawab oleh model regresi tersebut. Tentukan Uji – F untuk menyelidiki kesesuaian model regresi. Nyatakan hipotesis yang akan diuji, kriteria keputusannya, statistik uji dan tarik kesimpulan. Jelaskan arti R2 yang diperoleh di atas.
Dalam literatur akuntansi biaya, koefisien model regresi untuk variabel Xk merupakan taksiran marginal cost yang sebenarnya dari output yang sesuai dengan variabel Xk. Dapatkan taksiran titik dari marginal cost yang sebenarnya untuk total jam kerja mesin tiap bulan. Juga dapatkan taksiran interval keyakinan 95 % untuk marginal cost tersebut. Interpretasikan hasilnya. Uji hipotesis bahwa marginal cost yang sebenarnya dari output dengan produksi total kertas adalah 1,0. Gunakan prosedur uji dua sisi. Tulis hipotesisnya, kriteria keputusannya, statistik uji dan tarik kesimpulannya. Tinjau model reduksi : Yi = 0 + 1X1i + 2X2i + Ei Lakukan uji untuk membandingkan antara model lengkap dan model reduksi (output komputer, Lampiran III). Nyatakan hipotesis yang akan diuji, kriteria keputusannya, statistik uji dan tarik kesimpulannya
Output Komputer Contoh 4 (Model Lengkap) The regression equation is Cost = 51.7 + 0.948 Paper + 2.47 Machine + 0.048 Overhead - 0.0506 Labour Predictor Coef SE Coef T P Constant 1.72 21.70 2.38 0.026 Paper 0.9479 0.1200 7.90 0.000 Machine 2.4710 0.4656 5.31 0.000 Overhead 0.0483 0.5250 0.09 0.927 Labour -0.05058 0.04030 -1.26 0.223 S = 11.08 R-Sq = 99.9% R-Sq(adj) = 99.9% Analysis of Variance Source DF SS MS F P Regression 4 2271423 567856 4629.17 .000 Residual Error 22 2699 123 Total 26 2274122
Output Komputer Contoh 4 (Model Tereduksi) The regression equation is Cost = 59.4 + 0.949 Paper + 2.39 Machine Predictor Coef SE Coef T P Constant 59.43 19.64 3.03 0.006 Paper 0.9489 0.1101 8.62 0.000 Machine 2.3864 0.2101 11.36 0.000 S = 10.98 R-Sq = 99.9% R-Sq(adj) = 99.9% Analysis of Variance Source DF SS MS F P Regression 2 2271227 1135613 9413.48 .000 Residual Error 24 2895 121 Total 26 2274122
Contoh 5 : Dalam fasilitas industri, penaksiran yang tepat mengenai banyak jam kerja yang diperlukan untuk menyelesaikan suatu tugas adalah penting bagi manajemen untuk menentukan banyak tenaga kerja yang diperlukan, waktu penyelesaian pekerjaan atau penentuan biaya produksi. Suatu perusahaan pembuat boiler drum ingin menggunakan regresi untuk menaksir banyak jam kerja yang diperlukan untuk membuat drum proyek mendatang. Untuk mencapai ini, dikumpulkan data 35 boiler (X1 lb/hr), boiler design preasure (X2 = pound per square inch or pasi), boiler type (X3 = 1 untuk industri dan X3 = 0 untuk utilitas), jenis drum (X4 = 1 untuk steam dan X4 = 0 untuk mud
MAN HOURS (Y) BOILER CAPACITY (X1) DESIGN PRESSURE (X2) TYPE (X3) DRUM 3.137 3.590 4.526 10.825 4.023 7.606 3.748 2.972 3.163 4.065 2.048 6.50 120000 65000 150000 1073877 610000 88200 90000 30000 441000 375 75 500 2170 325 1500 399 1140 410 Industrial Utility Steam
Lanjutan Data Contoh 5 MAN HOURS (Y) BOILER CAPACITY (X1) DESIGN PRESSURE (X2) TYPE (X3) DRUM 6.50 5.651 6.565 6.387 6.454 6.928 4.268 14.791 2.680 2.974 1.965 2.566 441000 627000 610000 150000 1089490 125000 120000 65000 410 1525 1500 500 2170 750 375 Industrial Utility Steam Mud
Lanjutan Data Contoh 5 MAN HOURS (Y) BOILER CAPACITY (X1) DESIGN PRESSURE (X2) TYPE (X3) DRUM 1.515 2.000 2.735 3.698 2.835 1.206 3.775 3.120 4.206 4.006 3.728 3.211 1.200 150000 610000 90000 30000 441000 627000 300000 250 500 325 1500 1140 410 1525 Industrial Utility Mud
Output komputer sebagai berikut : The regression equation is Y = - 3783 +0.00875 X1 + 1.93 X2 + 3444 X3 + 2093 X4 Predictor Coef SE Coef T P Constant -3783 1205 -3.14 0.000 X1 0.0087490 0.0009035 9.68 0.000 X2 1.9265 0.6489 2.97 0.006 X3 3444.3 911.7 3.78 0.001 X4 2093 305.6 8.85 0.000 S = 894.4 R-Sq = 90.3% R-Sq(adj) = 89% Analysis of Variance Source DF SS MS F P Regression 4 230854848 57713712 72.11 0.000 Residual Error 31 24809760 800315 Total 35 255664608
Pertanyaan : Interpretasikan model regresi. Interpretasikan R2. Uji hipotesis bahwa kapasitas boiler (X1) mempunyai pengaruh positif terhadap banyak jam kerja (Y) : Demikian juga untuk pressure (X2). Interpretasikan pengertian koefisien 3 dan dapatkan interval koefisien 95 % untuk koefisien tersebut. Demikian juga untuk koefisien 4.