Sifat-Sifat Penaksir Kuadrat Terkecil : Teorema Gauss Markov

Slides:



Advertisements
Presentasi serupa
ANALISIS DATA Dr. Adi Setiawan.
Advertisements

ANALISIS REGRESI DAN KORELASI
REGRESI LINIER SEDERHANA
Analisis Data: Memeriksa Perbedaan
UJI ASUMSI KLASIK.
Statistika Inferensi : Estimasi Titik & Estimasi Interval
ESTIMASI.
KORELASI DAN REGRESI LINEAR SEDERHANA
Diunduh dari: SMNO FPUB….. 19/10/2012
Analisis Data dengan SPSS
Metode Statistika Pertemuan XIV
BAB 15 ANALISIS REGRESI DAN KORELASI LINIER
ANALISIS REGRESI SEDERHANA
PERTEMUAN 6 Teknik Analisis dan Penyajian Data
ANALISIS REGRESI DAN KORELASI
K O N S E P D A S A R A N A L I S I S R E G R E S I
Regresi Linear Dua Variabel
Contoh Perhitungan Regresi Oleh Jonathan Sarwono.
BAB 15 ANALISIS REGRESI DAN KORELASI LINIER
Uji Hipotesis.
Statistika Inferensi : Estimasi Titik & Estimasi Interval
STATISTIK INFERENSIAL
REGRESI LINIER BERGANDA (MULTIPLE LINEAR REGRESSION)
REGRESI LINIER SEDERHANA
Metode Statistika Pertemuan XII
Metode Statistika Pertemuan XIV
Regresi Berganda Statistika Ekonomi II Pertemuan Ke 10
ANALISIS REGRESI DAN KORELASI LINIER
UJI ASUMSI KLASIK & GOODNESS OF FIT MODEL REGRESI LINEAR
STATISTIKA INFERENSI : UJI HIPOTESIS (SAMPEL TUNGGAL)
Regresi Linier Berganda
Analisis Korelasi dan Regresi
Program Studi Statistika Semester Ganjil 2012
EKONOMETRIKA Pertemuan 4,5 Estimasi Parameter Model Regresi
STATISTIKA INDUSTRI I ANALISIS REGRESI DAN KORELASI LINIER (1)
Program Studi Statistika, semester Ganjil 2012/2013
STATISTIKA INFERENSI : UJI HIPOTESIS (SAMPEL TUNGGAL)
Analisis Regresi (Sesi 11)
Regresi Linier Berganda
Program Studi Statistika, semester Ganjil 2012/2013
EKONOMETRIKA Pertemuan 10: Pengujian Asumsi-asumsi Klasik (Bagian 1)
Analisis REGRESI.
Program Studi Statistika Semester Ganjil 2012
Metode Statistika Pertemuan XII
Operations Management
TEORI PENDUGAAN STATISTIK
EKONOMETRIKA Pertemuan 9: Pengujian Asumsi-asumsi Klasik (Bagian 1)
EKONOMETRIKA Pertemuan 9: Pengujian Asumsi-asumsi Klasik (Bagian 1)
STATISTIKA INDUSTRI I ANALISIS REGRESI DAN KORELASI LINIER (1)
Analisis Regresi Pengujian Asumsi Residual
BAB 14 PENGUJIAN HIPOTESIS SAMPEL KECIL
REGRESI LINIER BERGANDA (MULTIPLE LINEAR REGRESSION)
Disampaikan Pada Kuliah : Ekonometrika Terapan Jurusan Ekonomi Syariah
Agribusiness Study of Programme Wiraraja University
BAB 7 persamaan regresi dan koefisien korelasi
Regresi Linier Berganda
Metode Statistika Pertemuan XII
Pokok Bahasan : Review Regresi Linier Sederhana dan Berganda
HYPOTHESIS TESTING Beberapa Pengertian Dasar : Hipotesis Statistik
ANALISIS REGRESI & KORELASI
S1 STATISTIKA UNPAD I GEDE NYOMAN MINDRA JAYA
Pasca Sarjana Unikom Model Regresi Pasca Sarjana Unikom
UJI ASUMSI KLASIK.
Metode Statistika Pertemuan XII
Pasca Sarjana Unikom Model Regresi Pasca Sarjana Unikom
ANALISIS REGRESI LINIER
Metode Statistika Pertemuan XII
ANALISIS REGRESI DAN KORELASI
Analisis Regresi Regresi Linear Sederhana
Metode Statistika Pertemuan XII
Transcript presentasi:

Sifat-Sifat Penaksir Kuadrat Terkecil : Teorema Gauss Markov BLUE : Best Linear Unbiased Estimation Suatu penaksir ^ tak bias linear terbaik dari  kalau  tadi linear, tak bias, dan mempunyai varians minimum dalam kelas semua panaksir linear tak bias dari .

Koefisien Determinasi r2 Koefisien determinasi merupakan suatu ukuran kebaikan “Goodness of Fit “ model regresi. Koefisien determinasi bukan “Besar Pengaruh” Untuk menghitung r2 didasarkan pada konsep berikut : Yi=Y^i+ei Atau dalam bentuk simpangan : yi=y^i+ei (3.3.1)

Perincian Variasi Y ke Dalam Dua Bagian

Koefisien Determinasi Perhatikan : JKT=JKReg + JKRes R2 mengukur proporsi (bagian) atau prosentase total variansi dalam Y yang dijelaskan oleh model regresi.

Dua Sifat Dasar Koefisien Determinasi (r2) r2 merupakan besaran non negatif. Batasnya adalah 0r2 1. r2 juga dapat dihitung dengan rumus sebagai berikut : Untuk regresi linier sederhanda akar kuadrat dari Koefisein determinasi merupakan koefisien korelasi.

Sifat Koefisien Korelasi r dapat bernilai positif atau negatif, tandanya tergantung pada tanda faktor pembilang yang mengukur kovariansi sampel kedua variabel Terletak antara -1 dan +1 yaitu -1r2 1. Sifat dasarnya simetris yaitu koefisen korelasi antara X dengan Y sama dengan koefisien korelasi antara Y dengan X Tidak tergantung pada titik asal (origin) dan skala; yaitu kalo kita definisikan X*i =aXi+c dan Y*i =bYi +d, dimana a>0, b>0, dan c dan d konstan, maka r antara X* dan Y* sama dengan X dan Y. Kalo X dan Y bebas secara statistik, koefisien korelasi antara keduanya adalah nol. Tetapi kalo r=0 ini tidak bearti bawha kedua variabel adalah bebas. Dengan kata lain korelasi nol tidak perlu berarti kebebas, r hanyalah suatu ukuran hubungan linear atau ketergantungan linier saja. R tidak mempunyai arti untuk menggambarkan hubungan nonlinear. r adalah ukuran hubungan linear antara dua vairabel, tidak perlu berarti hubungan sebab akibat.

LINEARISASI DALAM REGRESI Model Log-Linear Model di atas dapat dilinearisasi dengan melakukan transformasi logaritma natural. Model di atas dapat dituliskan kedalam model linier dalam parameter : Model ini dikenal dengan model Log Linier, atau log-ganda atau elastisitas. Model di atas dapat ditaksir dengan metode OLS dengan memisalkan :

LINEARISASI DALAM REGRESI Model Semilog

ASUMSI KENORMALAN

Look at Normal Distributions A normal distribution symmetrical, bell-shaped (so they say)

What can go wrong? Skew Kurtosis Outliers non-symmetricality one tail longer than the other Kurtosis too flat or too peaked kurtosed Outliers Individual cases which are far from the distribution

Effects on the Mean Skew Kurtosis biases the mean, in direction of skew Kurtosis mean not biased standard deviation is and hence standard errors, and significance tests

Examining Univariate Distributions Histograms Boxplots P-P Plots

Histograms A and B

C and D

E & F

Histograms can be tricky ….

Boxplots

P-P Plots A & B

C & D

E & F

Bivariate Normality We didn’t just say “residuals normally distributed” We said “at every value of the dependent variables” Two variables can be normally distributed – univariate, but not bivariate

Couple’s IQs male and female Seem reasonably normal

But wait!!

When we look at bivariate normality So plot X against Y not normal – there is an outlier So plot X against Y OK for bivariate but – may be a multivariate outlier Need to draw graph in 3+ dimensions can’t draw a graph in 3 dimensions But we can look at the residuals instead …

IQ histogram of residuals

What to do about Non-Normality Skew and Kurtosis Skew – much easier to deal with Kurtosis – less serious anyway Transform data removes skew positive skew – log transform negative skew - square

DISTRIBUSI PROBABILITAS GANGGUAN (i) Kita perlu menetapkan spesifikasi distribusi probabilitas dari i (Mengapa ?) Distribusi sampling dari penaksir OLS akan tergantung pada asumsi mengenai distribusi probabilitas i terkait dengan pengujian hipotesis.

ASUMSI KENORMALAN Regresi Linier Klasik mengasumsikan bahwa i berdistribusi normal dengan : Rata-rata : E(i)=0 Varians : V(i)=2 Cov(i ,j) : E(i j)=0 untuk i≠j Atau secara singkat biasanya dituliskan iiidN(0,2)

Kanapa Normal?  menyatakan efek gabungan dari variabel bebas terhadap variabel takbebas. Jika variabel –variabel ini didistribusikan secara independen dan identik, maka jika variabel ini sangat besar, dengan menggunakan teorema limit pusat maka jumlahnya didistribusikan secara normal. Kalaupun banyak variabel tidak sangat besar, dan tidak benar-benar independen, jumlahnya masih bisa didistribusikan secara normal. Dengan distribusi normal, distribusi sampling dari penaksir OLS mudah diperoleh, karena merupakan sifat distribusi normal bahwa setiap fungsi linier dari vairabel-variabel yang didistribusikan secara normal dengan sendirinya didistribusikan secara normal. Distribusi normal, distribusi yang relatif sederhana yang hanya melibatkan dua parameter.

Sifat-Sifat Penaksir OLS Takbias Varians Minimum, Efisien Konsisten (N-2)^2/ 2 didistribusikan secara chi-kuadrat (^0, dan ^1 ) didistribusikan secara independen dari ^2 ^0, dan  ^1 mempunyai varians minimum dalam seluruh kelas penaksir tak bias baik linier maupun bukan

Distribusi Dari Y Rata-Rata : E(Yi) = 0+1Xi Varians : Var(Y)=2 Yi ~ N(0+1Xi ,2)

METODE KEMUNGKINAN TERBESAR (Maximum Likelihood=ML) Asumsikan dalam model regresi dua variabel Yi=0+1Xi+i Yi didistribusikan secara normal dan independen dengan rata-rata 0+1Xi dan varians 2 sebagai hasilnya fungsi densitas gabungan (joint probability function) dari Y1, Y2,..,Yn dengan syarat rata-rata dan varians di atas dapat dituliskan sebagai berikut :

Maximum Likelihood

IDENTIFIKASI KENORMALAN DATA Untuk identifikasi kenormalan, cara paling umum yang digunakan adalah melalui metode grafik yaitu grafik Q-Q plot. Langkah-langkah pembuatan grafik tersebut adalah sebagai berikut : Urutkan nilai ei dari kecil ke besar Hitung nilai proporsi pi=(i-0.5)/n Cari angka baku dari pi ( ) Plotkan hasil pada no.3 sebagai sumbu datar dengan no.1 sebagai sumbu tegak. Jika pola mengikuti garis lurus maka dapat diidentifikasi data mengikuti sebaran normal.

UJI KENORMALAN Selain melalui metode Grafik, juga dapat dilakukan pengujian kenormalan data dengan statistik uji Kolmogorov-Smirnov, Lilifors, Anderson-Darling, Shapiro-Wilks dll.

PENAKSIRAN SELANG DAN PENGUJIAN HIPOTESIS

PENAKSIRAN SELANG : BEBERAPA IDE DASAR Seberapa jauh taksiran titik dapat dipercaya ? Pada penaksiran titik, ketepatan taksiran diukur oleh standar error atau varians dari penaksir. Ketepatan dari penaksir dapat pula dinyatakan bahwa penaksir titik terletak dalam selang tertentu di sekitar parameter sebenarnya.

Seberapa dekat nilai ^1 dengan 1 Kita berusaha untuk menemukan dua angka positif  dan  dengan  terletak antara 0 dan 1 sedemikian sehingga : Membaca Selang Kepercayaan : Probabilitas bahwa selang acak yang ditunjukkan berisi nilai 1 adalah sebesar 1-. BUKAN Probabilitas bahwa 1 akan berada pada selang dengan batas atas ^1+ dan batas atas ^1- adalah 1-

PENTING Selang kepercayaan di atas tidak mengatakan bahwa probabilitas 1 terletak antara batas tertentu adalah 1-. Selang bersifat random, yaitu selang kepercayaan berbeda untuk satu sampel ke sampel yang lain. Bagaiamana Selang Kepercayaan Dibuat ?? Harus mengetahui distribusi sampling dari i

DISTRIBUSI PROBABILITAS Teorema 1. Kalau Z1, Z2,…,Zn variabel acak yang didistribusikan secara bebas dan normal sedemikian sehingga Zi~N(i,2i) maka jumlah Z=kiZi dimana ki konstan tidak semua nol, juga didistribusikan secara normal dengan rata-rata kii dan varians k2i 2i Teorema 2. Kalau Z1, Z2,…,Zn variabel acak yang didistribusikan secara bebas dan normal sedemikian sehingga tiap Zi~N(0,1), yaitu variabel normal yang distandarkan, maka Z2i mengikuti distirbusi Kai-kuadrat (Chi-Square) dengan derajat kebebasn n. Teorema 3. Kalau Z1, Z2,…,Zn variabel acak yang didistribusikan secara bebas dan masing-masing mengikuti distribusi Kai-Kuadrat dengan derajat bebas ki , maka jumlah Zi juga mengikuti distribusi Kai-Kuadrat dengan derajat bebas k= ki

DISTRIBUSI PROBABILITAS Teorema 4. Kalau Z1 variabel normal yang distandarkan [Z1~N(0,1)] dan variabel Z2 mengikuti distribusi Kai-Kuadrat dengan derajat kebebasan k dan bebas terhadap Z1, variabel tadi didefinisikan sebagai : Mengikuti distribusi t-student dengan derajat kebebasan k Teorema 5. Kalau Z1 dan variabel Z2 yang didistribusikan secara bebas dengan derajat kebebasan k1 dan k2 berturut-turut maka : Mempunyai distribusi F dengan derajat bebas k1 dan k2

Selang Kepercayaan Untuk 0 dan 1 Telah diasumsikan bahwa i~N(0,2) maka 0 dan 1 didistribusikan secara normal. Misalkan : Kita dapat membuat pernyataan probabilistik tentang 1 jika 2 diketahui. Jika 2 diketahui maka sifat penting dari variabel yang didistribusikan normal dengan rata-rata i dan 2 adalah luas di bawah kurva normal

Distribusi t-student Tetapi 2 jarang diketahui dan dalam praktek digunakan penaksir tak bias ^2 sehingga : Dengan derajat bebas n-2 Selang kepercayaannya menjadi :

Selang Kepercayaan 0

Selang Kepercayaan Untuk 2 Diketahui bahwa : Sehingga selang kepercayaan untuk 2 adalah

Selang Keyakinan (1-) pada derajat bebas (n-2) f(2) 2) 2(1-/2) 2/2

PENGUJIAN HIPOTESIS Apakah suatu pengamatan atau penemuan cocok dengan suatu hipotesis yang telah dinyatakan atau tidak? Cocok :”Cukup dekat dengan nilai yang dihipotesiskan”

Arah Pengujian Dua Pihak : H0 : 1= *1 Vs H1 : 1 *1 Satu Pihak Kanan H0 : 1= *1 Vs H1 : 1> *1 Satu Pihak Kiri H0 : 1= *1 Vs H1 : 1< *1

Beberapa Istilah Suatu nilai uji statistik yang diperoleh dari pengamatan dikatakan berarti (significant) bila hipotesis nol (H0) ditolak pada taraf keberartian  yang ditentukan sebelumnya. Himpunan nilai yang membuat penolakan hipotesis nol disebut daerah kirits (penolakan). Nilai batas dari daerah kritis disebut nilai kirits (titik kritis) P-value nilai kiritis yang teramati dari data sampel atau nilai peluang mengamati suatu nilai terok sebesar (atau lebih besar dari) nilai yang sesungguhnya diamati bila H0 benar. Derajat bebas (db) : banyaknya informasi bebas yang diperlukan untuk penaksiran parameter. Dalam regresi banyaknya observasi dikurangi dengan banyak parameter yang ditaksir

PENDEKATAN SELANG KEPERCAYAAN Misalkan kita menghipotesiskan : H0 : 1=0.3 H1 : 10.3 Apakah ^1 yang diamati sesuai dengan H0? Misal dari hasil perhitungan diperoleh selang kepercayaan : Kesimpulan : H0 ditolak “Jika selang kepercayaan memuat nilai yang dihipotesiskan pada H0 maka hipotesis nol diterima dan jika tidak maka hipotesis nol ditolak. “

TEST OF SIGNIFICANCE Menerima atau menolak hipotesis nol atas dasar nilai statistik uji yang diperoleh. Statistik uji yang digunakan :

TEST OF SIGNIFICANCE Hipotesis 2 Pihak : Hipotesis Satu Pihak Kanan Kriteria Penerimaan & Penolakan H0 Hipotesis 2 Pihak : Tolak Hipotesis Nol jika : Nilai t hitung > t tabel (/2,n-2) atau -t hitung <- tabel (/2,n-2) Hipotesis Satu Pihak Kanan Nilai t hitung > t tabel (,n-2) Hipotesis Satu Pihak Kiri Nilai -t hitung <- t tabel (,n-2)

Perlu Diingat Dalam Selang Kepercayaan : “Kita mencoba menetapkan batas-batas di mana nilai  sebenarnya tetapi tidak diketahui letaknya” Dalam Penguijian Tingkat Signifikansi: “Kita menghipotesiskan berapa nilai untuk  dan mencoba untuk melihat apakah  yang dihitung terletak dalam batas keyakinan yang layak disekitar nilai yang dihipotesiskan”

ANALISIS REGRESI DAN VARIANS Pada pembahasan sebelumnya telah ditunjukkan bahwa : Dekomposisi JKT (Jumlah Kuadrat Total ) menjadi JKR dan JKRes adalah konsep dalam analisis varians. Tabel anova untuk regresi linier sederhana dapat diguliskan sebagai berikut : Sumber Variasi JK db RJK F Akibat Regresi  ^1x2i  1   ^1x2i RJKReg/RJKRes Akibat Residual  e2i  n-2  e2i/(n-2) Total  y2i  n-1  

Tugas 2 No. 1 Tunjukkan Bahwa :

PENERAPAN ANALISIS REGRESI DALAM PREDIKSI Salah satu tujuan analisis regresi adalah prediksi baik interpolasi maupun ekstrapolasi. Terdapat dua macam prediksi yang dapat dilakukan : peramalan nilai rata-rata bersayarat dari Y yang berhubungan dengan X yang dipilih misalkan X0. peramalan suatu nilai Y individual yang berhubungan dengan X0.

Peramalan Rata-rata E(Y0|X0) Nilai dugaan akan berbeda dengan nilai sebenarnya, perbedaan nilai ini memunculkan pemikiran adanya kesalahan peramalan. Untuk menaksir kesalahan ini, perlu diketahui distribusi sampling dari Y^0. Karena ei berdistribusi normal, maka dengan sifat distribusi normal bahwa setiap fungsi linier dari variabel- variabel yang didistribusikan secara normal dengan sendirinya didistribusikan secara normal. Sehingga Y^0 juga berdistribusi normal dengan rata-rata (0 + 1X0) dan variansnya diberikan oleh rumus berikut :

dan karena 2 ditaksir oleh S2Residual rumus berikut : Selang kepercayaan E(Y0|X0) sebenarnya dapat dituliskan sebagai berikut

Peramalan Individu Jika diinginkan melakukan peramalan nilai individu dari Y yang berhubungan dengan nilai X tertentu misalkan X0 akan memilik varians : Selang kepercayaan tunggal Y0 sebenarnya dapat dituliskan sebagai birikut

Contoh Suatu penelitian lingkungan bertujuan untuk mengetahui tingkat pencemaran yang berasal dari mobil. Dalam hal ini diperkirakan bahwa tingkat emisi hydrokarbon (HC) dari mobil tergantung dari jaraknya. Dengan demikian, mobil yang masih baru lebih sedikit mengeluarkan HC daripada mobil tua. Untuk itu sebanyak 10 mobil merek tertentu dipilih secara acak, kemudian diperiksa berapa jarak tempuh (dalam ribuan kilometer) dari mobil tersebut dan diukur tingkat emisi HC-nya (dalam ppm). Hasilnya adalah sebagai berikut:   Untuk mempermudah proses perhitungan secara manual dari data di atas maka, data dijasikan dalam tabel di bawah ini : Jarak (X) 31 38 48 52 63 67 75 84 89 99 Emisi (Y) 553 590 608 650 700 680 834 752 845 960

Proses Perhitungan No. Jarak (X) Emisi (Y) X2 Y2 XY 1 31 553 961 305809 17143 2 38 590 1444 348100 22420 3 48 608 2304 369664 29184 4 52 650 2704 422500 33800 5 63 700 3969 490000 44100 6 67 680 4489 462400 45560 7 75 834 5625 695556 62550 8 84 752 7056 565504 63168 9 89 845 7921 714025 75205 10 99 960 9801 921600 95040 Total 646 7172 46274 5295158 488170

Proses Perhitungan

Proses Perhitungan a. Buatlah plot antara X dengan Y. Menurut Anda bagaimana bentuk hubungan antara jarak tempuh kendaraan dengan tingkat emisinya ?

Proses Perhitungan b. Kalau dicobakan model linear Yi = 0 + 1Xi +, i , maka carilah persamaan regresinya. Model regresi yang akan dibuat adalah model regresi dugaan yang diperoleh dari data sampel. Model regresi dugaannya adalah : Dengan nilai dari b0 dan b1 diperoleh dari metode kuadrat terkecil dengan proses perhitungan sebagai berikut :

Dugaan tingkat emisi = 363.669+5.473 (jarak tempuh) Sehinga model regresi dugaan dari kasus di atas adalah : Dugaan tingkat emisi = 363.669+5.473 (jarak tempuh)

Proses Perhitungan Apa makna dugaan 0 dan 1 pada konteks ini ?. b0 dalam di atas memberikan makna bahwa secara rata-rata tingkat emisi mobil baru yang memiliki jarak tempuh nol kilometer adalah 363.669 ppm atau pada saat start awal, mobil baru akan mengeluarkan tingkat emisi sebesar 363.669 ppm. b­1 dalam model di atas memberikan gambaran bahwa setiap peningkatan jarak tempuh seribu kilometer maka akan terjadi peningkatan tingkat emisi hydrokarbon (HC) sebesar 5.473 ppm

d. Lakukan pengujian H0: 1 = 0 lawan Ha : 1 > 0 dengan menggunakan uji-t . Apa kesimpulan yang anda peroleh dari hasil pengujian ini ? Jelaskan! Jawab : Untuk dapat mengambil kesimpulan secara umum bahwa ada pengaruh dari jarak tempuh kendaraan terhadap tingkat emisi hydrokarbon (HC) yang dikeluarkan maka terlebih dahulu harus dilakukan pengujian parameter regresi menggunakan statistik uji t student dengan syarat bahwa residu dari model mengikuti sebaran normal. Hipotesis Uji : H0 : 1 = 0 Tidak terdapat hubungan dari jarak tempuh terhadap tingkat emisi H1 : 1 > 0 Terdapat hubungan positif dari jarak tempuh terhadap tingkat emisi Statistik uji : Dengan : ^1 : Nilai dugaan untuk koefisien regresi s(^1) : Standar error estimasi dari koefisien 1

Standar error estimasi dari 1 yang dapat diformulasikan sebagai berikut : Dengan : KTG = Kuadrat Tengah Galat/Sisaan Sxx =Jumlah Kuadrat Terkoreksi variabel X Kriteria Penolakan dan Penerimaan H0 : Karena pengujian adalah uji satu pihak yaitu pihak kanan maka kriteria penolakan hipotesis dan penerimaan nolnya (H0) adalah : Tolak Hipotesis Nol (H0) jika : t hitung > t tabel (, n-2) Terima Hipotesis Nol (H0) jika : t hitung < t tabel (, n-2)

Jika diambil  = 5% maka t tabel adalah t(0.05,8) = 1.860

KESIMPULAN Kesimpulan : Dari hasil perhitungan statistik uji t diperoleh nilai t hitung sebesar 8.418. Sedangkan nilai t tabel pada tingkat signifikansi 0.05 dan derajat bebas 8 adalah 1.860. Nilai t hitung jauh lebih besar dari nilai t tabel seperti yang terlihat pada gambar 2 nilai t hitung jatuh di daerah penolakan sehingga dapat disimpulkan bahwa jarak tempuh kendaraan memiliki hubungan positif dan signifikan terhadap tingkat emisi hydrokarbon (HC). Artinya bahwa semakin jauh jarak tempuh kendaraan maka tingkat emisi hydrokarbon (HC) yang dihasilkan akan semakin tinggi.

e. Buatlah analisis ragam untuk model di atas e. Buatlah analisis ragam untuk model di atas. Jelaskan hasil yang Anda peroleh? Apa beda analisis ini dengan analisis yang Anda lakukan pada butir d. Jawab : Pengujian hipotesis parameter 1­ untuk menunjukkan bahwa terdapat pengaruh signifikan dari jarak tempuh terhadap tingkat emisi emisi hydrokarbon (HC) yang dikeluarkan selain dapat dilakukan dengan statistik uji t-student juga dapat dilakukan dengan analisis varians dengan statistik uji F-snedecor. Khusus untuk regresi linier sederhana, kuadrat dari statistik uji t dengan derajat bebas n-k-1 (k=banyaknya variabel predictor) sama dengan statistik uji uji F dengan derajat bebas v1 = 1 dan v2 = n-k-1. Hipotesis Uji : H0 : 1 = 0 Tidak terdapat hubungan linier dari jarak tempuh terhadap tingkat emisi H1 : 1  0 Terdapat hubungan linier dari jarak tempuh terhadap tingkat emisi

Statistik uji Dengan : v1 = derajat bebas keragaman regresi v2 = derajat bebas keragaman sisaan Untuk mendapatkan nilai F hitung dapat dibuat Tabel Analisis Varians dengan urutan perhitungan sebagai berikut :

Tabel ANOVA Kriteria Penolakan dan Penerimaan H0 : Sumber Keragaman DF JK KT F F Tabel (0.05,1,8) Regresi 1 136042.607 70.869 5.318 Sisaan 8 15356.993 1919.624 Total 9 151399.600 Kriteria Penolakan dan Penerimaan H0 : Tolak Hipotesis Nol (H0) jika : F hitung > F tabel (,v1,v2 ) Terima Hipotesis Nol (H0) jika : F hitung < F tabel (,v1,v2) v1 = k banyaknya variabel predictor v2 = n – k -1

f. Hitunglah koesfisien determinasinya dan jelaskan apa maknanya f. Hitunglah koesfisien determinasinya dan jelaskan apa maknanya! Apakah Anda puas dengan model yang Anda peroleh? Koefisien Determinasi (R2) Koefisien determinasi sebesar 89.857% menjelaskan bahwa sebesar 89.857% variansi dari emisi dapat dijelaskan oleh variabel jarak tempuh kendaraan dalam hubungan linier. Secara deskriptif dengan besar koefisien determinasi 89.857% yang mendekati nilai 100% menunukkan model sudah baik.

g. Periksalah dengan menggunakan plot normal, apakah asumsi kenormalan dipenuhi? Plot Quantil-Quantil i ei Terurut pi zi 1 -71.37 0.05 -1.645 2 -50.33 0.15 -1.036 3 -18.35 0.25 -0.674 4 -8.44 0.35 -0.385 5 -5.73 0.45 -0.126 6 1.75 0.55 0.126 7 18.37 0.65 0.385 8 19.68 0.75 0.674 9 54.54 0.85 1.036 10 59.88 0.95 1.645

Proses Perhitungan Dengan R

Syntax >lat1<-read.table("e:/KULIAH/PASCA STATISTIKA UNPAD/DATA/LAT1.txt", sep="\t", header=TRUE) > plot(Jarak~Emisi,lat1,main="Plot Jarak Tempuh dengan Tingkat Emisi") > reg1<-lm(Jarak~Emisi,lat1) > abline(reg1$coef,col="red") > summary(reg1)

Output

Output Call: lm(formula = Emisi ~ Jarak, data = lat1) Residuals: Min 1Q Median 3Q Max -71.369 -15.877 -1.988 19.353 59.885 Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 363.6692 44.2215 8.224 3.58e-05 *** Jarak 5.4726 0.6501 8.418 3.02e-05 *** --- Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1 Residual standard error: 43.81 on 8 degrees of freedom Multiple R-squared: 0.8986, Adjusted R-squared: 0.8859 F-statistic: 70.87 on 1 and 8 DF, p-value: 3.02e-05

MINITAB

MINITAB

Syntax Output Welcome to Minitab, press F1 for help. MTB > Regress 'Emisi' 1 'Jarak'; SUBC> GFourpack; SUBC> RType 1; SUBC> Constant; SUBC> Brief 2. Regression Analysis: Emisi versus Jarak The regression equation is Emisi = 364 + 5.47 Jarak Predictor Coef SE Coef T P Constant 363.67 44.22 8.22 0.000 Jarak 5.4726 0.6501 8.42 0.000 S = 43.8135 R-Sq = 89.9% R-Sq(adj) = 88.6% Analysis of Variance Source DF SS MS F P Regression 1 136043 136043 70.87 0.000 Residual Error 8 15357 1920 Total 9 151400 Residual Plots for Emisi

Output

Output

MYSTAT

MYSTAT

MYSTAT

MYSTAT

OUTPUT

SPSS

SPSS

OUTPUT SPSS

OUTPUT SPSS

MS Excel

MS. Excel

Output MS. Excel

STATISTICA

OPENSTAT

OUTPUT

TUGAS 2 Cari sebuah kasus yang sekiranya dapat dianalisis dengan analisis regresi linier sederhana.