PERTEMUAN 6 Teknik Analisis dan Penyajian Data Dalam pertemuan ini, diharapkan Anda mampu menunjukkan: 1. Tahapan analisis data dan teknik analisis data seperti: analisis statistik dan analisis ekonometrika; 2. Teknik penyajian dan analisis data
PERSIAPAN DAN TAHAPAN ANALISIS Analisis data lazimnya terdiri beberapa tahapan berikut ini. Penjelasan mengenai data yang digunakan serta sumbernya Persiapan data untuk analisis menggunakan software tertentu Spesifikasi model yang digunakan (uji spesifikasi model) Melakukan uji hipotesis yang memungkinkan konfirmasi atau penolakan teori, serta peramalan jika diperlukan. Analisis data juga mendiskusikan kelemahan analisis yang dilakukan, serta kemungkinan perbaikannya di penelitian yang akan datang.
ALAT ANALISIS DATA Berbagai software untuk penghitungan nilai-nilai statistik dan parameter (dan biasanya sudah termasuk juga fasilitas pengumpulan dan presentasi data) telah dibuat oleh para ahli. Di antaranya yang banyak digunakan adalah EXCEL, SAS, SPSS, MINITAB, MICROSTAT, MICRO TSP, TSP, EViews, RATS, Ox, SPSS.
TEKNIK ANALISIS DATA: ANALISIS STATISTIK DAN ANALISIS EKONOMETRIKA Teknik analisis data yang tersedia saat ini pada umumnya didasari oleh prinsip-prinsip statistika Statistika pada dasarnya dibagi menjadi dua bagian besar, yakni statistika deskriptif dan statistika induktif. Statistika deskriptif mendiskusikan teknik pengukuran sifat atau karakteristik data, baik populasi maupun sampel, yang berupa (1) ukuran tendensi sentral (measures of central tendency) dan ukuran tendensi non-sentral (measures of non-central tendency); (2) ukuran persebaran (measures dispersion); dan (3) ukuran bentuk distribusi (measures of shape of distribution). Statistika induktif mendiskusikan hubungan antara data sampel dan data populasi. Tujuan utama statistika induktif adalah menaksir karakteristik data populasi, atau dikenal sebagai parameter) dengan dasar karakteristik data sampel (atau dikenal sebagai statistik)
STATISTIKA DESKRIPTIF Ukuran Tendensi Sentral Mean aritmetik, atau secara ringkas hanya disebut mean adalah ukuran tendensi sentral yang paling sering digunakan. Mean aritmetika untuk populasi dilambangkan dengan huruf Yunani (baca: mu), dan mean aritmetika untuk sampel diwakili oleh Ẋ (baca: x bar). Rumusnya adalah untuk mean populasi dan untuk mean sampel. Sebagai contoh, kembali ke data di atas, mean dari data tersebut adalah: Median adalah nilai tengah dari sekelompok yang sudah diurutkan. Untuk data di atas, data berurutannya adalah 51, 65, 67, 73, 75, 89. Titik posisi median adalah (n + 1)/2 = (6 + 1)/2 = 3,5. Maka median diperoleh dengan cara mencari mean aritmetika dari nilai observasi ketiga dan keempat, yakni median = (67+73)/2 = 70. Mode didefinisikan sebagai nilai yang paling sering terjadi dalam suatu koleksi nilai. Mode digunakan hanya sebagai alat penggambaran. Midrange adalah mean aritmetika dari observasi terkecil dan observasi terbesar dalam satu kelompok data. Perumusannya adalah sebagai (Xterkecil + Xterbesar )/2. Dari data di atas, midrange adalah (51 + 89)/2 = 70
STATISTIKA DESKRIPTIF Ukuran Tendensi Sentral Midhinge adalah mean dari kuartil pertama dan kuartil ketiga dalam suatu kelompok data, yaitu (Q1 + Q3)/2, di mana: Q1 = kuartil pertama, dan Q3 = kuartil ketiga. Kuartil merupakan ukuran dari lokasi non-sentral, merupakan ukuran perempatan dari sebuah data. Kuartil pertama, Q1, adalah sebuah nilai dalam observasi data di mana 25% dari data tersebut adalah lebih kecil, dan 75% lebih besar dari nilai tersebut. Kuartil kedua, Q2, adalah sebuah nilai dalam observasi data di mana 50% dari data tersebut adalah lebih kecil, dan 50% lebih besar dari nilai tersebut. Kuartil ketiga, Q3, adalah sebuah nilai dalam observasi data di mana 75% dari data tersebut adalah lebih kecil, dan 25% lebih besar dari nilai tersebut
STATISTIKA DESKRIPTIF Ukuran Variasi Variasi adalah ukuran dispersi atau sebaran dalam data. Lima ukuran variasi adalah range, range interkuartil, varians, standar deviasi, dan koefisien variasi. Rentang atau range adalah perbedaan antara observasi terbesar dan observasi terkecil dalam satu kelompok data, yaitu: range = xterbesar - xtekecil. Range interkuartil atau sebaran tengah (midspread) adalah beda antara kuartil ketiga dan kuartil pertama dari kelompok data. Beberapa generalisasi bisa dibuat dari sifat sebaran data sebagai berikut: Semakin jauh persebaran data, semakin besar range, range interkuartil, varians, dan standar deviasinya. Semakin terkonsentrasi atau homogen sekelompok data, semakin kecil range, range interkuartil, varians, dan standar deviasinya. Jika semua observasinya adalah sama (sehingga tidak ada variasi dalam data), range, range interkuartil, varians, dan standar deviasinya semua akan sama dengan nol
STATISTIKA DESKRIPTIF Bentuk Distribusi Sifat ketiga yang penting dari sebuah kelompok data adalah bentuk distribusi atau shape of distribution – yaitu cara dengan mana data didistribusikan, baik data tersebut simetris maupun tidak. Jika distribusi data tidak simetris, maka disebut asimetris atau menceng (skewed). Untuk menggambarkan bentuk distribusi, kita hanya perlu membandingkan mean dan median Jika mean kurang dari median, maka data tersebut bisa disebut menceng ke kiri atau menceng negatif. Atau lebih jelasnya seperti berikut: a) Mean > median: menceng ke kanan atau menceng positif b) Mean = median: simetris atau menceng nol c) Mean < median: menceng ke kiri atau menceng negatif
Bentuk Distribusi (Shape of Distribution). Menceng positif akan terjadi jika nilai mean bernilai tinggi yang disebabkan oleh nilai-nilai yang “ekstrem tinggi” dalam sebuah kelompok data. Menceng negatif muncul jika mean bernilai rendah dikarenakan oleh nilai-nilai yang “ekstrem rendah”
EKONOMETRIKA Alat utama dalam ekonometrika adalah analisis regresi, yakni analisis yang menghubungkan perubahan dalam mean variabel independen dengan nilai tetap dari variabel dependen. Model ekonometrika sederhana, yakni model dengan satu variabel independen, bisa dirumuskan sebagai berikut: Teorema Gauss-Markov menyatakan bahwa jika asumsi-asumsi klasik dipenuhi, estimator OLS adalah BLUE, yakni Best, Linear Unbiased Estimators. Best berarti terbaik, artinya mempunyai varians minimum dibanding estimator linier yang lain. Unbiased artinya dalam penyampelan berulang, mean dari estimator adalah sama dengan parameter yang sesungguhnya
EKONOMETRIKA Asumsi Klasik: Zero Mean Asumsi zero mean berarti bahwa rata-rata dari error adalah nol. Secara matematis, hal ini dinyatakan sebagai: Asumsi ini menyatakan bahwa jumlah dari faktor-faktor yang mempengaruhi variabel dependen Y tetapi tidak dimasukkan ke dalam model tidak mempengaruhi error tersebut secara sistematis Asumsi klasik: Homoscedasticity Homoscedasticity berarti varians residual yang konstan, yakni Pelanggaran terhadap asumsi ini disebut heteroscedasticity, yakni varians yang tidak konstan: Asumsi Klasik: Asumsi No Autocorrelation (no-AC) Penyebab AC adalah inertia dan bias spesifikasi. Bias spesifikasi disebabkan oleh excluded variabel (tidak memasukkan variabel yang penting), atau incorrect functional form (menggunakan bentuk fungsi yang salah), cobweb phenomenon, lags, data manipulasi, dan nonstationarity (data yang tidak stasioner).
EKONOMETRIKA ANALISIS REGRESI DAN UJI ANOVA Uji ANOVA, yang didasarkan pada uji F, bisa digunakan untuk menguji signifikansi semua variabel secara bersama-sama. Jika uji t di atas dinamakan uji signifikansi parsial, uji F dinamakan juga uji signifikansi keseluruhan (overall test). Uji ini dilakukan dengan langkah-langkah sebagai berikut: Menyatakan hipotesis, dan Menentukan confidence level, misalnya . Dengan dasar confidence level, kita bisa menentukan nilai kritis pengujian. Menentukan statistik uji, dalam hal ini Menolak H0 jika dan menerima H0 jika
TERIMA KASIH