BAHAN PENGAJARAN MATRIKULASI STATISTIKA OLEH: Prof. Dr. Ir. ZULKIFLI ALAMSYAH, M.Sc. PROGRAM MAGISTER AGRIBISNIS UNIVERSITAS JAMBI
GARIS-GARIS BESAR PERKULIAHAN BAGIAN I. PENGERTIAN DAN KONSEP Pengertian Statistika Populasi dan Sampel Statistika Deskriptif dan Statistika Infrensial Data dan Variabel Kegunaan Statistika BAGIAN II. STATISTIKA DESKRIPTIF Distribusi Frekuensi Pengukuran Nilai Sentral Pengukuran Dispersi /Zed_A
BAGIAN III. STATISTIKA INFERENSIAL Hipotesis Teknik Sampling GARIS-GARIS BESAR PERKULIAHAN ……. lanjutan BAGIAN III. STATISTIKA INFERENSIAL Hipotesis Teknik Sampling Chi – Kuadrat Analisis t–test Analisis F–test (Analisis Varian Untuk K–Kategori Perlakuan) 6. Korelasi Dan Regresi BAGIAN IV. STATISTIKA NON PARAMETRIK Kasus satu sampel Kasus dua sampel dependent Kasus dua sampel independent /Zed_A
PENGERTIAN STATISTIK DAN STATISTIKA Statistik merupakan kumpulan angka-angka yang diukur dari pengamatan-pengamatan terhadap suatu sifat (karakteristik) sekumpulan benda tertentu Data atau sekumpulan data kuantitatif (numeric) Data yang belum bermakna Merupakan penduga parameter Contoh: Nilai Tukar Rupiah pada bulan Januari 2010. Luas Tanaman Karet Propinsi Jambi, tahun 1990 - 2009 /Zed_A
Statistika Contoh Penerapan: Ilmu yang mempelajari tentang penerapan metode ilmiah dalam analisis data kuantitatif untuk tujuan pengambilan keputusan yang rasional. Membahas cara atau metode mengumpulkan, menyederhanakan dan menyajikan data sehingga bisa memberikan informasi. Menarik kesimpulan, menafsirkan parameter, dan menguji hipotesa (dugaan) yang didasarkan pada hasil pengolahan data Mempelajari dan mengusahakan agar data mempunyai makna. Contoh Penerapan: Trend Nilai Tukar Rupiah Selama periode tertentu. Hubungan produksi dan nilai ekspor karet di Propinsi Jambi, tahun 1990 – 2009. /Zed_A
Populasi dan Sampel Populasi Sampel Subset Sampel Populasi Populasi Sebuah kumpulan dari semua kemungkinan orang-orang, benda-benda dan ukuran lain dari objek yang menjadi perhatian keseluruhan nilai dari suatu variabel pengamatan. Sampel Bagian dari populasi tertentu yang menjadi perhatian /Zed_A
Statistika Deskriptif (Descriptive Statistics) CABANG STATISTIKA Statistika Deskriptif (Descriptive Statistics) metode pengumpulan, peringkasan dan penyajian data. Descriptive : bersifat memberi gambaran Statistika Inferensial = Statistika Induktif (Inferential Statistics) Metode analisis, peramalan, pendugaan dan penarikan kesimpulan Inferential : bersifat melakukan generalisasi (penarikan kesimpulan). /Zed_A
Statistika inferensial digunakan untuk mengolah data kuantitatif dengan tujuan untuk menguji kebenaran suatu teori baru yang diajukan peneliti yang dikenal dengan hipotesis penelitian inferensial Dalam penelitian inferensial, teknik analisis statistik yang digunakan mengacu kepada suatu pengujian hipotesis /Zed_A
Data Primer : informasi yang diperoleh langsung dari sumber data, disebut juga data mentah. (Data = bentuk jamak dari datum = keterangan). Data sekunder : rangkuman informasi/keterangan yang didasarkan pada data mentah dan diperlukan untuk penyusunan laporan atau publikasi. Sensus : kegiatan pengumpulan informasi mengenai setiap obyek yang terdapat dalam populasi. Sampel acak : suatu sampel yang anggota-anggotanya dipilih dari anggota-anggota populasi dengan kesempatan yang sama. /Zed_A
Peubah/Variabel : Parameter : suatu ciri atau gejala suatu populasi atau sampel yang dapat mencapai lebih dari satu nilai. Suatu peubah dapat bersifat kualitatif atau kuantitatif. Parameter : suatu rangkuman berbentuk angka yang digunakan untuk mendeskripsikan/ menggambarkan sifat suatu populasi, misalnya nilai rataan (), simpangan baku (). Percobaan: suatu upaya mengumpulkan informasi melalui pembangkitan data secara sengaja. Survei : suatu upaya mengumpulkan informasi melalui data yang sudah tersedia di dalam populasi. /Zed_A
DATA dan VARIABEL DATA = Fakta atau angka-angka. Bila tidak diolah, tidak punya makna Data untuk kepentingan penelitian: Jenis: Data kuantitatif angka-angka (terukur) Data kualitatif tidak dalam angka Waktu: Data deret waktu (time series) periode Data sesaat (cross section) satu waktu /Zed_A
VARIABEL PARAMETER Variabel TIDAK SAMA dengan Parameter Merupakan atribut dari sekelompok data yang memiliki variasi antara satu data dengan data lainnya pada kelompok tersebut. Variabel TIDAK SAMA dengan Parameter PARAMETER Merupakan nilai penduga terhadap perilaku suatu variabel yang diberlakukan untuk suatu populasi. /Zed_A
Data untuk kepentingan penelitian: Sumber: Data Primer dari objek penelitian Data Sekunder dari sumber lainnya (laporan/publikasi) Skala: Nominal kategori, tidk diperbandingkan Ordinal kategori, diperbandingkan Interval Kelompok kategori menurut interval yang sama Rasio angka perbandingan /Zed_A
Data Nominal Data yang ditetapkan berdasarkan proses penggolongan atau kategorisasi. Data nominal ini bersifat diskrit dan saling terpisah (mutually exlusive) antara golongan (kategori) yang satu dengan yang lain. Angka tersebut tidak mengukur besaran, tetapi hanya sebagai lambang. Contoh : jenis kelamin; pendapat petani terhadap kenaikan harga pupuk (setuju / tidak setuju); warna favorit. /Zed_A
Data Ordinal Data yang mempunyai urutan atau bisa diurutkan berdasarkan jenjang atau atribut tertentu. Contoh : data tentang tingkat pendidikan; tingkat adopsi petani terhadap teknologi. Data ordinal juga bersifat diskrit. Operasi matematik tidak dapat digunakan pada peubah-peubah yang mempunyai skala pengukuran nominal dan ordinal. Analisis statistika yang digunakan adalah analisis statistika non parametrik. /Zed_A
Data Interval data yang dapat dikelompokkan berdasarkan ukuran (satuan/unit) yang sama; dapat diurutkan berdasarkan kelompok tersebut sebagaimana data ordinal. data interval umumnya bersifat kontinyu. Contoh: Temperatur, kalender, penunjuk waktu pada jam. /Zed_A
Data Rasio Data yang dalam kuantifikasinya mempunyai nilai nol (0) mutlak; artinya ‘kuantitas’ nol (0) dapat masuk sebagai anggota data. Dalam penelitian ilmu-ilmu sosial, jarang peneliti menggunakan data rasio. Data rasio bersifat kontinyu. /Zed_A
Beberapa Alat Statistika yang Dapat Digunakan Berdasarkan Skala DAta /Zed_A
Konversi Data Dalam praktek pengolahan data, dimungkinkan melakukan konversi dari data yang mempunyai tingkat lebih tinggi ke tingkat data yang lebih rendah. Data rasio data interval data ordinal data nominal Konversi data diperlukan biasanya untuk menyesuaikan dengan teknik analisis statistik yang akan dipakai. /Zed_A
Analisis Statistik yang Sesuai Menurut Skala Data SKALA BENTUK HUBUNGAN STATISTIK Uji Statistik NOMINAL Ekuivalensi Modus Frekuensi Koef. Contingensi ORDINAL Lebih Besar dari Median Persentil Spearman (rs) Kendall (t) Kendall (W) Non-parametrik INTERVAL Rasio sembarang dua interval Rata-rata (mean) Simpangan Baku Korelasi momen hasil kali Pearson Korelasi momen hasil kali ganda Parametrik RASIO Mean geometrik Koefisien Variasi /Zed_A
PENYAJIAN DATA /Zed_A
Ketinggian Beberapa Kota di Propinsi Jambi 1. Tabel Data Tunggal Ketinggian Beberapa Kota di Propinsi Jambi No. KOTA Tinggi dpl (M) 1. Jambi 23 2. Muara Bulian 20 3. Bangko 87 4. Muara Bungo 48 5. Kuala Tungkal 3 6. Sungai Penuh 938 7. Sarolangun 38 8. Muara Tembesi 24 9. Muara tebo 36 10. Muara Sabak 4 /Zed_A
2. Tabel Data Berkelompok Jarak Tempat Tinggal 100 Mahahsiswa dari Kampus Jarak (km) f 1 – 4 40 5 – 8 25 9 – 12 20 13 – 16 15 /Zed_A
Perkembangan Luas Areal Panen Jagung 3. Diagram Garis Perkembangan Luas Areal Panen Jagung Provinsi Jambi /Zed_A
Kebutuhan dan Ketersediaan Pangan Strategis 4. Diagram Batang Kebutuhan dan Ketersediaan Pangan Strategis Provinsi Jambi - 2006 Ketersediaan Kebutuhan /Zed_A
Persentase Luas Wilayah Provinsi Jambi Menurut Relief 5. Diagram Lingkaran Persentase Luas Wilayah Provinsi Jambi Menurut Relief Bentuk lain…. /Zed_A
DISTRIBUSI FREKUENSI mengorganisasikan data secara sistematik di dalam berbagai macam klasifikasi tanpa mengurangi informasi yang ada dari data tersebut. Jika data yang tersedia banyak, maka bisa dibagi ke dalam beberapa kelas. Penentuan jumlah kelas, sangat tergantung kepada kisaran (range) data dan interval (lebar) kelas. /Zed_A
Langkah-langkah pembuatan distribusi frekuensi dengan metode STURGESS Tentukan jumlah kelas (∑K) yang dibuat dari sejumlah data (N) ∑K = 1 + 3,3 Log N Tentukan range (Rentangan Data – R) Range (R) = Nilai terbesar – Nilai terkecil Tentukan selang kelas (Class Interval)/Ci Ci = R / ∑K /Zed_A
STATISTIKA DESKRIPTIF Ukuran Pemusatan Nilai Tengah (Arithmatic mean) Median Modus (Mode) Kuantil (Kuartil, desil, persentil) Ukuran Dispersi Kisaran (range) Ragam (variance) Simpangan baku (standard deviation) Koefisien variasi (coefficient of variation) /Zed_A
Nilai Tengah (Arithmatic mean) DATA1. Pengamatan Terhadap Umur Ketika Menikah 12 Orang Wanita Karir Di Kota Jambi No. Pengamatan Umur (thn) 1 23 5 26 9 21 2 28 6 25 10 24 3 7 11 27 4 22 8 12 Nilai Tengah (X) X1 + X2 + … + Xn = n Σi=1 Xi X = n atau = (23 + 28 + 26 + . . . + 24 + 27 + 26) /12 = 295/12 = 24.58 /Zed_A
Selang Kelas Umur (thn) Jika data dikelompokkan kedalam kelas: No. Selang Kelas Umur (thn) Frekuensi 1 21 – 22 2 23 – 24 4 3 25 – 26 27 - 28 Nilai tengah dapat di aproksimasi dengan rumus sbb: Σj=1 mj fj X = n g Dimana: n = jumlah pengamatan g = jumlah kelas mj = nilai tengah kelas ke-j fj = frekuensi kelas ke-j /Zed_A
mj . fj n = 12 g = 4 Σmj fj = 294 Selang Kelas Umur (thn) Nilai Tengah Kelas (mj) Frekuensi (fj) mj . fj 21 – 22 21.5 2 43 23 – 24 23.5 4 94 25 – 26 25.5 102 27 - 28 27.5 55 Σ 12 294 n = 12 g = 4 Σmj fj = 294 294 X = = 24.50 12 /Zed_A
Median Median merupakan ukuran pemusatan yang nilainya berada ditengah sederetan nilai yang telah diurutkan. No. Obs. Nilai 9 21 4 22 1 23 7 8 24 10 6 25 3 26 5 12 11 27 2 28 6 Obs. Tabel disebelah kanan adalah urutan nilai observasi dari terkecil ke terbesar. Median berada pada titik tengah dari urutan tersebut yaitu 24.5. 50% data berada diatas median dan 50% lainnya berada dibawah median. Urutan Median ditentukan menurut formula sbb: 6 Obs. n + 1 Urutan Median = 2 /Zed_A
Modus Nilai Frekuensi 21 I 1 22 23 II 2 24 25 26 III 3 27 28 Jumlah 12 Modus adalah angka yang paling sering muncul pada nilai pengamatan. Nilai pengamatan 26 paling sering muncul (3 kali). Oleh karena itu modus adalah 26. Nilai Frekuensi 21 I 1 22 23 II 2 24 25 26 III 3 27 28 Jumlah 12 Modus merupakan ukuran pemusatan yang dapat digunakan untuk data kualitatif. /Zed_A
Kuantil (quantiles) Kuartil (quartiles) Kuantil biasa digunakan untuk memperoleh gambaran lebih rinci dari sekumpulan data. Bila median membagi dua data sekumpulan data, kuantil membagi kumpulan data tersebut menjadi 4 (quartil), 10 (desil) dan 100 (persentil). Kuartil (quartiles) Q1 nilai yang berada pada kuarter pertama yang membagi 25% data yang lebih kecil dan 75% data yang lebih besar. Q2 = median Q3 nilai yang berada pada kuarter pertama yang membagi 75% data yang lebih kecil dan 25% data yang lebih besar. /Zed_A
Q1 nilai yang berada pada urutan data ke (n+1)/4 Berdasarkan DATA1, Q1 = pada urutan ke (12 + 1)/4 = 3.25 dengan nilai 23 Q3 = pada urutan ke 3(12 + 1)/4 = 9.75 dengan nilai 26 Perhitungan yang sama berlaku untuk Desil dan Persentil. /Zed_A
No. Group A Group B 1 65 42 2 66 54 3 67 58 4 68 62 5 71 6 73 77 7 74 8 85 9 93 10 100 Perhatikan dua kelompok data pada tabel. Hitunglah nilai tengah (mean), median dan modus kedua kelompok data tersebut. Apa yang dapat disimpulkan dari kedua data tersebut?? Mean 71.5 Median 72 Modus 77 /Zed_A
Ukuran Dispersi Kisaran Ragam Kisaran (range) adalah selisih antara nilai pengamatan terkecil dan terbesar. Contoh: Berdasarkan DATA1, kisaran = 28 – 21 = 7 Ragam Ragam (variance) menggambarkan bagaimana data (nilai pengamatan) terdistribusi dan fluktuasinya terhadap nilai tengah. Ragam dari sampel (S2) dihitungan dengan formula sbb: Σi=1 (Xi - X)2 S2 = n - 1 n Dari DATA1, n = 12 X = 24.58 /Zed_A
Simpangan Baku Sesuai dengan Formula, S2 = 48.92/(12-1) = 4.45 No. Obs. Nilai (Xi - X) (Xi - X)2 1 23 -1.58 2.51 2 28 3.42 11.67 3 26 1.42 2.01 4 22 -2.58 6.67 5 6 25 0.42 0.17 7 8 24 -0.58 0.34 9 21 -3.58 12.84 10 11 27 2.42 5.84 12 Jumlah (Σ) 295 48.92 Nilai Tengah 24.58 Sesuai dengan Formula, S2 = 48.92/(12-1) = 4.45 Simpangan Baku Simpangan baku (standard deviation) secara praktis dihitung sbb: S = S2 = 4.45 = 2.11. /Zed_A
Koefisien Variasi Koefisien variasi (coefficient of variation) menggambarkan sebaran data dari nilai tengah berdasarkan pengukuran relatif (dalam persentase). Koefisien variasi didefinisikan sebagai simpangan baku terhadap nilai tengah yang dinyatakan dalam bentuk persentase Koefisien variasi dihitung dengan formulas sbb: Dari DATA1, S = 2.11 X = 24.58 CV = (2.11/24.58) x 100% = 8.58%. S CV = 100% X /Zed_A
Koefisien variasi sangat tepat digunakan dalam studi komparasi antara dua fenomena atau lebih yang unit pengukurannya berbeda. Misalnya, studi tentang variasi alokasi pendapatan keluarga untuk kebutuhan keluarga. Mana yang lebih bervariasi antara jumlah beras yang dibeli (dalam satuan KG) atau biaya pendidikan yang dikeluarkan (dalam satuan Rp.). Kedua variabel ini memiliki satuan yang berbeda, sehingga komparasi tidak dapat dilakukan dengan ragam atau simpangan baku. /Zed_A
Dengan formula diatas, maka didapat: CVA = (1100 / 5500) 100% = 20% Koefisien variasi banyak digunakan oleh investor dalam pengambilan keputusan terhadap alternatif investasi. Misalnya, Rata-rata harga saham perusahaan A di BEJ pada bulan Januari Rp. 5.500 dengan simpangan baku Rp 1.100, sedangkan rata-rata harga saham perusahaan B pada periode yang sama Rp. 3.750 dengan simpangan baku Rp. 450,- Dengan formula diatas, maka didapat: CVA = (1100 / 5500) 100% = 20% CVB = (450 / 3750) 100% = 12% Saham perusahaan mana yang lebih aman dibeli oleh investor? /Zed_A