KIKI HARDIANSYAH SIR SEKOLAH TINGGI ILMU EKONOMI IBMI STATISTIKA EKONOMI I KIKI HARDIANSYAH SIR SEKOLAH TINGGI ILMU EKONOMI IBMI
Karakteristik dan Satuan Pengamatan Dalam penelitian, ciri yang kita teliti disebut karakteristik, sedangkan obyek yang karakteristiknya kita teliti disebut Satuan Pengamatan
Peranan Statistika dalam Ekonomi DATA : ukuran suatu nilai Data bentuk jamak (plural) Datum bentuk tunggal (singular) Informasi : data yang telah diproses Dalam banyak pengambilan keputusan dalam bidang bisnis, manajemen dan ekonomi, statistik (data) atau statistika (metode) berperan sangat penting seperti :…
Jenis-jenis data : Berdasarkan sumber-nya data dibedakan menjadi : Data primer : data yg didapatkan atau dikumpulkan sendiri, misal dgn melakukan wawancara, observasi atau penelitian lapangan/laboratorium Data sekunder : data yg didapat dari pihak lain, misal dari data providers seperti : BPS, LIPI, SRI dll
Berdasarkan jenisnya data dibedakan menjadi : Data Numerik (kuantitatif) → dinyatakan dalam besaran numerik (angka), Misalnya : Data pendapatan per kapita, pengeluaran, harga, jarak, dll. Data Kategorik (Kualitatif) → diklasifikasikan berdasarkan kategori/kelas tertentu Misalnya : Kategori Mahasiswa Berprestasi dan Tidak Berprestasi, Kategori kota kecil, sedang dan besar, Kategori pendukung partai politik XXX, YYY, ZZZ, dll.
Fungsi teknik statistik Teknik statistik mampu melakukan tiga tugas penting dalam ilmu pengetahuan, yaitu menerangkan gejala, meramalkan kejadian dan mengontrol keadaan. Statistik deskriptif merupakan bagian statistik yang memikul tugas untuk menerangkan suau gejala. Statistik inferensia merupakan bagian laindari statistik yang membuat ramalan dan mengontrol kejadian.
SKALA PENGUKURAN Empat tingkat Skala/Pengukuran berikut karakteristiknya: (a) Nominal : Tidak ada urutan, urutan tidak menunjukkan tingkatan (rangking) Tidak ada titik awal Tidak ada perbedaan Misalnya : Apa warna favorit anda : 1. Ungu 2. Abu-abu 3. Coklat 4. Putih (B) Ordinal : Ada urutan. urutan menunjukkan tingkatan (rangking) Tidak ada titik awal Tidak ada perbedaan
Misalnya : Bagaimana prestasi belajar anda semester lalu? 1. Sangat Baik 2. Baik 3. Sedang-sedang saja 4. Buruk 5. Sangat Buruk Skala Nominal dan Ordinal digunakan berkaitan dengan data kategorik/kualitatif.
Contoh pertanyaan yang jawabannya berbentuk kata atau kalimat adalah: 1. Berbelanja di toko ini lebih sering lebih baik, supaya dapat harga diskon untuk produk- produk tertentu : [ ] sangat setuju[ ] setuju [ ] netral [ ] tidak setuju [ ] sangat tidak setuju 2. Sebutkan gerai ritel modern yang sering anda kunjungi: ................... 3. Sebutkan alasan kenapa anda memilih gerai tersebut (jawaban no.2): .......................................................... .....................................................
Skala ordinal dan nominal Pertanyaan di atas mempunyai jawaban dalam bentuk kata atau kalimat, meskipun pernyataan nomor satu sudah menyediakan pilihan jawaban. Jawaban untuk ketiga pertanyaan tersebut harus dikodekan terlebih dahulu. Pengkodean jawaban pada nomor 1 harus mengikuti skala ordinal, sedangkan nomor 2 dan 3 mengikuti skala nominal.
Skala interval dan ratio (c) Interval: Ada Urutan Ada Perbedaan Tidak ada titik awal Misalnya: • Temperatur atau suhu : 0°C bukan berarti tidak mempunyai suhu. • Tangga Nada • IQ (d) Rasio : Ada Urutan Ada Perbedaan Ada titik awal • Pendapatan (Rp. 135 245,23 per bulan): Pendapatan Rp. 0 berarti tidak ada (bandingkan dengan 0°C pada suhu) Skala Interval dan Rasio digunakan berkaitan dengan data numerik/kuantitatif.
Variabel (Variable) Karakteristik yang keadaannya berubah-ubah (berbeda-beda) seperti ini, dalam istilah keilmuan disebut Variabel. Variabel adalah karakteristik. a. Yang dapat diklasifikasikan ke dalam sekurang- kurangnya dua buah klasifikasi (kategori) yang berbeda, atau, b. Yang dapat memberikan sekurang-kurangnya dua hasil pengukuran dan penghitungan yang nilai numeriknya berbeda.
Contoh Gender diklasifikasikan ke dalam dua klasifikasi : laki-laki atau perempuan. Pekerjaan diklasifikasikan ke dalam lebih dari dua kategori : Pegawai Negeri Sipil, Petani, Pedagang, dan sebagainya. Tinggi Badan memberikan banyak kemungkinan nilai numerik hasil pengukuran : 160 cm, 185 cm, dan seterusnya.
Notasi Variabel Dalam kajian Statistika, variabel diberi lambang X, Y, Z, atau huruf besar lainnya, sedangkan nilai pengukuran/penghitungan variabel ditulis dalam huruf yang sama tetapi menggunakan huruf kecil. Contoh : X = tinggi badan X = X1, X1 melambangkan hasil pengukuran tinggi badan untuk satuan pengamatan yang pertama.
Data adalah fakta, baik dalam bentuk kualitatif maupun kuantitatif. Fakta kualitatif diperoleh melalui pengamatan, sedangkan fakta kuantitatif diperoleh atas dasar pengukuran
Pengukuran adalah proses kuantifikasi. Dalam proses ini kita berusaha mencantumkan bilangan (nilai numerik) kepada suatu sistem materi, berdasarkan hukum (aturan) tertentu, dengan tujuan menggambarkan sifat-sifat yang dimiliki oleh sistem materi tersebut. terdapat bilangan yang menggambarkan sifat-sifat materi yang diukur interprestasi terhadap bilangan yang tercantum pada materi itu ditentukan oleh hukum (aturan) yang dipakai pada saat mencantumkan bilangan
Tingkat Pengukuran (Skala Pengukuran) Tingkat Pengukuran Nominal Tingkat Pengukuran Ordinal Tingkat Pengukuran Interval Tingkat Pengukuran Rasio
Pengukuran Statistik (“Statistical Measurement”) syaratnya : Pengukuran dilakukan berulang-ulang terhadap sebuah satuan pengamatan, mengenai sebuah atau beberapa variabel, atau Pengukuran dilakukan sekali terhadap beberapa satuan pengamatan, mengenai sebuah atau beberapa variabel, atau Pengukuran dilakukan berulang-ulang terhadap beberapa satuan pengamatan, mengenai satu atau beberapa variabel
Data Statistik atau Statistik (“Statistical Data” atau “Statistic”). adalah data hasil pengukuran/ pengamatan statistis, yang menunjukkan gejala tertentu dari variabel yang diteliti. Data Statistik atau statistik, biasa disusun secara sistematik dalam tabel atau grafik.
Tipe Variabel Variabel Kualitatif Bentuknya klasifikasi (kategori). Jika kategorinya tidak menunjukkan peringkat disebut Variabel Nominal, jika mengisyaratkan peringkat disebut Variabel Ordinal. Variabel Kuantitatif Apabila nilai numeriknya selalu bilangan bulat dan tidak mungkin bilangan pecahan (desimal) disebut Variabel Kuantitatif Diskrit Jika nilai numeriknya mungkin bilangan bulat mungkin pula pecahan (desimal) disebut Variabel Kuantitatif Kontinu
Tipe Variabel menurut Tingkat Pengukurannya Variabel Nominal Variabel Ordinal Variabel Interval Variabel Rasio
Tipe Variabel menurut Hubungannya Variabel Bebas (“Independent Variable”) dan Variabel Tak bebas (“Dependent Variable”) Bayangkan bahwa X dan Y merupakan dua buah variabel yang saling berhubungan. Jika dalam hubungan tersebut keadaan X bisa “menerangkan” keadaan Y, maka X disebut Variabel Bebas dan Y disebut Variabel Tak bebas
Populasi (“Population”/”Universe”), Sampling dan Sampel (“Sample”) Populasi adalah keseluruhan obyek yang berdasarkan suatu batasan, memiliki kesamaan ciri tertentu Sampling adalah memilih beberapa obyek dari sekumpulan obyek tertentu. Obyek yang terkumpul karena proses sampling disebut Sampel (“Sample”)
Ilustrasi Populasi, Sampel, dan Sampling Sampel (n=3) Populasi (N=43)
Ukuran Statistik (“Statistical Measures”) Bilangan yang diperoleh melalui manipulasi tertentu terhadap sekumpulan data statistik disebut Ukuran Statistik. Ukuran Statistik ini adalah sebuah bilangan yang mendeskripsikan gejala spesifik mengenai keadaan data yang sedang diteliti.
Parameter dan Statistik (“Parameter” dan “Statistic”) Ukuran Statistik yang diperoleh dari sebuah populasi disebut Parameter, Statistik adalah ukuran statistik yang diperoleh dari sebuah sampel.
Statistika (“Statistics”) “STATISTCS IS A BODY OF METHODS AND THEORY APLLIED TO NUMERIC AL EVIDENCE IN MAKING DECISIONS IN THE FACE OF UNCERTAINTY” (Lapin, 1973). Untuk bisa menggunakan statistika, kita harus mengubah semua bentuk fakta (data) empirik ke dalam bentuk numerik. Proses pengubahannya dilakukan melalui Teknik Pensekalaan (“Scaling Techniques”) dan pada saat mengambil keputusan dihadapkan pada kondisi ketidakpastian
Metode Statistika Bagaimana caranya mengumpulkan data Bagaimana caranya meringkaskan, mengolah dan menyajikan data. Bagaimana caranya melakukan analisis terhadap sekumpulan data Bagaimana caranya mengambil kesimpulan dan menyarankan keputusan Bagaimana menentukan besarnya risiko kekeliruan yang mungkin terjadi
UKURAN TENDENSI SENTRAL MEAN (RATA-RATA HITUNG) MEDIAN (RATA-RATA LETAK) Urutkan data dari yang terkecil sampai dengan yang terbesar. Cari data yang terletak paling ditengah (jika n gasal) Cari dua data yang terletak paling ditengah, kemudian jumlahkan dan dibagi dua. MODUS Modus merupakan nilai pengamatan yang paling banyak muncul
QUARTIL Jika sederetan data dibagi ke dalam empat bagian yang sama, kita peroleh nilai-nilai kuartil. DESIL Jika sederetan dara dibagi ke dalam sepuluh bagian yang sama, kita peroleh nilai-nilai desil
Untuk data yang sudah terkelompok 1. MEAN M = Nilai salah satu Xi yang dipilih sembarang (biasanya pilih pada kelas yang ditengah) C = Interval kelas
MEDIAN B = batas bawah kelas median C = interval kelas j = frek, kumulatif sebelum kelas median fMe = frekuensi kelas dimana median berada
MODUS B = batas bawah kelas modus b1 = selisih frekuensi kelas modus dengan frekuensi kelas sebelumnya. b2 = selisih frekuensi kelas modus dengan frekuensi kelas sesudahnya
Geometric Mean (Gm) digunakan untuk mengukur pertumbuhan X1 = pertumbuhan pertama X2 = pertumbuhan kedua Xn = pertumbuhan ke-n
RATA-RATA TERTIMBANG (Weighted Average + W.A) dengan Wi sebagai penimbang
UKURAN DISPERSI Range = Xn – Xi Deviasi Quartil Deviasi Rata-rata Deviasi Standar
Deviasi Standar Untuk data yang sudah terkelompok ke dalam distribusi frekuensi. Jika distribusi normal Sebanyak 68% dari semua hasil observasi berada pada 1 dari mean Sebanyak 90% dari semua hasil observasi berada pada 1,65 dari mean Sebanyak 95% dari semua hasil observasi berada pada 2 dari mean Sebanyak 99% dari semua hasil observasi berada pada 3 dari mean
KOEFISIEN VARIASI Variance = S2 Jika kita memiliki dua kelompok data misal X dan Y yang berpasangan, Covariance X terhadap Y
DISTRIBUSI FREKUENSI
Pengertian Salah satu fungsi dari statistik deskriptif adalah menyajikan data dengan baik dan sederhana sehingga dapat memberikan gambaran tentang keadaan yang akan disampaikan pada siapapun yang berkepentingan dengan data tersebut.
Contoh TABEL 3.1 Distribusi Frekuensi Tinggi Badan 100 Mahasiswa Kesehatan Masyarakat UIEU Tinggi Badan Frekuensi 151 – 153 154 – 156 157 – 159 160 – 162 163 – 165 166 – 168 169 – 171 172 - 174 3 7 12 18 27 17 11 5 Sumber : Data buatan
Dari sebuah distribusi frekuensi/tabel frekuensi terdapat beberapa bagian-bagian sebagai berikut : 1). Kelas-kelas (class) Merupakan kelompok nilai data atau varibel. Pada tabel 3.1 terdapat 8 kelas yaitu pada kelas pertama adalah 151 – 153, 154 – 156 adalah kelas ke dua, dst. 2). Batas kelas (class limits) Batas kelas adalah nilai-nilai yang membatasi kelas yang satu dengan kelas yang lain.
Tepi bawah kelas atau batas kelas bawah nyata. Terdapat dua batas kelas, yaitu : Batas kelas bawah (lower class limits), terdapat dideretan sebelah kiri setiap kelas. Pada tabel 3.1 maka batas kelas bawah adalah 151 untuk kelas pertama. Batas kelas atas (upper class limits), terdapat diseretan sebelah kanan setiap kelas. Pada tabel 3.1 maka batas kelas atas adalah 153 untuk kelas pertama. Tepi kelas (class boundary/real limits/true class limit) Terdapat dua tepi kelas, yaitu : Tepi bawah kelas atau batas kelas bawah nyata. Tepi atas kelas atau batas kelas atas nyata.
Kelas atas nyata pada kelas pertama = Batas atas kelas pertama + batas bawah kelas kedua 2 Rata-rata kelas (Class marks/Class mid point) Rata-rata kelas adalah nilai tengah pada tiap- tiap kelas pada suatu kelas.
Langkah selanjutnya adalah menetukan banyaknya kelas dengan menggunakan rumus Sturgess, yaitu k = 1 + 3,322 log n, dimana k adalah jumlah kelas. Tentukan lebar kelas dari distribusi data yang akan dibuat yaitu dengan menggunakan rumus : r J = , dimana j adalah lebar kelas k
Penentuan lebar kelas dengan metode ini hanya bersifat prediksi saja, biasanya lebar kelas diusahakan dalam bilangan asli.
Contoh : Dari hasil suatu pengumpulan data tentang gaji yang diperoleh mahasiswa STIE IBMI dalam jangka waktu sebulan (dalam jutaan rupiah) 23 60 79 32 57 74 52 70 82 36 80 77 81 95 41 65 92 85 55 76 10 64 75 78 25 98 67 71 83 54 72 88 62 43 89 84 48 90 15 34 17 69 63 61
Langkah 1 : Tentukan nilai jangkauan (r) = data terbesar-data terkecil penyelesaian Langkah 1 : Tentukan nilai jangkauan (r) = data terbesar-data terkecil Langkah 2 : Banyaknya kelas (k) adalah k = 1 + 3,3 log n Langkah 4 : Tentukan lebar kelas (j) adalah J = r/k
23 60 79 32 57 74 52 70 82 36 80 77 81 95 41 65 92 85 55 76 10 64 75 78 25 98 67 71 83 54 72 88 62 43 89 84 48 90 15 34 17 69 63 61
Ukuran letak Kuartil Nki = LB + (i.n/4)-cf/Fk . i Letak kuartil K1 = (1.n)/4 Desil Ndi = LB + (i.n/10)-Cf/Fk.i Persentil Npi = LB + (i.n/10)-Cf/Fk.i
Karakteristik dan Satuan Pengamatan Dalam penelitian, ciri yang kita teliti disebut karakteristik, sedangkan obyek yang karakteristiknya kita teliti disebut Satuan Pengamatan
Peranan Statistika dalam Ekonomi DATA : ukuran suatu nilai Data bentuk jamak (plural) Datum bentuk tunggal (singular) Informasi : data yang telah diproses Dalam banyak pengambilan keputusan dalam bidang bisnis, manajemen dan ekonomi, statistik (data) atau statistika (metode) berperan sangat penting seperti :…
Jenis-jenis data : Berdasarkan sumber-nya data dibedakan menjadi : Data primer : data yg didapatkan atau dikumpulkan sendiri, misal dgn melakukan wawancara, observasi atau penelitian lapangan/laboratorium Data sekunder : data yg didapat dari pihak lain, misal dari data providers seperti : BPS, LIPI, SRI dll
Berdasarkan jenisnya data dibedakan menjadi : Data Numerik (kuantitatif) → dinyatakan dalam besaran numerik (angka), Misalnya : Data pendapatan per kapita, pengeluaran, harga, jarak, dll. Data Kategorik (Kualitatif) → diklasifikasikan berdasarkan kategori/kelas tertentu Misalnya : Kategori Mahasiswa Berprestasi dan Tidak Berprestasi, Kategori kota kecil, sedang dan besar, Kategori pendukung partai politik XXX, YYY, ZZZ, dll.
Fungsi teknik statistik Teknik statistik mampu melakukan tiga tugas penting dalam ilmu pengetahuan, yaitu menerangkan gejala, meramalkan kejadian dan mengontrol keadaan. Statistik deskriptif merupakan bagian statistik yang memikul tugas untuk menerangkan suau gejala. Statistik inferensia merupakan bagian laindari statistik yang membuat ramalan dan mengontrol kejadian.
SKALA PENGUKURAN Empat tingkat Skala/Pengukuran berikut karakteristiknya: (a) Nominal : Tidak ada urutan, urutan tidak menunjukkan tingkatan (rangking) Tidak ada titik awal Tidak ada perbedaan Misalnya : Apa warna favorit anda : 1. Ungu 2. Abu-abu 3. Coklat 4. Putih (B) Ordinal : Ada urutan. urutan menunjukkan tingkatan (rangking) Tidak ada titik awal Tidak ada perbedaan
Misalnya : Bagaimana prestasi belajar anda semester lalu? 1. Sangat Baik 2. Baik 3. Sedang-sedang saja 4. Buruk 5. Sangat Buruk Skala Nominal dan Ordinal digunakan berkaitan dengan data kategorik/kualitatif.
Contoh pertanyaan yang jawabannya berbentuk kata atau kalimat adalah: 1. Berbelanja di toko ini lebih sering lebih baik, supaya dapat harga diskon untuk produk- produk tertentu : [ ] sangat setuju[ ] setuju [ ] netral [ ] tidak setuju [ ] sangat tidak setuju 2. Sebutkan gerai ritel modern yang sering anda kunjungi: ................... 3. Sebutkan alasan kenapa anda memilih gerai tersebut (jawaban no.2): .......................................................... .....................................................
Skala ordinal dan nominal Pertanyaan di atas mempunyai jawaban dalam bentuk kata atau kalimat, meskipun pernyataan nomor satu sudah menyediakan pilihan jawaban. Jawaban untuk ketiga pertanyaan tersebut harus dikodekan terlebih dahulu. Pengkodean jawaban pada nomor 1 harus mengikuti skala ordinal, sedangkan nomor 2 dan 3 mengikuti skala nominal.
Skala interval dan ratio (c) Interval: Ada Urutan Ada Perbedaan Tidak ada titik awal Misalnya: • Temperatur atau suhu : 0°C bukan berarti tidak mempunyai suhu. • Tangga Nada • IQ (d) Rasio : Ada Urutan Ada Perbedaan Ada titik awal • Pendapatan (Rp. 135 245,23 per bulan): Pendapatan Rp. 0 berarti tidak ada (bandingkan dengan 0°C pada suhu) Skala Interval dan Rasio digunakan berkaitan dengan data numerik/kuantitatif.
Variabel (Variable) Karakteristik yang keadaannya berubah-ubah (berbeda-beda) seperti ini, dalam istilah keilmuan disebut Variabel. Variabel adalah karakteristik. a. Yang dapat diklasifikasikan ke dalam sekurang- kurangnya dua buah klasifikasi (kategori) yang berbeda, atau, b. Yang dapat memberikan sekurang-kurangnya dua hasil pengukuran dan penghitungan yang nilai numeriknya berbeda.
Contoh Gender diklasifikasikan ke dalam dua klasifikasi : laki-laki atau perempuan. Pekerjaan diklasifikasikan ke dalam lebih dari dua kategori : Pegawai Negeri Sipil, Petani, Pedagang, dan sebagainya. Tinggi Badan memberikan banyak kemungkinan nilai numerik hasil pengukuran : 160 cm, 185 cm, dan seterusnya.
Notasi Variabel Dalam kajian Statistika, variabel diberi lambang X, Y, Z, atau huruf besar lainnya, sedangkan nilai pengukuran/penghitungan variabel ditulis dalam huruf yang sama tetapi menggunakan huruf kecil. Contoh : X = tinggi badan X = X1, X1 melambangkan hasil pengukuran tinggi badan untuk satuan pengamatan yang pertama.
Data adalah fakta, baik dalam bentuk kualitatif maupun kuantitatif. Fakta kualitatif diperoleh melalui pengamatan, sedangkan fakta kuantitatif diperoleh atas dasar pengukuran
Pengukuran adalah proses kuantifikasi. Dalam proses ini kita berusaha mencantumkan bilangan (nilai numerik) kepada suatu sistem materi, berdasarkan hukum (aturan) tertentu, dengan tujuan menggambarkan sifat-sifat yang dimiliki oleh sistem materi tersebut. terdapat bilangan yang menggambarkan sifat-sifat materi yang diukur interprestasi terhadap bilangan yang tercantum pada materi itu ditentukan oleh hukum (aturan) yang dipakai pada saat mencantumkan bilangan
Tingkat Pengukuran (Skala Pengukuran) Tingkat Pengukuran Nominal Tingkat Pengukuran Ordinal Tingkat Pengukuran Interval Tingkat Pengukuran Rasio
Pengukuran Statistik (“Statistical Measurement”) syaratnya : Pengukuran dilakukan berulang-ulang terhadap sebuah satuan pengamatan, mengenai sebuah atau beberapa variabel, atau Pengukuran dilakukan sekali terhadap beberapa satuan pengamatan, mengenai sebuah atau beberapa variabel, atau Pengukuran dilakukan berulang-ulang terhadap beberapa satuan pengamatan, mengenai satu atau beberapa variabel
Data Statistik atau Statistik (“Statistical Data” atau “Statistic”). adalah data hasil pengukuran/ pengamatan statistis, yang menunjukkan gejala tertentu dari variabel yang diteliti. Data Statistik atau statistik, biasa disusun secara sistematik dalam tabel atau grafik.
Tipe Variabel Variabel Kualitatif Bentuknya klasifikasi (kategori). Jika kategorinya tidak menunjukkan peringkat disebut Variabel Nominal, jika mengisyaratkan peringkat disebut Variabel Ordinal. Variabel Kuantitatif Apabila nilai numeriknya selalu bilangan bulat dan tidak mungkin bilangan pecahan (desimal) disebut Variabel Kuantitatif Diskrit Jika nilai numeriknya mungkin bilangan bulat mungkin pula pecahan (desimal) disebut Variabel Kuantitatif Kontinu
Tipe Variabel menurut Tingkat Pengukurannya Variabel Nominal Variabel Ordinal Variabel Interval Variabel Rasio
Tipe Variabel menurut Hubungannya Variabel Bebas (“Independent Variable”) dan Variabel Tak bebas (“Dependent Variable”) Bayangkan bahwa X dan Y merupakan dua buah variabel yang saling berhubungan. Jika dalam hubungan tersebut keadaan X bisa “menerangkan” keadaan Y, maka X disebut Variabel Bebas dan Y disebut Variabel Tak bebas
Populasi (“Population”/”Universe”), Sampling dan Sampel (“Sample”) Populasi adalah keseluruhan obyek yang berdasarkan suatu batasan, memiliki kesamaan ciri tertentu Sampling adalah memilih beberapa obyek dari sekumpulan obyek tertentu. Obyek yang terkumpul karena proses sampling disebut Sampel (“Sample”)
Ilustrasi Populasi, Sampel, dan Sampling Sampel (n=3) Populasi (N=43)
Ukuran Statistik (“Statistical Measures”) Bilangan yang diperoleh melalui manipulasi tertentu terhadap sekumpulan data statistik disebut Ukuran Statistik. Ukuran Statistik ini adalah sebuah bilangan yang mendeskripsikan gejala spesifik mengenai keadaan data yang sedang diteliti.
Parameter dan Statistik (“Parameter” dan “Statistic”) Ukuran Statistik yang diperoleh dari sebuah populasi disebut Parameter, Statistik adalah ukuran statistik yang diperoleh dari sebuah sampel.
Statistika (“Statistics”) “STATISTCS IS A BODY OF METHODS AND THEORY APLLIED TO NUMERIC AL EVIDENCE IN MAKING DECISIONS IN THE FACE OF UNCERTAINTY” (Lapin, 1973). Untuk bisa menggunakan statistika, kita harus mengubah semua bentuk fakta (data) empirik ke dalam bentuk numerik. Proses pengubahannya dilakukan melalui Teknik Pensekalaan (“Scaling Techniques”) dan pada saat mengambil keputusan dihadapkan pada kondisi ketidakpastian
Metode Statistika Bagaimana caranya mengumpulkan data Bagaimana caranya meringkaskan, mengolah dan menyajikan data. Bagaimana caranya melakukan analisis terhadap sekumpulan data Bagaimana caranya mengambil kesimpulan dan menyarankan keputusan Bagaimana menentukan besarnya risiko kekeliruan yang mungkin terjadi
UKURAN TENDENSI SENTRAL MEAN (RATA-RATA HITUNG) MEDIAN (RATA-RATA LETAK) Urutkan data dari yang terkecil sampai dengan yang terbesar. Cari data yang terletak paling ditengah (jika n gasal) Cari dua data yang terletak paling ditengah, kemudian jumlahkan dan dibagi dua. MODUS Modus merupakan nilai pengamatan yang paling banyak muncul
QUARTIL Jika sederetan data dibagi ke dalam empat bagian yang sama, kita peroleh nilai-nilai kuartil. DESIL Jika sederetan dara dibagi ke dalam sepuluh bagian yang sama, kita peroleh nilai-nilai desil
Untuk data yang sudah terkelompok 1. MEAN M = Nilai salah satu Xi yang dipilih sembarang (biasanya pilih pada kelas yang ditengah) C = Interval kelas
MEDIAN B = batas bawah kelas median C = interval kelas j = frek, kumulatif sebelum kelas median fMe = frekuensi kelas dimana median berada
MODUS B = batas bawah kelas modus b1 = selisih frekuensi kelas modus dengan frekuensi kelas sebelumnya. b2 = selisih frekuensi kelas modus dengan frekuensi kelas sesudahnya
Geometric Mean (Gm) digunakan untuk mengukur pertumbuhan X1 = pertumbuhan pertama X2 = pertumbuhan kedua Xn = pertumbuhan ke-n
RATA-RATA TERTIMBANG (Weighted Average + W.A) dengan Wi sebagai penimbang
UKURAN DISPERSI Range = Xn – Xi Deviasi Quartil Deviasi Rata-rata Deviasi Standar
Deviasi Standar Untuk data yang sudah terkelompok ke dalam distribusi frekuensi. Jika distribusi normal Sebanyak 68% dari semua hasil observasi berada pada 1 dari mean Sebanyak 90% dari semua hasil observasi berada pada 1,65 dari mean Sebanyak 95% dari semua hasil observasi berada pada 2 dari mean Sebanyak 99% dari semua hasil observasi berada pada 3 dari mean
KOEFISIEN VARIASI Variance = S2 Jika kita memiliki dua kelompok data misal X dan Y yang berpasangan, Covariance X terhadap Y
DISTRIBUSI FREKUENSI
Pengertian Salah satu fungsi dari statistik deskriptif adalah menyajikan data dengan baik dan sederhana sehingga dapat memberikan gambaran tentang keadaan yang akan disampaikan pada siapapun yang berkepentingan dengan data tersebut.
Contoh TABEL 3.1 Distribusi Frekuensi Tinggi Badan 100 Mahasiswa Kesehatan Masyarakat UIEU Tinggi Badan Frekuensi 151 – 153 154 – 156 157 – 159 160 – 162 163 – 165 166 – 168 169 – 171 172 - 174 3 7 12 18 27 17 11 5 Sumber : Data buatan
Dari sebuah distribusi frekuensi/tabel frekuensi terdapat beberapa bagian-bagian sebagai berikut : 1). Kelas-kelas (class) Merupakan kelompok nilai data atau varibel. Pada tabel 3.1 terdapat 8 kelas yaitu pada kelas pertama adalah 151 – 153, 154 – 156 adalah kelas ke dua, dst. 2). Batas kelas (class limits) Batas kelas adalah nilai-nilai yang membatasi kelas yang satu dengan kelas yang lain.
Tepi bawah kelas atau batas kelas bawah nyata. Terdapat dua batas kelas, yaitu : Batas kelas bawah (lower class limits), terdapat dideretan sebelah kiri setiap kelas. Pada tabel 3.1 maka batas kelas bawah adalah 151 untuk kelas pertama. Batas kelas atas (upper class limits), terdapat diseretan sebelah kanan setiap kelas. Pada tabel 3.1 maka batas kelas atas adalah 153 untuk kelas pertama. Tepi kelas (class boundary/real limits/true class limit) Terdapat dua tepi kelas, yaitu : Tepi bawah kelas atau batas kelas bawah nyata. Tepi atas kelas atau batas kelas atas nyata.
Kelas atas nyata pada kelas pertama = Batas atas kelas pertama + batas bawah kelas kedua 2 Rata-rata kelas (Class marks/Class mid point) Rata-rata kelas adalah nilai tengah pada tiap- tiap kelas pada suatu kelas.
Langkah selanjutnya adalah menetukan banyaknya kelas dengan menggunakan rumus Sturgess, yaitu k = 1 + 3,322 log n, dimana k adalah jumlah kelas. Tentukan lebar kelas dari distribusi data yang akan dibuat yaitu dengan menggunakan rumus : r J = , dimana j adalah lebar kelas k
Penentuan lebar kelas dengan metode ini hanya bersifat prediksi saja, biasanya lebar kelas diusahakan dalam bilangan asli.
Contoh : Dari hasil suatu pengumpulan data tentang gaji yang diperoleh mahasiswa STIE IBMI dalam jangka waktu sebulan (dalam jutaan rupiah) 23 60 79 32 57 74 52 70 82 36 80 77 81 95 41 65 92 85 55 76 10 64 75 78 25 98 67 71 83 54 72 88 62 43 89 84 48 90 15 34 17 69 63 61
Langkah 1 : Tentukan nilai jangkauan (r) = data terbesar-data terkecil penyelesaian Langkah 1 : Tentukan nilai jangkauan (r) = data terbesar-data terkecil Langkah 2 : Banyaknya kelas (k) adalah k = 1 + 3,3 log n Langkah 4 : Tentukan lebar kelas (j) adalah J = r/k
23 60 79 32 57 74 52 70 82 36 80 77 81 95 41 65 92 85 55 76 10 64 75 78 25 98 67 71 83 54 72 88 62 43 89 84 48 90 15 34 17 69 63 61
Ukuran letak Kuartil Nki = LB + (i.n/4)-cf/Fk . i Letak kuartil K1 = (1.n)/4 Desil Ndi = LB + (i.n/10)-Cf/Fk.i Persentil Npi = LB + (i.n/10)-Cf/Fk.i
Karakteristik dan Satuan Pengamatan Dalam penelitian, ciri yang kita teliti disebut karakteristik, sedangkan obyek yang karakteristiknya kita teliti disebut Satuan Pengamatan
Variabel (Variable) Karakteristik yang keadaannya berubah-ubah (berbeda-beda) seperti ini, dalam istilah keilmuan disebut Variabel. Variabel adalah karakteristik. a. Yang dapat diklasifikasikan ke dalam sekurang- kurangnya dua buah klasifikasi (kategori) yang berbeda, atau, b. Yang dapat memberikan sekurang-kurangnya dua hasil pengukuran dan penghitungan yang nilai numeriknya berbeda.
Contoh Gender diklasifikasikan ke dalam dua klasifikasi : laki-laki atau perempuan. Pekerjaan diklasifikasikan ke dalam lebih dari dua kategori : Pegawai Negeri Sipil, Petani, Pedagang, dan sebagainya. Tinggi Badan memberikan banyak kemungkinan nilai numerik hasil pengukuran : 160 cm, 185 cm, dan seterusnya.
Notasi Variabel Dalam kajian Statistika, variabel diberi lambang X, Y, Z, atau huruf besar lainnya, sedangkan nilai pengukuran/penghitungan variabel ditulis dalam huruf yang sama tetapi menggunakan huruf kecil. Contoh : X = tinggi badan X = X1, X1 melambangkan hasil pengukuran tinggi badan untuk satuan pengamatan yang pertama.
Data adalah fakta, baik dalam bentuk kualitatif maupun kuantitatif. Fakta kualitatif diperoleh melalui pengamatan, sedangkan fakta kuantitatif diperoleh atas dasar pengukuran
Pengukuran adalah proses kuantifikasi. Dalam proses ini kita berusaha mencantumkan bilangan (nilai numerik) kepada suatu sistem materi, berdasarkan hukum (aturan) tertentu, dengan tujuan menggambarkan sifat-sifat yang dimiliki oleh sistem materi tersebut. terdapat bilangan yang menggambarkan sifat-sifat materi yang diukur interprestasi terhadap bilangan yang tercantum pada materi itu ditentukan oleh hukum (aturan) yang dipakai pada saat mencantumkan bilangan
Tingkat Pengukuran (Skala Pengukuran) Tingkat Pengukuran Nominal Tingkat Pengukuran Ordinal Tingkat Pengukuran Interval Tingkat Pengukuran Rasio
Pengukuran Statistik (“Statistical Measurement”) syaratnya : Pengukuran dilakukan berulang-ulang terhadap sebuah satuan pengamatan, mengenai sebuah atau beberapa variabel, atau Pengukuran dilakukan sekali terhadap beberapa satuan pengamatan, mengenai sebuah atau beberapa variabel, atau Pengukuran dilakukan berulang-ulang terhadap beberapa satuan pengamatan, mengenai satu atau beberapa variabel
Data Statistik atau Statistik (“Statistical Data” atau “Statistic”). adalah data hasil pengukuran/ pengamatan statistis, yang menunjukkan gejala tertentu dari variabel yang diteliti. Data Statistik atau statistik, biasa disusun secara sistematik dalam tabel atau grafik.
Tipe Variabel Variabel Kualitatif Bentuknya klasifikasi (kategori). Jika kategorinya tidak menunjukkan peringkat disebut Variabel Nominal, jika mengisyaratkan peringkat disebut Variabel Ordinal. Variabel Kuantitatif Apabila nilai numeriknya selalu bilangan bulat dan tidak mungkin bilangan pecahan (desimal) disebut Variabel Kuantitatif Diskrit Jika nilai numeriknya mungkin bilangan bulat mungkin pula pecahan (desimal) disebut Variabel Kuantitatif Kontinu
Tipe Variabel menurut Tingkat Pengukurannya Variabel Nominal Variabel Ordinal Variabel Interval Variabel Rasio
Tipe Variabel menurut Hubungannya Variabel Bebas (“Independent Variable”) dan Variabel Tak bebas (“Dependent Variable”) Bayangkan bahwa X dan Y merupakan dua buah variabel yang saling berhubungan. Jika dalam hubungan tersebut keadaan X bisa “menerangkan” keadaan Y, maka X disebut Variabel Bebas dan Y disebut Variabel Tak bebas
Populasi (“Population”/”Universe”), Sampling dan Sampel (“Sample”) Populasi adalah keseluruhan obyek yang berdasarkan suatu batasan, memiliki kesamaan ciri tertentu Sampling adalah memilih beberapa obyek dari sekumpulan obyek tertentu. Obyek yang terkumpul karena proses sampling disebut Sampel (“Sample”)
Ilustrasi Populasi, Sampel, dan Sampling Sampel (n=3) Populasi (N=43)
Ukuran Statistik (“Statistical Measures”) Bilangan yang diperoleh melalui manipulasi tertentu terhadap sekumpulan data statistik disebut Ukuran Statistik. Ukuran Statistik ini adalah sebuah bilangan yang mendeskripsikan gejala spesifik mengenai keadaan data yang sedang diteliti.
Parameter dan Statistik (“Parameter” dan “Statistic”) Ukuran Statistik yang diperoleh dari sebuah populasi disebut Parameter, Statistik adalah ukuran statistik yang diperoleh dari sebuah sampel.
Statistika (“Statistics”) “STATISTCS IS A BODY OF METHODS AND THEORY APLLIED TO NUMERIC AL EVIDENCE IN MAKING DECISIONS IN THE FACE OF UNCERTAINTY” (Lapin, 1973). Untuk bisa menggunakan statistika, kita harus mengubah semua bentuk fakta (data) empirik ke dalam bentuk numerik. Proses pengubahannya dilakukan melalui Teknik Pensekalaan (“Scaling Techniques”) dan pada saat mengambil keputusan dihadapkan pada kondisi ketidakpastian
Metode Statistika Bagaimana caranya mengumpulkan data Bagaimana caranya meringkaskan, mengolah dan menyajikan data. Bagaimana caranya melakukan analisis terhadap sekumpulan data Bagaimana caranya mengambil kesimpulan dan menyarankan keputusan Bagaimana menentukan besarnya risiko kekeliruan yang mungkin terjadi
UKURAN TENDENSI SENTRAL MEAN (RATA-RATA HITUNG) MEDIAN (RATA-RATA LETAK) Urutkan data dari yang terkecil sampai dengan yang terbesar. Cari data yang terletak paling ditengah (jika n gasal) Cari dua data yang terletak paling ditengah, kemudian jumlahkan dan dibagi dua. MODUS Modus merupakan nilai pengamatan yang paling banyak muncul
QUARTIL Jika sederetan data dibagi ke dalam empat bagian yang sama, kita peroleh nilai-nilai kuartil. DESIL Jika sederetan dara dibagi ke dalam sepuluh bagian yang sama, kita peroleh nilai-nilai desil
Untuk data yang sudah terkelompok 1. MEAN M = Nilai salah satu Xi yang dipilih sembarang (biasanya pilih pada kelas yang ditengah) C = Interval kelas
MEDIAN B = batas bawah kelas median C = interval kelas j = frek, kumulatif sebelum kelas median fMe = frekuensi kelas dimana median berada
MODUS B = batas bawah kelas modus b1 = selisih frekuensi kelas modus dengan frekuensi kelas sebelumnya. b2 = selisih frekuensi kelas modus dengan frekuensi kelas sesudahnya
Geometric Mean (Gm) digunakan untuk mengukur pertumbuhan X1 = pertumbuhan pertama X2 = pertumbuhan kedua Xn = pertumbuhan ke-n
RATA-RATA TERTIMBANG (Weighted Average + W.A) dengan Wi sebagai penimbang
UKURAN DISPERSI Range = Xn – Xi Deviasi Quartil Deviasi Rata-rata Deviasi Standar
Deviasi Standar Untuk data yang sudah terkelompok ke dalam distribusi frekuensi. Jika distribusi normal Sebanyak 68% dari semua hasil observasi berada pada 1 dari mean Sebanyak 90% dari semua hasil observasi berada pada 1,65 dari mean Sebanyak 95% dari semua hasil observasi berada pada 2 dari mean Sebanyak 99% dari semua hasil observasi berada pada 3 dari mean
KOEFISIEN VARIASI Variance = S2 Jika kita memiliki dua kelompok data misal X dan Y yang berpasangan, Covariance X terhadap Y
Pendahuluan
Pendahuluan
Pendahuluan
Pendahuluan
Pendahuluan
Sasaran : Siswa memahami analisis time series Materi Sub Pertemuan Analisis eksplorasi data Ukuran-ukuran summari data numerik Eksplorasi data dengan grafis, Eksplorasi data berpasangan, Eksplorasi data berdimensi lebih dari dua 1-2 Clustering Cara pengelompokan Aplikasi clustering untuk ZOM 3 Uji Hipotesis Significant level, Metoda uji hipotesis 4-6 Analsis Time Series Moving average, Fungsi autokorelasi dan auto korelasi parsial, Auto regresi, Analisis trend, Analisis harmonik 8-10 Forecasting Regresi linier sederhana, Regresi linier berganda, Autoregressive Forecasting (AR), Autoregressive Moving Average (ARMA), Autoregressive Integrated Moving Average (ARIMA), 11-14
1. UKURAN-UKURAN SUMMARY DATA NUMERIK Latar Belakang Robustness and Resistance Quantile Ukuran summary Lokasi (pemusatan) Penyebaran Simetris
1.1. Robustness and Resistance Sifat-sifat yang penting dalam metode Exploratory Data Analysis (EDA) adalah robust (ketegaran) dan resistant (tahan). Robustness dan resistance adalah dua aspek ketidaksensitifitasan terhadap data. Metoda robust tidak perlu harus optimal dalam beberapa hal, namun mempunyai performa yang baik dalam hal yang lain. Misalkan statistik rata-2 sampel x-rata = xi / n adalah statistik yang terbaik untuk mengukur pemusatan data, jika diketahui bahwa data tersebut mengikuti distribusi Gauss. Namun jika data tersebut tidak mengikuti distribusi Gauss (misal : jika ada data ekstrim kejadian hujan), maka rata-rata sampel akan memperoleh nilai yang misleading. Sebaliknya, metoda-metoda robust secara umum tidak sensitif terhadap asumsi tentang data secara keseluruhan. Metoda resisten adalah dipengaruhi oleh sejumlah kecil “outlier” atau “data aneh”. Hasil dari metoda resistant hanya sedikit berubah jika sebagian kecil data diubah nilainya, meskipun perubahan itu secara drastis. Rata-rata sampel tidak mempunyai sifat resistant terhadap ukuran pemusatan data.
1.1. Robustness and Resistance Misalkan data {11, 12, 13, 14, 15, 16, 17, 18 ,19). Rata-rata sampelnya adalah 15. Namun jika datanya diubah menjadi {11, 12, 13, 14, 15, 16, 17, 18 ,91), maka rata-ratanya menjadi 23. Ukuran- ukuran yang resistant dari pemusatan sekumpulan data hanya sedikit berubah atau bahkan tidak berubah sama sekali dengan mengganti angka 19 menjadi 91. Median resistant terhadap nilai ekstrim Rata-2 tidak resistant terhadap nilai ekstrim
1.2. QUANTILE Quantile qp (0<p<1) qp = q0,5 = median q0,25, q0,5, q0,75 quartile q0,1, q0,2,…….q0,9 deciles q0,01, q0,02, q0,03……,q0,99 percentile
1.2. QUANTILE q0,5 = median = x([n+1]/2) …………... n ganjil = {x(n/2) + x([n/2]+1)}/2 … n genap Contoh : Jika terdapat 9 data (n=9), nilai median adalah q0,5 = x(5). Quartil bawah adalah q0,25 = x(3), quartil atas adalah q0,75 = x(7)
1.3. Ukuran Pemusatan Ukuran pemusatan yang robust dan resistant adalah ukuran median Trimean = (q0,25+2q0,5+q0,75)/4 (Rata-rata tertimbang dari median dan quartil. Trimean merupakan ukuran resistant)
1.4. Ukuran penyebaran (spread) Ukuran penyebaran (spread atau dispersion atau scale) yang umum, sederhana, robust dan resistant adalah interquartile range (jarak antar kuartil) IQR. IQR = q0,75 – q0,25 Ukuran penyebaran yang konvensional : standard deviation Koefisien Variasi : KV = (simpangan baku/rata)*100% Median Absolute Deviation (MAD) MAD = median|xi – q0,5|
1.5. Kesimetrisan Skewness coefficient (koefisien kemiringan) [ 1/(n-1 ] (xi – xrata)3 b1 = ---------------------------- s3
1.5. Kesimetrisan Kurtosis coefficient (koefisien keruncingan) [ 1/(n-1 ] (xi – xrata)4 b2 = ---------------------------- s4
2. Eksplorasi data dengan grafis Stem and Leaf Display Boxplots Schematic plot Histogram Distribusi Frekuensi Kumulatif
2.1. Eksplorasi data dengan grafis Stem and Leaf Display (diagram dahan daun) 2 19 02 8 20 224688 (10) 21 2244666668 13 22 00022224466 2 23 22
2.2. Eksplorasi data dengan grafis Boxplot (Box and Whiskers Plot) maksimum Whiskers Q1 Q2 BOX Q3 Whiskers minimum
2.3. Eksplorasi data dengan grafis Schematic plot Upper outer fence = q0,75 + 3 IQR Upper inner fence = q0,75 + 3 IQR/2 Lower inner fence = q0,25 - 3 IQR/2 Lower outer fence = q0,25 - 3 IQR
2.3. Eksplorasi data dengan grafis (schematic plot)
2.4. Eksplorasi data dengan grafis Histogram
2.5. Eksplorasi data dengan grafis Distribusi Frekuensi Kumulatif
2.5. Eksplorasi data dengan grafis Distribusi Frekuensi Kumulatif
Tugas mandiri / PR : Data : Hujan dan suhu Sta Tanjung Priok dan Pondok Betung Lakukan eksplorasi data sbb : Summary data (pemusatan, penyebaran dan kesimetrisan) Eksplorasi data dengan grafis Berikan analisis singkat AS MUCH AS POSSIBLE
PERTEMUAN KE-2 STATISTIKA II (UM1742) BAHAN KULIAH AKADEMI METEOROLOGI & GEOFISIKA SEMESTER GANJIL TA. 2009/2010 STATISTIKA II (UM1742) PERTEMUAN KE-2
3. Eksplorasi data berpasangan Scatterplots Pearson Correlation Rank Correlation Serial Correlation
3.1. Scatterplot Diagram
3.2. Pearson Correlation Analisis Korelasi : menyelidiki ada tidaknya hubungan dua peubah atau lebih Koefisien korelasi : untuk mengukur tingginya derajad hubungan Korelasi linier : hubungan peubah acak X dan Y yang membentuk garis lurus Arah hubungan eubah dapat bernilai positif atau negatif Koefisien korelasi populasi : Koefisien korelasi sampel :
X : suhu rata-rata Y : RH rata-rata rxy : - 0,53 Hubungan antara X dan Y negatif Jika X naik maka Y turun
3.3. Rank Correlation Korelasi antar peubah yang disusun berurut (rank) rrank = 1- [6 di2] / [n(n2-1)]
3.4. Serial Correlation Korelasi untuk data time series Korelasi antara data ke-t dengan data ke t-k Misal : korelasi antara curah hujan bulan berjalan dengan curah hujan sebelumnya (ryt yt-1) atau r1 (k=1 atau lag =1)
3.4. Serial Correlation (ryt yt-1) =0.37
4. Eksplorasi data berdimensi lebih dari dua Correlation Matrix Scatterplot Matrix Correlation Map
4.1. Correlation Matrix
4.2. Scatter Plot Matrix
4.3. Correlation Map : Peta yang menggabarkan hubungan antara dua peubah
Tugas Data : Produktivitas dan Penjualan pada PT. X Lakukan eksplorasi data sbb : Summary data (pemusatan, penyebaran dan kesimetrisan) Eksplorasi data dengan grafik Eksplorasi data berpasangan (korelasi) Berikan analisis singkat AS MUCH AS POSSIBLE