Analisa Data Statistik Agoes Soehianie, Ph.D
Rencana Perkuliahan 1. Komponen Penilaian 2. Perhitungan Nilai Akhir a. Ujian Tengah Semester b. Ujian Akhir Semester c. Tugas/PR d. Quiz 2. Perhitungan Nilai Akhir NA = 40% UTS + 40% UAS + 10% PR/Tugas + 10% Quiz 3. Konversi Nilai Mengikuti aturan Fisika dasar x>= 75 Index= A 68<= x < 75 Index = AB 60<= x < 68 Index = B 55<= x < 60 Index = BC 50<= x < 55 Index = C 45<= x < 50 Index = D X < 45 Index = E Tidak ikut ujian = 0 Syarat kehadiran 80% Text Book : Walpole, R.E., Myers, R.H., Myers, S.L., Keying Ye, Probability and Statistics for Engineers and Scientiests, 8th ed., 2007, Pearson Education International Pelengkap: Lind, D.A., William G Marchal, Samuel A. Wathen, Basic Statistics for Business & Economics, McGraw Hill Int. 5th Ed.
Rencana Perkuliahan 6. Cakupan bahan a. Pendahuluan & Deskripsi Data b. Probabilitas c. Distribusi Probabilitas (Diskrit dan Kontinu) d. Metoda Sampling dan Distribusi Sample e. Estimasi dan Confidence Interval f. Testing Hipotesa (1 sample) :sample kecil dan besar g. Testing Hipotesa (2 sample) : sample kecil dan besar h. ANOVA i. Korelasi dn Regresi Linear j. Regresi Linear Jamak k. Time Series dan Forecasting (jika waktu memungkinkan) Metoda Kuliah: tatap muka (slides, software & PR/ Quiz) Softwares : SPSS dan Excell
Chap-1
Chap 1: Pendahuluan dan Deskripsi Data Arti Statistik: Ilmu pengumpulan, mengorganisasi, menganalisa, menampilkan data serta menginterpretasikan data dalam rangka membuat keputusan yg efektif. Arti lain Statistik: Angka-angka numerik yang menggambarkan sekumpulan data Misal : nilai rata-rata 89.3, GNP negara X : 3000 USD, Median penghasilan negara X adalah 5000 USD.
Teori Probabilitas dan Macam Statistik Dua macam statistik: Statistik Inferensial mengambil kesimpulan ttg populasi dari sampel Statistik Deskriptif menggambarkan sampel saja Statistik Inferensial: Populasi Sampel Teori Probabilitas dan Distribusi Populasi: Keseluruhan object atau pengukuran tertentu yang menjadi pusat perhatian. Sampel: sebagian object atau pengukuran dari sebuah populasi
Tipe Variabel
Tingkat Pengukuran
Cara Deskripsi Data Cara penyajian data : Tabel dan Grafik Tabel : Distribusi Frekuensi Istilah penting: batas kelas, limit kelas, panjang interval, titik tengah kelas, frekuensi, frekuensi relatif dan frekuensi kumulatif
Tabel Distribusi Frekuensi Dari data mentah Tabel distribusi frekuensi (apa tujuannya?) Bagaimana membuatnya? Contoh : Data mentah (Nilai ADS) Banyak data (N), sort (urutkan) Manual? (No way!) Cari Data Max, Min dan Range Max : 100 Min: 14 , Range (Jangkauan) : Max –Min = 100-14 = 86 Berapa banyak interval kelas? Berapa Lebarnya? Banyak interval kelas (contoh) pakai Aturan Sturgess : k = 1+ 3.31log(N) ( Bukan harga mati)
Tabel Distribusi Frekuensi Hal yang harus dihindari : Interval terlalu lebar Interval terlalu kecil Cara membuat Distribusi Frequency : Excell : fungsi Frequency Note: Penjelasan dan demo dengan Excell
Tabel Distribusi Frekuensi Memakai Excell untuk distribusi frekuensi: Fungsi Frequency menerima dua argumen : Range Data dan Bins Array Range Data menunjuk pada range alamat sel yg berisi data yg akan dihitung distribusinya Bins Array menunjuk pada array 1D yang menyatakan batas atas interval yang berturutan. Harus dimasukkan sebagai Rumus Array (bagaimana caranya?) Awas Bins array terakhir!
Contoh : Frequency (Excell) X <= 70 ada 1 71 < X <= 79 ada 2 79 < X <= 89 ada 4 X>89 ada 2 Catatan: FREQUENCY (DATA ARRAY, BINS ARRAY) Rumus frequency harus dimasukkan sbg array dg baris +1 dibandingkan BINS array-nya.
Penyajian Data Dalam Grafik Macam-macam grafik: Histogram Line graph Scatter diagram Pie Chart Area Graph Stem-Leaf Plot
Stem-Leaf Plot
Eksplorasi Data dan Penyajiannya Ukuran Pemusatan Rata-rata (mean) aritmetika dan rata-rata terbobot Median Modus/Mode Ukuran Penyebaran Range Quartile Semi InterQuartile Variansi Standard Deviasi
Mean Mean fj = frekuen`si Weighted Mean Wj : weight Bisa untuk data dalam Bentuk interval
Mean : Contoh Mean Data : X : 3, 4, 4, 5 , 8 , 6 Mean : Mean data berbentuk tabel distribusi
Median : Contoh Median Data : X : 3, 4, 4, 1, 5 , 8 , 6 Median : nilai tengah (yg berada di tengah) jikalau data di urut. Langkah 1: urutkan X : 1, 3,4,4,5,6,8 Langkah 2: tentukan posisi tengah Banyak data : N= 7 Median : data ke (N+1)/2 = 4. Arti : Median data X= 4 : setengah data lebih kecil dari 4, setengah lagi lebih besar dari 4. Bagaimana Mediannya jika N genap? Diambil rata-rata data yg di tengah. Contoh : X : 3, 4, 4, 5 , 6 , 8 Median : ½ (XN/2 + XN/2-1) = ½ (4+5) 4.5
Modus : Contoh Modus Data : X : 3, 4, 4, 1, 5 , 8 , 6 Modus : data yg paling sering muncul. Frekuensinya tertinggi. Dalam contoh di atas modus X = 4. Untuk data-data yg bersifat nominal/kategorikal maka seringkali yg dipakai adalah modusnya. Berdasarkan pola distribusinya, terkadang bisa dikenali bahwa modusnya lebih dari satu macam: misal bi-modal ( 2 modus)
Range, Variansi dan STD Ukuran penyebaran yang paling sederhana adalah Range (jangkauan) data yaitu : Data terbesar – Data terkecil. Variansi (populasi): Variansi (sampel): koreksi di penyebut untuk memperbaiki nilai variansi sampel sebagai penaksir variansi populasi Standard deviasi : populasi : σ = √ σ2 sampel : S = √ S2
Variansi dan STD : data mentah Contoh: Hitunglah variansi dan STD sampel berikut ini: X : 3, 4, 4, 5 , 8 , 6 Hitung dulu rata-rata sampel: Variansi (sampel): S2= 16/5 = 3.2 Standard deviasi sampel = S = √3.2= 1.79
Variansi dan STD: tabel frekuensi Contoh: Hitunglah variansi dan STD sampel berikut ini: Untuk data terdistribusi dalam bentuk tabel interval klas, maka yang dipergunakan adalah titik tengah intervalnya, dan perhitungannya mempergunakan frekuensi tiap interval sebagai weighting factornya
Quartile & Percentile Ukuran penyebaran yg lain, yang merupakan pengembangan dari Median adalah Quartile. Pada dasarnya Quartile adalah data-data yang membagi seluruh data menjadi 4 bagian yang sama banyaknya. Q3=Quatile atas Q1=Quatile bawah Q2=median X Data rendah Data tinggi Jadi Q1 adalah menyatakan batas dimana 25% data adalah lebih kecil dari Q1 Jadi Q2 adalah menyatakan batas dimana 50% data adalah lebih kecil dari Q2 Jadi Q3 adalah menyatakan batas dimana 75% data adalah lebih kecil dari Q3
Quartile & Percentile Lebih umum dari Quartile adalah Percentile, yang menyatakan batas dimana sebanyak P% data ada di bawah nilai percentile dimaksud. Lokasi (atau posisi data) untuk sampel N data yang menjadi batas percentile P adalah: Berarti L25 = Q1, L50 = Q2= median, L75 = Q3 Bilamana nilai Lp bukan bilangan bulat, maka dilakukan interpolasi linear dua dari dua data terdekat. Sebagai ukuran sebaran data terkait adalah InterQuartile (IQ) yaitu IQ = Q3- Q1
Quartile & Percentile : Contoh Lebih umum dari Quartile adalah Percentile, yang menyatakan batas dimana sebanyak P% data ada di bawah nilai percentile dimaksud. Lokasi (atau posisi data) untuk sampel N data yang menjadi batas percentile P adalah: Berarti L25 = Q1, L50 = Q2= median, L75 = Q3 Bilamana nilai Lp bukan bilangan bulat, maka dilakukan interpolasi linear dua dari dua data terdekat. Cara penaksiran median dengan metoda ini lebih baik dari cara sebelumnya yg hanya menghitung rata-rata dua data yg terdekat.
Quartile & Percentile : Contoh Contoh: N=16 data (disamping) Hitunglah Q1, Q2 dan Q3 dan SIQ Lokasi Q1,Q2 dan Q3 dihitung dari rumus LP L25: (16+1)25/100=4.25, jadi Q1 antara data ke 4 dan 5. Interpolasi:
Box Whisker Plot Salah satu kegunaan informasi Quartile adalah untuk membuat Box Whisker Plot, dimana dengan cepat kita mengetahui karakter umum penyebaran data secara visual saja. Extreme Q3 Q2 Q1 Extreme
Box Whisker Plot Ilustrasi : Box Whisker Plot dan Sketsa Distribusi Data
Macam Studi Statistik Observasi Desain Kausalitas