STATISTIKA DAN PROBABILITAS PERTEMUAN KE 1 SAFITRI JAYA, S.Kom, M.T.I SEMESTER GANJIL TA 2017/2018 UNIVERSITAS PEMBANGUNAN JAYA STATISTIKA DAN PROBABILITAS
KURIKULUM TEKNIK INFORMATIKA UPJ DISTRIBUSI MATA KULIAH SEMESTER 1 NO KODE MK NAMA MK SKS SIFAT 1 GNR101 BAHASA INDONESIA 2 MKU GNR103 BAHASA INGGRIS 3 GNR105 DASAR LOGIKA MATEMATIKA 4 INF101 ALGORITMA PEMROGRAMAN MKMA 5 INF103 PEMROGRAMAN BERORIENTASI OBJEK MKMI 6 INF105 ALJABAR LINEAR 7 INF107 STATISTIKA DAN PROBABILITAS
KONTRAK PERKULIAHAN SKS MK : 3 SKS (2 SKS TEORI + 1 SKS LATIHAN) LAMA PERKULIAHAN : 100 MENIT TEORI + 50 MENIT LATIHAN JUMLAH TM : 14 PERTEMUAN (7 SEBELUM UTS DAN 7 SETELAH UTS) PELAKSANAAN UTS : 16 – 20 OKTOBER 2017 (16 OKTOBER 2017) PELAKSANAAN UAS : 18 – 22 DESEMBER 2017 (18 DESEMBER 2017) JADWAL KULIAH : SENIN, PKL 12.50 – 15.20 WIB, R-614 TOLERANSI KETERLAMBATAN : 15 MENIT, > 15 MENIT ABSEN NIHIL SYARAT IKUT UJIAN : ABSENSI MINIMAL 70 % (4X ABSEN) PENILAIAN : 10% ABSENSI, 20% LATIHAN DI LOG BOOK, 35% UTS, 35% UAS ALAT KOMUNIKASI : SILENT/MODE GETAR SELAMA PERKULIAHAN BERLANGSUNG KEWAJIBAN ALAT BM : LOG BOOK, BUKU AJAR (PERKELOMPOK, STATISTIKA PROBABILITAS, SUDARYONO, ILMU STATISTIKA ACHMAD ZANBAR SOLEH) EMAIL : SAFITRI.JAYA@UPJ.AC.ID
Materi perkuliahan STATISTIKA DESKRIPTIF PENDUGAAN PARAMETER PELUANG ANALISIS VARIANSI SATU PIHAK (ONE WAY) DISTRIBUSI PROBABILITAS DISKRET HUBUNGAN STATISTIKA DUA PEUBAH STATISTIKA INFERENSI PENGUJIAN HIPOTESIS REGRESI LINEAR SEDERHANA DISTRIBUSI SAMPLING
STATISTIKA DESKRIPTIF Statistika merupakan suatu cabang ilmu pengetahuan yang bertujuan untuk mempelajari tata cara pengumpulan data (sampling), pengolahan data, penyajian data, analisis data, dan pengambilan keputusan berdasarkan data. Penjabaran metodologi statistik didasarkan pada tiga hal : Proses analisis Analis deskriptif Informasi diberikan secara visual dan bersifat subjektif dalam pembuatan analisisnya. Analis konfirmatif (inferensi) Informasi lebih bersifat objektif terutama dalam proses pengambilan keputusan yang ditunjang dengan adanya nilai tingkat kesalahan pengukuran
STATISTIKA DESKRIPTIF Penjabaran metodologi statistik didasarkan pada tiga hal : 2. Asumsi bentuk distribusi Statistik Parametrik Variabel yang menjadi input memiliki bentuk distribusi tertentu Statistik Non Parametrik Variabel yang menjadi input tidak memiliki asumsi bentuk distribusi 3. Banyaknya variabel yang dilibatkan Multi-variate melibatkan banyak variabel Uni-variate & bi-variate hanya melibatkan 1 atau 2 variabel
data Menurut Webster’s New World Dictionary, Data diartikan sebagai sesuatu yang diketahui atau diasumsikan. Menurut referensi lainnya mengatakan bahwa data adalah sumber informasi yang diketahui/dicari/diasumsikan untuk memberikan gambaran mengenai suatu keadaan atau persoalan. Syarat untuk memperoleh data dengan kriteria “baik” : Data harus objektif (data harus sesuai dengan keadaan yang sebenarnya); Data harus representatif (data harus mewakili objek yang diamati); Data harus memiliki standard error yang kecil (data harus memiliki tingkat ketelitian yang tinggi); Data harus relevan (data harus memiliki hubungan atau keterkaitan dengan masalah yang akan diselesaikan).
data Beberapa istilah penting yang terkait dengan proses pengumpulan data : Populasi merupakan himpunan atau kumpulan dari semua objek yang diamati; Sampel merupakan himpunan bagian dari populasi; Sensus merupakan cara pengumpulan data dimana seluruh elemen populasi diamati satu per satu (banyak data sama dengan banyaknya anggota populasi); Sampling merupakan cara pengumpulan data dimana yang diselidiki adalah elemen sampel dari suatu populasi; Paramater merupakan suatu besaran yang nilainya menyatakan kondisi sebenarnya dari besaran tersebut.
Pengelompokan data populasi sampel Sifat Kualitatif Kuantitatif Sumber Internal Eksternal Cara memperoleh Primer Sekunder Cara mengumpulkan Cross section Time series data
Ukuran pemusatan data 1. Modus merupakan data yang memiliki frekuensi maksimum 2. Mean atau rata-rata 3. Median (simbol : Md, Quartil ke-2 [Q2] atau M) M = Data terurut ke (n+1) / 2 4. Tri rata (simbol : TRI) TRI = 0.25 (quartil bawah + 2 median + quartil atas) 5. Rata-rata antarkuartil (simbol : RAK)
Dana (satuan : Rp Milyar) Contoh soal Seorang mahasiswa planologi diberikan tugas yaitu mengamati besarnya dana yang digunakan oleh 12 kota di Pulau Jawa dalam menata kawasan kumuh. Mahasiswa tersebut mendatangi kantor dinas tata kota di ke 12 kota dan memperoleh informasi sebagai berikut : Nama Kota Dana (satuan : Rp Milyar) Simbol data mentah Simbol data terurut A 113, 75 X1 [ X9 ] B 99, 59 X2 [ X3 ] C 111, 79 X3 [ X7 ] D 300, 78 X4 [ X12 ] E 101, 66 X5 [ X5 ] F 124, 13 X6 [ X10 ] G 90, 00 X7 [ X2 ] H 20, 19 X8 [ X1 ] I 99, 92 X9 [ X4 ] J 112, 49 X10 [ X8 ] K 135, 72 X11 [ X11 ] L 102, 09 X12 [ X6 ]
Penyelesaian : ukuran pemusatan data 1. Modus = 0 5. Quartil Bawah (QB) = data terurut ke (12+1) (1/4) 2. Mean = (1/12)(1412,11) = 117,68 = data terurut ke 3,25 3. Median = data terurut ke (12+1)/2 = x[3,25] = data terurut ke 6,5 = x[3] + 0,25 {x4 – x3} = 99,84 = x[6,5] 6. TRI Rata = 0,25 {QB + 2 M + QA} = x[6] + 0,5 {x7 – x6} = 0,25 {99,84 + 2(106,94) + 121,54 = 102,09 + 0,5 {111,79 – 102,09} = 108,81 = 106,94 7. Rata-rata antar quartil (RAK) 4. Quartil Atas (QA) = data terurut ke (12+1) (3/4) Ada 3 data yang terletak diantara QA dan QB, yaitu 102,09 101,66 99,92 = data terurut ke 9,75 m = 3 = x[9,75] RAK = (102,09 + 101,66 + 99,92) / 3 = 101, 22 = x[9] + 0,75 {x10 – x9} = 121,54
Ukuran penyebaran data 1. Rentang data / Range (simbol : R) R = Nilai data terbesar – Nilai data terkecil 2. Sebaran tengah / Deviasi antar kuartil (simbol : dq) dq = QA – QB 3. Deviasi rata-rata (simbol : d) 4. Variansi (simbol : s2) dan simpangan baku (simbol : s) 5. Koefisien variansi (simbol : CV) CV = s / mean
Penyelesaian : ukuran penyebaran data 1. Rentang data 4. Variansi dan simpangan baku R = 300,78 – 20,19 s2 = 1/(n-1) [ 𝑖=1 𝑛 𝑥𝑖2 - { 𝑖=1 𝑛 𝑥𝑖}2 / n] = 280,59 = 4125,688 2. Sebaran tengah s =variansi = 64,232 dq = QA – QB 5. Koefisien variansi = 121,54 – 99,84 CV = s / mean = 21,7 = 64,232 / 117,68 3. Deviasi rata-rata = 0,55 d = 𝑖=1 𝑛 𝑥𝑖 −𝑚𝑒𝑎𝑛 / 12 = 385,21 / 12 = 32,101
Bentuk distribusi Simetris Menjurai ke kanan Menjurai ke kiri Distribusi merupakan pola atau model yang merupakan gambaran kondisi sekelompok data. Simetris Menjurai ke kanan Menjurai ke kiri
Diagram batang daun (steam leaf) Prinsip dari steam leaf adalah memanfaatkan nilai data untuk melihat distribusi data. Adapun langkah-langkah membuat steam leaf adalah sebagai berikut : Tentukan data yang memiliki nilai terbesar dan nilai terkecil; Gunakan nilai data terbesar dan terkecil sebagai patokan penentuan dari batang. Misalkan data terbesar adalah 76 dan terkecil adalah 6, maka satuan batang yang dapat dipilih adalah puluhan; Tentukan satuan daun. Karena satuan batang adalah puluhan, maka satuan daun harus lebih kecil dari satuan batang (satuan, persepuluhan, perseratusan, dst); Lengkapi steam leaf dengan memasukkan nilai-nilai data lainnya.
Penyelesaian diagram batang daun Nilai terbesar = 300,78 dan nilai terkecil = 20,19; Satuan batang berdasarkan nilai terbesar adalah ratusan dan puluhan; Satuan daun adalah satuan, sepersepuluh, seperseratus; Batang Daun 30 078 .... 13 572 12 413 11 375; 179; 249 2
Diagram kotak (box plot) Prinsip dari box plot adalah membagi data menjadi empat kelompok berbeda yang dibatasi oleh QA, QB, dan M. Adapun langkah-langkahnya adalah sebagai berikut : Tentukan nilai terbesar dan nilai terkecil; Hitung nilai QA, QB dan M dari data; Gambarkan box plot sebagai berikut : X min X max QB Median QA
Penyelesaian Diagram kotak (box plot) Penyelesaian masalah adalah sebagai berikut : Nilai terbesar adalah 300,78 dan nilai terkecil adalah 20,19; QA = 121, 54 QB = 99,84 Median = 106,94; Gambar box plot adalah sebagai berikut Kesimpulan : Karena data mengumpul di nilai-nilai kecil dan menyebar di nilai besar, maka bentuk distribusinya adalah menceng ke kiri atau menjurai ke kanan. 20,19 300,78 99,84 106,94 121,54
Membandingkan mean dan median Cara yang sangat mudah dan cepat dalam menyimpulkan bentuk distribusi adalah dengan cara membandingkan nilai mean dan median. Hasil yang dapat diperoleh diantaranya : Distribusi Simetris jika nilai mean = nilai median; Distribusi menceng ke kiri atau menjurai ke kanan jika median < rata-rata; Distribusi menceng ke kanan atau menjurai ke kiri jika median > rata-rata;
Penyelesaian membandingkan mean dan median Hasil = Median < Mean, maka Distribusi menceng ke kiri atau menjurai ke kanan jika median < rata-rata
pencilan Pencilan (outlier) memberikan informasi mengenai data yang harganya jauh berbeda dari nilai data lainnya. Mendeteksi data yang masuk pencilan sangat penting dalam statistika, karena data tersebut dapat mengganggu hasil analisis data. Oleh karena itu, data pencilan harus dianalisis tersendiri dan terpisah dari kelompoknya. Langkah-langkah mendeteksi pencilan adalah sebagai berikut : Hitung besar nilai sebaran tengah, dq = QA – QB; Hitung nilai batas bawah pencilan (BPP) = QB – [1,5 x dq]; Hitung nilai batas atas pencilan (BAP) = QA + [1,5 x dq]; Analisis data pencilan.
Penyelesaian pencilan Sebaran tengah dq = QA – QB = 121,54 – 99,84 = 21,7; BPP = QB – [1,5 x dq] = 67,29; BAP = QA + [1,5 x dq] = 154,09; Terdapat satu data yang nilainya dibawah nilai BPP yaitu 20,19, hal ini berarti terdapat satu pencilan bawah yaitu data dengan nilai 20,19. Terdapat satu data yang nilainya diatas nilai BAP yaitu 300,78, hal ini berarti terdapat satu pencilan atas yaitu data dengan nilai 300,78.