Probabilitas dan Statistik Statistik Deskriptif Probabilitas dan Statistik Hasdi Radiles 19770909 201101 1 005 Teknik Telekomunikasi Jurusan Elektro- Fakultas SainTek UIN Suska – Riau Pekanbaru, Maret 2012
Materi kuliah Besaran Kuantitatif Variabel Sentral tendensi Variabilitas Besaran posisi Diagram dan Grafik Pola dalam data Dotplot Diagram batang dan Histogram Stemplots dan Boxplot Plot Kumulatif Scatterplot Elektro - UIN SUSKA Update : Maret 2012
Variabel Variabel Atribut yang menggambarkan seseorang, tempat, sesuatu atau ide Nilai dari atribut dapat bervariasi antara suatu entitas dan entitas lainnya Contoh variabel: penampilan fisik, usia, penilaian juri, dll. Klasifikasi variabel: Kualitatif (katagori): menggunakan kata-kata untuk menggambarkan objek. Contoh : warna kulit, jenis gedung, bentuk kendaraan, dll Kuantitatif (numerik): penggambaran objek yang dapat diukur berdasarkan dan dianalisa Kontinu: variasi nilai menggunakan batas minimum dan maksimum. Contoh: usia manusia, klasikasi nilai perkuliahan, populasi penduduk Diskrit: variasi nilai berupa integer atau terdapat gap antar entitas. Contoh: Jumlah mahasiswa dikelas, jumlah matakuliah. Jumlah entitas variabel: Univariat: hanya terdapat 1 variabel dalam observasi Bivariat: mempelajari hubungan antara 2 variable Elektro - UIN SUSKA Update : Maret 2012
Set data dan sampling Set data dapat berupa: Populasi : Setiap elemen dari set observasi yang dapat dibuat. Atributnya disebut parameter. Contoh: mean dari populasi disebut parameter dilambangkan dengan Sampel Satu atau lebih observasi dari suatu populasi. Atributnya disebut dengan statistik. Contoh: mean dari sampel disebut statistik dilambangkan dengan Metoda sampling: prosedur untuk menseleksi elemen sampel dari suatu populasi Metoda sampling random sederhana dengan karakteristik: Populasi terdiri dari N objek Sampel terdiri dari n objek Setiap sampel dapat muncul dengan kecendrungan yang sama Contoh : Metoda lotre Metoda sampling random dengan pengembalian (replacement) Metoda sampling random tanpa pengembalian (non-replacement) Elektro - UIN SUSKA Update : Maret 2012
Metoda sampling sederhana Populasi N = 3 Berikan setiap anggota populasi dengan angka yang unik Letakan mereka dalam keranjang dan acak Secara random pilihlah n buah angka Anggota populasi yang memiliki angka-angka terpilih disebut dengan sampel 1 2 3 Sampel n=2 2 1 Elektro - UIN SUSKA Update : Maret 2012
2 2 Replacement sampling Populasi N = 3 Observasi 1 Populasi N = 3 Sampel n=1 Populasi N = 3 Observasi 1 Populasi N = 3 1 2 3 Sampel n=1 Observasi 2 2 2 Elektro - UIN SUSKA Update : Maret 2012
Non-replacement sampling 1 2 3 Sampel n=1 Populasi N = 3 Observasi 1 Populasi N = 3 1 3 Sampel n=1 Observasi 2 2 3 Elektro - UIN SUSKA Update : Maret 2012
Sentral tendensi Sentral tendensi Besaran yang menunjukan kesimpulan umum dari suatu set pengukuran Metoda perhitungan: Median Bekerja dengan baik ketika dalam kumpulan populasi terdapat beberapa nilai yang perbedaannya sangat ekstrim (outlier) Set observasi dalam orde terkecil hingga terbesar Jika jumlah observasi ganjil, maka median adalah nilai observasi yang berada pada urutan tengah Jika jumlah observasi genap, maka median adalah rata-rata dari 2 nilai observasi yang berada pada urutan tengah Mean: Memberikan pengukuran tendensi yang lebih baik jika outlier dibuang terlebih dahulu Elektro - UIN SUSKA Update : Maret 2012
Variabilitas Variabilitas Gambaran dari jumlah variasi/sebaran dalam suatu set data Range: perbedaan antara nilai terbesar dan terkecil dalam suatu set nilai Inter-Quartile Range, terdapat 2 metoda Metoda 1: IQR = Q3 – Q1 Q1 adalah nilai tengah dari 50% total data terkecil yang terurut Q2 adalah median Q3 adalah nilai tengah dari 50% total data terbesar yang terurut Metoda 2: range dari 50% data yang berada ditengah-tengah set nilai yang berurutan. Hilangkan 25% data terkecil dan 25% data terbesar IQR = max - min Variansi Populasi Sampel Standard deviasi:akar kuadrat dari variance Populasi Sampel Elektro - UIN SUSKA Update : Maret 2012
Besaran posisi Besaran posisi: Percentile Urutkan data dari terkecil hingga terbesar Bagi posisi yang terurut tersebut sehingga sebanding dengan 100 urutan Posisi Pi memiliki nilai > i% dari seluruh elemen pada set tersebut Posisi P50 = median. Quartile Q1 sebanding dengan P25 Q2 sebanding dengan P50 atau median Q3 sebanding dengan P75 Nilai Standar (nilai-z) Nilai-z < 0 elemen < mean Nilai-z >0 elemen > mean Nilai-z =0 elemen = mean Nilai-z = a terdapat a buah standar deviasi > mean Nilai-z = -a terdapat a buah standar deviasi < mean Elektro - UIN SUSKA Update : Maret 2012
Responsi #1 Apakah pengaruh pergantian unit pada nilai tendensi dari : Suhu dengan satuan celcius ke satuan kelvin Ukuran panjang dari meter ke kilometer Berapakah nilai tendensi dari urutan nilai: 80 96 99 100 100 103 176, jika diasumsikan outlier 80 dan 176 mana yang lebih baik mean atau median Sebuah dataset {1, 3, 5, 7}. Hitung variansi nya. Nilai rata-rata ujian statistik T. Elektro tahun 2011 adalah 75 dengan standar deviasi 15. Jika nilai ujian Budi memiliki nilai-z 1.2, berapakah nilai ujian Budi sebenarnya? Elektro - UIN SUSKA Update : Maret 2012
Diskusi #1 Gambarkan tinggi badan manusia dengan menggunakan Katagori Numerik Perhatikan rendering warna berikut ini. Dapatkah katagori warna ini dapat disebut kontinu? Berikan alasan Jika dari suatu observasi pembagian sebuah kue yang dipotong 9 bagian dengan ukuran yang sama. Apakah variabelnya diskrit jika seorang anak dalam suatu observasi mendapatkan kue kelipatan 1/9? Berikan alasan anda. Mungkinkah ukuran sampel > ukuran populasi? Berikan alasannya Mungkinkah setiap elemen terpilih 2x dengan metoda replacement? Buktikan ukuran sampel dari: Metoda sampling replacement = 1 ≤ n ≤∞ Metoda sampling non-replacement = 1 ≤ n ≤ N Elektro - UIN SUSKA Update : Maret 2012
Pola center Median Range Pola spesial (kuantitatif) dalam data dapat dianalisa sebagai berikut: Center: Contoh: data observasi pelemparan dadu 18x didapatkan sebagai berikut: x = { 2,1,5,3,5,4,6,2,6,3,1,4,2,6,1,1,6,5}, carilah pola sebaran data pelemparan dadu tersebut. Median Range Elektro - UIN SUSKA Update : Maret 2012
Pola spread Spread Data grafik kiri terbentang pada 3 – 7 dengan range 4 sementara grafik kanan terbentang dari 1 hingga 9. Grafik kanan memiliki variasi yang lebih besar dan dikatakan bentuk spread dari grafik kiri. Contoh aplikasi spread spectrum pada sistem cdma. Elektro - UIN SUSKA Update : Maret 2012
Bentuk kurva Bentuk kurva grafik dapat membentuk kurva (shape) dengan karakter sebagai berikut: Simetstris: dikatakan simetris jika grafik bagian kanannya tersebut merupakan pencerminan sisi kiri pada titik tengahnya. Jumlah puncak: suatu grafik memiliki karakter puncak sebagai berikut: Grafik dengan 1 nilai puncak disebut distribusi unimodal Grafik dengan 2 nilai puncak disebut dengan distribusi bimodal Grafik unimodal dengan puncak berada pada tengahnya disebut dengan bell shape (simetris unimodal) Skewness (kecondongan): derajat ketidak-simetrisan suatu kurva jika suatu data terdisitribusi dimana porsi kiri lebih banyak dibandingkan porsi kanan, maka dikatakan grafiknya skew right, jika porsi kanan lebih banyak, maka disebut skew left. Uniform: Jika data tidak memiliki puncak. Elektro - UIN SUSKA Update : Maret 2012
Ketidakberaturan kurva Gap : jika pada suatu elemen tidak terdapat observasi, maka elemen tersebut disebut dengan gap Outlier: data yang berbeda sangat ekstrim dibandingkan dengan rata-rata elemen lainnya. Suatu data disebut outlier jika : < Q1 – (1.5 x IQR) > Q3 + (1.5 x IQR) Contoh: jika diketahui data x = { 2,1,2,3,2,0,4,1,2,9,3,} tentukanlah outlier dan gap pada data tersebut. Urutkan data x’={0,1,2,2,2,2,3,3,4,9} Median = p50= 2, Q1 = 2, Q3=3 IQR= 3-2 =1. Jadi outlier adalah 2-1 =0.5 dan 3+1.5 = 4.5 jadi 9 adalah outlier. Elektro - UIN SUSKA Update : Maret 2012
Responsi #2 Elektro - UIN SUSKA Update : Maret 2012
Dotplot Dotplot dapat dibuat dengan memperhatikan: Setiap dot menunjukan observasi tunggal dari data set, atau sejumlah observasi dari suatu set data. Dot ditumpuk dalam kolom-kolom yang berkaitan dengan grupnya, sehingga tinggi kolom menunjukan frekuensi relatif atau absolut dari observasi pada kategori tersebut Pola data dari dotplot dapat digambarkan dengan menunjukan simetris dan skew-nya selama kategori tersebut kuantitatif. Jika kategorinya kualitatif, maka istilah simetris dan skew tidak dapat dilakukan. Merah hitam Kuning Biru Pink Konstanta observasi Frekuensi observasi Elektro - UIN SUSKA Update : Maret 2012
Diagram batang dan Histogram Properti tambahan yang dapat diberikan pada dot plot, diagram batang dan histogram adalah sebagai berikut: Diagram batang memiliki gab antar grupnya, histogram tanpa gap Digram batang tidak dapat dianalisa untuk skew dan simetrisnya Diagram batang untuk grup kualitatif, sedangkan histogram u/ grup kuantitatif Dapat berupa horisontal maupun vertikal sedangkan histogram slalu vertikal Diagram batang vertikal Skala kuantitatif Variabel kuantitatif Variabel kualitatif Grup kuantitatif Elektro - UIN SUSKA Update : Maret 2012
Stemplot Stemplot berfungsi untuk menggambarkan data kuantitatif Stemplot terdiri dari 2 bagian yaitu plot stem dan plot leaf Stems Leaves 150 1 140 130 120 2 6 110 4 5 7 9 100 1 2 2 2 5 7 9 9 90 0 2 3 4 4 5 7 8 9 9 80 1 1 4 7 8 Kunci: 110 7 merepresentasikan nilai IQ 117 110+9=119 optional Elektro - UIN SUSKA Update : Maret 2012
Stemplot Contoh : Suatu hasil pengukuran didapatkan sampel sebagai berikut: Prosedur kerja: Definisikan stem dan leaves Berikan kata kunci atau referensi (optional) Masukan leaves pada plot Temperatur 99.1 100.5 98.2 101.7 102.3 97.8 98.9 104.1 102.5 101.2 99.6 101.8 99.3 102.7 101.1 98.6 Stems Leaves 104 1 103 102 3 5 7 101 1 2 7 8 100 5 99 1 3 6 98 2 6 9 97 8 Kunci: 99 7 merepresentasikan 99.7 Elektro - UIN SUSKA Update : Maret 2012
Stemplot Perbandingan dengan 2 variabel Berapakah median untuk kelas A dan B Berapakah range data masing-masing variabel Berapakah rata-rata nilai masing-masing kelas Jika 80 ke atas adalah nilai A, berapa persenkah masing-masing kelas yg tidak mendapatkan A Kelas B Kelas A 100 2 0 90 9 4 3 1 80 3 3 5 7 9 9 9 2 1 70 1 2 7 8 8 7 7 6 1 60 5 6 8 9 9 9 9 9 8 7 50 1 3 6 8 9 Elektro - UIN SUSKA Update : Maret 2012
Boxplot Digunakan untuk menunjukkan pola kuantitatif data dengan merepresentasikan variabilitas data yakni range dan interquartile data tersebut. Skew right Skew left Symmetrics -150 -100 -50 0 50 100 150 Q1 Q2 Q3 Range Outlier IQR Elektro - UIN SUSKA Update : Maret 2012
Boxplot Perbandingan Jika batas atas nilai E adalah 50, berapkah persentase masing-masing kelas yang tidak lulus Jika batas nilai lulus adalah: 50-60 = C; 61-75 = B; dan >75 adalah A, berikanlah gambaran anda tentang masing-masing kelas jika jumlah siswanya adalah 40 orang untuk masing-masing kelas Menurut anda adakah yang salah dengan penggambaran grafik tersebut jika memperhatikan outlier dan gap? Cobalah anda rekonstruksi ulang nilai masing-masing kelas Elektro - UIN SUSKA Update : Maret 2012
Frekuensi kumulatif Frekuensi kumulatif merupakan cara untuk menampilkan informasi kumulatif secara grafis. Plot ini menunjukkan jumlah, persentase, atau proporsi observasi yang kurang dari atau sama dengan nilai tertentu. Frekuensi kumulatif Frekuensi Elektro - UIN SUSKA Update : Maret 2012
Frekuensi kumulatif Frekuensi kumulatif berdasarkan skala dapat ditampilkan dalam bentuk: Frekuensi absolut Frekuensi relatif Elektro - UIN SUSKA Update : Maret 2012
Frekuensi kumulatif Berdasarkan bentuk kuantitatif data juga dapat ditampilkan dalam bentuk: Diskrit Kontinu Median Elektro - UIN SUSKA Update : Maret 2012
Scatterplot Digunakan untuk menyatakan hubungan 2 buah variabel (misalnya variabel X dan Y) Hubungan Kuat Lemah (tidak ada hubungan) Linear Positif linear Negatif linear Linear sempurna Non-linear Kuadrat Eksponensial Sinusiodal Dependensi Homoscedastic : Nilai Y tidak bergantung pada nilai X Heteroscedastic: Nilai Y bergantung pada nilai X outlier Elektro - UIN SUSKA Update : Maret 2012
Scatterplot Elektro - UIN SUSKA Update : Maret 2012
Scatterplot Elektro - UIN SUSKA Update : Maret 2012
Responsi #3 Klasifikasikan plot-plot yang telah anda pelajari menjadi: kategori, diskrit dan kontinu Jika pembaca atau audiens presentasi anda, awam terhadap statistik, plot mana yang menurut anda pantas digunakan untuk menyajikan data Dapatkah dotplot dianalisa pola grafiknya seperti skewness dan spreadnya. Berikan alasanmu untuk semua kemungkinan jawaban Dapatkah diagram batang dianalisa pola grafiknya? Berikan alasanmu Dapatkah stemplot merepresentasikan data dengan 2 angka belakang desimal? Berikan contohnya Dapatkah data kualitatif dipresentasikan dalam grafik garis? Berikan pendapatmu Untuk frekuensi kumulatif, dapatkah pola data kita analisa secara lengkap? Berikan contoh dan alasannya. Mengapa kita perlu menganalisa bentuk kurva dari data set yang kita miliki Jika anda tidak ingin menampilkan detail nilai masing-masing elemen set, plot manakah yang anda pilih untuk mereprentasikannya? Berikan alasannya. Berikan 1 contoh untuk boxplot dan scatterplot dengan 20 elemen set. Elektro - UIN SUSKA Update : Maret 2012