# BAB 6 DISTRIBUSI DATA Oleh M. YAHYA AHMAD

## Presentasi berjudul: "BAB 6 DISTRIBUSI DATA Oleh M. YAHYA AHMAD"— Transcript presentasi:

BAB 6 DISTRIBUSI DATA Oleh M. YAHYA AHMAD
METODE STATISTIKA BAB 6 DISTRIBUSI DATA Oleh M. YAHYA AHMAD M. Yahya Ahmad

Variabel Kuantitatif Variabel Kuantitatif dapat memiliki nilai baik negatif maupun positif. These are the results of glucose in blood in 500 persons in Celaya, Gto. The high of bar show the number of persons with glycemia levels in the interval in the X axis. If we add the high of all bars, we shall obtain a total sample size. M. Yahya Ahmad

Variabel Kuantitatif This histogram is similar that the histogram shown before, only change Y axis that it show percentage of sample and not number of persons. We can see that 9% of sample, had glycemia levels < 40 mg/100 ml. The add of all high bars, will give 100%. M. Yahya Ahmad

Variabel Kuantitatif Apa yang terjadi jika ukuran sampel lebih besar?
Perubahan histogram? Histogram of a bigger sample, would make more symmetrical the distribution and more flat the histogram. M. Yahya Ahmad

Variabel Kuantitatif Distribusi data dari beberapa variabel dapat berbentuk simetris. Terutama jika ukuran sampel semakin besar. The charts show the stature distributions in two different samples of the same population. The first sample has 10 observations, the second sample has 1,000 observations. In the first chart, the distribution is skewed and in the second, the distribution is symmetrical. Joining the middle higher points of each bar, we obtain the figure knows as Normal distribution. This distributions is the more important in statistics; it is called also, Gaussian distribution. All Normal distributions have a bell form and are defined for their mean and their standard deviation. If the mean increase, the distribution move to the right; if the mean diminish, the distribution move to the left. If the standard deviation increase, the dispersal and the width of the distribution increase and the high, diminish; if the standard deviation diminish, dispersal and width of the distribution diminish and the high of distribution increase. M. Yahya Ahmad

Bagaimana Membandingkan Distribusi
Bila terdapat dua atau lebih kelompok data maka fokuskan perhatian kepada: Titik tengah (Center). Secara grafis titik tengah dari suatu sebaran data adalah titik dimana kira-kira separuh dari observasi berada di salah satu sisinya. Penyebaran data (Spread). Sebaran menggambarkan variabilitas data. Jika sebaran cukup luas. Maka spread dikatakan besar. Tetapi jika data berkelompok pada sekitar suatu nilai tertentu maka dikatakan sebarannya kecil. Bentuk (Shape). Betuk sebaran data dapat digambarkan dalam kategori kesimetrian (symmetry), kecondongan (kewness), banyaknya puncak, dan sterusnya. Karakter yang tidak biasa (Unusual features). Hal-hal yang biasa seperti adanya kesenjangan (tidak ada data) dan pencilan (outliers). M. Yahya Ahmad

Sebaran Normal Sebaran ini digunakan untuk mewakili sebaran dari nilai-nilai yang harus diamati, jika kita melibatkan semua anggota populasi. Oleh karena itu sumbu Y dari Sebaran Normal disebut probabilitas. Suatu histogram menunjukkan nilai sebaran yang diamati dalam sebuah sampel. Suatu pemetaan Normal menunjukkan nilai sebaran yang dianggap bahwa nilai tersebut dapat muncul di dalam populasi dimana sampel diambil. The sum of all bars in an histogram is equal to 100%, because all observed values are included in the chart. The area under the curve is equal to 100% because the curve cover all possible values. We interpret an histogram reading the percentage that correspond a each bar. We interpreted an Normal plot calculating area for each interval. M. Yahya Ahmad

Sebaran Normal Kita dapat menggunakan sebaran Normal untuk menjawab pertanyaan seperti: Berapa peluang orang dewasa yang menderita glycemia pada level < atau = 50 mg/100 ml? Kita dapat menjawab, dengan mengambil persentase pengamatan terhadap lelaki dewasa, dengan tingkat glycemia < 150 mg/100 ml. The answer can be imprecisely, if the sample size is small. M. Yahya Ahmad

Sebaran Normal Baku Sebaran Normal digambarkan dengan formula yang cukup rumit, namun sekarang telah dipublikasikan tabel yang dapat menentukan luas area di bawah kurva normal yang dinamakan sebagai Sebaran Normal Baku. Di dalam sebaran noral baku, nilai tengahnya adalah 0 dan simpangan baku adalah ±1. Tabel sebaran normal baku biasanya terdapat di dalam lampiran buku-buku statistika. Dengan berkembangnya perangkat lunak komputer, perhitungan luas area di bawah kurva normal sudah sangat mudah dilakukan, Z show the value of Normal standard distribution; p-lower, report the value under the curve to the left of Z and p-upper report the value of area under the curve to the right of Z. M. Yahya Ahmad

Sebaran Normal Baku Bila Z=0.00 maka luas area di bawah kurva normal adalah 0.5 Bila Z = 1.00 maka luas area di bawa kurva normal adalah atau 0.841 M. Yahya Ahmad

Sebaran Normal Baku Jika kita buatkan bentangan luas area di bawah kurva. Maka area di luar bentangan tersebut merupakan sisa (complementary) dari seluruh luas area. Range Area dalam bentang Area di luar bentang -1, + 1 68.3% 31.7% -2, +2 95.4% 0.6% -3, +3 99.7% 0.3% -4, +4 99.99% 0.01% To obtain area out of range, subtract of 1 area in the range. For example, area out range is = M. Yahya Ahmad

Sebaran Bukan Normal Tidak semua variabel kuntitatif memiliki sebaran yang normal. Jika kita ukur tingkat glycemia dalam 10 orang: maka terlihat sebarannya memiliki kecondongan. Dengan kondisi ini dapatkah kita sebut sebarannya normal? The mean of glycemia was 89.5 mg/100 ml with s = 29.3 Because the distribution is skewed, we cannot apply the properties of Normal distribution. What we can make? M. Yahya Ahmad

Sebaran Binom Variabel acak binom (binomial random variable) merupakan jumlah keberhasilan x di dalam n percobaan yang diulang-ulang dari suatu percobaan binomial. Distribusi Peluang (probability distribution) dari variabel acak binom disebut sebagai binomial distribution (juga dikenal dengan Bernoulli distribution). M. Yahya Ahmad

Sebaran Binom Menggambarkan peluang (probability) dari suatu kejadian yang memiliki karakteristik hany dua nilai, misalnya peluang terpilihnya dua warna dalam pengambilan (merah atau putih); peluang orang menjawab pertanyaan “ya: atau “tidak”. Gambar berikut ini menggambarkan sebaran probalitas dari jumlah lelaki di dalam sekelompok orang yang terdiri dari 10 orang. Ini merupakan variabel binom, karena kemungkinan pemilihannya hanya ada dua, yaitu lelaki atau bukan lelaki. M. Yahya Ahmad

Sebaran Binom Sebaran binom memiliki sifat-sifat sebagai berikut:
Nilai tengah (mean) dari distribusi binom (μx) sama dengan n * P . Ragam atau variance (σ2x) adalah n * P * ( 1 - P ). Simpangan baku atau standard deviation (σx) adalah akar pangkat dua dari [ n * P * ( 1 - P ) ]. M. Yahya Ahmad

Sebaran Binom Berapa besar peluang dimana sekurang-kurangnya lahir satu bayi lelaki dalam tiga kelahiran? Kombinasi yang mungkin terjadi: LPP, PLP, PPL, LLP, LPL, LLP, LLL. Untuk menghitung probabilitas dalam masing-masing kombinasi akan memakan banyak waktu. Kombinasi yang mungkin terjadi di dalam kelahiran adalah 8, yaitu: LPP, PLP, PPL, LLP, LPL, LLP, LLL, PPP. If we calculate the probability of three females (FFF) should be: 0.55 x 0.55 x 0.55 = = 16.64%. If to 1 (total of combinations), we subtract , shall obtain the probability of al least 1 male in the next three new born = = = 83.36%. M. Yahya Ahmad

Sebaran Chi-Square Sebaran chi-square memiliki sifat-sifat sebagai berikut: Nilai tengah dari sebaran sama dengan jumlah derajat bebasnya: μ = v. Ragam sama dengan dua kali derajat bebas: σ2 = 2 * v Ketika derajat bebas lebih besar atau sama dengan 2, maka nilai maksimum untuk Y terjadi manakala Χ2 = v - 2. Ketika derajat bebas meningkat, kurva chi-square mendekati kurva distribusi normal. M. Yahya Ahmad

Probabilitas Kumulatif dan Sebaran Chi-Square
Jika dibuatkan suatu kurva sebaran chi-square maka luar areal di bawah kurva sama dengan 1. Luas areal yang berada di bawah kurva antara 0 dan nilai chi-square tertentu merupakan probabilitas kumulatif yang terkait dengan nilai chi-square. Sebagai contoh dalam gambar berikut ini, daerah yang diarsir mewakili peluang kumulatif yang berkaitan dengan nilai chi-square statistik yang sama dengan A; yaitu probablitas dimana nilai nilai chi-square statistik akan berada antara 0 dan A. M. Yahya Ahmad

Probabilitas Kumulatif dan Sebaran Chi-Square

Contoh Penggunaan Chi-Square
Dengan menggabungkan dalam satu peta kita dapat memahami secara lebih baik hubungan antara dua sebaran. Dalam contoh berikut ini kita gunakan empat kemungkinan dari kombinasi antara curah hujan dan produksi suatu tanaman gandum Low rainfall, low yield Low rainfall, high yield High rainfall, low yield High rainfall, high yield M. Yahya Ahmad

Contoh Penggunaan Chi-Square
Catat jumah kejadian dalam suatu tabel freksuensi dari observasi yang dilakukan dalam bentuk matriks seperti tercantum di bawah ini M. Yahya Ahmad

Contoh Penggunaan Chi-Square
Buatkan tabel nilai frekuensi yang diharapkan dengan menggunakan statistik probabilitas (% High rain * # of high yield cells) Row total * column total / table total M. Yahya Ahmad

Menterjemahkan Hasil Chi Square