Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

Analisa Data Statistik Chap 8: Sampling Distribution Agoes Soehianie, Ph.D.

Presentasi serupa


Presentasi berjudul: "Analisa Data Statistik Chap 8: Sampling Distribution Agoes Soehianie, Ph.D."— Transcript presentasi:

1 Analisa Data Statistik Chap 8: Sampling Distribution Agoes Soehianie, Ph.D

2 Daftar Isi Random Sampling, Populasi dan Sampel Mean dan Variansi Sampel Grafik Tampilan Data Distribusi Sampel Kesimpulan (Inferences) Tentang Mean Populasi

3 Random Sampling Suatu proses untuk mengambil sampel secara acak dari populasi. Secara teknis letak kerumitannya adalah pada proses untuk menjamin ke-random-an, terutama bilamana sampel berasal dari populasi yg berunsur manusia. Ada beberapa teknik sampling yg dikenal: 1. Probabilistik sampling Setiap anggota populasi memiliki kesempatan yg sama untuk terpilih. Variasinya: Simple Random Sampling, Sistematik Random Sampling, Stratified Random Sampling, Multistage Area Random Sampling. 2. Non Probabilistik Sampling Bilamana kesempatan anggota populasi terpilih tidak sama Variasinya: Quota Sampling, Booster Sampling, Judgement Sampling, Convenience Sampling, Snow-Ball sampling etc Proses analisa statistik hanya berlaku untuk probabilistik sampling

4 Populasi dan Sampel Keseluruhan obyek atau kejadian yg menjadi sasaran observasi disebut populasi. Contoh: penduduk Indonesia, mahasiswa ITB, sekrup diameter 5mm produksi pabrik X, pengguna HP di Bandung, Penderita AIDS di Indonesia, umur batuan, tekanan udara di Bandung, curah hujan di Jawa Barat, dll Macam populasi : Diskrit vs Kontinu Finite vs Infinite Setiap observasi di populasi adalah NILAI dari variabel random X yg memiliki distribusi probabilitas tertentu f(x). Pada banyak kasus sulit/mahal/tidak mungkin untuk melakukan observasi untuk seluruh anggota populasi, sehingga diperlukan sampel. Sampel : himpunan bagian dari populasi.

5 Statistik Pada Statistik Inferential ingin diambil kesimpulan tentang parameter- parameter populasi (mean, variansi) dari studi terhadap parameter-parameter sampel. Statitik adalah sebuah fungsi berdasarkan pada variabel random yg dihitung dari sampel. Contoh : mean dan variansi serta STD Mean sampel Jika X 1,..,X n adalah nilai variabel random dari sampel berukuran n maka mean dari sampel didefinisikan sbg: dengan maka

6 Variansi sampel Jika X 1,..,X n adalah nilai variabel random dari sampel berukuran n maka mean dari sampel didefinisikan sbg: Contoh. Harga 1kg kopi di empat toko adalah 12,15,17 dan 20. Hitunglah rata- rata sampel dan variansinya. Jawab Statistik X(X-X)(X-X)^ Sum64034 average

7 Variansi sampel (alternative) Jika X 1,..,X n adalah nilai variabel random dari sampel berukuran n maka variansi dari sampel didefinisikan sbg: atau Contoh Hitung ulang variansi contoh sebelumnya dengan rumus ini. Statistik XX^ Sum641058

8 Standard Deviasi sampel Standard Deviasi sampel S adalah akar positif dari variansi! Soal Berikut ini adalah IP mahasiswa angkatan 200X dari Prodi Fisika : Hitunglah a) Mean dan variansi sampel b) Standard deviasi sampel Statistik

9 Quartile adalah data yg membawa seluruh sampel menjadi 4 bagian sama besar. Dikenal 3 quartile: a. Quartile bawah atau Quartile pertama Q 1 Misal Q 1 adalah Quartile bawah berarti 25% data ≤ Q 1 b. Quartile tengah atau Quartile kedua Q 2 = Median Misal Q 2 adalah Median berarti 55% data ≤ Q 2 c. Quartile atas atau Quartile ketiga Q 3 Misal Q 3 adalah Quartile atas berarti 75% data ≤ Q 4 Inter Quartile Range (IQR) = Q 3 -Q 1 Cara menentukan Quartile Q 1 : 1. Urutkan data X k dari nilai terendah hingga tertinggi 2. Hitung nomor urut data untuk Q 1, yaitu k=n/4 Jika k bilangan bulat maka Q 1 = (X k +X k+1 )/2 Jika k tidak bulat, definisikan k’ adalah bilangan bulat terdekat di atas k, maka Q 1 = X k’ Ukuran Sebaran (Dispersi)- Quartile

10 Cara menentukan Quartile Q 2 : 1. Urutkan data X k dari nilai terendah hingga tertinggi 2. Hitung nomor urut data untuk Q 2, yaitu k=n/2 Jika k bilangan bulat maka Q 2 = (X k +X k+1 )/2 Jika k tidak bulat, definisikan k’ adalah bilangan bulat terdekat di atas k, maka Q 2 = X k’ Cara menentukan Quartile Q 3 : 1. Urutkan data X k dari nilai terendah hingga tertinggi 2. Hitung nomor urut data untuk Q 3, yaitu k=3n/4 Jika k bilangan bulat maka Q 3 = (X k +X k+1 )/2 Jika k tidak bulat, definisikan k’ adalah bilangan bulat terdekat di atas k, maka Q 3 = X k’ Ukuran Sebaran (Dispersi)- Quartile

11 Contoh. Misalkan data nilai Fisika 16 anak adalah sbb: n=16 Q1: k=n/4 = 16/4 =4, maka Q 1 = (X 4 +X 5 )/2 = (51+56)/2 = 53.5 Q2: k=n/2 = 16/2 =8, maka Q 2 = (X 8 +X 9 )/2 = (64+70)/2 = 67 Q3: k=3n/4 = 3*16/4 =12, maka Q 3 = (X 12 +X 13 )/2 = (76+82)/2 = 79 IQR = Q 3 -Q 1 = = 25.5 Quartile - Contoh

12 Outliers adalah data yg berbeda jauh dari data kebanyakan atau jauh dari mean atau median. Ada beberapa kebiasaan dalam menentukan outliers misalkan: data di luar x ±3S di anggap outliers data X > Q IQR atau X < Q IQR dianggap outliers Titik ekstrem X disebut titik extrem jika > Q IQR, atau X disebut titik extrem jika < Q 1 -d 3 IQR Outliers

13 Jika C adalah persentile ke α (P α ), artinya sebanyak α data ≤ C. Jadi P 0.5 = Median, P 0.25 =Q 1 dan P 0.75 =Q 3. Cara mencari P α dari n buah data 1. Urutkan data 2. Hitung k = αn Jika k bulat maka P α = (X k +X k+1 )/2 Jika k tak bulat, definisikan k’ bilangan bulat terdekat diatas k, maka P α =X k’ Persentile P α

14 Box-Whisker Plot - Contoh Example NoNikotinNoNikotinNoNikotinNoNikotin Berikut ini adalah kadar Nikotin dalam 40 sampel rokok yg dipelajari. Quartile k = 40/4 = 10 Q 1 = (X 10 +X 11 )/2=1.485 k = 40/2 = 20 Q 2 = (X 20 +X 21 )/2=1.86 k = 3*40/4 = 30 Q 3 = (X 30 +X 31 )/2=2.14 IQR = Q 3 -Q 1 =0.655 P =(X 1 +X 2 )/2=0.765 P = (X 39 +X 40 )/2=

15 Box-Whisker Plot - Perbandingan

16 Quantile dari sampel dinyatakan oleh q(f) adalah batas nilai q yang menyatakan sebanyak fraksi f dari data bernilai kurang dari atau sama dengan q. Jadi: q(0.25)= Q 1 q(0.5) = Q 2 =median q(0.75) = Q 3 dst Quantile Plot memplot nilai data di sumbu tegak thd nilai quantile-nya Quantile Plot

17 Data untuk Quantile plot. Berikut ini data dari 30 data tentang ketebalan cat. Quantile Plot - Example Sampel Sample

18 Untuk membuat Quantile Plot. 1. Urutkan data tsb 2. Buat frequency kumulatif dari data tsb 3. Plot Kumulatif freq vs data tsb Tabel disamping menunjukkan sebagian Bagian awal distribusi kumulatif. Quantile Plot - Example Freq KumData

19 Quantile Plot Q2 Q1 Q3

20 Deteksi Penyimpangan dari Normal Normal Quantile-Quantile Plot Quantile plot dipakai untuk membandingkan distribusi sebuah sampel dengan distribusi teoretik. Normal quantile-quantile plot adalah plot dari data terurut y i dengan standard normal quantile q(f i ), yg didefinisikan: q(f i ) = 4.91[ f 0.14 – (1-f) 0.14 ] Dengan f i adalah dimana i adalah nomor urut data: fi i(i-3/8)/(n+1/4)qData

21 Normal Q-Q Plot

22 Menarik Kesimpulan Ttg Populasi Dari Sampel Ketika sebuah sampel random diambil dari populasi dengan rata-rata populasi μ, maka rata-rata yg diperoleh dari sampel akan berfluktuasi di sekitar rata-rata populasi. Statistik inferensial berusaha untuk mengambil kesimpulan tentang parameter-parameter populasi berdasarkan informasi yg diperoleh dari sampel. Distribusi Sampling Yg dimaksud distribusi sampling adalah distribusi probabilitas dari sebuah statistik. Jadi distribusi probabilitas dari rata-rata sampel dinamakan distribusi sampling dari rata-rata sampel

23 Distribusi Sampling dari Rata-Rata Dari populasi terdistribusi normal dengan rata-rata μ dan variansi σ 2 diambil sampel random berukuran n. Misal diperoleh rata-rata sampel tsb Bilamana diambil sampel berkali-kali masing-masing berukuran n, akan diperoleh distribusi rata-rata sampel: Rata-rata sampel ini akan terdistribusi normal juga dengan rata-rata = μ: yaitu rata-rata populasi dan variansi distribusi rata-rata sampelnya:

24 Contoh Bolam lampu yg diproduksi sebuah pabrik terdistribusi normal dengan rata-rata umur 800 jam dan standard deviasi 40 jam. Carilah probabilitasnya bahwa sampel random 16 bolam akan memiliki rata-rata umur lampu kurang dari 775 jam. Jawab. Distribusi rata-rata sampel akan terdistribusi normal dengan rata-rata dan standard deviasi Untuk Sehingga probabilitas P(x<775) = P(z<-2.5) = (tabel)

25 Teori Limit Pusat Jika x adalah rata-rata dari sebuah sampel random berukuran n yg ditarik dari populasi dengan rata-rata μ dan variansi σ 2, maka bentuk limit dari distribusi variabel dengan n  ∞ adalah distribusi normal standard n(z;0,1) Ini berarti tanpa harus mengetahui bagaimanakah bentuk distribusi dari populasi, distribusi rata-rata sampelnya akan mendekati bentuk distribusi normal! Jika populasinya mengikuti distribusi normal, tak peduli ukuran sampel distribusi rata-rata sampel akan mengikuti distribusi normal. Tetapi jika distribusi populasinya tidak normal maka distribusi rata- rata sampel akan bagus mendekati normal jika n≥30 pada umumnya

26 Ilustrasi: Teori Limit Pusat (Normalitas) n kecil ke moderate n besar (hampir normal) n=1 Distribusi rata- rata sampel rata-rata sampel

27 Aplikasi : Taksiran Rata-Rata Populasi Jika x s adalah rata-rata dari sebuah sampel random berukuran n yg ditarik dari populasi dengan rata-rata μ dan variansi σ 2, maka bentuk limit dari distribusi variabel dengan n  ∞ adalah distribusi normal standard n(z;0,1) Ini berarti tanpa harus mengetahui bagaimanakah bentuk distribusi dari populasi, distribusi rata-rata sampelnya akan mendekati bentuk distribusi normal! Jika populasinya mengikuti distribusi normal, tak peduli ukuran sampel distribusi rata-rata sampel akan mengikuti distribusi normal. Tetapi jika distribusi populasinya tidak normal maka distribusi rata-rata sampel akan bagus mendekati normal jika n≥30 pada umumnya

28 Taksiran Rata-Rata Populasi Contoh. Sebuah pabrik sparepart mobil, yg berupa silinder harus memproduksi silindernya dengan diameter rata-rata 5.0mm. Dalam sebuah studi 100 silinder yg diproduksi dipilih secara random. Ternyata didapati rata-rata diameter sampelnya x s = 5.027mm. Diketahui bahwa standard deviasi populasi untuk diameter adalah 0.1mm. Apakah hasil dari sampel tsb mendukung statement bahwa rata-rata diameter di populasi 5.0mm? Jawab. Pertanyaan ini akan dijawab dg jalan pemikiran demikian, jika benar rata-rata populasi μ=5 berapakah probabilitasnya untuk mendapatkan rata-rata sampel yg berukuran 100 buah lebih dari atau sama dengan 5.027? P(x s ≥5.027) =? Z s = (X s -μ)/(σ/√n) = ( )/(0.1/ √100) = 0.027/0.01=2.7 P(x s ≥5.027) = P(Z s ≥ 2.7) =1- P(Z<2.7)= (dari tabel normal) Jadi probabilitasnya menemukan rata-rata sampel ≥ hanya 0.35%. Berarti hasil studi thd sampel sangat tidak mendukung konjecture bahwa rata-rata populasi 5.0. Menurut Anda kemungkinan rata-rata populasi lebih kecil atau lebih besar dari 5.0?

29 Distribusi Sampling Selisih Dua Buah Rata-rata Dalam membandingkan dua buah populasi maka yg dipelajari adalah selisih rata-rata dua buah populasi tsb μ 1 – μ 2. Populasi 1 Populasi 2 μ 1, σ 1 μ 2, σ 2 X s1, S 1, n 1 X s2, S 2, n 2

30 Distribusi Sampling Selisih Dua Buah Rata-rata Distribusi rata-rata sampel x s1 akan hampir normal dengan rata- rata μ 1 dan variansi σ 1x 2 =σ 1 2 /n 1 Distribusi rata-rata sampel x s2 akan hampir normal dengan rata- rata μ 2 dan variansi σ 2x 2 =σ 2 2 /n 2 Maka distribusi variabel selisih rata-rata sampel x s1 -x s2 akan terdistribusi hampir normal juga dengan rata-rata: μ x1-x2 = μ 1 – μ 2 dan variansi: σ 2 x1-x2 = σ 1x 2 + σ 2x 2 = σ 1 2 /n 1 + σ 2 2 /n 2 Sehingga variabel standard Z: Akan terdistribusi normal standard

31 Contoh Waktu pengeringan dua buah jenis cat disurvei. Cat jenis A diambil sampel acak 18 buah, demikian juga cat B juga diambil 18 sampel. Asumsi yg dipercaya adalah rata-rata populasi waktu pengeringan kedua jenis cat tsb adalah sama. Diketahui standard deviasi waktu pengeringannya sama yaitu 1 jam. Berapakah probabilitas mendapati bahwa waktu pengeringan sampel A akan lebih lama dari 1 jam dibandingkan sampel B dalam kasus ini? Jawab: Populasi:μ A = μ B σ A = σ B = 1 Sampel: n A = n B = 18 P(x sA -x sB > 1)? Batasnya x sA -x sB =1, nilai Z yg terkait: P(x sA -x sB > 1)= P(Z>3.0)=1-P(Z<3.0)= =0.0013

32 Soal Waktu hidup tabung televisi Merk A 6.5tahun, dengan standard deviasi 0.9 tahun. Sedangkan Merk B umur rata-ratanya 6.0 tahun dan standard deviasi 0.8 tahun. Berapakah probabilitasnya sampel random sebanyak 36 tabung merk A akan memiliki rata-rata umur tabung paling tidak 1 tahun lebih lama dibandingkan umur tabung yg dihitung dari sampel random merk B sebanyak 49 buah?

33 Distribusi Sampling Variansi S 2 Bilamana ingin dipelajari variasi dari data maka fokus studi adalah pada distribusi variansi sampel S 2 untuk mendapatkan kesimpulan tentang variansi populasi σ 2. Sampel random berukuran n diambil dari populasi normal dengan rata-rata μ dan variansi σ 2. Diperolah bahwa variansi sampel S 2. Maka statistik : Akan memiliki distribusi chi-squared dengan derajat kebebasan ν= n-1.

34 Distribusi Chi-Squared Ditabelkan nilai variabel χ 2 yang terkait dengan luas ( α) ekor kanan dari distribusi chi-squared untuk berbagai derajat kebebasan. χ2χ2 χα2χα2 α

35 Tabel Distribusi Chi-Squared Tabel nilai kritikal χ 2 α yang terkait dengan luas ( α) ekor kanan dari distribusi chi-squared untuk berbagai derajat kebebasan (v)

36 Contoh. Pabrik aki menggaransi bahwa aki-nya tahan rata-rata 3 tahun dengan standard deviasi 1 tahun. Misalkan bahwa umur aki mengikuti distribusi normal. Diambil sampel acak 5 buah aki, dan ternyata umurnya 1.9, 2.4, 3.0, 3.5 dan 4.2 tahun. Periksalah apakah klaim pabrik bahwa standard deviasinya 1 tahun valid? Jawab. Pertama hitung variansi sampel: XX2X SUM Sum^2 225 S2=(nSxx- Sx^2)/(n*n-1) S2=0.815 Pabrik aki menggaransi bahwa aki-nya tahan rata-rata 3 tahun dengan standard deviasi 1 tahun. Misalkan bahwa umur aki mengikuti distribusi normal. Diambil sampel acak 5 buah aki, dan ternyata umurnya 1.9, 2.4, 3.0, 3.5 dan 4.2 tahun. Periksalah apakah klaim pabrik bahwa standard deviasinya 1 tahun valid? Jawab. Pertama hitung variansi sampel:

37 Contoh. Dari tabel kita melihat bahwa jika derajat kebebasan v=4, maka 95% dari nilai-nilai χ 2 akan berada diantara : χ2χ2 χ % χ % Dari tabel χ (v=4) = Dari tabel χ (v=4) = Dengan σ 2 =1 dan v=4 ternyata terdapat probabilitas 95% bahwa S 2 akan terletak antara dan Ternyata perhitungan menghasilkan sampel kita memiliki nilai χ 2 =3.26, Jadi sampel mendukung klaim bahwa variansi populasi =1.

38 Sampel Kecil: Student’s t Distribution Pada banyak kasus sering dijumpai tidak tersedia informasi tentang varia,nsi populasi, sehingga dipergunakan variansi yg berasal dari sampel sebagai pengganti S. Bilamana sampel berukuran besar (n≥30) maka penggantian σ dengan S cukup baik dan kita bisa mempergunakan variabel normal Z spt biasa dalam perhitungan: Jikalau sampel kecil (n<30) maka S 2 akan berfluktuasi cukup besar dari sampel ke sampel sehingga perlu statistik yg lebih baik. Jika sampel kecil akan tetapi berasal dari distribusi normal, maka statistik T berikut ini:

39 Sampel Kecil: Student’s t Distribution Variabel T tsb akan mengikuti distribusi probabilitas yg disebut Distribusi Student T (Student adalah nama samaran dari penemu distribusi ini yg bernama Gosset), dengan derajat kebebasan v=n- 1. Distribusi ini bentuknya serupa sekali dengan distribusi normal: rata-rata=0 dan bentuknya simetrik. Akan tetapi untuk sampel kecil maka ekor distribusinya lebih tinggi dibandingkan distribusi normal, jadi bentuknya ditentukan oleh derajat kebebasan. t0 ν=∞ν=∞ ν=2ν=2

40 Tabel Student’s t Distribution Tabel distribusi student diberikan untuk nilai kritis t yg terkait dengan luas ekor kanan dari distribusi t, untuk berbagai nilai derajat kebebasan yg berbeda.

41 Contoh. Seorang peneliti menyatakan rata-rata hasil panen setelah diberi pupuk adalah 500 gram per mm pupuk yg diberikan. Dia kemudian mengambil sampel 25 batch panen, dan memutuskan dia akan puas dengan klaimnya jikalau ternyata nilai t dari sampel terletak antara –t 0.05 s/d t Peneliti tsb mengasumsikan bahwa bobot hasil panen mengikuti distribusi normal. Ternyata sampelnya memiliki rata-rata 518 gram dengan standard deviasi sampel 40. Apakah dia akan puas dengan klaimnya? Jawab. Ini adalah persoalan distribusi student t. Ukuran sampel n=25, sehingga derajat kebebasan ν=n-1=25-1=24. Dari tabel diketahui bahwa untuk v=24, maka t 0.05 = 1.711, sedangkan hasil sampelnya memberikan

42 Kegunaan Distribusi Student t Distribusi student t biasanya digunakan dalam: 1. Kesimpulan ttg rata-rata populasi 2. Perbandingan antara dua buah rata-rata sampel 3. dll

43 Distribusi F Salah satu perbandingan yg dilakukan dalam statistik adalah perbandingan variabilitas atau variansi dari dua buah sampel. Statistik yg dipergunakan dalam membandingkan variansi 2 buah sampel dinamakan distribusi F. Jika S 1 2 dan S 2 2 adalah variansi dari 2 buah sampel random yg tak saling bergantung (independen) dengan ukuran n 1 dan n 2 yg diambil dari populasi normal dengan variansi σ 1 2 dan σ 2 2, maka statistik F: Mengikuti distribusi F dengan derajat kebebasan v 1 =n 1 -1 dan v 2 =n Distribusi F bersifat asimetrik. bentuknya bergantung pada derajat kebebasannya

44 Perbandingan Variansi: Distribution F f 0 ν= (10,30) ν= (6,10) fαfα 0 α Jika f α (v 1,v 2 ) menyatakan nilai kritis f dengan luas ekor kanan α untuk derajat kekebasan v 1,v 2, maka: (perhatikan urutan v 1 dan v 2 )

45 Tabel Distribusi F Karena ada dua derajat kebebasan yg menentukan bentuk Distribusi F maka, tabel distribusi lebih terbatas, hanya ditabelkan nilai kritis F untuk beberapa nilai luas ekor kanan yg populer dipakai (misalnya α= 5%)

46 Kegunaan Distribusi F Nanti distribusi F akan dipakai untuk memeriksa kesamaan rata-rata dari beberapa grup sampel yg diambil secara independen. Ada dua faktor yg akan menentukan apakah perbedaan rata-rata sampel memang nyata atau tidak yaitu: 1. Variasi di dalam sampel (within) 2. Variasi antar sampel (between) X X1X1 X2X2 X3X3


Download ppt "Analisa Data Statistik Chap 8: Sampling Distribution Agoes Soehianie, Ph.D."

Presentasi serupa


Iklan oleh Google