Upload presentasi
Presentasi sedang didownload. Silahkan tunggu
1
Statistika Dasar Bagus Sartono
2
Pokok Bahasan Pengenalan analisis dan deskripsi data
Pendugaan parameter dan selang kepercayaan Pengujian hipotesis rata-rata One-Sample T-Test Two-Sample T-Test One-Way ANOVA Korelasi dan Regresi Linear
3
Pengenalan Analisis Statistika dan Deskripsi Data Kategorik
4
Apa itu Statistika Ilmu yang mempelajari teknik-teknik pengumpulan data, analisis data, hingga proses pengambilan kesimpulan berdasarkan analisis tersebut.
5
Statistika bekerja dengan data contoh
Populasi vs contoh Populasi (population): himpunan semua individu/objek yang menjadi minat/perhatian Contoh (sample): himpunan bagian dari populasi Sensus vs Survei Sensus: proses pengumpulan data populasi Survei: proses pengumpulan data contoh Mengapa bekerja dengan contoh
6
Mengapa Contoh? Keterbatasan sumberdaya (tenaga, biaya, waktu, dll)
Sensus tidak dapat dikerjakan untuk kasus individu yang selalu bergerak ataupun bertambah jumlahnya. Proses pengumpulan data kadangkala bersifat merusak, misal: pemeriksaan kualitas kemasan, pemeriksaan rasa buah, dsb
7
Contoh harus representatif
Representatif = mewakili kesimpulan tidak bias. Contoh harus memiliki karakteristik yang sama dengan populasi karena data contoh digunakan untuk menarik kesimpulan mengenai populasi. Contoh Acak (random sample) Probability sampling vs non-probability sampling
8
Statistik sebagai penduga parameter
Parameter vs Statistik Parameter: karakteristik numerik dari populasi Statistik: karakteristik numerik dari contoh Statistik adalah penduga parameter Statistik selalu memiliki galat (error) Sampling error Non-sampling error
9
Peubah dan Jenisnya Variable, karakteristik dari individu. Misal untuk individu manusia, dapat dikumpulkan data mengenai: ukuran tubuh, usia, pekerjaan, penghasilan. Untuk individu tanaman dapat dikumpulkan data peubah ukuran tanaman, produktivitas, daya tahan terhadap hama, dsb. Numerik vs Kategorik Peubah Kategorik Nominal Ordinal Peubah Numerik Interval Ratio
10
Peubah Kategorik Nominal Ordinal
Hanya berupa penggolongan. Urutan kelas atau kategorinya tidak memiliki makna. Misal: warna baju, pekerjaan, bentuk daun Ordinal Urutan kelas atau kategorinya dapat diurutkan. Misal: intensitas serangan hama (parah, sedang, ringan), tingkat pendidikan (SD, SMP, SMA, PT), tingkat kesetujuan masyarakat (sangat setuju, setuju, kurang setuju, tidak setuju)
11
Peubah Numerik Interval Ratio
Nilai 0 pada peubah ini tidak bersifat mutlak, dan hanya berupa kesepakatan. Misal: temperatur benda/ruangan, nilai IPK Ratio Nilai 0 pada peubah ini bersifat mutlak. Misal: penghasilan per bulan, panjang benda, jumlah daun per cabang, produktivitas tanaman, berat badan sapi.
12
Analisis Statistika Statistika Deskriptif Statistika Inferensia
Mempelajari teknik-teknik yang berguna dalam peringkasan data dan pemberian gambaran umum tentang data yang dimiliki. Statistika Inferensia Mempelajari kaidah-kaidah pengambilan kesimpulan statistika dari data yang dimiliki dengan menggunakan ilmu peluang.
13
Deskripsi Data Menyajikan gambaran umum perilaku data yang dimiliki
Deskripsi dilakukan di awal proses analisis data Tujuan deskripsi data: Memberikan informasi yang cepat tentang data Mendapatkan informasi keberadaan data dengan karakteristik yang ‘aneh’ Memperoleh informasi yang berguna bagi proses analisis selanjutnya
14
Deskripsi Data Kategorik
Tabel Frekuensi (Frequency Table) Tabulasi Silang (Cross Tabulation) Grafik Bar Chart, 3D Bar Chart, Multiple Bar Chart Pie Chart
15
Deskripsi Data Kategorik
PROC FREQ DATA=stk.profile; TABLES transport / NOCUM; RUN;
16
Deskripsi Data Kategorik
PROC FREQ DATA=stk.profile; TABLES transport*budget; run;
17
Deskripsi Data Kategorik
PROC GCHART DATA=stk.profile; PIE transport; run;
18
Deskripsi Data Kategorik
PROC GCHART DATA=stk.profile; VBAR transport / GROUP=budget; where budget NE ""; run;
19
Deskripsi dan pengenalan SEBARan data numerik
20
Deskripsi Data Numerik
Ukuran Pemusatan (central tendency) Rataan Median Modus Ukuran Penyebaran (dispersion) Ragam (variance), simpangan baku (standard deviation) Range Inter-Quartile Range Pola sebaran data (data distribution)
21
Nilai tengah (rataan/rata-rata)
Definisi: merupakan ukuran yang menimbang data menjadi dua kelompok data yang memiliki massa yang sama Apabila x1, x2, ...,xN adalah anggota suatu populasi terhingga berukuran N, maka nilai tengah populasinya adalah:
22
Nilai tengah (rataan/rata-rata)
sedangkan jika x1, x2, ...,xn adalah anggota suatu contoh berukuran n, maka nilai tengah contoh tersebut adalah: dalam Bahasa Inggris, rata-rata populasi disebut dengan mean dan rata-rata contoh disebut average
23
Median Definisi : suatu nilai data yang membagi dua sama banyak kumpulan data yang telah diurutkan. Langkah Teknis: Urutkan data dari kecil ke besar Cari posisi median (nmed=(n+1)/2) Nilai median Jika nmed bulat, maka Median=X(n+1)/2 Jika nmed pecahan, maka Median=(X[nmed]+ X[nmed]+1)/2 (rata-rata dua pengamatan yang berada sebelum dan setelah posisi median)
24
Median vs Rataan Data: Median = 122, Rataan = Median = 122, Rataan =
25
Median vs Rataan Nilai rataan bersifat tidak kekar (robust), dan sangat terpengaruh oleh keberadaan nilai-nilai ekstrim. [selanjutnya nanti akan dikenalkan istilah pencilan/outlier] Adanya nilai ekstrim besar, akan menyebabkan nilai rataan cenderung membesar. Sebaliknya, nilai rataan akan mengecil jika terdapat nilai ekstrim kecil. Median cenderung tidak demikian, hanya saja secara komputasi penghitungan median lebih lama karena ada proses pengurutan data. Rataan terpangkas (trimmed mean) adalah salah satu solusi mengatasi ketidakkekaran rataan, dengan tidak menyertakan nilai ekstrim dalam penghitungan. Misal, membuang 5% data terbesar dan terkecil.
26
Ukuran Penyebaran Definisi : suatu ukuran untuk memberikan gambaran seberapa besar data menyebar dalam kumpulannya. Beberapa ukuran penyebaran: Wilayah (Range) Jarak Antar Kuartil (Interquartile Range) Ragam (Variance) Simpangan Baku (Standard Deviation) dll
27
Wilayah (Range) Definisi : suatu ukuran yang dihitung dari selisih antara nilai pengamatan terbesar dengan pengamatan terkecil W = X[N]-X[1] Ukuran ini cukup baik digunakan untuk mengukur penyebaran data yang simetrik dan nilai pengamatannya menyebar merata. Tetapi ukuran ini akan menjadi tidak relevan jika nilai pengamatan maksimum dan minimum merupakan data-data ekstrem
28
Kuartil (Quartile) Definisi : suatu nilai data yang membagi empat sama banyak kumpulan data yang telah diurutkan Q1, Q2, Q3 Cara Penghitungan Metode Belah dua Metode Interpolasi
29
Metode Belah dua Urutkan data dari kecil ke besar Cari posisi kuartil
nq2=(n+1)/2 nq1=(nq2*+1)/2= nq3, nq2* posisi kuartil dua terpangkas (pecahan dibuang) Nilai kuartil 2 ditentukan sama seperti mencari nilai median. Kuartil 1 dan 3 prinsipnya sama seperti median tapi kuartil 1 dihitung dari kiri, sedangkan kuartil 3 dihitung dari kanan.
30
Kuartil – Metode Belah Dua
Data terurut: Banyaknya data, n = 14 Posisi median, nQ2 = (14 + 1) / 2 = 7.5 Posisi Q1, nQ1 = (7 + 1) / 2 = 4 Median = ( ) / 2 = 121 Q1 = 64 Q3 = 133
31
Metode Interpolasi Urutkan data dari kecil ke besar
Cari posisi kuartil nq1=(1/4)(n+1) nq2=(2/4)(n+1) nq3=(3/4)(n+1) Nilai kuartil dihitung sebagai berikut: Xqi=Xa,i + hi (Xb,i-Xa,i) Xa,i = pengamatan sebelum posisi kuartil ke-i, Xb,i = pengamatan setelah posisi kuartil ke-i dan hi adalah nilai pecahan dari posisi kuartil
32
Kuartil – Metode Interpolasi
Data terurut: Banyaknya data, n = 14 Posisi Q1, nQ1 = (14 + 1) * 1/ 4 = 3.75 Posisi Q2, nQ2 = (14 + 1) * 2/ 4 = 7.5 Posisi Q3, nQ3 = (14 + 1) * 3/4 = 11.25 Q1 = X (X4 – X3) = (64-45) = Q2 = X (X8 – X7) = ( ) = 121 Q3 = X (X12 – X11) = ( ) =
33
Jarak antar kuartil (Interquartile Range)
Definisi : Jarak antar kuartil mengukur penyebaran 50% data ditengah-tengah setelah data diurut. Ukuran penyebaran ini merupakan ukuran penyebaran data yang terpangkas 25% yaitu dengan membuang 25% data yang terbesar dan 25% data terkecil.
34
Jarak antar kuartil (Interquartile Range)
Jarak antar kuartil dihitung dari selisih antara kuartil 3 (Q3) dengan kuartil 1 (Q1): JAK atau IQR = Q3 -Q1 Ukuran ini sangat baik digunakan jika data yang dikumpulkan banyak mengandung data pencilan
35
Ragam (Variance) Definisi : Ragam merupakan ukuran penyebaran data yang mengukur rata-rata jarak kuadrat semua titik pengamatan terhadap titik pusat (rataan). Apabila x1, x2, ...,xN]adalah anggota suatu populasi terhingga berukuran N, maka ragam populasinya adalah
36
Ragam (Variance) apabila x1, x2, ...,xn adalah anggota suatu contoh berukuran n, maka ragam contoh tersebut adalah:
37
Simpangan Baku (Standard Deviation)
Definisi : Merupakan akar dari ragam, yaitu simpangan baku populasi dan s simpangan baku sampel. diperoleh satuan yang sama dengan data aslinya
38
Teladan Perhatikan hasil ringkasan terhadap data pendapatan masyarakat (juta rupiah per bulan) dari dua kabupaten berikut ini:
39
Teladan Jika kita hanya menyajikan nilai rata-rata saja dari kedua kabupaten, maka dinyatakan bahwa masyarakat di kedua kabupaten memiliki pendapatan yang relatif sama. Penjelasan yang lebih banyak akan diperoleh jika kita melihat nilai-nilai simpangan bakunya. Kabupaten A memiliki simpangan baku yang lebih besar daripada Kabupaten B. Artinya, pendapatan masyarakat di Kabupaten A lebih heterogen dibandingkan di Kabupaten B. Implikasi dari informasi ini terhadap kesimpulan bisa signifikan.
40
Pengenalan Sebaran Data
Data distribution Statistik Statistik lima serangkai Persentil Skewness, kurtosis Grafik Histogram Boxplot
41
Pola Sebaran Data Selain menggunakan ukuran pemusatan dan ukuran penyebaran, pengenalan sebaran data dapat dilakukan menggunakan bantuan grafik: HISTOGRAM STEM & LEAF (Diagram Dahan Daun) BOX-PLOT (Diagram Kotak Garis)
42
HISTOGRAM informasi penyebaran data dan bentuk sebarannya
informasi ukuran pemusatan data informasi keberadaan data-data ekstrim dan pencilan (outliers) informasi adanya pengelompokan data
43
Tahapan Buat beberapa selang nilai yang sama lebarnya yang melingkupi semua nilai yang ada di data. Banyaknya kelas sekitar 3.3Log(n) + 1 Hitung banyaknya (frekuensi) data yang nilainya memenuhi setiap kelas Gambarkan batang setiap kelas yang tingginya proporsional dengan frekuensi
44
Ilustrasi Data n=48:
45
Banyaknya kelas = 3.3 log(48) + 1 = 6.5 7
47
Kemungkinan Informasi yang diperoleh dari bentuk sebaran
50
Nilai ukuran pemusatan di berbagai bentuk sebaran
Simetrik: rataan = rataan Menjulur ke kiri: rataan < median Menjulur ke kanan: rataan > median
51
STEM AND LEAF Mirip dengan Histogram, namun batangnya berupa nilai-nilai data Tahapan: bagi setiap data menjadi dua bagian : Dahan – Daun Letakkan nilai dahan pada sebuah kolom terurut Pasangkan daun sesuai dengan letak dahannya Urutkan nilai daun di setiap dahan Jika mungkin perbaiki tampilan dengan memecah dahan
52
Ilustrasi Data: bagi setiap data menjadi dua bagian
bagi setiap data menjadi dua bagian Letakkan nilai dahan pada sebuah kolom terurut 1 2 3
53
Pasangkan daun sesuai dengan letak dahannya
3 04
54
Urutkan nilai daun di setiap dahan
3 04
55
Jika mungkin perbaiki tampilan dengan memecah dahan
* * * 3- 04
56
Aturan memecah dahan pecah jadi 2 : pecah jadi 5 : - : 0, 1, 2, 3, 4
* : 5, 6, 7, 8, 9 pecah jadi 5 : - : 0, 1 t : 2, 3 f : 4, 5 s : 6, 7 * : 8, 9
57
BOXPLOT informasi ukuran pemusatan dan penyebaran (berupa kuartil)
informasi bentuk sebaran informasi data ekstrim
59
Tahapan hitung statistik lima serangkai (Min, Q1, Q2, Q3, Max)
hitung batas atas BA = Q3 + 3/2 (Q3-Q1) hitung batas bawah BB = Q1 - 3/2 (Q3-Q1) deteksi keberadaan pencilan, yaitu data yang nilainya kurang dari BB atau data yang lebih besar dari BA gambar kotak, dengan batas Q1 sampai Q3, dan letakkan tanda garis di tengah kotak pada posisi Q2
60
Tarik garis ke kanan, mulai dari Q3 sampai data terbesar di dalam batas atas
Tarik garis ke kiri, mulai dari Q1 sampai data terkecil di dalam batas bawah tandai pencilan dengan lingkaran kecil
61
Ilustrasi Dengan data sebelumnya diperoleh
X[1] = Min = 0 Q1 = 7.5 Q2 = 14 Q3 = 21 X[n] = Max = 34 Batas Bawah = 7.5 – 3/2(21 – 7.5) = Batas Atas = /2(21 – 7.5) = 41.25
64
Sebaran Penarikan Contoh
65
Sebaran Nilai Statistik
Statistik: karakteristik numerik yang diperoleh dari data contoh Dari sebuah populasi dapat diperoleh banyak contoh acak. Dari setiap contoh acak, dapat dihitung sebuah nilai statistik. Nilai statistik tersebut dapat berbeda-beda antar contohnya. Statistik adalah peubah acak, dan memiliki sebaran.
66
populasi contoh rata-rata 0.5 2.5 1.5 1.5
67
Rata-rata Contoh Misalkan terdapat suatu populasi dengan banyaknya anggota sebesar N, rata-rata sebesar dan ragam sebesar 2, ditarik contoh berukuran n. Maka memiliki rata-rata sebesar memiliki ragam sebesar Dengan Pemulihan Tanpa Pemulihan untuk N -> ∞,
68
Jika x1, x2, …, xn adalah contoh acak berukuran n yang diambil dari populasi dengan sebaran N(µ, 2), maka rata-rata contoh akan memiliki sebaran N(, 2/n) Dengan demikian memiliki sebaran N(0, 1) atau sebaran Z
69
Ilustrasi Andaikan sebuah contoh acak berukuran 8 diambil dari populasi dengan sebaran N(5, 16). Maka rata-rata contoh akan memiliki sebaran N(5, 2). Peluang mendapatkan contoh dengan rata-rata kurang dari 4 adalah P(xbar < 4) = P(Z < (4-5)/2) = P(Z < -0.71) =
70
Selang Kepercayaan bagi Rata-Rata
1 - Lower Limit Upper Limit
71
Selang Kepercayaan bagi Rata-Rata
1 -
72
Selang Kepercayaan bagi Rata-Rata
1 - /2 Z/2 99% 0.005 2.57 95% 0.025 1.96 90% 0.050 1.645
73
Ilustrasi Andaikan sebuah contoh acak berukuran 25 diambil dari populasi yang menyebar normal dengan ragam 16. Jika rata-rata data contoh adalah 10, maka selang kepercayaan 95% bagi rata-rata adalah
74
Ilustrasi Dengan tingkat keyakinan/kepercayaan 95%, kita yakin bahwa rata-rata populasi antara dan
75
Pada banyak (semua) kasus, ragam populasi atau 2 tidak diketahui
Problem Pada banyak (semua) kasus, ragam populasi atau 2 tidak diketahui
76
Jika x1, x2, …, xn adalah contoh acak berukuran n yang diambil dari populasi dengan sebaran normal, maka memiliki sebaran t-student dengan derajat bebas (n-1)
77
Selang Kepercayaan bagi Rata-Rata: ragam populasi tidak diketahui
1 -
79
Ilustrasi Andaikan sebuah contoh acak berukuran 25 diambil dari populasi yang menyebar normal. Jika rata-rata dan ragam dari data contoh masing-masing adalah 10 dan 20, maka selang kepercayaan 95% bagi rata-rata adalah
80
Teorema Limit Pusat (central limit theorem)
Jika x1, x2, …, xn adalah contoh acak berukuran n dari populasi dengan sebaran tertentu yang memiliki rata-rata dan ragam masing-masing dan 2, untuk n (n sangat besar) maka memiliki sebaran N(0, 1)
81
Selang Kepercayaan bagi Proporsi
Proporsi (p) adalah rata-rata dari peubah biner yang nilai datanya diganti 1 untuk kejadian yang diinginkan dan 0 untuk selainnya. Untuk contoh dengan ukuran yang besar, sebaran proporsi (p) mendekati sebaran normal. Ragam dari peubah biner adalah np(1-p), sehingga ragam proporsi adalah p(1-p)
82
Selang Kepercayaan bagi Proporsi
1 - /2 Z/2 99% 0.005 2.57 95% 0.025 1.96 90% 0.050 1.645
83
Ilustrasi Pemeriksaan terhadap 1000 bayi berusia antara 2 hingga 6 bulan di Kota Bogor mendeteksi adanya 300 bayi yang mendapat makanan dengan gizi kurang. Dengan demikian, selang kepercayaan 95% bagi proporsi bayi dengan gizi kurang adalah:
84
Latihan (3) Dari pemeriksaan terhadap 200 lembar papan yang dihasilkan dari sebuah pabrik pemotongan kayu, diperoleh 8 lembar papan yang cacat. Buat selang kepercayaan 90% bagi proporsi papan cacat produksi pabrik tersebut. Wawancara terhadap 400 penumpang KRL Commuter Line menghasilkan sebanyak 285 orang yang tidak setuju kenaikan harga tiket awal bulan ini. Buat selang kepercayaan 95% bagi proporsi penumpang yang tidak setuju kenaikan harga.
85
n = 400 p = 285 / 400 = 71.25% penduga titik (point estimate) 1 - = 95% z/2 = 1.96 Penduga selang (interval estimate)
86
Pengujian Hipotesis mengenai Rataan Populasi
87
Rataan populasi: Rataan Contoh nilainya tidak diketahui
nilainya diduga nilainya diasumsikan sama dengan, kurang dari atau lebih dari nilai tertentu nilainya dihipotesiskan Rataan Contoh digunakan untuk menduga rataan populasi digunakan untuk mengkonfirmasi hipotesis tentang rataan populasi kesimpulan konfirmasi hipotesis: ditolak vs diterima
88
Ditolak (rejected) : hipotesis tidak didukung oleh data, data tidak cukup mendukung hipotesis
Diterima (accepted): hipotesis didukung oleh data
89
Kesalahan Kesimpulan Kondisi Sebenarnya (tapi tidak diketahui)
Hipotesis Benar Hipotesis Salah Diterima Kesimpulan Konfirmasi (berdasarkan data contoh) Ditolak Apapun kesimpulan yang diambil berdasarkan data contoh, mengandung peluang membuat kesalahan.
90
Bentuk Hipotesis Hipotesis dalam statistika dinyatakan dalam dua bentuk yaitu: H0 (hipotesis nol / null hypothesis) H1 / HA (hipotesis alternatif / alternative hypothesis) H0 dan H1 bertolak belakang, tidak mungkin dua-duanya ditolak dan tidak mungkin dua-duanya diterima. Penolakan terhadap H0 berimplikasi pada penerimaan terhadap H1, dan sebaliknya.
91
Bentuk Hipotesis Two-Tail Hypothesis One-Tail Hypothesis H0 : = 0
92
Kesalahan Kesimpulan Type II Error () Type I Error ()
Kondisi Sebenarnya (tapi tidak diketahui) H0 Benar H0 Salah Type II Error () Type I Error () Terima H0 Kesimpulan Konfirmasi (berdasarkan data contoh) Tolak H0 ditentukan oleh pengambil kesimpulan. Secara umum membesar jika mengecil. disebut juga sebagai taraf nyata (significance level).
93
Kesalahan Kesimpulan
94
Pengambilan Kesimpulan
H0 : = 0 H1 : 0 Jika H0 benar maka x-bar akan menyebar mengikuti sebaran N(0, 2/n) Wilayah penolakan H0: x-bar lebih dari 0 + z/2 /n x-bar kurang dari 0 – z/2 / n
95
Pengambilan Kesimpulan
H0 : = 0 H1 : 0 Jika didefinisikan zhitung sebagai Tolak H0 jika |zhitung| > z/2 1 - /2 Z/2 99% 0.005 2.57 95% 0.025 1.96 90% 0.050 1.645
96
Pengambilan Kesimpulan
H0 : = 0 H1 : 0 Pada kondisi nilai ragam (2) atau simpangan baku () populasi tidak diketahui, didefinisikan thitung sebagai Tolak H0 jika |thitung| > t/2 dengan derajat bebas (n – 1)
97
Pengambilan Kesimpulan
Daerah penolakan H0 sangat tergantung dari bentuk hipotesis alternatif (H1) dan statistik uji Uji Z (Z-test) H1: < 0 Tolak H0 jika zhitung < -z (tabel) H1: > 0 Tolak H0 jika zhitung > z (tabel) H1: 0 Tolak H0 jika |zhitung| > z/2(tabel) Uji t (t-test) H1: < 0 Tolak H0 jika thitung < -t(; db=n-1)(tabel) H1: > 0 Tolak H0 jika thitung > t(; db=n-1)(tabel) H1: 0 Tolak H0 jika |thitung| > t(/2; db=n-1)(tabel) daerah kritis (critical region)
99
Ilustrasi Batasan yang ditentukan oleh pemerintah terhadap emisi gas CO kendaraan bermotor adalah 50 ppm. Sebuah perusahaan baru yang sedang mengajukan ijin pemasaran mobil, diperiksa oleh petugas pemerintah untuk menentukan apakah perusahan tersebut layak diberikan ijin. Sebanyak 20 mobil diambil secara acak dan diuji emisi CO-nya. Dari data yang didapatkan, rata-ratanya adalah 55 dan ragamnya 4.2. Dengan menggunakan taraf nyata 5%, layakkah perusahaan tersebut mendapat ijin ?
100
Daerah kritis pada taraf nyata 0.05
Hipotesis yang diuji: H0 : 50 vs H1 : > 50 Statistik uji: th= (55-50)/(4.2/20)=10.91 Daerah kritis pada taraf nyata 0.05 Tolak Ho jika th > t(0.05;db=19) = 1.729
101
Kesimpulan: Tolak H0, artinya emisi gas CO kendaraan bermotor yang akan dipasarkan oleh perusahaan tersebut melebihi batasan yang ditentukan oleh pemerintah sehingga perusahaan tersebut tidak layak memperoleh ijin untuk memasarkan mobilnya.
102
Latihan CV Ayo Kurban menyatakan bahwa kambing-kambing kurban yang mereka sediakan memiliki rata-rata bobot 48 kg. Pemeriksaan terhadap 15 ekor kambing memberikan data bobot sebagai berikut: Dengan taraf nyata 5%, apakah pernyataan CV Ayo Kurban didukung oleh data yang ada? 47 49 51 52 46 48 45 50
103
One-Way Anova
104
Outline Review Pengujian Hipotesis Pembandingan Nilai Tengah Dua Populasi Pengujian Hipotesis Pembandingan Nilai Tengah k Populasi, k > 2 : One-Way ANOVA Uji Perbandingan Berpasangan Fisher’s LSD Tukey’s HSD
105
Pembandingan Nilai Tengah k Populasi
1 2 3 4 dengan mengasumsikan ragam dari semua populasi sama besar, ingin diuji apakah populasi-populasi tersebut memiliki nilai tengah atau rata-rata yang sama besar. H0 : 1 = 2 = 3 = 4 H1 : setidaknya ada satu pasangan i j
106
Bagaimana membandingkannya?
Contoh 1 Contoh 2 Contoh 3 Contoh 4 n1 n2 n3 n4 H0 akan cenderung ditolak jika perbedaan antar x-bar semakin besar H0 akan cenderung ditolak jika ‘variasi’ antar x-bar semakin besar
107
Bagaimana membandingkannya?
Contoh 1 Contoh 2 Contoh 3 Contoh 4 n1 n2 n3 n4 Jika didefinisikan sebagai rataan umum (grand mean), yaitu rataan dari data gabungan semua contoh, maka selisih antara dan dapat dipandang sebagai ukuran variasi antar populasi
108
Variasi Total Ukuran variasi/perbedaan nilai setiap individu amatan dengan rata-rata umum. Diukur dalam bentuk SS(T), Sum of Squares Total [JKT = jumlah kuadrat total]
109
Variasi antar Populasi
Diukur menggunakan SS(B), Sum of Squares Between Mengukur variasi antar rata-rata setiap contoh dengan rata-rata umum (grand mean) Diboboti oleh banyaknya amatan (sample size) dari masing-masing contoh
110
Variasi dalam Populasi
Meskipun dari contoh yang sama, nilai amatan bisa berbeda-beda ada variasi dalam populasi Diukur menggunakan SS(W), Sum of Squares Within Mengukur variasi antara nilai setiap amatan dengan rata-rata contoh
111
One-Way ANOVA Memecah variasi total menjadi dua sumber yaitu variasi antar populasi dan variasi dalam populasi ANOVA: analysis of variance, analisis ragam, sidik ragam Dapat ditunjukkan bahwa SS(T) = SS(B) + SS(W) Penolakan terhadap H0 dilakukan jika porsi SS(B) jauh lebih besar dibandingkan porsi SS(W) SS(W) merupakan variasi yang diakibatkan oleh faktor lain selain faktor perbedaan populasi. Sehingga, SS(W) juga dikenal sebagai SS(E), sum of squares error.
112
One-Way ANOVA Direpresentasikan dalam bentuk tabel: Tabel ANOVA Source
df SS MS F Between k – 1 SS(B) MS(B) = SS(B)/ dfB Within n – k SS(W) MS(W) = SS(W)/dfW Total n – 1 SS(T) = SS(B ) + SS(W) df: degree of freedom, SS: sum of squares, MS: mean of squares = SS/df Sumber db JK KT F Antar Populasi k – 1 Dalam Populasi n – k Total n – 1 db: derajat bebas, JK: jumlah kuadrat, KT: kuadrat tengah = JK/db
113
H1 : setidaknya ada satu pasangan i j
One-Way ANOVA H0 : 1 = 2 = 3 = 4 H1 : setidaknya ada satu pasangan i j Uji F Kriteria penolakan H0 F > Ftabel dengan derajat bebas (dfB, dfW)
114
Ilustrasi
115
Permasalahan Suatu kelas dibagi dalam tiga kelompok berdasarkan baris tempat duduk siswa: depan, tengah, belakang Seorang guru ingin mengetahui apakah posisi tempat duduk mempengaruhi pemahaman siswa terhadap materi pelajaran. Ingin dibandingkan rata-rata nilai dari tiga kelompok tempat duduk.
116
Data Contoh acak dari setiap kelompok baris tempat duduk diambil.
Data nilai ujian mata pelajaran yang berhasil dikumpulkan adalah sebagai berikut Depan : 82, 83, 97, 93, 55, 67, 53 Tengah : 83, 78, 68, 61, 77, 54, 69, 51, 63 Belakang: 38, 59, 55, 66, 45, 52, 52, 61
117
Statistik Deskriptif Ringkasan statistik deskriptif dari data di slide sebelumnya adalah sebagai berikut Depan Tengah Belakang n 7 9 8 Rata-rata 75.71 67.11 53.50 St. Dev (simpangan baku) 17.63 10.95 8.96 Variance (ragam) 310.90 119.86 80.29
118
Rata-Rata Umum (grand mean)
119
SS(B)
120
SS(W)
121
Tabel ANOVA Source df SS MS F Between 2 1902 951.0 5.9 Within 21 3386
161.2 Total 23 5288 229.9 Ftabel pada db1 = 2 dan db2 = 21, serta = 5% adalah Karena nilai F lebih dari Ftabel, kita simpulkan Tolak H0, dengan demikian dikatakan bahwa rata-rata tingkat penguasaan materi pelajaran di tiga tempat duduk tersebut tidak semuanya sama besar. Dalam bahasa lain, posisi tingkat duduk mempengaruhi tingkat pengusaan materi pelajaran.
122
Analisis Korelasi dan Regresi Linear
123
Hubungan Antar Peubah Dari setiap objek/individu/tempat/dll dapat diukur/dicatat/diamati lebih dari satu buah peubah. Nilai dari suatu peubah bersifat: saling bebas dengan peubah lain saling terkait dengan peubah lain
124
Hubungan antar Peubah berat badan suhu rata-rata tinggi badan
ketinggian tempat
125
Koefisien Korelasi Diperlukan sebuah ukuran yang dapat mencirikan keeratan hubungan antar dua peubah. Koefisien Korelasi ( ; baca: rho) nilainya: -1 1 tanda menunjukkan arah hubungan besar/magnitude menunjukkan kekuatan hubungan koefisien korelasi data contoh dinotasikan r
126
Koefisien Korelasi (Pearson)
Jika ada dua peubah X dan Y, korelasi antara keduanya adalah
127
Koefisien Korelasi (+)
128
Koefisien Korelasi (-)
129
Ilustrasi Tinggi Badan Berat Badan 165 49 159 58 166 60 173 67 179 69
164 56 163 53 154 51 170 158 44
130
Ilustrasi x y x-xbar y-ybar (x-xbar)2 (y-ybar)2 (x-xbar)(y-ybar) 165
49 -0.1 -7.7 0.01 59.29 0.77 159 58 -6.1 1.3 37.21 1.69 -7.93 166 60 0.9 3.3 0.81 10.89 2.97 173 67 7.9 10.3 62.41 106.09 81.37 179 69 13.9 12.3 193.21 151.29 170.97 164 56 -1.1 -0.7 1.21 0.49 163 53 -2.1 -3.7 4.41 13.69 7.77 154 51 -11.1 -5.7 123.21 32.49 63.27 170 4.9 24.01 16.17 158 44 -7.1 -12.7 50.41 161.29 90.17 165.1 56.7 jumlah 496.9 548.1 426.3
131
Regresi Linear: Pengantar
Terdapat 2 peubah numerik : peubah yang satu mempengaruhi peubah yang lain Peubah yang mempengaruhi X, peubah bebas (independent), peubah penjelas (explanatory) Peubah yang dipengaruhi Y, peubah tak bebas (dependent), peubah respon (response)
132
Pengantar Misalnya ingin melihat hubungan antara pengeluaran untuk iklan (ads expenditures, X) dengan penerimaan melalui penjualan (sales revenue, Y) Bulan 1 2 3 4 5 6 7 8 9 10 X 11 12 13 14 15 Y 44 40 42 46 48 52 54 58 56 60
133
Pengantar
134
Pengantar Y = a + bX Ingin dibuat model
Model memuat error, selisih nilai sebenarnya dengan dugaan berdasar model
135
Bagaimana mendapatkan a dan b?
Metode yang digunakan : OLS (ordinary least squares/kuadrat terkecil), mencari a dan b sehingga jumlah kuadrat error paling kecil Cari penduga a dan b sehingga minimum
136
Bagaimana mendapatkan a dan b?
Rata-rata X Rata-rata Y
137
Ilustrasi Perhitungan
X Y X-Xbar Y-Ybar (X-Xbar)(Y-Ybar) (X-Xbar)2 10 44 -2 -6 12 4 9 40 -3 -10 30 11 42 -1 -8 8 1 46 -4 48 2 52 13 54 58 14 56 6 b = 106 / 30 = 3.533 a = 50 – (12) = 7.60
139
Interpretasi a dan b Y = 7. 6 + 3. 53 X Pendapatan = 7. 6 + 3
Interpretasi a dan b Y = X Pendapatan = Belanja Iklan a = intersep/intercept = besarnya nilai Y ketika X sebesar 0 b = gradient/slope = besarnya perubahan nilai Y ketika X berubah satu satuan. Tanda koefisien b menunjukkan arah hubungan X dan Y Pada kasus ilustrasi a = 7.6 besarnya sales revenue jika tidak ada belanja iklan adalah 7.6 juta dolar b = jika belanja iklan dinaikkan 1 juta dolar maka sales revenue naik juta dolar
140
Uji Signifikasi Koefisien b
H0 : b = 0 (artinya X tidak mempengaruhi Y) H1 : b 0 (artinya X mempengaruhi Y) Tolak H0 jika nilai |t| melebihi nilai t pada tabel dengan derajat bebas (n-2) dengan tingkat kesalahan /2
141
Uji signifikansi koefisien b
Nilai sb = (65.47 / (8)(30)) = 0.52 Nilai t = 3.53 / 0.52 = 6.79 Nilai t pada tabel (db = 8, = 5%) = 2.306 Kesimpulan : Tolak H0, data mendukung kesimpulan adanya pengaruh ads expenditure terhadap sales revenue.
142
Ukuran Kebaikan Model Menggunakan koefisien determinasi (R2, R-squared) R-squared bernilai antara 0 s/d 1 R-squared adalah persentase keragaman data yang mampu diterangkan oleh model R-squared tinggi adalah indikasi model yang baik
143
Ukuran Kebaikan Model Model dalam ilustrasi bisa ditunjukkan memiliki R-squared 0.85 atau 85%
Presentasi serupa
© 2024 SlidePlayer.info Inc.
All rights reserved.