UKURAN PENYEBARAN (VARIABILITAS)
PENGUKURAN DISPERSI, KEMIRINGAN, DAN KERUNCINGAN DATA DISPERSI DATA Dispersi/ variasi/ keragaman data: ukuran penyebaran suatu kelompok data terhadap pusat data. Ukuran Dispersi yang akan dipelajari: Jangkauan (Range) Simpangan rata – rata (mean deviation) Variansi (variance) Standar Deviasi (Standard Deviation) Simpangan Kuartil (quartile deviation) Koefisien variasi (coeficient of variation) Dispersi multak Dispersi relatif
RANGE/ JANGKAUAN DATA (r) Range: Selisih nilai maksimum dan nilai minimum Rumus: Range untuk kelompok data dalam bentuk distribusi frekuensi diambil dari selisih antara nilai tengah kelas maksimum – nilai tengah kelas minimum Range (r) = Nilai max – nilai min
Simpangan Rata2/ Mean Deviation (SR) Simpangan rata – rata: jumlah nilai mutlak dari selisih semua nilai dengan nilai rata – rata, dibagi banyaknya data. Rumus Untuk data tidak berkelompok Dimana: X = nilai data = rata – rata hitung n = banyaknya data
VARIANSI/ VARIANCE Untuk data berkelompok Dimana: X = nilai data = rata – rata hitung n = Σf = jumlah frekuensi VARIANSI/ VARIANCE Variansi adalah rata – rata kuadrat selisih atau kuadrat simpangan dari semua nilai data terhadap rata – rata hitung. = simbol untuk sample = simbol untuk populasi
Untuk data berkelompok Rumus untuk data tidak berkelompok Untuk data berkelompok
STANDAR DEVIASI/ STANDARD DEVIATION (S) Standar deviasi: akar pangkat dua dari variansi Rumus: Untuk data tidak berkelompok Untuk data berkelompok
Contoh Soal Data tidak berkelompok Diketahui sebuah data berikut: 20, 50, 30, 70, 80 Tentukanlah: Range (r) Simpangan Rata – rata (SR) Variansi Standar Deviasi
Jawab: Range (r) = nilai terbesar – nilai terkecil = 80 – 20 = 60 Simpangan Rata – rata (SR): n = 5
Variansi Standar Deviasi (S)
Contoh Soal Data Berkelompok Diketahui data pada tabel dibawah ini: Modal Frekuensi 112 - 120 4 121 - 129 5 130 - 138 8 139 - 147 12 148 -156 157 -165 166 - 174 2 40 Tentukan: Range (r) Simpangan rata – rata (SR) Variansi Standar Deviasi
JAWAB Range (r)= (nilai tengah tertinggi – nilai tengah terendah)/2 Simpangan rata – rata Variansi Standar Deviasi n = jml frekuensi
Untuk memudahkan mencari jawaban, maka dibuat tabel sesuai dengan keperluan jawaban Modal f Nilai Tengah (X) 112 - 120 4 116 24,525 98,100 601,476 2405,902 121 - 129 5 125 15,525 77,625 241,026 1205,128 130 - 138 8 134 6,525 52,200 42,576 340,605 139 - 147 12 143 2,475 29,700 6,126 73,507 148 -156 152 11,475 57,375 131,676 658,378 157 -165 161 20,475 81,900 419,226 1676,902 166 - 174 2 170 29,475 58,950 868,776 1737,551 Jumlah 40 455,850 8097,974
Maka dapat dijawab: Range (r) = 170 – 116 = 54 Simpangan rata – rata Variansi Standar Deviasi
JANGKAUAN QUARTIL DAN JANGKAUAN PERSENTIL 10-90 Jangkauan kuartil disebut juga simpangan kuartil, rentang semi antar kuartil, deviasi kuartil. Jangkauan persentil 10-90 disebut juga rentang persentil 10-90 Jangkauan kuartil dan jangkauan persentil lebih baik daripada jangkauan (range) yang memakai selisih antara nilai maksimum dan nilai minimun suatu kelompok data Rumus: Jangkauan Kuartil: Ket: JK: jangkauan kuartil Q1: kuartil bawah/ pertama Q3: kuartil atas/ ketiga
KOEFISIEN VARIASI/ DISPERSI RELATIF Rumus Jangkauan Persentil KOEFISIEN VARIASI/ DISPERSI RELATIF Untuk mengatasi dispersi data yang sifatnya mutlak, seperti simpangan baku, variansi, standar deviasi, jangkauan kuartil,dll Untuk membandingkan variasi antara nilai – nilai bersar dengan nilai – nilai kecil. Untuk mengatasi jangkauan data yang lebih dari 2 kelompok data. Rumus: Ket: KV: Koefisien variasi S : Standar deviasi X : Rata – rata hitung
KOEFISIEN VARIASI KUARTIL Alternatif lain untuk dispersi relatif yang bisa digunakan jika suatu kelompok data tidak diketahui nilai rata – rata hitungnya dan nilai standar deviasinya. Rumus: atau
NILAI BAKU Nilai baku atau skor baku adalah hasil transformasi antara nilai rata – rata hitung dengan standar deviasi Rumus: Nilai i = 1, 2, 3, …, n
Contoh Soal untuk Koefisien Variasi dan Simpangan Baku Ada dua jenis bola lampu. Lampu jenis A secara rata – rata mampu menyala selama 1500 jam dengan simpangan baku (standar deviasi) S1 = 275 jam, sedangkan lampu jenis B secara rata – rata dapat menyala selama 1.750 jam dengan simpangan baku S2 = 300 jam. Lampu mana yang kualitasnya paling baik? Jawab: Lampu jenis A: Lampu jenis B:
Nilai rata – rata ujian akhir semester mata kuliah Statistika dengan 45 mahasiswa adalah 78 dan simpangan baku/standar deviasi (S) = 10. Sedangkan untuk mata kuliah Bahasa Inggris di Kelas itu mempunyai nilai rata – rata 84 dan simpangan bakunya (S) = 18. Bila dikelas itu, Desi mendapat nilai UAS untuk kalkulus adalah 86 dan untuk bahasa Inggris adalah 92, bagaimana posisi/ prestasi Desi di kelas itu? Jawab Untuk mengetahui posisi/ prestasi Desi, maka harus dicari nilai baku (Z) dari kedua mata kuliah tersebut. dengan nilai X adalah nilai UAS yang diperoleh Desi
Untuk Mata Kuliah Statistika X = 86 S = 10 Maka: Untuk Mata Kuliah Bahasa Inggris X = 92 S = 18 Karena nilai baku (Z) untuk mata kuliah Statistika lebih besar dari B. Inggris, maka posisi Desi lebih baik pada mata kuliah Statistika dari pada B. Inggris
KEMIRINGAN DATA Kemiringan: derajat/ ukuran dari ketidaksimetrian (asimetri) suatu distribusi data 3 pola kemiringan distribusi data, sbb: Distribusi simetri (kemiringan 0) Distribusi miring ke kiri (kemiringan negatif) Distribusi miring ke kanan (kemiringan positif)
Beberapa metoda yang bisa dipakai untuk menghitung kemiringan data, yaitu: Rumus Pearson Rumus Momen Rumus Bowley Rumus Pearson (α) atau
Rumus tersebut dipakai untuk data tidak berkelompok maupun data berkelompok. Bila α = 0 atau mendekati nol, maka dikatakan distribusi data simetri. Bila α bertanda negatif, maka dikatakan distribusi data miring ke kiri. Bila α bertanda positif, maka dikatakan distribusi data miring ke kanan. Semakin besar α, maka distribusi data akan semakin miring atau tidak simetri
RUMUS MOMEN Cara lain yang dipakai untuk menghitung derajat kemiringan adalah rumus momen derajat tiga, yaitu Untuk data tidak berkelompok: Untuk data berkelompok
Khusus untuk data berkelompok dalam bentuk tabel distribusi frekuensi , derajat kemiringan α3 dapat dihitung dengan cara transformasi sebabai berikut: Jika α3 = 0, maka distribusi data simetri Jika α3 < 0, maka distribusi data miring ke kiri Jika α3 > 0, maka distribusi data miring ke kanan
Untuk mencari nilai Standar deviasi (S) menggunakan variabel U: Variabel U = 0, ±1, ±2, ±3, dst. RUMUS BOWLEY
KERUNCINGAN DISTRIBUSI DATA Keruncingan distribusi data adalah derajat atau ukuran tinggi rendahnya puncak suatu distribusi data terhadap distribusi normalnya. Keruncingan data disebut juga kurtosis, ada 3 jenis yaitu: Leptokurtis Mesokurtis Platikurtis
KERUNCINGAN DISTRIBUSI DATA
Keruncingan distribusi data (α4) dihitung dengan rumus: Data tidak berkelompok Data Berkelompok
Khusus untuk transformasi Keterangan α4 = 3, distribusi data mesokurtis α4 > 3, distribusi data leptokurtis α4 < 3, distribusi data platikurtis
Selain cara di atas, untuk mencari keruncingan data, dapat dicari dengan menggunakan rumus: Keterangan K = 0,263 maka keruncingan distribusi data mesokurtis K > 0,263 maka keruncingan distribusi data leptokurtis K < 0,263 maka keruncingan distribusi data platikurtis K= Koefisien Kurtorsis Persentil
REGRESI DAN KORELASI Pada bab ini akan membahas dua bagian yang saling berhubungan, khususnya dua kejadian yang dapat diukur secara matematis. Dalam hal dua kejadian yang saling berhubungan, ada dua hal yang perlu diukur dan dianalisis, yaitu: Bagaimana hubungan fungsional (persamaan matematis) antara dua kejadian tersebut -> analisis regresi Bagaimana kekuatan (keeratan) hubungan dua kejadian itu -> analisis korelasi
REGRESI LINEAR SEDERHANA Garis regresi/ regresi: garis lurus/ garis linear yang merupakan garis taksiran atau perkiraan untuk mewakili pola hubungan antara variabel X dan variabel Y. Cara untuk mencari persamaan garis regresi: Dimana Y = variabel terikat X = variabel bebas a = intersep (pintasan) bilamana X=0 b = koefisien arah (slope) dari garis regresi
Koefisien regresi a dan b dapat dicari dengan rumus:
Rumus lain untuk menghitung koefisien a dan b adalah:
Kita dapat membuat garis regresi lebih dari satu dari suatu data Kita dapat membuat garis regresi lebih dari satu dari suatu data. Lalu garis regresi manakah yang paling baik?? Garis regresi yang paling baik adalah garis regresi yang mempunyai total kuadrat kesalahan/ total kuadrat selisih/ total kuadrat eror yang paling minimum. Total kuadrat eror dapat dihitung dengan:
Selanjutnya bila diambil akarnya, maka diperoleh: Bentuk terakhir ini disebut Kesalahan baku dari penafsiran Atau disebut juga Standard error of estimate Rumus di atas dapat di jabarkan menjadi:
Nih….. Contoh Soal Regresi…… Berat Badan 2 3 4 5 6 7 8 Tinggi Badan 9 Tentukanlah persamaan regresi dan kesalahan baku penafsirannya! Jawab: Persamaan regresi adalah: Untuk melengkapi persamaan tersebut, maka perlu dicari nilai a dan b. Cara mencari nilai a dan b adalah:
Untuk mempermudah mencari nilai – nilai yang diperlukan, maka akan digunakan tabel. Berat Badan (X) 2 3 4 5 6 7 8 ∑X = 35 (∑X) = 1225 Tinggi Badan (Y) 9 ∑Y = 36 X 16 25 36 49 64 ∑X = 203 XY 15 54 42 56 ∑XY = 198 Masukan nilai – nilai yang telah diketahui, ke dalam rumus untuk mencari nilai a dan b:
Setelah diketahui, nilai a dan b, maka masukan nilai a dan b ke dalam persamaan regresi. Hasilnya adalah: Ini persamaan regresi / hubungan dari variabel X dan Y tadi…. Ngerti kan???? b. Mencari nilai kesalahan baku dari penafsiran.
Masukan nilai X ke dalam persamaan regresi untuk mencari nilai Y regresi Berat Badan (X) 2 3 4 5 6 7 8 Tinggi Badan (Y) 9 3.21 3,85 4,49 5,13 5,77 6,41 7,05 0,79 1,15 -2,49 -2,13 3,33 -0,41 -0,05 0,6241 1,3225 6,2001 4,5369 11,0889 0,1681 0,0025 23,9431 Cara mencari nilai Y regresi, masukan nilai masing – masing X ke dalam persamaan regresi.
X 1 = 2 -> X 2 = 3 -> X 3 = 4 -> X 4 = 5 -> X 5 = 6 -> X 6 = 7 -> X 7 = 8 ->
Maka nilai kesalahan baku dari taksiran regresi adalah: Akhirnya…. Terjawab semuanya…. Mudah kan? ^^ Perlu diketahui, bahwa selain regresi linear, dikenal juga regresi yang bukan linear, yaitu: Parabola kuadrat Parabola kubik Eksponen Geometrik Logistik Hiperbola Gompertz Sekedar buat pengetahuan aja,,, ga dipelajari di bab ini….. Tapi kalo mau,, otodidak aja ya…
KOEFISIEN KORELASI Perumusan koefisien korelasi dilakukan dengan memakai perbandingan antara variasi yang dijelaskan dengan variasi total. Variasi total dari Y terhadap dirumuskan oleh Variasi yang tidak dijelaskan Variasi yang dijelaskan
Koefisien korelasi (r) adalah akar dari koefisien determinasi Perbandingan antara variasi yang dijelaskan dengan variasi total, yaitu: Koefisien korelasi (r) adalah akar dari koefisien determinasi adalah koefisien determinasi Rumus r pertama
Keterangan: Nilai r = -1 disebut korelasi linear negatif (berlawanan arah); artinya terdapat hubungan negatif yang sempurna antara variabel X dan Y Nilai r = 1 disebut korelasi linear positif (searah); artinya terdapat hubungan positif yang sempurna antara variable X dengan variabel Y Nilai r = 0 disebut tidak berkorelasi secara linear, artinya tidak ada hubungan antara variabel X dan Y
Koefisien korelasi dapat juga dicari dengan rumus berikut: Dimana: = kuadrat dari kesalahan baku Rumus r kedua = variansi Y Kedua rumus koefisien korelasi di atas, dapat digunakan untuk mengukur kekuatan hubungan yang bentuknya linear maupun tidak linear. Bila hubungan antara variabel X dan Y bentuknya linear, maka rumus pertama dapat diubah menjadi: Dimana: Disebut juga koefisien korelasi produk momen
Dari rumus terakhir, yaitu koefisien korelasi produk momen (product momen formula) Apabila kita ambil: Merupakan kovarians dari X dan Y Merupakan simpangan baku dari X Merupakan simpangan baku dari Y Merupakan variansi dari Y Merupakan variansi dari X
Dengan demikian, maka rumus koefisien korelasi dapat juga ditulis: Gmana??? Bingung rumus mana yang harus digunakan??? Ga usah khawatir… sesuaikan aja sama data yang diketahui….. OK?!!
Arti dari koefisien korelasi r adalah: Bila 0,90 < r < 1,00 atau -1,00 < r < -0,90: artinya hubungan yang sangat kuat Bila 0,70 < r < 0,90 atau -0,90 < r < -0,70: artinya hubungan yang kuat Bila 0,50 < r < 0,70 atau -0,70 < r < -0,50: artinya hubungan yang moderat Bila 0,30 < r < 0,50 atau -0,50 < r < -0,30: artinya hubungan yang lemah Bila 0,0 < r < 0,30 atau -0,30 < r < 0,0: artinya hubungan yang sangat lemah
Contoh soalnya nih…. Biar lebih ngerti……. Soalnya sama aja dengan yang regresi ya…. Berat Badan 2 3 4 5 6 7 8 Tinggi Badan 9 Tentukanlah: Koefisien korelasi (r) dan artinya Koefisien determinasi dan artinya Jawab:
Koefisien korelasi adalah: Berat Badan (X) 2 3 4 5 6 7 8 ∑X = 35 (∑X) = 1225 Tinggi Badan (Y) 9 ∑Y = 36 (∑Y) = 1296 X 16 25 36 49 64 ∑X = 203 XY 15 54 42 56 ∑XY = 198 Y 81 ∑Y = 220 Koefisien korelasi adalah:
Truz….
Kesimpulannya….???? Oleh karena, nilai r = 0,49 terletak antara 0,30 dan 0,50 maka terdapat hubungan positif yang lemah antara tinggi badan dan berat badan. Koefisien determinasi, yaitu Artinya, variasi tinggi badan yang dapat dijelaskan oleh variasi berat badan (X) Mahasiswa oleh persamaan regresi adalah Sebesar 24,01 %. Sisanya 75,99% dipengaruhi oleh faktor lain.
TUGAS 2 Data pada suatu pabrik kertas menunjukkan bahwa banyaknya mesin yang rusak ada hubungannya dengan kecepatan beroperasi mesin cetak. Tergambar pada tabel di bawah ini. Kecepatan mesin permenit 8 9 10 11 12 13 15 16 Jumlah kerusakan kertas (lembar) 6 7 5
Persamaan regresi linear Tentukanlah: Persamaan regresi linear Berapa perkiraan jumlah kertas yang rusak, jika kecepatan mesin permenit adalah 18? Tentukan kesalahan baku yang diberikan oleh persamaan regresi! Tentukanlah koefisien korelasi dan koefisien determinasi data tersebut serta berikan artinya masing – masing! Deadline… Next week… Don’t be late OK!!!!
STATISTIKA SEMESTER 4 QUIZ 3 Selasa, 2 Juni 2009 Data pada suatu pabrik kertas menunjukkan bahwa banyaknya mesin yang rusak ada hubungannya dengan kecepatan beroperasi mesin cetak. Tergambar pada tabel di bawah ini. Tentukanlah: Persamaan regresi linear Berapa perkiraan jumlah kertas yang rusak, jika kecepatan mesin permenit adalah 20? Kecepatan mesin permenit 7 8 9 10 11 12 14 15 Jumlah kerusakan kertas (lembar) 5 6 4