STATISTIKA PENGERTIAN JENIS – JENIS DATA

Slides:



Advertisements
Presentasi serupa
STATISTIKA DESKRIPTIF
Advertisements

STATISTIKA PENGERTIAN JENIS – JENIS DATA
BAB II ANALISA DATA.
BAB VI UKURAN VARIASI ATAU DISPERSI (Pengukuran Dispersi) (Pertemuan ke-8) Oleh: Andri Wijaya, S.Pd., S.Psi., M.T.I. Program Studi Sistem Informasi Sekolah.
Ukuran Penyimpangan (Dispersi)
Dosen: Lies Rosaria, ST., MSi
UKURAN TENDENSI SENTRAL DAN PENYIMPANGAN

HOMOGEN DAN HETEROGEN DATA
UKURAN PENYEBARAN (DISPERSI)
UKURAN DISPERSI Presented by Astuti Mahardika, M.Pd.
1. Statistika dan Statistik
Statistik Diskriptif.
Denny Agustiawan JURUSAN TEKNIK INFORMATIKA STMIK ASIA MALANG
REVIEW BIOSTATISTIK DESKRIPTIF
Sesi-2: DISTRIBUSI FREKUENSI
STATISTIK DESKRIPTIF Sarwanto.
STATISTIK DESKRIPTIF Pengumpulan data, pengorganisasian, penyajian data Distribusi frekuensi Ukuran pemusatan Ukuran penyebaran Skewness, kurtosis.
Oleh: Indah Puspita Sari, M.Pd.
UKURAN PENYEBARAN (VARIABILITAS)
Ukuran Dispersi.
REGRESI DAN KORELASI Pada bab ini akan membahas dua bagian yang saling berhubungan, khususnya dua kejadian yang dapat diukur secara matematis. Dalam hal.
KUARTIL, DESIL, DAN PERSENTIL
Ukuran Kemiringan (Skewness) dan Ukuran Keruncingan (Kurtosis)
Gejala Pusat dan Ukuran Letak
STATISTIK 1 Pertemuan 9: Ukuran Kemencengan dan Keruncingan
UKURAN PENYEBARAN DATA
UKURAN NILAI SENTRAL&UKURAN PENYEBARAN
UKURAN VARIASI ATAU DISPERSI (Pengukuran Dispersi)
Ukuran Pemusatan (Central Tendency)
UKURAN PENYEBARAN (VARIABILITAS)
BAB 6 UKURAN DISPERSI.
Ukuran kemiringan & ukuran keruncingan
UKURAN DISPERSI.
UKURAN NILAI SENTRAL&UKURAN PENYEBARAN
BIO STATISTIKA JURUSAN BIOLOGI
Ukuran Dispersi.
Probabilitas dan Statistika
BAB 5 DISPERSI, KEMIRINGAN DAN KERUNCINGAN DISTRIBUSI DATA.
UKURAN NILAI SENTRAL&UKURAN PENYEBARAN
STATISTIKA DESKRIPTIF
? 1. Konsep Statistika STATISTIKA : Kegiatan untuk : mengumpulkan data
BAB 4 UKURAN PENYEBARAN.
Ukuran Dispersi, Kemiringan dan Keruncingan
NURRATRI KURNIA SARI, M.Pd
Ukuran Pemusatan Data Choirudin, M.Pd
Ukuran Pemusatan Data Choirudin, M.Pd
UKURAN PENYEBARAN DATA
DISTRIBUSI FREKUENSI.
BAB 4 UKURAN VARIABILITAS
STATISTIKA DESKRIPTIF
Statistika Deskriptif
NAMA : MUETIA WINDA ASTUTI KELAS : 11.2A.05 NIM :
JANGKAUAN 1. Kelompok data : 2, 3, 5, 6 maka jangkauan R = Xmax-Xmin R = 6 – 2 = 4.
Statistika Deskriptif
UKURAN VARIASI ATAU DISPERSI (Pengukuran Dispersi)
Statistika Deksriptif
Deskripsi Numerik Data
Universitas Pekalongan
UKURAN LETAK & KERAGAMAN
Disusun Oleh: Nama :Ghina Rahmatina Kelas :11.2B.04 NIM :
BAB 4 UKURAN PENYEBARAN.
BAB 4 UKURAN PENYEBARAN.
NAMA : MUETIA WINDA ASTUTI KELAS : 11.2A.05 NIM :
BAB VII UKURAN UKURAN KEMIRINGAN & KERUNCINGAN
PENGUKURAN DISPERSI, KEMIRINGAN, DAN KERUNCINGAN DISTRIBUSI DATA
PENGUKURAN DISPERSI, KEMIRINGAN, DAN KERUNCINGAN DISTRIBUSI DATA
DESKRIPSI DATA Pertemuan 3.
Ukuran pemusatan dan letak data
STATISTIKA DESKRIPTIF Tendensi Sentral & Ukuran Dispersi KELOMPOK 2.
Transcript presentasi:

STATISTIKA PENGERTIAN JENIS – JENIS DATA Ilmu tentang pengumpulan data Klasifikasi Data Penyajian Data Pengolahan Data Penarikan Kesimpulan Pengambilan keputusan Populasi: Himpunan keseluruhan dari objek pengamatan Sample: Bagian dari populasi Data: Informasi atau fakta yang tertuang dalam angka atau bukan angka Deskriptif: Metode untuk mendeskripsikan, menggambarkan, menjabarkan, atau menguraikan data Inferensia: Penarikan kesimpulan dari sample untuk menjelaskan isi dari populasi JENIS – JENIS DATA Data mentah Data primer Data sekunder Data Kuantitatif Data Diskrit Data Kontinyu

CONTOH – CONTOH Civitas UMMI Data Kualitatif Data Diskrit: Data Nominal Daata Ordinal Data Dikotomi Data Kualitatif Parameter: Kualitas Pengukuran sample CONTOH – CONTOH Deskriptif “Nilai UAS mahasiswa Teknik Informatika semester 4 untuk mata kuliah Statistika adalah dengan nilai rata – rata 65” Populasi dan Sample “Civitas akademik Universitas Muhammadiyah Sukabumi terdiri dari dosen, mahasiswa dan staff pekerja lainnya yang berjumlah 1200 orang” Data Nominal Jumlah lulusan mahasiswa Universitas Muhammadiyah Sukabumi tahun 2008 l Civitas UMMI Dosen Mahasiswa Pegawai sample Populasi Program Studi Jumlah Teknik Informatik 25 orang Kimia 5 orang SDPK 4 orang

Kategori hasil nilai akhir Mata Kuliah Statistika Data Ordinal Kategori hasil nilai akhir Mata Kuliah Statistika Data Dikotomi Murni: Hidup – mati, surga – neraka, laki – laki – wanita, dll. Buatan: lulus – gagal, hitam – putih, dll. Data interval: data yang memiliki rentang atau jarak yang sama Data rasio: Data yang dinyatakan dalam perbandingan Kategori Nilai Jumlah Istimewa 10 orang Baik 12 orang Cukup 20 orang Kurang 7 orang Kurang sekali 3 orang

TENDENSI SENTRAL Rumus: Rumus: Nilai rata – rata (Mean): Biasa Dengan Frekuensi Keterangan: (jumlah data ke 1 sampai data ke-n ) (jumlah perkalian frekuensi dengan data) n = banyaknya data = jumlah frekuensi Nilai Tengah (Median): Rumus: Biasa Dengan Frekuensi Keterangan: Me = median Lo = Batas bawah kelas C = lebar kelas n = banyaknya data F = jumlah frekuensi sebelum kelas f = jumlah frekuensi kelas

Modus = Nilai yang paling sering muncul Biasa Mo = nilai yang paling sering muncul Data berfrekuensi Keterangan: Mo = modus Lo = Batas bawah kelas modus C = lebar kelas b1 = selisih frekuensi sebelum kelas modus b2 = selisih frekuensi tepat satu data setelahnya Contoh Kasus: Data hasil ujian akhir semester 4 untuk mata kuliah statistika adalah sebagai berikut: 40, 65, 90, 65, 70, 55, 85, 65, 70, 35 Tentukanlah: Rata – rata nilai UAS Modus nilai UAS Median Nilai UAS Data nilai UAS mahasiswa semester 4, untuk mata kuliah STATISTIKA adalah sebagai berikut: Tentukanlah nilai : a. Rata2 b. Modus c. Median Nilai Jml Mhs 45 6 50 8 65 14 70 16 75 9 80 4

Contoh soal data distribusi berfrekuensi Misalkan modal (dalam jutaan rupiah) dari 40 perusahaan pada tabel distribusi frekuensi berikut: Modal Frekuensi 112 - 120 4 121 - 129 5 130 - 138 8 139 - 147 12 148 -156 157 -165 166 - 174 2 = 40 Tentukan: Mean/ Rata – rata Median Modus

Kata Kunci Data Distribusi Frekuensi Kelas = selang/ interval Frekuensi = banyaknya nilai yang termasuk ke dalam kelas Limit kelas/ tepi kelas: Nilai terkecil dan terbesar pada setiap kelas, terbagi menjadi 2, yaitu limit bawah kelas dan limit atas kelas Batas bawah kelas dan batas atas kelas Lebar kelas= selisih batas atas kelas dan batas bawah kelas Nilai tengah kelas = (batas bawah kelas + batas atas kelas)/ 2

Dari contoh di atas, maka didapat: Kelas = 112 – 120 Limit kelas/ tepi kelas: pada kelas 112 – 120, Nilai 112 disebut limit bawah kelas dan nilai 120 disebut limit atas kelas Pada kelas 112 – 120, nilai 111,5 disebut batas bawah kelas dan nilai 120,5 disebut batas atas kelas Lebar kelas= 120,5 – 111,5 = 9 nilai lebar kelas pada masing – masing kelas adalah sama Nilai tengah kelas = (111,5 + 120,5)/2 = 116

Penyelesaian Soal Mean/ Rata - rata Modal Nilai Tengah (X) Frekuensi fX 112 - 120 116 4 464 121 - 129 125 5 625 130 - 138 134 8 1.072 139 - 147 143 12 1.716 148 -156 152 760 157 -165 161 644 166 - 174 170 2 340 = 40 = 5.621

MEDIAN Untuk mencari median, tentukan dulu pada kelas interval mana mediannya terletak. Karena frekuensinya bernilai genap, maka median terletak pada nilai ke Data ke 20,5 terletak pada kelas interval 139 – 147. Maka diperoleh: Lo = 138,5 f = 12 F = 4 + 5 + 8 = 17 c = 147,5 – 138,5 = 9

Jadi mediannya adalah MODUS Untuk mencari modus, tentukan dulu kelas interval yang mengandung modus, yaitu kelas interval yang memiliki frekuensi terbesar. Maka dapat diketahui bahwa modus terletak pada kelas interval 139 – 147

Dengan demikian: Lo = 138, 5 c = 9 b1 = 12-8=4 b2 = 12-5=7 Jadi modusnya adalah: = 138,5 + 3,27 = 141,77

KUARTIL, DESIL, DAN PERSENTIL KUARTIL (Perluasan Median) Kuartil terbagi menjadi 3, yaitu: Kuartil pertama/ Kuartil bawah (Q1) Kuartil kedua/ Kuartil tengah (Q2) Kuartil ketiga/ Kuartil atas (Q3) Rumus Untuk data tidak berkelompok:

Untuk data berkelompok DESIL Jika sekelompok data dibagi menjadi 10 bagian yang sama banyak, maka akan terdapat 9 pembagi, masing – masing disebut nilai Desil (D), yaitu D1, D2, …, D9 Dimana: Lo= Batas bawah kelas kuartil c = Lebar kelas F = Jumlah frekuensi semua kelas sebelum kelas kuartil Qi f = Frekuensi kelas kuartil Qi

Untuk data tidak berkelompok Untuk data berkelompok Dimana: Lo = Batas bawah kelas desil Di c = Lebar kelas F = Jumlah frekuensi semua kelas sebelum kelas desil Di f = Frekuensi kelas desil Di

PERSENTIL Jika sekelompok data dibagi menjadi 100 bagian sama banyak, maka akan terdapat 99 pembagi, yang masing – masing disebut persentil (P), yaitu P1,P2,P3,…,P99. Nilai persentil ke-I, yaitu Pi dihitung dengan rumus berikut. Untuk data tidak berkelompok:

Untuk data berkelompok Dimana: Lo = Batas bawah kelas persentil Pi c = Lebar kelas F = Jumlah frekuensi semua kelas sebelum kelas persentil Pi f = Frekuensi kelas persentil Pi

Contoh soal data tidak berkelompok Tentukan kuartil Q1, Q2 dan Q3 dari data gaji bulanan 13 karyawan (dalam ribuan rupiah) berikut. 40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100. Jawab: Urutan data: 30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85, 95, 100. Maka: Q1=nilai ke- nilai ke- = antara nilai ke 3 dan ke 4 = nilai ke 3 + ½ (nilai ke 4 – nilai ke 3) = 40 + ½ (45-40) = 40 + 2,5= 42,5

Tentukan desil D3 dan D7 dari data gaji bulanan 13 karyawan (dalam ribuan rupiah) berikut. 40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100. Jawab: Urutan data: 30, 35, 40, 45, 50, 55, 60, 65, 75, 80, 85, 95, 100. Maka: D3= nilai yang ke- = nilai ke – = nilai ke 4 + 1/5 (nilai ke 5 – nilai ke 4) = 45 + 1/5 (50-45) = 45 + 1= 46

Contoh soal data berkelompok Misalkan modal (dalam jutaan rupiah) dari 40 perusahaan pada tabel distribusi frekuensi berikut: Modal Frekuensi 112 - 120 4 121 - 129 5 130 - 138 8 139 - 147 12 148 -156 157 -165 166 - 174 2 = 40 Tentukan: Tentukan nilai kuartil Q1, Q2 dan Q3 b. Tentukan desil D3 dan D8 c. Tentukan persentil P20 dan P 80

Penyelesaian Soal Mencari Q1, Q2, dan Q3 Jawab: Tentukan dulu kelas interval Q1, Q2, dan Q3 Karena n=40, Q1 terletak pada nilai ke Nilai ke 10, 25 terletak pada interval kelas 130 – 138 Q2 terletak pada nilai ke Nilai ke 20, 5 terletak pada interval kelas 139 – 147 Q3 terletak pada nilai ke Nilai ke 30,75 terletak pada interval kelas 148 – 156 Setelah diketahui interval kelas dari tiap – tiap kuartil yang dicari, maka nilai kuartil dapat dicari dengan rumus.

Untuk Q1, terletak pada interval kelas 130 – 137, maka: Lo = 129,5 F = 4+5 = 9 f = 8 c = 9 sehingga:

Tentukan kelas interval dimana desil berada Mencari D3 dan D8 Jawab: Tentukan kelas interval dimana desil berada Karena n = 40, maka kelas interval D3 dan D8 berada pada: D3 terletak pada nilai ke Nilai ke 12,3 terletak pada interval kelas 130 – 138 D8 terletak pada nilai ke Nilai ke 32,8 terletak pada interval kelas 139 – 147 Maka nilai D3 dan D8 adalah:

Untuk D3 terletak pada interval kelas 130 – 138, maka: Lo = 129,5 F = 4+5= 9 f = 8 c = 9 Sehingga:

PENGUKURAN DISPERSI, KEMIRINGAN, DAN KERUNCINGAN DATA DISPERSI DATA Dispersi/ variasi/ keragaman data: ukuran penyebaran suatu kelompok data terhadap pusat data. Ukuran Dispersi yang akan dipelajari: Jangkauan (Range) Simpangan rata – rata (mean deviation) Variansi (variance) Standar Deviasi (Standard Deviation) Simpangan Kuartil (quartile deviation) Koefisien variasi (coeficient of variation) Dispersi multak Dispersi relatif

RANGE/ JANGKAUAN DATA (r) Range: Selisih nilai maksimum dan nilai minimum Rumus: Range untuk kelompok data dalam bentuk distribusi frekuensi diambil dari selisih antara nilai tengah kelas maksimun – nilai tengah kelas minimum Range (r) = Nilai max – nilai min

Simpangan Rata2/ Mean Deviation (SR) Simpangan rata – rata: jumlah nilai mutlak dari selisih semua nilai dengan nilai rata – rata, dibagi banyaknya data. Rumus Untuk data tidak berkelompok Dimana: X = nilai data = rata – rata hitung n = banyaknya data

VARIANSI/ VARIANCE Untuk data berkelompok Dimana: X = nilai data = rata – rata hitung n = Σf = jumlah frekuensi VARIANSI/ VARIANCE Variansi adalah rata – rata kuadrat selisih atau kuadrat simpangan dari semua nilai data terhadap rata – rata hitung. = simbol untuk sample = simbol untuk populasi

Untuk data berkelompok Rumus untuk data tidak berkelompok Untuk data berkelompok

STANDAR DEVIASI/ STANDARD DEVIATION (S) Standar deviasi: akar pangkat dua dari variansi Rumus: Untuk data tidak berkelompok Untuk data berkelompok

Contoh Soal Data tidak berkelompok Diketahui sebuah data berikut: 20, 50, 30, 70, 80 Tentukanlah: Range (r) Simpangan Rata – rata (SR) Variansi Standar Deviasai

Jawab: Range (r) = nilai terbesar – nilai terkecil = 80 – 20 = 60 Simpangan Rata – rata (SR): n = 5

Variansi Standar Deviasi (S)

Contoh Soal Data Berkelompok Diketahui data pada tabel dibawah ini: Modal Frekuensi 112 - 120 4 121 - 129 5 130 - 138 8 139 - 147 12 148 -156 157 -165 166 - 174 2 40 Tentukan: Range (r) Simpangan rata – rata (SR) Variansi Standar Deviasi

JAWAB Range (r)= (nilai tengah tertinggi – nilai tengah terendah)/2 Simpangan rata – rata Variansi Standar Deviasi n = jml frekuensi

Untuk memudahkan mencari jawaban, maka dibuat tabel sesuai dengan keperluan jawaban Modal f Nilai Tengah (X) 112 - 120 4 116 24,525 98,100 601,476 2405,902 121 - 129 5 125 15,525 77,625 241,026 1205,128 130 - 138 8 134 6,525 52,200 42,576 340,605 139 - 147 12 143 2,475 29,700 6,126 73,507 148 -156 152 11,475 57,375 131,676 658,378 157 -165 161 20,475 81,900 419,226 1676,902 166 - 174 2 170 29,475 58,950 868,776 1737,551 Jumlah 40 455,850 8097,974

Maka dapat dijawab: Range (r) = 170 – 116 = 54 Simpangan rata – rata Variansi Standar Deviasi

JANGKAUAN QUARTIL DAN JANGKAUAN PERSENTIL 10-90 Jangkauan kuartil disebut juga simpangan kuartil, rentang semi antar kuartil, deviasi kuartil. Jangkauan persentil 10-90 disebut juga rentang persentil 10-90 Jangkauan kuartil dan jangkauan persentil lebih baik daripada jangkauan (range) yang memakai selisih antara nilai maksimum dan nilai minimun suatu kelompok data Rumus: Jangkauan Kuartil: Ket: JK: jangkauan kuartil Q1: kuartil bawah/ pertama Q3: kuartil atas/ ketiga

KOEFISIEN VARIASI/ DISPERSI RELATIF Rumus Jangkauan Persentil KOEFISIEN VARIASI/ DISPERSI RELATIF Untuk mengatasi dispersi data yang sifatnya mutlak, seperti simpangan baku, variansi, standar deviasi, jangkauan kuartil,dll Untuk membandingkan variasi antara nilai – nilai bersar dengan nilai – nilai kecil. Untuk mengatasi jangkauan data yang lebih dari 2 kelompok data. Rumus: Ket: KV: Koefisien variasi S : Standar deviasi X : Rata – rata hitung

KOEFISIEN VARIASI KUARTIL Alternatif lain untuk dispersi relatif yang bisa digunakan jika suatu kelompok data tidak diketahui nilai rata – rata hitungnya dan nilai standar deviasinya. Rumus: atau

NILAI BAKU Nilai baku atau skor baku adalah hasil transformasi antara nilai rata – rata hitung dengan standar deviasi Rumus: Nilai i = 1, 2, 3, …, n

Contoh Soal untuk Koefisien Variasi dan Simpangan Baku Ada dua jenis bola lampu. Lampu jenis A secara rata – rata mampu menyala selama 1500 jam dengan simpangan baku (standar deviasi) S1 = 275 jam, sedangkan lampu jenis B secara rata – rata dapat menyala selama 1.750 jam dengan simpangan baku S2 = 300 jam. Lampu mana yang kualitasnya paling baik? Jawab: Lampu jenis A: Lampu jenis B:

Nilai rata – rata ujian akhir semester mata kuliah Statistika dengan 45 mahasiswa adalah 78 dan simpangan baku/standar deviasi (S) = 10. Sedangkan untuk mata kuliah Bahasa Inggris di Kelas itu mempunyai nilai rata – rata 84 dan simpangan bakunya (S) = 18. Bila dikelas itu, Desi mendapat nilai UAS untuk kalkulus adalah 86 dan untuk bahasa Inggris adalah 92, bagaimana posisi/ prestasi Desi di kelas itu? Jawab Untuk mengetahui posisi/ prestasi Desi, maka harus dicari nilai baku (Z) dari kedua mata kuliah tersebut. dengan nilai X adalah nilai UAS yang diperoleh Desi

Untuk Mata Kuliah Statistika X = 86 S = 10 Maka: Untuk Mata Kuliah Bahasa Inggris X = 92 S = 18 Karena nilai baku (Z) untuk mata kuliah Statistika lebih besar dari B. Inggris, maka posisi Desi lebih baik pada mata kuliah Statistika dari pada B. Inggris

KEMIRINGAN DATA Kemiringan: derajat/ ukuran dari ketidaksimetrian (asimetri) suatu distribusi data 3 pola kemiringan distribusi data, sbb: Distribusi simetri (kemiringan 0) Distribusi miring ke kiri (kemiringan negatif) Distribusi miring ke kanan (kemiringan positif)

Beberapa metoda yang bisa dipakai untuk menghitung kemiringan data, yaitu: Rumus Pearson Rumus Momen Rumus Bowley Rumus Pearson (α) atau

Rumus tersebut dipakai untuk data tidak berkelompok maupun data berkelompok. Bila α = 0 atau mendekati nol, maka dikatakan distribusi data simetri. Bila α bertanda negatif, maka dikatakan distribusi data miring ke kiri. Bila α bertanda positif, maka dikatakan distribusi data miring ke kanan. Semakin besar α, maka distribusi data akan semakin miring atau tidak simetri

RUMUS MOMEN Cara lain yang dipakai untuk menghitung derajat kemiringan adalah rumus momen derajat tiga, yaitu Untuk data tidak berkelompok: Untuk data berkelompok

Khusus untuk data berkelompok dalam bentuk tabel distribusi frekuensi , derajat kemiringan α3 dapat dihitung dengan cara transformasi sebabai berikut: Jika α3 = 0, maka distribusi data simetri Jika α3 < 0, maka distribusi data miring ke kiri Jika α3 > 0, maka distribusi data miring ke kanan

Untuk mencari nilai Standar deviasi (S) menggunakan variabel U: Variabel U = 0, ±1, ±2, ±3, dst. RUMUS BOWLEY

KERUNCINGAN DISTRIBUSI DATA Keruncingan distribusi data adalah derajat atau ukuran tinggi rendahnya puncak suatu distribusi data terhadap distribusi normalnya. Keruncingan data disebut juga kurtosis, ada 3 jenis yaitu: Leptokurtis Mesokurtis Platikurtis

KERUNCINGAN DISTRIBUSI DATA

Keruncingan distribusi data (α4) dihitung dengan rumus: Data tidak berkelompok Data Berkelompok

Khusus untuk transformasi Keterangan α4 = 3, distribusi data mesokurtis α4 > 3, distribusi data leptokurtis α4 < 3, distribusi data platikurtis

Selain cara di atas, untuk mencari keruncingan data, dapat dicari dengan menggunakan rumus: Keterangan K = 0,263 maka keruncingan distribusi data mesokurtis K > 0,263 maka keruncingan distribusi data leptokurtis K < 0,263 maka keruncingan distribusi data platikurtis K= Koefisien Kurtorsis Persentil

REGRESI DAN KORELASI Pada bab ini akan membahas dua bagian yang saling berhubungan, khususnya dua kejadian yang dapat diukur secara matematis. Dalam hal dua kejadian yang saling berhubungan, ada dua hal yang perlu diukur dan dianalisis, yaitu: Bagaimana hubungan fungsional (persamaan matematis) antara dua kejadian tersebut -> analisis regresi Bagaimana kekuatan (keeratan) hubungan dua kejadian itu -> analisis korelasi

REGRESI LINEAR SEDERHANA Garis regresi/ regresi: garis lurus/ garis linear yang merupakan garis taksiran atau perkiraan untuk mewakili pola hubungan antara variabel X dan variabel Y. Cara untuk mencari persamaan garis regresi: Dimana Y = variabel terikat X = variabel bebas a = intersep (pintasan) bilamana X=0 b = koefisien arah (slope) dari garis regresi

Koefisien regresi a dan b dapat dicari dengan rumus:

Rumus lain untuk menghitung koefisien a dan b adalah:

Kita dapat membuat garis regresi lebih dari satu dari suatu data Kita dapat membuat garis regresi lebih dari satu dari suatu data. Lalu garis regresi manakah yang paling baik?? Garis regresi yang paling baik adalah garis regresi yang mempunyai total kuadrat kesalahan/ total kuadrat selisih/ total kuadrat eror yang paling minimum. Total kuadrat eror dapat dihitung dengan:

Selanjutnya bila diambil akarnya, maka diperoleh: Bentuk terakhir ini disebut Kesalahan baku dari penafsiran Atau disebut juga Standard error of estimate Rumus di atas dapat di jabarkan menjadi:

Nih….. Contoh Soal Regresi…… Berat Badan 2 3 4 5 6 7 8 Tinggi Badan 9 Tentukanlah persamaan regresi dan kesalahan baku penafsirannya! Jawab: Persamaan regresi adalah: Untuk melengkapi persamaan tersebut, maka perlu dicari nilai a dan b. Cara mencari nilai a dan b adalah:

Untuk mempermudah mencari nilai – nilai yang diperlukan, maka akan digunakan tabel. Berat Badan (X) 2 3 4 5 6 7 8 ∑X = 35 (∑X) = 1225 Tinggi Badan (Y) 9 ∑Y = 36 X 16 25 36 49 64 ∑X = 203 XY 15 54 42 56 ∑XY = 198 Masukan nilai – nilai yang telah diketahui, ke dalam rumus untuk mencari nilai a dan b:

Setelah diketahui, nilai a dan b, maka masukan nilai a dan b ke dalam persamaan regresi. Hasilnya adalah: Ini persamaan regresi / hubungan dari variabel X dan Y tadi…. Ngerti kan???? b. Mencari nilai kesalahan baku dari penafsiran.

Masukan nilai X ke dalam persamaan regresi untuk mencari nilai Y regresi Berat Badan (X) 2 3 4 5 6 7 8 Tinggi Badan (Y) 9 3.21 3,85 4,49 5,13 5,77 6,41 7,05 0,79 1,15 -2,49 -2,13 3,33 -0,41 -0,05 0,6241 1,3225 6,2001 4,5369 11,0889 0,1681 0,0025 23,9431 Cara mencari nilai Y regresi, masukan nilai masing – masing X ke dalam persamaan regresi.

X 1 = 2 -> X 2 = 3 -> X 3 = 4 -> X 4 = 5 -> X 5 = 6 -> X 6 = 7 -> X 7 = 8 ->

Maka nilai kesalahan baku dari taksiran regresi adalah: Akhirnya…. Terjawab semuanya…. Mudah kan? ^^ Perlu diketahui, bahwa selain regresi linear, dikenal juga regresi yang bukan linear, yaitu: Parabola kuadrat Parabola kubik Eksponen Geometrik Logistik Hiperbola Gompertz Sekedar buat pengetahuan aja,,, ga dipelajari di bab ini….. Tapi kalo mau,, otodidak aja ya…

KOEFISIEN KORELASI Perumusan koefisien korelasi dilakukan dengan memakai perbandingan antara variasi yang dijelaskan dengan variasi total. Variasi total dari Y terhadap dirumuskan oleh Variasi yang tidak dijelaskan Variasi yang dijelaskan

Koefisien korelasi (r) adalah akar dari koefisien determinasi Perbandingan antara variasi yang dijelaskan dengan variasi total, yaitu: Koefisien korelasi (r) adalah akar dari koefisien determinasi adalah koefisien determinasi Rumus r pertama

Keterangan: Nilai r = -1 disebut korelasi linear negatif (berlawanan arah); artinya terdapat hubungan negatif yang sempurna antara variabel X dan Y Nilai r = 1 disebut korelasi linear positif (searah); artinya terdapat hubungan positif yang sempurna antara variable X dengan variabel Y Nilai r = 0 disebut tidak berkorelasi secara linear, artinya tidak ada hubungan antara variabel X dan Y

Koefisien korelasi dapat juga dicari dengan rumus berikut: Dimana: = kuadrat dari kesalahan baku Rumus r kedua = variansi Y Kedua rumus koefisien korelasi di atas, dapat digunakan untuk mengukur kekuatan hubungan yang bentuknya linear maupun tidak linear. Bila hubungan antara variabel X dan Y bentuknya linear, maka rumus pertama dapat diubah menjadi: Dimana: Disebut juga koefisien korelasi produk momen

Dari rumus terakhir, yaitu koefisien korelasi produk momen (product momen formula) Apabila kita ambil: Merupakan kovarians dari X dan Y Merupakan simpangan baku dari X Merupakan simpangan baku dari Y Merupakan variansi dari Y Merupakan variansi dari X

Dengan demikian, maka rumus koefisien korelasi dapat juga ditulis: Gmana??? Bingung rumus mana yang harus digunakan??? Ga usah khawatir… sesuaikan aja sama data yang diketahui….. OK?!!

Arti dari koefisien korelasi r adalah: Bila 0,90 < r < 1,00 atau -1,00 < r < -0,90: artinya hubungan yang sangat kuat Bila 0,70 < r < 0,90 atau -0,90 < r < -0,70: artinya hubungan yang kuat Bila 0,50 < r < 0,70 atau -0,70 < r < -0,50: artinya hubungan yang moderat Bila 0,30 < r < 0,50 atau -0,50 < r < -0,30: artinya hubungan yang lemah Bila 0,0 < r < 0,30 atau -0,30 < r < 0,0: artinya hubungan yang sangat lemah

Contoh soalnya nih…. Biar lebih ngerti……. Soalnya sama aja dengan yang regresi ya…. Berat Badan 2 3 4 5 6 7 8 Tinggi Badan 9 Tentukanlah: Koefisien korelasi (r) dan artinya Koefisien determinasi dan artinya Jawab:

Koefisien korelasi adalah: Berat Badan (X) 2 3 4 5 6 7 8 ∑X = 35 (∑X) = 1225 Tinggi Badan (Y) 9 ∑Y = 36 (∑Y) = 1296 X 16 25 36 49 64 ∑X = 203 XY 15 54 42 56 ∑XY = 198 Y 81 ∑Y = 220 Koefisien korelasi adalah:

Truz….

Kesimpulannya….???? Oleh karena, nilai r = 0,49 terletak antara 0,30 dan 0,50 maka terdapat hubungan positif yang lemah antara tinggi badan dan berat badan. Koefisien determinasi, yaitu Artinya, variasi tinggi badan yang dapat dijelaskan oleh variasi berat badan (X) Mahasiswa oleh persamaan regresi adalah Sebesar 24,01 %. Sisanya 75,99% dipengaruhi oleh faktor lain.

TUGAS 2 Data pada suatu pabrik kertas menunjukkan bahwa banyaknya mesin yang rusak ada hubungannya dengan kecepatan beroperasi mesin cetak. Tergambar pada tabel di bawah ini. Kecepatan mesin permenit 8 9 10 11 12 13 15 16 Jumlah kerusakan kertas (lembar) 6 7 5

Persamaan regresi linear Tentukanlah: Persamaan regresi linear Berapa perkiraan jumlah kertas yang rusak, jika kecepatan mesin permenit adalah 18? Tentukan kesalahan baku yang diberikan oleh persamaan regresi! Tentukanlah koefisien korelasi dan koefisien determinasi data tersebut serta berikan artinya masing – masing! Deadline… Next week… Don’t be late OK!!!!

STATISTIKA SEMESTER 4 QUIZ 3 Selasa, 2 Juni 2009 Data pada suatu pabrik kertas menunjukkan bahwa banyaknya mesin yang rusak ada hubungannya dengan kecepatan beroperasi mesin cetak. Tergambar pada tabel di bawah ini. Tentukanlah: Persamaan regresi linear Berapa perkiraan jumlah kertas yang rusak, jika kecepatan mesin permenit adalah 20? Kecepatan mesin permenit 7 8 9 10 11 12 14 15 Jumlah kerusakan kertas (lembar) 5 6 4