DATA MINING : DESKRIPSI

Slides:



Advertisements
Presentasi serupa
DESKRIPSI DATA Pokok bahasan ke-4.
Advertisements

Statistika dan Aplikasi Komputer Sesi 2: Ukuran Sentral dan Persebaran
SMA N 1 Karangmojo-BTKP DIY
PENYEBARAN DATA Tujuan Belajar :
Variabilitas Azimmatul Ihwah.
STATISTIKA DAN PELUANG
UKURAN DISPERSI (PENYEBARAN DATA)
PERTEMUAN II DISTRIBUSI FREKUENSI
BAB V ukuran pemusatan Dipersiapkan oleh : Ely Kurniawati
Oleh Widiyastuti,S.Pd, M.Eng SMA N 3 BOYOLALI
DESKRIPSI DATA Pertemuan 9 1. Pendahuluan : Sering digunakan peneliti, khususnya dalam memperhatikan perilaku data dan penentuan dugaan-dugaan yang selanjutnya.
Peringkasan Data (Pemusatan dan Penyebaran)
pemusatan kumpulan data
DATA DIRI DOSEN Nama : AFIJAL, S.Kom, M.Kom NIDN :
UKURAN PEMUSATAN DATA Sub Judul.
Pertemuan 1 PRAKTIKUM STATISTIKA. Definisi Statistik dan Statistika Statistik adalah kumpulan data dalam bentuk angka maupun bukan angka yang disusun.
(Tes Prestasi Belajar – Pertemuan 2)
UKURAN PEMUSATAN Rata-rata (average) : B A B V
UKURAN LOKASI DAN VARIANSI
UKURAN PEMUSATAN MK. STATISTIK (MAM 4137) 3 SKS (3-0)
Belajar bagaikan musik (berirama), terus menerus dan berkesinambungan
Ukuran Variasi atau Dispersi
BAB VI UKURAN VARIASI ATAU DISPERSI (Pengukuran Dispersi) (Pertemuan ke-8) Oleh: Andri Wijaya, S.Pd., S.Psi., M.T.I. Program Studi Sistem Informasi Sekolah.
Ukuran Penyimpangan (Dispersi)
DAFTAR DISTRIBUSI FREKUENSI
UKURAN TENDENSI SENTRAL DAN PENYIMPANGAN
7. Penyajian Data TABEL GRAFIK. 7. Penyajian Data TABEL GRAFIK.
Ukuran Nilai Sentral : Modus dan median.

UKURAN PEMUSATAN Rata-rata (average) : mempunyai kecenderungan memusat
1. Statistika dan Statistik
UKURAN PEMUSATAN DAN LETAK DATA
STATISTIK DESKRIPTIF Pengumpulan data, pengorganisasian, penyajian data Distribusi frekuensi Ukuran pemusatan Ukuran penyebaran Skewness, kurtosis.
UKURAN DISPERSI (PENYEBARAN DATA)
STATISTIK DESKRIPTIF.
S T A T I S T I K Matematika SMK Kelas/Semester: III/1
Nurratri Kurnia Sari, M. Pd
HARGA-HARGA TENGAH & SIMPANGAN
Metode Penelitian Ilmiah
BIOSTATISTIK DESKRIPTIF
UKURAN NILAI SENTRAL&UKURAN PENYEBARAN
Ukuran Nilai Sentral : Modus dan median.
UKURAN VARIASI ATAU DISPERSI (Pengukuran Dispersi)
Harga Deviasi (Ukuran Penyebaran).
STATISTIK1 Pertemuan 5: Ukuran Penyebaran Dosen Pengampu MK:
II. STUDI DESKRIPTIF DATA
UKURAN NILAI SENTRAL&UKURAN PENYEBARAN
DISTRIBUSI FREKUENSI.
II. STUDI DESKRIPTIF DATA
KIMIA ANALISIS Konsep Statistika.
STATISTIK1 Pertemuan 3: Ukuran Pemusatan dan Penyebaran
UKURAN NILAI SENTRAL&UKURAN PENYEBARAN
? 1. Konsep Statistika STATISTIKA : Kegiatan untuk : mengumpulkan data
STATISTIK 1 Pertemuan 5,6: Ukuran Pemusatan dan Penyebaran
STATISTIKA OLEH : DHANU NUGROHO SUSANTO.
OLEH : RESPATI WULANDARI, M.KES
Ukuran Variasi atau Dispersi
STATISTIKA Pertemuan 3: Ukuran Pemusatan dan Penyebaran
Ukuran Pemusatan Data Choirudin, M.Pd
STATISTIKA Pertemuan 3: Ukuran Pemusatan dan Penyebaran
DESKRIPSI DATA NUMERIK
Ukuran Pemusatan Data Choirudin, M.Pd
ALAT-ALAT MANAJEMEN (2)
VI. UKURAN PEMUSATAN UKURAN PEMUSATAN ADALAH SUATU UKURAN YANG MEMPUNYAI KECENDERUNGAN MEMUSAT ARTINYA CENDERUNG BERADA DI TENGAH-TENGAH DARI KELOMPOK.
VI. UKURAN PEMUSATAN UKURAN PEMUSATAN ADALAH SUATU UKURAN YANG MEMPUNYAI KECENDERUNGAN MEMUSAT ARTINYA CENDERUNG BERADA DI TENGAH-TENGAH DARI KELOMPOK.
UKURAN VARIASI ATAU DISPERSI (Pengukuran Dispersi)
DESKRIPSI DATA Pertemuan 3.
S T A T I S T I K Matematika SMK Persiapan Ujian Nasional Kelas/Semester: III/1.
DASAR-DASAR STATISTIKA
OLEH : SITTI HAWA, ST, MPW.  Ukuran pemusatan atau disebut rata – rata adalah menunjukan dimana suatu data memusat atau suatu kumpulan pengamatan memusat.
Transcript presentasi:

DATA MINING : DESKRIPSI OverView Berbagai cara deskripsi dan pengetahuan yg dihasilkan Deskripsi Grafis Deskripsi Lokasi Deskripsi Keberagaman Conclusion

Overview Data tinggi badan dari Kelas Biasa Data tinggi badan dari Kelas Plus No siswa Tinggi badan (cm) 1 168 2 164 3 167 4 5 171 6 166 7 169 8 172 9 10 No siswa Tinggi badan (cm) 1 175 2 176 3 183 4 180 5 177 6 7 182 8 179 9 10 171

Overview Sekilas kita sulit menangkap maksud dari kumpulan data tsb. Kumpulan data tsb perlu diolah sedemikian shg agar dpt memberikan gambaran mengenai data tsb. Bgm jika data tsb melibatkan 10.000 siswa? Maka itu, diperlukan suatu metode utk menggambarkan data scr ringkas yg disebut ‘DESKRIPSI’

Berbagai cara deskripsi dan pengetahuan yg dihasilkan Deskripsi Grafis Diagram Titik Histogram Deskripsi Lokasi Rata2 (Mean) Nilai Tengah (Median) Nilai Sering Muncul (Modus) Kuartil Persentil Deskripsi Keberagaman

Berbagai cara deskripsi dan pengetahuan yg dihasilkan Deskripsi Grafis Diagram Titik Histogram Deskripsi Lokasi Rata2 (Mean) Nilai Tengah (Median) Nilai Sering Muncul (Modus) Kuartil Persentil Deskripsi Keberagaman

Deskripsi Grafis Merupakan cara utk mendeskripsikan data dalam bentuk gambar yg sesungguhnya Dua Gambar yg umum digunakan dlm deskripsi grafis adalah diagram titik dan histogram

Diagram Titik Pengetahuan apa yg diperoleh? 165 170 175 180 Pengetahuan apa yg diperoleh? Data Kelas Biasa (merah)  165-172cm Data Kelas Plus (biru)  >175cm, namun nilainya lbh beragam dgn sebaran yg lbh luas

Histogram Data tinggi badan dari Kelas Biasa Nosis Tinggi badan (cm) 1 168 2 164 3 167 4 5 171 6 166 7 169 8 172 9 10 Nosis Tinggi badan (cm) 11 169 12 167 13 14 15 164 16 166 17 168 18 19 165 20 Nosis Tinggi badan (cm) 21 167 22 166 23 165 24 25 169 26 171 27 28 29 164 30

Histogram Langkah 1  Buat bbrp interval yg lebarnya sama Interval 164-166 166-168 168-170 170-172 172-174

Histogram Langkah 2  Hitung sbrp banyak data yg menjadi anggota tiap interval Interval Frekuensi 164-166 8 166-168 13 168-170 6 170-172 2 172-174 1

Histogram Langkah 3, Buat histogram Pengetahuan apa yg diperoleh?

Histogram Pengetahuan apa yg diperoleh? Dapat melihat lokasi kecenderungan mengumpulnya data di batang tertinggi Histogram yg “tinggi-mengerucut”  keberagaman data yg relatif rendah Histogram yg “pendek-melebar”  keberagaman data yg beragam dan menyebar luas

Deskripsi Lokasi Deskripsi grafis sdh menggambarkan karakteristik data namun sifatnya msh terlalu kasar dan kurang praktis untuk dilakukan. Shg diperlukan suatu angka yg cukup dapat mewakili data yg ada serta dpt diperoleh dengan cara yg lebih praktis daripada menggambar Angka yg dpt “mewakili” tsd  LOKASI Disebut lokasi krn dpt memberikan informasi ttd data dari dari posisi tempat tertentu.

Mean Rata2 brrti “membuat menjadi rata”  nilai perataan tsb dianggap sebagai lokasi pusat, titik berat, atau titik keseimbangan data Secara matematis, bila kita memiliki nilai observasi x1, x2, ... ,x maka rata2 adalah: n (X1 + x2 + ... + xn) = ∑ Xi X = n n i=1 Scr sederhana, persamaan tsb brrti menjumlahkan semua data, kemudian membagi dgn banyaknya data

Mean Contoh: Diketahui data Kls Biasa: 168, 164, 167, 164, 171, 166, 169, 172, 166,166 Jumlah kls biasa  1673 Maka Rata2  1673/10= 167,3 cm. Data Kls Plus: 175, 176, 183, 180, 177, 177, 182, 179, 179, 171 Jumlah kls plus  1779 Maka Rata2  1779/10= 177,9 cm.

Mean Pengetahuan apa yg diperoleh? Bhw secara umum siswa kelas biasa memiliki TB 167,3 cm. Siswa kelas biasa lebih pendek dari kelas plus yg umumnya bertinggi badan 177,9 cm.

Median Scr harfiah, mencari tempat nilai tengah. Langkah pertama urutkan data lbh dahulu Data asli kelas biasa: 168, 164, 167, 164, 171, 166, 169, 172, 166,166 Data urut menjadi: 164,164,166,166,166,167,168,169,171,172 Krn jumlah data genap (10) mk, nilai tengah antara diurutan ke-5 dan 6  166 dan 167 Median = ((data ke-5 + data ke-6)/2) = ((166+167)/2 = 166,5

Median Apa keuntungan Median dibandingkan Mean? Median tdk terlalu terpengaruh oleh adanya nilai ektrem. Maksudnya: Data terurut: 164,164,166,166,166,167,168,169,171,172 (rata2 =167,3 ------ Median = 166,5) Data terurut modifikasi: 164,164,166,166,166,167,168,169,171,1720 (rata2 =332,3 ------ Median = 166,5)

Modus Mencari nilai observasi yang sering muncul Contoh dari Data urut Kelas Biasa: 164,164,166,166,166,167,168,169,171,172  Maka, Nilai 166 adalah nilai yg sering muncul (Modus) sebanyak 3x Pengetahuan yg diperoleh adalah, bhw dari Kelas Biasa memiliki byk siswa yg TB nya 166cm

Modus Kegunaan modus; Modus lbh mencerminkan lokasi kecenderungan berkumpulnya sebagian besar data dibanding ukuran-lainnya. Contoh: Sebuah PT menyatakan bhw rata2 gaji karyawannya adalah Rp. 10 juta. Kenyataannya, 90 org digaji Rp 1 juta dan hanya 10 org yg di gaji Rp. 100 juta. Dibandingkan rata2, informasi yg lbh berguna adalah bhw sebagian besar (modus) karyawan di gaji Rp. 1 juta

Kuartil Membagi seluruh data menjadi empat bagian dan mencari nilai di tiap seperempat bagian (kuartil) Ketiga kuartil dpt dinotasikan sebagai q1, q2, q3 (q2=median) Contoh dari data terurut: 164,164,166,166,166,167,168,169,171,172 maka: q1=166; q2=(166+167)/2=165,5; q3=169

Kuartil Pengetahuan apa yg diperoleh? Apabila kita ingin membagi 4 bagian sama besar dari tinggi badan yg telah diurutkan, maka diperoleh angka 166 cm, 166,5 cm dan 169 cm

Persentil Membagi seluruh data menjadi seratus bagian dan mencari nilai di tiap seperseratus bagian (persentil) Ketiga kuartil dpt dinotasikan sebagai p0.xx Contoh, Bgm apabila ingin mencari p0.10, p0.46, p0.83? Dari data terurut: 164,164,166,166,166,167,168,169,171,172 maka: p0.10=164; p0.46=166; p0.83=171

Persentil Pengetahuan apa yg diperoleh? Apabila kita ingin membagi 100 bagian sama besar dari tinggi badan yg telah diurutkan, maka diperoleh angka-angka pada belahan tersebut

Deskripsi Keberagaman Deskripsi Lokasi sdh menggambarkan ttg lokasi pusat data (mean, median, modus), namun kita blm memilik gambaran atas keberagaman data. Sbg gambaran: Data kelompok 1: 6,6,7,7,7,8,8 (mean: 7, median:7, modus:7) Data kelompok 2: 0,1,3,7,7,12,19 (mean: 7, median:7, modus:7) Meskipun ketiga ukuran lokasi itu sama namun kedua kelompok itu “berbeda” Shg diperlukan ukuran keberagaman  range, varians dan standart deviasi

Range Besarnya rentang jarak antara data terkecil dgn data terbesar. Rentang yg besar menandakan bhw data relatif lebih beragam. Sbg gambaran: Data kelompok 1: 6,6,7,7,7,8,8 (Range kelompok 1 8-6=2) Data kelompok 2: 0,1,3,7,7,12,19 (Range kelompok 1 19-0=19)

Range Pengetahuan apa yg diperoleh? Kelompok 2 memiliki data yg lebih beragam dgn range yg jauh lbh besar drpd Kel.1 Akan tetapi, krn ukuran ini hanya mengambil dua data ekstrem  adakalanya sulit utk dijadikan ukuran unik utk menilai keberagaman data, sebagaimana contoh: Kel.1 : 6,15,15,16,16,25 (Range kel.1=25-6=19) Kel.2 : 0,1,3,7,7,12,19 (Range kel.2=19-0=19)

Varians dan Standart Deviasi Range msh blm dpt dijadikan dasar utk menilai keberagaman data. Ukuran Varians yg menggunakan prinsip mencari jarak antara setiap data dengan pusatnya (rata2) seringkali digunakan. Rumus: n _ ∑ ( Xi – X ) i=1 __________ S2 = n-1

Varians dan Standart Deviasi Data Ke- Kel. 1 (1) Kel. 2 (2) 1 6 (6 - 15,57)2 = 91,61 49 2 15 0,33 36 3 16 4 0,18 7 5 12 (12 - 7)2 = 25 25 88,90 19 144 Jumlah 109 181,71 270 Rata-rata 15,57 Varians kel.1 = 181,71 / 6 = 30,3 Varians kel.2 = 270/ 6 = 45

Varians dan Standart Deviasi Pengetahuan apa yg diperoleh? Data Kel.2 berjarak relatif lebih jauh dari pusatnya (dhi.Rata2nya, yaitu: 7) drpd data Kel.1 shg Variansnya lbh besar. Dgn kata lain, data Kel.2 lbh beragam drpd data Kel.1 Seandainya data tsb memiliki satuan cm2, maka varians memiliki satuan cm2 pula. Dampaknya Varians jadi krg sinkron dgn ukuran lainnya spt, mean, modus, persentil, range, dll  utk itu perlu dibuat Standar Deviasi

Varians dan Standart Deviasi Standar Deviasi merupakan akar kuadrat Varians Maka Standar Deviasi Kel.1 = √ 30,29 = 5,5 Maka Standar Deviasi Kel.2 = √ 45 = 6,7 Pengetahuan apakah yg diperoleh? Data Kel.2 lebih beragam dibandingkan Kel.1. Standar Deviasi memiliki satuan yg sama dgn data asalnya. Apabila data tsb memiliki satuan cm, maka Standar Deviasinya pun memiliki satuan cm Dgn demikian, hasil yg muncul menjadi lbh mudah dicerna maknanya

Conclusion Kegunaan Fungsi Deskripsi Berbagai cara menggunakan fungsi Deskripsi Berbagai ukuran yg dipakai dalam cara-2 deskripsi, cara menghitung, dan menginterpretasikan ukuran tsb.