Statistik Non Parametrik Dr. Kurniyati Indahsari, M.Si.
Cakupan Pembahasan Review: apa dan kapan menggunakan (1) statistisk non parametrik; (2) statistisk deskriptif untuk data non parametric; (3) statistisk inferensia untuk data non parametrik Penyajian, pengolahan (alat analisis) dan interpertasi statistik deskriptif untuk data non parametrik Penyajian, pengolahan (alat analisis) dan interpertasi statistik inferensia untuk data non parametrik Studi kasus: penerapan statistik deskriptif dan inferensia untuk data non parametrik dalam penelitian
REVIEW MULAI Jenis Data ? Statistik Non Parametrik NOMINAL INTERVAL ORDINAL RASIO “Menjelasakan/ Menggambarkan” Tujuan Analisis? Menguji/ memprediksi / Menduga (induksi) Statistik Deskriptif Statistik Inferensia Jumlah Variabel ? Analisis Univariat SATU DUA / LEBIH Analisis Multivariat
REVIEW Statistik PARAMETRIK Vs NON PARAMETERIK Statistik PARAMETRIK : jika jenis data interval atau rasio; distribusi data normal atau mendekati normal. Statistik NONPARAMETRIK : jika jenis data nominal atau ordinal; distribusi data tidak diketahui atau tidak normal Statistik DESKRIPTIF Vs INFERENSIA Statistik deskriptif: metode pengumpulan, peringkasan dan penyajian data Descriptive : bersifat memberi GAMBARAN Statistik inferensia/induktif: Metode analisis, peramalan, pendugaan dan penarikan kesimpulan Inferential : bersifat melakukan generalisasi (penarikan kesimpulan)
REVIEW C. Analisis Statistik UNIVARIATE Vs MULTIVARIATE Analisis UNIVARIAT : hanya ada 1 pengukuran (variabel) untuk n sampel atau beberapa variabel tetapi masing-masing variabel dianalisis sendiri-sendiri. Contoh : korelasi motivasi dengan pencapaian akademik. Analisis MULTIVARIAT : dua atau lebih pengukuran (variabel) untuk n sampel di mana analisis antar variabel dilakukan bersamaan. Contoh : pengaruh motivasi terhadap pencapaian akademik yang dipengaruhi oleh faktor latar belakang pendidikan orang tua, faktor sosial ekonomi, faktor sekolah.
Penyajian Data Pengertian: * Arti: menyusun atau mengolah data ke bentuk yang memudahkan analisa * Tujuan: memberikan kemudahan menganalisa data
Bentuk-bentuk Penyajian Data Tabel Diagram batang Grafik / Histogram Diagram lingkaran Peta / Pemetaan Pemilihan bentuk yang akan digunakan: yang paling memudahkan bila dibaca Penyajian data dapat dilakukan secara manual ataupun bantuan software komputer, misalnya program Excel.
Tabel Ada kolom, baris yang menunjukkan informasi tentang satu atau lebih variabel Judul Tabel: memuat informasi tentang variabel yang disajikan Sumber data: diletakkan di bawah Tabel.
Pendapat tentang sertifikasi TABEL : memberikan informasi secara rinci. Terdiri atas kolom dan baris Kolom pertama : LABEL KOLOM Kolom kedua …. n : Frekuensi atau label TABEL BARIS Berisikan data berdasarkan kolom Tabel Tabulasi Silang Asal Wilayah Pendapat tentang sertifikasi Jumlah Sangat perlu Perlu Tidak tahu Tidak perlu Sangat tdk perlu Jawa Barat Jawa Tengah Jawa Timur NTT Papua
Tabel Frekuensi Tabel 1. Frekuensi dan Frekuensi Relatif Uang Kiriman per Bulan Mahasiswa Prodi EP Semester 2 TA 2015/2016 Tahun 2016 Uang Kiriman (Rp. 000) Frekuensi Frek. kumulatif Frek. Kurang dari Frek. Lebih dari Frekuensi relatif <500 1 74 0,013 500 – 600 7 8 67 0,093 601 – 700 30 38 37 0,400 701 – 800 18 56 19 0,240 801 – 900 10 66 9 0,133 901 – 1000 5 71 4 0,067 1001 – 1100 3 0,040 > 1100 75 1,000 Sumber: ………….
Diagram Batang / bar-chart Ada sumbu x, y yang masing-masing memuat informasi variabel Judul dan Sumber: Idem Tabel Lebih mudah “membaca” diagram batang daripada tabel: perbandingan, pemusatan dan sebaran data
Diagram Batang Gambar 1. Uang Kiriman per Bulan Mahasiswa Prodi EP Semester 2 TA 2015/2016 Tahun 2016 Sumber: ………………….
Grafik/Histogram Bentuk garis dari diagram batang, ada sumbu x, y Bayangkan jika variabel banyak dan ingin disajikan bersama-sama dalam satu gambar: diagram batang kurang cocok. Grafik cocok untuk variabel banyak
Grafik / Histogram Gambar 2. Frekuensi dan Frekuensi Relatif Uang Kiriman per Bulan Mahasiswa Prodi EP Semester 2 TA 2015/2016 Tahun 2016 Sumber: ………………….
Diagram Lingkaran / Pie-chart Bentuk lingkaran Hanya untuk 1 variabel dan berbentuk frekuensi relatif atau persentase. Total lingkaran = 1 (untuk frekuensi relatif) atau 100% (untuk persentase)
Diagram Lingkaran / Pie-chart Gambar 3. Uang Kiriman per Bulan Mahasiswa Prodi EP Semester 2 TA 2015/2016 Tahun 2016 Sumber: ………………….
Pemetaan Untuk melihat sebaran nilai variabel secara geografis Harus ada peta dan software komputer untuk memfasilitasi
Peta Kondisi Pendidikan Masing-Masing Kabupaten/Kota
Analisis Statistik Deskriptif dan Interpertasi Data Non Parametrik
Analisis dan Membaca/Interpertasi Data yang Sudah Tersaji Pengertian: memberikan ‘penjelasan’ tentang arti dari suatu sajian data Apa yang dilihat dan dibaca: Ukuran pemusatan, Ukuran penyebaran (perbandingan “posisi data”)
Ukuran Pemusatan Pengertian: Nilai tunggal yang mewakili suatu kumpulan data. Nilai tersebut menunjukkan pusat nilai data Khusus data kuantitatif Jenis-jenis ukuran pemusatan - Mean (rata-rata hitung) untuk parametrik - Median parametrik - Modus parametrik dan non parametrik - Rata-rata hitung tertimbang untuk parametrik
MODUS : bilangan yang paling banyak muncul Bisa disajikan dalam bentuk frekuensi per kategori Bisa pula disajikan dalam bentuk persentase dari tiap kategori Kategori Frekuensi 1 12 2 11 3 4 5 24 6 10 Jumlah 80 Kategori Nilai Frekuensi Persentase 8 – 10 8 29,6 5 – 7 17 63,0 2 – 4 2 7,4 Jumlah 27 100 -
Ukuran Penyebaran Arti: perserakan/sebaran data terhadap nilai rata-rata atau nilai tengah atau nilai modusnya Untuk data parametrik: Nilai ukuran penyebaran semakin tinggi berarti data semakin menyebar (jauh) dari nilai rata-ratanya/mean mean bukan ukuran pemusatan yang bagus Semakin kecil nilai ukuran penyebaran, berarti data menyebar (berkelompok) tidak jauh/mengumpul dgn nilai tengah mean ukuran pemusatan yang baik Dua kelompok data yang memiliki rata-rata yang sama, belum tentu mempunyai sebaran yang sama Untuk data non parametrik Perbandingan frekuensi / angka antar kelompok/kategori (kesenjangan antar kategori).
Silakan “Dibaca” Gambar 1. Uang Kiriman per Bulan Mahasiswa Prodi EP Semester 2 TA 2015/2016 Tahun 2016 Sumber: ………………….
WORLD ECONOMIC FORUM: DAYA SAING INDONESIA Beberapa Negara ASEAN Peringkat Global Competitiveness Index (GCI) Silakan dibaca juga… Sumber: WEF
Analisis Statistik Inferensia dan Interpertasi Data Non Parametrik: Korelasi Hubungan Causal
Korelasi : hubungan keterkaitan antara dua atau lebih variabel. Angka koefisien korelasi ( r ) bergerak -1 ≤ r ≤ +1 POSITIF makin besar nilai variabel 1 menyebabkan makin besar pula nilai variabel 2 Contoh : makin banyak waktu belajar, makin tinggi skor Ulangan korelasi positif antara waktu belajar dengan nilai ulangan NEGATIF makin besar nilai variabel 1 menyebabkan makin kecil nilai variabel 2 contoh : makin banyak waktu bermain, makin kecil skor Ulangan korelasi negatif antara waktu bermain dengan nilai ulangan NOL tidak ada atau tidak menentunya hubungan dua variabel contoh : pandai matematika dan jago olah raga ; pandai matematika dan tidak bisa olah raga ; tidak pandai matematika dan tidak bisa olah raga korelasi nol antara matematika dengan olah raga
Alat Analisis Korelasi berdasarkan Skala Data Skala data Variabel ke-1 nominal ordinal Interval/rasio Skala data Variabel ke-2 Chi-Kuadrat, Fisher Exact test, Koefisien Phi Sign tes, median tes, U tes, Kruskal Walis tes t-test Peringkat Spearman, Tau Kendal Transformasi variabel interval/rasio ke dalam variabel ordinal atau nominal, baru kemudian pakai teknik korelasi antara data skala ordinal-ordinal atau ordinal-nominal. Interval/ rasio Korelasi Pearson Yang dikotak merah: alat analisis dalam statistik non parametrik
KORELASI SPEARMAN (rho) dan Kendall (tau) : CONTOH KORELASI SPEARMAN (rho) dan Kendall (tau) : Digunakan jika data variabel ordinal (berjenjang atau peringkat). Disebut juga korelasi non parametrik 6Σd2 Di mana : N = banyak pasangan d = selisih peringkat rp = 1 - N(N2 – 1) Contoh : Apakah ada hubungan antara status opini atas audit BPK (WTP, WP, TW) dengan Nilai SAKIPnya (AA, A, BB, B, CC, C dan D) Data yg dibutuhkan: (1) Status opini dan nilai sakip di “angkakan, namun tetap ordinl”; (2) Status opini dan nilai sakip seluruh daerah yang diamati; (3) hitung rp Daerah A B C D Nilai SAKIP Opini d2 Σd2
CONTOH : Uji Chi-Square (X2) Chi-Square (tes independensi) : menguji apakah ada hubungan antara baris dengan kolom pada sebuah tabel kontingensi. Data yang digunakan adalah data kualitatif. Σ (O – E)2 O = skor yang diobservasi E = skor yang diharapkan (expected) X2 = Di mana E Contoh : Terdapat 20 siswa perempuan dan 10 siswa laki-laki yang fasih berbahasa Inggris, serta 10 siswa perempuan dan 30 siswa laki-laki yang tidak fasih berbahasa Inggris. Apakah ada hubungan antara jenis kelamin dengan kefasihan berbahasa Inggris ? Ho = tidak ada hubungan antara baris dengan kolom H1 = ada hubungan antara baris dengan kolom P L Σ O E (O-E) (O-E)2 (O-E)2/E a 20 (a+b)(a+c)/N b 10 (a+b)(b+d)/N c (c+d)(a+c)/N d 30 (c+d)(b+d)/N a b Fasih c d Tidak fasih Σ df = (kolom – 1)(baris – 1) Jika X2 hitung < X2 tabel, maka Ho diterima Jika X2 hitung > X2 tabel, maka Ho ditolak
Chi-Square dengan menggunakan SPSS CONTOH: Uji Chi-Square (X2) Chi-Square dengan menggunakan SPSS KASUS : apakah ada hubungan pendidikan dengan status marital responden Ho = tidak ada hubungan antara baris dengan kolom atau tidak ada hubungan pendidikan dengan status marital H1 = ada hubungan pendidikan dengan status marital pendidikan terakhir Total S1 S2 S3 status perkawinan belum kawin 21 3 1 25 kawin 32 9 6 47 janda 5 2 10 duda 4 8 62 19 90 Value df Asymp. Sig. (2-sided) Pearson Chi-Square 9,431 6 ,151 Likelihood Ratio 9,541 ,145 Linear-by-Linear Association 3,070 1 ,080 N of Valid Cases 90 Value Approx. Sig. Nominal by Nominal Contingency Coefficient ,308 ,151 N of Valid Cases 90 Hasil : tingkat signifikansi = 5% ; a asymp. Sig > 0.05 maka Ho diterima Artinya tidak ada perbedaan tingkat pendidikan berdasarkan status maritalnya dan hal ini diperlihatkan dengan kuatnya hubungan yang hanya 30.8%
Analisis Hubungan Kausal (sebab-akibat) Untuk mengetahui apakah variabel independen/VI (yang mempengaruhi) berpengaruh secara signifikan terhadap variabel dependen/VD (yang dipengaruhi) Biasa menggunakan analisis regeresi. Saat VI dan/atau VD berskala nominal/ordinal, maka tidak bisa menggunakan analisis regresi biasa, namun regresi logistik atau probit
Logit atau Probit? Logistic didasarkan pada kondisi dimana variabel tak bebasnya bersifat kualitatif (menggunakan fungsi logit) Probit didasarkan pada kondisi dimana variabel tak bebasnya bersifat kuantitatif (menggunakan distribusi kumulatif normal Probabilita ‘Sukses’) Dalam prakteknya kedua model seringkali memberikan hasil yang sama/mirip. Logit lebih mudah diinterpretasikan.
Pengertian Regresi Logistik: Suatu model matematik yang digunakan untuk mempelajari hubungan satu atau beberapa variabel independen dengan satu variabel dependen yang bersifat kategori, khususnya (binary). Variabel bianry : adalah variabel yang hanya memiliki dua nilai, misalnya (daerah maju/ daerah tertinggal atau berkembang), (Berhasil/todak berhasil), dll Variabel Independen (prediktor) sebaiknya kategorik, agar mudah untuk menginterpretasikan hasil analisisnya. Walau demikian, dapat pula variabel dengan skala interval atau rasio
Macam Regresi logistik : 1. Regresi logistik sederhana Untuk mempelajari hubungan antara satu variabel prediktor dengan satu variabel dependen dikotomus. 2. Regresi logistik ganda (Multiple Regression Logistic) Untuk mempelajari hubungan antara beberapa variabel prediktor/independen dengan satu varibel dependen dikotomus.
Contoh Penelitian denga Model Logit atau Probit Penelitian untuk mengetahui faktor-faktor yang mempengaruhi apakah seorang kandidat akan memenangkan pemilu atau tidak. Dalam kasus ini maka hasilnya adalah menang atau kalah. Beberapa faktor yg diduga berpengaruh adalah besarnyauang yang dikeluarkan dalam kampanye, lamanya waktu berkampanye negatif dan apakah kandidat memiliki jabatan atau tidak. Contoh 2: Penelitian untuk mengetahui apakah latihan OR, usia, dan jenis kelamin berpengaruh terhadap seseorang akan terkena serangan jantung atau tidak.
Contoh Penelitian denga Model Logit atau Probit Contoh 3: seorang mahasiswa ingin mengetahui faktor-faktor yang mempengaruhi seseorang memutuskan untuk menjadi TKI atau tidak. VI: jenis kelamin, status pernikana, tingkat pendidikan, pendapatan keluarga, dst. Contoh 4: Beberapa siswa SMU berkeinginan untuk melanjutkan kuliah. Dalam berkas lamarannya, mereka memasukkan skor GRE dan nilai GPA. Beberapa siswa berasal dari sekolah unggulan dan ada juga yang dari sekolah non unggulan. Beberapa bulan setelah siswa mengirimkan aplikasi, siswa tersebut menerima 2 macam amplop (tebal atau tipis) yang menandakan mereka diterima atau ditolak di PT yang bersangkutan.
Model Regresi Ganda Logistik Ln (p/(1-p) = logodd (logit). Logaritme natural dari odds. Odds : rasio probabilitas suatu peristiwa untuk terjadi dan probabilitas suatu peristiwa untuk tidak terjadi a = Konstanta ( intersep) b1 , b2 , .... bk = koefisien regresi variabel prediktor (slope) X1, X 2 ....Xk = variabel prediktor yg pengaruhnya akan diteliti. p = probabilitas untuk terjadinya “peristiwa” dari variabel dependen yg dikotomus.
Contoh sederhana pemakaian regresi logistik File
Penasaran? Silakan mencari artikel di jurnal tentang penelitian yang memanfaatkan alat ini sebagai alat analisisnya..