STATISTIKA II (UM1742) Urip Haryoko, MSi. Ir. Antoyo Setyadipratikto, Ah.MG. BAHAN KULIAH AKADEMI METEOROLOGI & GEOFISIKA SEMESTER GANJIL TA. 2009/2010
Pendahuluan
Pendahuluan
Pendahuluan
Pendahuluan
Pendahuluan
Sasaran : Siswa memahami analisis time series MateriSubPertemuan Analisis eksplorasi data 1.Ukuran-ukuran summari data numerik 2.Eksplorasi data dengan grafis, 3.Eksplorasi data berpasangan, 4.Eksplorasi data berdimensi lebih dari dua 1-2 Clustering1.Cara pengelompokan 2.Aplikasi clustering untuk ZOM 3 Uji Hipotesis1.Significant level, 2.Metoda uji hipotesis 4-6 Analsis Time Series1.Moving average, 2.Fungsi autokorelasi dan auto korelasi parsial, 3.Auto regresi, 4.Analisis trend, 5.Analisis harmonik 8-10 Forecasting1.Regresi linier sederhana, 2.Regresi linier berganda, 3.Autoregressive Forecasting (AR), 4.Autoregressive Moving Average (ARMA), 5.Autoregressive Integrated Moving Average (ARIMA), 11-14
1. UKURAN-UKURAN SUMMARY DATA NUMERIK Latar Belakang Robustness and Resistance Quantile Ukuran summary Lokasi (pemusatan) Penyebaran Simetris
1.1. Robustness and Resistance Sifat-sifat yang penting dalam metode Exploratory Data Analysis (EDA) adalah robust (ketegaran) dan resistant (tahan). Robustness dan resistance adalah dua aspek ketidaksensitifitasan terhadap data. Metoda robust tidak perlu harus optimal dalam beberapa hal, namun mempunyai performa yang baik dalam hal yang lain. Misalkan statistik rata-2 sampel x-rata = xi / n adalah statistik yang terbaik untuk mengukur pemusatan data, jika diketahui bahwa data tersebut mengikuti distribusi Gauss. Namun jika data tersebut tidak mengikuti distribusi Gauss (misal : jika ada data ekstrim kejadian hujan), maka rata-rata sampel akan memperoleh nilai yang misleading. Sebaliknya, metoda- metoda robust secara umum tidak sensitif terhadap asumsi tentang data secara keseluruhan. Metoda resisten adalah dipengaruhi oleh sejumlah kecil “outlier” atau “data aneh”. Hasil dari metoda resistant hanya sedikit berubah jika sebagian kecil data diubah nilainya, meskipun perubahan itu secara drastis. Rata-rata sampel tidak mempunyai sifat resistant terhadap ukuran pemusatan data.
1.1. Robustness and Resistance Misalkan data {11, 12, 13, 14, 15, 16, 17, 18,19). Rata-rata sampelnya adalah 15. Namun jika datanya diubah menjadi {11, 12, 13, 14, 15, 16, 17, 18,91), maka rata-ratanya menjadi 23. Ukuran-ukuran yang resistant dari pemusatan sekumpulan data hanya sedikit berubah atau bahkan tidak berubah sama sekali dengan mengganti angka 19 menjadi 91. Median resistant terhadap nilai ekstrim Rata-2 tidak resistant terhadap nilai ekstrim
1.2. QUANTILE Quantile q p (0<p<1) q p = q 0,5 = median q 0,25, q 0,5, q 0,75 quartile q 0,1, q 0,2,…….q 0,9 deciles q 0,01, q 0,02, q 0,03 ……,q 0,99 percentile
1.2. QUANTILE q 0,5 = median = x ([n+1]/2) …………... n ganjil = {x (n/2) + x ([n/2]+1) }/2 … n genap = {x (n/2) + x ([n/2]+1) }/2 … n genap Contoh : Jika terdapat 9 data (n=9), nilai median adalah q 0,5 = x (5). Quartil bawah adalah q 0,25 = x (3), quartil atas adalah q 0,75 = x (7)
1.3. Ukuran Pemusatan Ukuran pemusatan yang robust dan resistant adalah ukuran median Trimean = (q 0,25 +2q 0,5 +q 0,75 )/4 (Rata-rata tertimbang dari median dan quartil. Trimean merupakan ukuran resistant)
1.4. Ukuran penyebaran (spread) Ukuran penyebaran (spread atau dispersion atau scale) yang umum, sederhana, robust dan resistant adalah interquartile range (jarak antar kuartil) IQR. IQR = q 0,75 – q 0,25 Ukuran penyebaran yang konvensional : standard deviation Koefisien Variasi : KV = (simpangan baku/rata)*100% Median Absolute Deviation (MAD) MAD = median|x i – q 0,5 |
1.5. Kesimetrisan Skewness coefficient (koefisien kemiringan) [ 1/(n-1 ] (x i – x rata ) 3 b 1 = s 3
1.5. Kesimetrisan Kurtosis coefficient (koefisien keruncingan) [ 1/(n-1 ] (x i – x rata ) 4 b 2 = s 4
2. Eksplorasi data dengan grafis Stem and Leaf Display Boxplots Schematic plot Histogram Distribusi Frekuensi Kumulatif
2.1. Eksplorasi data dengan grafis Stem and Leaf Display (diagram dahan daun) (10)
2.2. Eksplorasi data dengan grafis Boxplot (Box and Whiskers Plot) BOX Whiskers maksimum minimum Q1 Q2 Q3
2.3. Eksplorasi data dengan grafis Schematic plot Upper outer fence = q 0, IQR Upper inner fence = q 0, IQR/2 Lower inner fence = q 0, IQR/2 Lower outer fence = q 0, IQR
2.3. Eksplorasi data dengan grafis (schematic plot)
2.4. Eksplorasi data dengan grafis Histogram
2.5. Eksplorasi data dengan grafis Distribusi Frekuensi Kumulatif
2.5. Eksplorasi data dengan grafis Distribusi Frekuensi Kumulatif
Tugas mandiri / PR : Data : Hujan dan suhu Sta Tanjung Priok dan Pondok Betung Lakukan eksplorasi data sbb : 1.Summary data (pemusatan, penyebaran dan kesimetrisan) 2.Eksplorasi data dengan grafis Berikan analisis singkat AS MUCH AS POSSIBLE
BAHAN KULIAH AKADEMI METEOROLOGI & GEOFISIKA SEMESTER GANJIL TA. 2009/2010 STATISTIKA II (UM1742)
3. Eksplorasi data berpasangan Scatterplots Pearson Correlation Rank Correlation Serial Correlation
3.1. Scatterplot Diagram
3.2. Pearson Correlation Analisis Korelasi : menyelidiki ada tidaknya hubungan dua peubah atau lebih Koefisien korelasi : untuk mengukur tingginya derajad hubungan Korelasi linier : hubungan peubah acak X dan Y yang membentuk garis lurus Arah hubungan eubah dapat bernilai positif atau negatif Koefisien korelasi populasi : Koefisien korelasi sampel :
X : suhu rata-rata Y : RH rata-rata r xy : - 0,53 Hubungan antara X dan Y negatif Jika X naik maka Y turun
3.3. Rank Correlation Korelasi antar peubah yang disusun berurut (rank) r rank = 1- [6 d i 2 ] / [n(n 2 -1)]
3.4. Serial Correlation Korelasi untuk data time series Korelasi antara data ke-t dengan data ke t-k Misal : korelasi antara curah hujan bulan berjalan dengan curah hujan sebelumnya ( r yt yt-1 ) atau r 1 (k=1 atau lag =1)
3.4. Serial Correlation ( r yt yt-1 ) = ( r yt yt-1 ) =0.37
4. Eksplorasi data berdimensi lebih dari dua Correlation Matrix Scatterplot Matrix Correlation Map
4.1. Correlation Matrix
4.2. Scatter Plot Matrix
4.3. Correlation Map : Peta yang menggabarkan hubungan antara dua peubah
Tugas Data : Hujan dan suhu Sta Tanjung Priok dan Pondok Betung Lakukan eksplorasi data sbb : 1.Summary data (pemusatan, penyebaran dan kesimetrisan) 2.Eksplorasi data dengan grafik 3.Eksplorasi data berpasangan (korelasi) Berikan analisis singkat AS MUCH AS POSSIBLE