Presentasi sedang didownload. Silahkan tunggu

Presentasi sedang didownload. Silahkan tunggu

STATISTIKA II (UM1742) Urip Haryoko, MSi. Ir. Antoyo Setyadipratikto, Ah.MG. BAHAN KULIAH AKADEMI METEOROLOGI & GEOFISIKA SEMESTER GANJIL TA. 2009/2010.

Presentasi serupa


Presentasi berjudul: "STATISTIKA II (UM1742) Urip Haryoko, MSi. Ir. Antoyo Setyadipratikto, Ah.MG. BAHAN KULIAH AKADEMI METEOROLOGI & GEOFISIKA SEMESTER GANJIL TA. 2009/2010."— Transcript presentasi:

1 STATISTIKA II (UM1742) Urip Haryoko, MSi. Ir. Antoyo Setyadipratikto, Ah.MG. BAHAN KULIAH AKADEMI METEOROLOGI & GEOFISIKA SEMESTER GANJIL TA. 2009/2010

2 Pendahuluan

3 Pendahuluan

4 Pendahuluan

5 Pendahuluan

6 Pendahuluan

7 Sasaran : Siswa memahami analisis time series MateriSubPertemuan Analisis eksplorasi data 1.Ukuran-ukuran summari data numerik 2.Eksplorasi data dengan grafis, 3.Eksplorasi data berpasangan, 4.Eksplorasi data berdimensi lebih dari dua 1-2 Clustering1.Cara pengelompokan 2.Aplikasi clustering untuk ZOM 3 Uji Hipotesis1.Significant level, 2.Metoda uji hipotesis 4-6 Analsis Time Series1.Moving average, 2.Fungsi autokorelasi dan auto korelasi parsial, 3.Auto regresi, 4.Analisis trend, 5.Analisis harmonik 8-10 Forecasting1.Regresi linier sederhana, 2.Regresi linier berganda, 3.Autoregressive Forecasting (AR), 4.Autoregressive Moving Average (ARMA), 5.Autoregressive Integrated Moving Average (ARIMA), 11-14

8 1. UKURAN-UKURAN SUMMARY DATA NUMERIK  Latar Belakang  Robustness and Resistance  Quantile  Ukuran summary  Lokasi (pemusatan)  Penyebaran  Simetris

9 1.1. Robustness and Resistance Sifat-sifat yang penting dalam metode Exploratory Data Analysis (EDA) adalah robust (ketegaran) dan resistant (tahan). Robustness dan resistance adalah dua aspek ketidaksensitifitasan terhadap data. Metoda robust tidak perlu harus optimal dalam beberapa hal, namun mempunyai performa yang baik dalam hal yang lain. Misalkan statistik rata-2 sampel x-rata =  xi / n adalah statistik yang terbaik untuk mengukur pemusatan data, jika diketahui bahwa data tersebut mengikuti distribusi Gauss. Namun jika data tersebut tidak mengikuti distribusi Gauss (misal : jika ada data ekstrim kejadian hujan), maka rata-rata sampel akan memperoleh nilai yang misleading. Sebaliknya, metoda- metoda robust secara umum tidak sensitif terhadap asumsi tentang data secara keseluruhan. Metoda resisten adalah dipengaruhi oleh sejumlah kecil “outlier” atau “data aneh”. Hasil dari metoda resistant hanya sedikit berubah jika sebagian kecil data diubah nilainya, meskipun perubahan itu secara drastis. Rata-rata sampel tidak mempunyai sifat resistant terhadap ukuran pemusatan data.

10 1.1. Robustness and Resistance Misalkan data {11, 12, 13, 14, 15, 16, 17, 18,19). Rata-rata sampelnya adalah 15. Namun jika datanya diubah menjadi {11, 12, 13, 14, 15, 16, 17, 18,91), maka rata-ratanya menjadi 23. Ukuran-ukuran yang resistant dari pemusatan sekumpulan data hanya sedikit berubah atau bahkan tidak berubah sama sekali dengan mengganti angka 19 menjadi 91. Median  resistant terhadap nilai ekstrim Rata-2  tidak resistant terhadap nilai ekstrim

11 1.2. QUANTILE  Quantile  q p (0<p<1)  q p = q 0,5 = median  q 0,25, q 0,5, q 0,75  quartile  q 0,1, q 0,2,…….q 0,9  deciles  q 0,01, q 0,02, q 0,03 ……,q 0,99  percentile

12 1.2. QUANTILE  q 0,5 = median = x ([n+1]/2) …………... n ganjil = {x (n/2) + x ([n/2]+1) }/2 … n genap = {x (n/2) + x ([n/2]+1) }/2 … n genap  Contoh : Jika terdapat 9 data (n=9), nilai median adalah q 0,5 = x (5). Quartil bawah adalah q 0,25 = x (3), quartil atas adalah q 0,75 = x (7)

13 1.3. Ukuran Pemusatan  Ukuran pemusatan yang robust dan resistant adalah ukuran median  Trimean = (q 0,25 +2q 0,5 +q 0,75 )/4 (Rata-rata tertimbang dari median dan quartil. Trimean merupakan ukuran resistant)

14 1.4. Ukuran penyebaran (spread)   Ukuran penyebaran (spread atau dispersion atau scale) yang umum, sederhana, robust dan resistant adalah interquartile range (jarak antar kuartil) IQR. IQR = q 0,75 – q 0,25   Ukuran penyebaran yang konvensional : standard deviation   Koefisien Variasi : KV = (simpangan baku/rata)*100%   Median Absolute Deviation (MAD) MAD = median|x i – q 0,5 |

15 1.5. Kesimetrisan   Skewness coefficient (koefisien kemiringan) [ 1/(n-1 ]  (x i – x rata ) 3 b 1 = ---------------------------- s 3

16 1.5. Kesimetrisan   Kurtosis coefficient (koefisien keruncingan) [ 1/(n-1 ]  (x i – x rata ) 4 b 2 = ---------------------------- s 4

17 2. Eksplorasi data dengan grafis  Stem and Leaf Display  Boxplots  Schematic plot  Histogram  Distribusi Frekuensi Kumulatif

18 2.1. Eksplorasi data dengan grafis  Stem and Leaf Display (diagram dahan daun) 2 19 02 8 20 224688 (10) 21 2244666668 13 22 00022224466 2 23 22

19 2.2. Eksplorasi data dengan grafis  Boxplot (Box and Whiskers Plot) BOX Whiskers maksimum minimum Q1 Q2 Q3

20 2.3. Eksplorasi data dengan grafis   Schematic plot Upper outer fence = q 0,75 + 3 IQR Upper inner fence = q 0,75 + 3 IQR/2 Lower inner fence = q 0,25 - 3 IQR/2 Lower outer fence = q 0,25 - 3 IQR

21 2.3. Eksplorasi data dengan grafis (schematic plot)

22 2.4. Eksplorasi data dengan grafis  Histogram

23 2.5. Eksplorasi data dengan grafis  Distribusi Frekuensi Kumulatif

24 2.5. Eksplorasi data dengan grafis  Distribusi Frekuensi Kumulatif

25 Tugas mandiri / PR :  Data : Hujan dan suhu Sta Tanjung Priok dan Pondok Betung  Lakukan eksplorasi data sbb : 1.Summary data (pemusatan, penyebaran dan kesimetrisan) 2.Eksplorasi data dengan grafis  Berikan analisis singkat AS MUCH AS POSSIBLE

26 BAHAN KULIAH AKADEMI METEOROLOGI & GEOFISIKA SEMESTER GANJIL TA. 2009/2010 STATISTIKA II (UM1742)

27 3. Eksplorasi data berpasangan  Scatterplots  Pearson Correlation  Rank Correlation  Serial Correlation

28 3.1. Scatterplot Diagram

29 3.2. Pearson Correlation Analisis Korelasi : menyelidiki ada tidaknya hubungan dua peubah atau lebih Koefisien korelasi : untuk mengukur tingginya derajad hubungan Korelasi linier : hubungan peubah acak X dan Y yang membentuk garis lurus Arah hubungan eubah dapat bernilai positif atau negatif Koefisien korelasi populasi : Koefisien korelasi sampel :

30 X : suhu rata-rata Y : RH rata-rata r xy : - 0,53 Hubungan antara X dan Y negatif Jika X naik maka Y turun

31 3.3. Rank Correlation  Korelasi antar peubah yang disusun berurut (rank)  r rank = 1- [6  d i 2 ] / [n(n 2 -1)]

32 3.4. Serial Correlation  Korelasi untuk data time series  Korelasi antara data ke-t dengan data ke t-k  Misal : korelasi antara curah hujan bulan berjalan dengan curah hujan sebelumnya ( r yt yt-1 ) atau r 1  (k=1 atau lag =1)

33 3.4. Serial Correlation ( r yt yt-1 ) = ( r yt yt-1 ) =0.37

34 4. Eksplorasi data berdimensi lebih dari dua  Correlation Matrix  Scatterplot Matrix  Correlation Map

35 4.1. Correlation Matrix

36 4.2. Scatter Plot Matrix

37 4.3. Correlation Map : Peta yang menggabarkan hubungan antara dua peubah

38 Tugas  Data : Hujan dan suhu Sta Tanjung Priok dan Pondok Betung  Lakukan eksplorasi data sbb : 1.Summary data (pemusatan, penyebaran dan kesimetrisan) 2.Eksplorasi data dengan grafik 3.Eksplorasi data berpasangan (korelasi)  Berikan analisis singkat AS MUCH AS POSSIBLE


Download ppt "STATISTIKA II (UM1742) Urip Haryoko, MSi. Ir. Antoyo Setyadipratikto, Ah.MG. BAHAN KULIAH AKADEMI METEOROLOGI & GEOFISIKA SEMESTER GANJIL TA. 2009/2010."

Presentasi serupa


Iklan oleh Google