Kuliah+Statistik+II+AMG 09

38
STATISTIKA II STATISTIKA II (UM1742) (UM1742) Urip Haryoko, MSi. Urip Haryoko, MSi. Ir. Antoyo Setyadipratikto, Ir. Antoyo Setyadipratikto, Ah.MG. Ah.MG. BAHAN KULIAH AKADEMI METEOROLOGI & GEOFISIKA SEMESTER GANJIL TA. 2009/2010

Transcript of Kuliah+Statistik+II+AMG 09

Page 1: Kuliah+Statistik+II+AMG 09

STATISTIKA II STATISTIKA II (UM1742)(UM1742)

Urip Haryoko, MSi.Urip Haryoko, MSi.

Ir. Antoyo Setyadipratikto, Ah.MG.Ir. Antoyo Setyadipratikto, Ah.MG.

BAHAN KULIAH AKADEMI METEOROLOGI & GEOFISIKA SEMESTER GANJIL TA. 2009/2010

Page 2: Kuliah+Statistik+II+AMG 09

PendahuluanPendahuluan

Page 3: Kuliah+Statistik+II+AMG 09

PendahuluanPendahuluan

Page 4: Kuliah+Statistik+II+AMG 09

PendahuluanPendahuluan

Page 5: Kuliah+Statistik+II+AMG 09

PendahuluanPendahuluan

Page 6: Kuliah+Statistik+II+AMG 09

PendahuluanPendahuluan

Page 7: Kuliah+Statistik+II+AMG 09

Sasaran : Sasaran : Siswa memahami analisis time seriesSiswa memahami analisis time series

Materi Sub Pertemuan

Analisis eksplorasi data

1. Ukuran-ukuran summari data numerik

2. Eksplorasi data dengan grafis,

3. Eksplorasi data berpasangan,

4. Eksplorasi data berdimensi lebih dari dua

1-2

Clustering 1. Cara pengelompokan

2. Aplikasi clustering untuk ZOM

3

Uji Hipotesis 1. Significant level,

2. Metoda uji hipotesis

4-6

Analsis Time Series 1. Moving average,

2. Fungsi autokorelasi dan auto korelasi parsial,

3. Auto regresi,

4. Analisis trend,

5. Analisis harmonik

8-10

Forecasting 1. Regresi linier sederhana,

2. Regresi linier berganda,

3. Autoregressive Forecasting (AR),

4. Autoregressive Moving Average (ARMA),

5. Autoregressive Integrated Moving Average (ARIMA),

11-14

Page 8: Kuliah+Statistik+II+AMG 09

1. UKURAN-UKURAN SUMMARY1. UKURAN-UKURAN SUMMARY DATA NUMERIK DATA NUMERIK

Latar BelakangLatar Belakang Robustness and ResistanceRobustness and Resistance QuantileQuantile

Ukuran summaryUkuran summary Lokasi (pemusatan)Lokasi (pemusatan) Penyebaran Penyebaran SimetrisSimetris

Page 9: Kuliah+Statistik+II+AMG 09

1.1. Robustness and 1.1. Robustness and ResistanceResistance

Sifat-sifat yang penting dalam metode Exploratory Data Analysis (EDA) adalah robust (ketegaran) dan resistant (tahan). Robustness dan resistance adalah dua aspek ketidaksensitifitasan terhadap data.

Metoda robust tidak perlu harus optimal dalam beberapa hal, namun mempunyai performa yang baik dalam hal yang lain. Misalkan statistik rata-2 sampel x-rata = xi / n adalah statistik yang terbaik untuk mengukur pemusatan data, jika diketahui bahwa data tersebut mengikuti distribusi Gauss. Namun jika data tersebut tidak mengikuti distribusi Gauss (misal : jika ada data ekstrim kejadian hujan), maka rata-rata sampel akan memperoleh nilai yang misleading. Sebaliknya, metoda-metoda robust secara umum tidak sensitif terhadap asumsi tentang data secara keseluruhan.

Metoda resisten adalah dipengaruhi oleh sejumlah kecil “outlier” atau “data aneh”. Hasil dari metoda resistant hanya sedikit berubah jika sebagian kecil data diubah nilainya, meskipun perubahan itu secara drastis. Rata-rata sampel tidak mempunyai sifat resistant terhadap ukuran pemusatan data.

Page 10: Kuliah+Statistik+II+AMG 09

1.1. Robustness and 1.1. Robustness and ResistanceResistance

Misalkan data {11, 12, 13, 14, 15, 16, 17, 18 ,19). Rata-rata sampelnya adalah 15. Namun jika datanya diubah menjadi {11, 12, 13, 14, 15, 16, 17, 18 ,91), maka rata-ratanya menjadi 23. Ukuran-ukuran yang resistant dari pemusatan sekumpulan data hanya sedikit berubah atau bahkan tidak berubah sama sekali dengan mengganti angka 19 menjadi 91.

Median resistant terhadap nilai ekstrim

Rata-2 tidak resistant terhadap nilai ekstrim

Page 11: Kuliah+Statistik+II+AMG 09

1.2. QUANTILE1.2. QUANTILE

Quantile Quantile q qp p (0<p<1) (0<p<1)

qqp p = q= q0,50,5 = median = median

qq0,250,25, q, q0,50,5, q, q0,750,75 quartile quartile

qq0,10,1, q, q0,20,2,…….q,…….q0,90,9 deciles deciles

qq0,010,01, q, q0,020,02, q, q0,030,03……,q……,q0,990,99 percentile percentile

Page 12: Kuliah+Statistik+II+AMG 09

1.2. QUANTILE1.2. QUANTILE

qq0,50,5 = median = x = median = x([n+1]/2)([n+1]/2) …………... n ganjil …………... n ganjil

= {x= {x(n/2)(n/2) + x + x([n/2]+1)([n/2]+1)}/2 … n genap}/2 … n genap

Contoh :Contoh :

Jika terdapat 9 data (n=9), nilai median adalah Jika terdapat 9 data (n=9), nilai median adalah qq0,50,5 = x = x(5)(5). Quartil bawah adalah q. Quartil bawah adalah q0,250,25 = x = x(3)(3), quartil , quartil

atas adalah qatas adalah q0,750,75 = x = x(7)(7)

Page 13: Kuliah+Statistik+II+AMG 09

1.3. Ukuran Pemusatan1.3. Ukuran Pemusatan

Ukuran pemusatan yang robust dan Ukuran pemusatan yang robust dan resistant adalah ukuran resistant adalah ukuran medianmedian

Trimean = (qTrimean = (q0,250,25+2q+2q0,50,5+q+q0,750,75)/4 )/4

(Rata-rata tertimbang dari median dan quartil. Trimean (Rata-rata tertimbang dari median dan quartil. Trimean merupakan ukuran resistant)merupakan ukuran resistant)

Page 14: Kuliah+Statistik+II+AMG 09

1.4. Ukuran penyebaran1.4. Ukuran penyebaran (spread) (spread)

Ukuran penyebaran (spread atau dispersion atau scale) yang umum, sederhana, robust dan resistant adalah interquartile range (jarak antar kuartil) IQR. IQR = q0,75 – q0,25

Ukuran penyebaran yang konvensional : standard deviation

Koefisien Variasi : KV = (simpangan baku/rata)*100%

Median Absolute Deviation (MAD)MAD = median|xi – q0,5|

Page 15: Kuliah+Statistik+II+AMG 09

1.5. Kesimetrisan1.5. Kesimetrisan

Skewness coefficient (koefisien kemiringan)

[ 1/(n-1 ] (xi – xrata)3

b1 = ----------------------------

s3

Page 16: Kuliah+Statistik+II+AMG 09

1.5. Kesimetrisan1.5. Kesimetrisan

Kurtosis coefficient (koefisien keruncingan)

[ 1/(n-1 ] (xi – xrata)4

b2 = ----------------------------

s4

Page 17: Kuliah+Statistik+II+AMG 09

2. Eksplorasi data dengan 2. Eksplorasi data dengan grafisgrafis

Stem and Leaf DisplayStem and Leaf Display BoxplotsBoxplots Schematic plotSchematic plot HistogramHistogram Distribusi Frekuensi KumulatifDistribusi Frekuensi Kumulatif

Page 18: Kuliah+Statistik+II+AMG 09

2.1. Eksplorasi data dengan grafis2.1. Eksplorasi data dengan grafis

Stem and Leaf Display (diagram dahan Stem and Leaf Display (diagram dahan daun)daun)

2 19 02

8 20 224688

(10) 21 2244666668

13 22 00022224466

2 23 22

Page 19: Kuliah+Statistik+II+AMG 09

2.2. Eksplorasi data dengan grafis2.2. Eksplorasi data dengan grafis Boxplot (Box and Whiskers Plot)Boxplot (Box and Whiskers Plot)

T-B

dg

23

22

21

20

19

Boxplot of T-Bdg

BOX

Whiskers

Whiskers

maksimum

minimum

Q1

Q2

Q3

Page 20: Kuliah+Statistik+II+AMG 09

2.3. Eksplorasi data dengan grafis2.3. Eksplorasi data dengan grafis Schematic plot

Upper outer fence = q0,75 + 3 IQR

Upper inner fence = q0,75 + 3 IQR/2

Lower inner fence = q0,25 - 3 IQR/2

Lower outer fence = q0,25 - 3 IQR

T-Bdg2

30

25

20

15

10

Boxplot of T-Bdg2

Page 21: Kuliah+Statistik+II+AMG 09

2.3. Eksplorasi data dengan grafis2.3. Eksplorasi data dengan grafis (schematic plot) (schematic plot)

Data

T-Jkt2T-Bdg2

35

30

25

20

15

10

Boxplot of T-Bdg2; T-Jkt2

Page 22: Kuliah+Statistik+II+AMG 09

2.4. Eksplorasi data dengan grafis2.4. Eksplorasi data dengan grafis

HistogramHistogram

Page 23: Kuliah+Statistik+II+AMG 09

2.5. Eksplorasi data dengan grafis2.5. Eksplorasi data dengan grafis

Distribusi Frekuensi KumulatifDistribusi Frekuensi Kumulatif

Page 24: Kuliah+Statistik+II+AMG 09

2.5. Eksplorasi data dengan grafis2.5. Eksplorasi data dengan grafis

Distribusi Frekuensi KumulatifDistribusi Frekuensi Kumulatif

Page 25: Kuliah+Statistik+II+AMG 09

Tugas mandiri / PR :Tugas mandiri / PR :

Data : Hujan dan suhu Sta Tanjung Priok dan Data : Hujan dan suhu Sta Tanjung Priok dan Pondok BetungPondok Betung

Lakukan eksplorasi data sbb :Lakukan eksplorasi data sbb :1.1. Summary data (pemusatan, penyebaran dan Summary data (pemusatan, penyebaran dan

kesimetrisan)kesimetrisan)

2.2. Eksplorasi data dengan grafisEksplorasi data dengan grafis

Berikan analisis singkat Berikan analisis singkat AS MUCH AS AS MUCH AS POSSIBLEPOSSIBLE

Page 26: Kuliah+Statistik+II+AMG 09

BAHAN KULIAH AKADEMI METEOROLOGI & GEOFISIKA SEMESTER GANJIL TA. 2009/2010

STATISTIKA II STATISTIKA II (UM1742)(UM1742)

Page 27: Kuliah+Statistik+II+AMG 09

3. Eksplorasi data berpasangan3. Eksplorasi data berpasangan

ScatterplotsScatterplots Pearson CorrelationPearson Correlation Rank CorrelationRank Correlation Serial CorrelationSerial Correlation

Page 28: Kuliah+Statistik+II+AMG 09

3.1. Scatterplot Diagram3.1. Scatterplot Diagram

RH_rata2

Suhu_ra

ta2

908580757065

30

29

28

27

26

25

Scatterplot of Suhu_ rata2 vs RH_ rata2 Staklim Pondok Betung

Page 29: Kuliah+Statistik+II+AMG 09

3.2. Pearson Correlation3.2. Pearson CorrelationAnalisis Korelasi : menyelidiki ada tidaknya hubungan dua peubah atau lebihKoefisien korelasi : untuk mengukur tingginya derajad hubunganKorelasi linier : hubungan peubah acak X dan Y yang membentuk garis lurus

Arah hubungan eubah dapat bernilai positif atau negatif

Koefisien korelasi populasi :

Koefisien korelasi sampel :

Page 30: Kuliah+Statistik+II+AMG 09

DATA IKLIM STAKLIM PONDOK BETUNG

kode_stasiun Tahun Bulan Hujan HH Suhu_rata2 Suhu_max Suhu_min RH_min RH_max RH_rata296733 1995 1 394.5 26 26.6 33 22.2 59 100 85

96733 1995 2 217.4 25 26.6 39 22.6 56 100 84

96733 1995 3 289.2 26 26.6 34 22.5 50 100 85

96733 1995 4 154.1 15 27.5 34.2 23 47 98 80

96733 1995 5 189.2 15 27.7 34.2 22.8 51 98 81

96733 1995 6 328.0 16 27.2 34.4 22.6 49 98 82

96733 1995 7 95.9 9 27.3 33.7 22 41 99 78

96733 1995 8 0.0 0 27.5 35.4 22 38 95 71

96733 1995 9 303.4 11 27.4 35.2 19.6 34 92 75

96733 1995 10 243.8 19 27.4 34.2 22 50 100 80

96733 1995 11 189.5 24 26.7 33.6 22.4 56 99 85

96733 1995 12 174.0 16 26.7 34.1 22.5 53 98 82

96733 1996 1 270.8 18 26.2 34.8 21.6 58 99 85

96733 1996 2 482.4 21 26.2 32.4 22.2 66 100 88

96733 1996 3 277.9 15 26.6 34 21.3 54 100 86

96733 1996 4 291.3 19 27.2 35.2 22.5 44 100 84

96733 1996 5 68.3 10 27.9 35 22.5 43 97 78

96733 1996 6 55.0 9 27.7 35.2 20.2 45 98 79

96733 1996 7 36.0 8 27.7 35 20.4 41 95 76

X : suhu rata-rataY : RH rata-ratarxy : - 0,53 Hubungan antara X dan Y negatifJika X naik maka Y turun

RH_rata2

Suhu_ra

ta2

908580757065

30

29

28

27

26

25

Scatterplot of Suhu_ rata2 vs RH_rata2 Staklim Pondok Betung

Page 31: Kuliah+Statistik+II+AMG 09

3.3. Rank Correlation3.3. Rank Correlation

Korelasi antar peubah yang disusun Korelasi antar peubah yang disusun berurut (rank)berurut (rank)

rrrankrank = 1- [6 = 1- [6 d dii22] / [n(n] / [n(n22-1)]-1)]

Page 32: Kuliah+Statistik+II+AMG 09

3.4. Serial Correlation3.4. Serial Correlation

Korelasi untuk data time seriesKorelasi untuk data time series Korelasi antara data ke-t dengan data ke Korelasi antara data ke-t dengan data ke

t-kt-k Misal : korelasi antara curah hujan bulan Misal : korelasi antara curah hujan bulan

berjalan dengan curah hujan sebelumnya berjalan dengan curah hujan sebelumnya

((rryt yt-1yt yt-1) atau ) atau rr1 1 (k=1 atau lag =1)(k=1 atau lag =1)

Page 33: Kuliah+Statistik+II+AMG 09

3.4. Serial Correlation3.4. Serial Correlation

DATA IKLIM STAKLIM PONDOK BETUNG

kode_stasiun Tahun Bulan t Hujan ke-t Hujan ke-(t-1)96733 1995 1 1 394.596733 1995 2 2 217.4 394.596733 1995 3 3 289.2 217.496733 1995 4 4 154.1 289.296733 1995 5 5 189.2 154.196733 1995 6 6 328.0 189.296733 1995 7 7 95.9 328.096733 1995 8 8 0.0 95.996733 1995 9 9 303.4 0.096733 1995 10 10 243.8 303.496733 1995 11 11 189.5 243.896733 1995 12 12 174.0 189.596733 1996 1 13 270.8 174.096733 1996 2 14 482.4 270.896733 1996 3 15 277.9 482.496733 1996 4 16 291.3 277.996733 1996 5 17 68.3 291.396733 1996 6 18 55.0 68.396733 1996 7 19 36.0 55.0

((rryt yt-1yt yt-1) =) =0.37

Page 34: Kuliah+Statistik+II+AMG 09

4. Eksplorasi data berdimensi lebih 4. Eksplorasi data berdimensi lebih dari duadari dua

Correlation MatrixCorrelation Matrix Scatterplot MatrixScatterplot Matrix Correlation MapCorrelation Map

Page 35: Kuliah+Statistik+II+AMG 09

4.1. Correlation Matrix4.1. Correlation Matrix

Sabang Aceh Bengkulu Jambi Medan Meulaboh Padang Aceh -0.156 Bengkulu -0.135 -0.088 Jambi -0.094 -0.026 0.709 Medan -0.285 0.295 -0.016 -0.065 Meulaboh 0.047 0.294 0.267 0.118 0.330 Padang 0.242 0.387 0.287 0.198 0.250 0.504 nino 0.180 0.118 -0.432 -0.421 0.000 -0.092 -0.289 dmi 0.356 -0.243 -0.435 -0.538 -0.122 -0.108 -0.204 monsun 0.030 0.341 -0.014 0.042 -0.246 -0.016 0.127

Page 36: Kuliah+Statistik+II+AMG 09

4.2. Scatter Plot Matrix4.2. Scatter Plot Matrix

Sabang

Aceh

Bengkulu

Jambi

Medan

Meulaboh

Padang

nino

dmi

monsun

600-60 800-80 1000-100 10-1 10-1

200

100

0

60

0

-60200

0

-200100

0

-100100

0

-100100

0

-100

200

0

-200

1

0

-1

2

0

-2

2001000

1

0

-1

2000-200 1000-100 2000-200 20-2

Matrix Plot of Sabang, Aceh, Bengkulu, J ambi, Medan, Meulaboh, ...

Page 37: Kuliah+Statistik+II+AMG 09

4.3. 4.3. CorrelationCorrelationMap :Map :

Peta yang Peta yang menggabarkan menggabarkan hubungan antara dua hubungan antara dua peubahpeubah

Page 38: Kuliah+Statistik+II+AMG 09

TugasTugas

Data : Hujan dan suhu Sta Tanjung Priok dan Data : Hujan dan suhu Sta Tanjung Priok dan Pondok BetungPondok Betung

Lakukan eksplorasi data sbb :Lakukan eksplorasi data sbb :1.1. Summary data (pemusatan, penyebaran dan Summary data (pemusatan, penyebaran dan

kesimetrisan)kesimetrisan)

2.2. Eksplorasi data dengan grafikEksplorasi data dengan grafik

3.3. Eksplorasi data berpasangan (korelasi)Eksplorasi data berpasangan (korelasi)

Berikan analisis singkat Berikan analisis singkat AS MUCH AS AS MUCH AS POSSIBLEPOSSIBLE