STATISTIKA II STATISTIKA II (UM1742)(UM1742)
Urip Haryoko, MSi.Urip Haryoko, MSi.
Ir. Antoyo Setyadipratikto, Ah.MG.Ir. Antoyo Setyadipratikto, Ah.MG.
BAHAN KULIAH AKADEMI METEOROLOGI & GEOFISIKA SEMESTER GANJIL TA. 2009/2010
PendahuluanPendahuluan
PendahuluanPendahuluan
PendahuluanPendahuluan
PendahuluanPendahuluan
PendahuluanPendahuluan
Sasaran : Sasaran : Siswa memahami analisis time seriesSiswa memahami analisis time series
Materi Sub Pertemuan
Analisis eksplorasi data
1. Ukuran-ukuran summari data numerik
2. Eksplorasi data dengan grafis,
3. Eksplorasi data berpasangan,
4. Eksplorasi data berdimensi lebih dari dua
1-2
Clustering 1. Cara pengelompokan
2. Aplikasi clustering untuk ZOM
3
Uji Hipotesis 1. Significant level,
2. Metoda uji hipotesis
4-6
Analsis Time Series 1. Moving average,
2. Fungsi autokorelasi dan auto korelasi parsial,
3. Auto regresi,
4. Analisis trend,
5. Analisis harmonik
8-10
Forecasting 1. Regresi linier sederhana,
2. Regresi linier berganda,
3. Autoregressive Forecasting (AR),
4. Autoregressive Moving Average (ARMA),
5. Autoregressive Integrated Moving Average (ARIMA),
11-14
1. UKURAN-UKURAN SUMMARY1. UKURAN-UKURAN SUMMARY DATA NUMERIK DATA NUMERIK
Latar BelakangLatar Belakang Robustness and ResistanceRobustness and Resistance QuantileQuantile
Ukuran summaryUkuran summary Lokasi (pemusatan)Lokasi (pemusatan) Penyebaran Penyebaran SimetrisSimetris
1.1. Robustness and 1.1. Robustness and ResistanceResistance
Sifat-sifat yang penting dalam metode Exploratory Data Analysis (EDA) adalah robust (ketegaran) dan resistant (tahan). Robustness dan resistance adalah dua aspek ketidaksensitifitasan terhadap data.
Metoda robust tidak perlu harus optimal dalam beberapa hal, namun mempunyai performa yang baik dalam hal yang lain. Misalkan statistik rata-2 sampel x-rata = xi / n adalah statistik yang terbaik untuk mengukur pemusatan data, jika diketahui bahwa data tersebut mengikuti distribusi Gauss. Namun jika data tersebut tidak mengikuti distribusi Gauss (misal : jika ada data ekstrim kejadian hujan), maka rata-rata sampel akan memperoleh nilai yang misleading. Sebaliknya, metoda-metoda robust secara umum tidak sensitif terhadap asumsi tentang data secara keseluruhan.
Metoda resisten adalah dipengaruhi oleh sejumlah kecil “outlier” atau “data aneh”. Hasil dari metoda resistant hanya sedikit berubah jika sebagian kecil data diubah nilainya, meskipun perubahan itu secara drastis. Rata-rata sampel tidak mempunyai sifat resistant terhadap ukuran pemusatan data.
1.1. Robustness and 1.1. Robustness and ResistanceResistance
Misalkan data {11, 12, 13, 14, 15, 16, 17, 18 ,19). Rata-rata sampelnya adalah 15. Namun jika datanya diubah menjadi {11, 12, 13, 14, 15, 16, 17, 18 ,91), maka rata-ratanya menjadi 23. Ukuran-ukuran yang resistant dari pemusatan sekumpulan data hanya sedikit berubah atau bahkan tidak berubah sama sekali dengan mengganti angka 19 menjadi 91.
Median resistant terhadap nilai ekstrim
Rata-2 tidak resistant terhadap nilai ekstrim
1.2. QUANTILE1.2. QUANTILE
Quantile Quantile q qp p (0<p<1) (0<p<1)
qqp p = q= q0,50,5 = median = median
qq0,250,25, q, q0,50,5, q, q0,750,75 quartile quartile
qq0,10,1, q, q0,20,2,…….q,…….q0,90,9 deciles deciles
qq0,010,01, q, q0,020,02, q, q0,030,03……,q……,q0,990,99 percentile percentile
1.2. QUANTILE1.2. QUANTILE
qq0,50,5 = median = x = median = x([n+1]/2)([n+1]/2) …………... n ganjil …………... n ganjil
= {x= {x(n/2)(n/2) + x + x([n/2]+1)([n/2]+1)}/2 … n genap}/2 … n genap
Contoh :Contoh :
Jika terdapat 9 data (n=9), nilai median adalah Jika terdapat 9 data (n=9), nilai median adalah qq0,50,5 = x = x(5)(5). Quartil bawah adalah q. Quartil bawah adalah q0,250,25 = x = x(3)(3), quartil , quartil
atas adalah qatas adalah q0,750,75 = x = x(7)(7)
1.3. Ukuran Pemusatan1.3. Ukuran Pemusatan
Ukuran pemusatan yang robust dan Ukuran pemusatan yang robust dan resistant adalah ukuran resistant adalah ukuran medianmedian
Trimean = (qTrimean = (q0,250,25+2q+2q0,50,5+q+q0,750,75)/4 )/4
(Rata-rata tertimbang dari median dan quartil. Trimean (Rata-rata tertimbang dari median dan quartil. Trimean merupakan ukuran resistant)merupakan ukuran resistant)
1.4. Ukuran penyebaran1.4. Ukuran penyebaran (spread) (spread)
Ukuran penyebaran (spread atau dispersion atau scale) yang umum, sederhana, robust dan resistant adalah interquartile range (jarak antar kuartil) IQR. IQR = q0,75 – q0,25
Ukuran penyebaran yang konvensional : standard deviation
Koefisien Variasi : KV = (simpangan baku/rata)*100%
Median Absolute Deviation (MAD)MAD = median|xi – q0,5|
1.5. Kesimetrisan1.5. Kesimetrisan
Skewness coefficient (koefisien kemiringan)
[ 1/(n-1 ] (xi – xrata)3
b1 = ----------------------------
s3
1.5. Kesimetrisan1.5. Kesimetrisan
Kurtosis coefficient (koefisien keruncingan)
[ 1/(n-1 ] (xi – xrata)4
b2 = ----------------------------
s4
2. Eksplorasi data dengan 2. Eksplorasi data dengan grafisgrafis
Stem and Leaf DisplayStem and Leaf Display BoxplotsBoxplots Schematic plotSchematic plot HistogramHistogram Distribusi Frekuensi KumulatifDistribusi Frekuensi Kumulatif
2.1. Eksplorasi data dengan grafis2.1. Eksplorasi data dengan grafis
Stem and Leaf Display (diagram dahan Stem and Leaf Display (diagram dahan daun)daun)
2 19 02
8 20 224688
(10) 21 2244666668
13 22 00022224466
2 23 22
2.2. Eksplorasi data dengan grafis2.2. Eksplorasi data dengan grafis Boxplot (Box and Whiskers Plot)Boxplot (Box and Whiskers Plot)
T-B
dg
23
22
21
20
19
Boxplot of T-Bdg
BOX
Whiskers
Whiskers
maksimum
minimum
Q1
Q2
Q3
2.3. Eksplorasi data dengan grafis2.3. Eksplorasi data dengan grafis Schematic plot
Upper outer fence = q0,75 + 3 IQR
Upper inner fence = q0,75 + 3 IQR/2
Lower inner fence = q0,25 - 3 IQR/2
Lower outer fence = q0,25 - 3 IQR
T-Bdg2
30
25
20
15
10
Boxplot of T-Bdg2
2.3. Eksplorasi data dengan grafis2.3. Eksplorasi data dengan grafis (schematic plot) (schematic plot)
Data
T-Jkt2T-Bdg2
35
30
25
20
15
10
Boxplot of T-Bdg2; T-Jkt2
2.4. Eksplorasi data dengan grafis2.4. Eksplorasi data dengan grafis
HistogramHistogram
2.5. Eksplorasi data dengan grafis2.5. Eksplorasi data dengan grafis
Distribusi Frekuensi KumulatifDistribusi Frekuensi Kumulatif
2.5. Eksplorasi data dengan grafis2.5. Eksplorasi data dengan grafis
Distribusi Frekuensi KumulatifDistribusi Frekuensi Kumulatif
Tugas mandiri / PR :Tugas mandiri / PR :
Data : Hujan dan suhu Sta Tanjung Priok dan Data : Hujan dan suhu Sta Tanjung Priok dan Pondok BetungPondok Betung
Lakukan eksplorasi data sbb :Lakukan eksplorasi data sbb :1.1. Summary data (pemusatan, penyebaran dan Summary data (pemusatan, penyebaran dan
kesimetrisan)kesimetrisan)
2.2. Eksplorasi data dengan grafisEksplorasi data dengan grafis
Berikan analisis singkat Berikan analisis singkat AS MUCH AS AS MUCH AS POSSIBLEPOSSIBLE
BAHAN KULIAH AKADEMI METEOROLOGI & GEOFISIKA SEMESTER GANJIL TA. 2009/2010
STATISTIKA II STATISTIKA II (UM1742)(UM1742)
3. Eksplorasi data berpasangan3. Eksplorasi data berpasangan
ScatterplotsScatterplots Pearson CorrelationPearson Correlation Rank CorrelationRank Correlation Serial CorrelationSerial Correlation
3.1. Scatterplot Diagram3.1. Scatterplot Diagram
RH_rata2
Suhu_ra
ta2
908580757065
30
29
28
27
26
25
Scatterplot of Suhu_ rata2 vs RH_ rata2 Staklim Pondok Betung
3.2. Pearson Correlation3.2. Pearson CorrelationAnalisis Korelasi : menyelidiki ada tidaknya hubungan dua peubah atau lebihKoefisien korelasi : untuk mengukur tingginya derajad hubunganKorelasi linier : hubungan peubah acak X dan Y yang membentuk garis lurus
Arah hubungan eubah dapat bernilai positif atau negatif
Koefisien korelasi populasi :
Koefisien korelasi sampel :
DATA IKLIM STAKLIM PONDOK BETUNG
kode_stasiun Tahun Bulan Hujan HH Suhu_rata2 Suhu_max Suhu_min RH_min RH_max RH_rata296733 1995 1 394.5 26 26.6 33 22.2 59 100 85
96733 1995 2 217.4 25 26.6 39 22.6 56 100 84
96733 1995 3 289.2 26 26.6 34 22.5 50 100 85
96733 1995 4 154.1 15 27.5 34.2 23 47 98 80
96733 1995 5 189.2 15 27.7 34.2 22.8 51 98 81
96733 1995 6 328.0 16 27.2 34.4 22.6 49 98 82
96733 1995 7 95.9 9 27.3 33.7 22 41 99 78
96733 1995 8 0.0 0 27.5 35.4 22 38 95 71
96733 1995 9 303.4 11 27.4 35.2 19.6 34 92 75
96733 1995 10 243.8 19 27.4 34.2 22 50 100 80
96733 1995 11 189.5 24 26.7 33.6 22.4 56 99 85
96733 1995 12 174.0 16 26.7 34.1 22.5 53 98 82
96733 1996 1 270.8 18 26.2 34.8 21.6 58 99 85
96733 1996 2 482.4 21 26.2 32.4 22.2 66 100 88
96733 1996 3 277.9 15 26.6 34 21.3 54 100 86
96733 1996 4 291.3 19 27.2 35.2 22.5 44 100 84
96733 1996 5 68.3 10 27.9 35 22.5 43 97 78
96733 1996 6 55.0 9 27.7 35.2 20.2 45 98 79
96733 1996 7 36.0 8 27.7 35 20.4 41 95 76
X : suhu rata-rataY : RH rata-ratarxy : - 0,53 Hubungan antara X dan Y negatifJika X naik maka Y turun
RH_rata2
Suhu_ra
ta2
908580757065
30
29
28
27
26
25
Scatterplot of Suhu_ rata2 vs RH_rata2 Staklim Pondok Betung
3.3. Rank Correlation3.3. Rank Correlation
Korelasi antar peubah yang disusun Korelasi antar peubah yang disusun berurut (rank)berurut (rank)
rrrankrank = 1- [6 = 1- [6 d dii22] / [n(n] / [n(n22-1)]-1)]
3.4. Serial Correlation3.4. Serial Correlation
Korelasi untuk data time seriesKorelasi untuk data time series Korelasi antara data ke-t dengan data ke Korelasi antara data ke-t dengan data ke
t-kt-k Misal : korelasi antara curah hujan bulan Misal : korelasi antara curah hujan bulan
berjalan dengan curah hujan sebelumnya berjalan dengan curah hujan sebelumnya
((rryt yt-1yt yt-1) atau ) atau rr1 1 (k=1 atau lag =1)(k=1 atau lag =1)
3.4. Serial Correlation3.4. Serial Correlation
DATA IKLIM STAKLIM PONDOK BETUNG
kode_stasiun Tahun Bulan t Hujan ke-t Hujan ke-(t-1)96733 1995 1 1 394.596733 1995 2 2 217.4 394.596733 1995 3 3 289.2 217.496733 1995 4 4 154.1 289.296733 1995 5 5 189.2 154.196733 1995 6 6 328.0 189.296733 1995 7 7 95.9 328.096733 1995 8 8 0.0 95.996733 1995 9 9 303.4 0.096733 1995 10 10 243.8 303.496733 1995 11 11 189.5 243.896733 1995 12 12 174.0 189.596733 1996 1 13 270.8 174.096733 1996 2 14 482.4 270.896733 1996 3 15 277.9 482.496733 1996 4 16 291.3 277.996733 1996 5 17 68.3 291.396733 1996 6 18 55.0 68.396733 1996 7 19 36.0 55.0
((rryt yt-1yt yt-1) =) =0.37
4. Eksplorasi data berdimensi lebih 4. Eksplorasi data berdimensi lebih dari duadari dua
Correlation MatrixCorrelation Matrix Scatterplot MatrixScatterplot Matrix Correlation MapCorrelation Map
4.1. Correlation Matrix4.1. Correlation Matrix
Sabang Aceh Bengkulu Jambi Medan Meulaboh Padang Aceh -0.156 Bengkulu -0.135 -0.088 Jambi -0.094 -0.026 0.709 Medan -0.285 0.295 -0.016 -0.065 Meulaboh 0.047 0.294 0.267 0.118 0.330 Padang 0.242 0.387 0.287 0.198 0.250 0.504 nino 0.180 0.118 -0.432 -0.421 0.000 -0.092 -0.289 dmi 0.356 -0.243 -0.435 -0.538 -0.122 -0.108 -0.204 monsun 0.030 0.341 -0.014 0.042 -0.246 -0.016 0.127
4.2. Scatter Plot Matrix4.2. Scatter Plot Matrix
Sabang
Aceh
Bengkulu
Jambi
Medan
Meulaboh
Padang
nino
dmi
monsun
600-60 800-80 1000-100 10-1 10-1
200
100
0
60
0
-60200
0
-200100
0
-100100
0
-100100
0
-100
200
0
-200
1
0
-1
2
0
-2
2001000
1
0
-1
2000-200 1000-100 2000-200 20-2
Matrix Plot of Sabang, Aceh, Bengkulu, J ambi, Medan, Meulaboh, ...
4.3. 4.3. CorrelationCorrelationMap :Map :
Peta yang Peta yang menggabarkan menggabarkan hubungan antara dua hubungan antara dua peubahpeubah
TugasTugas
Data : Hujan dan suhu Sta Tanjung Priok dan Data : Hujan dan suhu Sta Tanjung Priok dan Pondok BetungPondok Betung
Lakukan eksplorasi data sbb :Lakukan eksplorasi data sbb :1.1. Summary data (pemusatan, penyebaran dan Summary data (pemusatan, penyebaran dan
kesimetrisan)kesimetrisan)
2.2. Eksplorasi data dengan grafikEksplorasi data dengan grafik
3.3. Eksplorasi data berpasangan (korelasi)Eksplorasi data berpasangan (korelasi)
Berikan analisis singkat Berikan analisis singkat AS MUCH AS AS MUCH AS POSSIBLEPOSSIBLE
Top Related