Statistik Terapan p.projo
-
Upload
fazlurrahman-shomat -
Category
Documents
-
view
176 -
download
5
Transcript of Statistik Terapan p.projo
STATISTIK STATISTIK TERAPANTERAPAN
Projo Danoedoro
Jurusan Sains Informasi Geografis dan Pengembangan Wilayah
POKOK-POKOK MATERI
• Kuliah ini tidak membahas tentang dasar-dasar teori statistik, melainkan penerapan beberapa prinsip statistik dalam analisis geografis, khususnya dalam kaitannya dengan penggunaan peta (SIG dan PJ)
• Bersifat komplementer dengan Mata Kuliah Statistik dan Metode Penelitian SIGPW
Materi dari Projo:
• Error matrix untuk analisis akurasi peta/hasil interpretasi
• Aspek statistik pemrosesan citra
• Analisis Regresi untuk pemetaan kecenderungan (trend)
• Principal Component Analysis
• Beberapa aspek dari Geostatistik dan Trend Surface Analysis
Beberapa catatan• Prinsip yang sama dapat diterapkan untuk
mengevaluasi peta. Bukan hanya citra
• Untuk citra dan analisis digital, satuan perhitungan diberikan dalam piksel, sedangkan dalam analisis akurasi peta dengan SIG berbasis vektor, satuan ini bisa dalam satuan luas
• Untuk hasil interpretasi visual (misalnya foto udara) satuan yang biasa digunakan ialah jumlah satuan pemetaan tetapi metode ini sebenarnya mensyaratkan perlu-tidaknya penggabungan klas
Vektor nilai piksel
• Citra penginderaan jauh banyak yang dihasilkan dalam bentuk multispektral, sehingga setiap piksel setiap posisi baris i dan kolom j pada suatu saluran k akan mempunyai pasangan nilai lain pada saluran l dan seterusnya
• Suatu vektor nilai piksel disajikan dalam
bentuk: BVijk, yaitu nilai kecerahan pada baris
i, kolom j, saluran k.
Histogram citra
• Suatu citra yang tersusun atas sejumlah kolom dan baris piksel akan mempunyai distribusi frekuensi (kemunculan) nilai piksel, yang dapat disajikan dalam bentuk tabel maupun histogram
• Evaluasi atas citra dan upaya perbaikan kenampakannya --dalam hal tertentu-- dapat dilakukan tanpa melihat citranya, melainkan hanya dengan menganalisis histogramnya.
Rerata, kemencengan, kurtosis
• Mean (rerata) μ:
• Kemencengan:
(skewness)
• Kurtosis:
Tendensi sentral dan kemencengan (skewness)
• Histogram yang terdistribusi normal:• Kurtosis = 0 sempurna• Kurtosis >0 dan besar semakin curam• Kurtosis <0 dan kecil semakin landai
• Citra dengan kenampakan kontras antara dua jenis obyek yang secara spektral berbeda tajam tidak akan menyajikan histogram berkurva normal.
Contoh: citra inframerah dekat, tengah dan jauh untuk kenampakan darat dan tubuh air
Ukuran dispersi : variansi dan kovariansi
• Julat (range) : maxk – mink
• Variansi = (Sd)2 =
• Kovariansi
Mean =44.698477, Sd=32.388668 Mean =61.196332, Sd=13.541991
Mengukur kekuatan hubungan antar-variabel: korelasi
Tipe korelasi Skala pengukuran Karakteristik data
Product moment (r) Interval/ rasio Dapat digunakan untuk kedua macam skala
Spearman rank (rs) Ordinal Kedua variabel harus dinyatakan sebagai data berperingkat untuk kedua macam uji iniKendall’s tau () Ordinal
Biserial (rb) Nominal Salah satu merupakan variabel dikotomis, sedangkan yang lain punya > 2 macam nilai
Koefisien Phi ( atau r ) Nominal Kedua variabel harus dikotomis
Pustaka
• Shaw dan Wheeler (Wheeler). 1989 (1995). Statistical Techniques in Geographical Analysis. NY: John Wiley and Sons
• Watford, N. 1996. Geographical Data Analysis. NY: John Wiley and Sons
Pearson’s product moment
• Perhitungan melibatkan kovariansi• Kovariansi dapat dihitung dari populasi atau dari
sampel• Kovariansi populasi:
Kovariansi sampel:
Kovariansi dapat juga diartikan sebagai simpangan rerata dari satu himpunan observasi dari sentroid mereka (sentroid rerata)
• Rumus r (product moment) untuk N populasi:
• Rumus r (product moment) untuk n sampel:
• Rumus rs (spearman rank):
rs = 1 – (6D2)/N(N2-1)
rs = 1 – (6D2)/N(N2-1)
rs = 1- (6 x 5.5)/(50x(502-1)
= +0.9997
Net farm income
Koefisien Phi ()
• Digunakan untuk data tabel silang
• Hanya berlaku untuk dua variabel yang masing-masing bersifat dikotomis, disajikan dalam bentuk tabel kontingensi
• Rumus:
= AD – BC
[(A+B)(B+C)(A+C)(B+D)]
Tabel kontingensi untuk koefisien korelasi
Atribut a
Ada/setuju/ya, dsb. Tidak ada/ menolak/tidak, dsb
Atribut b
Ada/setuju/ya, dsb.
A B
Tidak ada/ menolak/tidak, dsb
C D
= AD – BC [(A+B)(B+C)(A+C)(B+D)]
ErosiAda Tidak ada
Lereng
Curam 11 13
Tidak curam
1 25
24
26
12 38 50
= AD – BC = (11x25) – (13 x 1) [(A+B)(B+C)(A+C)(B+D)] (24 x 14 x 12 x 38)
= + 0,4912
Peta batas administratif kecamatan
PETA PENGGUNAAN LAHAN KABUPATEN KARANGANYAR JAWA TENGAH
0 2 4 6 8 Km
Waduk
Batas Kecamatan
Batas Kabupaten
Batas Propinsi
Sungai
Legenda
N
EW
S
Sumber : Data Pokok Kabupaten Karanganyar Berupa Peta Digital Karakteristik Lahan
Kec. Colomadu
Kec. Gondangrejo
Kec. Jaten
Kec. Kebakkramat
Kec Tasikmadu
Kec.Mojogedang
Kec. Karanganyar
Kec. Kerjo
Kec. Jumantono
Kec. Matesih
Kec. Karangpandan
Kec. Jenawi
Kec. Ngargoyoso
Kec. Tawangmangu
Kec. JatiyosoKec. Jumapolo
Kec.Jatipuro
KAB. SUKOHARJO
KAB. SRAGEN
470000 mT
470000 mT
480000
480000
490000
490000
500000
500000
510000
510000
520000 mT
520000 mT
914
000
0 m
U
91400
00 mU
915
000
0 91500
00
916
000
0 91600
00
917
000
0 m
U
91700
00 mU
Prop. Jawa Tengah
Prop. DIY
Laut Jawa
Samudera Hindia
Kab. Karanganyar
Skala 1:180.000
Jenis analisis korelasi apa yang dapat kita lakukan dengan
dua macam peta ini?
Analisis Regresi
• Mengukur kekuatan hubungan dengan analisis korelasi
• Menerapan bentuk persamaan regresi yang sesuai
• Regresi linier berganda
• Beberapa catatan
Menganalisis hubungan: Beyond statistical consideration
• Menilai kekuatan hubungan tidak hanya bergantung pada observasi atas 2 variabel (x dan y) saja Perlu memperhatikan adanya pengaruh variabel lain
• Dengan mencoba ‘memecah’ data ke dalam ≥ 2 kategori, pengamatan mengenai ada-tidaknya hubungan bisa dikaji lebih mendalam dan akurat
ukuran rumah
pen
dap
atan
kel
uar
ga R =0,01
Pola permukiman teraturPola permukiman tidak teratur
ukuran rumah
pen
dap
atan
kel
uar
ga
ukuran rumah
pen
dap
atan
kel
uar
ga
R =0,75
R = -0,15
Menerapkan persamaan regresi
• Regresi linier: Y = a + bX + e• Y = variabel terikat• X = variabel bebas• a = intercept pada sumbu Y, yaitu nilai Y ketika X = 0• b = koefisien gradien/slope• e = error
a = (Y)(X2) – (X)(XY)
N X2 - (X)2
b = N XY - (X)(Y)
N X2 - (X)2
Contoh: persamaan regresi antara jumlah penduduk dengan jumlah toko (N=15)
Jumlah penduduk
(X)X2
Jumlah toko
(Y)Y2 XY
Wilayah A 9.204 84.713.616 95 9.025 874.380
Wilayah B 5.629 31.685.640 94 8.836 529.126
Wilayah C 17.883.
.
319.801.664.
.
271.
.
73.441.
.
4.846.293.
.
Wilayah O 14.830 219.928896 233 54.289 3.455.390
Jumlah 125.442 1.453.923.072 2.127 412.911 22.648.580
pddwil
Menerapkan persamaan regresi
Regresi linier: Y = a + bX + e
a = (2127)(1453923072) – (125442)(22648580) = 41.4
(15 x 1453923072) - 15735695360
b = (15) (22648580) - (125442)(2127) = 0,0120
(15 x 1453923072) - 15735695360
Persamaan regresi menjadi Y = 41,4 + 0,0120X
Regresi non linier?
• Bentuk umum:
• Logaritmik sederhana : Y = a + b.logX
• Eksponensial sederhana : Y = a.ebX
• Pangkat sederhana: Y = a.Xb
Tugas: Baca Shaw and Wheeler (1989) atau lainnya, untuk memahami model fungsi regresi non-linier
Regresi linier berganda
• Digunakan untuk menggambarkan hubungan matematis antara satu variabel terikat (Y) dengan beberapa variabel bebas (Xi)
• Menggunakan asumsi bahwa masing-masing variabel bebas Xi bersifat saling independen
• Bentuk umum:
Y = a + b1X1 + b2X2 + b3X3 + … + biXi + e
a = nilai intercept
b1 s/d bi = koefisien regresi parsial
e = error
• Tidak dapat digambarkan secara grafis, kecuali kalau hanya terdapat dua variabel bebas X1 dan X2.
• Pada kasus di mana hanya ada 2 variabel X1 dan X2, bentuk persamaan yang umum adalah
• Pada kasus di mana hanya ada 2 variabel X1 dan X2,
bentuk persamaan yang umum sebenarnya adalah
Y = a + b01.2 X1 + b02.1 X2 + edi mana b01.2 adalah koefisien regresi yang mewakili garis regresi Y vs X1, dengan asumsi X2 tetap (konstan). Begitu sebaliknya untuk b02.1.
• Bila persamaan di atas hanya digambarkan dengan b1 dan b2, maka perhitungan b1 dan b2 adalah sbb:
• b1 = (Y – Y)(X1 – X1)(X – X1) (X2-X2)2
• Korelasi berganda dan korelasi parsial
• Korelasi berganda : R =
• Korelasi parsial :
ANALISIS FAKTOR
• Analisis faktor diperlukan ketika dalam suatu penelitian ada ‘sejumlah besar’ variabel yang terlibat; khususnya ketika dalam mengamati variabel-variabel yang berpengaruh terhadap suatu fenomena Y, terdapat sejumlah besar Xi yang harus diperhitungkan kontribusinya
• Dalam analisis faktor, diasumsikan bahwa sejumlah besar variabel Xi tersebut belum tentu saling independen
ANALISIS FAKTOR• Analisis faktor juga diperlukan karena:
– Ada kebutuhan untuk mempelajari hubungan timbal-balik antar sejumlah besar variabel
– Untuk menilai masing-maisng faktor menurut keterkaitan variabel yang ada di dalam kelompoknya
– untuk digunakan sebagai dasar dalam ‘menyisihkan’ variabel yang tidak nyata
• Analisis faktor bertumpu pada data rasio/interval, yang besarannya dapat di’plot’ pada suatu sistem koordinat multi-dimensi. Perhatian utama analisis faktor adalah pada upaya penentuan sumbu-sumbu utama dari sejumlah variabel.
Beberapa jenis analisis faktor
TahapTahap Tipe pilihanTipe pilihan TerminologiTerminologi
Matriks korelasi (a) antar-variabel R-factoring
(b) Antar individu Q-factoring
Ekstraksi faktor inisial (a) Faktor yang terdefinisi
Principle Component
(b) Faktor terinferensi Factor analysis
Rotasi untuk mencapai faktor final
(a) Uncorrelated (tak-berkorelasi)
Ortogonal
(b) Correlated (berkorelasi)
Condong
Sumbu utama pertama
Sumbu utama kedua
Contoh analisis awal dengan melibatkan koefisien korelasi antar 3 variabel: Estimasi variabel rerata baru (atau ‘faktor’)
Lereng Elevasi Drainase permukaan
Lereng 1,0 0,6 0,7
Elevasi 0,6 1,0 0,8
Drainase permukaan 0,7 0,8 1,0
Jumlah korelasi= 2,3 2,4 2,5
Bobot faktor
(factor loadings)=
Jumlah setiap korelasi
(jumlah total korelasi)
VariabelVariabel Bobot faktorBobot faktor
(factor loading)(factor loading)
Kuadrat bobotKuadrat bobot
Lereng 2,3/(2,3+2,4+2,5) =
0,85
0,72
Elevasi 2,4/(7,2) =
0,89
0,79
Drainase permukaan 2,5/ (7,2) =
0,93
0,86
Nilai eigen (eigen value) =
(kuadrat bobot faktor)
2,37
Besarnya variansi faktor, dalam persen, adalah: (1/n), =nilai eigen
Sehingga untuk faktor I = 2,37/3 = 79%
Perhitungan untuk nilai eigen dan persentase faktor II, III dst biasanya tidak mungkin dilakukan secara manual, dan dilakukan secara iteratif (berulang) dengan komputer.
Sumbu utama pertama
Sumbu utama kedua
Nilai eigen
Total variansi:
% faktor
GEOSTATISTIKGEOSTATISTIK
• Concern utama: variabel acak yang terdistribusi dalam ruang, yang disebut sebagai ‘teregionalisasi’ (regionalized)
• Geostatistik dapat digunakan untuk melakukan ekstraksi sifat-sifat spasial dari variabel-variabel yang teregionalisasi
• Manfaat interpolasi klasifikasi
Analisis geostatistik
• Pioner: Krige (1951), di Afrika Selatan tambang emas
• Matheron dan Ghandin (1971) di Uni Soviet karakteristik tanah
• Konsep fundamental :
PRINSIP AUTOKORELASI SPASIAL
AUTOKORELASI DAN KRIGING
• Autokorelasi: hubungan statistik antar titik-titik yang diukur, di mana korelasi tergantung pada jarak dan arah yang memisahkan lokasi titik-titik tersebut.
• Prinsipnya: yang berdekatan lebih punya kemiripan daripada yang berjauhan. Semakin jauh, semakin tidak mirip
AUTOKORELASI: HUKUM GEOGRAFI YANG PERTAMA – MENURUT WALDO TOBLER
Autokorelasi dan Kriging
• Kriging memanfaatkan prinsip autokorelasi spasial, dan pada dasarnya merupakan ‘distance-weigthed interpolation’
• Kriging memberi bobot pada ruang di sekitar nilai-nilai yang diukur, untuk memprediksi nilai setiap titik pada lokasi baru
• Bobot tidak hanya pada titik-titik yang dievaluasi, melainkan juga titik yang akan diprediksi, dan juga susunan keruangan (spatial arrangement) –yaitu autokorekorelasi– titik-titik yang diukur
Kriging• Kriging menggunakan bobot berdasarkan
perhitungan statistik data, dan bukan bersifat a-priori (seperti pada scoring) menjadi pembeda kunci antara analisis deterministik (tradisional) dan analisis geostatistik
• Proses Kriging:– Kuantifikasi struktur spasial dari titik-titik data
di sekitar titik yang akan diprediksi– Menghasilkan prediksi pada suatu lokasi baru
Variografi, semivariogram• Variografi proses di mana model spasial
terplotkan secara tepat pada data, dan struktur spasialnya terkuantifikasi
• Semivariogram digunakan untuk mengkaitkan semivariansi dengan separasi spasial/ autokorelasi yang ada pada sampel
• Semivariansi memberikan deskripsi tak bias mengenai skala dan pola variabilitas spasial di seluruh wilayah kajian
Contoh komputasi semivariansi
• 12 nilai kecerahan secara individual (BV) yang terdapat pada suatu penampang/jalur
• (BV) z dari piksel x diekstrak dengan interval teratur z(x), di mana x = 1,2,3,…n
• Hubungan antara suatu pasangan piksel sejauh h interval dapat diberikan oleh nilai variansi rerata sepanjang penampang
• Ada m kemungkinan pasangan yang dipisahkan oleh lag distance h.
• Semivariogram (h) merupakan fungsi yang menkaitkan setengah dari pangkat perbedaan antara titik-titik sampel:
• Semivariansi rerata merupakan ukuran yang bagus untuk besarnya ketidakmiripan (dissimilarity) antar piksel-piksel yang secara spasial terpisah
Karakteristik terpenting dalam semivariogram: