gd4113-1b.pdf

29
GD4113 - Statistik Spasial B. Setyadji, September 2005 Statistik untuk Data Spasial Salah satu definisi “Statistik”: Ilmu tentang ketidakpastian yang berupaya membuat suatu model keteraturan dari ketidakteraturan (order in disorder). Salah satu cara mengukur ketidakpastian adalah menggunakan konsep entropy. Jika ada kemungkinan kondisi di alam x i =1,...,k yang muncul secara acak dengan distribusi probabilitas (p 1 ,p 2 ,...,p k ) dimana 0 p i 1,i =1,...,k dan p 1 + p 2 + ··· + p k =1, maka entropy dapat didefinisikan (Shannon, 1948) sebagai E ≡- k i=1 p i · log p i dimana x. log x 0, untuk x =0. – Typeset by Foil T E X 1

Transcript of gd4113-1b.pdf

GD4113 - Statistik Spasial B. Setyadji, September 2005

Statistik untuk Data Spasial

Salah satu definisi “Statistik”: Ilmu tentang ketidakpastian yangberupaya membuat suatu model keteraturan dari ketidakteraturan (orderin disorder).

Salah satu cara mengukur ketidakpastian adalah menggunakan konsepentropy. Jika ada kemungkinan kondisi di alam xi = 1, . . . , k yang munculsecara acak dengan distribusi probabilitas (p1, p2, . . . , pk) dimana 0 ≤ pi ≤1, i = 1, . . . , k dan p1 + p2 + · · ·+ pk = 1, maka entropy dapat didefinisikan(Shannon, 1948) sebagai

E ≡ −k∑

i=1

pi · log pi

dimana x. log x ≡ 0, untuk x = 0.

– Typeset by FoilTEX – 1

GD4113 - Statistik Spasial B. Setyadji, September 2005

Jika xi adalah data numeris, maka nilai menengah µ ≡∑k

i=1 xi·pi dapat

disamakan dengan pusat distribusi dan variansi σ2 ≡∑k

i=1(xi − µ)2pi

sebagai jumlah penyimpangan distribusi. Bandingkan dengan formulasikonsep nilai variansi σ2 dalam Hitung Perataan I yang menunjukkan nilaiketidakpastian hasil estimasi nilai menengah µ

Satu pertidaksamaan entropy yang menarik adalah

E(λ(1) : µ(1)

)≥ E

(λ(0) : µ(0)

)yang kira-kira dapat diinterpretasikan bahwa alam semesta cenderungmengarah pada tingkat entropy yang lebih tinggi daripada level sebelumnya.Berbagai upaya dilakukan untuk memperlambat peningkatan entropy iniwalaupun tidak pernah akan bisa menurunkan total entropy.

– Typeset by FoilTEX – 2

GD4113 - Statistik Spasial B. Setyadji, September 2005

Model data yang terdistribusi secara independen dan identik(Independent-and-Identically Distributed-Data Model)

Pada kuliah HP-I, selalu dipakai asumsi bahwa data yang digunakan(data pengamatan, observations fenomena tertentu) diambil pada kondisiyang sama dan tidak tergantung (independent) satu sama lain, danselanjutnya disebut sebagai sampel acak/random; prosedur-prosedurstatistik baku dapat diterapkan untuk membentuk model statistik danmeng-estimasi parameter-parameternya (lihat materi kuliah HP-I).

– Typeset by FoilTEX – 3

GD4113 - Statistik Spasial B. Setyadji, September 2005

Model data yang tidak homogen (Innhomogeneous-Data Model)

Adanya ketidak-homogenan dalam kumpulan data biasanyadiperhitungkan dalam model-model statistik dengan sebuah asumsinilai menengah yang tidak konstan; biasanya nilai menengah tersebutdiasumsikan merupakan kombinasi linier dari variabel-variabel yang terlibat.Walaupun, setelah variasi ketidak-homogenan sekala besar diperhitungkan,seringkali bisa diduga juga ada variasi ketidak-homogenan dalam sekalakecil.

Bisa terjadi nilai menengah mendekati konstan, tetapi variansi berlainan,tergantung pada peralatan yang digunakan dalam pengamatannya.Sehingga, teori satu-sampel tidak dapat diterapkan, meskipun masihmungkin untuk membentuk selang kepercayaan (confidence interval) untuknilai menengah bersama, dengan basis statistik t-like dengan pembobotan.

– Typeset by FoilTEX – 4

GD4113 - Statistik Spasial B. Setyadji, September 2005

Model data yang tak-bebas (Dependent-Data Model)

Kebanyakan teori matematika-statistik menggunakan asumsi kebebasan(independence) untuk memudahkan pembuatan modelnya. Walaupun tentusaja model-model yang melibatkan keterganrtungan statistik seringkali lebihrealistis; dua kelas model yang digunakan bersama melibatkan struktur-struktur korelasi inter-kelas (intraclass-correlation) dan korelasi serial. Iniyang menjadi salah satu lingkup kecil statistik spasial, yaitu ketergantunganakan muncul dalam segala arah dan menjadi lemah sebanding dengan makinjauhnya lokasi antar data.

Model ruang 3-dimensi yang saling berhubungan dengan waktu yangbergerak kesatu arah (unidirectional) adalah model alamiah yang telahdigunakan oleh ahli-ahli statistik untuk membuat model atas fenomena-fenomena fisika dan sosial. Model temporal murni adalah model deret waktu

– Typeset by FoilTEX – 5

GD4113 - Statistik Spasial B. Setyadji, September 2005

yang biasanya berbasis pada pengamatan yang terdistribusi secara seragamdan saling tergantung serta muncul pada selang waktu yang seragam pula.Aliran waktu yang satu arah mendasari pembentukan model-model ini.

Model-model spasial baru muncul belakangan. Disiplin apapun yangbekerja dengan pengumpulan data dari lokasi spasial yang berlainan perlumembangun model-model (tidak harus model statistik) yang menunjukkanadanya ketergantungan antar data dari lokasi yang berlainan. Model spasialtentu saja harus lebih fleksibel dibandingkan model temporal sebab masalalu (past), masa kini (present), dan masa datang (future) tidak mempunyaianalogi dalam ruang, serta tidak mungkin mengharapkan data muncul secarapada posisi spasial yang regular/teratur.

Dua pendekatan yang kontrast dapat dipakai untuk mengolah data yangmengandung ketergantungan ruang-dan-waktu. Berawal dari paradigmakebebasan yang dapat dimodelkan atau pembentukan prosedur-prosedurstatistik yang akan mengarah pada prosedur robust.

– Typeset by FoilTEX – 6

GD4113 - Statistik Spasial B. Setyadji, September 2005

Ruang lingkup

Topik utama: Analisis dan pemodelan statistik kumpulan data spasial.

Komponen utama: Lokasi spasial {s1, . . . , sn} dan data{D(s1), . . . , D(sn)} yang diamati pada lokasi-lokasi tersebut. Kumpulandata biasanya diasumsikan acak dan lokasi (seringkali) juga diasumsikanacak. Lebih jauh, lokasi yang diberikan biasanya tidak melibatkan modelketelitiannya.

Hal-hal penting lain yang sangat berkaitan dengan data spasial adalahmasalah pengukuran, penyimpanan, dan pengambilan informasi yangmengarah pada ilmu GIS.

Tiga jenis pembahasan dapat dipisahkan secara jelas dalam statistikspasial, yaitu:

– Typeset by FoilTEX – 7

GD4113 - Statistik Spasial B. Setyadji, September 2005

• Proses spasial yang terjadi pada ruang kontinyu (topik-topik padageostatistik),

• Proses spasial pada ruang lattice (mirip deret waktu), dan

• proses titik spasial (melibatkan proses titik tertentu dan proses himpunanacak.)

– Typeset by FoilTEX – 8

GD4113 - Statistik Spasial B. Setyadji, September 2005

Data Spasial dan Model-model Spasial

Penggunaan pertama statistik spasial adalah dalam bentuk peta sebarandata. Misalnya penggambaran arah angin pada peta tataguna lahan yangberkaitan dengan musim, yang kemudian digunakan untuk “meramalkan”musim tanam.

Model spasial baru muncul belakangan. Misalnya penggambaran jumlahkutu yang ada di kepala yang disajikan dalam bentuk banyaknya kutuper sentimeter persegi. Atau penggambaran magnitude gempa dalambentuk bola-bola pantai dengan ukuran simbol yang berlainan untukmemperlihatkan kecenderungan magnitude dan posisi gempa.

– Typeset by FoilTEX – 9

GD4113 - Statistik Spasial B. Setyadji, September 2005

Model Spasial Umum Statistik, mulai dari analisis data sampai ke teoridistribusi asimptotik untuk estimator parameter, berdasar pada model-model stokastik. Data spasial harus dimodelkan dalam bentuk yang sangatsederhana sehingga cukup fleksibel untuk ditangani meskipun ukurannyabesar sekali. Data yang dipakai dapat berupa data kontinyu maupun datadiskrit, dapat merupakan agregasi spasial maupun pengamatan pada titik-titik dalam ruang, lokasi spasialnya dapat regular maupun irregular, danlokasi-lokasinya dapat berupa bidang kontinyu secara spasial maupun bidangdiskrit. Paling sedikit, model stokastik digunakan untuk menyimpulkankeseluruhan data atau untuk memprediksi data yang tidak teramati.Hasilnya bisa saja menjelaskan kemunculan sebuah fenomena, sehinggaharus dibedakan dari pengertian kata “model” yang umum digunakan.Kebanyakan ilmuwan perlu membuat model dengan komponen-komponenyang dinamis.

– Typeset by FoilTEX – 10

GD4113 - Statistik Spasial B. Setyadji, September 2005

Ambil s ∈ Rd sebagai sebuah lokasi data generik dalam ruang euclidd-dimensi dan anggaplah bahwa datum potensial Z(s) pada lokasi spasials adalah nilai acak. Selanjutnya dibuat agar s bervariasi dalam himpunanindeks D ⊂ Rd sedemikian rupa sehingga menghasilkan medan acak (prosesacak) multivariate

Z(s) : s ∈ D;

yang disebut sebagai model “super-populasi” untuk data spasial.

Pada umumnya D diasumsikan menjadi himpunan bagian Rd yang fixed(tak-acak). Secara matematis, himpunan acak adalah hasil pemetaan dariruang probabilitas ke ruang (tertutup) yang merupakan himpunan bagiandari Rd.

Empat macam himpunan indeks D dapat dibedakan, yaitu:

• Data geostatistik

– Typeset by FoilTEX – 11

GD4113 - Statistik Spasial B. Setyadji, September 2005

D adalah himpunan bagian yang fixed dari Rd yang mengandungsegiempat d-dimensi dengan volume positif; Z(s) adalah vektor acakpada lokasi s ∈ D .

• Data latticeD adalah sebuah koleksi (beraturan ataupun tidak) yang fixed darisejumlah titik yang dapat dihitung dari Rd (dapat juga digeneralisirsebagai D adalah grafik/gambar dalam Rd); Z(s) adalah vektor acakpada lokasi s ∈ D.

• Pola titik(point patterns)D adalah proses titik dalam Rd atau himpunan bagian dari Rd; Z(s)adalah vektor acak pada lokasi s ∈ D.

• ObjekD adalah proses titik dalam Rd; Z(s) adalah himpunan random itu

– Typeset by FoilTEX – 12

GD4113 - Statistik Spasial B. Setyadji, September 2005

sendiri.

Untuk sementara, proses-proses deret-waktu multivariate dipisahkan dariproses-proses spasial menggunakan index T

Z(t) : −∞ < t < ∞

Proses-proses dalam ruang-waktu (space-time) dapat ditulis sebagai

Z(s; i) : s ∈ D(i), t ∈ T

dengan Z, D, dan T bisa saja random.

– Typeset by FoilTEX – 13

GD4113 - Statistik Spasial B. Setyadji, September 2005

Data Geostatistik

Geostatistik muncul pada awal 1980-an sebagai campuran disiplin-disiplinteknik Pertambangan, geologi, matematik, dan statistik. Kelebihannyadibandingkan pendekatan klasik untuk mengestimasi cadangan mineraladalah bahwa geostatistik mengenal variasi spasial baik pada sekala besarmaupun sekala kecil, atau dalam bahasa statistik: mampu memodelkanbaik kecenderungan spasial (spatial trends) maupun korelasi spasial (spatialcorrelation).

Metoda-metoda trend-surface melibatkan hanya variasi sekala-besardengan asumsi galat-galat yang independen. Watson (1972) menemukanbahwa kebanyakan problem-problem geologi memiliki variasi sekala-kecil,semacam korelasi positif antara data pada lokasi-lokasi spasial yangberdekatan.

– Typeset by FoilTEX – 14

GD4113 - Statistik Spasial B. Setyadji, September 2005

Satu hal yang penting dalam geostatistik adalah memprediksi tingkatbutiran pada satu blok pertambangan dari sampel-sampel yang diamati.Matheron (1963) menamakan proses prediksi ini sebagai kriging.

Metoda geostatistik banyak digunakan para ilmuwan tanah untukmembuat peta sifat-sifat tanah pada sebuah bidang tertentu dari sejumlahkecil sampel tanah pada lokasi-lokasi yang telah diketahui dalam bidangtersebut.

Masalah-masalah geostatistik dapat dibedakan dengan jelas dari jenislainnya dari kemampuan indeks spasial s untuk bervariasi secara kontinyudalam ruang Rd.

– Typeset by FoilTEX – 15

GD4113 - Statistik Spasial B. Setyadji, September 2005

Data lattice

Sebuah lattice dari lokasi-lokasi menggambarkan ide titik-titik yangtersebar merata dalam ruang Rd, terhubung ke tetangga terdekat, terdekatkedua, dst. Bentuk lattice tersebut dapat beraturan (regular) maupuntidak beraturan (irregular) yang pergeseran relatifnya tidak mengikutipola yang bisa diperkirakan dan hubungan-hubungannya tidak selaluberhubungan dengan bentuk geometrinya. Contoh: pixel yang disensordalam penginderaan jauh.

– Typeset by FoilTEX – 16

GD4113 - Statistik Spasial B. Setyadji, September 2005

Pola Titik

Pola titik muncul ketika variable penting yang akan dianalisis adalahlokasi dari “even-even”. Pertanyaan awal yang seringkali muncul adalahapakah pola yang diperoleh menggambarkan keteracakan spasial sempurna,clustering, atau keteraturan. Contohnya adalah penentuan posisi pohon-pohon dengan ukuran tertentu. Apakah pohon-pohon dengan ukurantertentu membentuk cluster? Bagaimana pohon-pohon lain berinteraksidengan kelompok tersebut, dsb. Variasi ukuran-ukuran disebut sebuahvariabel penanda (mark variable), dan keseluruhan proses selanjutnyadisebut sebagai proses titik spasial bertanda (marked spatial point process).

– Typeset by FoilTEX – 17

GD4113 - Statistik Spasial B. Setyadji, September 2005

Mengapa perlu statistik spasial?

Statistik spasial diperlukan untuk melihat efek korelasi terhadap proses-proses estimasi, prediksi, dan desain menggunakan model-model spasialtertentu.

Estimasi

Kita perhatikan lagi model statistik sederhana. Anggap ada himpunanpengamatan Z(1), . . . , Z(n) yang independen dan terdistribusi secaraseragam dari sebuah distribusi Gaussian (tentu saja normal) dengan nilaimenengah µ tidak diketahui tetapi nilai variansi σ2

0 diketahui. Variansi-minimum estimator yang tak-bias untuk µ menjadi

Z̄ ≡n∑

i=1

Z(i)/n,

– Typeset by FoilTEX – 18

GD4113 - Statistik Spasial B. Setyadji, September 2005

dan pengaruhnya pada nilai menengah,µ, adalah langsung: EstimatorZ̄ adalah Gaussian dengan nilai menengah µ dan variansi σ2

0/n. Sehinggasebuah selang kepercayaan 95% untuk µ menjadi

(Z̄ − (1.96)σ0/√

n, Z̄ + (1.96)σ0/√

n)

Selain data independen, bagaimana kalau data dianggap memiliki korelasipositif dengan korelasi yang menurun bila “jarak” antar data meningkat:

cov(Z(i), Z(j)) = σ20 · ρ|i−j|, i, j = 1, · · · , n, 0 < ρ < 1

Korelasi ini dihasilkan dari proses autoregressive Z(i) = ρZ(i − 1) +ε(i), i ≥ 1, dengan ε(i) adalah bagian dari urutan (i.i.d) variabel acakGaussian dengan nilai menengah nol dan variansi σ2

0(1− ρ2) dan bebas dariZ(i− 1).

Selanjutnya

– Typeset by FoilTEX – 19

GD4113 - Statistik Spasial B. Setyadji, September 2005

var(Z̄) = n−2

{n∑

i=1

n∑j=1

cov(Z(i), Z(j))

}

= {σ20/n}

[1 + 2{ρ/(1− ρ)}{1− (1/n)}

−2{ρ/(1− ρ)}2(1− ρn−1)/n]

untuk n = 10 dan ρ = 0.26, diperoleh var(Z̄) = {σ20/10}[1.608] dan selang

kepercayaan 95% dua-sisi untuk µ menjadi

(Z̄ − (2.485)σ0/√

10, Z̄ + (2.485)σ0/√

10)

Jadi, ketiakberhasilan mengenali adanya korelasi positif dalam himpunandata akan mengarah pada sebuah selang kepercayaan yang terlalu sempit;untuk n = 10 dan ρ = 0.26, cakupan probabilitasnya adalah 87.8%, bukan95%.

Efek dari korelasi spasial dapat diturunkan dari fungsi variansi di atas.

– Typeset by FoilTEX – 20

GD4113 - Statistik Spasial B. Setyadji, September 2005

Tuliskan variansi di atas sebagai

var(Z̄) = σ20/n′

dengan

n′ ≡ n/[1 + 2{ρ/(1− ρ)}{1− (1/n)}

−2{ρ/(1− ρ)}2(1− ρn−1)/n]

dapat diinterpretasikan sebagai bilangan ekivalen dari pengamatanindependen. Jika n = 10 dan ρ = 0.26, maka n′ = 6.2; yaitu 6 pengamatanindependen mencapai presisi yang sama seperti 10 pengamatan berkorelasi.Untuk nilai n yang besar, n′ ' n/[(1 + ρ)/(1− ρ)], memperlihatkan bahwakorelasi berpengaruh bahkan dalam sampel-sample yang besar.

Model-model spasial lain yang lebih rumit pun memperlihatkan sifat-sifatumum yang sama. Sebagai contoh, Haining (1988) mengusulkan model

– Typeset by FoilTEX – 21

GD4113 - Statistik Spasial B. Setyadji, September 2005

Gaussian dengan nilai menengah yang konstan (constant-mean) dalam R2

yang menggambarkan autoregresi dan moving averages, masing-masingdengan parameter variansi σ2 yang tidak diketahui. Di sini dibandingkanjuga variansi Z̄ yang diasumsikan independen dengan yang diasumsikantergantung secara positif. Juga dibandingkan variansi estimator maximumlikelihood µ̂ dari nilai menengah µ yang konstan. Secara umum, pengaruhklasik dengan dasar Z̄ dan σ̂2/n kurang cocok; untuk ketergantunganspasial yang positif, v̂ar(Z̄) dan v̂ar(µ̂) lebih besar daripada σ̂2/n.

Grenander (1954) memperlihatkan bahwa Z̄ dan estimator maximumlikelihood

µ ≡{

Z(1) + (1− ρ)n−1∑i=2

Z(i) + Z(n)} /

{n− (n− 2)ρ}

(yang juga sekaligus menjadi estimator unbiased untuk variansi minimum)memiliki efisiensi asimptotik (100%) yang sama untuk n →∞.

– Typeset by FoilTEX – 22

GD4113 - Statistik Spasial B. Setyadji, September 2005

Prediksi

Anggaplah ada satu nilai pengamatan yang tidak diketahui, Z(n +1), harus di-prediksi dari data Z ≡ (Z(1), . . . , Z(n)) dengan asumsiZ(1), . . . , Z(n), Z(n + 1) terhubung secara Gaussian, terdistribusi identikdengan nilai menengah /mu dan variansi σ2

0 diketahui, dan independen.Prediktor p(Z;n + 1) yang memenuhi kondisi ke-tidakbias-an E(p(Z;n +1)) = µ dan meminimalkan kesalahan prediksi kuadrat-rata-rata

E(Z(n + 1)− p(Z;n + 1))2

adalah nilai menengah sampel

p0(Z;n + 1) = Z̄.

Kesalahan prediksi kuadrat-rata-rata yang diminimalkan adalah

ms0 = σ201 + (1/n)

– Typeset by FoilTEX – 23

GD4113 - Statistik Spasial B. Setyadji, September 2005

Ketika asumsi independen diganti dengan korelasi positif, prediktor tak-bias yang meminimalkan kesalahan prediksi kuadrat-rata-rata menjadi

pρ(Z;n + 1) = pρ(Z)

= ρZ(N) + (1− ρ){Z(1)+(1−ρ)∑n−1

i=2 +Z(n)}{n−(n−2)ρ} ;

Jika digunakan Z̄ maka kesalahan prediksi kuadrat-rata-rata menjadi

E(Z(n + 1)− Z̄)2

= σ20

{1 + (1/n)

[1 + 2{ρ/(1− ρ)}{ρn − (1/n)}

−2{ρ/(1− ρ)2}(1− ρn−1)/n]}

.

Untuk n = 10 dan ρ = 0.26, E(Z(n + 1) − Z̄)2 adalah σ20{1.09051}.

Bandingkan dengan ms0 yang menghasilkan σ20{1.1}: perbedaannya tidak

– Typeset by FoilTEX – 24

GD4113 - Statistik Spasial B. Setyadji, September 2005

terlalu signifikan. Tetapi, ketika korelasi spasial menurun secara geometrissebagai fungsi jarak, selang prediksi klasik akan mendekati valid. Walaupunakan kurang efisien.

Untuk model tak-bebas dapat dihitung

ms0 = σ20

[1− ρ2 + {(1− ρ)2(1 + ρ)/(n− (n− 2)ρ)}

];

Untuk n = 10 dan ρ = 0.26, ms0 adalah σ20{1.01952}. Jadi selang

prediksi 95% untuk Z(n + 1), berdasar pada prediktor optimal pρ(Z;n + 1)adalah(

pρ(Z)− (1.96)σ0{1.01952}1/2, pρ(Z) + (1.96)σ0{1.01952}1/2)

Bandingkan dengan selang prediksi 95% yang lebih lebar berbasis padaZ̄ (

pρ(Z)− (1.96)σ0{1.09051}1/2, pρ(Z) + (1.96)σ0{1.09051}1/2)

– Typeset by FoilTEX – 25

GD4113 - Statistik Spasial B. Setyadji, September 2005

Untuk n yang besar, rasio kuadrat dari lebar selang prediksi menggunakanpρ(Z) sampai Z̄ akan mendekati 1 − ρ2, yang merupakan suatu ukuranefisiensi pengaruh berdasar pada Z̄ dibandingkan pada prediktor optimalpρ(Z). Untuk ρ = 0.26 diperoleh efisiensi 93% sedangkan untuk ρ = 0.5menjadi 75%

Desain Eksperimental

Anggaplah ada satuan-satuan percobaan yang terletak pada arrayberukuran t × b membentuk blok b (kolom), dengan satuan-satuan t disetiap kolom tersebut. Satuan-satuan yang kira-kira sama ditempatkandalam blok yang sama sedemikian rupa sehingga terbentuk heterogenitasdi antara blok-blok tersebut. Anggap lagi bahwa percobaan t dibandingkansebagai berikut. Sebuah variabel tanggap (response variable) diukur setelahmenerapkan percobaan pada unit-unit eksperimental tersebut sedemikianrupa sehingga setiap percobaan muncul tepat satu kali dalam setiap blok.Sebuah rancangan/desain (yaitu alokasi percobaan pada unit-unit) untuk

– Typeset by FoilTEX – 26

GD4113 - Statistik Spasial B. Setyadji, September 2005

sebuah tipe baru saja dideskripsikan ini disebut sebagai rancangan bloklengkap (complete block design)

Dalam pembuatan kertas, menjelang akhir proses saat masih dalambentuk gulungan (kira-kira lebar 3 m dan panjang 10 km), lembarantersebut di-press supaya licin (inggris: calendered) atau digiling . Mesinkalender ini adalah tumpukan dua atau lebih silinder berpermukaan kerasdan mulus yang dilewati kertas yang bertujuan untuk mereduksi (caliper)kertas sehigga kertas menjadi padat dan meningkatkan kehalusannya. Prosespenggilingan ini digunakan tekanan tinggi untuk membuat kertas yang lebihkompak, lebih tipis dan permukaan lebih halus. Dalam masalah kehalusandan ketebalan dasar hampir seluruh variasi melintang ke arah lebar kertas.Oleh karena itu, sebuah percobaan pada penggilingan (a.l. jumlah danderajat kehalusan dsb) harus memperhitungkan hal-hal tersebut seperti jugakemungkinan korelasi spasial ke arah sejajar panjang kertas.

Percobaan penggilingan yang dirancang dengan baik dalam lab. harus

– Typeset by FoilTEX – 27

GD4113 - Statistik Spasial B. Setyadji, September 2005

memisahkan kertas dalam beberapa keras yang lebih sempit (mis. 60 cm),untuk memungkinkan pembentukan blok-blok percobaan. Dalam blok-blok tersebut, halaman-halaman yang lebih berdekatan akan cenderungmirip dibandingkan halaman-halaman yang terpisah, dan hal ini dapatdimodelkan dengan korelasi spasial (satu-dimensi). Oleh karena itu, ketikasebuah kegiata penggilingan diterapkan pada sebuah halaman (page), lokasihalaman tersebut dalam blok akan menjadi informsi yang bermanfaat untukanalisis yang efisien.

Tetapkan satu respon pada unit ke-i dalam blok ke-j adalah Yij(k); i =1, . . . , t; j = 1, . . . , b; k = 1, . . . , t, dengan k menunjukkan percobaan yangditerapkan pada unit. Anggap ada sebuah model tambahan

Yij(k) = µ + αk + βj + δ(i, j),

dengan δ(·, ·) adalah proses error Gaussian dengan nilai menengah nol.Lebih jauh lagi, anggap tidak ada ketergantungan δ antar blok tetapi ada

– Typeset by FoilTEX – 28

GD4113 - Statistik Spasial B. Setyadji, September 2005

ketergantungan spasial dalam blok, yaitu

cov(δ(i, j), δ(i′, j′)) ={

0, j 6= j′

σ2ρ[i−i‘], j = j′

dengan |ρ| < 1.

Salah satu tujuan dari desain eksperimental adalah untuk menemukanalokasi percobaan(treatment) atas unit-unit yang akan memberikan estimasipaling teliti mengenai efek percobaan, τk ≡ αk− (

∑tl−1 αl/t), k = 1, . . . , t.

Secara khusus, bisa diminimalkan

A ≡∑1≤k

∑<l≤t

var(τ̂k − τ̂l)/ (

t2

),

dengan {τ̂k : k = 1, · · · , t} adalah estimator kuadrat terkecilyang digeneralisasi (generalized-least-squares estimators) dari efek-efekpercobaan.

– Typeset by FoilTEX – 29