BAB I

download BAB I

of 18

Transcript of BAB I

BAB I PENDAHULUAN

1.1 Latar Belakang Metode Bootstrap merupakan metode baru yang memanfaatkan kecanggihan komputer yang dapat dikatakan juga sebagai metode resampling, yaitu suatu metode pengambilan data secara random dengan pengembalian, dimana sampel hasil resampling ini disebut sampel Bootstrap. Sebaran t-student biasa dimanfaatkan oleh statistikawan untuk menduga selang kepercayaan. Semuanya mafhum bahwa asumsi kenormalan merupakan syarat dasar yang harus terpenuhi; karena itu, sebelum menyodorkan dugaan selang kepercayaan statistikawan umumnya menyibukkan diri dengan berbagai penjelasan, sedemikian rupa sehinggga penggunaan t-student memperoleh pembenaran. Jika yang dievaluasi adalah statistik rataan para statistikawan dapat tertolong oleh dalil limit pusat yang menyatakan bahwa sebaran rataan mendekati normal apabila sampel yang diambil berukuran besar, tak peduli apa sebaran asalnya. Namun, kenyataan yang dialami kadang tidak sesempurna itu. Pada suatu kesempatan, mungkin saja sampel yang diambil berukuran kecil sehingga dalil limit pusat tidak bisa menjadi sandaran, dan pada saat yang sama sebaran populasi sama sekali tidak diketahui. Kalau sampelnya cukup besar, meskipun sebaran populasi tidak diketahui kenormalan data masih bisa diidentifikasi dengan uji kebaikan suai, tapi kalau sampelnya kecil uji kebaikan suai umumnya gagal memberi garansi kenormalan. Sampel kecil bukanlah satu-satunya masalah yang dapat menghambat pekerjaan statistikawan. Masalah lain yang dapat muncul adalah ketika yang mau dievaluasi bukan statistik rataan, misalnya median. Kita tahu t-student tidak diciptakan sebagai alat untuk menganalisis median; lalu bagaimana kalau kita tetap ingin tahu standar errornya? Apakah hal itu bisa dilakukan? Kadangkala ada oknum statistikawan yang memaksakan penggunaan statistik t-student agar dapat memenuhi keinginannya melakukan inferensi dengan cara menyatakan bahwa data yang dianalisis diasumsikan menyebar normal,1 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP

meskipun sebenarnya asumsi tersebut bukan berasal dari fakta atau hasil pengujian yang ketat, melainkan harapan belaka. Tindakan ini menanggung konsekuensi: kalau pada kenyataaan asumsi kenormalan tidak terpenuhi maka hasil inferensinya akan salah. Kesalahan yang dilakukan oleh seorang statistikawan bisa saja berakibat fatal. Pengujian pengaruh obat, misalnya, menuntut ketelitian dan keabsahan dari metode yang digunakan. Jika metodenya salah maka hasil pengujiannya bisa salah, dan pada akhirnya kesalahan tersebut bisa mengancam jiwa manusia. Gambaran ini akan membuat statistikawan merasa terpojok. Lantas apa yang bisa dilakukan saat kita berada dalam kondisi yang penuh keterbatasan? Metode apa yang bisa dijadikan sebagai jalan keluar? Tidak ada solusi tunggal dan pasti, namun metode Bootstrap memungkinkan kita menemukan jalan keluar.

1.2 Identifikasi Masalah 1. Bagaimanakah cara memperoleh sebuah perkiraan yang baik untuk nilai numerik dari estimasi standar error?

1.3 Tujuan Penulisan Adapun tujuan dari penulisan makalah ini adalah untuk mengetahui cara memperoleh sebuah perkiraan yang baik untuk nilai numerik dari estimasi standar error.

1.4 Manfaat Penulisan Secara umum manfaat penulisan makalah ini adalah menambah pengetahuan maupun wawasan baik penulis maupun pembaca akan suatu metode estimasi standar error.

1.5 Sistematika Penulisan Sistematika penulisan pada makalah ini disusun menjadi empat bab, berikut adalah pembagian pembahasan setiap bab yang di tulis dalam makalah ini :

BAB I PENDAHULUAN

2 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP

Berisikan latar belakang masalah, rumusan masalah, tujuan penulisan, manfaat penulisan dan sistematika penulisan. BAB II TINJAUAN PUSTAKA Berisikan teori penunjang yang berisi tentang pengertian standar error serta estimasi parameter yang terdiri atas estimasi tunggal, estimasi interval keyakinan dan estimasi standar error dari mean.

BAB III PEMBAHASAN Menguraikan tentang metode Bootstrap, estimasi parameter Bootstrap, standar error dan estimasi standar error dalam Bootstrap yang terdiri atas standar error dan estimasi standar error, aspek komputasi standar error dan studi kasus.

BAB IV KESIMPULAN Bab ini menguraikan kesimpulan isi dari hubungan antara bab-bab sebelumnya.

3 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP

BAB II LANDASAN TEORI

Metode pem-bootstrap-an pertama kali diperkenalkan oleh Efron sebagai sebuah metode untuk menurunkan nilai dugaan galat baku (standar error) dari suatu penduga tak tentu. Mencari galat baku suatu nilai dugaan adalah sebuah kegiatan yang penting bagi setiap statistikawan karena umumnya tidak merasa cukup hanya dengan nilai dugaan titik; kita selalu ingin tahu seberapa layakkah si penduga bagaimana keragaman dari penduga? Dalam kenyataannya, kadang para statistikawan begitu serakah dan tidak hanya ingin tahu dugaan titik dan galat bakunya saja tapi juga hal-hal lain seperti bias atau bahkan sebaran lengkap dari penduga (Nancy Barker). Bootstrap ialah sebuah jalan keluar yang patut dicoba ketika statistikawan yang serakah terperangkap sejumlah persoalan, seperti tidak terpenuhinya asumsi kenormalan akibat dari sampel kecil, adanya hubungan tak linear antar peubah (misalnya rasio), atau ketika statistik yang ingin dievaluasi bukanlah rataan. Dengan Bootstrap, kita dapat membuat inferensi seperti selang kepercayaan tanpa mengetahui sebaran populasi. Penjelasan detail tentang metode ini dapat dibaca di dalam buku yang ditulis Efron dan Tibshirani: An Introduction to the Bootstrap (1993). Bootstrap merupakan suatu teknik baru dan terus berkembang sebagai upaya untuk menjawab pertanyaan mendasar dari teori statistika, yaitu seberapa akurat ringkasan data yang telah dibuat. Menaksir akurasi dari suatu penduga

merupakan salah satu tujuan yang umumnya ingin dicapai oleh statistikawan, tapi sayangnya hal ini tidak selamanya mudah dilakukan. Jika yang sedang dievaluasi adalah rataan, formula tingkat akurasi bisa diperoleh dengan mudah, yakni ,

yang dikenal sebagai dugaan standard error. Tapi jika yang dievaluasi adalah statistik selain rataan, itu berarti statistikawan sedang menjumpai masalah.

2.1 Pengertian Standar Error

4 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP

Standar error dari suatu estimator/penduga didefinisikan sebagai akar kuadrat positif dari ragamnya. Ini merupakan ukuran yang paling umum untuk akurasi suatu penduga/estimator. Estimasi standar error adalah langkah awal yang sangat baik untuk berpikir kritis terhadap nilai dugaan. Dalam membicarakan mengenai standar error itu, akan dibedakan dua macam sampel, yaitu sampel yang berukuran besar dan sampel yang berukuran kecil. Jika n merupakan sebuah bilangan besar (dimana n menunjukkan besarnya sampel), maka distribusi sampel teoritis dari nilai rata-rata hitung itu dapat dihampiri dengan baik oleh distribusi normal. Jika sampel yang dipakai terlalu kecil, distribusi normal tidak dapat dipakai untuk menghampiri distribusi sampel teoritis tersebut, tetapi harus memakai distribusi t . Ini disebabkan standar error suatu statistik bergantung pada besarnya sampel yang dipakai. Sayangnya standar error mempunyai kelemahan besar: untuk kebanyakan penduga selain rataan tidak tersedia formula untuk dugaan standar error. Dengan kata lain, sulit menerka akurasi suatu nilai dugaan selain rataan. Lalu bagaimana caranya mengetahui tingkat keakuratan statistik selain rataan, misalnya median? Bootstrap hadir untuk menjawab pertanyaan seperti ini. Untuk memahami bagaimana proses metode bootstrap dalam mengestimasi standard errror suatu statistik, Efron dan Tibshirani memberikan gambaran dengan skema di bawah ini: dari sampel

5 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP

Skema di atas menjelaskan bahwa standar error dari suatu statistik s(X) dapat diduga oleh standar deviasi dari nilai-nilai replikasi bootstrap s(X*1), s(X*2), ..., s(X*B), di mana B adalah banyaknya sampel bootstrap yang dibangkitkan dari data melalui penarikan sampel dengan pengembalian, dan masing-masing sampel bootstrap berukuran n (banyaknya observasi pada data asal). Lebih jauh, Efron dan Tibshirani menjelaskan dengan sangat detail bagaimana teknik menduga selang kepercayaan dari suatu parameter: melalui tabel bootstrap (t-boostrap) dan persentil bootstrap, serta berbagai metode yang bisa digunakan untuk mengoreksi hasilnya. Merujuk ke Efron dan Tibshirani, Nancy Barker menjelaskannya dengan cara yang lebih ringkas. Misalkan ada suatu nilai dugaan dan dugaan standard error , maka selang

kepercayaan 95% yang umum ialah: RATAAN 1.96*SE =

Ini didasarkan pada asumsi bahwa:

(yakni mendekati sebaran normal baku) , tapi hanya sebuah pendekatan untuk sampel terbatas.

Ini sah jika n

Pendekatan yang mungkin lebih baik ialah dengan menggunakan sebaran t dengan mengasumsikan

(yakni mendekati sebaran t dengan derajat

bebas n-1). Untuk sampel kecil ini merupakan pendekatan yang lebih baik, namun

6 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP

penggunaan sebaran -t tidak meng-adjust selang kepercayaan untuk menjelaskan kemenjuluran yang asli dari populasi atau galat lain yang muncul ketika rataan. Dengan menggunakan metode bootstrap bisa diperoleh selang yang akurat tanpa harus membuat asumsi teori normal. bukan

2.2 BOOTSTRAP NON-PARAMETRIK

Misalkan x1,x2,...,xn adalah data pengamatan, biasanya dinyatakan oleh suatu vektor x=(x1,x2...xn), kemudian dihitung suatu Statistik dari data pengamatan tersebut misalkan s(x). Suatu sampel Bootstrap x*= (x1*, x2*,.... xn*) diperoleh melalui sampling acak dengan pengembalian sebanyak n kali dari data pengamatan x1,x2,...,xn

2.3 ALGORITMA BOOTSTRAP NON PARAMETRIK Berikut langkah langkah menghitung nilai taksiran Standard Error dengan menggunakan simulasi Bootstrap Non-parametrik: 1. berdasarkan data sampel asli x = (x1, x2 , ..., xn) hitung Statistik s(x) 2. ambil sampel acak dengan pengembalian dari data sampel asli, untuk mendapatkan sampel Bootstrap x*= (x1*, x2*,.... xn*). 3. hitung Statistik yang sama seperti langkah satu dengan menggunakan data sampel Bootstrap untuk mendapatkan replikasi Bootstrap s(x*). 4. ulangi langkah 2 dan 3 sebanyak B kali, sehingga diperoleh replikasi Bootstrap s(x*1), s(x*2),..., s(x*B). 5. hitung nilai taksiran Standard Error dari s(x), dengan menggunakan persamaan berikut:

=Diketahui:

; S(.) =

: nilai taksiran standard error bootstrap

: standard error bootstrap ke-b hasil dari resampling

7 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP

: rataan untuk standard error bootstrap : banyaknya resampling bootstrap

8 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP

BAB III PEMBAHASAN Diketahui ada sebuah data Nonparametrik yang akan ditaksir Standar Errornya menggunakan Metode Standar error Bootstrap Nonparametrik dengan data sampel sebagai berikut: Tabel 3.1 Skor Agresi anak laki-laki dan anak perempuan dalam permainan bebas ANAK LAKI-LAKI 86 69 72 65 113 65 118 45 141 104 41 50 ANAK PEREMPUAN 55 40 22 58 16 7 9 16 26 36 20 15

Sumber: Sidney Siegel, Nonparametric Statistics for Behavioral Sciences(1997) Dari tabel diatas diketahui bahwa dua belas anak laki-laki berusia empat tahun dan dua belas anak perempuan berusia empat tahun diobservasi dalam waktu-bermain yang panjangnya 15 menit dan setiap permainan masing masing anak dalam kedua kurun waktu itu diberi skor untuk kejadian dan tingkat Agresi. Dari data Nonparametrik diatas akan dihitung nilai penaksir Standard Error dari rata-rata, varians dan koefisien korelasi sampel dengan menggunakan metode Bootstrap.

9 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP

Metode yang digunakan untuk menghitung nilai penaksir Standar Error dari rata-rata, varians dan koefisien korelasi sampel dengan menggunakan metode Bootstrap nonparametrik dikarenakan data sampel adalah nonparametrik. Hal yang dilakukan pertama sekali dalam penaksiran standar error atas data tersebut adalah melakukan replikasi data sampel sebanyak B kali, kemudian membuat algoritma untuk penaksiran standar error Bootstrap dengan

mengidentifikasi statistik s(x) apa yang akan digunakan dalam penaksiran standar error tersebut. Selanjutnya melakukan perhitungan nilai taksiran Standard Error dari s(x), dengan menggunakan persamaan berikut:

=

; S(.) =

Dengan menggunakan bantuan software Matlab, berikut ini disajikan nilai estimasi standar error Bootstrap atas data sampel tersebut diatas dari statistik: a. Rata-rata sampel untuk x: Penyataan program Matlab untuk estimasi standar error Bootstrap dari rata-rata sampel untuk x adalah:function [RATA,SE]=datax(x) % MENGHITUNG STANDARD ERROR DARI RATA-RATA rand('state',100) n=length(x); % banyaknya sampel x RATA=mean(x); % rata-rata dari sampel x pembangkitan (langkah 1) B=1000; % jumlah replikasi bootstrap

hasil dari

for i=1:B % pengulangan untuk langkah 2 dan 3 index=unidrnd(n,n,1); xboot=x(index); % sampel bootstrap RATAboot(i)= mean(xboot); end SE=std(RATAboot);% standar error dari rata-rata bootstrap

Ouput dari serangkaian pernyataan di atas ditampilkan di bawah ini:

10 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP

>> [RATA,SE]=datax(x) RATA = 80.7500 SE = 8.7712 Dari output di atas dapat dilihat bahwa standar error dari rata-rata replikasi Bootstrap adalah 8.7712.

b. Rata-rata sampel untuk y: Penyataan program Matlab untuk estimasi standar error Bootstrap dari rata-rata sampel untuk y adalah:

function [RATA,SE]=datay(y) % MENGHITUNG STANDARD ERROR DARI RATA-RATA rand('state',100) n=length(y); % banyaknya sampel y RATA=mean(y); % rata-rata dari sampel y hasil dari pembangkitan (langkah 1) B=1000; % jumlah replikasi bootstrap for i=1:B % pengulangan untuk langkah 2 dan 3 index=unidrnd(n,n,1); yboot=y(index)% sampel bootstrap RATAboot(i)= mean(yboot) end SE=std(RATAboot);% standar error dari rata-rata bootstrap

Ouput dari serangkaian pernyataan di atas ditampilkan di bawah ini: RATA = 26.6667 SE = 4.6467

Dari output di atas dapat dilihat bahwa standar error dari rata-rata replikasi Bootstrap adalah 4.6467.

c. Koefisien korelasi x dan y:

11 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP

Penyataan program Matlab untuk estimasi standar error Bootstrap dari koefisien korelasi untuk x dan y adalah:

function [koefkor,SEkor]=tugas2(x,y) % MENGHITUNG STANDARD ERROR DARI KOEFISIEN KORELASI rand('state',100) n=length(x); korel=corrcoef(x,y);% korelasi antara x dan y dalam bentuk matriks 2x2 koefkor=korel(1,2); % korelasi antara x dan y dari matriks korelasi 2x2 yang diambil baris 1 kolom 2 saja B=1000; % jumlah replikasi bootstrap for i=1:B % pengulangan untuk langkah 2 dan 3 index=unidrnd(n,n,1); xboot=x(index); yboot=y(index); korelboot= corrcoef(xboot,yboot); rboot(i)=korelboot(1,2); end SEkor=std(rboot);% standar error dari rata-rata bootstrap

Ouput dari serangkaian pernyataan di atas ditampilkan di bawah ini: >> korel=corrcoef(x,y) korel = 1.0000 0.0049 0.0049 1.0000

>> r1=korel(1,2) r1 = 0.0049

>> [koefkor,SEkor]=tugas2(x,y) koefkor = 0.0049 SEkor = 0.2319

12 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP

Dari output di atas dapat dilihat bahwa standar error dari koefisien korelasi replikasi Bootstrap adalah 0.2319. d. Varians sampel untuk x: Penyataan program Matlab untuk estimasi standar error Bootstrap dari varians sampel untuk y adalah:

function [VARIANS,SE]=datax1(x) % MENGHITUNG STANDARD ERROR DARI VARIANS rand('state',100) % banyaknya sampel x n=length(x); VARIANS=var(x); % varians dari sampel x hasil dari pembangkitan (langkah 1) B=1000; % banyaknya sampel Bootstrap for i=1:B % pengulangan untuk langkah 2 dan 3 index=unidrnd(n,n,1); xboot=x(index); VARIANSboot(i)= var(xboot);% sampel bootstrap end SE=std(VARIANSboot);% standar error dari varians Bootstrap

Ouput dari serangkaian pernyataan di atas ditampilkan di bawah ini:

>> [VARIANS,SE]=datax1(x)

VARIANS = 1.0128e+003 SE = 301.4040

Dari output di atas dapat dilihat bahwa standar error dari varians replikasi Bootstrap adalah 301.4040.

13 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP

e. Varians sampel untuk y: Penyataan program Matlab untuk estimasi standar error Bootstrap dari varians sampel untuk y adalah:function [VARIANS,SE]=datay1(y) % MENGHITUNG STANDARD ERROR DARI VARIANS rand('state',100) n=length(y); % banyaknya sampel y VARIANS=var(y); % varians dari sampel y hasil dari pembangkitan (langkah 1) % banyaknya sampel Bootstrap B=1000; for i=1:B % pengulangan untuk langkah 2 dan 3 index=unidrnd(n,n,1); yboot=y(index); VARIANSboot(i)= var(yboot);% sampel bootstrap end SE=std(VARIANSboot);% standar error dari varians Bootstrap

Ouput dari serangkaian pernyataan di atas ditampilkan di bawah ini: >> [VARIANS,SE]=datay1(y) VARIANS = 288.9697 SE = 95.2397

Dari output di atas dapat dilihat bahwa standar error dari koefisien korelasi replikasi Bootstrap adalah 95.2397.

ALGORITMA : Berikut algoritma menghitung nilai taksiran Standard Error dengan menggunakan simulasi Bootstrap Non-parametrik: 1. berdasarkan data sampel asli x = (x1, x2 , ..., xn) hitung Statistik s(x)

14 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP

2. ambil sampel acak dengan pengembalian dari data sampel asli, untuk mendapatkan sampel Bootstrap x*= (x1*, x2*,.... xn*). 3. hitung Statistik yang sama seperti langkah satu dengan menggunakan data sampel Bootstrap untuk mendapatkan replikasi Bootstrap s(x*). 4. ulangi langkah 2 dan 3 sebanyak B kali, sehingga diperoleh replikasi Bootstrap s(x*1), s(x*2),..., s(x*B). 5. hitung nilai taksiran Standard Error dari s(x), dengan menggunakan persamaan berikut:

=Diketahui:

; S(.) =

: nilai taksiran standard error bootstrap

: standard error bootstrap ke-b hasil dari resampling : rataan untuk standard error bootstrap : banyaknya resampling bootstrap

DIAGRAM ALIR ( flow chart ) : Mulai

Input data x, y

Hitung statistik s(x), s(y)

Ambil sampel Bootstrap x*= (x1 *, x2*,...., xn*) dan y*= (y1*, y2 *,...., yn*)

hitung s(x*) dan s(y*)

15 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP

hitung nilai taksiran Standard Error dari s(x) dan s(y), atau

berhenti

16 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP

BAB IV KESIMPULAN

17 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP

DAFTAR PUSTAKA

www.google.com. Mutaqin, Aceng Komarudin. 2006. Komputasi Statistika dengan Matlab. Bandung: Universitas Islam Bandung.

18 ESTIMASI STANDAR ERROR DATA NONPARAMETRIK DENGAN METODE BOOTSTRAP