Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data...

20
Bab 2 Landasan Teori 2.1. Uji Statistik Non-Parametrik Dalam melakukan uji statistik non-parametrik kebaikan hasil ujinya relatif lebih rendah dibanding dengan uji parametrik. Untuk meningkatkan kebaikan hasil ujinya, ukuran sampel harus diperbesar. Akan tetapi bagaimanapun juga uji non-parametrik sangatlah mudah dimengerti dan relatif lebih sederhana dibandingkan dengan uji parametrik. Uji statistik non-parametrik dapat dikelompokkan menjadi 3 kategori, yaitu: 1. Uji sebuah sampel yang dibandingkan dengan menggunakan suatu distribusi tertentu. Misalnya, distribusi chi-kuadrat, binomial, normal dan distribusi lainnya. Untuk membandingkan frekuensi observasi dari variabel kategori dengan frekuensi harapan, digunakan uji chi-square. Untuk membandingkan frekuensi observasi dari variabel dikotomi dengan frekuensi harapan digunakan uji binomial. Untuk membandingkan distribusi kumulatif observasi suatu variabel dengan distribusi normal, uniform atau Poisson, digunakan uji kolmogorov- smirnov satu sampel. Uji runs digunakan untuk mengetahui apakah urutan suatu barisan pengamatan berubah-ubahsecara random. 2. Uji untuk dua grup independen (bebas) atau lebih. Perbandingan lokasi pemusatan dua buah distribusi yang diasumsikan mempunyai bentuk yang sama, digunakan uji 2 sampel independen U Mann Whitney yang merupakan versi non-parametrik uji T beda rata-rata. Kelompok uji 2 sampel independen meliputi uji Z kolgomorov-smirnov, reaksi ekstrem moses dan uji runs wald wolfowitz. Untuk lebih dari 2 grup independen, digunakan uji H kruskal-wallis.

description

http://ahlannet99.wordpress.com

Transcript of Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data...

Page 1: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

Bab 2

Landasan Teori

2.1. Uji Statistik Non-Parametrik

Dalam melakukan uji statistik non-parametrik kebaikan hasil ujinya relatif

lebih rendah dibanding dengan uji parametrik. Untuk meningkatkan

kebaikan hasil ujinya, ukuran sampel harus diperbesar. Akan tetapi

bagaimanapun juga uji non-parametrik sangatlah mudah dimengerti dan

relatif lebih sederhana dibandingkan dengan uji parametrik.

Uji statistik non-parametrik dapat dikelompokkan menjadi 3 kategori,

yaitu:

1. Uji sebuah sampel yang dibandingkan dengan menggunakan suatu

distribusi tertentu. Misalnya, distribusi chi-kuadrat, binomial, normal

dan distribusi lainnya. Untuk membandingkan frekuensi observasi dari

variabel kategori dengan frekuensi harapan, digunakan uji chi-square.

Untuk membandingkan frekuensi observasi dari variabel dikotomi

dengan frekuensi harapan digunakan uji binomial. Untuk

membandingkan distribusi kumulatif observasi suatu variabel dengan

distribusi normal, uniform atau Poisson, digunakan uji kolmogorov-

smirnov satu sampel. Uji runs digunakan untuk mengetahui apakah

urutan suatu barisan pengamatan berubah-ubahsecara random.

2. Uji untuk dua grup independen (bebas) atau lebih. Perbandingan lokasi

pemusatan dua buah distribusi yang diasumsikan mempunyai bentuk

yang sama, digunakan uji 2 sampel independen U Mann Whitney yang

merupakan versi non-parametrik uji T beda rata-rata. Kelompok uji 2

sampel independen meliputi uji Z kolgomorov-smirnov, reaksi ekstrem

moses dan uji runs wald wolfowitz. Untuk lebih dari 2 grup independen,

digunakan uji H kruskal-wallis.

Page 2: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

3. Uji variabel-variabel berpasangan (paired) atau berhubungan (related).

Untuk membandingkan 2 variabel untuk masing-masing subyek,

digunakan uji wilcxonyang merupakan versi non-parametrik uji T

berpasangan atau dependen. Kelompok ujiini meliputi uji tanda dan uji

mcnemar. Uji mcnemar sangat cocok untukmembandingan 2 variabel

kategori yang dikodekan dengan 2 nilai. Untukmembandingkan lebih

dari 2 pengukuran untuk masing-masing subyek, digunakan

Ujifriedman (untuk variabel kategori tidak biner) atau uji wkendall dan uji

q-cochran.

2.1.1. Uji Dua Sampel Berkait dan Uji K-Sampel Berkait

Pada sampel berkait (related), perlakuan atau treatment dilakukan pada

satu individu yangsama atau mendekati sama. Bila 2 perlakuan

diterapkan pada subjek yang sama, dapatdigunakan uji tanda, wilcoxon

dan uji mcnemar dengan hipotesis uji:

H0 : nilai variabel pada perlakuan 1 = perlakuan 2

H1 : nilai variabel pada perlakuan 1≠ perlakuan 2

Bila lebih dari 2 perlakuan diterapkan pada subjek yang sama (atau

mendekati sama), maka ujiyang digunakan adalah uji Friedman, Uji W

Kendall and uji q-cochran. Uji wkendal dan Uji q-cochran dapat digunakan

untuk nilai variabel-variabel dikotomi (biner), sedangkan ujiFriednandapat

digunakan untuk nilai-nilai yang tidak biner. Hipotesis uji k-sampel

berkaitadalah:

H0 : nilai semua variabel pada semua perlakuan bernilai sama

H1 : ada suatu variabel pada suatu perlakuan yang tidak sama

2.2.Metode Non-Parametrik

Hampir seluruh uraian tentang pengujian hipotesis berkisar pada

pengujian parametrik (parametrik test) karena pengujian sedemikian itu

Page 3: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

tertuju pada parameter populasi seperti misalnya rata-rata, varians dan

proporsi populasi. Pengujian non-parametrik merupakan cara menguji

hipotesis secara klasik dan didasarkan pada beberapa asumsi seperti

misalnya observasi sampel yang dipilih dari populasi harus bebas stokastik

dan random.

Metode non-parametrik sebaliknya tidak pernah merumuskan kondisi

maupun asumsi mengenai populasi darimana sampelnya dipilih. Tidak

heran jika statistik non-parametrik acapkali dinamakan statistik bebas

distribusi (distribution free statistics) karena metodenya tidak

membutuhkan asumsi tentang pola distribusi populasi. Dua asumsi

tentang sampelnya memang masih dibutuhkan, yaitu:

Observasi sampel harus independent dan random.

Variabel harus kontinyu.

Meskipun demikian, asumsinya jelas lebih sedikit dan lunak jika

dibandingkan dengan asumsi bagi statistik parametrik. Selain daripada

itu, asumsinya bahkan boleh dipenuhi atau tidak dipenuhi dalam

penggunaan metode non-parametrik. Istilah non-parametrik dan “bebas

distribusi” sebetulnya tidak identik. Non-parametrik umumnya

digunakan untuk menggambarkan bentuk pengujian yang tidak

melibatkan parameter populasi yang tertentu. Sebaliknya, “bebas

distribusi” berarti bentuk pengujian yang tidak membutuhkan asumsi

mengenai bentuk distribusi populasi. Lepas dari perbedaan diatas,

metode non-parametrik umumnya berarti metode pengujian yang

menyangkut salah satu dari atau kedua kondisi tersebut. Dalam banyak

hal, asumsi tentang distribusi populasi yang normal memang sukar

diterima. Guna melengkapi pengujian parametrik yang tradisional,

serangkaian cara pengujian statistik yang berhubungan dengan pola

distribusi populasi yang tidak diketahui telah dikembangkan.

Page 4: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

2.3. Keuntungan dan Kekurangan

Keuntungan menggunakan prosedur statistika non-parametrikadalah:

a Jika ukuran sampel kecil, tidak ada pilihan lain yang lebih baik dari

pada menggunakan metode statistik non parametrik, kecuali jika

distribusi populasi jelas normal.

b Karena memerlukan sedikit asumsi, umumnya metode non parametrik

lebih relevan pada situasi-situasi tertentu, sehingga kemungkinan

penerapannya lebih luas. Disamping itu kemungkinan dipergunakan

secara salah (karena pelanggaran asumsi) lebih kecil dari pada metode

parametrik.

c Metode non-parametrik dapat digunakan meskipun data diukur dalam

skala ordinal maupun interval.

d Metode non-parametrik dapat digunakan meskipun data diukur dalam

skala nominal. Sebaliknya tidak ada teknik parametrik yang dapat

diterapkan untuk data semacam itu.

Kekurangan menggunakan prosedur statistika non-parametrik adalah:

a Fleksibilitas terhadap skala pengukuran variabel, kadang-kadang

mendorong peneliti memilih metode parametrik, meskipun situasinya

memungkinkan untuk menggunakan metode parametrik. Karena

didasarkan pada asumsi yang lebih sedikit metode non-parametrik

secara statistik kurang kuat dari pada metode parametrik.

b Jika asumsi untuk metode parametrik terpenuhi, dengan ukuran

sampel yang sama, metode non-parametrik tidak memiliki kuasa

(power) dari pada metode parametrik.

c Penyederhanaan data (data reduction) dari skala rasio atau interval ke

dalam ordinal atau nominal, merupakan pemborosan informasi yang

sudah dikumpulkan.

d Meskipun konsep dan prosedur non parametrik sederhana, tetapi

Page 5: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

pekerjaan hitung menghitung bisa membutuhkan banyak waktu jika

ukuran sampel yang dianalisis besar.

2.4. Uji Tanda

Pengujian secara parametrik mengharuskan kita membuat asumsi bahwa

bentuk kedua distribusi populasi diketahui atau dianggap normal dan

varians dari kedua populasi juga dianggap sama.

Dalam banyak eksperimen, kita sering ingin membandingkan pengaruh

hasil dua perlakuan. Untuk data yang berpasangan, satu sebagai hasil

perlakuan A dan satu lagi hasil perlakuan B, ternyata untuk

membandingkan kedua hasil perlakuan (ditinjau dari rata-rata) itu dapat

digunakan uji tanda. Uji ini sangat baik apabila syarat-syarat berikut

dipenuhi:

a) Pasangan hasil pengamatan yang sedang dibandingkan bersifat

independen

b) Masing-masing pengamatan dalam tiap pasang terjadi karena

pengaruh kondisi yang serupa

c) Pasangan yang berlainan terjadi karena kondisi yang berbeda.

Sebagaimana namanya menyatakan, uji tanda ini akan dilakukan

berdasarkan tanda, yakni + dan – yang didapat dari selisih nilai

pengamatan. Misalkan hasil pengamatan Xi dan Yi masing-masing terjadi

karena perlakuan A dan B. Sampel berukuran N dapat ditulis sebagai (X1,

Y1), (X2,Y2),....,(XN,YN). Selanjutnya bentuk selisih-selisih (X1 - Y1), (X2 -

Y2),....,(XN - YN). Jika Xi> Yi kita beri tanda + (positif), dan jika Xi< Yi kita

beri tanda – (negatif), sedangkan untuk Xi = Yi kita abaikan pasangan

tersebut. Misalkan n menyatakan banyak pasangan yang menghasilkan

tanda-tanda positif dan negatif setelah dihilangkan pasangan Xi = Yi.

Selanjutnya misalkan h menyatakan banyak tanda + atau – yang paling

Page 6: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

sedikit. Bilangan h ini dapat dipakai untuk menguji hipotesis:

Ho: tidak ada perbedaan pengaruh kedua perlakuan

H1: terdapat perbedaan pengaruh kedua perlakuan

Dalam hal ini, pengaruh diukur oleh rata-rata, sehingga sebenarnya, uji

tanda ini dapat digunakan untuk menguji kesamaan dua rata-rata

populasi.

Untuk menolak atau menerima hipotesis Ho dalam taraf nyata 0,01 atau

0,05 sebuah daftar telah disediakan ialah daftar. Daftar tersebut berisikan

harga-harga h sebagai batas kriteria pengujian untuk harga n yang

didapat. Kriteria tersebut adalah: tolak Ho jika harga h dari perhitungan

lebih kecil atau sama dengan harga h yang didapat dari daftar untuk taraf

nyata yang dipilih. Dalam hal lainnya, Ho diterima. Dari daftar nampak

bahwa agar supaya pengujian dapat ditentukan hasilnya, diperlukan

paling sedikit n = 6.

2.4.1. Pengujian Tanda yang Sederhana

Kita misalkan x1 dan x2 merupakan variabel random dan kita

mengemukakan sebuah hipotesis bahwa distribusi populasi x1 identik

dengan distribusi populasi x2. guna menguji hipotesis diatas, kita memilih

dua sampel random yang memiliki besaran n yang sama (n1 = n2) masing-

masing dari populasi x1 dan x2. sampel dengan besaran n1 dapat saja

terdiri dari hasil observasi x1 = jumlah produk rusak per partai yang

dihasilkan dengan menggunakan m1. Sedangkan sampel dengan besaran

n2 dapat saja terdiri dari hasil observasi x2 = jumlah produk rusak per

partai yang dihasilkan dengan menggunakan mesin m2. Prosedur

pengujian tanda yang sederhana sebetulnya didasarkan pada hasil plus

atau minus dari beda antara kedua observasi sampel diatas tanpa

memperhitungkan besaran bedanya. Andaikan distribusi kedua populasi

Page 7: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

memang diketahui normal, maka pengujian parameter 21 dengan

menggunakan statistik uji t dapat saja digunakan. Sebaliknya dalam kasus

diatas dimana distribusi kedua populasi tidak diketahui, maka pengujian

tanda seharusnya digunakan.

2.4.2. Pengujian Pangkat Bertanda

Kelemahan cara pengujian tanda sederhana ialah cara pengujian

sedemikian itu tidak memperhitungkan besaran beda nilai pasangan.

Pada tahun 1945, Frank Wilcoxon mengembangkan suatu cara pengujian

yang berbeda dan dinamakan pengujian pangkat bertanda Wilcoxon

(Wilcoxon’s signed rank test). Titik tolak pengujian pangkat bertanda ialah

mengharuskan kita memberi pangkat pada semua beda absolut antara

nilai-nilai pasangan dari nilai beda terrendah sampai dengan nilai beda

tertinggi. Nilai beda absolut terrendah diberi pangkat nilsi 1. Nilai beda

sesudah nilai terendah diberi pangkat 2 dan begitu seterusnya. Setiap

pasang nilai yang memiliki nilai beda sama dengan nol tidak

diperhitungkan. Karena nilai bedanya diberi pangkat tanpamenghiraukan

tandanya, maka beda –1 dan +1 harus diberi pangkat nilai sampel, maka

jumlah pangkat bernilai positif dan negatif dihitung dan pengujian

pangkat bertanda didasarkan pada hasil penjumlahan.

2.5. UjiWilcoxon

Uji ini merupakan perbaikan dari uji tanda yang dijelaskan dalam bagian

yang lalu. Dalam uji wilcoxon, bukan saja tanda yang diperhatikan tetapi

juga nilai selisih (X - Y).

Caranya adalah sebagai berikut:

a) Beri nomor urut setiap harga mutlak selisih (Xi - Xj). Harga mutlak

yang terkecil diberi nomor urut atau peringkat 1, harga mutlak selisih

berikutnya diberi nomor urut 2, dan akhirnya harga mutlak terbesar

Page 8: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

diberi nomor urut n. Jika terdapat selisih yang harga mutlaknya sama

besar, untuk nomor urut diambil rata-ratanya.

b) Untuk tiap nomor urut diberikan pula tanda yang didapat dari selisih

(X - Y)

c) Hitunglah jumlah nomor urut yang bertanda positif dan juga jumlah

nomor urut yang bertanda negatif.

d) Untuk jumlah nomor urut yang didapat di c), ambilah jumlah yang

harga mutlaknya paling kecil. Sebutlah jumlah ini sama dengan J.

Jumlah inilah yang dipakai untuk menguji hipotesis:

Ho: tidak ada perbedaan pengaruh kedua perlakuan

H1: terdapat perbedaan pengaruh kedua perlakuan

Untuk menguji hipotesis di atas dengan taraf nyata 0,01 atau 0,05, kita

bandingkan J di atas dengan J yang diperoleh dari Daftar. Jika J dari

perhitungan lebih kecil atau sama dengan J dari daftar berdasarkan taraf

nyata yang dipilih maka Ho ditolak. Dalam hal lainnya Ho diterima.

Sebelum diberikan contoh mengenai penggunaan uji wilcoxon ini,

terlebihdahulu akan dijelaskan bagaimana nomor urut ditentukan untuk

sekumpulan data. Ambilah data berikut: 8, 9, 20, 14, 15, 18, 12, 6.

Jika nomor urut diberikan dimulai dari yang terkecil, maka 6 diberi nomor

urut 1, kemudian 8 diberi nomor urut 2, lalu 9 diberi nomor urut 3,

selanjutnya 12 diberi nomor urut 4 dan begitu seterusnya hingga akhirnya

20 diberi nomor urut 8. tentu saja, jika pemberian nomor urut dimulai dari

yang terbesar, urutan nomor akan dibalik. Jika ada data yang didapat dari

rata-rata nomor urut. Dengan demikian terjadilah nomor urut yang seri.

Untuk menentukan nomor urut dari kumpulan data berikut:

20, 8, 9, 10, 8, 10, 17, 10, 12, 10, 17, 17.

Page 9: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

Jika dimulai dari data terkecil, maka nomor urut 1 dan nomor urut 2

(untuk sementara) diberikan kepada 8. rata-ratanya = ½ (1 + 2) = 1½ , dan

inilah yang merupakan nomor urut seri unutk 8. nomor urut 3 diberikan

kepada 9. data bernilai 10 mempunyai nomor urut sementara 4, 5, 6 dan 7.

rata-ratanya = ¼ (4 + 5 + 6 + 7) = 5¼ dan inilah yang menjadi nomor urut

seri 10. selanjutnya nilai 12 diberi nomor urut 8. data 17 mempunyai

nomor urut 10 yang didapat dari ½ (9 + 10 + 11). Akhirnya nomor urut 12

diberikan kepada nilai 20. Uji wilcoxon ini juga dapat digunakan untuk

menguji hipotesis:

Ho: median populasi = M

H1: median populasi M.

Berdasarkan sebuah sampel acak yang diambil dari populasi yang diduga

mempunyai median M.Sudah barang tentu bahwa untuk hal ini kita

hanya memperhatikan sebuah sampel yang diambil dari sebuah populasi.

Jika data sampel berukuran n itu X1, X2,...., Xn, maka untuk keperluan

menguji median seperti dirumuskan dimuka harus dihitung selisih (Xi – M)

dan nomor urut harga mutlak MX i . Selanjutnya ditempuh langkah-

langkah b), c) dan d) seperti dijelaskan dimuka. Hipotesis Ho kita tolak

jika J dari perhitungan lebih kecil atau sama dengan J dari daftar

berdasarkan taraf nyata yang dipilih.

Jika ukuran sampel n lebih besar dari 25, maka J dapat dianggap

berdistribusi normal dengan rata-rata dan simpangan baku:

241)1)(2nn(nσ

41)n(nμ

J

J

...............................................(1)

Page 10: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

kriteria pengujian dalam hal ini, seperti biasa, didapat dari daftar

distribusi normal baku dengan menggunakan transformasi:

J

J

σμJ

z ..................................................................(2)

2.6. Koefisien Korelasi Pangkat

Dalam bagian ini akan dibicarakan korelasi antara dua variabel yang

berbeda dengan yang telah dijelaskan. Korelasi ini dikenal dengan nama

korelasi pangkat. Derajat hubungan yang mengukur korelasi pangkat

dinamakan koefisien korelasi pangkat atau koefisien korelasi spearman,

yang disini akan diberi simbul r’ (dibaca: er aksen).

Misalkan pasangan data hasil pengamatan (X1 , Y1), (X2 , Y2),....., (Xn , Yn)

kita susun menurut urutan besar nilainya dalam tiap variabel. Nilai Xi

disusun menurut urutan besarnya, yang terbesar diberi nomor urut atau

peringkat 1, terbesar kedua diberi peringkat 2, terbesar ketiga

diberiperingkat 3, dan seterusnya sampai kepada nilai Xi terkecil diberi

peringkat n, demikian pula untuk variabel Yi. Sekarang kita bentuk selisih

atau beda peringkat Xi dan peringkat Yi yang data aslinya berpasangan.

Sebutlah beda ini bi. Maka koefisien korelasi peringkat diantara serentetan

pasangan Xi dan Yi dihitung dengan rumus:

1)n(nb6

1r' 2

2i ............................................................(3)

kita lihat, bahwa dalam hal ini, seperti juga bagian 2 dan bagian 3, tidak

ada asumsi apapun mengenai distribusi X dan Y, yang berarti tidak

terdapat pula asumsi mengenai parameter populasi. Karena itulah bagian

ini dikenal dengan statistika nonparametrik atau statistika bebas

distribusi.

Page 11: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

Harga r’ bergerak dari –1 sampai dengan +1, sebagaimana halnya

koefisien korelasi r biasa. Harga r’ = +1 berarti terdapat persesuaian yang

sempurna antara Xi dan Yi sedangkan r’ = -1 menyatakan penilaian yang

betul-betul bertentangan antara Xi dan Yi.

Koefisien korelasi nomor urut (peringkat) yang diperoleh dengan rumus

(3) dapat digunakan untuk menguji hipotesis nol mengenai tidak

terdapatnya korelasi antara variabel-variabel X dan Y melawan hipotesis

tandingan atau alternatif terdapat korelasi positif atau persesuaian antara

X dan Y atau melawan alternatif terdapat korelasi negatif atau

pertentangan antara X dan Y. Dalam hal alternatif yang pertama, kita

tolak hipotesis nol jika r’ dari perhitungan lebih besar atau sama dengan

batas nilai kritis dari daftar.

2.7. Uji Runtun

Dalam semua uraian terdahulu mengenai penggunaan metode statistika,

telah dimisalkan bahwa sampel yang digunakan adalah sampel acak yang

diambil dari populasi tertentu. Akan tetapi, apabila data telah diambil

selama jangka waktu tertentu dan ada alasan cukup kuat mengenai

kesangsian keacakannya, maka dianjurkan untuk mengadakan pengujian

mengenai keacakan sampel diamaksud. Pengujian untuk ini akan

berdasarkan kepada adanya runtun.

Runtun adalah barisan huruf-huruf atau tanda-tanda yang identik yang

didahului atau di ikuti oleh sebuah huruf atau sebuah tanda yang

berbeda. Untuk runtun permulaan, barisan dimaksud tidak didahului

oleh huruf atau tanda apapun. Demikian pula untuk runtun terakhir,

barisan itu tidak diakhiri oleh huruf atau tanda yang berbeda. Panjang

runtun ditentukan oleh banyak huruf atau tanda yang ada dalam setiap

runtun.

Page 12: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

Misalkan sampel I dan sampel II terdiri atas data sebagai berikut:

Sampel I: 5, 16, 12, 17, 8, 9, 12

Sampel II: 20, 7, 14, 19, 10

Jika kedua sampel digabungkan dan datanya disusun menurut urutan

nilainya, maka didapat:

5, 7 , 8, 9, 10 , 12, 12, 14 , 16, 17, 20,19

Deretan bilangan ini dapat dianggap terdiri atas delapan runtun. Runtun-

runtun yang didapat dari sampel II telah diberi garis bawah dua buah

untuk membedakan dengan runtun-runtun yang didapat dari sampel I

yang diberi garis bawah sebuah.

Dengan adanya runtun ini, kita dapat menguji hipotesis tentang:

a) Data pengamatan telah diambil secara acak dari sebuah populasi, atau

sampel yang diambil dari sebuah populasi adalah acak.

b) Dua sampel acak berasal dari populasi yang sama atau dua populasi

mempunyai distribusi yang sama.

Statistik yang digunakan untuk menguji hipotesis diatas ialah banyak

runtun dalam deretan yang akan kita nyatakan dengan u.

Untuk melakukan uji hipotesis yang dicantumkan di (a), ialah:

Ho: data sampel telah diambil secara acak dari sebuah populasi, melawan

alternatif.

H1: data sampel diambil tidak secara acak,

Kita tempuh langkah sebagai berikut:

a) Tuliskan data hasil pengamatan dalam sampel menurut urutan

didapatnya atau urutan terjadinya.

Page 13: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

b) Tentukan besarnya median sampel.

c) Data yang harganya lebih besar dari median supaya diberi tanda positif

sedangkan data yang lebih kecil dari median diberi tanda negatif.

d) Hitung berapa banyak tanda positif, diberi simbul n1, dan berapa

banyak tanda negatif, diberi simbul n2.

Dengan mengambil taraf nyata 0,05, bandingkanlah harga u yang didapat

dengan harga u dari daftar sebagai batas nilai kritis. Daftar tersebut, pada

kolom kirinya berisikan harga terkecil di antara n1 dan n2, sedangkan baris

paling atas berisikan harga terbesar diantara n1 dan n2. harga u dengan

taraf nyata 0,05 dapat dicari didalam tiap sel daftar. Harga u yang kecil

menyatakan nilai kritis untuk uji pihak kiri dan harga u yang besar

merupakan nilai kritis untuk uji pihak kanan. Dengan demikian, kriteria

pengujian adalah tolak Ho jika u dari perhitungan lebih kecil atau sama

dengan u terkecil dari daftar. Dalam hal lainnya hipotesis Ho diterima.

Apabila hipotesis yang dihadapi seperti yang dirumuskan di (b), yaitu:

Ho: dua sampel acak berasal dari populasi yang sama atau dua

populasi mempunyai distribusi yang sama, melawan alternatif.

H1: kedua sampel berasal dari populasi yang berlainan atau distribusi

kedua populasi berlainan.

Maka langkah yang ditempuh untuk menguji hipotesis ini adalah:

a) Gabungkan kedua sampel yang didapat menjadi sebuah sampel

berukuran n1 + n2, jika n1 = ukuran sampel kesatu dan n2 = ukuran

sampel kedua.

b) Tuliskan ke-( n1 + n2) buah data dari sampel gabungan menurut urutan

nilainya.

c) Nyatakan data dari sampel kesatu dengan a dan data dari sampel

kedua dengan b.

Page 14: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

d) Hitung banyak runtun yang didapat dalam sampel gabungan ini dan

nyatakan dengan u.

Kriteria pengujian adalah terima hipotesis ho, jika u hasil perhitungan

terletak antara harga-harga u dari daftar. Dalam hal lainnya Ho ditolak.

Jika n1 dan n2 kedua-duanya lebih besar dari 20, maka u dapat mengikuti

distribusi normal dengan rata-rata dan simpangan baku:

1)n(n)n(n)nnn(2nn2nσ

nnn2n1μ

212

21

212121u

21

21u

....................................(4)

untuk menjadikan normal baku digunakan trasformasi:

u

uuz ....................................................................(5)

2.8. UjiMedian

Dalam bagian ini akan dibicarakan cara pengujian nonparametrik yang

lain yang dikenal dengan uji median. Hipotesisnya yang dihadapi ialah:

Ho: dua sampel acak telah diambil dari dua populasi dengan median yang

sama atau telah diambil dari populasi yang sama.

H1: kedua sampel itu berasal dari dua populasi dengan median yang

berlainan atau dari dua populasi yang berlainan

Langkah yang ditempuh untuk pengujian hipotesis ini ialah:

a) Gabungkan kedua sampel menjadi sebuah sampel berukuran n1 + n2,

dengan n1 = ukuran sampel yang diambil dari populasi kesatu dan n2 =

ukuran sampel yang diambil dari populasi kedua.

b) Tuliskan ke-( n1 + n2) buah data dari sampel gabungan ini menurut

urutan besar nilainya.

c) Tentukan median dari sampel gabungan ini.

d) Dari setiap sampel, tentukan banyak data yang ada di muka median.

Page 15: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

Nyatakan hal ini dengan A1 untuk sampel I dan A2 untuk sampel II.

Tentukan juga data yang ada di bawah median, dan nyatakan hal ini

dengan B1 untuk sampel I dan B2 untuk sampel II.

Dengan menggunakan data yang telah disusun dalam daftar kontingensi

tersebut, untuk menguji hipotesis Ho digunakan uji chi-square.

Selanjutnya, kita tolak hipotesis Ho jika X2 dari perhitungan lebih besar

atau sama dengan X21- dengan dk = 1 dan = taraf nyata. Dalam hal

lainnya Ho diterima.

2.9. Uji Kenormalan

Dari uaraian-uaraian terdahulu, misalnya dalam uruaian tentang berbagai

distribusi sampling, teori menaksir, pengujian hipotesis, telah kita lihat

bahwa pentingnya untuk mengetahui model populasi yang dipelajari,

terutam model normal, asumsi normalitas, telah melancarkan teori dan

metoda sebegitu rupa sehingga banyak persoalan yang dapat diselesaikan

dengan lebih mudah dan cepat. Karenanya, cukup mudah dimengerti

kiranya bahwa asumsi normalitas perlu dicek keberlakuannya agar

langkah-langkah selanjutnya dapat dipertanggungjawabkan. Jika ternyata

asumsi tidak benar atau terlalu menyimpang, tidak hanya mengenai

normalitas tetapi juga pengamatan bersifat independen, tidak terdapat

kesalahan ketika mencatat hasil pengamatan, homogenitas tentang

varians dan sebagainya, bukan saja langkah-langkah penelitian tidak

dapat dipertanggungjawabkan tetapi juga ternyata salah. Pengujian

mengenai homogenitas tentang Varians telah diuraikan dalam bab

terdahulu dengan dimisalkan populasi berdistribusi normal. Mengenai

kemungkinan kesalahan yang terjadi terhadap hasil pengamatan , tidak

ada uji statistik yang tersedia, kecuali pengamatan atau penelitian harus

dilakukan secara teliti dan jujur. Soal keacakan mengenai sampel dapat

diuji secara khusus dan ini akan dibicarakan kemudian. Disini, akan

Page 16: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

diuraikan bagaimana uji normalitas dilakukan.

Sekarang kita akan membahas sedikit tentang pengertian pengujian yang

ajeg. Pengertian ini timbul dari kenyataan bahwa tidak selalu asumsi-

asumsi, semua atau sebagian, dapat dipnuhi dengan tepat. Dalam

beberapa hal, penyimpangan wajar dari syarat-syarat yang telah

digariskan sering tidsk mengakibatkan bahaya yang hebat. Misalnya,

sedikit terjadi penyimpangan dari normalitas dan atau dari sifat

homogenitas Varians, biasanya hanya memberikan akibat buruk yang kecil

terhadap hasil pengujian dan kesimpulannya. Distribusi t atau distribusi

student telah diketahiu tidak sensitif terhadap penyimpangan wajar dari

normalitas, sehingga penggunaanya tidak dibatasi keras oleh asumsi

normalitas. Sifat demikian, ialah tidak sensitif terhadap penyimpangan

wajar dari syarat yang digariskan, dinamakan ajeg. Jika hal ini terjadi

sehubungan dengan pengujian hipotesis, maka diperoleh uji ajeg.

Sekarang marilah kita tinjau mengenai uji normalitas. Persamaaan

distribusi normal dengan rata-rata dan simpangan baku . Jika sebuah

sampel acak berukuran n telah diambil dengan rata-rata x dan simpangan

baku s, maka kurva normal yang cocok atau sesuai dengan data tersebut

(Untuk keperluan ini data harus disusun dalam daftar distribusi frekuensi

yang terdiri atas k buah kelas interval). Ialah :

2

sxx

21

e2μs

ny

Untuk keperluan penelitian, kita harus menghitung frekuensi teoritik Ei

dan mengetahui frekuensi nyata atau hasil pengamatan Oi. Frekuensi Oi

jelas didapat dari sampel, masing-masing menyatakan frekuensi dalam

tiap kelas interval. Harga Ei frekuensi teoritik, didapat dari hasil kali

antara n dengan peluang atau luas dibawah kurva normal untuk interval

yang bersangkutan. Untuk menentukan kriteria pengujian digunakan

distribusi chi-square dengan dk = ( k – 3 ) dan taraf .

Page 17: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

Pada bagian ini akan diperlihatkan uji kenormalan secara nonparametrik.

Uji yang digunakan dikenal dengan nama uji lilliefors.

Misalkan kita mempunyai sampel acak dengan hasil pengamatan x1,

x2,.....,xn. Berdasarkan sampel ini akan diuji hipotesis nol bahwa

sampeltersebut berasal dari populasi berdistribusi normal melawan

hipotesis tandingan bahwa distribusi tidak normal.

Untuk pengujian hipotesis nol tersebut kita tempuh prosedur berikut

a) Pengamatan x1, x2,.....,xn dijadikan bilangan baku z1, z2, ...,zn dengan

menggunakan rumussxxz i

i

( x dan s masing-masing merupakan

rata-rata dan simpangan baku sampel).

b) Untuk tiap bilangan baku ini dan menggunakan daftar distribusi

normal baku, kemudian dihitung peluang F(zi) = ( izz ).

c) Selanjutnya dihitung proporsi z1, z2, ...,zn yang lebih kecil atau sama

dengan zi. Jika proporsi ini dinyatakan oleh S(zi), maka

nzzzzS n

ii21 zyang,...,,.banyaknya

)(

d) Hitung selisih F(zi) – S(zi) kemudian harga mutlaknya.

Untuk menerima atau menolak hipotesis nol, kita bandingkan Lo

inidengan nilai kritis L yang diambil dari Daftar untuk taraf nyata yang

dipilih. Kriterianya adalah tolak hipotesis nol bahwa populasi

berdistribusi normal jika Lo yang diperoleh dari data pengamatan

melebihi L dari daftar. Dalam hal lainnya hipotesis nol diterima.

2.10. Analisis Varians

Kita tahu bahwa kumpulan hasil pengamatan mengenai sesuatu hal, skor

hasil belajar para siswa, berat bayi yang baru lahir, gaji pegawai di suatu

perusahaan, hasil jagung setiap hektar misalnya, nilai datanya bervariasi

Page 18: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

dari yang satu dengan yang lain. Karena adanya variasi atau ragam ini

untuk sekumpulan data, maka digunakan alat ukurnya yaitu Varians. Kita

lihat juga bahwa Varians bersama-sama rata-rata telah banyak digunakan

untuk membuat kesimpulan mengenai populasi, baik secara

deskriptifmaupun induktif melalui penaksiran dan pengujian hipotesis

mengenai parameter.

Dalam modul ini, Varians akan dibahas lebih lanjut dengan terlebih

dahulu melalui berbagai jenis Varians kemudian menggunakannya untuk

pengujian hipotesis melalui teknik analisis Varians, disingkat ANAVA

(AnalisisVarians).

Yang diberikan disini hanyalah ANAVA yang sederhana yaitu ANAVA

satu arah.

Jenis Varians

Dalam bab yang lalu telah kita bahas berbagai jenis Varians ialah Varians

sampel S2 dan Varians populasi 2 . Varians untuk sekumpulan data ini

melukiskan derajat perbedaan atau variasi nilai data individu yang ada

dalam kelompok atau kumpulan data tersebut. Varians ini dihitung dari

nilai rata-rata sekumpulan data. Selanjutnya juga kita kenal Varians

sampling berbagai statistik, untuk rata-rata diberi lambang 2x , untuk

proporsi dengan lambang 2

nx dan untuk statistik lainnya telah kita

bahas dalam bab-bab sebelumnya.

Barangkali secara umum Varians dapat digolongkan kedalam Varians

sistematik dan Varians galat. Varians sistematik adalah Varians

pengukuran karena adanya pengaruh yang memyebabkan skor atau nilai

data lebih condong kesatu arah tertentu dibandingkan keraha lain. Setiap

pengeruh alami atau buatan manusia yang dapat menyebabkan terjadinya

peristiwa dapat diduga atau diramalkan dalam arah tertentu, merupakan

Page 19: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

pengaruh sistematik sehingga menyebabkan terjadinya Varians

sistematik. Cara mengajar yang dilakukan seorang ahli secara sistematik

mempengaruhi kemajuan anak didik lebih baik bila dibandingkan dengan

kemajuan anak yang diajar sembarangan, hasil skor ujiannya

menggambarkan adanya Varianssistematik.

Salah satu jenis Varians sistematik dalam kumpulan data hasil penelitian

adalah Varians antar kelompok atau kadang-kadang disebut pula Varians

eksperimental. Varians ini menggambarkan adanya perbedaan atau

variasi sistematik antara kelompok-kelompok hasil pengukuran. Dengan

demikian varians ini terjadi karena adanya perbedaan antara kelompok-

kelompok individu.

2.10.1. Rangking Satu Arah Kruskal-Wallis

Fungsi uji ini adalah untuk menentukan apakah k sampel independen

berasal dari populai-populasi yang berbeda. Teknik Kruskal-Wallis

menguji hipotesis nol bahwa k sampel berasal dari populasi identik,

dalam hal rata-ratanya. Uji Kruskal-Wallis sering disebut juga uji H

Kruskal-Wallis.

Langkah-langkah pengujiannya:

Misalkan ni (i = 1, 2,...,k) menyatakan benyaknya pengamatan pada

sampel ke-i

Gabungkanlah semua k sampel dan urutkan ke semua pengamatan dan

beri rangking dari 1, 2,.....,n. Bila terdapat pengamatan dan biasa dan

berikan rata-rata rang jika pengamatan dapat dibedakan. Jumlah rang

semua pengamatan ni dari sampel ke-i dinyatakan dengan peubah acak

ri..

Statistik ujinya:

Page 20: Statistika Non Parametrik - Bab 2 Landasan Teori - Modul 6 - Laboratorium Statistika Industri - Data Praktikum - Risalah - Moch Ahlan Munajat - Universitas Komputer Indonesia

k

1i i

2i )1n(3

nr

)1n(n12h ....................................(6)

= ......% 1kv;2x

Kesimpulan: tolak Ho jika h > 1;2

kvx

Apabila terdapat angka sama antara dua skor atau lebih, tiap-tiap skor

mendapatkan rangking yang sama, untuk itu perlu dilakukan koreksi

untuk angka sama tersebut dalam menghitung h, sebagai berikut:

nnT1

1)3(nnr

1)n(n12

h3

k

1i i

2i

* .................................(7)

Dimana:

T = t3– t (t = jumlah observasi berangka sama dalam serangkaian

skor berangka sama).

N = banyak observasi dalam seluruh k sampel bersama-sama.

T = jumlah semua kelompok yang mempunyaiangka sama.