BUKU AJAR STATISTIKA NONPARAMETRIK - fpunram.com · buku ajar statistika nonparametrik 4 atau...
Embed Size (px)
Transcript of BUKU AJAR STATISTIKA NONPARAMETRIK - fpunram.com · buku ajar statistika nonparametrik 4 atau...
buku ajar statistika nonparametrik 1
BUKU AJARSTATISTIKA NONPARAMETRIK
Oleh:
A N W A RSYARIFUDDIN
PROGRAM STUDI AGRIBISNISJURUSAN SOSEK FAKULTAS PERTANIAN
UNIVERSITAS MATARAMDESEMBER 2016
buku ajar statistika nonparametrik 2
ANALISIS INSTRUKSIONALMATA KULIAH STATISTIKA NONPARAMETRIK
SKS = 3 (2-1), Semester VI
TUJUAN INSTRUKSIONAL UMUM:Setelah menyelesaikan mata kuliah Statistika Nonparametrikmahasiswa akan dapat memilih Uji Statistik Nonparametrik
yang tepat untuk Penelitian Sosial Ekonomi Pertanian
Memilih Uji Statistik Nonparametrik untukPenelitian Sosial Ekonomi Pertanian
Memilih Uji Statistik Memilih Uji Statistik Memilih Uji Statistik Memilih modelNonparametrik Nonparametrik Nonparametrik pengukuran
untuk Kasus untuk Kasus untuk Kasus korelasi danSatu Sampel Dua Sampel k Sampel pengujiannya
Menerapkan prinsip dan prosedurUji Hipotesis Statistik
Menjelaskan konsep & prosedurperhitungan dasar statistika
Setelah mengikuti proses pembelajaran mata kuliah ini (pada akhir semester)mahasiswa S1 Program Studi Agribisnis Fakultas Pertanian UniversitasMataram, diharapkan dapat menjelaskan dan menggunakan atau menerapkanalat analisis statistik nonparametrik secara tepat, dan dapat menginter-pretasikannya secara akurat.
buku ajar statistika nonparametrik 3
BAB ISTATISTIKA PARAMETRIK DAN NONPARAMETRIK
Secara garis besar ilmu statistika dibagi menjadi dua bagian,
yaitu: statistika parametrik dan statistika nonparametrik. Perbedaan kedua
statistika tersebut diuraikan pada ulasan berikut.
1. Statistika Parametrik
Statistika parametrik adalah ilmu statistika yang digunakan untuk
data yang memiliki sebaran normal. Jika data tidak menyebar normal
maka metode statistika nonparametrik dapat digunakan. Apa yang dapat
dilakukan jika data tidak menyebar normal, namun statistika parametrik
ingin tetap digunakan. Untuk kasus ini data sebaiknya ditransformasikan
terlebih dahulu. Transformasi data perlu dilakukan agar data mengikuti
sebaran normal. Transformasi dapat dilakukan dengan mengubah data ke
dalam bentuk logaritma natural, menggunakan operasi matematik
(membagi, menambah, atau mengali dengan bilangan tertentu), dan
mengubah skala data dari nominal menjadi interval.
Parametrik berarti parameter. Parameter adalah indikator dari
suatu distribusi hasil pengukuran terhadap populasi. Indikator dari
distribusi pengukuran berdasarkan statistika parametrik digunakan untuk
parameter dari distribusi normal. Apa yang dimaksud dengan distribusi
normal? Bagaimana mengetahui sebuah data berdistribusi normal atau
tidak? Hal ini penting sekali untuk diketahui karena berdasarkan normal
buku ajar statistika nonparametrik 4
atau tidaknya distribusi ini baru dapat ditentukan apakah uji statistika
parametrik atau nonparametrik yang digunakan.
Distribusi normal dikenal juga dengan istilah Gaussian Distribution.
Distribusi normal mengandung dua parameter, yaitu rata-rata (mean = )
dan ragam (varians = 2). Parameter-parameter ini memberikan
karakteristik yang unik pada suatu distribusi berdasarkan lokasi-nya
(central tendency). Berbagai metode statistika mendasarkan perhi-
tungannya pada kedua parameter tersebut.
Penggunaan metode statistika parametrik mengikuti prinsip-prinsip
distribusi normal. Prinsip-prinsip dari distribusi normal adalah:
a. Distribusi dari suatu sampel yang dijadikan obyek pengukuran
berasal dari populasi yang diasumsikan terdistribusi secara normal.
b. Sampel diperoleh secara random, dengan jumlah sampel yang
dianggap dapat mewakili populasi (n > 30).
c. Distribusi normal merupakan bagian dari distribusi probabilitas yang
kontinyu (continuous probability distribution). Implikasinya, skala
pengukuran pun harus kontinyu. Skala pengukuran yang kontinyu
adalah skala rasio dan interval. Kedua skala ini memenuhi syarat
untuk menggunakan uji statistika parametrik.
Bila syarat-syarat ini semua terpenuhi, maka metode statistika
parametrik dapat digunakan. Contoh metode statistika parametrik
diantaranya adalah uji-z (1 atau 2 sampel), uji-t (1 atau 2 sampel),
korelasi pearson, perancangan percobaan (1-way ANOVA, 2-way
ANOVA), regresi dan lain-lain.
buku ajar statistika nonparametrik 5
2. Statistika Nonparametrik
Statistika nonparametrik disebut juga statistika bebas sebaran.
Statistika nonparametrik tidak mensyaratkan bentuk sebaran parameter
populasi. Statistika nonparametrik dapat digunakan pada data yang
memiliki sebaran normal atau tidak.
Istilah nonparametrik pertama kali digunakan oleh Wolfowitz,
pada tahun 1942. Metode statistika nonparametrik merupakan metode
statistika yang dapat digunakan dengan mengabaikan asumsi-asumsi
yang melandasi penggunaan metode statistika parametrik, terutama yang
berkaitan dengan distribusi normal. Istilah lain yang sering digunakan
untuk statistika nonparametric adalah statistika bebas distribusi
(distribution-free statistics) dan uji bebas asumsi (assumption-free test).
Statistika nonparametrik banyak digunakan pada penelitian-penelitian
sosial. Data yang diperoleh dalam penelitian sosial pada umumnya
berbentuk kategori atau berbentuk ranking.
Uji statistika nonparametrik ialah suatu uji statistika yang tidak
memerlukan adanya asumsi-asumsi mengenai sebaran data populasi. Uji
statistika ini disebut juga sebagai statistika bebas sebaran (distribution
free). Statistika nonparametrik tidak mensyaratkan bentuk sebaran
parameter populasi berdistribusi normal. Statistika nonparametrik dapat
digunakan untuk menganalisis data yang berskala nominal atau ordinal
karena pada umumnya data berjenis nominal dan ordinal tidak
menyebar normal. Dari segi jumlah data, pada umumnya statistika
nonparametrik digunakan untuk data berjumlah kecil (n < 30).
buku ajar statistika nonparametrik 6
Contoh metode statistika nonparametrik diantaranya adalah Chi-
square test, Mann Withney test, Kruskal-Wallis, Friedman test, dan lain-
lain.
Keunggulan Statistika Nonparametrik
Keunggulan statistika nonparametrik diantaranya:
1. Asumsi dalam uji-uji statistika nonparametrik relatif lebih longgar.
Jika pengujian data menunjukkan bahwa salah satu atau beberapa
asumsi yang mendasari uji statistika parametrik (misalnya
mengenai sifat distribusi data) tidak terpenuhi, maka statistika
nonparametrik lebih sesuai diterapkan dibandingkan statistika
parametrik.
2. Perhitungan-perhitungannya dapat dilaksanakan dengan cepat dan
mudah, sehingga hasil penelitian segera dapat disampaikan.
3. Untuk memahami konsep-konsep dan metode-metodenya tidak
memerlukan dasar matematika serta statistika yang mendalam.
4. Uji-uji pada statistika nonparametrik dapat diterapkan jika kita
menghadapi keterbatasan data yang tersedia, misalnya jika data
telah diukur menggunakan skala pengukuran yang lemah (nominal
atau ordinal).
5. Efisiensi statistika nonparametrik lebih tinggi dibandingkan dengan
metode parametrik untuk jumlah sampel yang sedikit.
buku ajar statistika nonparametrik 7
Keterbatasan Statistika Nonparametrik
Disamping keunggulan, statistika nonparametrik juga memiliki
keterbatasan. Beberapa keterbatasan statistika nonparametrik antara lain:
a. Jika asumsi uji statistika parametrik terpenuhi, penggunaan uji
nonparametrik meskipun lebih cepat dan sederhana akan menyebab-
kan pemborosan informasi.
b. Jika jumlah sampel besar, tingkat efisiensi nonparametrik relatif lebih
rendah dibandingkan dengan metode parametrik.
c. Statistika nonparametrik tidak dapat dipergunakan untuk membuat
prediksi (peramalan).
3. Langkah-Langkah Pemilihan Metode Statistika
Kapan metode statistika nonparametrik digunakan? Metode
pengujian ini digunakan bila salah satu syarat dalam statistika parametrik
tidak terpenuhi. Syarat-syarat yang perlu diperhatikan untuk menentukan
statistika apa yang akan digunakan dalam analisis, yaitu:
1. Apakah distribusi data diketahui?
Jika distribusi data tidak diketahui maka statistika yang sesuai adalah
statistika nonparametrik. Jika distribusi data diketahui, maka kita
harus melihat jenis distribusi data tersebut.
2. Apakah data berdistibusi normal?
Jika data tidak berdistribusi normal, maka statistika yang sesuai
adalah statistika nonparametrik. Jika data berdistribusi normal, maka
statistika yang sesuai adalah statistika parametrik.
buku ajar statistika nonparametrik 8
3. Apakah sampel ditarik secara random?
Jika sampel tidak ditarik secara random, maka statistika yang sesuai
adalah statistika nonparametrik. Jika sampel ditarik secara random,
maka statistika yang sesuai adalah statistika parametrik.
4. Apakah varians kelompok sama?
Jika varians kelompok tidak sama, maka statistika yang sesuai
adalah statistika nonparametrik. Jika varians kelompok sama, maka
statistika yang sesuai adalah statistika parametrik.
5. Bagaimana jenis skala pengukuran data?
Jika skala pengukuran data nominal dan ordinal, maka statistika yang
sesuai adalah statistika nonparametrik. Jika skala pengukuran data
interval dan rasio, maka statistika yang sesuai adalah statistika
parametrik.
Selain sebaran, salah satu indikator penggunaan metode statistik
parametrik atau nonparametrik adalah jenis data. Distribusi normal
merupakan bagian dari distribusi probabilitas yang kontinyu (continuous
probability distribution), karena itu skala pengukurannya pun haruslah
kontinyu. Jenis data yang memiliki skala pengukuran yang kontinyu
adalah data rasio dan interval.
Karena dalam pemilihan metode statistika jenis data merupakan
salah satu indikator, maka perlu dijelaskan kembali pengertian dan jenis-
jenis data.
buku ajar statistika nonparametrik 9
BAB IIDATA DAN SKALA PENGUKURAN
1. Jenis Data
Data adalah ukuran dari variabel. Data diperoleh dengan
mengukur nilai satu atau lebih variabel dalam sampel (atau populasi).
Data dapat diklasifikasikan menurut jenis, menurut dimensi waktu, dan
menurut sumbernya.
Data Menurut Jenis
Menurut jenisnya, data terdiri dari data kuantitatif dan data
kualitatif.
a. Data kuantitatif adalah data yang diukur dalam suatu skala
numerik (angka). Data kuantitatif dapat dibedakan menjadi:
- Data interval, yaitu data yang diukur dengan jarak di antara
dua titik pada skala yang sudah diketahui. Sebagai contoh: IPK
mahasiswa (interval 0 hingga 4); usia produktif (interval 15 hingga
55 tahun); suhu udara dalam Celcius (interval 0 hingga 100
derajat).
- Data rasio, yaitu data yang diukur dengan suatu proporsi.Sebagai contoh: persentase jumlah pengangguran di Propinsi NTB,
tingkat inflasi Indonesia pada tahun 2010, Gini rasio, persentase
penduduk miskin di NTB, pertumbuhan ekonomi NTB.
buku ajar statistika nonparametrik 10
b. Data kualitatif, adalah data yang tidak dapat diukur dalam skala
numerik. Namun karena dalam statistik semua data harus dalam
bentuk angka, maka data kualitatif umumnya dikuantifikasi agar
dapat diproses. Kuantifikasi dapat dilakukan dengan mengklasi-
fikasikan data dalam bentuk kategori. Data kualitatif dapat dibedakan
menjadi:
- Data nominal, yaitu data yang dinyatakan dalam bentuk
kategori. Sebagai contoh, industri di Indonesia oleh Badan Pusat
Statistik digolongkan menjadi:
* Industri rumah tangga, dengan jumlah tenaga kerjanya 1- 4
orang, yang diberi kategori 1.
* Industri kecil, dengan jumlah tenaga 5 -19 orang, yang
diberi kategori 2.
* Industri menengah, dengan jumlah tenaga kerja 20-100
orang, yang diberi kategori 3.
* Industri besar, dengan jumlah tenaga kerja lebih dari 100
orang, yang diberi kategori 4.
Angka yang menyatakan kategori ini menunjukkan bahwa
posisi data sama derajatnya. Dalam contoh di atas, angka 4
tidak berarti industri besar nilainya lebih tinggi dibanding industri
kecil yang angkanya 1. Angka ini sekedar menunjukkan kode
kategori yang berbeda.
- Data ordinal, yaitu data yang dinyatakan dalam bentuk kategori,
namun posisi data tidak sama derajatnya karena dinyatakan
buku ajar statistika nonparametrik 11
dalam skala peringkat. Sebagai contoh, tingkat kosmopolitan
petani suatu daerah diketegorikan:
Sangat rendah diberi kode 1.
Rendah diberi kode 2.
Sedang diberi kode 3.
Tinggi diberi kode 4.
Sangat tinggi diberi kode 5.
Dalam contoh di atas, angka 5 menunjukkan tingkat kosmopolitan
yang tertinggi (besar nilainya lebih tinggi dibanding dengan tingkat
4, 3, 2, dan 1). Angka ini menunjukkan kode kategori dan
nilai/derajat yang berbeda.
Data Menurut Dimensi Waktu
Menurut dimensi waktu, data dapat digolongkan menjadi:
a. Data runtut waktu (time-series), yaitu data yang secara kronologis
disusun menurut waktu. Data runtut waktu digunakan untuk melihat
perubahan dalam rentang waktu tertentu. Variasi antar variabel
terjadi karena adanya perbedaan waktu. Data runtut waktu dibedakan
menjadi:
- Data harian, misalnya data Indeks Harga Saham setiap hari, data
harga sembilan bahan-bahan pokok.
- Data mingguan, misalnya data perkembangan harga beras
dalam satu minggu (7 hari).
buku ajar statistika nonparametrik 12
- Data bulanan, misalnya data tingkat inflasi, data suku bunga
Bank Indonesia.
- Data kuartalan, misalnya data Produk Domestik Bruto suatu
Negara.
- Data tahunan, misalnya data pendapatan nasional setiap tahun
(12 bulan).
b. Data silang tempat (cross-section), yaitu data yang dikumpulkan
pada suatu titik waktu. Data silang tempat digunakan untuk
mengamati perilaku dalam periode yang sama. Variasi variabel
terjadi karena adanya perbedaan antar pengamatan. Data ini
biasanya lebih sesuai untuk mendukung penelitian atau kajian-kajian
perilaku individu, perusahaan, atau wilayah. Misalnya:
- Data Sensus yang diterbitkan setiap 10 tahun sekali.
Sebagai contoh: sensus penduduk untuk setiap kabupaten
pada tahun 2000; sensus ekonomi dari setiap perusahaan di
setiap kabupaten pada tahun 2006.
- Data jumlah penduduk miskin pada setiap desa di Propinsi NTB
pada tahun tertentu.
- Data pendapatan petani jagung pada suatu daerah tertentu.
c. Data pooling, adalah kombinasi antara data runtut waktu dan silang
tempat.
buku ajar statistika nonparametrik 13
Data Menurut Sumbernya
Berdasarkan sumbernya, data dapat digolongkan menjadi:
a. Data internal dan data eksternal. Data internal yaitu data yang
bersumber dari dalam organisasi. Data eksternal yaitu data yang
bersumber dari luar organisasi.
b. Data primer dan data sekunder. Data primer adalah data yang
diperoleh melalui survei lapangan dengan menggunakan metode
pengumpulan data tertentu. Data sekunder adalah data yang telah
dikumpulkan oleh lembaga pengumpul data dan dipublikasikan
kepada masyarakat pengguna data. Data sekunder akan lebih
mempermudah dan mempercepat jalannya penelitian. Namun karena
umumnya data sekunder dimaksudkan untuk konsumen peneliti
dalam jumlah besar, seringkali data yang tersedia tidak sesuai benar
dengan keinginan peneliti.
Hal yang sering dikeluhkan apabila kita menggunakan data
sekunder adalah: (1) ragam data statistik yang tersedia semakin banyak
tetapi kelompok data yang dibutuhkan bagi suatu studi sering tidak
cukup; (2) konsistensi dari data runtut waktu tidak selalu dapat
dipertahankan; (3) angka-angka mengenaim asalah tertentu yang
dikeluarkan oleh berbagai sumber resmi tidak konsisten satu sama lain.
Uji reliabilitas data, penyederhanaan, agregasi, dan penyesuaian mutlak
diperlukan agar diperoleh hasil yang dapat dipertanggungjawabkan.
buku ajar statistika nonparametrik 14
2. Skala Pengukuran Variabel
Dalam menentukan alat analisis statistika yang tepat dan cocok,
seorang peneliti tidak hanya harus mengetahui model analisisnya tetapi
juga harus memperhatikan skala pengukuran variabel dari data yang akan
dianalisis. Misalnya saja seorang peneliti ingin mendeskripsikan seberapa
besar penghasilan suatu kelompok masyarakat, maka statistika yang
mungkin dapat digunakan adalah menggunakan rata-rata hitung (mean)
dan simpangan baku (standar deviasi). Tetapi rata-rata (mean) ini kurang
tepat kalau digunakan untuk menggambarkan tingkat pendidikan
masyarakat tersebut. Salah satu statistik yang lebih cocok digunakan
untuk menggam-barkan tingkat pendidikan masyarakat adalah modus,
atau dapat juga menggunakan persentase. Meskipun model analisis yang
dapat digunakan menggambarkan penghasilan dan tingkat pendidikan
suatu masyarakat adalah analisis deskriptif, tetapi alat statistika yang
digunakan berbeda. Kenapa hal ini berbeda ?
Perbedaan penggunaan alat analisis sangat terkait dengan skala
pengukuran variabel yang akan dideskripsikan itu. Oleh karena itu,
pemahaman tentang skala pengukuran variabel yang akan dianalisis
harus diperhatikan. Ada empat macam skala pengukuran variabel, yaitu
skala nominal, ordinal, interval, dan rasio.
a. Skala Nominal
Misalnya saja saat ini kita sebagai dosen perguruan tinggi X
sedangkan Pak Ali yang tinggal di sebelah rumah kita bekerja di sebuah
buku ajar statistika nonparametrik 15
bank pemerintah. Maka variabel jenis pekerjaan atau profesi itu
mempunyai skala pengukuran nominal. Nilai dari skala nominal ini
hanyalah menunjuk-kan sebagai perbedaan saja, tenaga pengajar
tentunya berbeda dengan seorang bankir.
Contoh lainnya adalah misalnya seorang peneliti ingin mengetahui
jenis transportasi apa saja yang digunakan oleh karyawan PT BATAGOR.
Untuk maksud itu peneliti menjaring pertanyaan "Alat angkutan apakah
yang Anda gunakan untuk ke kantor?". Ada banyak kemungkinan jawaban
dari karyawan itu, misalnya saja dengan bersepeda motor, dengan
berkendaraan umum, dengan bersepeda, atau dengan mobil jemputan
yang disediakan oleh perusahaan. Maka variabel alat transportasi itu
berskala pengukuran nominal.
b. Skala Ordinal
Seorang ketua Lembaga Penelitian di Perguruan Tinggi bermaksud
mengetahui usulan-usulan penelitian yang telah disetujui oleh Direktorat
Jenderal Pendidikan Tinggi lima tahun terakhir berdasarkan jabatan
fungsional peneliti utamanya. Tentunya informasi yang mungkin diperoleh
adalah sekian peneliti utamanya lektor muda, sekian orang peneliti
utamanya lektor, lektor madya, dan sebagainya. Nilai dari variabel jabatan
fungsional itu menunjukkan adanya tingkatan atau order disamping
adanya perbedaan. Varaibel yang demikian dinamakan sebagai skala
pengukuran yang ordinal. Skala pengukuran ini memberikan nilai yang
buku ajar statistika nonparametrik 16
dapat diurutkan, jabatan lektor muda tentunya lebih rendah daripada lektor
atau lektor madya.
Contoh lain untuk skala pengukuran ordinal adalah nilai mata kuliah
mahasiswa. Ferry mendapat nilai C untuk mata kuliah Metodologi
Penelitian, Sukino mendapat nilai B, Khaeruman mendapat nilai D. Nilai
mata kuliah yang telah dikategorikan dengan A, B, C, D, dan E merupakan
variabel yang berskala pengukuran ordinal. Nilai-nilai itu selain dapat
membedakan kemampuan Ferry, Sukina, dan Khaeruman dalam mata
kuliah Metodologi Penelitian tersebut tetapi juga menggambarkan
kedudukan, posisi, atau urutan kemampuan tiap mahasiswa dalam mata
kuliah tersebut.
c. Skala Interval
Variabel temperatur atau suhu merupakan contoh yang pas dan
baik untuk menggambarkan varaibel berskala pengukuran interval.
Misalnya air di gelas A bersuhu 100 derajat Celcius, di gelas B 60 derajat
Celsius, dan di gelas C 30 derajat Celsius. Disini terlihat bahwa suhu air di
tiga gelas itu saling berbeda, air digelas A paling panas, dan di gelas C
paling dingin diantara ketiga gelas yang ada. Selisih suhu air di gelas A
dan gelas B adalah 40 derajat Celsius, tetapi tidak dapat dikatakan bahwa
suhu air di gelas B dua kali suhu di gelas C. Dari contoh ini terlihat bahwa
variabel suhu air selain memenuhi sifat adanya perbedaan dan dapat
diurutkan, tampak juga bahwa kita dapat melihat berapa selisih suhu air
dari tiap gelas yang berbeda itu. Hal ini dapat dikatakan bahwa variabel
buku ajar statistika nonparametrik 17
berskala pengukuran interval mempunyai ciri membedakan, meng-
urutkan, dan mengandung unsur jarak.
d. Skala Rasio
Variabel penghasilan merupakan contoh untuk skala pengukuran
rasio. Misalnya penghasilan Rini setiap bulan sebagai dosen yang
mempunyai jabatan Lektor Muda adalah 500 ribu rupiah, sedangkan Lusi
yang baru setahun lalu menjabat Asisten Ahli berpenghasilan 300 ribu
rupiah, ataupun Eko yang baru saja diangkat sebagai Asisten Ahli Madya
hanya memperoleh 250 ribu rupiah per bulan. Penghasilan ketiga tenaga
pengajar itu berbeda satu sama lainnya, dan juga Rini merupakan dosen
yang berpenghasilan tertinggi diantara teman-temannya, dan Eko
menduduki posisi yang terendah. Variabel penghasilan ini juga dapat
memberikan informasi bahwa selisih penghasilan antara Rini dengan Lusi
adalah 200 ribu rupiah, selisih penghasilan Lusi dengan Eko hanya
sebesar 50 ribu rupiah. Dari contoh ini terlihat bahwa variabel penghasilan
berskala pengukuran interval mempunyai ciri perbedaan, urutan, dan
mengandung unsur adanya jarak atau selisih yang jelas dian-tara nilai
variabelnya itu. Selain itu dapat juga dikatakan bahwa Rini berpenghasilan
dua kali penghasilan Eko yang baru saja mengajar. Rasio dua kali ini
sangat esak karena kedua nilai mempunyai nilai nol (titik nol) yang sama
dan mutlak. Nol mutlak inilah yang membedakan skala pengukuran rasio
dengan interval.
buku ajar statistika nonparametrik 18
BAB IIIREGRESI DENGAN VARIABEL DUMMY
Variabel di dalam analisis regresi bisa debedakan menjadi dua
yaitu variabel kuantitatif dan variabel kualitatif. Model regresi pada bagian
ini memfokuskan pada regresi dengan variabel independen kualitatif.
Harga, volume produksi, volume penjualan, biaya promosi adalah
beberapa contoh variabel yang datanya bersifat kuantitatif. Namun, bila
kita membicarakan masalah jenis kelamin, tingkat pendidikan, status
perkawinan, krisis ekonomi maupun kenaikan harga BBM berarti kita
membicarakan variabel bersifat kualitatif.
Variabel-variabel kualitatif tersebut sangat mempengaruhi perilaku
agen-agen ekonomi. Variabel kualitatif ini bisa terjadi pada dara cross
section maupun data time series. Misalnya dalam data cross section kita
bisa memasukkan jenis kelamin di dalam regresi dalam mempengaruhi
volume penjualan handphone. Begitu pula data kualitatif seperti kenaikan
harga BBM bisa kita masukkan di dalam regresi dalam mempengaruhi
volume penjualan dalam data time series.
Ada kalanya kita melakukan suatu regresi dimana variabel penjelas
atau variabel tergantung berupa data kategorikal (sering disebut data
nominal). Misalnya laki-laki dan perempuan, desa-kota, industri pangan,
sandang, dan peralatan.
buku ajar statistika nonparametrik 19
Contoh kita ingin mengetahui jenis kelamin, lokasi, dan industri terhadap
upah.
1. Pengaruh jenis kelamin atas upah, modelnya,
Upah = a + b1DJK
Dimana DJK adalah Dummy jenis kelamin (laki-laki dan wanita)
2. Pengaruh lokasi terhadap upah, apakah desa lebih rendah
upahnya dari kota, modelnya,
Upah = a + b1DLOK
dimana DLOK adalah dummy lokasi
3. Pengaruh industri terhadap upah, modelnya
Upah = a + b1DIND
dimana DIND adalah dummy setiap klasifikasi industri
Untuk memudahkan lihat contoh data berikut:
Industri Kode Industri UpahPangan 31 500Sandang 32 522Sandang 32 530Pangan 31 512Peralatan logam 38 600Peralatan logam 38 642Pangan 31 540Pangan 31 520Sandang 32 580Sandang 32 570
Cara Membuat Variabel Dummy
Untuk dapat membedakan pengaruh masing-masing industri atas
upah kita akan membuat variabel dummy. Caranya adalah memberi nilai 1
buku ajar statistika nonparametrik 20
pada kategori tersebut dan memberi nol bagi kategori lainnya data
berubah menjadi sebagai berikut.
Industri Kode Industri Upah Dpangan Dsandang Dalat
Pangan 31 500 1 0 0Sandang 32 520 0 1 0Sandang 32 530 0 1 0Pangan 31 520 1 0 0Peralatan logam 38 600 0 0 1Peralatan logam 38 640 0 0 1Pangan 31 540 1 0 0Pangan 31 520 1 0 0Sandang 32 580 0 1 0Sandang 32 570 0 1 0
Sekarang perhatikan upah rata-rata untuk masing-masing industri:
Pangan = 5204
520540520500
Sandang = 5504
570580530520
Peralatan= 6202
640600
Jika kita memiliki 3 dummy variabel maka kita bisa memasukkan 2
variabel dummy, sedangkan yang satu akan berfungsi menjadi benchmark
atau pematok. Besarnya benchmark tidak lain adalah intercept atau nilai
konstanta (a).
Contoh:Upah = a + b1 Dsandang + b2 Dalat
Dari data di atas hasilnya adalah sebagai berikut
Upah = 520 + 30 Dsandang + 100 Dalat
buku ajar statistika nonparametrik 21
Jadi rata-rata upah industri pangan yang tidak dimasukkan ke dalam
model menjadi intersep (benchmark) beda upah sandang terhadap
pangan adalah nilai b1=30 dan beda upah rata-rata industri peralatan
terhadap industri pangan adalan 100.
Sebaliknya jika yang tidak dimasukkan dalam regresi adalah
industri peralatan, maka hasil regresi akan berubah sebagai berikut:
Upah = 620 - 100 Dpangan - 70 Dsandang
Sekarang intersep (a) menjadi rerata industri alat, dan beda upah pangan
terhadap industri alat adalah minus 100 dan beda upah industri alat
adalah minus 70.
Kesimpulannya jika kita punya n variabel dummy, maka kita dapat
memasukkan n-1 variabel dalam model regresi, dan yang menjadi
intersep adalah nilai rata-rata variabel yang tidak dimasukkan. Perhatikan
cara memaknai parameter hasil regresi yang menggunakan dummy di
atas.
Sekarang kita akan memasukkan data pendidikan pada data yang
kita miliki di atas, data lengkapnya menjadi sebagai berikut.
Industri Kode Industri Upah Dpangan Dsandang Dalat
Pangan 31 500 1 0 6Sandang 32 520 0 1 9Sandang 32 530 0 1 9Pangan 31 520 1 0 9Peralatan logam 38 600 0 0 12Peralatan logam 38 640 0 0 11Pangan 31 540 1 0 9Pangan 31 520 1 0 6Sandang 32 580 0 1 12Sandang 32 570 0 1 9
buku ajar statistika nonparametrik 22
Hasil di atas dapat kita ringkas dan sajikan sebagai berikut:
Makna hasil regresi sekarang adalah sebagai berikut:
Pada tingkat pendidikan yang sama, maka upah industri sandang
adalah minus 18,6 di bawah industri pangan (industri yang tidak diikutkan
dalam regresi). Upah industri peralatan pada tingkat pendidikan yang
sama adalah 49,9 di atas industri pangan. Mengapa angkanya menjadi
semakin kecil dari sebelumnya?
Hal ini disebabkan adanya perbedaan pendidikan di ketiga industri,
perbedaan upah tidak semata disebabkan oleh perbedaan industri tetapi
juga disebabkan oleh perbedaan pendidikan. Ini dapat juga dikatakan
bahwa pendidikan menjadi variabel KONTROL yan bertugas memurnikan
pengaruh perbedaan industri atas upah.
Contoh :
Menganalisis apakah masa kerja, tingkat pendidikan karyawan, dan
jenis kelamin mempengaruhi gaji karyawan. Pendidikan dikategorikan
menjadi dua yaitu Diploma dan Sarjana. Menggunakan data hipotetis
sebanyak 20 karyawan suatu perusahaan.
Yi = o + 1 Xi + 2 D1 + 3 D2
Upah = 448,4 - 18,62 Dsandang + 49,9 Dalat + 10,5 Pendidik(12,)** (-1,04) (2,287)** (2,486)**R2 = 0,839F = 0,40
buku ajar statistika nonparametrik 23
Dimana :
Yi = gaji karyawan
Xi = masa kerja karyawan (tahun)
D1 = 1 jika sarjana dan 0 jika tidak (diploma)
D2 = 1 jika pria dan 0 bila wanita
Data 20 Karyawan di Perusahaan PT Maju Mundur
Gaji (juta) Masa_kerja Pendidikan Kelamin
2,700 11 0 03,400 3 1 13,900 18 0 13,400 14 0 14,800 9 1 12,200 3 0 16,400 15 1 16,230 17 1 04,200 20 0 12,065 2 0 03,510 4 1 02,500 5 0 12,800 8 0 12,975 14 0 05,890 15 1 03,105 15 0 03,200 2 1 13,365 19 0 03,850 5 1 06,910 20 1 0
buku ajar statistika nonparametrik 24
Data dianalisis dengan SPSS dan hasil outputnya seperti berikut.
Model Summary
,958a ,917 ,901 ,45176Model1
R R SquareAdjusted
R SquareStd. Error ofthe Estimate
Predictors: (Constant), Kelamin, Pendidikan, Masa_kerja
a.
Nilai koefisien determinasi sebesar 0,917 artinya hasil regresi
menunjukkan bahwa variasi masa kerja, tingkat pendidikan karyawan dan
jenis kelamin mampu menjelaskan variasi gaji karyawan sebesar 91,7%
dan sisanya sebesar 9,3% dijelaskan oleh faktor lain di luar model.
ANOVAb
36,101 3 12,034 58,964 ,000a
3,265 16 ,20439,367 19
RegressionResidualTotal
Model1
Sum ofSquares df Mean Square F Sig.
Predictors: (Constant), Kelamin, Pendidikan, Masa_kerjaa.
Dependent Variable: Gajib.
Nilai F-hitung sebesar 58,964 dan nilai F-tabel pada =5% dengan
df (3,16) sebesar 3,24 (cari dalam tabel F). Nilai F-hitung lebih besar dari
nilai F-tabel sehingga kita menolak Ho. Bisa juga melihat nilai signifikansi
sebesar 0,000 < = 0,05 maka Ho ditolak (H1 diterima). Hasil regresi ini
mengindikasikan bahwa secara serentak variabel masa kerja, tingkat
pendidikan karyawan dan jenis kelamin secara nyata mempengaruhi gaji
karyawan.
buku ajar statistika nonparametrik 25
Coefficientsa
1,067 ,280 3,815 ,002,156 ,016 ,703 9,448 ,000
2,183 ,207 ,774 10,560 ,000,228 ,208 ,081 1,096 ,289
(Constant)Masa_kerjaPendidikanKelamin
Model1
B Std. Error
UnstandardizedCoefficients
Beta
StandardizedCoefficients
t Sig.
Dependent Variable: Gajia.
Uji signifikansi variabel independen terhadap variabel dependen
menunjukkan bahwa nilai t-hitung variabel masa kerja sebesar 9,448;
variabel dummy tingkat pendidikan sebesar 10,560; dan variabel dummy
jenis kelamin sebesar 1,096. Sementara itu, nilai t-tabel uji dua sisi pada
=5% dengan df =16 sebesar 2,120 (cari dalam tabel t). Dengan demikian
variabel masa kerja dan dummy tingkat pendidikan signifikan pada =5%
(nilai t-hitung > nilai t-tabel), sedangkan variabel dummy jenis kelamin
tidak berpengaruh nyata. Bisa juga membandingkan nilai Sig. (probabilitas
atau p-value) jika lebih kecil dari alpha maka Ho ditolak, artinya variabel
tersebut berpengaruh nyata terhadap variabel dependen.
Hasil regresi mengindikasikan bahwa variabel kualitatif tingkat
pendidikan karyawan berpengaruh nyata terhadap gaji karyawan.
Koefisien regresi variabel dummy tingkat pendidikan sebesar 2,183 dapat
diartikan gaji karyawan berpendidikan sarjana lebih besar 2,183 juta
dibandingkan dengan gaji karyawan berpendidikan tidak sarjana dengan
asumsi variabel lain tetap. Variabel dummy jenis kelamin tidak signifikan
maka dapat diartikan tidak ada perbedaan gaji antara karyawan pria dan
wanita dengan asumsi variabel lain tetap. Koefisien regresi variabel
buku ajar statistika nonparametrik 26
dummy jenis kelamin 0,228 artinya gaji karyawan pria lebih tinggi 0,228
juta dibandingkan dengan gaji karyawan wanita tetapi secara statistika
perbedaan itu tidak berbeda nyata.
Karyawan Sarjana dan Pria :
E(Yi | D1=1; D2=1, Xi) = (o + 2 + 3) + 1Xi
Karyawan Tidak Sarjana dan Pria :
E(Yi | D1=0; D2=1, Xi) = (o + 3) + 1Xi
Karyawan Sarjana dan Wanita :
E(Yi | D1=1; D2=0, Xi) = (o + 2) + 1Xi
Karyawan Tidak Sarjana dan Wanita :
E(Yi | D1=0; D2=0, Xi) = o + 1Xi
Persamaan regresi Yi = 1,067 + 0,156 Xi + 2,183 D1 + 0,228 D2
Gaji karyawan berpendidikan sarjana dan pria :
Y = (1,067 +2,183 + 0,228) + 0,156 Xi ===> Y = 3,478 + 0,156 Xi
Gaji karyawan berpendidikan tidak sarjana dan pria :
Y = (1,067 + 0,228) + 0,156 Xi ===> Y = 1,295 + 0,156 Xi
Gaji karyawan berpendidikan sarjana dan wanita :
Y = (1,067 + 2,183) + 0,156 Xi ===> Y = 3,250 + 0,156 Xi
Gaji karyawan berpendidikan tidak sarjana dan wanita: Y=1,067+0,156 Xi
buku ajar statistika nonparametrik 27
Soal Latihan :
Sekarang buatlah analisis dengan data berikut.
INDUSTRI LABA KAPITALA 10 10A 12 11A 14 12A 12 9B 13 13B 15 23B 11 25B 10 16B 18 31C 20 40C 22 50C 23 52A 20 20A 11 30B 15 40
Buatlah model analisis yang menjawab pertanyaan penelitian berikut:
1. Apakah ketiga industri memiliki laba benar-benar yang berbeda?
Buatlah dummy variabelnya.
2. Apakah laba itu disebabkan oleh beda industri atau modal, berapa
sumbangan masing-masing?
3. Mana variabel yang signifikan?
4. Tunjukkan ketepatan modelnya.
5. Ujilah asumsi klasiknya.
6. Sajikan hasil regresi secara internasional
Soal di atas hanya dapat dipecahkan melalui program paket karena
variabelnya menjadi banyak, gunakan program SPSS.
buku ajar statistika nonparametrik 28
BAB IVJENIS UJI STATISTIKA NONPARAMETRIK
1. Uji Chi Square (X2)
Chi-Square disebut juga dengan Kai Kuadrat. Chi Square adalah
salah satu jenis uji komparatif non parametrik yang dilakukan pada dua
variabel, di mana skala data kedua variabel adalah nominal. (Apabila dari
2 variabel, ada 1 variabel dengan skala nominal maka dilakukan uji chi
square dengan merujuk bahwa harus digunakan uji pada derajat yang
terendah).
Uji chi-square merupakan uji non parametrik yang paling banyak
digunakan. Namun perlu diketahui syarat-syarat uji ini adalah: frekuensi
responden atau sampel yang digunakan besar, sebab ada beberapa
syarat di mana chi square dapat digunakan yaitu:
1. Tidak ada cell dengan nilai frekuensi kenyataan atau disebut juga
Actual Count (F0) sebesar 0 (Nol).
2. Apabila bentuk tabel kontingensi 2 X 2, maka tidak boleh ada 1 cell
saja yang memiliki frekuensi harapan atau disebut juga expected
count ("Fh") kurang dari 5.
3. Apabila bentuk tabel lebih dari 2 x 2, misak 2 x 3, maka jumlah cell
dengan frekuensi harapan yang kurang dari 5 tidak boleh lebih dari
20%.
buku ajar statistika nonparametrik 29
Rumus chi-square sebenarnya tidak hanya ada satu. Apabila tabel
kontingensi bentuk 2 x 2, maka rumus yang digunakan adalah "koreksi
yates". Untuk rumus koreksi yates, sudah kami bahas dalam artikel
sebelumnya yang berjudul "Koreksi Yates".
Apabila tabel kontingensi 2 x 2 seperti di atas, tetapi tidak
memenuhi syarat seperti di atas, yaitu ada cell dengan frekuensi harapan
kurang dari 5, maka rumus harus diganti dengan rumus "Fisher Exact
Test".
Pada buku ajar ini, akan fokus pada rumus untuk tabel kontingensi
lebih dari 2 x 2, yaitu rumus yang digunakan adalah "Pearson Chi-
Square".
Formula uji Chi Square :
Dimana :
= Nilai kai-kuadrat
fo = frekuensi observasi/pengamatan
fe = frekuensi ekspetasi/harapan
Untuk memahami apa itu "cell", lihat tabel di bawah ini:
Pendidikan Pekerjaan Total1 21 a b a+b2 c d c+d3 e f e+f
Total a+c+e b+d+f N
Tabel di atas, terdiri dari 6 cell, yaitu cell a, b, c, d, e dan f.
buku ajar statistika nonparametrik 30
Sebagai contoh kita gunakan penelitian dengan judul "Perbedaan
Pekerjaan Berdasarkan Pendidikan".
Teladan 1 : Gunakan data berikut:
Responden Pendidikan Pekerjaan1 1 12 2 23 1 24 2 25 1 26 3 27 2 28 1 29 2 2
10 1 211 1 212 3 113 3 114 2 115 1 216 3 217 2 218 2 219 1 120 2 221 3 122 1 123 3 224 1 225 3 126 2 227 1 228 1 229 2 230 1 131 2 232 2 133 2 134 1 135 2 2
buku ajar statistika nonparametrik 31
36 1 137 3 238 2 239 2 140 3 241 1 142 3 243 1 144 2 245 1 146 3 147 3 248 2 149 3 250 2 151 2 152 2 253 3 254 1 155 2 256 2 257 1 158 3 159 2 160 3 1
Dari data di atas, kita kelompokkan ke dalam tabel kontingensi.
Karena variabel pendidikan memiliki 3 kategori dan variabel pekerjaan
memiliki 2 kategori, maka tabel kontingensi yang dipakai adalah tabel 3 x
2. Maka akan kita lihat hasilnya sebagai berikut:
Pendidikan Pekerjaan Total1 21 11 9 202 8 16 243 7 9 16
Total 26 34 60
buku ajar statistika nonparametrik 32
Dari tabel di atas, kita inventarisir per cell untuk mendapatkan nilai
frekuensi kenyataan, sebagai berikut:
Cell Foa 11b 9c 8d 16e 7f 9
Langkah berikutnya kita hitung nilai frekuensi harapan per cell, rumus
menghitung frekuensi harapan adalah sebagai berikut:
Fh = (Jumlah Baris/Jumlah Semua) x Jumlah Kolom
1. Fh cell a = (20/60) x 26 = 8,667
2. Fh cell b = (20/60) x 34 = 11,333
3. Fh cell c = (24/60) x 26 = 10,400
4. Fh cell d = (24/60) x 34 = 13,600
5. Fh cell e = (16/60) x 26 = 6,933
6. Fh cell f = (16/60) x 34 = 9,067
Maka kita masukkan ke dalam tabel sebagai berikut:
Cell Fo Fha 11 8,667b 9 11,333c 8 10,400d 16 13,600e 7 6,933f 9 9,067
Langkah berikutnya adalah menghitung Kuadrat dari Frekuensi
Kenyataan dikurangi Frekuensi Harapan per cell.
buku ajar statistika nonparametrik 33
1. Fh cell a = (11 - 8,667)2 = 5,444
2. Fh cell b = (9 - 11,333)2 = 5,444
3. Fh cell c = (8 - 10,400)2 = 5,760
4. Fh cell d = (16 - 13,600)2 = 5,760
5. Fh cell e = (7 - 6,933)2 = 0,004
6. Fh cell f = (9 - 9,067)2 = 0,004
Lihat hasilya pada tabel di bawah ini:
Cell Fo Fh Fo - Fh (Fo - Fh)2
a 11 8,667 2,333 5,444
b 9 11,333 -2,333 5,444
c 8 10,400 -2,400 5,760
d 16 13,600 2,400 5,760
e 7 6,933 0,067 0,004
f 9 9,067 -0,067 0,004
Kuadrat dari Frekuensi Kenyataan dikurangi Frekuensi Harapan per
cell kemudian dibagi frekuensi harapannya:
1. Fh cell a = 5,444/8,667 = 0,628
2. Fh cell b = 5,444/11,333 = 0,480
3. Fh cell c = 5,760/10,400 = 0,554
4. Fh cell d = 5,760/13,600 = 0,424
5. Fh cell e = 0,004/6,933 = 0,001
6. Fh cell f = 0,004/9,067 = 0,000
Kemudian dari nilai di atas, semua ditambahkan, maka itulah nilai
chi-square hitung. Lihat Tabel di bawah ini:
buku ajar statistika nonparametrik 34
Cell Fo Fh Fo - Fh (Fo - Fh)2 (Fo - Fh)2/Fha 11 8,667 2,333 5,444 0,628b 9 11,333 -2,333 5,444 0,480c 8 10,400 -2,400 5,760 0,554d 16 13,600 2,400 5,760 0,424e 7 6,933 0,067 0,004 0,001f 9 9,067 -0,067 0,004 0,000
Chi-Square Hitung = 2,087
Untuk menjawab hipotesis, bandingkan chi-square hitung dengan
chi-square tabel pada derajat kebebasan atau degree of freedom (DF)
tertentu dan taraf signifikansi tertentu. Apabila chi-square hitung >= chi-
square tabel, maka perbedaan bersifat signifikan, artinya H0 ditolak atau
H1 diterima.
DF pada teladan 2 di atas adalah 2. Didapat dari rumus ===>
DF = (r - 1) x (k-1)
di mana: r = baris. k = kolom. Pada contoh di atas, baris ada 3 dan kolom
ada 2, sehingga DF = (2 - 1) x (3 -1) = 2.
Apabila taraf signifikansi yang digunakan adalah 95% maka batas kritis
0,05 pada DF 2, nilai chi-square tabel sebesar = 5,991.
Karena 2,087 < 5,991 maka perbedaan tidak signifikan, artinya Ho
diterima atau H1 ditolak.
Teladan 2 : untuk Data dari Sampel Tunggal
Akan diuji distribusi frekuensi kategori variabel motivasi hasil
amatan dengan distribusi frekuensi kategori variabel sama yang
diharapkan. Hipotesis nol uji tersebut adalah: tidak terdapat perbedaan
distribusi variabel motivasi hasil amatan dengan distribusi harapan.
buku ajar statistika nonparametrik 35
Prosedur ini banyak digunakan pada uji normalitas variabel. Rumus yang
digunakan dalam uji tersebut adalah:
k
i i
ii
E
EO
1
22 )(
dengan keterangan:
iO = banyaknya kasus yang diamati dalam kategori i.
iE = banyaknya kasus yang diharapkan
k
i 1
= penjumlahan semua kategori k.
Misalkan hasil penelitian memperoleh frekuensi kategori hasil
observasi (kolom O) dan frekuensi kategori harapan ditunjukkan (kolom E)
pada Tabel, untuk menghitung i
ii
E
EO 2)( perlu dibuat kolom ((O-E)2)/E.
Tabel Uji Statistik Nonparametrik Data dari Sampel Tunggaldengan Chi-Kuadrat
Kategori O E ((O-E)2)/ESangat Rendah 3 2 0,500Rendah 7 8 0,125Sedang 8 10 0,400Tinggi 8 8 0,000Sangat Tinggi 4 2 2,000Total 30 30 3,025
Dengan cara tersebut, maka diperoleh 2 = 3,025. Derajad
kebebasan (db) uji tersebut adalah jumlah kategori (k) dikurangi 1 = 4.
Pada taraf signifikasi () = 5% harga 2 tabel = 9,49. Karena 2 hitung pasangannya pada sampel 2
tanda () data pada sampel 1 < pasangannya pada sampel 2
tanda Nol (0) data pada sampel 1 = pasangannya pada sampel 2
Tanda Nol tidak digunakan dalam perhitungan.
Notasi yang digunakan:
n = banyaknya tanda (+) dan tanda () dalam sampel
p = proporsi SUKSES dalam sampel
q = 1 p
p0 = proporsi SUKSES dalam H0
q0 = 1 p0
Standar Error = Galat Baku = p =n
qp 00
Rata-Rata Sampel = p = p0
Statistik Uji zhitung =p
pp
zhitung =
n
qp
pp
00
0
Ingat: kejadian SUKSES tergantung dari apa yang ditanyakan (ingin diuji)
dalam soal.
Jika yang ingin diuji sampel 1 > sampel 2 maka SUKSES adalah
banyak tanda (+)
Jika yang ingin diuji sampel 1 < sampel 2 maka SUKSES adalah
banyak tanda ()
buku ajar statistika nonparametrik 38
Nilai p0 disesuaikan dengan nilai pengujian p yang diinginkan dalam soal,
atau jika ingin diuji proporsi sampel 1 = proporsi sampel 2 maka = p0 = q0
= 0,5.
Penetapan H0 dan H1, dalam uji hipotesis terdapat 3 alternatif H0 dan H1:
1) H0: p = p0 dan H1: p < p0Uji 1 arah dengan daerah penolakan H0: z < z
2) H0: p = p0 dan H1: p > p0Uji 1 arah dengan daerah penolakan H0: z > z
3) H0: p = p0 dan H1: p p0Uji 2 arah dengan daerah penolakan H0: z < z/2 dan z > z/2
Teladan 3 :
Berikut adalah nilai preferensi konsumen terhadap 2 Merk Sabun
Mandi (LUXE dan GIVE). Dengan taraf nyata 1%, ujilah apakah proporsi
preferensi konsumen pada kedua merk bernilai sama?
Tabel Skor preferensi sabun untuk Teladan 3
buku ajar statistika nonparametrik 39
Banyaknya tanda (+) = 8
Banyaknya tanda () = 5
Total n = 8 + 5 = 13
Jika kita asumsikan LUXE lebih disukai dibanding GIVE maka SUKSES
dalam sampel adalah p = proporsi banyaknya tanda (+) dalam sampel.
13
8
n
positifbanyakp = 0,62
q = 1 p = 1 0,62 = 0,38
Karena ingin diuji proporsi yang suka LUXE = GIVE, maka p0 = q0 = 0,50.
Langkah pengujiannya adalah:
1. H0: p = 0,50 H1: p 0,50
2. Statistik Uji : z
3. Arah uji: 2 arah
4. Taraf nyata pengujian = = 1% /2 = 0,5% = 0,005
5. Daerah Penolakan H0
buku ajar statistika nonparametrik 40
6. Nilai statistik Uji:
zhitung =
13
25,0
12,0
13
50,050,0
50,062,0
00
0
n
qp
pp
=13867,0
12,0
0192,0
12,0 = 0,8653 0,87
7. Kesimpulan:
z hitung = 0,87 ada di daerah penerimaan H0, sehingga H0 di-terima.
Proporsi konsumen yang menyukai LUXE masih sama dengan yang
menyukai GIVE.
Teladan 4 :
Dengan menggunakan data pada Teladan 3 di atas dan taraf nyata
1%, ujilah apakah proporsi preferensi konsumen pada sabun LUXE
dibanding sabun GIVE sudah lebih dari 0,30?
Diketahui: p0 = 0,30
q0 = 1 0,30 = 0,70
1) H0: p = 0,30 H1: p > 0,30
2) Statistik Uji: z
3) Arah uji: 1 arah
4) Taraf nyata pengujian = = 1% = 0,01
5) Daerah Penolakan H0:
buku ajar statistika nonparametrik 41
6) Nilai statistik uji:
zhitung =
13
21,0
32,0
13
70,030,0
30,062,0
00
0
n
qp
pp
= 1270,0
32,0
0161,0
32,0 = 2,5177 2,52
7) Kesimpulan:
z hitung = 2,52 ada di daerah penolakan H0, sehingga H0 ditolak dan
H1 diterima. Proporsi konsumen yang menyukai LUXE sudah lebih
dari 0,30.
Soal Latihan :
Di Kelurahan Karang Pule diadakan penyuluhan tentang kesehatan
dan kebersihan serta diadakan perlombaan kebersihan berhadiah. Untuk
mengetahui apakah penyuluhan demikian ada manfaatnya untuk
menyadarkan penduduk dalam hal kebersihan dan kesehatan, kemudian
buku ajar statistika nonparametrik 42
diadakan pengamatan terhadap 26 rumah yang dipilih secara acak.
Misalnya ada empat tingkat kebersihan rumah masing-masing diberi nilai
1, 2, 3, dan 4 berdasarkan pedoman penilaian tertentu. Data hasil
pengamatan sebelum dan sesudah diadakan penyuluhan sebagai berikut.
Resp Sebelum Sesudah1 2 32 3 23 1 34 2 35 1 26 2 37 3 48 2 39 4 4
10 1 311 2 312 2 113 2 414 1 315 2 316 3 217 3 218 2 319 1 220 1 321 2 322 1 123 3 224 2 325 1 426 2 2
Ujilah apakah penyuluhan dapat menyadarkan penduduk dalam hal
kebersihan dan kesehatan, alpha 1% dan 5 %.
buku ajar statistika nonparametrik 43
3. Uji Pangkat Bertanda Wilcoxon
Uji ini dipergunakan untuk membandingkan dua sampel yang
anggota-anggotanya berpasangan dan berasal dari dua populasi yang
tidak diketahui distribusinya. Untuk menguji perbedaan median dua
populasi berdasarkan median dua sampel berpasangan. Uji ini selain
mempertimbangkan arah perbedaan, juga mempertimbangkan besar
relatif perbedaannya. Dengan demikian bisa dikatakan bahwa Uji Pangkat
Bertanda Wilcoxon memiliki kualitas yang lebih baik dibandingkan
dengan Uji Tanda. Data paling tidak berskala ordinal.
Notasi yang digunakan:
n1 = ukuran sampel ke-1 n2 = ukuran sampel ke-2
n1 < n2 ukuran sampel ke-1 selalu lebih kecil dari sampel ke-2
W = jumlah peringkat pada sampel berukuran terkecil.
Nilai Ekspektasi (W) = E(W) =
2
1211 nnn
Standar Error = SE =12
)1( 2121 nnnn
Statistik uji = z =SE
WEW )(
Teladan 5 : Berikut ini adalah data pendapatan di 2 kelompok pekerja.
buku ajar statistika nonparametrik 44
Dengan taraf nyata 5% ujilah apakah (peringkat) pendapatan di de-
partemen Q lebih kecil dibandingkan dari departemen Z?
Jawab:
1. H0: 1 = 2 H1: 1 < 2
2. Statistik Uji : z
3. Arah uji: 1 arah
4. Taraf nyata pengujian = = 5% = 0,05
5. Daerah Penolakan H0: lihat diagram pada halaman berikutnya!
6. Statistik uji: n1 = 4 n2 = 8 W = 19
E(W) =
2
134
2
1844
2
1211
nnn
= 26
SE =
666,3412
416
12
1384
12
12121
nnnn
= 5,89
z =89,5
2619)(
SE
WEW= 1,19
7. Kesimpulan:
z hitung = 1,19 ada di daerah penerimaan H0, sehingga H0 diterima.
Jadi, peringkat pendapatan di kedua departemen sama.
buku ajar statistika nonparametrik 45
4. Uji Jumlah Pangkat Wilcoxon
Uji ini dipergunakan untuk membandingkan dua sampel yang
anggota-anggotanya tidak berpasangan dan berasal dari dua populasi
yang tidak diketahui distribusinya. Hipotesis nol yang akan diuji
menyatakan bahwa mean dari dua populasi sama.
Ho : 1 = 2 lawan H1 : 1 2
Kedua populasi yang diselidiki tidak diketahui distribusinya dan
tidak perlu sama macam distribusinya, dengan demikian uji parametrik
tidak tepat untuk digunakan.
Bila besar sampel pertama dan kedua dinyatakan dengan n1 dan
n2, maka langkah-langkah pengujiannya sebagai berikut :
1. Gabungkan kedua sampel dan beri pangkat (jenjang) pada tiap-tiap
anggotanya mulai dari nilai pengamatan terkecil ke nilai pengamatan
terbesar. Apabila ada dua atau lebih nilai pengamatan yang sama maka
pangkat yang diberikan pada tiap-tiap anggota sampel adalah pangkat
rata-rata.
2. Hitung pangkat masing-masing bagi sampel pertama dan kedua, dan
notasikan dengan R1 dan R2.
3. Ambillah jumlah pangkat yang lebih kecil antara R1 dan R2, notasikan
dengan R.
4. Bandingkan nilai R yang diperoleh dari hasil pengamatan dengan R
dari tabel.
5. Jika R R maka Ho diterima dan jika R < R maka Ho ditolak.
buku ajar statistika nonparametrik 46
Teladan 6
Suatu metode penanaman padi model baru (Jajar Legowo=Jarwo)
hendak dicobakan. Untuk mengetahui apakah cara baru (Jarwo) tersebut
memberikan hasil panenan (produksi) yang berbeda dengan cara lama
(Tandur Jajar). Kemudian dilakukan penelitian, cara lama dicobakan pada
10 orang petani dan cara baru dicobakan pada 10 orang petani lainnya,
masing-masing dipilih secara random dari berbagai tempat yang kira-kira
memiliki luas lahan dan kesuburan yang sama. Hasil penelitian dan
pangkatnya disajikan pada tabel berikut.
Tabel Hasil Panenan (Produksi) dan Pangkat Cara Lama dan Cara Baru
No Metode Lama (Tandur Jajar) Metode Baru (Jarwo)Produksi Pangkat Produksi Pangkat
1 16 7,5 16 7,52 12 2 15 5,53 18 10 19 13,54 19 13,5 23 185 14 4 25 196 13 3 21 177 18 10 26 208 19 13,5 20 169 15 5,5 18 1010 10 1 19 13,5
Jumlah R1 = 70 Jumlah R2 = 140
Jumlah pangkat yang lebih kecil adalah R1 = 70 ===> R. Untuk n1
= 10 dan n2 = 10, dari tabel R diperoleh R 5% = 78 dan R 1% = 71, nilai R
hitung < R tabel maka Ho ditolak, artinya produksi padi cara baru berbeda
nyata dengan produksi padi cara lama.
Untuk dua sampel yang berukuran tidak sama (n1 n2), pemberian
pangkat dilakukan dua kali, yaitu pangkat dari nilai pengamatan terkecil ke
buku ajar statistika nonparametrik 47
nilai pengamatan terbesar (pangkat I) dan dari nilai pengamatan terbesar
ke nilai pengamatan terkecil (pangkat II).
Apabila n1 atau n2 atau kedua-duanya lebih besar dari 20,
pengujian hipotesis dilakukan dengan menggunkan distribusi Z, dengan
rumus sebagai berikut :
n* (n1 + n2 + 1) 2 R*Z-hit = --------------------------------------
(n1 n2 (n1 + n2 + 1) / 3)1/2
R* = jumlah pangkat yang lebih kecil
n* = jumlah sampel dari R*
Jika Z-hit Z tabel maka Ho diterima (H1 ditolak)
Jika Z-hit > Z tabel maka Ho ditolak (H1 diterima)
Soal Latihan :
Seorang peneliti ingin mengetahui apakah kenaikan upah akan
meningkatkan output per jam dari pekerja. Output per jam dalam unit
sebelum kenaikan upah (X) dan output per jam dalam unit setelah
kenaikan upah (Y). Sampel dengan 10 pekerja memberikan hasil sebagai
berikut :
Pekerja 1 2 3 4 5 6 7 8 9 10
X 91 83 70 64 85 86 91 66 72 61
Y 88 87 67 69 83 81 94 67 76 65
Ujilah apakah kenaikan upah dapat meningkatkan output per jam
dari pekerja, gunakan uji Pangkat Bertanda Wilcoxon = 5 %.
buku ajar statistika nonparametrik 48
5. Uji Mann-Whitney
Uji ini merupakan alternatif uji beda dua rata-rata parametrik
dengan menggunakan referensi distribusi t (sampel-sampel berukuran
kecil).
Langkah pertama pengujian ini adalah pengurutan nilai mulai dari
yang terkecil hingga terbesar. Pengurutan dilakukan tanpa pemisahan
kedua sampel. Selanjutnya lakukan penetapan Rank (Peringkat) dengan
aturan berikut:
Peringkat ke -1 diberikan pada nilai terkecil di urutan pertama dan
peringkat tertinggi diberikan pada nilai terbesar.
Jika tidak ada nilai yang sama maka urutan = peringkat.
Jika ada nilai yang sama, maka ranking dihitung dengan rumus:
Peringkat (R) = samabernilaiyangdatabanyaknya
samabernilaiyangdataurutan
Teladan 7 : Berikan peringkat (ranking) data dalam tabel berikut.
Tabel Nilai Statistika II untuk Teladan 7.
buku ajar statistika nonparametrik 49
Ranking untuk nilai 70 =3
21
3
876
= 7
Ranking untuk nilai 75 =2
19
2
109
= 9,5
Notasi yang digunakan:
R1 = Jumlah peringkat dalam sampel ke-1
R2 = Jumlah peringkat dalam sampel ke-2
n1 = ukuran sampel ke-1
n2 = ukuran sampel ke-2
Ukuran kedua sampel tidak harus sama
Rata-rata R1 =
2
12111
nnnR
Rata-rata R2 =
2
12122
nnnR
Standar Error (Galat Baku) = 12
12121 nnnn
R
Statistik uji: z =1
11
R
RR
Dalam perhitungan hanya R1 yang digunakan, karena ia menjadi subyek
dalam H0 dan H1.
Teladan 8 :
Berdasarkan Tabel di atas (lihat Teladan 7), ujilah dengan taraf
nyata 5%, apakah (peringkat) nilai mahasiswa Fakultas Pertanian lebih
besar dibanding mahasiswa Fakultas Ekonomi?
buku ajar statistika nonparametrik 50
Jawab:
1. H0: 1 = 2 H1: 1 > 2
2. Statistik Uji: z
3. Arah uji: 1 arah
4. Taraf nyata pengujian = = 5% = 0,05
5. Daerah Penolakan H0:
6. Nilai statistik uji:
R1 = 117 R2 = 93
n1 = 10 n2 = 10
2
210
2
2110
2
1101010
2
12111
nnn
R = 105
175
12
2100
12
211010
12
12121
nnnn
R
= 13,23
23,13
12
175
105117
1
11
R
RRz
= 0,90711 0,91
buku ajar statistika nonparametrik 51
7. Kesimpulan:
z hitung = 0,91 ada di daerah penerimaan H0, sehingga H0 diterima.
Dengan demikian (peringkat) nilai UAS Statistika di Fakultas Pertanian
sama dengan Fakultas Ekonomi.
Soal Latihan :
Seorang Manajer ingin mengetahui apakah iringan musik lembut
berpengaruh terhadap produktivitas kerja. Output per jam dalam unit
pekerja tanpa iringan musik (X) dan output per jam dalam unit pekerja
dengan iringan musik (Y). Sampel dengan 10 pekerja memberikan hasil
sebagai berikut :
Pekerja 1 2 3 4 5 6 7 8 9 10
X 13 12 12 10 10 10 14 11 9 8
Y 15 13 12 12 14 16 13 8 10 7
Ujilah apakah iringan musik lembut berpengaruh terhadap
produktivitas kerja, gunakan uji Mann-Whitney = 5%.
buku ajar statistika nonparametrik 52
6. Uji Run (Run Test)
Uji Run(s) digunakan untuk menguji keacakan dalam suatu sampel.
Run adalah satu atau lebih lambang-lambang yang identik yang didahului
atau diikuti oleh suatu lambang yang berbeda atau tidak ada lambang
sama sekali.
terdapat 9runs
Statistik uji yang digunakan: z
Notasi yang digunakan:
n1 = banyaknya lambang 1 dalam sampel n1 > 10
n2 = banyaknya lambang 2 dalam sampel n2 > 10
n = n1 + n2
nr = banyak run(s)
Rata-rata Run(s) = r =n
nn 212 + 1
Standar deviasr Run(s) = r = 122
22221
nn
nnnnn
Statistik uji: z =r
rrn
Penetapan H0:
H0: susunan acak (random)
H1: susunan tidak acak (not random)
Uji 2 arah dengan daerah penolakan H0: z < z/2 dan z > z/2
buku ajar statistika nonparametrik 53
Teladan 9 :
Berikut ini adalah urutan duduk mahsiswa dan mahasiswi dalam
suatu kelas:
LL P L PP L P L P L P LL P LLLLLLL PP L P LL PP LLLLLL
L = Laki-laki, P = Perempuan
Dengan taraf nyata 5%, ujilah apakah urutan ini sudah random?
Diketahui:
n1 = banyak L = 24 ; n2 = banyak P = 12 ; nr = banyak runs = 19
Jawab:
1. H0: susunan acak H1: susunan tidak acak
2. Statistik Uji : z
3. Arah pengujian: 2 Arah
4. Taraf nyata pengujian = = 5% /2 = 2,5% = 0,025
5. Daerah Penolakan H0:
buku ajar statistika nonparametrik 54
6. Statistik uji:
r = n
nn 212+ 1 = 36
12242 + 1 = 17
r = 122
22221
nn
nnnnn=
13636
3612242122422
= 351296
540576
= 857143,6 = 2,618615 2,62
nr = 19
z =r
rrn
= 62,2
1719 = 0,76
7. Kesimpulan:
z hitung = 0,76 ada di daerah penerimaan H0, maka H0 diterima. Jadi,
dengan demikian susunan tersebut terbukti acak.
Soal Latihan :
Seorang mahasiswa Fakultas Pertanian melakukan penelitian
untuk mengetahui Apakah Pria dan Wanita yang Berbelanja ke Kios
Saprotan (Sarana Produksi Pertanian) Berdatangan Secara Acak atau
Tidak. Pada hari penelitian mahasiswa tersebut melakukan pencatatan
terhadap jenis kelamin orang yang berbelanja dari mulai kios dibuka
hingga ditutup kembali, dan diperoleh data, ada 30 orang yang
berbelanja, terdiri dari 20 orang Pria (n1) dan 10 orang Wanita (n2)
dengan susunan seperti berikut.
P P P P W W P P P P P P W W W W P P P P P P W P P P P W W W
Hipotesis penelitian adalah Ho : data berdistribusi random lawan H1 :
data tidak berdistribusi random. Berdasarkan data hasil penelitian
tersebut lakukan uji Run, = 5%.
buku ajar statistika nonparametrik 55
7. Uji Kruskal-Wallis
Analisis varian ranking satu arah Kruskal-Wallis atau biasa disebut
Uji Kruskal-Wallis pertama kali diperkenalkan oleh William H. Kruskal dan
W. Allen Wallis pada tahun 1952. Uji ini merupakan salah satu uji statistik
nonparametrik dalam kasus k sampel independen. Uji Kruskal-Wallis
digunakan untuk menguji apakah k sampel independen berasal dari
populasi yang berbeda, dengan kata lain uji ini dapat digunakan untuk
menguji hipotesis nol bahwa k sampel independen berasal dari populasi
yang sama atau identik dalam hal harga rata-ratanya. Oleh karena itu, uji
Kruskal-Wallis juga merupakan perluasan dari uji Mann-Whitney.
Menurut D.C. Montgomery (2005), apabila asumsi kenormalan
yang dibutuhkan oleh metode statistika parametrik tidak dapat dipenuhi,
maka peneliti dapat menggunakan metode alternatif sebagai pengganti
analisis varian satu arah (One way ANOVA) yaitu Kruskal-Wallis Test.
Sedangkan menurut Wayne W. Daniel dalam bukunya Applied
Nonparametric Statistic, beberapa syarat yang harus dipenuhi dalam
menggunakan Kruskal-Wallis Test adalah:
1. Pengamatan harus bebas satu sama lain (tidak berpasangan).
2. Tipe data setidak-tidaknya adalah ordinal.
3. Variabel yang diamati merupakan variabel yang berdistribusi
kontinyu.
buku ajar statistika nonparametrik 56
Dasar Pemikiran dan Metode
Data untuk pengujian Kruskal-Wallis pada umumnya dituangkan
dalam tabel r baris dan k kolom. Banyaknya sampel yang terpilih dituliskan
dalam tabel secara baris, sedangkan kelompok atau kategori yang
tersedia dituliskan secara kolom.
Dalam penghitungan uji Kruskal-Wallis ini, masing-masing nilai
observasi diberi ranking secara keseluruhan dalam satu rangkaian.
Pemberian ranking diurutkan dari nilai yang terkecil hingga nilai yang
terbesar. Nilai yang terkecil diberi ranking 1 dan nilai yang terbesar diberi
ranking N (dimana N adalah jumlah seluruh observasi). Apabila terdapat
angka yang sama, maka ranking dari nilai-nilai tersebut adalah rata-rata
ranking dari nilai-nilai observasi tersebut.
Jika seluruh nilai observasi telah diberi ranking, langkah
selanjutnya adalah menghitung jumlah ranking dari masing-masing kolom
(Rj).
Sampel Kelompok / Kategori1 R 2 R k R
12...nj
X11X21
Xn1
R11R21
Rn1
X12X22
Xn2
R12R22
Rn2
X1kX2k
Xnk
R1kR2k
RnkRj - R1 - R2 - Rk
buku ajar statistika nonparametrik 57
Selanjutnya, uji Kruskal-Wallis dapat didefinisikan dengan rumus:
dimana:
Metode dan Prosedur
1. Penentuan Hipotesis Nol dan Hipotesis Alternatif
H0 : k sampel berasal dari populasi yang sama
H1 : k sampel berasal dari populasi yang berbeda
2. Menentukan Tes Statistik / Statistik Uji
Karena tujuannya adalah menguji apakah k sampel independen
berasal dari populasi yang sama maka uji statistik yang kita
gunakan adalah uji Kruskal-Wallis dengan statistik ujinya H yang
berdistribusi Chi-Square dengan derajat bebas (k-1).
3. Menentukan Tingkat Signifikansi
Tingkat signifikansi adalah bilangan yang mencerminkan
besarnya peluang menolak hipotesis nol ketika hipotesis nol bernilai
benar.
H: nilai Kruskal-Wallis dari hasil penghitungan
Rj: jumlah rank dari kelompok/kategori ke-j
nj : banyaknya kasus dalam sampel pada kelompok/kategori ke-j
k: banyaknya kelompok/kategori
N: jumlah seluruh observasi (N=n1+n2+n3+..+nk)
)1(3)1(
12
1
2
NnR
NNH
k
i j
j
buku ajar statistika nonparametrik 58
4. Distribusi Sampling
H mendekati distribusi Chi-Square dengan derajat bebas (k-1). Nilai
H dapat dihitung dengan rumus di atas. Adapun ketentuan
penggunaan tabel adalah sebagai berikut:
a. Jika k=3 dan nj 5 (j=1;2;3), Tabel O dapat digunakan untuk
menentukan nilai yang berkaitan dengan harga di bawah H0.
b. Dalam kasus lain, dapat digunakan Tabel C dengan derajat
bebas (k-1).
5. Daerah Penolakan
Daerah penolakan terdiri dari semua harga H yang sedemikian
besar sehingga kemungkinan yang berkaitan dengan terjadinya
harga-harga itu di bawah H0 sama dengan atau kurang dari .
6. Keputusan
H0 akan ditolak jika nilai H (k-1) atau nilai p-value sebaliknya
H0 akan gagal ditolak jika nilai H < (k-1) atau nilai p-value > .
Ringkasan Prosedur
1. Berilah ranking pada masing-masing nilai observasi dengan urutan
dari ranking 1 hingga N.
2. Tentukan harga R (jumlah ranking) untuk masing-masing kelompok
atau kategori.
3. Metode untuk menilai signifikansi harga observasi H bergantung
pada besarnya k dan banyaknya sampel pada setiap kelompok/
kategori tersebut.
buku ajar statistika nonparametrik 59
a. Jika k=3 dan nj 5 (j=1;2;3), Tabel O dapat digunakan untuk
menentukan nilai yang berkaitan dengan harga di bawah H0.
b. Dalam kasus lain, dapat digunakan Tabel C dengan derajat
bebas (k-1).
4. Jika kemungkinan yang berkaitan dengan harga observasi H
adalah sama atau kurang dari , maka tolak H0 dan terima H1.
Teladan 8 :
Untuk membandingkan tingkat keefektifan dari 3 macam metode
diet, maka sebanyak 22 orang mahasiswi yang dipilih dari suatu
universitas dibagi ke dalam 3 kelompok yang mana masing-masing
kelompok mengikuti program diet selama empat minggu sesuai dengan
metode yang telah dibuat. Setelah program diet berakhir, maka diperoleh
banyaknya berat badan yang hilang (dalam kg) dari mahasiswi-mahasiswi
tersebut sebagai berikut:
Metode Diet 1 Metode Diet 2 Metode Diet 3
Sampel Berat Badan(BB) yg hilang SampelBerat Badan
(BB) yg hilang SampelBerat Badan
(BB) yg hilang1 5,3 1 6,3 1 2,42 4,2 2 8,4 2 3,13 3,7 3 9,3 3 3,74 7,2 4 6,5 4 4,15 6,0 5 7,7 5 2,56 4,8 6 8,2 6 1,7
7 9,5 7 5,38 4,59 1,3
buku ajar statistika nonparametrik 60
Untuk menguji Ho yang menyatakan bahwa tingkat keefektifan dari ketiga
metode diet di atas adalah sama, terhadap hipotesis alternatif yang
menyatakan bahwa tingkat keefektifan ketiga metode di atas adalah tidak
sama ( = 5%).
Jawaban :o Hipotesis
H0 : tingkat keefektifan dari ketiga metode diet adalah sama
H1 : tingkat keefektifan dari ketiga metode diet adalah tidak sama
o Tes Statistik : Kruskal-Wallis Test
o Tingkat Signifikansi : =5%,
o Distribusi sampling :
H mendekati distribusi Chi-Square dengan derajat bebas (k-1),
sehingga wilayah kritis dapat ditentukan dengan menggunakan
Tabel Chi Square.
o Penghitungan
n1=6 ; n2=7 ; n3=9 ; N= n1 + n2 + n3 = 22
Metode Diet 1 Metode Diet 2 Metode Diet 3BB yg hilang Ranking BB yg hilang Ranking BB yg hilang Ranking
5,3 12,5 6,3 15 2,4 34,2 9 8,4 20 3,1 53,7 6,5 9,3 21 3,7 6,57,2 17 6,5 16 4,1 86,0 14 7,7 18 2,5 44,8 11 8,2 19 1,7 2
9,5 22 5,3 12,54,5 101,3 1
R1 = 70 R2 = 131 R3 = 52
buku ajar statistika nonparametrik 61
)1(3)1(
12
1
2
NnR
NNH
k
i j
j
= 15,633
o Daerah penolakan : H (k-1) atau p-value
o Keputusan : 0,05(2) = 5,991
Karena 15,633 > 5,991 H > 0,05(2) , maka Tolak H0
o Kesimpulan : Dengan tingkat kepercayaan 95 %, belum cukup bukti
untuk menyatakan bahwa tingkat keefektifan dari ketiga metode
diet tersebut adalah sama.
Teladan 9 :
Sebuah perusahaan ingin mengetahui apakah terdapat perbedaan
keterlambatan masuk kerja antara pekerja yang rumahnya jauh atau dekat
dari lokasi perusahaan. Misalkan jarak rumah dikategorikan dekat (kurang
dari 10 km), sedang (10 15 km) dan jauh (lebih dari 15 km).
Keterlambatan masuk kerja dihitung dalam menit keterlambatan selama
sebulan terakhir.
Penelitian dilakukan pada tiga kelompok pekerja dengan sampel
acak, dengan masing-masing sampel untuk yang memiliki jarak rumah
dekat sebanyak 5 sampel, jarak sedang sebanyak 4 sampel dan jauh
sebanyak 3 sampel. Ujilah dengan tingkat kepercayaan 95 %. Datanya
sebagai berikut :
buku ajar statistika nonparametrik 62
Dekat Sedang Jauh59 77 89
110 99 102132 128 121143 144165
Jawaban :o Hipotesis
H0 : Tidak ada perbedaan lama keterlambatan antara tiga kategori
pekerja berdasarkan jarak rumahnya.
H1 : Ada perbedaan lama keterlambatan antara tiga kategori
pekerja berdasarkan jarak rumahnya
o Tes Statistik : Kruskal-Wallis Test. Karena data berada pada skala
pengukuran rasio (lama keterlambatan), maka kruskal-wallis dapat
digunakan.
o Tingkat Signifikansi : = 0,05
o Penghitungan, n1= 5 ; n2= 4 ; n3= 3 ; N= n1 + n2 + n3 = 12
Dekat Rank Sedang Rank Jauh Rank59 1 77 2 89 3
110 6 99 4 102 5132 9 128 8 121 7143 10 144 11165 12
R1 = 38 R2 = 25 R3 = 15
buku ajar statistika nonparametrik 63
= 1,004
o Daerah penolakan : p-value
o Keputusan :
Karena k=3 dan nj 5 (j=1;2;3), maka kita dapat menggunkan Tabel
Kruskal Wallis untuk menentukan nilai yang berkaitan dengan
harga di bawah H0.
Untuk nilai , , dan , p-value untuk H = 1,004
adalah lebih besar dari 0,103 (p-value > 0,103). Karena p-value >
0,05, maka gagal tolak H0
o Kesimpulan : Dengan tingkat kepercayaan 95 %, belum cukup bukti
untuk menyatakan bahwa ada perbedaan lama keterlambatan
antara tiga kategori pekerja berdasarkan jarak rumahnya.
Soal Latihan :
Suatu percobaan untuk membandingkan umur rata-rata lima merk bola
lampu telah dilakukan serta memberikan data sebagai berikut (data
dalam satuan jam). Ujilah apakah ada perbedaan umur merk bola lampu.
Merk A Merk B Merk C Merk D Merk E308 202 283 279 331313 206 299 238 251331 204 411 256 246251 280 167 276 204246 255 294 281305 322
buku ajar statistika nonparametrik 64
8. Uji Friedman (Friedman Test)
Pengujian dengan uji Friedman sama sepertidalam uji analisis dua
arah dalam statistik parametrik. Uji ini diperkenalkan oleh Milton Friedman
tahun 1937 dan termasuk dalam uji nonparametrik yang tidak
membutuhkan asumsi distribusi normal dan varians populasi tidak
diketahui. Skala data yang digunakan dapat berupa ordinal. Uji Friedman
merupakan alternatif yang dilakukan apabila pengujian dalam ANOVA
tidak terpenuhi asumsi-asumsi seperti tersebut di atas. Setiap sampel
mendapatkan perlakukan yang berbeda (repeated measurement).
Pegambilan data pada setiap sampel dilakkan sebelum (pre test) dan
sesudah (post test). Pemberian ranking menurut baris (per observasi).
Uji yang digunakan untuk membandingkan skor (nilai pengamatan)
dari k sampel atau kondisi yang berpasangan (banyaknya pengamatan
setiap sampel atau kondisi sama).
Untuk menguji hipotesis dua sampel berpasangan dimana
perlakuan yang diterapkan terhadap obyek lebih dari 2 kali. Formulanya
sebagai berikut :
Menentukan degree of freedom (df atau db) = k-1 dimana k = jumlah
sampel.
buku ajar statistika nonparametrik 65
Teladan 10 :
Dilakukan sebuah penelitian pada 15 responden tentang
perbedaan 3 shift kerja terhadap kinerja perawat sebuah RS Swasta di
Mataram, berikut merupakan datanya.
NomorObservasi
Kinerja PerawatShift 1 Shift 2 Shift 3
Nilai Rank Nilai Rank Nilai Rank1 76 3 70 1 75 22 71 2 65 1 77 33 56 1 57 2 74 34 67 3 60 2 59 15 70 2 56 1 76 36 77 3 71 1 73 27 45 1 47 2 78 38 60 1 67 3 62 29 63 2 60 1 75 3
10 60 2 59 1 74 311 61 3 57 1 60 212 56 1 60 2 75 313 59 2 54 1 70 314 74 3 72 2 71 115 66 3 63 1 65 2
Rank (peringkat) ditentukan berdasarkan banyaknya k dari
observasi 1 dalam semua perlakuan/kondisi. Misal: observasi 1 mendapat
nilai kinerja pada shift 1, 2 dan 3 masing-masing 76, 70 dan 75. Maka rank
(peringkat)-nya ditentukan berdasarkan nilai terkecil, yaitu 70, 75, dan 76
masing-masing peringkat 1, 2, dan 3.
Jumlah-jumlah tersebut kemudian dimasukan ke dalam rumus, yaitu :
12= -------------------- [(322+222+362)] - 3(15)(3+1) = 6,93
(15) (3) (3+1)
buku ajar statistika nonparametrik 66
Dengan df = k-1 =3-1=2, pada =0,05 dan CI 95 % , maka nilai chi square
pada tabel adalah = 5,59.
Ternyata nilai chi square hitung > nilai chi square pada tabel = 6,93 > 5,59
====> Ho ditolak, artinya, ada perbedaan kinerja perawat pada masing-
masing shift kerja.
Soal Latihan :
Manajemen restoran fastfood sangat ingin tahu pendapat langganannya
mengenai pelayanan, kebersihan dan kualitas makanan dari restorannya.
Pihak management ingin membandingkan hasil rating pelanggan untuk
tiga shift yang berbeda, yaitu:
Shift 1: 16.00 midnight; Shift 2: midnight 08.00; Shift 3: 08.00 16.00
Pelanggan diberi kesempatan untuk mengisi kartu saran. Pada penelitian
ini 10 kartu saran (customer card) dipilih secara random, untuk setiap shift.
Rating digolongkan dalam empat kategori yaitu 4 = sempurna, 3 = baik, 2
= biasa, 1 = buruk. Diperoleh data seperti dibawah ini:
16.00 - Midnight Midnight - 08.00 08.00 - 16.004 3 34 4 13 2 34 2 23 3 13 4 33 3 43 3 22 2 43 3 1
Dengan tingkat kepercayaan 95%, dapatkah pihak manajemen
mengatakan bahwa karyawannya memberikan pelayanan, kebersihan,
dan kualitas makanan yang sama sepanjang hari?
buku ajar statistika nonparametrik 67
9. Uji Korelasi Rank Spearman
Dua uji Mann-Whitney dan Wilcoxon ditujukan untuk 2 sampel yang
saling bebas (independen), sedangkan Uji Rank Spearman ditujukan
untuk penetapan peringkat data berpasangan.
Konsep dan interpretasi nilai Korelasi Rank Spearman (rS) sama
dengan konsep Koefisien Korelasi Product Moment pada Regresi (Linier
Sederhana).
Notasi yang digunakan:
n = banyak pasangan data
di = selisih peringkat pasangan data ke-i
rS = Korelasi Spearman
rS = 1 16
21
2
nn
dn
ii
Statistik uji = z = rS 1n
Penetapan H0 dan H1:
Terdapat 3 alternatif H0 dan H1, yaitu:
a) H0: R = 0 (korelasi 0, tidak ada hubungan /tidak ada kecocokan)
H1: R < 0 (korelasi negatif)
Uji 1 arah dengan daerah penolakan H0: z < z
b) H0: R = 0 (korelasi 0, tidak ada hubungan/tidak ada kecocokan)
H1: R > 0 (korelasi positif)
Uji 1 arah dengan daerah penolakan H0: z > z
buku ajar statistika nonparametrik 68
c) H0: R = 0 (korelasi 0, tidak ada hubungan /tidak ada kecocokan)
H1: R 0 (ada korelasi/kecocokan, korelasi tidak sama dengan 0)
Uji 2 arah dengan daerah penolakan H0: z < z/2 dan z > z/2
Peringkat diberikan tergantung pada kategori penilaian. Jika ada item
yang dinilai berperingkat sama, maka penetapan peringkat seperti halnya
dalam Mann-Whitney dapat dilakukan (ambil rata-rata peringkatnya!)
Teladan 11 :Dua orang pakar (ahli) diminta memberikan peringkat kinerja pada
10 Bank di Indonesia. Peringkat diberikan mulai dari bank terbaik
(peringkat 1) sedang yang terburuk diberi peringkat 10. Hasilnya disajikan
dalam tabel berikut ini.
Tabel Hasil peringkat 10 bank oleh 2 pakar
Dengan taraf nyata 5% ujilah apakah ada korelasi antara peringkat yang
diberikan kedua pakar?
buku ajar statistika nonparametrik 69
Jawab:
1. H0: R = 0 H1: R 0
2. Statistik Uji: z
3. Arah pengjian: 2 Arah
4. Taraf nyata pengujian = = 5% /2 = 2,5% = 0,025
5. Daerah Penolakan H0:
6. Statistik uji:
RS = 1 16
21
2
nn
dn
ii
= 1 11010556
2
= 1 990
330= 1 0,33 = 0,67
z = RS ( 1n ) = 0,67 ( 110 ) = 0,67 9 = 2,01
7. Kesimpulan:
z hitung = 2,01 ada di daerah penolakan H0, sehingga H0 ditolak H1
diterima. Jadi, ada korelasi/asosiasi pemberian peringkat oleh kedua
pakar.
buku ajar statistika nonparametrik 70
Soal Latihan :
Seorang manajer perusahaan ingin mengetahui apakah terdapat
hubungan antara Motivasi Kerja dengan Prestasi Kerja karyawan di
perusahaan yang ia pimpin. Untuk itu diambilah 12 pekerja untuk dijadikan
sampel penelitian. Data yang diperoleh dapat dilihat pada tabel di bawah
ini.
Pekerja Motivasi Kerja Prestasi Kerja
1 75 71
2 83 88
3 75 77
4 68 70
5 63 73
6 62 67
7 80 80
8 72 83
9 75 88
10 77 79
11 69 75
12 81 85
Hitunglah koefisien korelasi Rank Spearman antara motivasi kerja
dan prestasi kerja, alpha 5%.
buku ajar statistika nonparametrik 71
10. Uji Konkordansi Kendall
Adalah pengujian sampel berpasangan ganda (multiple-paired
samples). Orang yang memberi peringkat lebih dari 2. Statistik Uji yang
digunakan : 2 (chi kuadrat) dengan derajat bebas (db) = n1
Notasi yang digunakan:
n = banyak pasangan data, n 8
R = jumlah peringkat
k = banyaknya orang yang memberi peringkat (k >2)
Statistik uji = 2 =
11312 22
nkn
nknR
Teladan 12 :
Tiga konsultan Teknologi Informasi (TI) diminta memberi peringkat
pada 8 merk laptop. Dengan taraf nyata 5% ujilah apakah terdapat
kecocokan peringkat ?
Tabel Peringkat 8 merk laptop oleh 3 pakar TI
buku ajar statistika nonparametrik 72
Jawab:
1. H0: RKendall = 0 (tidak ada korelasi/tidak ada kecocokan)
H1: RKendall 0 (ada korelasi/ada kecocokan)
2. Statistik uji: 2
3. Taraf nyata pengujian = = 5% = 0,05
4. db = n 1 = 8 1 = 7 2tabel(db; ) = 14,06713
5. Daerah penolakan H0 jika 2 > 2tabel(db; ) 2 > 14,06713
6. Statistik uji:
2 =
11312 22
nkn
nknR
=
183318383172812 2
= 15
7. Kesimpulan:
2 hitung = 15 ada di daerah penolakan H0, maka H0 ditolak dan H1
diterima, artinya ada kecocokan peringkat.
buku ajar statistika nonparametrik 73
11. Uji Korelasi Rank Kendall ()
Merupakan ukuran kadar asosiasi/relasi/hubungan antara dua
variabel yang didasarkan atas ranking dan data berskala ordinal.
Prosedur Perhitungan dan Pengujian:
1. Berikan ranking pada variabel X dan Y, jika ada ranking kembar buat
rata-ratanya.
2. Urutkan ranking X dari terkecil hingga terbesar (1, 2, .., n)
3. Tentukan harga S berdasarkan ranking Y yang telah disusun
mengikuti X. Amati ranking Y mulai dari yang paling kecil menurut
X, hingga yang terbesar menurut X. Kemudian beri nilai +1 untuk
setiap harga yang lebih tinggi berdasarkan susunan ranking X dan
1 untuk setiap harga yang lebih rendah.
4. Hitung koefisien korelasi kendall, digunakan rumus.
S = -------------- N (N 1)
Teladan 13 :
Manajer Personalia PT. Duta Makmur ingin mengetahui apakah
terdapat hubungan yang signifikan dan erat antara Nilai Test masuk
seorang karyawan dengan Motivasi kerja, Prestasi kerja dan jumlah
Absensi selama sebulan kerja. Untuk itu diambil 11 orang pekerja untuk
dijadikan sampel penelitian, yang kemudian dinilai motivasi dan prestasi
buku ajar statistika nonparametrik 74
kerja serta dicatat ketidakhadirannya (absen) selama sebulan kerja. Data
yang diperoleh dapat dilihat pada tabel dibawah ini.
Pekerja NilaiTest Prestasi Kerja Motivasi Kerja Absen1 78 79 84 32 77 75 88 23 75 69 84 24 79 81 82 35 82 83 70 16 85 88 59 17 86 90 59 18 70 74 64 49 80 84 68 2
10 69 71 91 411 67 70 59 4
Hasil olahan dengan menggunakan program SPSS
Correlations
1.000 .855**. .000
11 11.855** 1.000.000 .
11 11
Correlation CoefficientSig. (2-tailed)NCorrelation CoefficientSig. (2-tailed)N
NilaiTest
Prestasi
Kendall's tau_bNilaiTest Prestasi
Correlation is significant at the 0.01 level (2-tailed).**.
Berdasarkan output di atas diketahui bahwa N atau jumlah data
penelitian adalah 11, kemudian nilai sig. (2-tailed) adalah 0,000 < 0,05
maka dapat disimpulkan bahwa ada hubungan yang signifikan antara nilai
test dengan prestasi kerja. Selanjutnya, dari output di atas diketahui
Correlation Coefficient (koefisien korelasi) sebesar 0,855 maka nilai ini
menandakan hubungan yang tinggi antara nilai test dengan prestasi kerja.
buku ajar statistika nonparametrik 75
Soal Latihan :
Manajer Personalia PT. Duta Makmur ingin mengetahui apakah
terdapat hubungan yang signifikan dan erat antara Nilai Test masuk
seorang karyawan dengan Motivasi kerja, Prestasi kerja dan jumlah
Absensi selama sebulan kerja. Untuk itu diambil 11 orang pekerja untuk
dijadikan sampel penelitian, yang kemudian dinilai motivasi dan prestasi
kerja serta dicatat ketidakhadirannya (absen) selama sebulan kerja. Data
yang diperoleh dapat dilihat pada tabel dibawah ini.
Pekerja NilaiTest Prestasi Kerja Motivasi Kerja Absen1 73 77 81 32 77 75 88 23 75 69 84 24 79 81 82 35 82 83 70 16 85 88 59 17 86 90 59 18 72 74 64 49 80 84 68 2
10 69 71 91 411 67 71 69 4
buku ajar statistika nonparametrik 76
12. Uji Asosiatif (Uji Koefisien Kontingensi)
Analisis koefisien kontingensi digunakan untuk menganalisis data
penelitian yang mempunyai karakteristik:
a. Hipotesis yang diajukan hipotesis asosiatif/menganalisis hubungan dua
variabel yang berskala nominal
b. Data berskala nominal
Rumus X2 :
Lalu cari C (koefisien kontingensi) dan C max nya untuk melihat derajat
keeratan hubungan yang terjadi :
mm
Cmaks1
Makin dekat Nilai C dengan Cmaks makin besar derajat hubungan antar
variabel. Kemudian lakukan uji signifikansi berdasarkan nilai X2 dengan df
(db) = (baris-1) (kolom-1).
Teladan 14 :
Ingin diketahui hubungan antara daerah tempat tinggal (urban dan
rural) terhadap kemungkinan beberapa penyakit degeneratif (PJK, ginjal,
ca paru, ca colon). Sampel yang diambil sebanyak 200 orang. Berikut
datanya dalam bentuk tabel 2x2 (tabel kontingensi).
m harga minimumantara banyakbaris b danbanyak kolom k
buku ajar statistika nonparametrik 77
Daerah Penyakit Total
PJK Ginjal Ca Paru Ca colon
Fo fe fo fe fo fe fo fe fo fe
Urban 27 24 35 30 33 36 25 30 120 120
Rural 13 16 15 20 27 24 25 20 80 80
Total 40 40 50 50 60 60 50 50 200 200
a. Mencari frekuensi yang diharapkan fe (freq.expected) =
Misal : fe sel pertama (sel urban yang PJK) = 120x40/200 = 24
b. Menghitung nilai X2
= 0,375 + 0,833 + 0,250 + 0,833 + 0,563 + 1,250 + 0,375 + 1,250
= 5,729
c. Masukan ke rumus untuk mencari koefisien kontingensi (C)
Koefisien kontingensi dicari untuk menentukan derajat keeratan
hubugan antara variabel independen dan variabel dependen
buku ajar statistika nonparametrik 78
= ((5,279) / (200 + 5,279)) = 0,16
Masukan ke rumus 3 untuk mencari nilai C max
mm
Cmaks1
= (2-1) /2 = 0,5 = 0,70
Dari point c dan d diperoleh nilai C sebesar 0,16 dan C max = 0,70.
Karena nilai C dan C max cukup jauh, artinya derajat keeratan
hubungan antara variabel independen (daerah tempat tinggal) dengan
variabel dependen (penyakit degeneratif) tidak kuat.
d. Menentukan X2 tabel : df (dk) = (baris-1) (kolom-1) = (2-1) (4-1) =3
Dengan melihat tabel chi square pada df =3 dan = 0,05 diperoleh nilai
X2 tabel = 7,815.
e. Bandingkan X2 hitung dengan X2 tabel
X2 hitung < X2 tabel = 5,279 < 7,815 H0 gagal ditolak (tidak ada
hubungan antara daerah tempat tinggal dengan penyakit degeneratif).
buku ajar statistika nonparametrik 79
13. Uji Cochran (Cochran Test)
Menguji perbedaan proporsi populasi yang hanya memiliki dua
kategori berdasarkan proporsi k (k > 2) sampel berpasangan. Data
berskala nominal dan hanya memiliki dua kategori.
1. Pada setiap jawaban/data yang bersifat dikotomi beri skor 1 dan 0.
2. Buat Tabel Silang k x n ; dimana k adalah kelompok sampel yang
berpasangan dijadikan kolom dan n adalah banyaknya kasus/
sampel dijadikan baris.
3. Cari harga Q dengan memakai rumus:
k k
(k-1) [ k Gj2 ( Gj)2]j=1 j=1
Q = --------------------------------n n
k Li Li2
i=1 i=1
4. Gunakan Tabel Cochran. Tentukan probabilitas (p) yang dikaitkan
dengan harga Q untuk harga db = k-1. Jika nilai Q-hitung > Q
tabel maka Ho tolak; atau jika p < , maka tolak Ho.
Teladan 15 :
Untuk mengetahui selera konsumen di Kota Mataram Manajer
Pemasaran SARI ROTI mengambil sampel 12 orang yang pernah
mengkonsumsi Roti produksi SARI ROTI, yaitu roti sara coklat, rasa
nenas, rasa kacang dan rasa durian. Kepada 12 responden diberi hanya
dua alternatif pendapat yakni Suka atau Tidak Suka terhadap masing-
masing rasa roti tersebut. Data sikap responden sebagai berikut.
buku ajar statistika nonparametrik 80
Konsumen Coklat Nenas Kacang Durian
BUDI Tidak Suka Suka Tidak Suka Tidak SukaBUDIMAN Tidak Suka Tidak Suka Suka SukaBRIAN Tidak Suka Suka Tidak Suka Tidak SukaBAMBANG Tidak Suka Suka Tidak Suka Tidak SukaBADIR Suka Tidak Suka Suka SukaBOB Suka Suka Tidak Suka Tidak SukaBERTHA Suka Suka Tidak Suka SukaBENYAMIN Tidak Suka Tidak Suka Tidak Suka SukaBENNY Suka Suka Suka Tidak SukaBOBBY Tidak Suka Suka Tidak Suka SukaBORIS Suka Suka Suka SukaBASUKI Tidak Suka Suka Tidak Suka Suka
Keterangan : Tidak Suka diberi nilai 0, dan Suka nilai 1
Hasil Output SPSS disajikan pada tampilan berikut.
Frequencies
7 53 98 45 7
CoklatNenasKacangDurian
0 1Value
Test Statistics
124.784 a
3.188
NCochran's QdfAsymp. Sig.
0 is treated as a success.a.
Dari tabel Test Statistics di atas diketahui nilai signifikansi p-value
sebesar 0,188 > 0,05 maka terima hipotesis nol (Ho), artinya sikap
konsumen terhadap keempat rasa roti relative sama, atau tidak ada rasa
roti yang menjadi favorit di antara konsumen. Cara lain, nilai chi-square
(X2) hitung sebesar 4,784 lebih kecil dari chi-square (X2) tabel 5% (4-1)db
= 7,815 maka Ho diterima.
buku ajar statistika nonparametrik 81
DAFTAR PUSTAKA
Agus Widarjono, 2010. Analisis Statistika Multivariat Terapan. PenerbitUPP Sekolah Tinggi Ilmu Manajemen YKPN, Yogyakarta.
Cornelius Trihendradi, 2009. Step by Step SPSS 16 Analisis DataStatistik. Penerbit ANDI Yogyakarta.
Daniel, Wayne W. 1978. Applied Nonparametric Statistics. United Statesof America. PWS-KENT Publishing Company.
Djarwanto, 1985. Statistik Nonparametrik. Penerbit BPFE Yogyakarta.
Imam Ghozali, 2006. Aplikasi Analisis Multivariate dengan Program SPSS.Badan Penerbit Universitas Diponegoro, Semarang.
Saleh, Samsubar. 1985. Statistik Nonparametrik. Yogyakarta. PenerbitBPFE-Yogyakarta.
Siegel, Sidney. 1985. Statistik Nonparametrik untuk Ilmu-Ilmu Sosial.Jakarta. PT Gramedia Pustaka Utama.