Regresi Dengan Variabel Dummy
-
Upload
eurekadwira -
Category
Documents
-
view
275 -
download
0
Transcript of Regresi Dengan Variabel Dummy
-
8/10/2019 Regresi Dengan Variabel Dummy
1/8
REGRESI DENGAN VARIABEL DUMMY
Sifat Variabel Dummy
Tidak selamanya variabel independen itu bersifat bilangan atau kuantitatif
(seperti pendapatan, biaya, harga, bobot, suhu). Ada kalanya variabel independen itu
bersifat kualitatif (seperti jenis kelamin, ras, warna, agama, kebangsaan, ukuran afiliasi
partai politik, dan status perkawinan). Nah variabel kualitatif inilah yang sering
disebut sebagai variabel buatan/ variabel dummy/ variabel boneka ( dummy variable ).
Variabel ini juga punya istilah lain seperti variabel indikator, variabel biner, variabel
kategori, dan variabel dikotomi. Variabel kualitatif seperti itu biasanya menunjukkanada tidaknya kualitas suatu atribut, seperti laki -laki dan perempuan, hitam atau
putih, Muslim atau non-Muslim, WNI atau non-WNI . Salah satu metode kuantifikasi
atribut-atribut ini adalah dengan membentuk variabel-variabel artifisial yang
memperhitungkan nilai-nilai 0 atau 1, 0 menunjukkan ketiadaan sebuah atribut dan 1
menunjukkan keberadaan (atau kepemilikan) atribut itu. Misalnya, 1 mungkin
menunjukkan bahwa seseorang adalah wanita dan 0 mungkin menunjukkan pria,atau 1 mungkin menunjukkan bahwa seseorang adalah lulusan perguruan tinggi dan
0 menunjukkan orang itu bukan lulusan perguruan tinggi, atau 1 misal menunjukkan
keanggotaan PKS dan 0 menunjukkan keanggotaan partai Demokrat. Nah variabel
yang mengasumsikan nilai seperti 0 dan 1 ini disebut sebagai variabel buatan
(dummy variable ). Disini kita melambangkan variabel dummy dengan simbol D
bukan X untuk menekankan bahwa kita berhadapan dengan variabel kualitatif.
Dalam prakteknya, model regresi mungkin hanya meliputi variabel penjelas
dummy. Model regresi yang hanya berisikan variabel penjelas dummy itu disebut
dengan model analisis varians (ANOVA). Perhatikan contoh model ANOVA berikut:
(1)
Dimana Y = pengeluaran makanan tahunan ($)
Di = 1 jika wanita
= 0 jika pria
-
8/10/2019 Regresi Dengan Variabel Dummy
2/8
Dengan mengasumsikan bahwa gangguan u i dalam model diatas memenuhi
asumsi lazim model regresi linear klasik (CLRM, classical linear regression model ), dari
model diatas kita mendapat hal berikut ini:
Makanan rata-rata pria:
( ) ( ) (2)
Makanan rata-rata wanita:
( ) ( ) (3)
Uji H0 bahwa tidak ada perbedaan dalam pengeluaran makanan rata-rata
kedua jenis kelamin ini (yakni ) bisa dengan mudah dilakukan dengan
melakukan regresi (pada model diatas sekali) melalui cara kuadrat terkecil biasa yanglazim (OLS) dan menemukan ada tidaknya signifikansi statistik b 2 dengan dasar tes t.
Contoh case: Pengeluaran makanan tahunan konsumen pria dan wanita lajang
Tabel dibawah ini menunjukkan data pengeluaran makanan tahunan ($) dan
pendapatan setelah pajak tahunan ($) untuk pria dan wanita pada tahun 2000 hingga
2001. Variabel dummy menggunakan nilai 1 untuk wanita dan 0 untuk pria.
Usia
Pengeluaran
makanan, wanita
($)
Pendapatan setelah
pajak, wanita ($)
Pengeluaran
makanan, pria ($)
Pendapatan
setelah pajak, pria
($)
< 25 1983 11557 2230 11589
25-34 2987 29387 3757 33328
35-44 2993 31463 3821 36151
45-54 3156 29554 3291 35448
55-64 2706 25137 3429 3298865> 2217 14952 2533 20437
*Note: data pengeluaran makanan dan pendapatan setelah pajak adalah rata-rata
berdasarkan pada jumlah aktual orang dalam berbagai kelompok usia. Angka
aktualnya mencapai ribuan.
Dengan meregresikan pengeluaran makanan pada variabel dummy jenis
kelamin, diperoleh hasil sebagai berikut:
-
8/10/2019 Regresi Dengan Variabel Dummy
3/8
( ) ( )
( )( ) (4)
Dimana Y = pengeluaran makanan ($) dan D = 1 jika wanita, 0 jika pria.Seperti ditunjukkan dalm hasil ini, bahwa pengeluaran makanan rata-rata
untuk pria adalah $3,177 dan untuk wanita adalah (3176,833-503,1667) = 2673,
6663 atau sektar $2.674. tapi ang menarik dicatat adalah bahwa perkiraan D i tidak
signifikan secara statistik, karena nilai t nya hanya sekitar -1,52 dan niali p-nya sekitar
15%. Ini berarti bahwa meskipun nilai angka pengeluaran makanan pria dan wanita
berbeda, secara statistik tidak ada perbedaan signifikan antara kedua angka ini.Dalam contoh ini, variabel dummy jenis kelamin memiliki 2 kategori. Kita
memberikan nilai 1 untuk konsumen wanita dan 0 untuk konsumen pria. Nilai titik
potong dalam penetapan seperti itu mewakili nilai mean kategori yang mendapatkan
nilai 0 atau pria dalam kasus ini. karena itu kita bisa sebut kategori yang mendapat
nilai 0 sebagai kategori dasar atau referensi atau benchmark atau perbandingan .
Untuk menghitung mean pengeluaran makanan untuk wanita, kita harus menambah
nilai koefisien variable dummy pada nilai titik potong, yang menunjukkan
pengeluaran makanan untuk wanita, seperti ditunjukkan sebelumnya.
Model ANOVA seperti model persamaan regresi sebelumnya, meskipun lazim
dalam bidang-bidang seperti sosiologi, psikologi, pendidikan, dan riset pasar, tidak
lazim dalam ilmu ekonomi. Dalam sebagian besar riset ekonomi, model regresi
mengandung beberapa variable bebas yang bersifat kuantitatif dan beberapa
kualitatif, model regresi yang mengandung kombinasi variabel kuantitatif dan
kualitatif disebut dengan model analisis kovarians (ANCOVA). Model ANCOVA
merupakan perluasan dari model ANOVA dalam hal penyediaan metode kontrol
secara statistik atas efek-efek variabel bebas kuantitatif, yang disebut dengan
variabel kovariat atau variabel kontrol, dalam sebuah model yang meliputi baik
variabel penjelas kuantitatif maupun kualitatif atau dummy.
-
8/10/2019 Regresi Dengan Variabel Dummy
4/8
Model ANCOVA: Regresi pada Satu Variabel Kuantitatif dan Satu Variabel
Kualitatif Dengan Dua Kategori: Tinjauan Ulang Atas Contoh Sebelumnya
Model ANCOVA:
(5)
Y= pengeluaran makanan ($), X= pendapatan setelah pajak ($), dan D=1 untuk
wanita dan 0 untuk pria. Dengan menggunakan data sebelumnya, hasil yang
diperoleh:
( ) ( )( )
( )( )(9,6417)( ) ( ) ( )
(6)
*menunjukkan nilai-niali yang sangat kecil.
Hasil-hasil ini patut diperhatikan karena beberapa alasan. Pertama, dalam
persamaan sebelumnya koefisien dummy tidak signifikan secara statistik, tapi
sekarang justru signifikan. Mengapa? Mungkin dalam menaksir persamaan itu kita
melakukan kesalahan spesifikasi karena kita mengeluarkan suatu kovariat, variabel
pendapatan setelah pajak, yang menurut teori diharapkan memiliki pengaruh
penting atas pengeluaran konsumsi. Kedua, karena persamaan sebelumnya
merupakan regresi berganda, sekarang bisa kita katakan bahwa dengan
menganggap pendapatan setelah pajak konstan, mean pengeluaran makanan pria
adalah sekitar $1506, dan untuk wanita adalah sekitar $1.277, dan rata-rata ini
berbeda signifikan secara statistik. Ketiga, dengan menganggap perbedaan jenis
kelamin konstan, koefisien pendapatan 0,0579 berarti bahwa mean pengeluaran
makanan naik sekitar 6 sen untuk setiap dolar tambahan pendapatan setelah pajak.
Dengan kata lain, kecenderungan marjinal mengkonsumsi makanan-pengeluaran
makanan tambahan tiap satu dolar tambahan pendapatan siap konsumsi adalah
sekitar 6 sen. Nah sekarang kita bisa menurunkan regresi berikut ini dari persamaan
(6) untuk kedua kelompok itu sebagai berikut:
-
8/10/2019 Regresi Dengan Variabel Dummy
5/8
Regresi mean pengeluaran makanan wanita:
(7)
(8)
Kedua garis regresi ini berbeda titik potongnya, tapi kemiringannya sama. Dengan
kata lain, kedua garis regresi ini sejajar.
Regresi Terhadap Satu Variabel Kuantitatif dan Satu Variabel Kualitatif dengan
Lebih Dari Dua Kelas atau Kategori
Teknik variabel dummy sangat mampu menangani model-model dimana
suatu variabel kualitatif bisa memiliki lebih dari dua kategori. Kita ambil contoh datatentang gaji rata-rata guru sekolah negeri dan belanja pemerintah per siswa
(halaman 9 di buku Gujarati), keduanya diukur dalam dolar, untuk 50 negara bagian
dan distrik kolumbia pada tahun 1951. Kita akan mencari tau apakah ada perbedaan
gaji yang signifikan secara statistik dalam 51 wilayah yang dimasukkan kedalam
analisis ini. untuk tujuan ini, anggap kita membagi berbagai negara bagian dan
Washington DC kedalam 3 wilayah: (1) Northeast dan North Central (total 21 negarabagian), (2) South (17 negara bagian), dan West (13 negara bagian). Variabel
kualitatif disini adalah wilayah yang memiliki 3 kategori yang kita paparkan diatas.
Perhatikan model berikut:
(9)
Dimana: AAS = gaji tahunan rata-rata guru sekolah negeri
D2 = 1 jika negara bagian tersebut berada di wilayah Northeast atau North
Central, dan 0 jika sebaliknya
D3 = 1 jika negara bagian itu ada di wilayah South, dan 0 jika sebaliknya
Karena variabel kualitatif wilayah memiliki tiga kelas, kita hanya akan menetapkan
dua dummy. Disini kita memperlakukan West sebagai kategori dasar atau acuan.
*Note : Pay = gaji tahunan rata-rata guru sekolah negeri
-
8/10/2019 Regresi Dengan Variabel Dummy
6/8
PPS = belanja per siswa oleh otoritas publik
Wilayah: 1 = wilayah Northeast dan North Central
2 = South
3 = West
Dummy D2 = 1 = wilayah Northeast dan North Central
0 = wilayah lain
D3 = 1 = South
= 0 = wilayah lain
Dari model (9) kita peroleh mean fungsi gaji dalam ketiga wilayah sbb:
Mean gaji guru sekolah negeri di wilayah Northeast dan North Central :( ) (10)
Mean gaji sekolah negeri di South:
( ) (11)
Mean gaji sekolah negeri di West:
( ) (12)
Ingat bahwa West sebagai wilayah acuan. So, semua perbandingan gaji
dikaitkan dengan West. Jadi artinya setelah kita melangkah melebihi klasifikasi
dikotomi sederhana (perempuan atau laki-laki, dll), kita harus berhati-hati ketika
menspesifikasi kategori mana yang menjadi dasar, karena semua perbandingan ini
terkait dengan kategori dasar atau acuan yang dipilih itu. Mengubah kategori dasar
akan mengubah perbandingan. Akan tetapi, hal itu tidak akan mengubah substansi
hasil regresi. Kita bisa menaksir model (9) dengan segala kategori sebagai kategori
dasarnya. Hasil regresi model (9) sbb:
( ) ( ) (-2,1776)
( ) ( ) ( )
(13)
*signifikan secara statistik pada tingkat 5%
-
8/10/2019 Regresi Dengan Variabel Dummy
7/8
**tidak signifikan secara statistik pada tingkat 5%
Regresi Atas Satu Variabel Bebas Kuantitatif dan Lebih Dari Satu Variabel
Kualitatif
Perhatikan model berikut:
(14)
Dimana Y = upah per jam dalam dolar
X = pendidikan (tahun belajar)
D2 = 1 jika wanita, 0 jika pria
D3 = 1 jika nonputih dan non-Hispanik, 0 jika lainnyaDalam model ini, jenis kelamin dan ras merupakan variabel-variabel bebas kualitatif
dan pendidikan merupakan variabel bebas kuantitatif. Untuk menaksir model
sebelumnya, diperoleh data dari 528 individu , yang memberikan hasil sbb:
( ) ( ) ( ) ( )
(15)
*menunjukkan nilai p lebih kecil daripada 5%
**menunjukkan nilai p lebih besar daripada 5%
Penafsiran hasil tersebut: Pertama, apakah kategori dasar yang kita gunakan
disini, mengingat kita sekarang memiliki 2 variabel kualitatif? Jawabannya adalah pria
putih dan atau Hispanik. Kedua, dengan menganggap tingkat pendidikan dan ras
konstan, secara rata-rata, wanita mendapatkan penghasilan lebih kecil daripada pria
sebesar $2,36 per jam. Demikian pula, dengan menganggap tingkat pendidikan dan
jenis kelamin konstan, secara rata-rata, nonputih/non-Hispanik mendapatkan
penghasilan lebih rendah daripada kategori dasar sekitar $1,73 per jam. Ketiga,
dengan menganggap jenis kelamin dan ras konstan, mean upah per jam naik sekitar
80% per jam untuk tiap tahun tambahan pendidikan.
Efek Interaksi
-
8/10/2019 Regresi Dengan Variabel Dummy
8/8
Meski hasil yang ditampilkan pada persamaan (15) masuk akal, ada asumsi
yang tersirat dalam model (14) bahwa efek diferensial variabel dummy jenis kelamin
D2 adalah konstan di seluruh kedua kategori ras tersebut, kemudian efek diferensial
variabel dummy ras D 3 juga konstan di kedua jenis kelamin. Itu artinya, jika upah per
jam rata-rata lebih tinggi untuk pria daripada wanita, maka hal itu akan berlaku pula
baik untuk mereka yang nonputih /nonhispanik maupun bukan. Demikian pula, jika
katakanlah nonputih/nonhispanik menghasilkan upah rata-rata yang lebih rendah,
hal yang sama juga berlaku tanpa memperhatikan jenis kelamin. Seorang wanita
nonputih/nonhispanik mungkin menghasilkan upah yang lebih rendah daripada pria
nonputih/nonhispanik. Dengan kata lain, mungkin ada interaksi antara variabelkualitatif, D2 dan D 3. Oleh sebab itu, efeknya atas rata-rata Y mungkn tidak hanya
aditif, seperti model (14), tapi mungkin juga multiplikatif, seperti dalam model
berikut:
( ) (16)
Variabel dummy , perkalian kedua variabel dummy ini, disebut dengan
variabel dummy interaksi , karena menunjukkan efek dua variabel kualitatifsekaligus, atau simultan.