Regresi Logistik Menggunakan SPSS

download Regresi Logistik Menggunakan SPSS

of 19

description

Regresi Logistik Menggunakan SPSS

Transcript of Regresi Logistik Menggunakan SPSS

  • 1

    BAB I

    PENDAHULUAN

    Regresi logistik adalah bagian dari analisis regresi yang digunakan ketika

    variabel dependen (respon) merupakan variabel dikotomi. Variabel dikotomi

    biasanya hanya terdiri atas dua nilai, yang mewakili kemunculan atau tidak

    adanya suatu kejadian yang biasanya diberi angka 0 atau 1.

    Tidak seperti regresi linier biasa, regresi logistik tidak mengasumsikan

    hubungan antara variabel independen dan dependen secara linier. Regresi logistik

    merupakan regresi non linier dimana model yang ditentukan akan mengikuti pola

    kurva seperti gambar di bawah ini.

    Gambar 1.1Grafik regresi logistik

    Model yang digunakan pada regresi logistik adalah:

    Log (P / 1 p) = 0 + 1X1 + 2X2 + . + kXk

    Dimana p adalah kemungkinan bahwa Y = 1, dan X1, X2, X3 adalah variabel

    independen, dan b adalah koefisien regresi.

    Regresi logistik akan membentuk variabel prediktor/respon (log (p/(1-p))

    yang merupakan kombinasi linier dari variabel independen. Nilai variabel

    prediktor ini kemudian ditransformasikan menjadi probabilitas dengan fungsi

    logit.

    Regresi logistik juga menghasilkan rasio peluang (odds ratios) terkait dengan nilai

    setiap prediktor. Peluang (odds) dari suatu kejadian diartikan sebagai probabilitas

    hasil yang muncul yang dibagi dengan probabilitas suatu kejadian tidak terjadi.

    Secara umum, rasio peluang (odds ratios) merupakan sekumpulan peluang yang

    dibagi oleh peluang lainnya. Rasio peluang bagi prediktor diartikan sebagai

    jumlah relatif dimana peluang hasil meningkat (rasio peluang > 1) atau turun

    (rasio peluang < 1) ketika nilai variabel prediktor meningkat sebesar 1 unit.

  • 2

    BAB II

    DESKRIPSI KERJA

    Pada praktikum terakhir analisis regresi terapan semester ini mempelajari

    regresi logistik. Berikut merupakan sebuah kasus serta cara mengerjakan

    menggunakan software SPSS.

    A. STUDI KASUS

    Suatu penelitian dilakukan untuk mengetahui seberapa besar peluang

    seseorang dapat diterima bekerja di PT Makmur Jaya. Penelitian dilakukan

    dengan mengambil sampel sebesar 40 orang dan menggunakan analisis regresi

    logistik. Adapun variabel yang diteliti adalah sebagai berikut.

    y (keputusan) = 1 jika diterima dan 0 jika tidak diterima

    x1 = lama pendidikan terakhir (tahun)

    x2 = lama pengalaman kerja (tahun)

    x3 (jenis kelamin) = 1 jika pelamarnya laki-laki dan 0 jika pelamarnya

    perempuan

    Pertanyaan:

    1. Carilah Model logit dan model regresi logistik dari kasus tersebut.

    2. Interpretasikan nilai estimasi (dengan menggunakan nilai odd dari masing-

    masing variabel)

    3. Berapa peluang diterimanya seorang wanita yang ingin melamar pekerjaan

    di PT Makmur Jaya, jika diketahui memiliki lama pendidikan 4 tahun dan

    pengalaman bekerja 1 tahun ?

    Tabel 2.1 Data 40 orang yang melamar pekerjaan

    Pelamar Education (X1) Experience (X2) SEX (X3) HIRED (Y)

    1 6 6 1 1

    2 6 3 1 1

    3 8 3 0 1

    4 8 10 0 1

    5 4 5 1 1

  • 3

    6 6 1 1 1

    7 8 5 1 1

    8 4 10 1 1

    9 6 12 0 1

    10 6 2 0 1

    11 4 0 1 0

    12 4 1 0 0

    13 4 2 1 0

    14 4 4 0 0

    15 6 1 0 0

    16 4 2 1 0

    17 8 5 1 0

    18 4 2 0 0

    19 6 7 0 0

    20 6 4 0 0

    21 8 0 1 0

    22 4 0 0 0

    23 4 1 1 0

    24 4 5 1 0

    25 6 0 1 0

    26 4 9 0 0

    27 8 1 0 0

    28 6 1 1 0

    29 6 6 1 1

    30 6 3 1 1

    31 8 3 0 1

    32 8 10 0 1

    33 4 5 1 1

    34 6 1 1 1

    35 8 5 1 1

  • 4

    36 4 10 1 1

    37 6 12 0 1

    38 6 2 0 1

    39 4 0 1 0

    40 4 10 1 0

    B. DESKRIPSI KERJA

    Dalam melakukan analisis regresi logistik diperlukan langkah-langkah

    sebagai berikut:

    1. Membuka Lembar Kerja SPSS

    Langkah-langkah yang diperlukan dalam menggunakan SPSS adalah

    sebagai berikut :

    a. Klik start

    b. Kemudian klik SPSS pada menu start

    c. Setelah itu, maka muncul lembar kerja SPSS yang siap untuk digunakan

    d. Kemudian klik variable view kemudian ketikkan nama variiabel dengan

    nama Education, Experience, Sex, dan Hired

    Gambar 2.1 Membuat nama variabel

    e. Input data

    Tabel 2.2 Data yang telah diinput

  • 5

    f. Membuat value labeldengan cara klik values pada variabel X3 yang

    bernilai 1 untuk laki-laki dan 0 untuk perempuan dan value label untuk Y

    yang bernilai 1 untuk diterima dan 0 untuk tidak diterima

    Gambar 2.2 Membuat Value label

    2. Melakukan Regresi Logistik

    Langkah-langkah yang diperlukan untuk melakukan analisis regresi

    logistic antaralain:

    a. Klik analyze, pilih regression, kemudian pilih binary logistic

    Gambar 2.3 Pemilihan Menu Analyze

    b. Muncul kotak dialog linear regression, kemudian masukkan variabel

    Hired sebagai variabel dependen dan variabel Education, Experience

    dan Sex sebagai variabel independen. Kemudian milih metode yang

    enter.

  • 6

    Gambar 2.4Kotak Dialog Logistic Regression

    c. Klik categorical, masukkan variabel sex ke kolom categorical

    covariates, pilih first, kemudian klik continue

    Gambar 2.5Kotak Dialog Logistic Regression Categorical

    d. Klik save, beri tanda pada probabilities dan group membership,

    kemudian klik continue

    Gambar 2.6Kotak Dialog Logistic Regression Save

    e. Klik options, beri tanda pada classification plots, hosmer-lemeshow

    goodness of fit, correlations of estimaes dan include constant in model,

    kemudian klik continue

  • 7

    Gambar 2.5Kotak Dialog Logistic Regression Options

    f. Klik Ok

    g. Ketika variabel sexkonstanta tidak signifikan, maka pengujian diulangi

    dari awal kembali dengan tidak mengikutsertakan variabel sex

    kemudian diulangi kembai dengan mengeluarkan konstanta

  • 8

    BAB III

    PEMBAHASAN

    A. MODEL LOGIT DAN PENGUJIAN

    Tabel 3.1 Case Processing Summary

    Tabel 3.2 Dependent Variable Encoding

    Tabel 3.3 Categorical Variables Codings

    Berdasarkan tabel 3.1 dapat diketahui jumlah data yang dianalisis

    sebanyak 40 data (included in Analysis), sedangkan missing cases bernilai nol

    (0) menunjukan tidak ada data yang hilang ketika proses analisis data

    dilakukan. Dilihat dari tabel 3.2 didapt informasi bahwa tebel tersebut

    mengkategorikan variabel dependen menjadi 1 untuk yang diterima dan 0

    untuk yang tidak diterima. Sedangkan tabel 3.2 memberikan informasi bahwa

    variabel sex dikategorikan menjadi dua, yaitu 1 untuk jenis kelamin laki-laki

    dan 0 untuk jenis kelamin perempuan. Selain itu juga dapai diketahui untuk

    jumlah pelamar yang berjenis kelamin laki-laki itu sebanyak 23 dan sisanya 17

    untuk jumlah pelamar dengan jenis kelamin perempuan.

  • 9

    Tabel 3.4Classification Tablea,b

    Output classification table diatas menjelaskan bahwa persentase variabel

    yang diprediksi sebesar 50% adalah baik. Atau dengan kata lain, semua data

    independen yang dianalisis sebesar 50% berpengaruh terhadap nilai variabel

    dependen dengan mengikutsertakan parameter konstanta.

    Cut value yang terdapat dalam output di atas mengindikasikan batas

    peluang setiap kejadian sukses dan gagal. Jika nilai prediksi dalam data

    (PRE_1) lebih dari 0,5 maka pelamar ini sukses atau diterima (ditunjukkan

    dalam variabel PGR_1 dengan nilai 1) dalam data SPSS. Sebaliknya, jika

    nilainya kurang dari 0,5 maka hasilnya tidak sukses atau gagal (ditunjukkan

    dalam variabel PGR_1 dengan nilai 0).

    Berdasarkan output yang ada, untuk mendapatkan model regresi logistik

    yang terbaik maka perlu dilakukan beberapa pengujian antaralain:

    1. Uji Parameter 0

    Tabel 3.5 Variables in The Equation

    Dari tabel 3.5 dapat dilakukan uji hipotesis sebagai berikut:

    a. Hipotesis

    H0 : 0= 0 (model tidak sesuai)

    H1 : 0 0(model sesuai)

    b. Tingkat Signifikasi

    = 5%

    c. Statistik Uji

    P-value = 1,000

    d. Daerah Kritis

    H0 ditolak jika P-value < P-value (1.000) > (0.05)

  • 10

    e. Keputusan

    Gagal tolak H0 (H0 diterima)

    f. Kesimpulan

    Dengan = 5% dapat disimpulkan bahwa model tidak sesuai

    2. Uji Overall

    Tabel 3.6 Omnibus Tests of Model Coefficients

    Dari tabel 3.6 dapat dilakukan uji hipotesis sebagai berikut:

    a. Hipotesis

    H0 : Tidak ada variabel X yang signifikan mempengaruhi variabel Y

    H1 : Minimal ada satu variabel X yang signifikan mempengaruhi variabel

    Y

    b. Tingkat Signifikasi

    = 5%

    c. Statistik Uji

    P-value = 0,002

    d. Daerah Kritis

    H0 ditolak jika P-value < P-value (0.002) < (0.05)

    e. Keputusan

    Tolak H0

    f. Kesimpulan

    Dengan = 5% dapat disimpulkan bahwa minimal ada satu variabel X

    yang signifikan mempengaruhi variabel Y

    Selain menggunakan nilai pada tabel 3.6, uji overall juga dapat

    dilakukan dengan menggunakan nilai Hosmer Lemeshow seperti berikut:

    Tabel 3.7 Hosmer and Lemeshow Test

  • 11

    Dari tabel 3.7 dapat dilakukan uji hipotesis sebagai berikut:

    a. Hipotesis

    H0 : Model telah cukup mampu menjelaskan data (sesuai)

    H1 : Model tidak cukup mampu menjelaskan data

    b. Tingkat Signifikasi

    = 5%

    c. Statistik Uji

    P-value = 0,857

    d. Daerah Kritis

    H0 ditolak jika P-value < P-value (0.857) > (0.05)

    e. Keputusan

    Gagal tolak H0

    f. Kesimpulan

    Dengan = 5% dapat disimpulkan bahwa model regresi logistik yang

    digunakan telah cukup mampu menjelaskan data (sesuai)

    Tabel 3.8 Model Summary

    Berdasarkan tabel 3.8 hasil output pada Cox-Snell R2 danNagelkerke

    R memiliki analogi sama dengan nilai R-squarepada regresi linier,

    menyakatan bahwa sebanyak 40,5% keragaman dapat dijelaskan oleh

    model, sedangkan sisanya (59,5%) dijelaskan oleh faktor (variabel) lain

    diluar model penelitian.

    Tabel 3.9 Classification Tablea

  • 12

    Cut value yang terdapat dalam output di atas mengindikasikan batas

    peluang setiap kejadian sukses dan gagal. Jika nilai prediksi dalam data

    (PRE_1) lebih dari 0,5 maka kejadian ini sukses atau diterima (ditunjukkan

    dalam variabel PGR_1 dengan nilai 1) dalam data SPSS. Sebaliknya, jika

    nilainya kurang dari 0,5 maka hasilnya tidak sukses atau gagal (ditunjukkan

    dalam variabel PGR_1 dengan nilai 0).Dari data tersebut dapat diketahui

    juga bahwa nilai-nilai prediksi dapat memprediksi variabel-variabel dengan

    tingkat kebenaran 75% (lebih besar daripada ketika mengikutsertakan

    konstanta)

    3. Uji Partial

    Tabel 3.10 Variables in The Equation Block 1

    Dari tabel 3.10 dapat dilakukan uji hipotesis sebagai berikut:

    Untuk 1

    a. Hipotesis

    H0 : 1= 0 (Variabel Education tidak signifikan mempengaruhi Y)

    H1 : 1 0 (Variabel Education signifikan mempengaruhi Y)

    b. Tingkat Signifikasi

    = 5%

    c. Statistik Uji

    P-value = 0,021

    d. Daerah Kritis

    H0 ditolak jika P-value < P-value (0.021) < (0.05)

    e. Keputusan

    Tolak H0

  • 13

    f. Kesimpulan

    Dengan = 5% dapat disimpulkan bahwa variabel education signifikan

    mempengaruhi Y

    Untuk 2

    a. Hipotesis

    H0 : 2= 0 (Variabel Experience tidak signifikan mempengaruhi Y)

    H1 : 2 0 (Variabel Experience signifikan mempengaruhi Y)

    b. Tingkat Signifikasi

    = 5%

    c. Statistik Uji

    P-value = 0,011

    d. Daerah Kritis

    H0 ditolak jika P-value < P-value (0.011) < (0.05)

    e. Keputusan

    Tolak H0

    f. Kesimpulan

    Dengan = 5% dapat disimpulkan bahwa variabel experience signifikan

    mempengaruhi Y

    Untuk 3

    a. Hipotesis

    H0 : 2= 0 (Variabel Sex tidak signifikan mempengaruhi Y)

    H1 : 2 0 (Variabel Sex signifikan mempengaruhi Y)

    b. Tingkat Signifikasi

    = 5%

    c. Statistik Uji

    P-value = 0,220

    d. Daerah Kritis

    H0 ditolak jika P-value < P-value (0.220) > (0.05)

    e. Keputusan

    Gagal tolak H0

  • 14

    f. Kesimpulan

    Dengan = 5% dapat disimpulkan bahwa variabel sextidak signifikan

    mempengaruhi Y

    Karena variabel sex tidak signifikan, maka dilakukan pengujian kembali

    dengan output sebagai berikut:

    1. Uji Overall Setelah Variabel Sex Dikeluarkan

    Tabel 3.11 Omnibus Tests of Model Coefficients Tanpa variabel sex

    Dari tabel 3.11 dapat dilakukan uji hipotesis sebagai berikut:

    g. Hipotesis

    H0 : Tidak ada variabel X yang signifikan mempengaruhi variabel Y

    H1 : Minimal ada satu variabel X yang signifikan mempengaruhi variabel

    Y

    h. Tingkat Signifikasi

    = 5%

    i. Statistik Uji

    P-value = 0,002

    j. Daerah Kritis

    H0 ditolak jika P-value < P-value (0.002) < (0.05)

    k. Keputusan

    Tolak H0

    l. Kesimpulan

    Dengan = 5% dapat disimpulkan bahwa minimal ada satu variabel X

    yang signifikan mempengaruhi variabel Y

    Selain menggunakan nilai pada tabel 3.6, uji overall juga dapat

    dilakukan dengan menggunakan nilai Hosmer Lemeshow seperti berikut:

    Tabel 3.12 Hosmer and Lemeshow Test Tanpa Variabel Sex

  • 15

    Dari tabel 3.12 dapat dilakukan uji hipotesis sebagai berikut:

    g. Hipotesis

    H0 : Model telah cukup mampu menjelaskan data (sesuai)

    H1 : Model tidak cukup mampu menjelaskan data

    h. Tingkat Signifikasi

    = 5%

    i. Statistik Uji

    P-value = 0,225

    j. Daerah Kritis

    H0 ditolak jika P-value < P-value (0.225) > (0.05)

    k. Keputusan

    Gagal tolak H0

    l. Kesimpulan

    Dengan = 5% dapat disimpulkan bahwa model regresi logistik yang

    digunakan telah cukup mampu menjelaskan data (sesuai)

    Tabel 3.13 Model SummaryTanpa Variabel Sex

    Berdasarkan tabel 3.13 hasil output pada Cox-Snell R2 danNagelkerke

    R memiliki analogi sama dengan nilai R-squarepada regresi linier,

    menyakatan bahwa sebanyak 36,7% keragaman dapat dijelaskan oleh

    model, sedangkan sisanya (63,3%) dijelaskan oleh faktor (variabel) lain

    diluar model penelitian.

    Tabel 3.14 Classification TableaTanpa Variabel Sex

    Cut value yang terdapat dalam output di atas mengindikasikan batas

    peluang setiap kejadian sukses dan gagal. Jika nilai prediksi dalam data

  • 16

    (PRE_1) lebih dari 0,5 maka kejadian ini sukses atau diterima (ditunjukkan

    dalam variabel PGR_1 dengan nilai 1) dalam data SPSS. Sebaliknya, jika

    nilainya kurang dari 0,5 maka hasilnya tidak sukses atau gagal (ditunjukkan

    dalam variabel PGR_1 dengan nilai 0).Dari data tersebut dapat diketahui

    juga bahwa nilai-nilai prediksi dapat memprediksi variabel-variabel dengan

    tingkat kebenaran 62,5% (lebih besar daripada ketika mengikutsertakan

    konstanta)

    2. Uji Partial

    Tabel 3.15 Variables in The Equation Block 1Tanpa Variabel Sex

    Dari tabel 3.10 dapat dilakukan uji hipotesis sebagai berikut:

    Untuk 0

    a. Hipotesis

    H0 : 0= 0 (konstanta tidak signifikan mempengaruhi Y)

    H1 : 0 0 (konstanta signifikan mempengaruhi Y)

    b. Tingkat Signifikasi

    = 5%

    c. Statistik Uji

    P-value = 0,009

    d. Daerah Kritis

    H0 ditolak jika P-value < P-value (0.009) < (0.05)

    e. Keputusan

    Tolak H0

    f. Kesimpulan

    Dengan = 5% dapat disimpulkan bahwa konstanta signifikan

    mempengaruhi Y

    Untuk 1

    a. Hipotesis

    H0 : 1= 0 (Variabel Education tidak signifikan mempengaruhi Y)

  • 17

    H1 : 1 0 (Variabel Education signifikan mempengaruhi Y)

    b. Tingkat Signifikasi

    = 5%

    c. Statistik Uji

    P-value = 0,029

    d. Daerah Kritis

    H0 ditolak jika P-value < P-value (0.029) < (0.05)

    e. Keputusan

    Tolak H0

    f. Kesimpulan

    Dengan = 5% dapat disimpulkan bahwa variabel education signifikan

    mempengaruhi Y

    Untuk 2

    a. Hipotesis

    H0 : 2= 0 (Variabel Experience tidak signifikan mempengaruhi Y)

    H1 : 2 0 (Variabel Experience signifikan mempengaruhi Y)

    b. Tingkat Signifikasi

    = 5%

    c. Statistik Uji

    P-value = 0,015

    d. Daerah Kritis

    H0 ditolak jika P-value < P-value (0.015) < (0.05)

    e. Keputusan

    Tolak H0

    f. Kesimpulan

    Dengan = 5% dapat disimpulkan bahwa variabel experience signifikan

    mempengaruhi Y

    Setelah dilakukan uji overall dan partial didaptkan model logit sebagai berikut:

    Logit (p) = Ln

    = 4,467 + 0,58 Education + 0,293 Experience

  • 18

    B. INTERPRETASI DAN PELUANG

    Berdasarkan tabel 3.15 dapat diinterpretasikan sebagai berikut:

    1. Kecenderungan pelamar mengalami keberhasilan setelah mencoba

    memasukkan lamaran pekerjaan ke PT Makmur Jaya berhubungan positif

    dengan educations (pendidikan yang ditempuh pelamar). Setiap peningkatan

    educationssebesar satu poin membuat kecenderungan mengalami

    keberhasilan sebesar 0,58 kali.

    2. Kecenderungan pelamar mengalami keberhasilan setelah mencoba

    memasukkan lamaran pekerjaan ke PT Makmur Jaya berhubungan positif

    dengan experience (pendidikan yang ditempuh pelamar). Setiap peningkatan

    experiencesebesar satu poin membuat kecenderungan mengalami

    keberhasilan sebesar 0,293 kali.

    3. Peluang pelamar mengalami keberhasilan diterima bekerja di PT Makmur

    Jaya setelah mencoba memasukkan lamaran pekerjaan adalah

    1 =exp(0 + 1 + 2)

    1 + exp(0 + 1 + 2)=

    0,11 + 1,786 + 1,340

    1 + (0,11 + 1,786 + 1,340)= 0,7639

    4. Peluang pelamar mengalami tidak diterima bekerja di PT Makmur Jaya

    setelah mencoba memasukkan lamaran pekerjaan adalah

    0 = 1 0,7639 = 0,2361

    5. Untuk pengalaman pekerjaan selama 1 tahun dan lamanya menempuh

    pendidikan 4 tahun, maka diperoleh

    Logit (p) = Ln

    = 4,467 + 0,58 Education + 0,293 Experience

    = 4,467 + 0,58 (4) + 0,293 (1)

    = 1,854

  • 19

    BAB IV

    PENUTUP

    Berdasarkan pengujian yang telah dilakukan pada bab tiga diperoleh

    kesimpulan bahwa variabel yang mempengaruhi diterima atau tidaknya seorang

    pelamar oleh PT Makmur Jaya dipengaruhi oleh varibel education dan

    experience.Variabel-variabel yang berpengaruh tersebut hanya mempengaruhi

    variabel Y sebesar 36,7% dan sisanya dipengaruhi variabel lain diluar model.

    Peluang seseorang diterima bekerja di PT Makmur Jaya yaitu sebesar 0,7639 dan

    peluang tidak tidak diterima seseorang di PT Makmur Jaya yaitu sebesar 0,2361.