Analisis Diskriminan Dan Regresi Logik

download Analisis Diskriminan Dan Regresi Logik

of 18

Transcript of Analisis Diskriminan Dan Regresi Logik

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    1/18

    1

    ANALISIS DISKRIMINAN

    Dalam mencoba untuk memilih teknik analisis yang tepat, kadang-kadang kita

    menghadapi masalah yang melibatkan kategori variabel dependen dan beberapa variabel

    independen metrik. Sebagai contoh, kita mungkin ingin membedakan yang baik dari risiko kredit

    macet. Jika kita memiliki ukuran metrik risiko kredit, maka kita bisa menggunakan regresi

    berganda. Dalam banyak kasus kita tidak memiliki ukuran metrik yang diperlukan untuk regresi

    berganda. Sebaliknya, kita hanya bisa memastikan apakah seseorang dalam kelompok tertentu

    (misalnya, baik atau risiko kredit yang buruk).

    Analisis diskriminan adalah teknik statistik yang tepat ketika variabel dependen adalah

    kategoris (nominal atau nonmetric) variabel dan variabel independen adalah variabel metrik.

    Dalam banyak kasus, variabel dependen terdiri dari dua kelompok atau klasifikasi, misalnya,

    jantan dan betina atau tinggi rendah dibandingkan. Dalam kasus lain, lebih dari dua kelompok

    yang terlibat, seperti rendah, sedang, dan klasifikasi tinggi. Analisis diskriminan mampu

    menangani baik dua kelompok atau beberapa (tiga atau lebih) kelompok. Ketika dua klasifikasi

    yang terlibat, teknik ini disebut sebagai dua kelompok analisis diskriminan. Ketika tiga atau

    lebih klasifikasi diidentifikasi, teknik ini disebut sebagai analisis diskriminan berganda.

    Analisis diskriminan melibatkan berasal suatu variate. Diskriminan variate adalah

    kombinasi linear dari dua (atau lebih) variabel independen yang akan membedakan terbaik antara

    obyek (orang, perusahaan, dll) dalam kelompok didefinisikan a priori. Diskriminasi dicapai

    dengan menghitung bobot variate untuk masing-masing variabel independen untuk

    memaksimalkan perbedaan antara kelompok (yaitu, antara kelompok varians relatif terhadap

    varians dalam kelompok). Variate untuk analisis diskriminan, juga dikenal sebagai fungsi

    diskriminan, berasal dari sebuah persamaan seperti yang terlihat pada regresi berganda.

    Seperti dengan variate dalam regresi atau teknik multivariat lain kita melihat skor

    diskriminan untuk setiap objek dalam analisis (orang, perusahaan, dll) menjadi penjumlahan nilai

    yang diperoleh dengan mengalikan masing-masing variabel independen berat diskriminannya.

    Apa yang unik tentang analisis diskriminan adalah bahwa lebih dari satu fungsi diskriminan

    mungkin ada, sehingga setiap objek mungkin memiliki lebih dari satu skor diskriminan. Kami

    akan membahas apa yang menentukan jumlah fungsi diskriminan kemudian, tetapi di sini kita

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    2/18

    2

    melihat bahwa analisis diskriminan memiliki kesamaan dan elemen yang unik bila dibandingkan

    dengan teknik multivariat lainnya.

    Analisis Diskriminan adalah salah satu tehnik analisa statistika dependensi yang memiliki

    kegunaan untuk mengklasifikasikan objek beberapa kelompok. Pengelompokan dengan analisis

    diskriminan ini terjadi karena ada pengaruh satu atau lebih variabel lain yang merupakan

    variabel independen. Kombinasi linier dari variabel-variabel ini akan membentuk suatu fungsi

    diskriminan. Analisis diskriminan adalah teknik multivariate yang termasukdependencemethod,

    yakni adanya variabel dependen dan variabel independen. Dengan demikian ada variabel yang

    hasilnya tergantung dari data variabel independen.

    Analisis diskriminan mirip regresi linier berganda (multivariable regression).

    Perbedaannya analisis diskriminan digunakan apabila variabel dependennya kategoris

    (maksudnya kalau menggunakan skala ordinal maupun nominal) dan variabel independennya

    menggunakan skala metric (interval dan rasio). Sedangkan dalam regresi berganda variabel

    dependennya harus metric dan jika variabelnya independen, bias metric maupun nonmetrik.

    Dengan rata-rata skor diskriminan untuk semua individu dalam suatu kelompok tertentu, kita

    berarti sampai pada kelompok. Ini berarti kelompok disebut sebagai suatu centroid. Ketika

    analisis melibatkan dua kelompok, ada dua centroid, dengan tiga kelompok, ada tiga centroid,

    dan sebagainya. Para centroid menunjukkan lokasi yang paling khas dari setiap anggota dari

    kelompok tertentu, dan perbandingan kelompok centroid menunjukkan seberapa jauh kelompok

    yang ada dalam hal fungsi diskriminan.

    Analogi Dengan Regresi Dan MANOVA

    Penerapan dan interpretasi dari analisis diskriminan adalah sama seperti dalam analisis

    regresi. Artinya, fungsi diskriminan merupakan kombinasi linear (variate) pengukuran metrik

    untuk dua atau lebih variabel independen dan digunakan untuk menggambarkan atau

    memprediksi variabel dependen tunggal. Perbedaan utama adalah bahwa analisis diskriminan

    cocok untuk masalah penelitian di mana variabel dependen adalah kategoris (nominal atau

    nonmetric), sedangkan regresi digunakan ketika variabel dependen adalah metrik. Seperti telah

    dibahas sebelumnya, regresi logistik adalah varian dari regresi dengan banyak kesamaan kecuali

    untuk jenis variabel dependen.

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    3/18

    3

    Contoh Hipotesis Analisis Diskriminan

    Analisis diskriminan berlaku untuk setiap pertanyaan penelitian dengan tujuan

    keanggotaan yaitu pemahaman kelompok, apakah kelompok terdiri dari individu (misalnya,

    pelanggan dibandingkan bukan konsumen), perusahaan (misalnya, menguntungkan

    dibandingkan tidak menguntungkan), produk (misalnya, sukses dibandingkan tidak sukses), atau

    objek lainnya yang dapat dievaluasi pada serangkaian variabel independen. Untuk

    menggambarkan dasar analisis diskriminan, kami memeriksa pengaturan dua penelitian, yang

    melibatkan dua kelompok (pembeli dibandingkan nonpurchasers) dan tiga kelompok lainnya

    (tingkat beralih perilaku). Regresi logistik beroperasi dengan cara yang cukup sebanding dengan

    analisis diskriminan untuk dua kelompok.

    Mengidentifikasi Variabel Diskriminasi

    Untuk mengidentifikasi variabel yang mungkin berguna dalam membedakan antara

    kelompok (yaitu, pembeli dibandingkan nonpurchasers), penekanan ditempatkan pada perbedaan

    kelompok dan bukan ukuran korelasi yang digunakan dalam regresi berganda.

    Menghitung Fungsi Diskriminan

    Dengan tiga variabel pembeda potensial diidentifikasi, perhatian bergeser menuju

    penyelidikan yang kemungkinan menggunakan variabel diskriminasi dalam kombinasi untuk

    memperbaiki kekuatan diskriminatif dari setiap variabel individu. Untuk tujuan ini, sebuah

    variate dapat dibentuk dengan dua atau lebih variabel diskriminatif untuk bertindak bersama-

    sama dalam membedakan antara kelompok.

    Mengidentifikasi Variabel Diskriminasi

    Dengan tiga kategori variabel dependen, analisis diskriminan dapat memperkirakan

    fungsi diskriminan dua, masing-masing mewakili dimensi yang berbeda dari diskriminasi.

    Menghitung Dua Fungsi Diskriminan

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    4/18

    4

    Dengan variabel diskriminatif potensial diidentifikasi, langkah berikutnya adalah untuk

    menggabungkan mereka ke dalam fungsi diskriminan yang akan memanfaatkan kekuatan

    gabungan dalam membedakan mereka antara kelompok.Dengan dua fungsi, sekarang kita dapat

    menghitung skor diskriminan dua untuk masing-masing responden. Selain itu, dua fungsi

    diskriminan memberikan dimensi diskriminasi.

    Tujuan Analisis Diskriminan

    Oleh karena bentuk multivariate dari analisis diskriminan adalah dependence, maka variabel

    dependen adalah variabel yang menjadi dasar analisis diskriminan. Variabel dependen bisa

    berupa kode grup 1 atau grup 2 atau lainnya, dengan tujuan diskriminan secara umum adalah :

    1. Untuk mengetahui apakah ada perbedaan yang jelas antar grup pada variabel dependen.

    2. Jika ada perbedaan, kita ingin mengetahui variabel independen mana pada fungsi

    diskriminan yang membuat perbedaan tersebut.

    3. Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan persamaan

    regresi.

    4. Melakukan klasifikasi terhadap objek (dalam terminology SPSS disebut baris), apakah suatu objek

    (bisa nama orang, nama tumbuhan, benda atau lainnya) termasuk pada grup 1 atau grup 2 atau

    lainnya.

    Proses Keputusan Untuk Analisis DiskriminanSeperti dengan semua aplikasi multivariat, menetapkan tujuan adalah langkah pertama

    dalam analisis. Kemudian peneliti harus mengatasi masalah desain yang spesifik dan pastikan

    asumsi yang mendasari terpenuhi. Hasil analisis dengan derivasi dari fungsi diskriminan dan

    penentuan apakah fungsi yang signifikan secara statistik dapat diturunkan untuk memisahkan

    dua (atau lebih) kelompok. Hasil diskriminan kemudian dinilai untuk akurasi prediksi dengan

    mengembangkan matriks klasifikasi. Selanjutnya, interpretasi fungsi diskriminan menentukan

    mana dari variabel independen memberikan kontribusi yang paling membedakan antara

    kelompok. Akhirnya, fungsi diskriminan harus divalidasi dengan sampel ketidaksepakatan.

    Tahap 1: Tujuan Analisis Diskriminan

    Sebuah tinjauan dari tujuan untuk menerapkan analisis diskriminan lanjut harus menjelaskan

    sifatnya. Analisis diskriminan dapat mengatasi salah satu tujuan penelitian berikut:

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    5/18

    5

    1. Menentukan apakah perbedaan signifikan secara statistik ada antara profil-rata skor pada

    set variabel untuk dua (atau lebih) priori kelompok yang didefinisikan.

    2. Menentukan mana variabel independen dan untuk perbedaan dalam profil skor rata-rata

    dua atau lebih kelompok.

    3. Menetapkan jumlah dan komposisi dimensi diskriminasi antara kelompok-kelompok

    yang terbentuk dari himpunan variabel independen.

    4. Menetapkan prosedur untuk mengklasifikasikan obyek (individu, perusahaan, produk,

    dll) ke dalam kelompok berdasarkan skor mereka pada satu set variabel independen.

    Sebagaimana yang dicatat, tujuan analisis diskriminan berguna ketika peneliti tertarik

    dalam memahami perbedaan kelompok atau dengan benar mengklasifikasikan objek ke

    dalam kelompok atau kelas. Oleh karena itu, analisis diskriminan dapat dianggap baik jenis

    analisis profil atau teknik prediksi analitiknya.

    Tahap 2: Desain Penelitian Untuk Analisis Diskriminan

    Keberhasilan penerapan analisis diskriminan memerlukan pertimbangan beberapa isu.

    Isu-isu termasuk pemilihan variabel baik dependen dan independen, ukuran sampel yang

    dibutuhkan untuk estimasi fungsi diskriminan, dan pembagian sampel untuk keperluan validasi.

    Memilih Variabel Dependent dan Independen

    Untuk menerapkan analisis diskriminan, peneliti harus terlebih dahulu menentukan

    variabel yang menjadi ukuran independen dan variabel mana yang menjadi ukuran. Variabel

    terikat adalah nonmetrik dan variabel independen adalah metrik.

    Variabel Dependent

    Peneliti harus fokus pada variabel dependen pertama. Jumlah kelompok variabel

    dependen (kategori) bisa dua atau lebih, tetapi kelompok-kelompok harus saling eksklusif dan

    lengkap. Dengan kata lain, setiap pengamatan dapat ditempatkan ke dalam hanya satu kelompok.

    Dalam beberapa kasus, variabel dependen mungkin melibatkan dua kelompok (dikotomis),

    seperti baik versus buruk. Dalam kasus lain, variabel dependen mungkin melibatkan beberapa

    kelompok (multichotomous), seperti pekerjaan dokter, pengacara, atau profesor.

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    6/18

    6

    Berapa Banyak Kategori dalam Variabel Dependent?

    Secara teoritis, analisis diskriminan dapat menangani jumlah yang tidak terbatas kategori

    dalam variabel dependen. Sebagai masalah praktis, bagaimanapun, peneliti harus memilih

    variabel dependen dan jumlah kategori berdasarkan beberapa pertimbangan:

    1. Selain menjadi saling eksklusif dan lengkap, kategori variabel dependen harus berbeda

    dan unik pada set variabel independen yang dipilih. Analisis diskriminan mengasumsikan

    bahwa setiap kelompok harus memiliki profil yang unik pada variabel independen yang

    digunakan dan dengan demikian mengembangkan fungsi diskriminan secara maksimal

    dengan memisahkan kelompok berdasarkan variabel-variabel. Analisis diskriminan,

    bagaimanapun, memiliki sarana akomodatif atau menggabungkan kategori yang tidak

    berbeda pada variabel independen. Jika dua atau lebih kelompok memiliki profil sangat

    mirip, analisis diskriminan tidak akan mampu memliki unik profil masing-masing

    kelompok, sehingga penjelasan dan klasifikasi kelompok secara keseluruhan tidak jelas.

    Dengan demikian, peneliti harus memilih variabel dependen dan kategori untuk

    mencerminkan perbedaan dalam variabel independen. Sebuah contoh akan membantu

    menggambarkan masalah.

    2. Peneliti juga harus berusaha untuk memperbesar jumlah yang kecil daripada besar

    kategori dalam ukuran. Ini mungkin tampak lebih logis untuk memperluas jumlah

    kategori dalam mencari kelompok yang unik lagi, tapi memperluas jumlah kategori

    menyajikan kompleksitas lebih dalam profil dan tugas klasifikasi analisis diskriminan.

    Jika analisis diskriminan dapat memperkirakan sampai dengan NG-1 (jumlah kelompok

    minus satu) fungsi diskriminan, kemudian meningkatkan jumlah kelompok memperluas

    jumlah fungsi diskriminan, meningkatkan kompleksitas dalam mengidentifikasi dimensi

    yang mendasari diskriminasi tercermin oleh masing-masing fungsi diskriminan sebagai

    serta mewakili keseluruhan efek dari setiap variabel independen.

    Konversi Variabel Metrik. Contoh-contoh sebelumnya dari variabel kategori adalah dikotomi

    (atau multichotomies). Dalam beberapa situasi, analisis diskriminan tepat bahkan jika variabel

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    7/18

    7

    dependen tidak nonmetric (kategorikal) variabel. Kami mungkin memiliki variabel dependen

    yang merupakan pengukuran ordinal atau interval yang kita ingin gunakan sebagai kategori

    variabel dependen. Dalam kasus tersebut, kita harus membuat sebuah variabel kategoris, dan dua

    pendekatan yang paling sering digunakan:

    Pendekatan yang paling umum adalah untuk menetapkan kategori menggunakan skala

    metrik. Sebagai contoh, jika kita memiliki variabel yang mengukur jumlah rata-rata

    minuman cola yang dikonsumsi per hari, kita bisa membuat trikotomi buatan (tiga

    kelompok) dengan hanya menunjuk orang-orang yang mengkonsumsi tidak ada, satu,

    atau minuman cola dua per hari sebagai pengguna ringan , mereka yang mengkonsumsi

    tiga, empat, atau lima per hari sebagai pengguna menengah, dan mereka yang

    mengkonsumsi enam, tujuh, delapan, atau lebih sebagai pengguna berat. Prosedur

    tersebut akan membuat variabel kategorikal tiga kelompok di mana tujuan akan

    membedakan antara ringan, sedang, dan pengguna berat cola. Sejumlah kelompok

    kategoris dapat dikembangkan. Paling sering, pendekatan akan melibatkan membuat dua,

    tiga, atau empat kategori. Sejumlah besar kategori bisa dibentuk jika diperlukan.

    Ketika tiga atau lebih kategori yang diciptakan, kemungkinan timbul dari memeriksa

    hanya kelompok ekstrim dalam analisis dua kelompok-diskriminan. Pendekatan ekstrem

    melibatkan dengan membandingkan hanya dua kelompok ekstrim dan tidak termasuk

    kelompok menengah dari analisis diskriminan. Sebagai contoh, peneliti bisa memeriksa

    pengguna ringan dan berat minuman cola dan belum termasuk pengguna menengah.

    Pendekatan ini dapat digunakan setiap saat peneliti ingin meneliti hanya kelompok

    ekstrim. Namun, peneliti juga mungkin ingin mencoba pendekatan ini ketika hasil

    analisis regresi yang tidak sebagus seperti yang diharapkan. Prosedur tersebut dapat

    membantu karena ada kemungkinan bahwa perbedaan kelompok dapat muncul meskipun

    hasil regresi miskin. Artinya, pendekatan ekstrem dengan analisis diskriminan dapat

    mengungkapkan perbedaan yang tidak menonjol dalam analisis regresi data lengkap.

    Manipulasi data secara alami akan memerlukan kehati-hatian dalam menafsirkan temuan

    seseorang.

    Variabel Independen

    Setelah keputusan telah dibuat pada variabel dependen, peneliti harus menentukan

    variabel independen yang akan disertakan dalam analisis. Variabel independen biasanya dipilih

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    8/18

    8

    dalam dua cara. Pendekatan pertama melibatkan melibatkan identifikasi variabel baik dari

    penelitian sebelumnya atau dari model teoritis yang merupakan dasar yang mendasari pertanyaan

    penelitian. Pendekatan kedua adalah intuisi-memanfaatkan pengetahuan peneliti dan intuitif

    memilih variabel yang tidak ada penelitian sebelumnya atau teori ada tapi itu secara logis

    mungkin berkaitan dengan memprediksi kelompok untuk variabel dependen. Dalam kedua kasus,

    variabel independen yang paling tepat adalah mereka yang berbeda di setidaknya dua dari

    kelompok variabel dependen. Ingat bahwa tujuan dari setiap variabel independen adalah untuk

    menyajikan profil unik dari setidaknya satu kelompok dibandingkan dengan orang lain.

    Ukuran Sampel

    Analisis diskriminan, seperti teknik multivariat lainnya, dipengaruhi oleh ukuran

    sampling error bahwa identifikasi dari semua perbedaan terbesar adalah tidak ada. Selain itu,

    ukuran sampel yang sangat besar akan membuat semua perbedaan signifikan secara statistik,

    meskipun perbedaan-perbedaan yang sama mungkin memiliki relevansi manajerial sedikit atau

    tidak ada. Di antara yang ekstrem, peneliti harus mempertimbangkan dampak dari ukuran sampel

    pada analisis diskriminan, baik di tingkat keseluruhan dan secara kelompok per kelompok.

    Keseluruhan Ukuran Sampel

    Pertimbangan pertama adalah melibatkan ukuran sampel keseluruhan. Analisis

    diskriminan cukup sensitif terhadap rasio ukuran sampel dengan jumlah variabel prediktor.

    Akibatnya, banyak penelitian menunjukkan rasio dari 20 observasi untuk setiap variabel

    prediktor. Meskipun rasio ini mungkin sulit untuk dipertahankan dalam prakteknya, peneliti

    harus mencatat bahwa hasil menjadi tidak stabil sebagai ukuran sampel yang menurun relatif

    terhadap jumlah variabel independen. Ukuran minimum yang disarankan adalah lima

    pengamatan per variabel independen. Perhatikan bahwa rasio ini berlaku untuk semua variabel

    dipertimbangkan dalam analisis, bahkan jika semua variabel dianggap tidak dimasukkan ke

    dalam fungsi diskriminan (seperti dalam estimasi bertahap).

    Contoh Ukuran Per Kategori

    Selain ukuran sampel secara keseluruhan, peneliti juga harus mempertimbangkan ukuran

    sampel dari masing-masing kategori. Minimal, ukuran kelompok terkecil dari kategori harus

    melebihi jumlah variabel independen. Sebagai panduan praktis, setiap kategori harus memiliki

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    9/18

    9

    setidaknya 20 pengamatan. Bahkan ketika semua kategori melebihi 20 pengamatan,

    bagaimanapun, peneliti juga harus mempertimbangkan ukuran relatif kategori. Variasi yang luas

    dalam ukuran kelompok 'akan berdampak pada estimasi fungsi diskriminan dan klasifikasi

    pengamatan. Pada tahap klasifikasi, kelompok yang lebih besar memiliki kesempatan lebih

    tinggi proporsional klasifikasi. Jika ukuran kelompok yang sangat bervariasi, peneliti mungkin

    ingin sampel secara acak dari kelompok yang lebih besar, sehingga mengurangi ukuran mereka

    ke tingkat yang sebanding dengan kelompok yang lebih kecil.

    Divisi Sampel

    Satu catatan terakhir tentang dampak ukuran sampel dalam analisis diskriminan. Dalam

    hal pertimbangan ukuran sampel, adalah penting bahwa setiap sub sampel menjadi ukuran yang

    memadai untuk mendukung kesimpulan dari hasilnya. Dengan demikian, semua pertimbangan

    yang dibahas dalam bagian sebelumnya berlaku tidak hanya untuk total sampel, tapi sekarang

    masing-masing dua subsamples (terutama subsampel digunakan untuk estimasi). Tidak ada

    aturan telah ditetapkan, tetapi tampaknya logis bahwa peneliti akan ingin setidaknya 100 di total

    sampel untuk membenarkan pembagiannya ke dalam dua kelompok.

    Menciptakan Subsampel

    Sejumlah prosedur telah diusulkan untuk membagi sampel menjadi subsampel. Prosedur

    yang biasa adalah dengan membagi sampel total responden secara acak menjadi dua subsampel.

    Tidak ada pedoman yang pasti telah ditetapkan untuk menentukan ukuran relatif dari analisis dan

    ketidaksepakatan (atau validasi) subsampel. Pendekatan yang paling populer adalah untuk

    membagi total sampel sehingga satu setengah dari responden ditempatkan dalam sampel analisis

    dan setengah lainnya ditempatkan dalam sampel ketidaksepakatan.

    Bagaimana Jika Keseluruhan Sampel Terlalu Kecil?

    Jika ukuran sampel terlalu kecil untuk membenarkan pembagian dalam analisis dankelompok ketidaksepakatan, peneliti memiliki dua pilihan. Pertama, mengembangkan fungsi

    pada seluruh sampel dan kemudian menggunakan fungsi untuk mengklasifikasikan kelompok

    yang sama yang digunakan untuk mengembangkan fungsi. Prosedur ini menghasilkan bias ke

    atas dalam akurasi prediksi dari fungsi, tapi tentunya lebih baik daripada tidak menguji fungsi

    sama sekali. Kedua, beberapa teknik yang dibahas dalam tahap 6 dapat melakukan jenis prosedur

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    10/18

    10

    ketidaksepakatan di mana fungsi diskriminan berulang kali diperkirakan pada sampel, setiap kali

    "memegang" pengamatan yang berbeda. Dalam pendekatan ini, jauh lebih kecil ukuran sampel

    dapat digunakan karena sampel keseluruhan tidak perlu dibagi menjadi subsampel.

    Tahap 3: Asumsi Analisis Diskriminan

    Seperti semua teknik multivariat, analisis diskriminan didasarkan pada sejumlah asumsi.

    Asumsi ini berhubungan dengan kedua proses statistik yang terlibat dalam prosedur estimasi dan

    klasifikasi dan isu-isu yang mempengaruhi interpretasi hasil. Bagian berikut ini menjelaskan

    setiap jenis asumsi dan dampak pada aplikasi yang tepat dari analisis diskriminan.

    Dampak terhadap Estimasi dan Klasifikasi

    Asumsi utama untuk menurunkan fungsi diskriminan adalah normalitas multivariat dari

    varibel independen dan tidak diketahui (tapi sama) dispersi dan kovarians struktur (matriks)

    untuk kelompok seperti yang didefinisikan oleh variabel dependen. Bukti Campuran ada

    mengenai sensitivitas analisis diskriminan untuk pelanggaran asumsi.

    Dampak terhadap Estimasi

    Data tidak memenuhi asumsi normalitas multivariat dapat menyebabkan masalah dalam

    estimasi fungsi diskriminan. Remedi dimungkinkan melalui transformasi dari data untuk

    mengurangi kesenjangan antara matriks kovarians. Namun, dalam banyak kasus remedy ini tidak

    efektif. Dalam situasi ini, model harus benar divalidasi. Jika ukuran dependen adalah biner,

    regresi logistik harus digunakan jika keadaan memungkinkan.

    Dampak terhadap Klasifikasi

    Matriks kovarians yang tidak merata juga negatif mempengaruhi proses klasifikasi. Jika

    ukuran sampel kecil dan matriks kovarians yang tidak sama, maka signifikansi statistik dari

    proses estimasi terpengaruh. Kasus yang lebih mungkin adalah bahwa dari kovarians tidak setara

    antara kelompok ukuran sampel yang memadai, dimana pengamatan diidentifikasi ke dalam

    kelompok-kelompok dengan matriks kovarians yang lebih besar. Efek ini dapat diminimalkan

    dengan meningkatkan ukuran sampel dan juga dengan menggunakan kelompok spesifik matriks

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    11/18

    11

    kovarians untuk tujuan klasifikasi, tetapi pendekatan ini mandat lintas validasi hasil

    diskriminannya.

    Dampak Terhadap Interpretasi

    Karakteristik lain dari data yang mempengaruhi hasil adalah multikolinearitas diantara

    variabel independen. Multikolinearitas, diukur dalam hal toleransi, menunjukkan bahwa dua atau

    lebih variabel independen sangat berkorelasi, sehingga satu variabel dapat sangat dijelaskan atau

    diprediksi oleh variabel lain dan dengan demikian menambah sedikit kekuatan penjelas dari

    seluruh rangkaian. Pertimbangan ini menjadi sangat penting ketika prosedur bertahap bekerja.

    Peneliti, dalam menafsirkan fungsi diskriminan, harus menyadari tingkat multikolinieritas dan

    dampaknya terhadap menentukan variabel memasuki solusi bertahap.

    Tahap 4: Estimasi Model diskriminan dan Menilai Fit Keseluruhan

    Untuk menurunkan fungsi diskriminan, peneliti harus memutuskan metode estimasi dan

    kemudian menentukan jumlah fungsi untuk dipertahankan Dengan fungsi diperkirakan, model

    fit secara keseluruhan dapat dinilai dalam beberapa cara. Pertama, diskriminan Z skor, juga

    dikenal sebagai skor Z, dapat dihitung untuk setiap objek. Perbandingan berarti kelompok

    (centroid) pada skor Z menyediakan satu ukuran diskriminasi antara kelompok. Akurasi prediksi

    dapat diukur sebagai jumlah pengamatan diklasifikasikan ke dalam kelompok-kelompok yang

    benar, dengan sejumlah kriteria yang tersedia untuk menilai apakah proses klasifikasi mencapai

    signifikansi praktis atau statistik. Akhirnya, diagnosa bertahap dapat mengidentifikasi ketepatan

    klasifikasi masing-masing kasus dan dampak relatif terhadap estimasi model secara keseluruhan.

    Memilih Metode Estimasi

    Tugas pertama dalam menurunkan fungsi diskriminan adalah untuk memilih metode

    estimasi. Dalam membuat pilihan ini, peneliti harus menyeimbangkan kebutuhan untuk kontrol

    atas proses estimasi versus keinginan untuk parsimoni dalam fungsi diskriminan. Dua metode

    yang tersedia adalah metode (langsung) simultan dan metode bertahap.

    Estimasi simultan melibatkan menghitung fungsi diskriminan sehingga semua variabel

    independen dianggap bersamaan. Dengan demikian, fungsi diskriminan dihitung berdasarkan set

    variabel independen keseluruhan, terlepas dari kekuatan diskriminatif dari masing-masing

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    12/18

    12

    variabel independen. Metode simultan sesuai jika, untuk alasan teoritis, peneliti ingin

    memasukkan semua variabel independen dalam analisis dan tidak tertarik melihat hasil antara

    didasarkan hanya pada variabel yang paling diskriminatif.

    Estimasi Bertahap. Estimasi bertahap adalah sebuah alternatif untuk pendekatan simultan. Ini

    melibatkan memasukkan variabel independen ke dalam satu fungsi diskriminan pada waktu atas

    dasar kekuasaan diskriminatif mereka. Pendekatan bertahap mengikuti suatu proses

    menambahkan atau menghapus variabel dengan cara berikut:

    1. Pilih variabel pembeda tunggal terbaik.

    2. Memasangkan variabel awal dengan masing-masing variabel independen lain, satu per

    satu, dan pilih variabel yang paling mampu meningkatkan kekuatan diskriminatif dari

    fungsi dalam kombinasi dengan variabel pertama.

    3. Pilih variabel tambahan dengan cara seperti. Perhatikan bahwa sebagai variabel tambahan

    disertakan, beberapa variabel yang dipilih sebelumnya bisa dihapus apabila informasi

    yang dikandungnya tentang perbedaan kelompok tersedia dalam beberapa kombinasi dari

    variabel lain termasuk tahap-tahap selanjutnya.

    4. Pertimbangkan proses selesai ketika baik semua variabel independen yang dimasukkan

    ke dalam fungsi atau variabel dikecualikan dihakimi sebagai tidak memberikan kontribusi

    signifikan terhadap diskriminasi lebih jauh.

    Metode bertahap berguna ketika peneliti ingin mempertimbangkan jumlah yang relatif besar

    variabel independen untuk dimasukkan ke dalam fungsi. Dengan berurutan memilih variabel

    pembeda terbaik berikutnya pada setiap langkah, variabel yang tidak berguna dalam

    membedakan antara kelompok dieliminasi dan satu set mengurangi variabel diidentifikasi. Set

    berkurang biasanya hampir sebagus-dan kadang-kadang lebih baik daripada-set lengkap variabel.

    Peneliti tidak harus bahwa estimasi bertahap menjadi kurang stabil dan digeneralisasikan sebagai

    rasio ukuran sampel untuk penurunan variabel independen di bawah tingkat yangdirekomendasikan dari 20 pengamatan per variabel independen. Hal ini sangat penting dalam hal

    ini untuk memvalidasi hasil dalam berbagai cara sebanyak mungkin.

    Signifikansi statistik

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    13/18

    13

    Setelah estimasi fungsi diskriminan, peneliti harus menilai tingkat signifikansi untuk kekuatan

    diskriminatif kolektif fungsi diskriminan serta pentingnya setiap fungsi diskriminan terpisah.

    Mengevaluasi signifikansi keseluruhan menyediakan peneliti dengan informasi yang diperlukan

    untuk dekade apakah akan melanjutkan pada interpretasi analisis atau jika respecification

    diperlukan. Jika model keseluruhan adalah signifikan, kemudian mengevaluasi fungsi individu

    mengidentifikasi fungsi yang harus dipertahankan dan diinterpretasikan.

    Signifikansi Dari Fungsi Diskriminan Individu

    Jika jumlah kelompok adalah tiga atau lebih, maka peneliti harus menentukan tidak

    hanya apakah diskriminasi antara kelompok keseluruhan secara statistik signifikan, tetapi juga

    apakah masing-masing fungsi diskriminan yang diperkirakan adalah signifikan secara statistik.

    Seperti telah dibahas sebelumnya, analisis diskriminan memperkirakan satu fungsi diskriminan

    kurang ada kelompok per kelompok. Jika tiga kelompok dianalisis, kemudian dua fungsi

    diskriminan akan diestimasi, karena empat kelompok, tiga fungsi akan diestimasi, dan

    sebagainya. Program komputer semua memberikan peneliti informasi yang diperlukan untuk

    memastikan jumlah fungsi yang dibutuhkan untuk mendapatkan signifikansi statistik, tanpa

    termasuk fungsi diskriminan yang tidak meningkatkan daya diskriminatif signifikan.

    Model Estimasi dan Fit Model

    Meskipun estimasi bertahap dapat dilihat optimal dengan memilih set paling pelit

    variabel maksimal diskriminatif, waspadalah terhadap dampak multikolinearitas pada

    penilaian kekuatan diskriminatif masing-masing variabel.

    Model fit keseluruhan menilai signifikansi statistik antara kelompok pada skor

    diskriminan Z tetapi tidak menilai akurasi prediksi.

    Dengan lebih dari dua kelompok, jangan membatasi analisis Anda hanya fungsi

    diskriminan signifikan secara statistik , tetapi pertimbangkan jika tidak bermakna fungsi

    (dengan tingkat signifikansi hingga .3) menambah daya jelas.

    Menilai Fit Model Keseluruhan

    Setelah `fungsi diskriminan signifikan telah diidentifikasi, perhatian bergeser ke memastikan

    kesesuaian keseluruhan fungsi diskriminan tetap. Penilaian ini melibatkan tiga tugas:

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    14/18

    14

    1. Menghitung diskriminan skor Z untuk setiap pengamatan.

    2. Mengevaluasi perbedaan kelompok pada skor Z diskriminan.

    3. Menilai kelompok akurasi prediksi keanggotaan.

    Menghitung diskriminan Z skor

    Dengan fungsi diskriminan ditahan ditetapkan, dasar untuk menghitung skor diskriminan

    Z telah ditetapkan. Skor diskriminan Z, variabel metrik, menyediakan sarana langsung

    membandingkan pengamatan pada fungsi masing-masing. Pengamatan dengan skor Z yang sama

    diasumsikan lebih sama pada variabel merupakan fungsi ini dibandingkan dengan nilai yang

    berbeda. Fungsi diskriminan dapat dinyatakan dengan baik bobot standar atau unstandardixed

    dan nilai-nilai. Versi standar yang lebih berguna untuk tujuan interpretasi, tapi versi

    unstandardixed lebih mudah untuk digunakan dalam menghitung skor diskriminan Z.

    Mengevaluasi Perbedaan Grup

    Setelah diskriminan Z skor dihitung, penilaian pertama dari model fit secara keseluruhan

    adalah untuk menentukan besarnya perbedaan antara anggota kelompok masing-masing dalam

    hal skor diskriminan Z. Sebuah ukuran ringkasan perbedaan kelompok adalah perbandingan dari

    centroid kelompok, diskriminan Z score rata-rata untuk semua anggota kelompok. Sebuah

    ukuran keberhasilan analisis diskriminan adalah kemampuannya untuk menentukan fungsi

    diskriminan yang menghasilkan centroid kelompok berbeda secara signifikan.

    Menilai Grup Akurasi Keanggotaan Prediksi

    Mengingat bahwa variabel dependen adalah nonmetric, maka tidak mungkin untuk

    menggunakan ukuran seperti R2

    seperti yang dilakukan di multiple regression, untuk menilai

    akurasi prediksi. Sebaliknya, setiap pengamatan harus dinilai, apakah itu benar diklasifikasikan.

    Dengan demikian, pertimbangan utama beberapa harus diperhatikan:

    Alasan statistik dan praktis untuk mengembangkan matriks klasifikasi. Penentuan pemotongan skor.

    Pembangunan matriks klasifikasi.

    Standar untuk menilai akurasi klasifikasi.

    Mengapa Matriks Klasifikasi Dikembangkan. Tes statistik untuk menilai pentingnya fungsi

    diskriminan hanya menilai tingkat perbedaan antara kelompok berdasarkan skor diskriminan Z,

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    15/18

    15

    tetapi tidak menunjukkan seberapa baik fungsi memprediksi. Prosedur matriks klasifikasi

    memberikan perspektif tentang signifikansi praktis daripada signifikansi statistik. Dengan

    analisis diskriminan berganda, persentase diklasifikasikan dengan benar, juga disebut rasio hit,

    mengungkapkan seberapa baik fungsi diskriminan mengelompokkan benda. Dengan ukuran

    sampel yang cukup besar dalam analisis diskriminan, kita bisa memiliki perbedaan yang

    signifikan secara statistik antara dua (atau lebih) kelompok dan belum benar mengklasifikasikan

    hanya 53 persen (ketika kesempatan adalah 50 persen, dengan ukuran kelompok yang sama).

    Dalam hal demikian, uji statistik akan menunjukkan signifikansi statistik, namun rasio hit akan

    memungkinkan untuk penilaian yang terpisah harus dibuat dalam hal signifikansi praktis.

    Dengan demikian, kita harus menggunakan prosedur matriks klasifikasi untuk menilai akurasi

    prediksi sekedar signifikansi statistik.

    Pemotongan Perhitungan Skor. Menggunakan fungsi diskriminan dianggap signifikan, kita

    dapat mengembangkan matriks klasifikasi untuk memberikan penilaian yang lebih akurat dari

    kekuatan diskriminatif dari fungsi. Sebelum matriks klasifikasi dapat dibangun, bagaimanapun,

    peneliti harus menentukan skor pemotongan (juga disebut nilai kritis Z) untuk setiap fungsi

    diskriminan. Nilai pemotongan adalah kriteria terhadap yang skor diskriminan setiap benda

    dibandingkan untuk menentukan mana kelompok objek harus diklasifikasikan.

    Skor pemotongan merupakan titik membagi digunakan untuk mengklasifikasikan

    pengamatan menjadi salah satu dari dua kelompok berdasarkan nilai fungsi mereka diskriminan.

    Perhitungan pemotongan skor antara dua kelompok didasarkan pada dua kelompok centroid

    (rata-rata dari skor diskriminan) dan ukuran relatif dari kedua kelompok. Para centroid

    Kelompok mudah dihitung dan diberikan pada setiap tahap proses bertahap. Untuk benar

    menghitung skor pemotongan optimal, Peneliti harus mengatasi dua masalah:

    1. Tentukan probabiliti sebelumnya, didasarkan baik pada ukuran sampel relatif dari

    kelompok-kelompok yang diamati atau ditentukan oleh peneliti (baik diasumsikan samaatau dengan nilai-nilai yang ditetapkan oleh peneliti).

    2. Hitung skor nilai pemotongan optimum sebagai rata-rata tertimbang berdasarkan pada

    ukuran diasumsikan dari kelompok (berasal dari probabilitas sebelumnya).

    Tahap 5: Interpretasi Hasil

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    16/18

    16

    Jika fungsi diskriminan signifikan secara statistik dan akurasi klasifikasi dapat diterima,

    peneliti harus fokus pada pembuatan interpretasi substantif temuan. Proses ini melibatkan

    memeriksa fungsi diskriminan untuk menentukan kepentingan relatif dari masing-masing

    variabel independen dalam membedakan antara kelompok. Tiga metode menentukan

    kepentingan relatif telah diusulkan:

    1. Standar diskriminan bobot

    2. Diskriminan beban (korelasi struktur)

    3. Partial F nilai

    Standar Bobot Diskriminan

    Pendekatan tradisional untuk fungsi diskriminan menafsirkan memeriksa tanda dan

    besarnya bobot diskriminan standar (juga disebut sebagai koefisien diskriminan) ditugaskan

    untuk setiap variabel dalam menghitung fungsi diskriminan. Ketika tanda diabaikan, berat

    masing-masing merupakan kontribusi relatif dari variabel yang terkait dengan fungsi tersebut.

    Variabel bebas dengan bobot yang relatif lebih besar memberikan kontribusi lebih untuk

    kekuatan diskriminatif dari fungsi daripada variabel dengan bobot yang lebih kecil. Tanda

    menunjukkan bahwa variabel hanya membuat baik positif atau kontribusi negatif.

    Beban Diskriminan ( Struktur Korelasi)

    Beban diskriminan, kadang-kadang disebut sebagai korelasi struktur, semakin digunakan

    sebagai dasar untuk interpretasi karena kekurangan dalam memanfaatkan bobot. Mengukur

    korelasi linear sederhana antara setiap variabel independen dan fungsi diskriminan, beban

    diskriminan mencerminkan varian bahwa variabel independen berbagi dengan fungsi

    diskriminan. Dalam hal itu mereka dapat ditafsirkan seperti faktor beban dalam menilai

    kontribusi relatif dari masing-masing variabel independen dengan fungsi diskriminan.

    Salah satu karakteristik unik dari beban adalah bahwa beban dapat dihitung untuk semua

    variabel, apakah mereka digunakan dalam estimasi fungsi diskriminan atau tidak. Aspek ini

    sangat berguna ketika prosedur estimasi bertahap digunakan dan beberapa variabel yang tidak

    termasuk dalam fungsi diskriminan. Daripada harus ada cara untuk memahami dampak relatif

    mereka, beban memberikan efek relatif dari setiap variabel pada ukuran umum.

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    17/18

    17

    Tahap 6: Validasi Hasil

    Tahap akhir dari analisis diskriminan melibatkan memvalidasi hasil diskriminan untuk

    memberikan jaminan bahwa hasil memiliki eksternal serta validitas internal. Dengan

    kecenderungan analisis diskriminan untuk mengembang rasio hit jika dievaluasi hanya pada

    sampel analisis, validasi adalah suatu langkah penting. Selain memvalidasi rasio hit, peneliti

    harus menggunakan kelompok untuk memastikan bahwa sarana kelompok merupakan indikator

    yang valid dari model konseptual yang digunakan dalam memilih variabel independen.

    Validasi Prosedur

    Validasi merupakan langkah penting dalam analisis diskriminan karena berkali-kali, terutama

    dengan sampel yang lebih kecil, hasilnya bisa kurang generalisasi (validitas eksternal).

    Pendekatan yang paling umum untuk membangun validitas eksternal adalah penilaian dari rasio

    hit. Validasi dapat terjadi baik dengan sampel terpisah (sampel ketidaksepakatan) atau

    menggunakan prosedur yang berulang kali memproses sampel estimasi. Validitas eksternal

    didukung ketika rasio hit pendekatan dipilih melebihi standar perbandingan yang mewakili

    akurasi prediksi yang diharapkan secara kebetulan.

  • 7/30/2019 Analisis Diskriminan Dan Regresi Logik

    18/18

    18