Analisis Diskriminan Dan Regresi Logik

7/30/2019 Analisis Diskriminan Dan Regresi Logik

1/18

1

ANALISIS DISKRIMINAN

Dalam mencoba untuk memilih teknik analisis yang tepat, kadang-kadang kita

menghadapi masalah yang melibatkan kategori variabel dependen dan beberapa variabel

independen metrik. Sebagai contoh, kita mungkin ingin membedakan yang baik dari risiko kredit

macet. Jika kita memiliki ukuran metrik risiko kredit, maka kita bisa menggunakan regresi

berganda. Dalam banyak kasus kita tidak memiliki ukuran metrik yang diperlukan untuk regresi

berganda. Sebaliknya, kita hanya bisa memastikan apakah seseorang dalam kelompok tertentu

(misalnya, baik atau risiko kredit yang buruk).

Analisis diskriminan adalah teknik statistik yang tepat ketika variabel dependen adalah

kategoris (nominal atau nonmetric) variabel dan variabel independen adalah variabel metrik.

Dalam banyak kasus, variabel dependen terdiri dari dua kelompok atau klasifikasi, misalnya,

jantan dan betina atau tinggi rendah dibandingkan. Dalam kasus lain, lebih dari dua kelompok

yang terlibat, seperti rendah, sedang, dan klasifikasi tinggi. Analisis diskriminan mampu

menangani baik dua kelompok atau beberapa (tiga atau lebih) kelompok. Ketika dua klasifikasi

yang terlibat, teknik ini disebut sebagai dua kelompok analisis diskriminan. Ketika tiga atau

lebih klasifikasi diidentifikasi, teknik ini disebut sebagai analisis diskriminan berganda.

Analisis diskriminan melibatkan berasal suatu variate. Diskriminan variate adalah

kombinasi linear dari dua (atau lebih) variabel independen yang akan membedakan terbaik antara

obyek (orang, perusahaan, dll) dalam kelompok didefinisikan a priori. Diskriminasi dicapai

dengan menghitung bobot variate untuk masing-masing variabel independen untuk

memaksimalkan perbedaan antara kelompok (yaitu, antara kelompok varians relatif terhadap

varians dalam kelompok). Variate untuk analisis diskriminan, juga dikenal sebagai fungsi

diskriminan, berasal dari sebuah persamaan seperti yang terlihat pada regresi berganda.

Seperti dengan variate dalam regresi atau teknik multivariat lain kita melihat skor

diskriminan untuk setiap objek dalam analisis (orang, perusahaan, dll) menjadi penjumlahan nilai

yang diperoleh dengan mengalikan masing-masing variabel independen berat diskriminannya.

Apa yang unik tentang analisis diskriminan adalah bahwa lebih dari satu fungsi diskriminan

mungkin ada, sehingga setiap objek mungkin memiliki lebih dari satu skor diskriminan. Kami

akan membahas apa yang menentukan jumlah fungsi diskriminan kemudian, tetapi di sini kita


2/18

2

melihat bahwa analisis diskriminan memiliki kesamaan dan elemen yang unik bila dibandingkan

dengan teknik multivariat lainnya.

Analisis Diskriminan adalah salah satu tehnik analisa statistika dependensi yang memiliki

kegunaan untuk mengklasifikasikan objek beberapa kelompok. Pengelompokan dengan analisis

diskriminan ini terjadi karena ada pengaruh satu atau lebih variabel lain yang merupakan

variabel independen. Kombinasi linier dari variabel-variabel ini akan membentuk suatu fungsi

diskriminan. Analisis diskriminan adalah teknik multivariate yang termasukdependencemethod,

yakni adanya variabel dependen dan variabel independen. Dengan demikian ada variabel yang

hasilnya tergantung dari data variabel independen.

Analisis diskriminan mirip regresi linier berganda (multivariable regression).

Perbedaannya analisis diskriminan digunakan apabila variabel dependennya kategoris

(maksudnya kalau menggunakan skala ordinal maupun nominal) dan variabel independennya

menggunakan skala metric (interval dan rasio). Sedangkan dalam regresi berganda variabel

dependennya harus metric dan jika variabelnya independen, bias metric maupun nonmetrik.

Dengan rata-rata skor diskriminan untuk semua individu dalam suatu kelompok tertentu, kita

berarti sampai pada kelompok. Ini berarti kelompok disebut sebagai suatu centroid. Ketika

analisis melibatkan dua kelompok, ada dua centroid, dengan tiga kelompok, ada tiga centroid,

dan sebagainya. Para centroid menunjukkan lokasi yang paling khas dari setiap anggota dari

kelompok tertentu, dan perbandingan kelompok centroid menunjukkan seberapa jauh kelompok

yang ada dalam hal fungsi diskriminan.

Analogi Dengan Regresi Dan MANOVA

Penerapan dan interpretasi dari analisis diskriminan adalah sama seperti dalam analisis

regresi. Artinya, fungsi diskriminan merupakan kombinasi linear (variate) pengukuran metrik

untuk dua atau lebih variabel independen dan digunakan untuk menggambarkan atau

memprediksi variabel dependen tunggal. Perbedaan utama adalah bahwa analisis diskriminan

cocok untuk masalah penelitian di mana variabel dependen adalah kategoris (nominal atau

nonmetric), sedangkan regresi digunakan ketika variabel dependen adalah metrik. Seperti telah

dibahas sebelumnya, regresi logistik adalah varian dari regresi dengan banyak kesamaan kecuali

untuk jenis variabel dependen.


3/18

3

Contoh Hipotesis Analisis Diskriminan

Analisis diskriminan berlaku untuk setiap pertanyaan penelitian dengan tujuan

keanggotaan yaitu pemahaman kelompok, apakah kelompok terdiri dari individu (misalnya,

pelanggan dibandingkan bukan konsumen), perusahaan (misalnya, menguntungkan

dibandingkan tidak menguntungkan), produk (misalnya, sukses dibandingkan tidak sukses), atau

objek lainnya yang dapat dievaluasi pada serangkaian variabel independen. Untuk

menggambarkan dasar analisis diskriminan, kami memeriksa pengaturan dua penelitian, yang

melibatkan dua kelompok (pembeli dibandingkan nonpurchasers) dan tiga kelompok lainnya

(tingkat beralih perilaku). Regresi logistik beroperasi dengan cara yang cukup sebanding dengan

analisis diskriminan untuk dua kelompok.

Mengidentifikasi Variabel Diskriminasi

Untuk mengidentifikasi variabel yang mungkin berguna dalam membedakan antara

kelompok (yaitu, pembeli dibandingkan nonpurchasers), penekanan ditempatkan pada perbedaan

kelompok dan bukan ukuran korelasi yang digunakan dalam regresi berganda.

Menghitung Fungsi Diskriminan

Dengan tiga variabel pembeda potensial diidentifikasi, perhatian bergeser menuju

penyelidikan yang kemungkinan menggunakan variabel diskriminasi dalam kombinasi untuk

memperbaiki kekuatan diskriminatif dari setiap variabel individu. Untuk tujuan ini, sebuah

variate dapat dibentuk dengan dua atau lebih variabel diskriminatif untuk bertindak bersama-

sama dalam membedakan antara kelompok.

Mengidentifikasi Variabel Diskriminasi

Dengan tiga kategori variabel dependen, analisis diskriminan dapat memperkirakan

fungsi diskriminan dua, masing-masing mewakili dimensi yang berbeda dari diskriminasi.

Menghitung Dua Fungsi Diskriminan


4/18

4

Dengan variabel diskriminatif potensial diidentifikasi, langkah berikutnya adalah untuk

menggabungkan mereka ke dalam fungsi diskriminan yang akan memanfaatkan kekuatan

gabungan dalam membedakan mereka antara kelompok.Dengan dua fungsi, sekarang kita dapat

menghitung skor diskriminan dua untuk masing-masing responden. Selain itu, dua fungsi

diskriminan memberikan dimensi diskriminasi.

Tujuan Analisis Diskriminan

Oleh karena bentuk multivariate dari analisis diskriminan adalah dependence, maka variabel

dependen adalah variabel yang menjadi dasar analisis diskriminan. Variabel dependen bisa

berupa kode grup 1 atau grup 2 atau lainnya, dengan tujuan diskriminan secara umum adalah :

1. Untuk mengetahui apakah ada perbedaan yang jelas antar grup pada variabel dependen.

2. Jika ada perbedaan, kita ingin mengetahui variabel independen mana pada fungsi

diskriminan yang membuat perbedaan tersebut.

3. Membuat fungsi atau model diskriminan, yang pada dasarnya mirip dengan persamaan

regresi.

4. Melakukan klasifikasi terhadap objek (dalam terminology SPSS disebut baris), apakah suatu objek

(bisa nama orang, nama tumbuhan, benda atau lainnya) termasuk pada grup 1 atau grup 2 atau

lainnya.

Proses Keputusan Untuk Analisis DiskriminanSeperti dengan semua aplikasi multivariat, menetapkan tujuan adalah langkah pertama

dalam analisis. Kemudian peneliti harus mengatasi masalah desain yang spesifik dan pastikan

asumsi yang mendasari terpenuhi. Hasil analisis dengan derivasi dari fungsi diskriminan dan

penentuan apakah fungsi yang signifikan secara statistik dapat diturunkan untuk memisahkan

dua (atau lebih) kelompok. Hasil diskriminan kemudian dinilai untuk akurasi prediksi dengan

mengembangkan matriks klasifikasi. Selanjutnya, interpretasi fungsi diskriminan menentukan

mana dari variabel independen memberikan kontribusi yang paling membedakan antara

kelompok. Akhirnya, fungsi diskriminan harus divalidasi dengan sampel ketidaksepakatan.

Tahap 1: Tujuan Analisis Diskriminan

Sebuah tinjauan dari tujuan untuk menerapkan analisis diskriminan lanjut harus menjelaskan

sifatnya. Analisis diskriminan dapat mengatasi salah satu tujuan penelitian berikut:


5/18

5

1. Menentukan apakah perbedaan signifikan secara statistik ada antara profil-rata skor pada

set variabel untuk dua (atau lebih) priori kelompok yang didefinisikan.

2. Menentukan mana variabel independen dan untuk perbedaan dalam profil skor rata-rata

dua atau lebih kelompok.

3. Menetapkan jumlah dan komposisi dimensi diskriminasi antara kelompok-kelompok

yang terbentuk dari himpunan variabel independen.

4. Menetapkan prosedur untuk mengklasifikasikan obyek (individu, perusahaan, produk,

dll) ke dalam kelompok berdasarkan skor mereka pada satu set variabel independen.

Sebagaimana yang dicatat, tujuan analisis diskriminan berguna ketika peneliti tertarik

dalam memahami perbedaan kelompok atau dengan benar mengklasifikasikan objek ke

dalam kelompok atau kelas. Oleh karena itu, analisis diskriminan dapat dianggap baik jenis

analisis profil atau teknik prediksi analitiknya.

Tahap 2: Desain Penelitian Untuk Analisis Diskriminan

Keberhasilan penerapan analisis diskriminan memerlukan pertimbangan beberapa isu.

Isu-isu termasuk pemilihan variabel baik dependen dan independen, ukuran sampel yang

dibutuhkan untuk estimasi fungsi diskriminan, dan pembagian sampel untuk keperluan validasi.

Memilih Variabel Dependent dan Independen

Untuk menerapkan analisis diskriminan, peneliti harus terlebih dahulu menentukan

variabel yang menjadi ukuran independen dan variabel mana yang menjadi ukuran. Variabel

terikat adalah nonmetrik dan variabel independen adalah metrik.

Variabel Dependent

Peneliti harus fokus pada variabel dependen pertama. Jumlah kelompok variabel

dependen (kategori) bisa dua atau lebih, tetapi kelompok-kelompok harus saling eksklusif dan

lengkap. Dengan kata lain, setiap pengamatan dapat ditempatkan ke dalam hanya satu kelompok.

Dalam beberapa kasus, variabel dependen mungkin melibatkan dua kelompok (dikotomis),

seperti baik versus buruk. Dalam kasus lain, variabel dependen mungkin melibatkan beberapa

kelompok (multichotomous), seperti pekerjaan dokter, pengacara, atau profesor.


6/18

6

Berapa Banyak Kategori dalam Variabel Dependent?

Secara teoritis, analisis diskriminan dapat menangani jumlah yang tidak terbatas kategori

dalam variabel dependen. Sebagai masalah praktis, bagaimanapun, peneliti harus memilih

variabel dependen dan jumlah kategori berdasarkan beberapa pertimbangan:

1. Selain menjadi saling eksklusif dan lengkap, kategori variabel dependen harus berbeda

dan unik pada set variabel independen yang dipilih. Analisis diskriminan mengasumsikan

bahwa setiap kelompok harus memiliki profil yang unik pada variabel independen yang

digunakan dan dengan demikian mengembangkan fungsi diskriminan secara maksimal

dengan memisahkan kelompok berdasarkan variabel-variabel. Analisis diskriminan,

bagaimanapun, memiliki sarana akomodatif atau menggabungkan kategori yang tidak

berbeda pada variabel independen. Jika dua atau lebih kelompok memiliki profil sangat

mirip, analisis diskriminan tidak akan mampu memliki unik profil masing-masing

kelompok, sehingga penjelasan dan klasifikasi kelompok secara keseluruhan tidak jelas.

Dengan demikian, peneliti harus memilih variabel dependen dan kategori untuk

mencerminkan perbedaan dalam variabel independen. Sebuah contoh akan membantu

menggambarkan masalah.

2. Peneliti juga harus berusaha untuk memperbesar jumlah yang kecil daripada besar

kategori dalam ukuran. Ini mungkin tampak lebih logis untuk memperluas jumlah

kategori dalam mencari kelompok yang unik lagi, tapi memperluas jumlah kategori

menyajikan kompleksitas lebih dalam profil dan tugas klasifikasi analisis diskriminan.

Jika analisis diskriminan dapat memperkirakan sampai dengan NG-1 (jumlah kelompok

minus satu) fungsi diskriminan, kemudian meningkatkan jumlah kelompok memperluas

jumlah fungsi diskriminan, meningkatkan kompleksitas dalam mengidentifikasi dimensi

yang mendasari diskriminasi tercermin oleh masing-masing fungsi diskriminan sebagai

serta mewakili keseluruhan efek dari setiap variabel independen.

Konversi Variabel Metrik. Contoh-contoh sebelumnya dari variabel kategori adalah dikotomi

(atau multichotomies). Dalam beberapa situasi, analisis diskriminan tepat bahkan jika variabel


7/18

7

dependen tidak nonmetric (kategorikal) variabel. Kami mungkin memiliki variabel dependen

yang merupakan pengukuran ordinal atau interval yang kita ingin gunakan sebagai kategori

variabel dependen. Dalam kasus tersebut, kita harus membuat sebuah variabel kategoris, dan dua

pendekatan yang paling sering digunakan:

Pendekatan yang paling umum adalah untuk menetapkan kategori menggunakan skala

metrik. Sebagai contoh, jika kita memiliki variabel yang mengukur jumlah rata-rata

minuman cola yang dikonsumsi per hari, kita bisa membuat trikotomi buatan (tiga

kelompok) dengan hanya menunjuk orang-orang yang mengkonsumsi tidak ada, satu,

atau minuman cola dua per hari sebagai pengguna ringan , mereka yang mengkonsumsi

tiga, empat, atau lima per hari sebagai pengguna menengah, dan mereka yang

mengkonsumsi enam, tujuh, delapan, atau lebih sebagai pengguna berat. Prosedur

tersebut akan membuat variabel kategorikal tiga kelompok di mana tujuan akan

membedakan antara ringan, sedang, dan pengguna berat cola. Sejumlah kelompok

kategoris dapat dikembangkan. Paling sering, pendekatan akan melibatkan membuat dua,

tiga, atau empat kategori. Sejumlah besar kategori bisa dibentuk jika diperlukan.

Ketika tiga atau lebih kategori yang diciptakan, kemungkinan timbul dari memeriksa

hanya kelompok ekstrim dalam analisis dua kelompok-diskriminan. Pendekatan ekstrem

melibatkan dengan membandingkan hanya dua kelompok ekstrim dan tidak termasuk

kelompok menengah dari analisis diskriminan. Sebagai contoh, peneliti bisa memeriksa

pengguna ringan dan berat minuman cola dan belum termasuk pengguna menengah.

Pendekatan ini dapat digunakan setiap saat peneliti ingin meneliti hanya kelompok

ekstrim. Namun, peneliti juga mungkin ingin mencoba pendekatan ini ketika hasil

analisis regresi yang tidak sebagus seperti yang diharapkan. Prosedur tersebut dapat

membantu karena ada kemungkinan bahwa perbedaan kelompok dapat muncul meskipun

hasil regresi miskin. Artinya, pendekatan ekstrem dengan analisis diskriminan dapat

mengungkapkan perbedaan yang tidak menonjol dalam analisis regresi data lengkap.

Manipulasi data secara alami akan memerlukan kehati-hatian dalam menafsirkan temuan

seseorang.

Variabel Independen

Setelah keputusan telah dibuat pada variabel dependen, peneliti harus menentukan

variabel independen yang akan disertakan dalam analisis. Variabel independen biasanya dipilih


8/18

8

dalam dua cara. Pendekatan pertama melibatkan melibatkan identifikasi variabel baik dari

penelitian sebelumnya atau dari model teoritis yang merupakan dasar yang mendasari pertanyaan

penelitian. Pendekatan kedua adalah intuisi-memanfaatkan pengetahuan peneliti dan intuitif

memilih variabel yang tidak ada penelitian sebelumnya atau teori ada tapi itu secara logis

mungkin berkaitan dengan memprediksi kelompok untuk variabel dependen. Dalam kedua kasus,

variabel independen yang paling tepat adalah mereka yang berbeda di setidaknya dua dari

kelompok variabel dependen. Ingat bahwa tujuan dari setiap variabel independen adalah untuk

menyajikan profil unik dari setidaknya satu kelompok dibandingkan dengan orang lain.

Ukuran Sampel

Analisis diskriminan, seperti teknik multivariat lainnya, dipengaruhi oleh ukuran

sampling error bahwa identifikasi dari semua perbedaan terbesar adalah tidak ada. Selain itu,

ukuran sampel yang sangat besar akan membuat semua perbedaan signifikan secara statistik,

meskipun perbedaan-perbedaan yang sama mungkin memiliki relevansi manajerial sedikit atau

tidak ada. Di antara yang ekstrem, peneliti harus mempertimbangkan dampak dari ukuran sampel

pada analisis diskriminan, baik di tingkat keseluruhan dan secara kelompok per kelompok.

Keseluruhan Ukuran Sampel

Pertimbangan pertama adalah melibatkan ukuran sampel keseluruhan. Analisis

diskriminan cukup sensitif terhadap rasio ukuran sampel dengan jumlah variabel prediktor.

Akibatnya, banyak penelitian menunjukkan rasio dari 20 observasi untuk setiap variabel

prediktor. Meskipun rasio ini mungkin sulit untuk dipertahankan dalam prakteknya, peneliti

harus mencatat bahwa hasil menjadi tidak stabil sebagai ukuran sampel yang menurun relatif

terhadap jumlah variabel independen. Ukuran minimum yang disarankan adalah lima

pengamatan per variabel independen. Perhatikan bahwa rasio ini berlaku untuk semua variabel

dipertimbangkan dalam analisis, bahkan jika semua variabel dianggap tidak dimasukkan ke

dalam fungsi diskriminan (seperti dalam estimasi bertahap).

Contoh Ukuran Per Kategori

Selain ukuran sampel secara keseluruhan, peneliti juga harus mempertimbangkan ukuran

sampel dari masing-masing kategori. Minimal, ukuran kelompok terkecil dari kategori harus

melebihi jumlah variabel independen. Sebagai panduan praktis, setiap kategori harus memiliki


9/18

9

setidaknya 20 pengamatan. Bahkan ketika semua kategori melebihi 20 pengamatan,

bagaimanapun, peneliti juga harus mempertimbangkan ukuran relatif kategori. Variasi yang luas

dalam ukuran kelompok 'akan berdampak pada estimasi fungsi diskriminan dan klasifikasi

pengamatan. Pada tahap klasifikasi, kelompok yang lebih besar memiliki kesempatan lebih

tinggi proporsional klasifikasi. Jika ukuran kelompok yang sangat bervariasi, peneliti mungkin

ingin sampel secara acak dari kelompok yang lebih besar, sehingga mengurangi ukuran mereka

ke tingkat yang sebanding dengan kelompok yang lebih kecil.

Divisi Sampel

Satu catatan terakhir tentang dampak ukuran sampel dalam analisis diskriminan. Dalam

hal pertimbangan ukuran sampel, adalah penting bahwa setiap sub sampel menjadi ukuran yang

memadai untuk mendukung kesimpulan dari hasilnya. Dengan demikian, semua pertimbangan

yang dibahas dalam bagian sebelumnya berlaku tidak hanya untuk total sampel, tapi sekarang

masing-masing dua subsamples (terutama subsampel digunakan untuk estimasi). Tidak ada

aturan telah ditetapkan, tetapi tampaknya logis bahwa peneliti akan ingin setidaknya 100 di total

sampel untuk membenarkan pembagiannya ke dalam dua kelompok.

Menciptakan Subsampel

Sejumlah prosedur telah diusulkan untuk membagi sampel menjadi subsampel. Prosedur

yang biasa adalah dengan membagi sampel total responden secara acak menjadi dua subsampel.

Tidak ada pedoman yang pasti telah ditetapkan untuk menentukan ukuran relatif dari analisis dan

ketidaksepakatan (atau validasi) subsampel. Pendekatan yang paling populer adalah untuk

membagi total sampel sehingga satu setengah dari responden ditempatkan dalam sampel analisis

dan setengah lainnya ditempatkan dalam sampel ketidaksepakatan.

Bagaimana Jika Keseluruhan Sampel Terlalu Kecil?

Jika ukuran sampel terlalu kecil untuk membenarkan pembagian dalam analisis dankelompok ketidaksepakatan, peneliti memiliki dua pilihan. Pertama, mengembangkan fungsi

pada seluruh sampel dan kemudian menggunakan fungsi untuk mengklasifikasikan kelompok

yang sama yang digunakan untuk mengembangkan fungsi. Prosedur ini menghasilkan bias ke

atas dalam akurasi prediksi dari fungsi, tapi tentunya lebih baik daripada tidak menguji fungsi

sama sekali. Kedua, beberapa teknik yang dibahas dalam tahap 6 dapat melakukan jenis prosedur


10/18

10

ketidaksepakatan di mana fungsi diskriminan berulang kali diperkirakan pada sampel, setiap kali

"memegang" pengamatan yang berbeda. Dalam pendekatan ini, jauh lebih kecil ukuran sampel

dapat digunakan karena sampel keseluruhan tidak perlu dibagi menjadi subsampel.

Tahap 3: Asumsi Analisis Diskriminan

Seperti semua teknik multivariat, analisis diskriminan didasarkan pada sejumlah asumsi.

Asumsi ini berhubungan dengan kedua proses statistik yang terlibat dalam prosedur estimasi dan

klasifikasi dan isu-isu yang mempengaruhi interpretasi hasil. Bagian berikut ini menjelaskan

setiap jenis asumsi dan dampak pada aplikasi yang tepat dari analisis diskriminan.

Dampak terhadap Estimasi dan Klasifikasi

Asumsi utama untuk menurunkan fungsi diskriminan adalah normalitas multivariat dari

varibel independen dan tidak diketahui (tapi sama) dispersi dan kovarians struktur (matriks)

untuk kelompok seperti yang didefinisikan oleh variabel dependen. Bukti Campuran ada

mengenai sensitivitas analisis diskriminan untuk pelanggaran asumsi.

Dampak terhadap Estimasi

Data tidak memenuhi asumsi normalitas multivariat dapat menyebabkan masalah dalam

estimasi fungsi diskriminan. Remedi dimungkinkan melalui transformasi dari data untuk

mengurangi kesenjangan antara matriks kovarians. Namun, dalam banyak kasus remedy ini tidak

efektif. Dalam situasi ini, model harus benar divalidasi. Jika ukuran dependen adalah biner,

regresi logistik harus digunakan jika keadaan memungkinkan.

Dampak terhadap Klasifikasi

Matriks kovarians yang tidak merata juga negatif mempengaruhi proses klasifikasi. Jika

ukuran sampel kecil dan matriks kovarians yang tidak sama, maka signifikansi statistik dari

proses estimasi terpengaruh. Kasus yang lebih mungkin adalah bahwa dari kovarians tidak setara

antara kelompok ukuran sampel yang memadai, dimana pengamatan diidentifikasi ke dalam

kelompok-kelompok dengan matriks kovarians yang lebih besar. Efek ini dapat diminimalkan

dengan meningkatkan ukuran sampel dan juga dengan menggunakan kelompok spesifik matriks


11/18

11

kovarians untuk tujuan klasifikasi, tetapi pendekatan ini mandat lintas validasi hasil

diskriminannya.

Dampak Terhadap Interpretasi

Karakteristik lain dari data yang mempengaruhi hasil adalah multikolinearitas diantara

variabel independen. Multikolinearitas, diukur dalam hal toleransi, menunjukkan bahwa dua atau

lebih variabel independen sangat berkorelasi, sehingga satu variabel dapat sangat dijelaskan atau

diprediksi oleh variabel lain dan dengan demikian menambah sedikit kekuatan penjelas dari

seluruh rangkaian. Pertimbangan ini menjadi sangat penting ketika prosedur bertahap bekerja.

Peneliti, dalam menafsirkan fungsi diskriminan, harus menyadari tingkat multikolinieritas dan

dampaknya terhadap menentukan variabel memasuki solusi bertahap.

Tahap 4: Estimasi Model diskriminan dan Menilai Fit Keseluruhan

Untuk menurunkan fungsi diskriminan, peneliti harus memutuskan metode estimasi dan

kemudian menentukan jumlah fungsi untuk dipertahankan Dengan fungsi diperkirakan, model

fit secara keseluruhan dapat dinilai dalam beberapa cara. Pertama, diskriminan Z skor, juga

dikenal sebagai skor Z, dapat dihitung untuk setiap objek. Perbandingan berarti kelompok

(centroid) pada skor Z menyediakan satu ukuran diskriminasi antara kelompok. Akurasi prediksi

dapat diukur sebagai jumlah pengamatan diklasifikasikan ke dalam kelompok-kelompok yang

benar, dengan sejumlah kriteria yang tersedia untuk menilai apakah proses klasifikasi mencapai

signifikansi praktis atau statistik. Akhirnya, diagnosa bertahap dapat mengidentifikasi ketepatan

klasifikasi masing-masing kasus dan dampak relatif terhadap estimasi model secara keseluruhan.

Memilih Metode Estimasi

Tugas pertama dalam menurunkan fungsi diskriminan adalah untuk memilih metode

estimasi. Dalam membuat pilihan ini, peneliti harus menyeimbangkan kebutuhan untuk kontrol

atas proses estimasi versus keinginan untuk parsimoni dalam fungsi diskriminan. Dua metode

yang tersedia adalah metode (langsung) simultan dan metode bertahap.

Estimasi simultan melibatkan menghitung fungsi diskriminan sehingga semua variabel

independen dianggap bersamaan. Dengan demikian, fungsi diskriminan dihitung berdasarkan set

variabel independen keseluruhan, terlepas dari kekuatan diskriminatif dari masing-masing


12/18

12

variabel independen. Metode simultan sesuai jika, untuk alasan teoritis, peneliti ingin

memasukkan semua variabel independen dalam analisis dan tidak tertarik melihat hasil antara

didasarkan hanya pada variabel yang paling diskriminatif.

Estimasi Bertahap. Estimasi bertahap adalah sebuah alternatif untuk pendekatan simultan. Ini

melibatkan memasukkan variabel independen ke dalam satu fungsi diskriminan pada waktu atas

dasar kekuasaan diskriminatif mereka. Pendekatan bertahap mengikuti suatu proses

menambahkan atau menghapus variabel dengan cara berikut:

1. Pilih variabel pembeda tunggal terbaik.

2. Memasangkan variabel awal dengan masing-masing variabel independen lain, satu per

satu, dan pilih variabel yang paling mampu meningkatkan kekuatan diskriminatif dari

fungsi dalam kombinasi dengan variabel pertama.

3. Pilih variabel tambahan dengan cara seperti. Perhatikan bahwa sebagai variabel tambahan

disertakan, beberapa variabel yang dipilih sebelumnya bisa dihapus apabila informasi

yang dikandungnya tentang perbedaan kelompok tersedia dalam beberapa kombinasi dari

variabel lain termasuk tahap-tahap selanjutnya.

4. Pertimbangkan proses selesai ketika baik semua variabel independen yang dimasukkan

ke dalam fungsi atau variabel dikecualikan dihakimi sebagai tidak memberikan kontribusi

signifikan terhadap diskriminasi lebih jauh.

Metode bertahap berguna ketika peneliti ingin mempertimbangkan jumlah yang relatif besar

variabel independen untuk dimasukkan ke dalam fungsi. Dengan berurutan memilih variabel

pembeda terbaik berikutnya pada setiap langkah, variabel yang tidak berguna dalam

membedakan antara kelompok dieliminasi dan satu set mengurangi variabel diidentifikasi. Set

berkurang biasanya hampir sebagus-dan kadang-kadang lebih baik daripada-set lengkap variabel.

Peneliti tidak harus bahwa estimasi bertahap menjadi kurang stabil dan digeneralisasikan sebagai

rasio ukuran sampel untuk penurunan variabel independen di bawah tingkat yangdirekomendasikan dari 20 pengamatan per variabel independen. Hal ini sangat penting dalam hal

ini untuk memvalidasi hasil dalam berbagai cara sebanyak mungkin.

Signifikansi statistik


13/18

13

Setelah estimasi fungsi diskriminan, peneliti harus menilai tingkat signifikansi untuk kekuatan

diskriminatif kolektif fungsi diskriminan serta pentingnya setiap fungsi diskriminan terpisah.

Mengevaluasi signifikansi keseluruhan menyediakan peneliti dengan informasi yang diperlukan

untuk dekade apakah akan melanjutkan pada interpretasi analisis atau jika respecification

diperlukan. Jika model keseluruhan adalah signifikan, kemudian mengevaluasi fungsi individu

mengidentifikasi fungsi yang harus dipertahankan dan diinterpretasikan.

Signifikansi Dari Fungsi Diskriminan Individu

Jika jumlah kelompok adalah tiga atau lebih, maka peneliti harus menentukan tidak

hanya apakah diskriminasi antara kelompok keseluruhan secara statistik signifikan, tetapi juga

apakah masing-masing fungsi diskriminan yang diperkirakan adalah signifikan secara statistik.

Seperti telah dibahas sebelumnya, analisis diskriminan memperkirakan satu fungsi diskriminan

kurang ada kelompok per kelompok. Jika tiga kelompok dianalisis, kemudian dua fungsi

diskriminan akan diestimasi, karena empat kelompok, tiga fungsi akan diestimasi, dan

sebagainya. Program komputer semua memberikan peneliti informasi yang diperlukan untuk

memastikan jumlah fungsi yang dibutuhkan untuk mendapatkan signifikansi statistik, tanpa

termasuk fungsi diskriminan yang tidak meningkatkan daya diskriminatif signifikan.

Model Estimasi dan Fit Model

Meskipun estimasi bertahap dapat dilihat optimal dengan memilih set paling pelit

variabel maksimal diskriminatif, waspadalah terhadap dampak multikolinearitas pada

penilaian kekuatan diskriminatif masing-masing variabel.

Model fit keseluruhan menilai signifikansi statistik antara kelompok pada skor

diskriminan Z tetapi tidak menilai akurasi prediksi.

Dengan lebih dari dua kelompok, jangan membatasi analisis Anda hanya fungsi

diskriminan signifikan secara statistik , tetapi pertimbangkan jika tidak bermakna fungsi

(dengan tingkat signifikansi hingga .3) menambah daya jelas.

Menilai Fit Model Keseluruhan

Setelah `fungsi diskriminan signifikan telah diidentifikasi, perhatian bergeser ke memastikan

kesesuaian keseluruhan fungsi diskriminan tetap. Penilaian ini melibatkan tiga tugas:


14/18

14

1. Menghitung diskriminan skor Z untuk setiap pengamatan.

2. Mengevaluasi perbedaan kelompok pada skor Z diskriminan.

3. Menilai kelompok akurasi prediksi keanggotaan.

Menghitung diskriminan Z skor

Dengan fungsi diskriminan ditahan ditetapkan, dasar untuk menghitung skor diskriminan

Z telah ditetapkan. Skor diskriminan Z, variabel metrik, menyediakan sarana langsung

membandingkan pengamatan pada fungsi masing-masing. Pengamatan dengan skor Z yang sama

diasumsikan lebih sama pada variabel merupakan fungsi ini dibandingkan dengan nilai yang

berbeda. Fungsi diskriminan dapat dinyatakan dengan baik bobot standar atau unstandardixed

dan nilai-nilai. Versi standar yang lebih berguna untuk tujuan interpretasi, tapi versi

unstandardixed lebih mudah untuk digunakan dalam menghitung skor diskriminan Z.

Mengevaluasi Perbedaan Grup

Setelah diskriminan Z skor dihitung, penilaian pertama dari model fit secara keseluruhan

adalah untuk menentukan besarnya perbedaan antara anggota kelompok masing-masing dalam

hal skor diskriminan Z. Sebuah ukuran ringkasan perbedaan kelompok adalah perbandingan dari

centroid kelompok, diskriminan Z score rata-rata untuk semua anggota kelompok. Sebuah

ukuran keberhasilan analisis diskriminan adalah kemampuannya untuk menentukan fungsi

diskriminan yang menghasilkan centroid kelompok berbeda secara signifikan.

Menilai Grup Akurasi Keanggotaan Prediksi

Mengingat bahwa variabel dependen adalah nonmetric, maka tidak mungkin untuk

menggunakan ukuran seperti R2

seperti yang dilakukan di multiple regression, untuk menilai

akurasi prediksi. Sebaliknya, setiap pengamatan harus dinilai, apakah itu benar diklasifikasikan.

Dengan demikian, pertimbangan utama beberapa harus diperhatikan:

Alasan statistik dan praktis untuk mengembangkan matriks klasifikasi. Penentuan pemotongan skor.

Pembangunan matriks klasifikasi.

Standar untuk menilai akurasi klasifikasi.

Mengapa Matriks Klasifikasi Dikembangkan. Tes statistik untuk menilai pentingnya fungsi

diskriminan hanya menilai tingkat perbedaan antara kelompok berdasarkan skor diskriminan Z,


15/18

15

tetapi tidak menunjukkan seberapa baik fungsi memprediksi. Prosedur matriks klasifikasi

memberikan perspektif tentang signifikansi praktis daripada signifikansi statistik. Dengan

analisis diskriminan berganda, persentase diklasifikasikan dengan benar, juga disebut rasio hit,

mengungkapkan seberapa baik fungsi diskriminan mengelompokkan benda. Dengan ukuran

sampel yang cukup besar dalam analisis diskriminan, kita bisa memiliki perbedaan yang

signifikan secara statistik antara dua (atau lebih) kelompok dan belum benar mengklasifikasikan

hanya 53 persen (ketika kesempatan adalah 50 persen, dengan ukuran kelompok yang sama).

Dalam hal demikian, uji statistik akan menunjukkan signifikansi statistik, namun rasio hit akan

memungkinkan untuk penilaian yang terpisah harus dibuat dalam hal signifikansi praktis.

Dengan demikian, kita harus menggunakan prosedur matriks klasifikasi untuk menilai akurasi

prediksi sekedar signifikansi statistik.

Pemotongan Perhitungan Skor. Menggunakan fungsi diskriminan dianggap signifikan, kita

dapat mengembangkan matriks klasifikasi untuk memberikan penilaian yang lebih akurat dari

kekuatan diskriminatif dari fungsi. Sebelum matriks klasifikasi dapat dibangun, bagaimanapun,

peneliti harus menentukan skor pemotongan (juga disebut nilai kritis Z) untuk setiap fungsi

diskriminan. Nilai pemotongan adalah kriteria terhadap yang skor diskriminan setiap benda

dibandingkan untuk menentukan mana kelompok objek harus diklasifikasikan.

Skor pemotongan merupakan titik membagi digunakan untuk mengklasifikasikan

pengamatan menjadi salah satu dari dua kelompok berdasarkan nilai fungsi mereka diskriminan.

Perhitungan pemotongan skor antara dua kelompok didasarkan pada dua kelompok centroid

(rata-rata dari skor diskriminan) dan ukuran relatif dari kedua kelompok. Para centroid

Kelompok mudah dihitung dan diberikan pada setiap tahap proses bertahap. Untuk benar

menghitung skor pemotongan optimal, Peneliti harus mengatasi dua masalah:

1. Tentukan probabiliti sebelumnya, didasarkan baik pada ukuran sampel relatif dari

kelompok-kelompok yang diamati atau ditentukan oleh peneliti (baik diasumsikan samaatau dengan nilai-nilai yang ditetapkan oleh peneliti).

2. Hitung skor nilai pemotongan optimum sebagai rata-rata tertimbang berdasarkan pada

ukuran diasumsikan dari kelompok (berasal dari probabilitas sebelumnya).

Tahap 5: Interpretasi Hasil


16/18

16

Jika fungsi diskriminan signifikan secara statistik dan akurasi klasifikasi dapat diterima,

peneliti harus fokus pada pembuatan interpretasi substantif temuan. Proses ini melibatkan

memeriksa fungsi diskriminan untuk menentukan kepentingan relatif dari masing-masing

variabel independen dalam membedakan antara kelompok. Tiga metode menentukan

kepentingan relatif telah diusulkan:

1. Standar diskriminan bobot

2. Diskriminan beban (korelasi struktur)

3. Partial F nilai

Standar Bobot Diskriminan

Pendekatan tradisional untuk fungsi diskriminan menafsirkan memeriksa tanda dan

besarnya bobot diskriminan standar (juga disebut sebagai koefisien diskriminan) ditugaskan

untuk setiap variabel dalam menghitung fungsi diskriminan. Ketika tanda diabaikan, berat

masing-masing merupakan kontribusi relatif dari variabel yang terkait dengan fungsi tersebut.

Variabel bebas dengan bobot yang relatif lebih besar memberikan kontribusi lebih untuk

kekuatan diskriminatif dari fungsi daripada variabel dengan bobot yang lebih kecil. Tanda

menunjukkan bahwa variabel hanya membuat baik positif atau kontribusi negatif.

Beban Diskriminan ( Struktur Korelasi)

Beban diskriminan, kadang-kadang disebut sebagai korelasi struktur, semakin digunakan

sebagai dasar untuk interpretasi karena kekurangan dalam memanfaatkan bobot. Mengukur

korelasi linear sederhana antara setiap variabel independen dan fungsi diskriminan, beban

diskriminan mencerminkan varian bahwa variabel independen berbagi dengan fungsi

diskriminan. Dalam hal itu mereka dapat ditafsirkan seperti faktor beban dalam menilai

kontribusi relatif dari masing-masing variabel independen dengan fungsi diskriminan.

Salah satu karakteristik unik dari beban adalah bahwa beban dapat dihitung untuk semua

variabel, apakah mereka digunakan dalam estimasi fungsi diskriminan atau tidak. Aspek ini

sangat berguna ketika prosedur estimasi bertahap digunakan dan beberapa variabel yang tidak

termasuk dalam fungsi diskriminan. Daripada harus ada cara untuk memahami dampak relatif

mereka, beban memberikan efek relatif dari setiap variabel pada ukuran umum.


17/18

17

Tahap 6: Validasi Hasil

Tahap akhir dari analisis diskriminan melibatkan memvalidasi hasil diskriminan untuk

memberikan jaminan bahwa hasil memiliki eksternal serta validitas internal. Dengan

kecenderungan analisis diskriminan untuk mengembang rasio hit jika dievaluasi hanya pada

sampel analisis, validasi adalah suatu langkah penting. Selain memvalidasi rasio hit, peneliti

harus menggunakan kelompok untuk memastikan bahwa sarana kelompok merupakan indikator

yang valid dari model konseptual yang digunakan dalam memilih variabel independen.

Validasi Prosedur

Validasi merupakan langkah penting dalam analisis diskriminan karena berkali-kali, terutama

dengan sampel yang lebih kecil, hasilnya bisa kurang generalisasi (validitas eksternal).

Pendekatan yang paling umum untuk membangun validitas eksternal adalah penilaian dari rasio

hit. Validasi dapat terjadi baik dengan sampel terpisah (sampel ketidaksepakatan) atau

menggunakan prosedur yang berulang kali memproses sampel estimasi. Validitas eksternal

didukung ketika rasio hit pendekatan dipilih melebihi standar perbandingan yang mewakili

akurasi prediksi yang diharapkan secara kebetulan.


18/18

18

Analisis Diskriminan Dan Regresi Logik

Documents

Transcript of Analisis Diskriminan Dan Regresi Logik