1
ANALISIS DISKRIMINAN
Dr. Ir. Imam Buchori
Ir. Artiningsih, MSi
2
PENDAHULUAN
Pertama kali diperkenalkan oleh Fisher (1936). Digunakan untuk mengetahui variabel-variabel penciri
yang membedakan kelompok populasi yang ada dan juga dapat dipergunakan sebagai kriteria pengelompokkan.
Banyak dipakai dalam berbagai bidang ilmu pengetahuan, misalnya : Psikologi (Lie, 1964), Pendidikan (John, 1968), Geografi (Mather, 1969), Geologi (Davis, 1973) dan berbagai bidang ilmu lainnya.
3
PENDAHULUAN (Lanjutan…)
Pada prinsipnya hampir sama dengan Regression Analysis.
Mempunyai Dependen Variabel (Y) dan Independen Variabel (X) yang mempengaruhi Dependen Variabel.
Regression Analysis : 1. Linier Regression (2 Variabel) 2. Multiple Regression ( >2 Variabel) Discriminant Analysis : 1. Diskriminan 2 Group (2 Variabel Penciri) 2. Diskriminan 3 Group (>2 Variable Penciri)
4
DEFINISI dan CARA KERJA
Definisinya adalah :Teknik analisis statistik untuk menggolongkan populasi /
individu / objek menjadi kelompok-kelompok sendiri dalam sekumpulan variabel independent.
Cara kerjanya adalah :Maksimasi variansi antar kelompok dan minimasi variansi
dalam kelompok.Menentukan nilai setiap individu dalam sampel, dimana
nilai setiap individu adalah rata-rata bobot dari individu dalam sejumlah variabel independent.
5
TUJUAN
Untuk mencari model yang sesuai untuk dapat menentukan objek-objek pengamatan menjadi kelompok-kelompok yang lengkap.
Untuk menentukan kontribusi masing-masing variabel yang terlibat dalam pengklasifikasian.
Sebagai dasar penentuan apakah suatu variabel tertentu perlu dilibatkan dalam analisa pengklasifikasian selanjutnya atau tidak.
6
PRINSIP DASAR / ASUMSI-ASUMSI YANG BERLAKU
Variabel independent (1…p) mempunyai distribusi normal.
Matriks p x p atau matriks variant – covariant untuk setiap kelompok (1…k) harus sama.
Pengamatan dari masing-masing group dipilih secara acak / random.
7
CONTOH PENGGUNAAN :
Untuk menentukan suatu daerah yang termasuk dalam tingkat kriminalitasnya tinggi / rendah diperlukan data :
Jumlah tindakan kriminalitas (var. dependent) Jumlah polisi, jumlah kantor polisi, jumlah penduduk
berpendapatan rendah, jumlah keluarga yang mendiami permukiman kumuh, jumlah penduduk berpendidikan rendah (var. independent).
Catatan :
Kemampuan untuk mengelompokkan objek pengamatan sangat menentukan keberhasilan analisis diskriminan.
8
FORMULA UMUM ANALISIS DISKRIMINAN
Y = b’ XDimana :
Y = Vektor nilai diskriminan untuk individu (1 x n)
b’ = Vektor bobot diskriminan (1 x p)
X = Matriks yang mengandung nilai-nilai untuk setiap
n individu pada p independen variabel.
9
ANALOGI DENGAN ANALISA REGRESI
Dependen Variabel (Y) pada multiple regresi adalah suatu nilai kuantitatif, sedangkan pada discriminant analysis, dependen variabel adalah suatu nilai kualitatif.
Pada analisis regresi, variabel dependen (Y) menjadi satu fokus yang berubah (prediktif) dan variabel independen (x) relatif tetap, sedangkan pada analisis diskriminan, variabel dependen relatif tetap (kelompok) dan variabel independen berubah-ubah serta terdistribusi normal.
Analisis Regresi menurunkan perkiraan-perkiraan parameter yang telah mempunyai kelengkapan statistik, sedang analisis diskriminan merupakan strategi yang teliti dalam menemukan mean dari pengelompokkan.
10
PERMASALAHAN 2 GROUP
Misal kita memiliki dua kelompok populasi yang bebas. Populasi 1 diambil sampel sebesar n1 serta dipelajari p karakter dari
sampel tersebut. Populasi 2 diambil sampel sebesar n2 serta dipelajari p karakter dari
sampel tersebut.
Sehingga keseluruhan sampel dari populasi 1 danpopulasi 2 adalah n = n1 + n2
11
PERMASALAHAN 2 GROUP (Lanjutan….)
P karakter yang dipelajari bila dinyatakan dalam variabel (multidimensional) melalui vektor x’ = (x1 , x2 ,…., xp)
),.....,,( 111211)1()1( npxn XXXX
),.....,,( 222221)2()2( npxn XXXX
12
PERMASALAH 2 GROUP (Lanjutan….)
Sehingga vektor nilai rata-rata dan matriks variance – kovariance dirumuskan sebagai berikut :
1
11
1
11 n
j
jXn
X
'111
11
11 ))((
1
1 1
XXXXn
S j
n
jj
13
PERMASALAHAN 2 GROUP (Lanjutan…..)
Asumsi populasi mempunyai peragam yang sama yaitu ∑ maka matrik peragam S1 & S2 dapat digabung sebagai penduga bagi ∑ Melalui rata-rata terbobot sebagai berikut :
Diskriminan dibangun untuk menerangkan perbedaan diantara populasi perlu diuji apakah ada perbedaan yang nyata secara statistik (uji statistik “T2-Hotteling”)
)2(
).1().1(
21
2211
nn
SnSnSG
14
UJI HIPOTESIS PADA ANALISIS DISKRIMINAN
H0 : U1 = U2 ; vektor nilai rata-rata dari populasi 1 sama dengan dari populasi 2 H1 : U1 ≠ U2 ; kedua vektor nilai rata-rata itu berbeda
Selanjutnya….
)()(.
211'
21
21
212 XXSXXnn
nnT G
2
21
21
)2(
1Tpnn
pnnF
15
UJI HIPOTESIS PADA DISK. ANALISIS (Lanjutan…..)
F adalah derajat kebebasan yang berdistribusi, dimana v1=
p dab v2 = n1+ n2 – p -1
1. Kaidah keputusan.
Terima Ho : U1 = U2 , jika T2 - tabel ≤ T2 - hitung
2. Selain itu ada alternatif lain :
Terima H0 : U1 = U2, jika F- tabel ≤ F-hitung
Tolak H0 : U1 = U2, jika F- tabel > F-hitung.
16
FUNGSI DISKRIMINAN LINIER FISHER
Dimana : b’ : vektor koefisien pembobot fungsi diskriminan X : vektor variabel acak (yang diident) dalam diskriminan : vektor nilai rata-rata dari variabel acak
kelompok 1: vektor nilai rata-rata dari variabel acak
kelompok 2: invers matriks gabungan
XSXXXbY G ..)( 1'21
'
1X
2X
1GS
17
ATURAN PENGGOLONGAN
Menurut Fisher untuk menetapkan individu dengan nilai x di p pada kelompok 1 :
pada kelompok 2 jika ;
Cara lain adalah Metoda “ mid point “
)()( 2'
1' XXbXXb
)()( 2'
1' XXbXXb
).()( 211'
2121 XXSXXm G
18
ATURAN PENGGOLONGAN (Lanjutan…)
Bila ukuran sampel tidak sama (n1 ≠ n2), maka :
).()( 211'
2121 XXSXXm G
21
2112.
nn
YnYnm
19
ATURAN PENGGOLONGAN “MID POINT”
Kelompok 1 jika yo > m 2 jika yo ≤ mYo = skor diskriminan dari individu
Metode lain adalah Wald Anderson Statistic “W”
Alokasikan pada kelompok 1. Jika W > 0 2. Jika W ≤ 0.
)()(2
1)( 21
112121
11 XXSXXXXSXW GG
20
BAHAN BACAAN
Anderson, Black, Hair and Tatham, Multivariate Data Analysis, Fifth Edition, Prentice Hall, USA, 1998
Gasperz, Teknik Analisis dalam Penelitian Percobaan, Edisi ke-2, Tarsito, Bandung, 1992.
William R Dillon and Mathew Goldstein, Multivariate Analysis Methods and Applications, USA, 1984.
21
Contoh Aplikasi
Analisis Diskriminan
22
Contoh Aplikasi
Sebuah toko yang bernama LAKU KERAS selama ini menduga ada dua kelompok pembeli, yaitu mereka yang sering berbelanja di toko LAKU KERAS dan mereka yang jarang berbelanja di toko tersebut.
Jika ini benar, pihak manajemen ingin mengetahui faktor apa saja yang mendorong seorang konsumen untuk sering atau jarang berbelanja di toko tersebut.
Kepada setiap responden diberikan daftar kuesioner yang memuat pertanyaan tentang pendapat responden terhadap atribut-atribut toko LAKU KERAS serta frekuensi belanja di toko tersebut.
23
Contoh Pertanyaan
Responden memberi tanda ’x’ pada di sembarang tempat di antara garis 1 sampai 5, yang akan diukur oleh periset sebagai jawaban responden dalam bentuk angka.
Semua pengukuran atribut mempunyai arah yang sama, yaitu angka 1 untuk penilaian negatif dan angka 5 untuk penilaian positif.
Hasil pengukuran adalah bersifat numerik seperti 3,4 atau 2,5 dan sebagainya.
Bagaimana dengan fasilitas pendingin udara yang ada pada toko LAKU KERAS?
________________________________________________________________
1. 5.
Sangat Tidak Sejuk Sangat Sejuk
24
Variabel (untuk 40 responden)
1. Layout, yaitu tata letak barang di toko LAKU KERAS.
2. Lengkap, yaitu kelengkapan barang di toko.
3. Harga, yaitu harga yang murah dan kompetitif.
4. Musik, yaitu fasilitas musik untuk para pengunjung toko.
5. AC, yaitu fasilitas pendingin udara untuk pengunjung toko.
6. Lampu, yaitu fasilitas penerangan untuk pengunjung toko.
7. Pelkar, yaitu pelayanan karyawan toko.
8. Pelkasir, yaitu pelayanan kasir toko.
9. Promosi, yaitu kegiatan promosi toko LAKU KERAS.
10. Image, yaitu citra toko di mata konsumen
25
Variabel (lanjutan)
Selain itu kepada setiap konsumen ditanyakan apakah mereka: Sering membeli di toko LAKU KERAS dengan kode 0. Jarang membeli di toko LAKU KERAS dengan kode 1.
Dengan demikian, sekarang terdapat dua kelompok variabel, yaitu:
SEBUAH variabel dependen, yaitu variabel berjenis kategori, dengan kode 0 (sering beli) dan 1 (jarang beli).
SEPULUH variabel independen, yaitu atribut yang diduga membuat perbedaan perilaku konsumen yang menjadi sering membeli atau jarang membeli.
26
Variabel
VARIABEL DEPENDEN
(Kategori)
Y: Kode 0 = Sering
Kode 1 = Jarang
VARIABEL INDEPENDEN
X1 …. Layout
X2 …. Lengkap
X3 …. Harga
Xn …. dst
27
Tujuan Analisis (dalam kasus ini)
1. Apakah perilaku beli konsumen benar-benar berbeda, dalam arti mereka yang sering membeli perilakunya benar-benar berbeda dengan yang jarang membeli?
2. Jika berbeda, variabel bebas mana saja yang membedakan perilaku beli konsumen? Semua variabel bebas atau hanya sebagian? Jika ada sejumlah variabel yang membedakan (diskriminan) maka ada sebuah model diskriminan.
3. Jika ada sejumlah variabel bebas yang membedakan perilaku, variabel mana yang paling penting dan seterusnya?
4. Dilakukan pengujian apakah model diskrimanan tersebut mampu melakukan klasifikasi responden dengan tepat?
28
Langkah Pengerjaan-01
Buka program SPSS dan masukkan data yang ada dengan terlebih dahulu mendefinisikan variabel yang akan dimasukkan datanya
Dari menu utama SPSS, pilih menu Analyze, lalu submenu Classify, kemudian pilih Discriminant.
29
Langkah Pengerjaan-02
Masukkan variabel beli ke grouping variabel yang berfungsi sebagai dependen variabel dan masukkan kode kategori yang dipakai.
Pengisian: Masukkan angka 0 pada minimum. Masukkan angka 1 pada maksimum.
Tekan Continue untuk kembali pada kotak dialog discriminant.
Masukkan variabel-variabel lainnya pada kotak independents yang berarti kesepuluh variabel ini berfungsi sebagai variabel bebas.
30
Langkah Pengerjaan-03
Klik tombol Statistics dan aktifkan pilihan sesuai tampilan layar berikut ......
Klik Continue untuk kembali ke kotak dialog utama.
31
Langkah Pengerjaan-04
Klik mouse pada pilihan Stepwise Method dan klik tombol Method sehingga akan tampak di layar ......
Pilihan Stepwisie berarti pemasukan variabel akan dilakukan secara bertahap.
Pada bagian Method, pilih Mahalanobis Distance dan bagian Criteria pilih Use Probability of F tetapi jangan mengubah isi yang telah ada. Abaikan pilihan yang lain dan tekan Continue untuk kembali ke menu utama.
32
Langkah Pengerjaan-05
Pada menu utama klik tombol Classify, sehingga akan tampak di layar........
Pada bagian Display, aktifkan pilihan Casewise Results dan juga aktifkan pilihan Leave-one-out classification.
Abaikan pilihan yang lain dan klik Continue untuk kembali ke menu utama. Pada menu utama klik OK untuk proses data.
33
Interpretasi-01
Tidak ada data yang hilang: 22 orang sering
belanja 18 orang jarang
belanja Total = 40 orang
Group Statistics
2.8091 1.27126 22 22.000
2.6136 1.01807 22 22.000
3.2227 1.01603 22 22.000
2.7955 1.16393 22 22.000
2.4682 1.10556 22 22.000
2.4455 1.04139 22 22.000
2.2818 .89583 22 22.000
2.9000 1.31258 22 22.000
3.0864 1.14363 22 22.000
2.9364 1.18745 22 22.000
2.8833 .85147 18 18.000
2.7944 1.10479 18 18.000
2.9611 1.02334 18 18.000
2.7833 1.00250 18 18.000
2.9111 .97973 18 18.000
2.6056 1.04795 18 18.000
3.1222 1.09306 18 18.000
2.6111 1.01974 18 18.000
2.6778 1.20614 18 18.000
2.6111 1.04875 18 18.000
2.8425 1.08979 40 40.000
2.6950 1.04806 40 40.000
3.1050 1.01475 40 40.000
2.7900 1.08055 40 40.000
2.6675 1.06130 40 40.000
2.5175 1.03401 40 40.000
2.6600 1.06405 40 40.000
2.7700 1.18413 40 40.000
2.9025 1.17506 40 40.000
2.7900 1.12496 40 40.000
Layout
Lengkap
Harga
Musik
AC
Lampu
Pelkar
Pelkasir
Promosi
Image
Layout
Lengkap
Harga
Musik
AC
Lampu
Pelkar
Pelkasir
Promosi
Image
Layout
Lengkap
Harga
Musik
AC
Lampu
Pelkar
Pelkasir
Promosi
Image
Beli.00
1.00
Total
Mean Std. Deviation Unweighted Weighted
Valid N (listwise)
34
Interpretasi-02
Walupun terdapat satu atribut perbedaan perilaku konsumen tapi secara umum tidak ada perbedaan yang nyata antara mereka yang sering berbelanja di toko LAKU KERAS dengan mereka yang jarang berbelanja di toko tersebut (Tabel Test of Equality of Group Means).
Wilks Lamda:Semakin mendekati nol semakin berbeda
Semakin mendekati satu semakin sama
Sig:Sig>0.05 tidak ada perbedaan
Sig<0.05 ada perbedaan
Semakin tinggi angka F semakin ada perbedaan
Tests of Equality of Group Means
.999 .045 1 38 .833
.992 .289 1 38 .594
.983 .652 1 38 .424
1.000 .001 1 38 .972
.956 1.758 1 38 .193
.994 .233 1 38 .632
.842 7.149 1 38 .011
.985 .583 1 38 .450
.969 1.203 1 38 .280
.979 .824 1 38 .370
Layout
Lengkap
Harga
Musik
AC
Lampu
Pelkar
Pelkasir
Promosi
Image
Wilks'Lambda F df1 df2 Sig.
35
Interpretasi-03
Atribut yang paling membedakan perilaku kedua kelompok tersebut adalah atribut PELKAR
Perhatikan nilai Sig.-nya
Variables Entered/Removeda,b,c,d
Pelkar .722.00 and 1.00
7.149 1 38.000 .011
Step1
Entered StatisticBetweenGroups Statistic df1 df2 Sig.
Exact F
Min. D Squared
At each step, the variable that maximizes the Mahalanobis distance between the two closestgroups is entered.
Maximum number of steps is 20.a.
Maximum significance of F to enter is .05.b.
Minimum significance of F to remove is .10.c.
F level, tolerance, or VIN insufficient for further computation.d.
36
Interpretasi-04
Sehubungan dengan hasil dari no. 2, maka kesembilan atribut yang ada bukanlah variabel yang membedakan perilaku kedua kelompok. Atau dapat dikatakan sikap mereka terhadap kesembilan atribut tersebut relatif sama (sama-sama positif atau sama-sama negatif).
37
Interpretasi-05
Model diskriminan yang ada tidak dapat digunakan karena walaupun hasil menunjukkan tingkat validitasnya di atas 50 % (60% valid), hanya satu variabel yang mempengaruhi pembedaan, itupun tidak cukup signifikan.
Model ini belum dapat digunakan sebagai bahan untuk pengambilan keputusan secara menyeluruh (Tabel Classification Results).
Classification Resultsb,c
15 7 22
8 10 18
68.2 31.8 100.0
44.4 55.6 100.0
14 8 22
8 10 18
63.6 36.4 100.0
44.4 55.6 100.0
Beli.00
1.00
.00
1.00
.00
1.00
.00
1.00
Count
%
Count
%
Original
Cross-validateda
.00 1.00
Predicted GroupMembership
Total
Cross validation is done only for those cases in the analysis. Incross validation, each case is classified by the functions derivedfrom all cases other than that case.
a.
62.5% of original grouped cases correctly classified.b.
60.0% of cross-validated grouped cases correctly classified.c.