Download - 5b IB Analisis Diskriminan

1

ANALISIS DISKRIMINAN

Dr. Ir. Imam Buchori

Ir. Artiningsih, MSi

2

PENDAHULUAN

Pertama kali diperkenalkan oleh Fisher (1936). Digunakan untuk mengetahui variabel-variabel penciri

yang membedakan kelompok populasi yang ada dan juga dapat dipergunakan sebagai kriteria pengelompokkan.

Banyak dipakai dalam berbagai bidang ilmu pengetahuan, misalnya : Psikologi (Lie, 1964), Pendidikan (John, 1968), Geografi (Mather, 1969), Geologi (Davis, 1973) dan berbagai bidang ilmu lainnya.

3

PENDAHULUAN (Lanjutan…)

Pada prinsipnya hampir sama dengan Regression Analysis.

Mempunyai Dependen Variabel (Y) dan Independen Variabel (X) yang mempengaruhi Dependen Variabel.

Regression Analysis : 1. Linier Regression (2 Variabel) 2. Multiple Regression ( >2 Variabel) Discriminant Analysis : 1. Diskriminan 2 Group (2 Variabel Penciri) 2. Diskriminan 3 Group (>2 Variable Penciri)

4

DEFINISI dan CARA KERJA

Definisinya adalah :Teknik analisis statistik untuk menggolongkan populasi /

individu / objek menjadi kelompok-kelompok sendiri dalam sekumpulan variabel independent.

Cara kerjanya adalah :Maksimasi variansi antar kelompok dan minimasi variansi

dalam kelompok.Menentukan nilai setiap individu dalam sampel, dimana

nilai setiap individu adalah rata-rata bobot dari individu dalam sejumlah variabel independent.

5

TUJUAN

Untuk mencari model yang sesuai untuk dapat menentukan objek-objek pengamatan menjadi kelompok-kelompok yang lengkap.

Untuk menentukan kontribusi masing-masing variabel yang terlibat dalam pengklasifikasian.

Sebagai dasar penentuan apakah suatu variabel tertentu perlu dilibatkan dalam analisa pengklasifikasian selanjutnya atau tidak.

6

PRINSIP DASAR / ASUMSI-ASUMSI YANG BERLAKU

Variabel independent (1…p) mempunyai distribusi normal.

Matriks p x p atau matriks variant – covariant untuk setiap kelompok (1…k) harus sama.

Pengamatan dari masing-masing group dipilih secara acak / random.

7

CONTOH PENGGUNAAN :

Untuk menentukan suatu daerah yang termasuk dalam tingkat kriminalitasnya tinggi / rendah diperlukan data :

Jumlah tindakan kriminalitas (var. dependent) Jumlah polisi, jumlah kantor polisi, jumlah penduduk

berpendapatan rendah, jumlah keluarga yang mendiami permukiman kumuh, jumlah penduduk berpendidikan rendah (var. independent).

Catatan :

Kemampuan untuk mengelompokkan objek pengamatan sangat menentukan keberhasilan analisis diskriminan.

8

FORMULA UMUM ANALISIS DISKRIMINAN

Y = b’ XDimana :

Y = Vektor nilai diskriminan untuk individu (1 x n)

b’ = Vektor bobot diskriminan (1 x p)

X = Matriks yang mengandung nilai-nilai untuk setiap

n individu pada p independen variabel.

9

ANALOGI DENGAN ANALISA REGRESI

Dependen Variabel (Y) pada multiple regresi adalah suatu nilai kuantitatif, sedangkan pada discriminant analysis, dependen variabel adalah suatu nilai kualitatif.

Pada analisis regresi, variabel dependen (Y) menjadi satu fokus yang berubah (prediktif) dan variabel independen (x) relatif tetap, sedangkan pada analisis diskriminan, variabel dependen relatif tetap (kelompok) dan variabel independen berubah-ubah serta terdistribusi normal.

Analisis Regresi menurunkan perkiraan-perkiraan parameter yang telah mempunyai kelengkapan statistik, sedang analisis diskriminan merupakan strategi yang teliti dalam menemukan mean dari pengelompokkan.

10

PERMASALAHAN 2 GROUP

Misal kita memiliki dua kelompok populasi yang bebas. Populasi 1 diambil sampel sebesar n1 serta dipelajari p karakter dari

sampel tersebut. Populasi 2 diambil sampel sebesar n2 serta dipelajari p karakter dari

sampel tersebut.

Sehingga keseluruhan sampel dari populasi 1 danpopulasi 2 adalah n = n1 + n2

11

PERMASALAHAN 2 GROUP (Lanjutan….)

P karakter yang dipelajari bila dinyatakan dalam variabel (multidimensional) melalui vektor x’ = (x1 , x2 ,…., xp)

),.....,,( 111211)1()1( npxn XXXX

),.....,,( 222221)2()2( npxn XXXX

12

PERMASALAH 2 GROUP (Lanjutan….)

Sehingga vektor nilai rata-rata dan matriks variance – kovariance dirumuskan sebagai berikut :

1

11

1

11 n

j

jXn

X

'111

11

11 ))((

1

1 1

XXXXn

S j

n

jj

13

PERMASALAHAN 2 GROUP (Lanjutan…..)

Asumsi populasi mempunyai peragam yang sama yaitu ∑ maka matrik peragam S1 & S2 dapat digabung sebagai penduga bagi ∑ Melalui rata-rata terbobot sebagai berikut :

Diskriminan dibangun untuk menerangkan perbedaan diantara populasi perlu diuji apakah ada perbedaan yang nyata secara statistik (uji statistik “T2-Hotteling”)

)2(

).1().1(

21

2211

nn

SnSnSG

14

UJI HIPOTESIS PADA ANALISIS DISKRIMINAN

H0 : U1 = U2 ; vektor nilai rata-rata dari populasi 1 sama dengan dari populasi 2 H1 : U1 ≠ U2 ; kedua vektor nilai rata-rata itu berbeda

Selanjutnya….

)()(.

211'

21

21

212 XXSXXnn

nnT G

2

21

21

)2(

1Tpnn

pnnF

15

UJI HIPOTESIS PADA DISK. ANALISIS (Lanjutan…..)

F adalah derajat kebebasan yang berdistribusi, dimana v1=

p dab v2 = n1+ n2 – p -1

1. Kaidah keputusan.

Terima Ho : U1 = U2 , jika T2 - tabel ≤ T2 - hitung

2. Selain itu ada alternatif lain :

Terima H0 : U1 = U2, jika F- tabel ≤ F-hitung

Tolak H0 : U1 = U2, jika F- tabel > F-hitung.

16

FUNGSI DISKRIMINAN LINIER FISHER

Dimana : b’ : vektor koefisien pembobot fungsi diskriminan X : vektor variabel acak (yang diident) dalam diskriminan : vektor nilai rata-rata dari variabel acak

kelompok 1: vektor nilai rata-rata dari variabel acak

kelompok 2: invers matriks gabungan

XSXXXbY G ..)( 1'21

'

1X

2X

1GS

17

ATURAN PENGGOLONGAN

Menurut Fisher untuk menetapkan individu dengan nilai x di p pada kelompok 1 :

pada kelompok 2 jika ;

Cara lain adalah Metoda “ mid point “

)()( 2'

1' XXbXXb

)()( 2'

1' XXbXXb

).()( 211'

2121 XXSXXm G

18

ATURAN PENGGOLONGAN (Lanjutan…)

Bila ukuran sampel tidak sama (n1 ≠ n2), maka :

).()( 211'

2121 XXSXXm G

21

2112.

nn

YnYnm

19

ATURAN PENGGOLONGAN “MID POINT”

Kelompok 1 jika yo > m 2 jika yo ≤ mYo = skor diskriminan dari individu

Metode lain adalah Wald Anderson Statistic “W”

Alokasikan pada kelompok 1. Jika W > 0 2. Jika W ≤ 0.

)()(2

1)( 21

112121

11 XXSXXXXSXW GG

20

BAHAN BACAAN

Anderson, Black, Hair and Tatham, Multivariate Data Analysis, Fifth Edition, Prentice Hall, USA, 1998

Gasperz, Teknik Analisis dalam Penelitian Percobaan, Edisi ke-2, Tarsito, Bandung, 1992.

William R Dillon and Mathew Goldstein, Multivariate Analysis Methods and Applications, USA, 1984.

21

Contoh Aplikasi

Analisis Diskriminan

22

Contoh Aplikasi

Sebuah toko yang bernama LAKU KERAS selama ini menduga ada dua kelompok pembeli, yaitu mereka yang sering berbelanja di toko LAKU KERAS dan mereka yang jarang berbelanja di toko tersebut.

Jika ini benar, pihak manajemen ingin mengetahui faktor apa saja yang mendorong seorang konsumen untuk sering atau jarang berbelanja di toko tersebut.

Kepada setiap responden diberikan daftar kuesioner yang memuat pertanyaan tentang pendapat responden terhadap atribut-atribut toko LAKU KERAS serta frekuensi belanja di toko tersebut.

23

Contoh Pertanyaan

Responden memberi tanda ’x’ pada di sembarang tempat di antara garis 1 sampai 5, yang akan diukur oleh periset sebagai jawaban responden dalam bentuk angka.

Semua pengukuran atribut mempunyai arah yang sama, yaitu angka 1 untuk penilaian negatif dan angka 5 untuk penilaian positif.

Hasil pengukuran adalah bersifat numerik seperti 3,4 atau 2,5 dan sebagainya.

Bagaimana dengan fasilitas pendingin udara yang ada pada toko LAKU KERAS?

________________________________________________________________

1. 5.

Sangat Tidak Sejuk Sangat Sejuk

24

Variabel (untuk 40 responden)

1. Layout, yaitu tata letak barang di toko LAKU KERAS.

2. Lengkap, yaitu kelengkapan barang di toko.

3. Harga, yaitu harga yang murah dan kompetitif.

4. Musik, yaitu fasilitas musik untuk para pengunjung toko.

5. AC, yaitu fasilitas pendingin udara untuk pengunjung toko.

6. Lampu, yaitu fasilitas penerangan untuk pengunjung toko.

7. Pelkar, yaitu pelayanan karyawan toko.

8. Pelkasir, yaitu pelayanan kasir toko.

9. Promosi, yaitu kegiatan promosi toko LAKU KERAS.

10. Image, yaitu citra toko di mata konsumen

25

Variabel (lanjutan)

Selain itu kepada setiap konsumen ditanyakan apakah mereka: Sering membeli di toko LAKU KERAS dengan kode 0. Jarang membeli di toko LAKU KERAS dengan kode 1.

Dengan demikian, sekarang terdapat dua kelompok variabel, yaitu:

SEBUAH variabel dependen, yaitu variabel berjenis kategori, dengan kode 0 (sering beli) dan 1 (jarang beli).

SEPULUH variabel independen, yaitu atribut yang diduga membuat perbedaan perilaku konsumen yang menjadi sering membeli atau jarang membeli.

26

Variabel

VARIABEL DEPENDEN

(Kategori)

Y: Kode 0 = Sering

Kode 1 = Jarang

VARIABEL INDEPENDEN

X1 …. Layout

X2 …. Lengkap

X3 …. Harga

Xn …. dst

27

Tujuan Analisis (dalam kasus ini)

1. Apakah perilaku beli konsumen benar-benar berbeda, dalam arti mereka yang sering membeli perilakunya benar-benar berbeda dengan yang jarang membeli?

2. Jika berbeda, variabel bebas mana saja yang membedakan perilaku beli konsumen? Semua variabel bebas atau hanya sebagian? Jika ada sejumlah variabel yang membedakan (diskriminan) maka ada sebuah model diskriminan.

3. Jika ada sejumlah variabel bebas yang membedakan perilaku, variabel mana yang paling penting dan seterusnya?

4. Dilakukan pengujian apakah model diskrimanan tersebut mampu melakukan klasifikasi responden dengan tepat?

28

Langkah Pengerjaan-01

Buka program SPSS dan masukkan data yang ada dengan terlebih dahulu mendefinisikan variabel yang akan dimasukkan datanya

Dari menu utama SPSS, pilih menu Analyze, lalu submenu Classify, kemudian pilih Discriminant.

29


Masukkan variabel beli ke grouping variabel yang berfungsi sebagai dependen variabel dan masukkan kode kategori yang dipakai.

Pengisian: Masukkan angka 0 pada minimum. Masukkan angka 1 pada maksimum.

Tekan Continue untuk kembali pada kotak dialog discriminant.

Masukkan variabel-variabel lainnya pada kotak independents yang berarti kesepuluh variabel ini berfungsi sebagai variabel bebas.

30


Klik tombol Statistics dan aktifkan pilihan sesuai tampilan layar berikut ......

Klik Continue untuk kembali ke kotak dialog utama.

31


Klik mouse pada pilihan Stepwise Method dan klik tombol Method sehingga akan tampak di layar ......

Pilihan Stepwisie berarti pemasukan variabel akan dilakukan secara bertahap.

Pada bagian Method, pilih Mahalanobis Distance dan bagian Criteria pilih Use Probability of F tetapi jangan mengubah isi yang telah ada. Abaikan pilihan yang lain dan tekan Continue untuk kembali ke menu utama.

32


Pada menu utama klik tombol Classify, sehingga akan tampak di layar........

Pada bagian Display, aktifkan pilihan Casewise Results dan juga aktifkan pilihan Leave-one-out classification.

Abaikan pilihan yang lain dan klik Continue untuk kembali ke menu utama. Pada menu utama klik OK untuk proses data.

33

Interpretasi-01

Tidak ada data yang hilang: 22 orang sering

belanja 18 orang jarang

belanja Total = 40 orang

Group Statistics

2.8091 1.27126 22 22.000

2.6136 1.01807 22 22.000

3.2227 1.01603 22 22.000

2.7955 1.16393 22 22.000

2.4682 1.10556 22 22.000

2.4455 1.04139 22 22.000

2.2818 .89583 22 22.000

2.9000 1.31258 22 22.000

3.0864 1.14363 22 22.000

2.9364 1.18745 22 22.000

2.8833 .85147 18 18.000

2.7944 1.10479 18 18.000

2.9611 1.02334 18 18.000

2.7833 1.00250 18 18.000

2.9111 .97973 18 18.000

2.6056 1.04795 18 18.000

3.1222 1.09306 18 18.000

2.6111 1.01974 18 18.000

2.6778 1.20614 18 18.000

2.6111 1.04875 18 18.000

2.8425 1.08979 40 40.000

2.6950 1.04806 40 40.000

3.1050 1.01475 40 40.000

2.7900 1.08055 40 40.000

2.6675 1.06130 40 40.000

2.5175 1.03401 40 40.000

2.6600 1.06405 40 40.000

2.7700 1.18413 40 40.000

2.9025 1.17506 40 40.000

2.7900 1.12496 40 40.000

Layout

Lengkap

Harga

Musik

AC

Lampu

Pelkar

Pelkasir

Promosi

Image

Layout

Lengkap

Harga

Musik

AC

Lampu

Pelkar

Pelkasir

Promosi

Image

Layout

Lengkap

Harga

Musik

AC

Lampu

Pelkar

Pelkasir

Promosi

Image

Beli.00

1.00

Total

Mean Std. Deviation Unweighted Weighted

Valid N (listwise)

34

Interpretasi-02

Walupun terdapat satu atribut perbedaan perilaku konsumen tapi secara umum tidak ada perbedaan yang nyata antara mereka yang sering berbelanja di toko LAKU KERAS dengan mereka yang jarang berbelanja di toko tersebut (Tabel Test of Equality of Group Means).

Wilks Lamda:Semakin mendekati nol semakin berbeda

Semakin mendekati satu semakin sama

Sig:Sig>0.05 tidak ada perbedaan

Sig<0.05 ada perbedaan

Semakin tinggi angka F semakin ada perbedaan

Tests of Equality of Group Means

.999 .045 1 38 .833

.992 .289 1 38 .594

.983 .652 1 38 .424

1.000 .001 1 38 .972

.956 1.758 1 38 .193

.994 .233 1 38 .632

.842 7.149 1 38 .011

.985 .583 1 38 .450

.969 1.203 1 38 .280

.979 .824 1 38 .370

Layout

Lengkap

Harga

Musik

AC

Lampu

Pelkar

Pelkasir

Promosi

Image

Wilks'Lambda F df1 df2 Sig.

35

Interpretasi-03

Atribut yang paling membedakan perilaku kedua kelompok tersebut adalah atribut PELKAR

Perhatikan nilai Sig.-nya

Variables Entered/Removeda,b,c,d

Pelkar .722.00 and 1.00

7.149 1 38.000 .011

Step1

Entered StatisticBetweenGroups Statistic df1 df2 Sig.

Exact F

Min. D Squared

At each step, the variable that maximizes the Mahalanobis distance between the two closestgroups is entered.

Maximum number of steps is 20.a.

Maximum significance of F to enter is .05.b.

Minimum significance of F to remove is .10.c.

F level, tolerance, or VIN insufficient for further computation.d.

36

Interpretasi-04

Sehubungan dengan hasil dari no. 2, maka kesembilan atribut yang ada bukanlah variabel yang membedakan perilaku kedua kelompok. Atau dapat dikatakan sikap mereka terhadap kesembilan atribut tersebut relatif sama (sama-sama positif atau sama-sama negatif).

37

Interpretasi-05

Model diskriminan yang ada tidak dapat digunakan karena walaupun hasil menunjukkan tingkat validitasnya di atas 50 % (60% valid), hanya satu variabel yang mempengaruhi pembedaan, itupun tidak cukup signifikan.

Model ini belum dapat digunakan sebagai bahan untuk pengambilan keputusan secara menyeluruh (Tabel Classification Results).

Classification Resultsb,c

15 7 22

8 10 18

68.2 31.8 100.0

44.4 55.6 100.0

14 8 22

8 10 18

63.6 36.4 100.0

44.4 55.6 100.0

Beli.00

1.00

.00

1.00

.00

1.00

.00

1.00

Count

%

Count

%

Original

Cross-validateda

.00 1.00

Predicted GroupMembership

Total

Cross validation is done only for those cases in the analysis. Incross validation, each case is classified by the functions derivedfrom all cases other than that case.

a.

62.5% of original grouped cases correctly classified.b.

60.0% of cross-validated grouped cases correctly classified.c.