DISCRIMINANT ANALYSIS - staff.ui.ac.idstaff.ui.ac.id/system/files/users/liche/material/...DA dipakai...
Transcript of DISCRIMINANT ANALYSIS - staff.ui.ac.idstaff.ui.ac.id/system/files/users/liche/material/...DA dipakai...
1
DISCRIMINANT DISCRIMINANT
ANALYSISANALYSIS
STATISTIK LANJUT
MAGISTER PROFESI
F.PSI.UI
Liche Seniati
2
Discriminant Analysis
� Merupakan teknik parametrik yang digunakan untuk
menentukan bobot dari prediktor yg paling baik untuk
membedakan dua atau lebih kelompok kasus, yang tidak
terjadi secara kebetulan (Cramer, 2004).
� DA dipakai untuk menjawab pertanyaan bagaimana
individu dapat dimasukkan ke dalam kelompok
berdasarkan beberapa variabel.
� DA adalah metode untuk mencari dasar pengelompokan
individu berdasarkan lebih dari 1 IV.
3
Discriminant Analysis
� Persamaan fungsi diskriminan yang dihasilkan untuk memberikan peramalan yang paling tepat untuk mengklasifikasi individu ke dalam kelompok berdasarkan skor IV.
� DA juga merupakan salah satu bentuk Multiple Regression Analysis, dimana DV berupa kategori
� Jumlah fungsi diskriminan tergantung dari jumlah prediktor (IV) atau jumlah kelompok dikurang 1 (yang paling kecil)
4
Tahap-tahap Perhitungan
Analisis Diskriminan
1. Menghitung Nilai Rata-rata IV pada setiap kelompok
(deskriptif).
2. Menghitung Nilai Uji-F � untuk melihat perbedaan
skor IV (prediktor) pada setiap kelompok.
3. Menghitung Nilai Homogenitas Kovarians Dalam
Kelompok (dengan Box’s M).
4. Mencari Eigenvalue untuk setiap Discriminant
Function => rasio yg dpt dijelaskan dgn fungsi.
5
Tahap-tahap Perhitungan Analisis
Diskriminan
5. Mencari Nilai Canonical Discriminant Function
Coefficients utk setiap fungsi => utk mendptkan
bobot dari setiap IV.
6. Mencari Nilai Signifikansi dari Discriminant
Function (Wilks’ lambda) => sign. fungsi
7. Menentukan klasifikasi (persentase kasus yang
dapat diidentifikasi dengan benar)
6
Contoh
Contoh (dalam Cramer, 2004):
� VB: skor anxious, restless, depressed, and hopeless
� VT: kelompok pasien (normal, cemas, depresi)
Analisis diskriminan pada penelitian ini dilakukan
untuk melihat prediktor yang paling baik untuk
mengelompokkan pasien berdasarkan jenis gangguan
Pada penelitian ini ada 3 kelompok pasien sehingga
akan diperoleh dua fungsi diskriminan.
7
Output SPSS untuk Analisis Diskriminan
Group Statistics
2.20 1.30
2.40 .55
2.00 1.00
2.00 .71
4.00 .71
3.60 1.14
2.20 .84
2.60 .89
2.60 .89
2.60 1.14
4.20 .84
3.80 .84
2.93 1.22
2.87 1.06
2.80 1.32
2.80 1.08
ANXIOUS
RESTLESS
DEPRESSE
HOPELESS
ANXIOUS
RESTLESS
DEPRESSE
HOPELESS
ANXIOUS
RESTLESS
DEPRESSE
HOPELESS
ANXIOUS
RESTLESS
DEPRESSE
HOPELESS
KELP
Normal
Cemas
Depresi
Total
Mean Std. Deviation Kesimpulan:
• Kelompok Pasien Normal
memiliki skor yang paling
rendah dalam semua VB
• Kelompok Pasien Cemas
memiliki skor Anxious dan
Restless yang paling tinggi
• Kelompok Pasien Depresi
memiliki skor Depressed
dan Hopeless yang paling
tinggi
8
Tests of Equality of Group Means
.573 4.467 2 12 .035
.737 2.138 2 12 .161
.393 9.250 2 12 .004
.488 6.300 2 12 .013
ANXIOUS
RESTLESS
DEPRESSE
HOPELESS
Wilks'
Lambda F df1 df2 Sig.
Kesimpulan:
Ada perbedaan Skor VB yang signifikan pada setiap kelompok pasien.
9
Test Results
37.535
.907
20
516.896
.578
Box's M
Approx.
df1
df2
Sig.
F
Tests null hypothesis of equal population covariance matrices.
Kesimpulan:
F tidak signifikan � berarti kovarians dalam setiap kelompok adalah
homogen, sehingga perhitungan selanjutnya dapat dilakukan (asumsi
terpenuhi)
Box's Test of Equality of
Covariance Matrices
10
Summary of Canonical Discriminant Functions
Eigenvalues
2.809a 77.4 77.4 .859
.820a 22.6 100.0 .671
Function1
2
Eigenvalue % of Variance Cumulative %
Canonical
Correlation
First 2 canonical discriminant functions were used in the
analysis.
a.
Nilai Eigenvalue menunjukkan perbandingan varians antar kelompok
dengan varians dalam kelompok. Semakin besar nilai Eigenvalue berarti
semakin besar fungsi diskriminan (pengaruh masing-masing VB).
Output di atas menunjukkan bahwa fungsi diskriminan pertama lebih
besar daripada fungsi diskriminan kedua.
Selain itu, terlihat bahwa fungsi diskriminan pertama menjelaskan
77,4% dari total varians VB dan 22,6% utk fungsi kedua.
11
Wilks' Lambda
.144 20.330 8 .009
.549 6.289 3 .098
Test of Function(s)1 through 2
2
Wilks'
Lambda Chi-square df Sig.
Output ini menunjukkan signifikansi dari fungsi diskriminan (yang
dilihat dari nilai Wilks’ Lambda dan χ2)
Pada output di atas, fungsi diskriminan pertama dan kedua (secara
bersama) adalah signifikan. Namun jika hanya fungsi diskriminan
kedua yang diperhitungkan (dengan menghilangkan fungsi
diskriminan pertama) maka fungsi kedua tidak signifikan.
12
Standardized Canonical Discriminant Function Coefficients
-,421 ,753
-,391 ,299
,646 ,101
,681 ,292
ANXIOUS
RESTLESS
DEPRESSE
HOPELESS
1 2
Function Interpretasi:
Tabel pertama dan tabel kedua
menunjukkan bahwa depressed dan
hopeless merupakan fungsi
diskriminan pertama, sedangkan
anxious dan restless merupakan fungsi
diskriminan kedua.
Secara lebih khusus, tabel kedua
menunjukkan korelasi antara setiap
variabel dengan setiap fungsi
diskriminan. (menunjukkan variabel
yg dpt menjadi diskriminan)
Structure Matrix
,719* ,330
,538* ,537
-,234 ,849*
-,180 ,569*
DEPRESSE
HOPELESS
ANXIOUS
RESTLESS
1 2
Function
Largest absolute correlation between each
variable and any discriminant function
*.
13
Canonical Discriminant Function Coefficient
-,421 ,753
-,397 ,304
,723 ,113
,834 ,358
-1,986 -4,401
ANXIOUS
RESTLESS
DEPRESSE
HOPELESS
(Constant)
1 2
Function
Unstandardized coefficients
Output ini digunakan untuk membuat persamaan fungsi diskriminan
Fungsi diskriminan I = -1,986 + -0,421(anxious) + -0,397(restless) +
0,723(depressed) + 0,834(hopeless)
Fungsi diskriminan II = -4,401 + 0,753(anxious) + 0,304(restless) +
0,113(depressed) + 0,358(hopeless)
14
Interpretasi
Analisis diskriminan dilakukan untuk mengetahui
apakah dari 4 prediktor, yaitu feeling anxious, restless,
depressed, dan hopeless, dapat menentukan apakah
individu akan didiagnosis normal, anxious, dan
depressed. Dari dua fungsi diskriminan yang diperoleh,
fungsi pertama memberikan sumbangan sebesar 77%
terhadap varians DV, fungsi kedua menjelaskan 23%
terhadap varians DV.
Latihan:
Seorang peneliti ingin melihat apakah skor tes kemampuan
verbal dan skor tes kemampuan numerik dapat
membedakan seorang mahasiswa memiliki IPK tinggi atau
rendah.
15
Group Statistics
67.067 12.8745 12 12.000
65.917 13.7110 12 12.000
84.250 10.6355 12 12.000
82.333 11.3184 12 12.000
75.658 14.5051 24 24.000
74.125 14.8823 24 24.000
VERBAL
NUMERIK
VERBAL
NUMERIK
VERBAL
NUMERIK
IPKRendah
Tinggi
Total
Mean Std. Deviation Unweighted Weighted
Valid N (listwise)
16
Kesimpulan:
Berdasarkan Nilai Wilks’ Lambda, Nilai F, dan Signifikansi
: Ada perbedaan Skor Tes Kemampuan Verbal dan Skor Tes
Kemampuan Numerik yang signifikan antara kelompok dengan
IPK Tinggi dan IPK Rendah
Tests of Equality of Group Means
.634 12.706 1 22 .002
.683 10.231 1 22 .004
VERBAL
NUMERIK
Wilks'
Lambda F df1 df2 Sig.
17
Pooled Within-Groups Matrices a
139.433 -6.502
-6.502 158.049
1.000 -.044
-.044 1.000
VERBAL
NUMERIK
VERBAL
NUMERIK
Covariance
Correlation
VERBAL NUMERIK
The covariance matrix has 22 degrees of freedom.a.
Kesimpulan:
• Berdasarkan Covarince: matriks kovarians antara variabel verbal dan
numerik berbeda untuk masing-masing perbandingan
• Berdasarkan Correlation: tidak ada korelasi antara variabel verbal dan
numerik (variabel bebas tidak saling berkorelasi)
18
Covariance Matricesa
165.753 15.292
15.292 187.992
113.114 -28.295
-28.295 128.106
210.397 67.371
67.371 221.484
VERBAL
NUMERIK
VERBAL
NUMERIK
VERBAL
NUMERIK
IPKRendah
Tinggi
Total
VERBAL NUMERIK
The total covariance matrix has 23 degrees of freedom.a.
Kesimpulan:
• Hasil analisis matriks
kovarians menunjukkan
bahwa nilai kovarians
cukup besar untuk masing-
masing kelompok status
dengan dua variabel
diskriminan.
• Hasil Box’s M
menunjukkan kovarians
pada kedua kelompok
adalah sama, sehingga
memenuhi asumsi
kovarians dalam analisis
diskriminan
Test Results
1.467
.441
3
87120.000
.724
Box's M
Approx.
df1
df2
Sig.
F
Tests null hypothesis of equal population covariance matrices.
19
Variables Entered/Removeda,b,c,d
VERBAL .634 1 1 22.000 12.706 1 22.000 .002
NUMERIK .478 2 1 22.000 11.446 2 21.000 .000
Step1
2
Entered Statistic df1 df2 df3 Statistic df1 df2 Sig.
Exact F
Wilks' Lambda
At each step, the variable that minimizes the overall Wilks' Lambda is entered.
Maximum number of steps is 4.a.
Minimum partial F to enter is 3.84.b.
Maximum partial F to remove is 2.71.c.
F level, tolerance, or VIN insufficient for further computation.d.
Kesimpulan:
• Hasil Analisis Diskriminan dengan Metode Stepwise, Nilai Statistik F
dan Signifikansinya menunjukkan bahwa Skor Rata-rata Tes
Kemampuan Verbal maupun Skor Tes Kemampuan Numerik adalah
berbeda pada kelompok IPK Tinggi dan kelompok IPK Rendah.
20
Variables in the Analysis
1.000 12.706
.998 8.959 .683
.998 6.823 .634
VERBAL
VERBAL
NUMERIK
Step1
2
Tolerance F to Remove
Wilks'
Lambda
Variables Not in the Analysis
1.000 1.000 12.706 .634
1.000 1.000 10.231 .683
.998 .998 6.823 .478
VERBAL
NUMERIK
NUMERIK
Step
0
1
Tolerance
Min.
Tolerance F to Enter
Wilks'
Lambda
Wilks' Lambda
1 .634 1 1 22 12.706 1 22.000 1.733E-03
2 .478 2 1 22 11.446 2 21.000 4.348E-04
Step1
2
Number of
Variables Lambda df1 df2 df3 Statistic df1 df2 Sig.
Exact F
21
Kesimpulan:
� Dari Tabel Wilks’ Lambda terlihat bahwa skor tes kemampuan
verbal dan skor tes kemampuan numerik pada kedua kelompok
(IPK tinggi dan rendah) adalah berbeda secara signifikan.
� Dari Tabel Eigenvalues dan Wilks’ Lambda Fungsi Diskriminan
Kanonikal terlihat bahwa variabel diskriminator (tes verbal dan tes
numerikal) memiliki hubungan yang erat dengan IPK.
Eigenvalues
1.090a 100.0 100.0 .722
Function
1
Eigenvalue % of Variance Cumulative %
Canonical
Correlation
First 1 canonical discriminant functions were used in the
analysis.
a.
Wilks' Lambda
.478 15.481 2 .000
Test of Function(s)1
Wilks'
Lambda Chi-square df Sig.
Summary of Canonical Discriminant Functions