Makalah Seminar Sns Viii an Suryana Nrp 1306201710

download Makalah Seminar Sns Viii an Suryana Nrp 1306201710

of 10

Transcript of Makalah Seminar Sns Viii an Suryana Nrp 1306201710

  • 7/23/2019 Makalah Seminar Sns Viii an Suryana Nrp 1306201710

    1/10

    PERBANDINGAN KINERJA PENAKSIRROBUSTMCD

    DAN MWCD DALAM ANALISIS DISKRIMINAN KUADRATIKOleh: Suryana1

    Abstrak

    Penerapan analisis diskriminan untuk mengelompokkan objek atau individu ke dalam salah

    satu kelompok yang telah diketahui dalam suatu populasi begitu saja tidak cukup, perlu

    dipertimbangkan keberadaan pengamatan outlier. Fungsi diskriminan klasik didasarkan pada estimasi

    vektor rata-rata dan matrik kovariansi sampel. Keduanya tidak robust terhadap keberadaan

    pengamatan outlier. Akibatnya fungsi diskriminan yang dihasilkan juga tidak robust. Dengan

    menggantikan vektor rata-rata dan matrik kovariansi sampel klasik dengan vektor rata-rata dan matrik

    kovariansi yang robust akan dihasilkan fungsi diskriminan yang robust juga. Selain itu, seringkali

    ditemukan matrik kovariansi dua kelompok berbeda. Masalah ini tidak dapat diselesaikan dengan

    menggunakan fungsi diskriminan linear. Sebagai solusinya diperlukan fungsi diskriminan kuadratik.

    Kombinasi antara fungsi diskriminan kuadratik dan fungsi diskriminan robust dapat mengatasi

    permasalahan perbedaan matrik kovariansi dan keberadaan pengamatan outlier dalam data. Dalampenelitian ini akan digunakan penggunaan penaksir robust MCD dan MWCD dalam analisis

    diskriminan kuadratik.

    Untuk mengukur kinerja MCD dan MWCD dalam analisis diskriminan kuadratik digunakan

    data simulasi yang terdiri dari data tanpa kontaminasi outlierdan data dengan kontaminasi outlier10,

    25, dan 30 persen. Pertama, ditentukan vektor rata-rata dan matrik kovariansi dengan menggunakan

    MCD dan MWCD. Kedua, dihitung skor masing-masing objek berdasarkan fungsi diskriminan klasik

    dan fungsi diskriminan robust. Terakhir kinerja fungsi diskriminan yang dihasilkan dievaluasi dengan

    menggunakan metode APER. Hasil simulasi menunjukkan kinerja penaksir robust MCD dalam

    analisis diskriminan kuadratik merupakan yang terbaik. Dari 100 pengulangan, rata-rata probabilita

    salah pengelompokkan dari fungsi diskriminan kuadratik dengan menggunakan penaksir MCD

    merupakan yang terkecil. Standar deviasi salah pengelompokkan terkecil dihasilkan oleh penaksir

    robustMWCD meskipun dalam hal rata-ratanya cenderung tidak stabil, pada kasus tertentu terkeciltetapi pada kasus lainnya terbesar.

    Kata Kunci: diskriminan robust, MCD, MWCD, outlier.

    1. Pendahuluan

    Analisis diskriminan adalah salah satu teknik analisis multivariat yang dapat digunakan untuk

    mengelompokkan objek/individu ke dalam kelompok yang telah didefinisikan sebelumnya. Untuk itu,

    diperlukan suatu aturan yang dapat mengenali asal kelompok suatu objek.Dalam analisis diskriminan, data terbagi dalam l kelompok dengan masing-masing jumlah

    observasi n1, n2, . . . , nl di mana 1.

    l

    jjn n

    == Masing-masing observasi dinotasikan dengan ijx

    dengan 1, . . . , li n= dan 1, . . . , .j l= Diasumsikan setiap observasi dalam kelompok j dengan

    1, . . . ,j l= dapat dijelaskan oleh random variabel jX berdimensip dengan densitas .jf Probabilita

    1 Mahasiswa S2 Jurusan Statistika Institut Teknologi Sepuluh Nopember Surabaya

  • 7/23/2019 Makalah Seminar Sns Viii an Suryana Nrp 1306201710

    2/10

    sebuah observasi termasuk dalam kelompok j adalah .jp Bila jfberdistribusi normal multivariat,

    maka sebuah observasi pRx akan termasuk dalam kelompok k jika skor diskriminan kuadratik

    ( ) ( ){ }max ; 1, . . . , ,Q Q

    k jd d j l = =x x

    dengan

    ( ) ( ) ( ) ( )11 1

    ln ln2 2

    tQ

    j j j j j jd p= +x x x ,

    di mana

    j = matrik kovariansi dalam kelompok j ,

    j = vektor rata-rata dalam kelompok j .

    Kenyataannya, j dan j tidak diketahui. Kedua parameter ini ditaksir dari data sampel.

    Penaksir tak bias untuk j dan j adalah danj jx S . Skor diskriminan kuadratik berdasarkan data

    sampel dihitung dengan formula:

    ( ) ( ) ( ) ( )11 1

    ln ln2 2

    tQMLE

    j j j j j jd p= +x S x x S x x .

    Akan tetapi, kedua penaksir danj jx S sangat dipengaruhi oleh kehadiran observasi outlier. Nilai

    breakdown dan

    j j

    x S adalah nol (Casela dan Berger, 2002). Akibatnya, skor diskriminan yang

    dihasilkan menjadi tidakrobust.

    Agar skor diskriminan menjadi robust, j dan j harus ditaksir dengan penaksir robust.

    Penaksir robust vektor rata-rata dan matrik kovariansi diantaranya penaksir S (Rocke, 1996;

    Campbell, 1998; Lopuhaa, 1989; 1991), Minimum Covariance Determinant (MCD) oleh Rousseeuw

    dan Van Driessen (1999) dan Minimum Weighted Covariance Determinant(MWCD) oleh Roelant,

    Van Aelst dan Williems (2006).

    Penerapan penaksir robust dalam analisis diskriminan telah dilakukan beberapa peneliti.

    Perbandingan kinerja fungsi diskriminan linear dengan menggunakan MCD, M, S, dan Orthogonalize

    Gnadadesikan-Kettering telah dikemukakan oleh Todorov dan Pires pada tahun 2007. Hasil kajian

    Todorov dan Pires (2007) menunjukkan tidak ada satupun metode estimasi robustyang dominan pada

    berbagai kondisi. Joossen (2006) membandingkan kinerja diskriminan linear dan kuadratik robust

    dengan menggunakan S dan MCD. Diskriminan kuadratik dengan MCD menghasilkan probabilita

    salah pengelompokkan lebih kecil dibandingkan S.

    Tujuan makalah ini membandingkan kinerja penaksirrobustMCD dan MWCD dalam analisis

    diskriminan kuadratik. Kinerja yang dimaksud diukur dengan probabilita salah pengelompokkan dari

    aturan diskriminan kuadratik yang dihasilkan dibandingkan dengan penaksir yang tidak robust

  • 7/23/2019 Makalah Seminar Sns Viii an Suryana Nrp 1306201710

    3/10

    danj jx S . Penghitungan probabilita salah pengelompokkan dari fungsi diskriminan dengan

    menggunakan metode APER (Apparent Error Rate). Metode ini menyertakan seluruh observasi baik

    pada saat pembentukan fungsi diskriminan maupun pada saat evaluasi kinerja dari fungsi diskriminan

    yang terbentuk. Dalam jumlah data yang besar, metode ini sesuai karena membutuhkan waktu sedikit.

    Penulisan makalah disusun dengan struktur sebagai berikut. Pada bagian selanjutnya akan

    dibahas penaksirrobustMCD dan MWCD. Bagian ini akan mengulas beberapa kelebihan MCD dan

    MWCD dibandingkan penaksir robust lainnya. Pada bagian 3 akan dibahas analisis diskriminan

    kuadratik dengan menggunakan MCD, MWCD dan metode klasik (MLE). Kinerja aturan diskriminan

    dari ketiga metode tersebut diukur dengan menggunakan data simulasi. Makalah ini ditutup dengan

    kesimpulan yang dipaparkan pada bagian 4.

    2. PenaksirRobustMCD dan MWCD dalam Skor Diskriminan Kuadratik

    Menurut Hubert (2001) ada beberapa kelebihan MCD. Pertama, MCD memiliki sifat statistik

    yang baik karena memenuhi sifat affine equivariant dan terdistribusi normal asimtotik. MCD juga

    tergolong penaksir robust tingkat tinggi karena memenuhi batas nilai maksimum 50 persen nilai

    breakdown. Dari sudut pandang ketersediaan paket program, MCD telah terakomodir dalam S-PLUS

    dan SAS dan Matlab dengan menggunakan algoritma Fast-MCD (Van Driessen dan Rousseeuw,

    1999).

    Definisi1 MCD

    MCD merupakan pasangan ( )t X dan ( )C X dari suatu sub sampel berukuran h pengamatandi mana

    determinan matrik kovariansi dari sub-sampel tersebut adalah minimal dengan 0h h n dan 0h

    merupakan nilai integer terkecil dari ( )( )1 / 2n p+ + ,

    ( )( ){ }min det , 1, . . . ,jn

    MCD C jh

    =

    X ,

    dengan:

    ( ) ( ) ( )( ) ( )( )1 1

    1 1;

    1

    h h t

    i i ij ji i

    t C t t h h= =

    = = X x X x X x X

    Untuk menghitung MCD dengan algoritma FAST-MCD dilakukan dengan langkah-langkah sebagai

    berikut:

    a. Ambil sejumlah h0pengamatan yang berbeda. Dari n pengamatan akan dihasilkann

    c

    himpunan

    baru. Nilai h0 yang optimal memenuhi (n +p + 1)/2.

  • 7/23/2019 Makalah Seminar Sns Viii an Suryana Nrp 1306201710

    4/10

    b. Definisikan himpunan pertama sebagai H1. Berdasarkan himpunan H1 hitung vektor rata-rata dan

    matrik kovariansi ( )1 1,x S . Selanjutnya hitung det(S1).

    c. Definisikan himpunan kedua H2. Berdasarkan himpunan H1 hitung vektor rata-rata dan matrik

    kovariansi ( )2 2,x S . Selanjutnya hitung det(S2).

    d. Bandingkan det(S2) dengan det(S1). Bila det(S2) det(S1) ulangi langkah pada poin c untuk

    himpunan berikutnya sampai dipenuhi kondisi det(Sm+1) = det(Sm).

    e. Tetapkan anggota himpunanHm sebagai himpunan dengan determinan matrik kovariansi terkecil.

    f. BerdasarkanHm data selanjutnya diberi bobot

    ( ) ( )1 2,0.9751 jika

    0 jika lainnya

    t

    i m m i m piw

    =

    x x S x x

    g. Berdasarkan bobot pada , maka MCD dihitung sebagai

    ( ) ( )

    1

    1

    1

    1

    1

    n

    i i

    iMCD n

    i

    i

    nt

    i i MCD i MCD

    i

    MCD n

    i

    i

    w

    w

    w

    w

    =

    =

    =

    =

    =

    =

    x

    x

    x x x x

    S

    Skor diskriminan kuadratik dengan menggunakan penaksir robust MCD diperoleh dengan

    menggantikan penaksir vektor rata-rata dan matrik kovariansi pada dengan . Adapun formulasinya

    sebagai berikut:

    ( ) ( ) ( ) ( )11 1

    ln ln2 2

    tQMCD

    j MCDj MCDj MCDj MCDj jd p= +x S x x S x x .

    Observasi pRx akan termasuk dalam kelompok k jika skor diskriminan kuadratik

    ( ) ( ){ }max ; 1, . . . , .QMCD QMCDk jd d j l = =x x

    Penaksir robust MWCD adalah pengembangan lebih lanjut MCD. Dengan memberikan

    pembobot yang berbeda pada h subset matrik data X yang determinan matrik kovariansi minimal

    menjadikan MCD menjadi MWCD.

    Definisi 2 MWCD (Roelant dkk, 2006)

    Pertimbangkan suatu fungsi pembobot ( ) ( )( )/ 1 , 1, . . . ,na i h i n i n+= + = dengan

    ( ): 0,1 [0, )h+ sedemikian sehingga

  • 7/23/2019 Makalah Seminar Sns Viii an Suryana Nrp 1306201710

    5/10

    ( ){ }sup ; 0 1u h u + > =

    dengan ( ) (0 1 2 dan 0 untuk 0,1 ].h u u + >

    MWCD adalah setiap penyelesaian

    ( )( ) ( ), ;det 1

    , arg min ,MWCD n MWCD nm C C

    X C D m C=

    =

    dengan

    ( ) ( ) ( )

    ( ) ( ) ( )

    ( ) ( ) ( )

    2

    1

    2 1

    2 2 2

    1

    , ,

    ,

    rank dari , di antara , , . . . , ,

    n

    n n i i

    i

    t

    i i i

    i i n

    D m C a R d m C

    d m C x m C x m

    R d m C d m C d m C

    =

    =

    =

    =

    Beberapa sifat baik dari MWCD adalah:

    a.BreakdownPointdari MWCD

    ( ) ( )* *min( 1, ( )) , , nn MWCD n n MWCD n

    n k k k X X X

    n

    + = =

    dengan

    k= jumlah observasi yang diberi bobot tidak sama dengan nol.

    ( )nk X = jumlah observasi maksimal yang terletak pada hyperplane yang sama daripR .

    b. Pada data dengan sedikit kontaminasi outliermenghasilkan MSE dan Bias yang lebih kecil.

    Skor diskriminan kuadratik dengan menggunakan penaksir robustMWCD diperoleh dengan

    menggantikan penaksir vektor rata-rata dan matrik kovariansi pada dengan . Adapun formulasinya

    sebagai berikut:

    ( ) ( ) ( ) ( )11 1 ln ln2 2

    tQMWCD

    j MWCDj MWCDj MWCDj MWCDj jd p= +x x x .

    Observasi p

    Rxakan termasuk dalam kelompok

    k

    jika skor diskriminan kuadratik

    ( ) ( ){ }max ; 1, . . . , .QMWCD QMWCDk jd d j l = =x x

    3. Analisis Diskriminan Kuadratik

    Pada bagian ini penaksir robust MCD dan MWCD akan dielaborasi dengan skor diskriminan

    kuadratik. Jumlah kelompok yang diamati dibatasi hanya dua kelompok masing-masing tiga variabel

    yang dibangkitkan dari distribusi normal multivariat. Dampak penggantian penaksir matrik kovariansi

    MLE dengan penaksir robustMCD dan MWCD dilihat dari probabilita salah pengelompokkan dari

  • 7/23/2019 Makalah Seminar Sns Viii an Suryana Nrp 1306201710

    6/10

    skor diskriminan kuadaratik yang dihasilkan. Untuk maksud tersebut digunakan data simulasi pada

    empat kondisi.

    Kondisi A menggambarkan data tanpa kontaminasi outlier. Sebanyak 2000 data dibangkitkan

    dari dua kelompok masing-masing terdiri dari 1000 data yang berasal dari distribusi normal

    multivariat dengan matrik kovariansi yang berbeda. Adapun rinciannya sebagai berikut:

    1 3

    2 3

    1 0.4 0 0

    1000 0 , 0 0.4 0 ,

    0 0 0 0.4

    0 0.25 0 0

    1000 1 , 0 0.75 0 .

    0 0 0 0.75

    N

    N

    = =

    Kondisi B menggambarkan data dengan kontaminasi outlier sebanyak 10 persen. Data

    masing-masing kelompok terdiri dari 900 data seperti pada kondisi A ditambah dengan 100 data yang

    didefinisikan sebagai kontaminan. Dengan mengubah struktur vektor rata-rata dan matrik kovariansi

    diharapkan terjadi pergeseran parameter lokasi dan parameter skala pada kedua kelompok dari kondisi

    A.

    1 3 3

    2 3 3

    1 0.4 0 0 0 0.1 0 0

    900 0 , 0 0.4 0 100 6 0 , 0 0.1 0 ,

    0 0 0 0.4 1 0 0 0.1

    0 0.25 0 0 1 0.1

    900 1 , 0 0.75 0 100 6 0 ,25

    0 0 0 0.75 0

    N N

    N N

    = +

    = +

    0 0

    0 0.1 0 .

    0 0 0.1

    Kondisi C menggambarkan data dengan kontaminasi outlier 25 persen. Berbeda

    dengan dua kondisi sebelumnya, jumlah observasi masing-masing kelompok berbeda.

    Kelompok 1 terdiri dari 1500 data terdiri dari 1125 data dasar dan 375 data kontaminan.

    Kelompok 2 terdiri dari 500 data terdiri dari 375 data dasar dan 125 data kontaminan. Strukturdata kondisi C selengkapnya sebagai berikut:

    1 3 3

    2 3 3

    1 0.4 0 0 0 0.1 0 0

    1125 0 , 0 0.4 0 375 6 0 , 0 0.1 0 ,

    0 0 0 0.4 1 0 0 0.1

    0 0.25 0 0 1 0.

    375 1 , 0 0.75 0 125 6 0 ,25

    0 0 0 0.75 0

    N N

    N N

    = +

    = +

    1 0 0

    0 0.1 0 .

    0 0 0.1

  • 7/23/2019 Makalah Seminar Sns Viii an Suryana Nrp 1306201710

    7/10

    Terakhir, kondisi D menggambarkan data dengan kontaminasi outlier 30 persen

    dengan jumlah observasi kedua kelompok sama. Struktur data kondisi D sebagai berikut:

    1 3 3

    2 3 3

    1 0.4 0 0 0 0.1 0 0

    700 0 , 0 0.4 0 300 6 0 , 0 0.1 0 ,

    0 0 0 0.4 1 0 0 0.1

    0 0.25 0 0 1 0.1

    700 1 , 0 0.75 0 300 6 0 ,25

    0 0 0 0.75 0

    N N

    N N

    = + = +

    0 0

    0 0.1 0 .

    0 0 0.1

    Masing-masing dari keempat kondisi data diulangi hingga 100 kali pengulangan.

    Probabilita salah pengelompokkan dicatat untuk setiap kali pengulangan. Selanjutnya dihitung

    rata-rata dan standar deviasi probabilita salah pengelompokkan dari 100 pengulangan

    tersebut. Semakin kecil rata-rata probabilita salah pengelompokkan menunjukkan semakin

    baik kinerja penaksir vektor rata-rata dan matrik kovariansi dalam analisis diskriminan

    kuadratik. Semakin kecil standar deviasi probabilita salah pengelompokkan menunjukkan

    fungsi diskriminan kuadratik yang dihasilkan semakin reliabel.

    3.1 Hasil Simulasi Data Kondisi A

    Tabel 1 menunjukkan rata-rata dan standar deviasi (angka di dalam kurung) dari 100pengulangan data kondisi A. Angka 10, 25 dan 30 yang menyertai huruf kapital A

    menunjukkan proporsi data yang diberikan bobot nol pada saat penghitungan skor

    diskriminan kuadratik dengan menggunakan penaksir robust matrik kovariansi. Pada kasus

    data tanpa kontaminasi tampak bahwa probabilita salah pengelompokkan dari diskriminan

    kuadratik antara penaksirrobustdan tidakrobusttidak menunjukkan perbedaan yang berarti.

    Tabel 1. Rata-rata dan Standar Deviasi probabilita salah pengelompokkan dari 100

    pengulangan fungsi diskriminan kuadratik pada kondisi A dengan menggunakan

    penaksir MLE, MCD dan MWCD.

    Data Statistik Penaksir

    MLE MCD MWCD

    A_10Rata-rata

    Standar Deviasi

    0.12913

    (0.0075149)

    0.12373

    (0.0082546)

    0.12954

    (0.0076165)

    A_25Rata-rata

    Standar Deviasi

    0.12858

    (0.0066456)

    0.1229

    (0.0066279)

    0.12964

    (0.0065508)

    A_30Rata-rata

    Standar Deviasi

    0.12859

    (0.0078026)

    0.12271

    (0.0089719)

    0.12964

    (0.0084093)

    Sumber: Hasil Pengolahan dengan Matlab 7.01

  • 7/23/2019 Makalah Seminar Sns Viii an Suryana Nrp 1306201710

    8/10

    Meskipun demikian, secara absolut penaksir robust MCD menunjukkan kinerja

    terbaik. Hal ini ditunjukkan dengan rata-rata probabilita salah pengelompokkan terkecil. Jika

    ketiga metode penaksir disusun dari rata-rata salah pengelompokkannya tampak MCD < MLE

    < MWCD. Akan tetapi dari standar deviasinya, penaksir MCD menghasilkan standar deviasi

    yang lebih besar dari kedua metode lainnya.

    3.2 Hasil Simulasi Data Kondisi B

    Dengan menyertakan 10 persen outlier pada data dasar berdampak pada kinerja fungsi

    diskriminan kuadratik. Kinerja MLE dan MWCD tampak memburuk. Rata-rata probabilita salah

    pengelompokkan menjadi lebih besar daripada kondisi A. Penaksir MCD cenderung stabil. Hal ini

    menunjukkan bahwa dengan kehadiran 10 persen observasi outlier, penaksir robust MCD tetap

    resisten sekaligus menjadikan kinerja fungsi diskriminan kuadratik yang dihasilkan juga resisten

    terhadap kehadiran observasi outlier. Meskipun rata-rata salah pengelompokkan penaksir MWCD

    lebih besar dari penaksir MLE namun dari standar deviasinya ternyata lebih kecil. Hasil selengkapnya

    dapat diamati pada Tabel 2.

    Tabel 2. Rata-rata dan Standar Deviasi probabilita salah pengelompokkan dari 100

    pengulangan fungsi diskriminan kuadratik pada kondisi B dengan menggunakan

    penaksir MLE, MCD dan MWCD.

    Data Statistik

    Penaksir

    MLE MCD MWCD

    B_10Rata-rata

    Standar Deviasi

    0.18813

    (0.010039)

    0.1272

    (0.0078783)

    0.21521

    (0.0073392)

    B_25Rata-rata

    Standar Deviasi

    0.1887

    (0.01034)

    0.12582

    (0.0080923)

    0.21582

    (0.0070881)

    B_30Rata-rata

    Standar Deviasi

    0.18924

    (0.010012)

    0.12548

    (0.0081907)

    0.21584

    (0.0068807)

    Sumber: Hasil Pengolahan dengan Matlab 7.01

    3.3 Hasil Simulasi Data Kondisi C

    Pada kondisi C, penaksir MWCD dengan hanya menyertakan 90 persen data (Baris C_10)

    memberikan rata-rata salah pengelompokkan terkecil. Akan tetapi, pada C_25 dan C_30 rata-rata salah

    pengelompokkan kembali menjadi besar. Secara keseluruhan, Tabel 3 menunjukkan bahwa penaksir

    MCD menunjukkan kinerja yang lebih baik karena rata-rata salah pengelompokkan yang dihasilkan

    cenderung stabil dan lebih kecil dari MLE dan MWCD.

  • 7/23/2019 Makalah Seminar Sns Viii an Suryana Nrp 1306201710

    9/10

    Tabel 3. Rata-rata dan Standar Deviasi probabilita salah pengelompokkan dari 100

    pengulangan fungsi diskriminan kuadratik pada kondisi C dengan menggunakanpenaksir MLE, MCD dan MWCD.

    Data Statistik

    Penaksir

    MLE MCD MWCD

    C_10Rata-rata

    Standar Deviasi

    0.12121

    (0.0061792)

    0.11182

    (0.007014)

    0.10669

    (0.0057396)

    C_25Rata-rata

    Standar Deviasi

    0.12027

    (0.006694)

    0.11385

    (0.0074471)

    0.33479

    (0.0058019)

    C_30Rata-rata

    Standar Deviasi

    0.12028

    (0.0070776)

    0.10465

    (0.008297)

    0.33227

    (0.0062444)Sumber: Hasil Pengolahan dengan Matlab 7.01

    3.4 Hasil Simulasi Data Kondisi D

    Pada kondisi D, penaksir MWCD menujukkan kinerja yang tidak stabil. Rata-rata

    salah pengelompokkan penaksir MWCD terendah pada D_25 tetapi terburuk pada D_30.

    Secara umum kinerja MCD merupakan yang terbaik. Akan tetapi hasilnya tidak berbeda jauh

    dari penaksir MLE. Hasil selengkapnya dapat dilihat pada Tabel 4.

    Tabel 4. Rata-rata dan Standar Deviasi probabilita salah pengelompokkan dari 100

    pengulangan fungsi diskriminan kuadratik pada kondisi D dengan menggunakan

    penaksir MLE, MCD dan MWCD.

    Data Statistik

    Penaksir

    MLE MCD MWCD

    D_10Rata-rata

    Standar Deviasi

    0.15874

    (0.0080868)

    0.15309

    (0.0087087)

    0.18588

    (0.0097196)

    D_25Rata-rata

    Standar Deviasi

    0.15939

    (0.0082047)

    0.15608

    (0.010279)

    0.12268

    (0.011725)

    D_30Rata-rata

    Standar Deviasi

    0.15807

    (0.0085093)

    0.14563

    (0.012834)

    0.39075

    (0.0061293)

    Sumber: Hasil Pengolahan dengan Matlab 7.01

    4. Kesimpulan

    Berdasarkan hasil simulasi dari keempat kondisi data pada bagian 3, dapat ditarik

    beberapa kesimpulan sebagai berikut:

  • 7/23/2019 Makalah Seminar Sns Viii an Suryana Nrp 1306201710

    10/10

    1. Telah ditunjukkan dengan data simulasi bahwa kinerja penaksir robust MCD dalam

    diskriminan kuadratik menghasilkan proporsi salah pengelompokkan yang lebih kecil

    baik pada data terkontaminasi maupun data tanpa kontaminasi.

    2. Pada data tanpa kontaminasi outlier, kinerja penaksirrobustmatrik kovariansi MCD dan

    MWCD hampir serupa dengan kinerja penaksir MLE.

    3. Kinerja penaksirrobust MCD cenderung menghasilkan proporsi salah pengelompokkan

    yang lebih kecil dibandingkan dengan penaksir MLE dan MWCD.

    4. Kinerja penaksir robust MWCD dalam analisis diskriminan kuadratik cenderung

    menunjukkan kinerja yang tidak stabil. Meskipun demikian, standar deviasi yang

    dihasilkan cenderung lebih kecil dari kedua metode lainnya.

    5. Referensi

    Campbell, N. A., Lopuha, H. P., dan Rousseeuw, P. J., (1998), On The Calculation Of A Robust S-

    Estimator Of A Covariance Matrix, Statist. Med., 17, 2685 2695.

    Croux, Christophe dan Dehon, Catherine, (2001), Robust Linear Discriminant Analysis using S-

    estimators, The Canadian Journal of Statistics, Vol. 29, 473 492.

    Hawkins, Douglas M. dan McLachlan, Geoffrey J., (1997), High-Breakdown Linear Discriminant

    Analysis,Journal of the American Statistical Association, Vol. 92, N0. 437, 136 143.

    Hubert, M. dan Van Driessen, K., (2004), "Fast and Robust Discriminant Analysis," Computational

    Statistics and Data Analysis, 45, 301-320.

    Joossens, Kristel, (2006), Robust Diskriminan Analysis, Tesis Ph.D., Katholieke Universiteit Leuven,

    Leuven.

    Lopuhaa. H.P, (1989), On the Relation between S-estimators and M-estimator of multivariate location

    and ovariance.Ann. Statist. 17, 1662-1683.

    -----------------, (1991), Breakdown Point and Asymptotyc Properties of Multivariate S-Estimators

    and -Estimators: A Summary, dalam Directions in Robust Statistics and Diagnostics Part I,

    Editors: Stahel, Werner dan Weisberg, Sanford, The IMA Volumes in Mathematics and Its

    Applications, Springer-Verlag, Volume 33.

    Roelant, E., VanAelst, S., dan Williems, G., (2006), The Minimum Weighted Covariance

    Determinant, ICORS, Lisbon.

    Rocke D.M. (1996) Robustness properties of s-estimators of multivariate location and shape in high

    dimension,Annals of Statistics, 24, 13271345.

    Rousseeuw, Peter J., dan Van Driessen, K., (1999), A Fast Algorithm for the Minimum CovarianceDeterminant Estimator, Technometrics. Vol. 41, No. 3, 212-223.

    Todorov, Valentine, dan Pires, Ana M., (2007), Comparative Performace of Several Robust Linear

    Discriminant Analysis Methods,REVSTAT Statistical Journal, Volume 5, Number 1, 6383.