Best Subset

7
1 PEMILIHAN MODEL TERBAIK (BACKWARD) Oleh: FahmiCholid (1314030046) Affanda AH Aminullah (1314030048) DesiUsfaliana (1314030064) ZainalAbidin

description

model terbaik

Transcript of Best Subset

Page 1: Best Subset

1

PEMILIHAN MODEL TERBAIK(BACKWARD)

Oleh:FahmiCholid (1314030046)

Affanda AH Aminullah (1314030048)

DesiUsfaliana (1314030064)

ZainalAbidin (1314030068)

DiaLinaWardhati (1314030082)

Page 2: Best Subset

2

BEST SUBSET REGRESSION

Regresi terbaik (best subset Regression) ini merupakan salah satu cara untuk mengatasi multikolinieritas yaitu dengan memilih variabel-variabel bebas yang dapat digunakan dalam model agar diperoleh persamaan regresi terbaik yang mengandung sebagian atau seluruh variabel bebas

Kriteria-kriteria yang dapat digunakan untuk menentukan variabel bebas yang digunakan sehingga diperoleh model terbaik untuk memilih dengan jumlah variabel yang dipilih yaitu:

1. Nilai R-Sq terbesar 2. Nilai R-Sq (Adj) terbesar 3. Nilai C-p terkecil 4. Nilai S terkecil

Page 3: Best Subset

3

BEST SUBSET REGRESSION

Kelemahan Best Subset Regression :Cenderung menghasilkan persamaan regresi

dengan banyak peubah bebas jika banyaknya peubah bebas terlalu kecil, persamaan regresi yang baik tidak terlihat, dan belum ada informasi tercetak yang dengan mudah dapat diperoleh mengenai bagaimana berbagai himpunan bagian itu diperoleh

Page 4: Best Subset

4

BEST SUBSET REGRESSIONContoh Kasus:Apendix B (Drapper and Smith)

No X1 X2 X3 X4 Y

1 7 26 6 60 78.5

2 1 29 15 52 74.3

3 11 56 8 20 104.3

4 11 31 8 47 87.6

5 7 52 6 33 95.9

6 11 55 9 22 109.2

7 3 71 17 6 102.7

8 1 31 22 44 72.5

9 2 54 18 22 93.1

10 21 47 4 26 115.9

11 1 40 23 34 83.8

12 11 66 9 12 113.3

13 10 68 8 12 109.4

Page 5: Best Subset

5

BEST SUBSET REGRESSION

Penyelesaian :Y = X5 versus X1, X2, X3, dan X4. Response is Y

= X5

Variabel Bebas R-Sq R-Sq (adj) C-p Mallows X1 X2 X3 X4

4 67,5 64,7 156,2 X

2 66,6 63.8 160,4 X

1 53,4 49,5 228.0 X

3 28,6 22,6 354,7 X

12 97,9 97,5 2,9 X X

14 97,2 96,7 6,1 X X

34 93,5 92,4 25,0 X X

23 84,7 81,9 60,1 X X

124 98,2 97,7 3,0 X X X

123 98,2 97,8 3,0 X X X

134 98,1 97,6 3,6 X X X

234 97,3 96,5 7,9 X X X

1234 98,2 97,5 5,0 X X X X

Page 6: Best Subset

6

BEST SUBSET REGRESSION

Penyelesaian :

Berdasarkan tabel tersebut dapat dipilih model yang terbaik dengan melihat R-sq yang bernilai besar, R-sq(adj) yang bernilai besar dan nilai Cp Mallows yang kecil. Maka dapat dipilih model dengan variabel X1 dan X2 karena memiliki R-sq yang besar dan Cp Mallows terkecil.

Page 7: Best Subset

7

Terima KasihTerima Kasih