..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan...

26
..::Data Mining::.. Prediksi Data Mining-Prediksi-Adam AB Mata Kuliah Data warehouse Univ. Darma Persada Oleh: Adam Arif Budiman 2012

Transcript of ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan...

Page 1: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

..::Data Mining::..Prediksi

Data Mining-Prediksi-Adam AB

Prediksi

Mata Kuliah

Data warehouse

Univ. Darma Persada

Oleh:

Adam Arif Budiman

2012

Page 2: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Prediksi

• Dalam estimasi kita memperkirakan suatu hal misalnya rata-rata populasi dari sampel.

• Estimasi dilakukan berdasarkan sampel

Data Mining-Prediksi-Adam AB 2

• Estimasi dilakukan berdasarkan sampel yang ada di tangan kita

• Prediksi?

Page 3: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Prediksi (lanj)

• Dalam prediksi kita menggunakan data

yang ada di tangan kita untuk memprediksi

hasil dari satu hal baru yang akan muncul

selanjutnya.

• Jadi estimasi dilakukan untuk

Data Mining-Prediksi-Adam AB 3

• Jadi estimasi dilakukan untuk

memperkirakan hal yang tidak kita ketahui

(rata-rata populasi, varians populasi)

• Prediksi memperkirakan hasil dari hal yang

belum terjadi. Kita dapat menunggu hingga

hal tersebut terjadi untuk membuktikan

seberapa tepat prediksi kita.

Page 4: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Prediksi (lanj)

• Dalam statistika dikenal dua cara untuk memprediksi yaitu dengan cara regresi linear dan regresi linear berganda

Data Mining-Prediksi-Adam AB 4

Page 5: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Regresi linear

• Bila diketahui data sbb:

• Berapa lama waktu yang diperlukan untuk mengantarkan pesanan yang ke 26 dengan jarak

Data Mining-Prediksi-Adam AB 5

yang ke 26 dengan jarak sekian kilometer?

Page 6: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Regresi Linear (lanj)

• Terdapat dua jenis regresi yaitu:

1. Regresi linear sederhana � hanya melibatkan satu variabel pemberi pengaruh

Data Mining-Prediksi-Adam AB 6

pengaruh

2. Regresi linear berganda � melibatkan lebih dari satu variabel pemberi pengaruh

Page 7: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Regresi (lanj)

• Variabel: besaran yang berubah nilainya

• Variabel �variabel pemberi pengaruh (sebab)

• � variabel terpengaruh

Data Mining-Prediksi-Adam AB 7

• � variabel terpengaruh (akibat)

• Contoh: jarak toko dan waktu tempuh

� jarak sebagai sebab, waktu yang

diperlukan sebagai akibat.

Page 8: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Regresi Linear Sederhana (lanj)

• Grafik pada data pada slide 5 bila digambarkan akan seperti di bawah ini.

• Bagaimana kecenderungan titik di grafik tersebut?

jarak vs waktu

80

Data Mining-Prediksi-Adam AB 8

0

10

20

30

40

50

60

70

80

0 2 4 6 8

jarak

wak

tu

Page 9: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Regresi linear sederhana (lanj)

jarak vs waktu

50

60

70

80w

ak

tu

Data Mining-Prediksi-Adam AB 9

0

10

20

30

40

0 2 4 6 8

jarak

wak

tu

Page 10: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Regresi linear sederhana (lanj)

• Regresi linear sederhana merupakan yang menggunakan garis lurus untuk menggambarkan hubungan diantara dua variabel atau lebih.

Data Mining-Prediksi-Adam AB 10

dua variabel atau lebih.

• Dari kasus ini variabel tersebut adalah jarak dan waktu, dengan jarak sebagai sumbu x (dalam km), waktu

sebagai sumbu y (dalam menit)

Page 11: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Regresi linear sederhana (lanj)

• Kita mencari garis yang mendekati titik-titik sehingga garis tersebut dapat dijadikan acuan untuk prediksi titik berikutnya

• Secara umum garis tersebut dapat

Data Mining-Prediksi-Adam AB 11

• Secara umum garis tersebut dapat dituliskan dalam bentuk persamaan garis

� Y = β0

+ β1X

Page 12: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Regresi linear Sederhana (lanj)

• Y = variabel terpengaruh

• β0

= konstanta

• β1

= gradient garis

• X = variabel pemberi pengaruh

Data Mining-Prediksi-Adam AB 12

• X = variabel pemberi pengaruh

Page 13: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Regresi linear sederhana (lanj)

• Bagaimana cara mencari garis regresi yang paling baik?

• Menghitung konstanta (β0) dan gradient

(β1) dengan rumus:

Data Mining-Prediksi-Adam AB 13

jarak vs waktu

0

10

20

30

40

50

60

70

80

0 2 4 6 8

jarak

waktu

Page 14: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Regresi linear sederhana (lanj)

• Dengan rumus

di atas, maka

hasil

perhitungan

pada tabel

jarak dan

Data Mining-Prediksi-Adam AB 14

jarak dan

waktu

menjadi:

Page 15: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Regresi linear sederhana (lanj)

β1 =

2745.81- (752.42) (82.94)

25

353.18 - (82.94)2

25

= 4.35

Data Mining-Prediksi-Adam AB 15

β0 = 29.02 – 4.35 (3.32) = 14.58

• Sehingga persamaan regresinya adalah :

Y = 14.58 + 4.35x

Page 16: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Regresi linear sederhana (lanj)

• Pengetahuan apa yang bisa diperoleh dari pengolahan data di atas?

�Kita bisa memprediksikan waktu tempuh pengiriman pesanan sama dengan 14.58 menit ditambah 4.35 kali jarak rumah

Data Mining-Prediksi-Adam AB 16

menit ditambah 4.35 kali jarak rumah pelanggan

�Misal, pelanggan ke 26 berjarak 1.5 km maka waktu tempuh adalah

Y = 14.58 + (4.35) (1.5)

= 21.1 (menit)

Page 17: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Regresi linear berganda

• Bagaimana bila variabel masukan/pemberi pengaruh lebih dari satu?

• � k buah variabel

• Y = β0

+ β1X1 + β

2X2 + … + β

kXk

Data Mining-Prediksi-Adam AB 17

• Y = β0

+ β1X1 + β

2X2 + … + β

kXk

• Bila kita memiliki (k+1) buah persamaan sementara variabel yang tidak kita ketahui juga sebanyak (k+1) maka persamaan di atas bisa menjadi ….

Page 18: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Regresi linear berganda (lanj)

Data Mining-Prediksi-Adam AB 18

Page 19: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Regresi linear berganda (lanj)

• Y = β0

+ β1X1 + β

2X2 + … + β

kXk

• Bila kita isikan data pada tabel di atas makaakan diperoleh persamaan

• 25β0

+ β1(206) + β

2(82.94) = 725.42

• β0(206) + β

1(2396) + β

2(771.77) = 8001.67

Data Mining-Prediksi-Adam AB 19

• β0(206) + β

1(2396) + β

2(771.77) = 8001.67

• β0(82.94) + β

1(771.77) + β

2(353.18) = 2745.81

• Ketiga persamaan di atas diselesaikansehingga diperoleh nilai β0 = 2.31, β1 = 2.74, β2 = 1.24

Page 20: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Regresi linear berganda (lanj)

• Sehingga persamaan umum model di atas

adalah :

Y = 2.31 + 2.74X1 + 1.24X2

• Pengetahuan apa yang bisa diperoleh?

Data Mining-Prediksi-Adam AB 20

• Pengetahuan apa yang bisa diperoleh?

• Kita bisa memprediksi bahwa bila kita

mengantarkan pesanan maka akan diperoleh

waktu sama dengan 2.31 menit ditambah 2.74

kali banyaknya lampu merah yang ditemui dan

ditambah 1.24 kali jarak rumah pelanggan

Page 21: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Regresi linear berganda (lanj)

• Bila jarak rumah pelanggan ke – 26 adalah 1.5 dari restoran dan akan melewati lampu merah 1 buah maka waktu hantar adalah 6.91 menit

Data Mining-Prediksi-Adam AB 21

Page 22: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Lampiran 1 menyelesai

kan persamaan

regresi

Data Mining-Prediksi-Adam AB 22

Page 23: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Data Mining-Prediksi-Adam AB 23

Page 24: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

Data Mining-Prediksi-Adam AB 24

Page 25: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

latihan• Buatlah

persamaan regresi dan simpulkan pengetahuan yang

Data Mining-Prediksi-Adam AB 25

yang diperoleh

Page 26: ..::Data Mining::.. - never stop learning | Ikatlah ilmu … yaitu dengan cara regresi linear dan regresi linear berganda Data Mining-Prediksi-Adam AB 4 Regresi linear • Bila diketahui

referensi

Data Mining-Prediksi-Adam AB 26