Pertemuan 11 EDA 2015

32
Diagram Pencar (scatter plot), Keterkaitan variabel kuantitatif, Membuat plot pola linier sempurna, non linier, linier melebar, Persamaan regresi linier sederhana Pertemuan 11

description

analisis data elsploratif

Transcript of Pertemuan 11 EDA 2015

Page 1: Pertemuan 11 EDA 2015

Diagram Pencar (scatter plot),

Keterkaitan variabel kuantitatif,

Membuat plot pola linier sempurna,

non linier, linier melebar,

Persamaan regresi linier sederhana

Pertemuan 11

Page 2: Pertemuan 11 EDA 2015

Diagram Pencar

Keterkaitan variabel kuantitatif

Membedakan variabel bebas dan tak bebas

Macam-macam Plot terkait var bebas dan tak bebas

(linear, non linear, linear melebar, dll)

Persamaan regresi linear sederhana

Page 3: Pertemuan 11 EDA 2015

Research biasanya sering membutuhkan gambaran

untuk mengetahui hubungan antara dua variabel

sebagai deskripsi data.

Cara yg paling sederhana untuk menggambarkan

hubungan antara x dan y adalah dengan sebuah

grafik yang disebut diagram pencar.

Untuk membuat sebuah diagram pencar, nilai y

ditempatkan berlawanan dngan nilai x untuk

masing-masing subjek. Hasil sebaran titik-titik

menunjukkan variasi nilai y pada nilai x yang

berbeda-beda.

Page 4: Pertemuan 11 EDA 2015

Most often a scatter diagram is used to prove or disprove cause-

and-effect relationships.

While the diagram shows relationships, it does not by itself prove that one variable causes the other. In addition to showing possible cause and effect relationships, a scatter diagram can show that two variables are from a common cause that is unknown or that one variable can be used as a surrogate for the other.

Diagram pencar sangat berguna untuk mendapatkan suatu kesan visual mengenai suatu hubungan, penggambaran yang lebih kuantitatif yang sering diperlukan.

Jika kita ingin menganalisis secara kuantitatif kesesuaian sebuah garis atau kurva pada sampel data dg diagram pencar, maka dibutuhkan suatu ukuran korelasi. (yang biasa digunakan regresi dan korelasi).

Page 5: Pertemuan 11 EDA 2015

Untuk X yang bersifat

kategori (nominal atau

ordinal), perbedaan

karakteristik Y dapat

dilihat melalui box-plot.

Y

X2 1 2 3

Page 6: Pertemuan 11 EDA 2015

Untuk X berupa hasil pengukuran dan bersifat kontinu,

kita dapat merumuskan pola hubungan Y dan X secara

lebih kuantitatif dalam bentuk persamaan garis,

sehingga dapat dilihat besarnya perubahan Y untuk

setiap perubahan nilai X.

Bahkan dengan adanya persamaan garis dapat

dilakukan interpolasi atau menduga nilai Y untuk X

tertentu yang tidak diamati tetapi masih berada dalam

selang X yang diteliti.

Page 7: Pertemuan 11 EDA 2015

Plot the paired data. Plot the data on the chart,

using concentric circles to indicate repeated data

points.

Title and label the diagram.

Interpret the data. Scatter diagrams will generally

show one of five possible correlations between the

variables

Page 8: Pertemuan 11 EDA 2015
Page 9: Pertemuan 11 EDA 2015
Page 10: Pertemuan 11 EDA 2015

Variabel dependen (Y) dan independen (X)

Variabel respon (Y) dan prediktor (X)

Variabel Y dan X memiliki korelasi jika X dan Y

memiliki perubahan variasi yang satu sama lain

berhubungan.

Artinya jika variabel X berubah, maka variabel Y pun

berubah.

Page 11: Pertemuan 11 EDA 2015

1. Variabel Iklan dan Pendapatan. Mana yang menjadi

variabel bebas dan mana yang menjadi variabel

tak bebas??

2.

Data promosi dalam ribuan, unit terjual dalam satuan

Page 12: Pertemuan 11 EDA 2015

Jika variabel X merupakan sebuah variabel yang

bersifat menerangkan tingkah laku variabe Y, maka

variabel X disebut variabel bebas (independen).

Jika tingkah laku variabel Y diterangkan variabel X,

variabel Y disebut variabel tidak bebas (dependen).

Variabel bebas disebut juga penyebab (prediktor).

Variabel tak bebas disebut akibat (respon)

Page 13: Pertemuan 11 EDA 2015

Buat diagram pencarnya

antara variabel X1 dan Y,

X2 dan Y, X3 dan Y.

Page 14: Pertemuan 11 EDA 2015

Langkah awal dalam penelusuran pola hubungan Y

dengan X adalah melalui scatter plot (xi,yi).

Beberapa kemungkinan tampilan yang nampak : (lihat di

slide 8-9)

Titik-titik memencar di sekitar garis lurus tertentu,

Titik-titik berpencar mengikuti suatu kurva, Titik-titik

berpencar tak beraturan Sebagian besar dari titik-

titik membentuk pola garis atau kurva, dengan

beberapa penyimpangan dari pola utamanya.

Jika berdasarkan pencaran titik terlihat adanya suatu

pola garis lurus tertentu, pertanyaan yang muncul

adalah : apakah benar pola tsbt merupakan garis lurus ?

Page 15: Pertemuan 11 EDA 2015
Page 16: Pertemuan 11 EDA 2015

• Apa itu analisis regresi?

Analisi Regresi “Analisis statistika yang memanfaatkan hubungan antara dua atau lebih peubah kuantitatif sehingga salah satu peubah dapat diramalkan dari peubah lainnya.”

• Apa bedanya dengan korelasi?

Page 17: Pertemuan 11 EDA 2015

Analisis Korelasi Analisis statistika yang

membahas tentang derajat (kekuatan)

hubungan antara peubah-peubah.

Page 18: Pertemuan 11 EDA 2015
Page 19: Pertemuan 11 EDA 2015

Sampel

Page 20: Pertemuan 11 EDA 2015
Page 21: Pertemuan 11 EDA 2015

1

)(dan

1

)(

1

))((

22

n

yyS

n

xxS

n

yyxxS

SS

Sr

i

y

i

x

ii

xy

yx

xy

xy

Page 22: Pertemuan 11 EDA 2015
Page 23: Pertemuan 11 EDA 2015

• Hubungan Antar Peubah:

• Fungsional (deterministik) Y=f(X) ; misalnya: Y=10X

• Statistik (stokastik) amatan tidak jatuh pas pada kurva

Mis: IQ vs Prestasi, Berat vs Tinggi, Dosis Pupuk vs Produksi

• Model regresi sederhana:

niXY iii ,...,2,1 ; 10

Page 24: Pertemuan 11 EDA 2015

Makna 0 & 1 ?

Page 25: Pertemuan 11 EDA 2015
Page 26: Pertemuan 11 EDA 2015

• Pendugaan terhadap koefisien regresi:

b0 penduga bagi 0 dan b1 penduga bagi 1

Bagaimana Pengujian terhadap model regresi ??

• parsial (per koefisien) uji-t

• bersama (simultan) uji-F (Anova)

Bagaimana menilai kesesuaian model ??

R2 (Koef. Determinasi: % keragaman Y yang mampu dijelaskan

oleh X)

xbyb

n

xx

n

yxxy

b

10

2

2

1 )(

))((

Metode

Kuadrat Terkecil

Page 27: Pertemuan 11 EDA 2015

Jarak Emisi

31 553

38 590

48 608

52 682

63 752

67 725

75 834

84 752

89 845

99 960

Percobaan dalam bidang lingkungan

Apakah semakin tua mobil semakin

besar juga emisi HC yang dihasilkan?

Diambil contoh 10 mobil secara acak,

kemudian dicatat jarak tempuh yang

sudah dijalani mobil (dalam ribu

kilometer) dan diukur Emisi HC-nya

(dalam ppm)

Emisi = 382 + 5.39 Jarak

Page 28: Pertemuan 11 EDA 2015

10090807060504030

950

850

750

650

550

Jarak

Em

isi

Plot antara Emisi Hc (ppm) dg

Jarak Tempuh Mobil (ribu

kilometer)

Page 29: Pertemuan 11 EDA 2015

1. Apakah nilai mutu rata-rata (NMR) pada akhir tahun

pertama (Y) dapat diramalkan dari nilai ujian masuk (X)?

Bila jawaban ya, maka

2. Buatlah diagram pencar X dan Y.

3.Tentukan persamaan regresi dugaannya beserta

maknanya!

Page 30: Pertemuan 11 EDA 2015

Data berikut merupakan hasil penelitian tentang hubungan

antar nilai ulangan Matematika (dalam skala nilai 10 sampai

100) dengan lama waktu belajar matematika (dalam jam

selama seminggu)

a) Tentukan peubah mana sebagai peubah bebas X dan peubah tak bebas Y!

b) Tentukan persamaan regresi dugaan dan berikan makna dugaan koefisien

regresinya!

Page 31: Pertemuan 11 EDA 2015

Suatu penelitian telah dilakukan untuk mengetahui

hubungan

antara pengeluaran untuk iklan (X dalam jutaan

rupiah) dengan penerimaan melalui penjualan (Y

dalam jutaan rupiah) pada perusahaan tertentu.

Berikut ringkasan datanya :

a) Tentukan persamaan regresi dugaan! Berikan maknanya.

b) Bila pengeluaran untuk iklan sebesar 16 juta rupiah,

berapakah penerimaan dari hasil penjualan?

Page 32: Pertemuan 11 EDA 2015