Pert 02 statistik deskriptif 2013

Post on 22-Jan-2018

586 views 11 download

Transcript of Pert 02 statistik deskriptif 2013

Luki ArdiantoUNIPDU - 2014

1

Sering digunakan peneliti, khususnya dalam memperhatikan perilaku data dan penentuan dugaan-dugaan yang selanjutnya akan diuji dalam analisis inferensi.

2

Sari numerik (ringkasan angka)◦ Menyatakan nilai-nilai penting dalam statistik

meliputi ukuran pemusatan dan dispersi.

Distribusi◦ Menyatakan pola atau model dari penyebaran

data.

Pencilan◦ Menyatakan nilai data yang berada diluar

kelompok nilai data yang lainnya.

3

Ukuran pemusatan ◦ merupakan ukuran yang menyatakan pusat

dari sebaran data. Ada tiga macam ukuran pemusatan yaitu Rata-rata, Median, dan Modus.

Ukuran penyebaran (dispersi) ◦ adalah ukuran yang dipakai untuk mengukur

tingkat penyebaran data. ◦ Semakin kecil ukuran penyebaran semakin

seragam data tersebut dan semakin besar ukuran penyebaran semakin beragam data tersebut.

4

Rata-rata adalah sebuah nilai yang khas yang dapat mewakili suatu himpunan data.

Rata-rata dari suatu himpunan n bilangan x1, x2 , ….., xn ditunjukkan oleh dan didefinisikan sbb :

5

n

x

n

xxxX

n

i

n

121 .....

Jika bilangan-bilangan x1, x2 , ….., xn masing-masing terjadi f1, f2 , ….., fn maka nilai rata-ratanya adalah :

6

n

i

n

ii

n

nn

f

xf

fff

xfxfxfX

1

1

21

2211

....

.....

Median adalah besaran yang membagi data menjadi dua kelompok yang memiliki persentase sama besar., dimana himpunan bilangan disusun menurut urutan besarnya.

Dimana L1 = batas kelas bawah dari kelas median.n = banyak data(Σ f)1= jumlah frekuensi semua kelas yang lebih rendah dari

kelas median

f med = frekuensi kelas medianc = panjang kelas

7

c

f

fn

LMedianmed

1

1

2

Modus suatu himpunan bilangan adalah nilai yang paling sering muncul (memiliki frekuensi maksimum). Modus mungkin tidak ada. Modus dapat diperoleh dari rumus :

Dimana L1 = batas kelas bawah dari kelas modus.1 = selisih frekuensi kelas modus dan frekuensi

kelassebelumnya

2 = selisih frekuensi kelas modus dan frekuensi kelas

sesudahnyac = panjang kelas

8

cLModus

21

1

1

Derajat atau ukuran sampai seberapa jauh data numerik cenderung untuk tersebar disekitar nilai rata-ratanya.

Yang paling umum adalah Range (rentang), Variansi, dan Simpangan Baku.

Ukuran dispersi lain adalah kuartil, persentil.

9

adalah selisih antara bilangan terbesar dan terkecil dalam himpunan.

Nilai R akan selalu positif. Interpretasi nilai R adalah:◦ R = 0, menunjukkan bahwa data terbesar

sama dengan data terkecil, akibatnya semua data memiliki harga yang sama

◦ R kecil, memberikan informasi bahwa data akan mengumpul di sekitar pusat data

◦ R besar, menyatakan bahwa paling sedikit ada satu data yang harganya berbeda jauh dengan data lainnya

10

Simpangan Baku (Deviasi Standar) suatu himpunan bilangan x1, x2, …, xn dinyatakan dengan s dan didefinisikan sebagai berikut :

11

2

1

222

1

2

11

n

xnx

n

xxs ii

Jika x1, x2, …, xn masing-masing muncul dengan frekuensi f1, f2, …, fn, maka simpangan baku dapat dituliskan :

12

2

1

222

1

2

1

n

xf

n

xf

f

xxfs

iiii

i

ii

ifn

Kuadrat dari simpangan baku adalahvariansi.

Nilai variansi dan simpangan baku selalunon-negatif.

Interpretasi nilai s2 adalah:◦ s2 = 0 atau s = 0 berarti nilai data sama sengan

rata-ratanya, sehingga nilai semua data sama

◦ s2 atau s kecil, berarti perbedaa n harga data yang satu dengan lainnya kecil Akibatnya semuadata akan mengumpul disekitar pusat data.

◦ s2 atau s besar menyatakan bahwa paling sedikitada satu data yang harganya berbeda jauh dengandata lainnya.

13

Simpangan baku (deviasistandar) (3):

Suatu himpunan data membagi himpunan atas empat bagian yang sama. Nilai-nilai ini disebut Kuartil dan dinyatakan dengan Q1, Q2, dan Q3.

Suatu himpunan data membagi data atas sepuluh bagian yang sama disebut Desildan dinyatakan dengan D1, D2, D3, …., D9.

Suatu himpunan data membagi data atas seratus bagian disebut Persentil dan dinyatakan dengan P1, P2, P3, ….., P99.

14

Di mana LQN = batas kelas bawah dari kelas kuartil ke-N n = banyak data (Σ f)N= jumlah frekuensi semua kelas sebelum

kelas kuartil ke N

fQN = frekuensi kelas kuartil ke-N c = panjang kelas

15

Rumus Kuartil ke-N (N = 1,2,3) :

c

f

fn

N

LQQN

N

QNN

4.

Dalam statistika, mempelajari distribusi merupakan suatu hal yang penting, karena akan menentukan metodologi statistika yang akan digunakan.

Distribusi adalah pola atau model penyebaran yang merupakan gambaran kondisi sekelompok data.

16

Mean = median = modus

17

1 2 3 4 5 6 7 8 9 10 11 12

Mean > median > modus

18

1 2 3 4 5 6 7 8 9 10 11 12

Mean < median < modus

19

1 2 3 4 5 6 7 8 9 10 11 12

Rumus Pearson

Dimana

◦ SK = derajat kemenjuluran (skewness)

◦ = mean

◦ Mo = Modus

◦ S = Standar Deviasi

20

S

MoxSK

X

Bila nilai SK = 0 atau mendekati nol, maka dikatakan distribusi data simetri

Bila nilai SK bertanda negatif, maka distribusi data menjulur ke kiri

Bila nilai SK bertanda positif, maka distribusi data menjulur ke kanan

21

Memberikan informasi mengenai data yang harganya jauh berbeda dari harga data lainnya.

Dalam statistika, mendeteksi pencilan sangatpenting karena data yang masuk dalampencilan akan mengganggu hasil analisisdata.

Oleh karena itu, data pencilan harus dianalisistersendiri, terpisah dari kelompoknya.

22

Hitung besarnya nilai sebaran tengah, yaitu dq = QA – QB

Hitung nilai batas bawah pencilan (BBP), yaitu : BBP = QB – (1,5 x dq)

Hitung nilai batas atas pencilan (BAP), yaitu : BAP = QA + (1,5 x dq)

Apabila terdapat data dengan nilai lebih kecil atau sama dengan BBP maka data tersebut disebut pencilan bawah.

Apabila terdapat data dengan nilai lebih besar atau sama dengan BAP maka data tersebut disebut pencilan atas.

23

24

Penyajian Data Tabel

25

Bermanfaat untuk merepresentasikan data

kuantitatif maupun kualitatif yang telah

dirangkum dalam frekuensi, frekuensi

relatif, atau persen distribusi frekuensi.

•Cara:

Pada sumbu horisontal diberi label

yang menunjukkan kelas/kelompok.

Frekuensi, frekuensi relatif, maupun

persen frekuensi dinyatakan dalam

sumbu vertikal yang dinyatakan

dengan menggunakan gambar

berbentuk batang dengan lebar yang

sama/tetap.

• Merupakan grafik dari distribusi frekuensi kumulatif.

• Nilai data disajikan pada garis horisontal (sumbu-x).

• Pada sumbu vertikal dapat disajikan:

– Frekuensi kumulatif, atau

– Frekuensi relatif kumulatif, atau

– Persen frekuensi kumulatif

• Frekuensi yang digunakan (salah satu diatas)masing-

masing kelas digambarkan sebagai titik.

• Setiap titik dihubungkan oleh garis lurus.

Biaya

($)

BiayaBiaya

($)($)

2020

4040

6060

8080

100100

Pers

en

freku

ensi

ku

mula

tif

Pers

en

Pers

en

freku

ensi

freku

ensi

ku

mula

tif

ku

mula

tif

50 60 70 80 90 100 11050 60 70 80 90 100 11050 60 70 80 90 100 110

Diagram scatter (scatter diagram) merupakan metode presentasi secara grafis untuk menggambarkan hubungan antara dua variabel kuantitatif.

Salah satu variabel digambarkan pada sumbu horisontal dan variabel lainnya digambarkan pada sumbu vertikal.

Pola yang ditunjukkan oleh titik-titik yang ada menggambarkan hubungan yang terjadi antar variabel.

xx

yy

xx

yy

xx

yy

xx

yy

xx

yy

xx

yy

Hubungan Positif

Jika X naik, maka

Y juga naik dan

jika X turun, maka

Y juga turun

Hubungan Negatif

Jika X naik, maka

Y akan turun dan

jika X turun, maka

Y akan naik

Tidak ada hubungan

antara X dan Y

Data Kualitatif Data Kuantitatif

Metode

Tabel

Metode

Grafik

Distr. Frekuensi

Distr. Frek.

Relatif

% Distr. Frek.

Tabulasi silang

Metode

Tabel

Metode

Grafik

Data

Grafik

Batang

Grafik

Lingkaran

Distr. Frekuensi

Distr. Frek. Relatif

Distr. Frek. Kum.

Distr. Frek. Relatif Kum.

Diagram Batang-Daun

Tabulasi silang

Plot Titik

Histogram

Ogive

Diagram

Scatter

Merupakan tabel ringkasan data yang menunjukkan frekuensi/banyaknya item/obyek pada setiap kelas yang ada.

Tujuan: mendapatkan informasi lebih dalam tentang data yang ada yang tidak dapat secara cepat diperoleh dengan melihat data aslinya.

Merupakan fraksi atau proporsi frekuensi setiap kelas terhadap jumlah total.

Distribusi frekuensi relatif merupakan tabel ringkasan dari sekumpulan data yang menggambarkan frekuensi relatif untuk masing-masing kelas.

Data Kuantitatif◦ Kepala Sekolah SMA Maju berkeinginan melihat gambaran yang

lebih jelas tentang distribusi penghasilan orang tua siswa. Untukitu diambil 50 orang tua siswa sebagai sampel, kemudian dicatatpenghasilan per bulannya (dalam puluhan ribu rupiah). Berikuthasilnya:

Buatlah : Distribusi frekeuensinya, histogram, ogive, dan rata-rata (mean). Coba saudara buat interpretasi dari data penghasilanorang tua tersebut di atas.

91 78 93 57 75 52 99 80 97 62

71 69 72 89 66 75 79 75 72 76

104 74 62 68 97 105 77 65 80 109

85 97 88 68 83 68 71 69 67 74

62 82 98 101 79 105 79 69 62 73

Distribusi frekuensi dari upah karyawan suatu perusahaan dalam ribuan rupiah per bulan adalah sbb.:

49

Nilai upah Banyaknya

karyawan

100 – 199 15

200 – 299 20

300 – 399 30

400 – 499 25

500 – 599 15

600 – 699 10

700 – 799 5

Hitung mean

dan modus

Hitung kuartil

ke-3 dan

simpangan

baku

Diketahui besarnya pinjaman 7 orang nasabah suatu bank sbb. (dalam juta Rp).

50

Nama A B C D E F G

Pinjama

n

12.57 14.65 25.50 5.75 11.80 16.55 15.89

Selidiki, apakah terdapat nasabah yang pinjamannya cukup sedikit atau sangatbesar dibandingkan dengan nasabah lainnya

Sebuah obyek wisata di Bandung diamati selama30 hari. Setiap hari dicatat banyaknya wisatawandomestik (satuan orang) yang mengunjungiobyek wisata tersebut yang ditampilkan dalamtabel berikut .

51

85 42 45 3 71 97 6 48 60 49

45 55 21 75 80 62 54 62 41 6

95 45 25 81 76 84 45 68 59 15

Dengan memanfaatkan analisis data statistik secara deskriptif, berikan analisisanda terkait dengan masalah di atas.

Banyaknya mobil pribadi yang melewati 7 titik pengamatan pada jam 06.30 – 07.30 di kawasan jalan pahlawan adalah sbb.:

52

Lokas

i

1 2 3 4 5 6 7

Jml

mbl

70 73 93 71 109 75 71

Setelah data di atas dibakukan (*), selidiki betuk distribusinya melaluinilai rata-rata dan median.

Catatan (*):

Membakukan data bertujuan untukmentransformasikan nilai-nilai data menjadi suatu kumpulan data barudengan nilai rata-rata sama dengan noldan variansi sama dengan 1.

Rumus pembakuan data adalah :

53

bakusimpangan

datapemusaukuran

s

xxZ

x

ii

tan