01 SubpokokbahasanStatistik 1.2

40
Bahasan 1.2 Penyajian Data : Tabel dan Gambar Statistik & Probabilitas

Transcript of 01 SubpokokbahasanStatistik 1.2

Bahasan 1.2

Penyajian Data : Tabel dan Gambar

Statistik & Probabilitas

Tujuan PembahasanSetelah menyelesaikan bahasan ini, mahasiswa akan

dapat: Membangun dan menginterpretasi distribusi frekuensi,

polygon, dan ogive

Membuat histogram

Membangun dan menginterpretasi bar charts, pie charts, dan scatter diagrams

Membangun dan menginterpretasi data kategori dalam bar charts and pie charts

Menggambar cara yang seharusnya untuk menampilkan data secara grafis

Organisasi dan Presentasi Data secara Grafis

Data dalam bentuk mentah biasanya tidak mudah digunakan dalam pengambilan keputusan Jenis organisasi data yang diperlukan

Tabel Grafik

Teknik yang ditinjau disini adalah sbb: Ordered Array Distribusi Frekuensi dan Histograms Bar charts and pie charts Tabel Contingency

Tabel dan Gambar untuk Data Numerik

Data Numerik

Ordered Array

Histogram Polygon Ogive

Distribusi Frekuensi danDistribusi Kumulatif

The Ordered Array

Suatu daftar tersortir dari data: Menunjukkan batas jangkauan (min ke max)

Menunjukkan variasi dalam jangkauan

Dapat membangun/mengenali outliers (observasi yang tidak biasanya)

Jika serangkaian data terlalu besar maka ordered array tidak begitu bermanfaat

Data dalam bentuk mentah (sebagaimana terkumpul):

24, 26, 24, 21, 27, 27, 30, 41, 32, 38

Data dalam ordered array dari terkecil sampai terbesar:

21, 24, 24, 26, 27, 27, 30, 32, 38, 41

(continued)

The Ordered Array

Apa yang dimaksud Distribusi Frekuensi?

Suatu distribusi frekuensi adalah suatu daftar atau tabel

mengandung pengelompokan kelas (kategori atau rentang dimana data didalamnya)

dan menghubungkan frekuensi dengan data yang ada dalam setiap pengelompokan atau kategori

Tabulasi Data Numerik: Distribusi Frekuensi

Kenapa Distribusi Frekuensi diperlukan?

Suatu distribusi frekuensi merupakan suatu cara untuk meringkas/menyimpulkan data

Distribusi akan memadatkan data mentah menjadi suatu bentuk yang lebih berguna

Dan memungkinkan untuk interpretasi cepat data secara visual

Interval Kelas dan Batas Kelas

Setiap pengelompokan kelas mempunyai lebar yang sama

Lebar setiap interval ditentukan:

Gunakan minimal 5 tapi tidak lebih 15 kelompok Batas kelas tidak pernah overlap Bulatkan lebar interval untuk mendapatkan

titik / nilai akhir

diinginkan yang kelaskelompok jumlah

rentangintervalLebar

Contoh Distribusi Frekuensi

Contoh: Suatu pabrik insulasi secara acak memilih 20 hari musim dingin dan mencatat suhu tertinggi harian

24, 35, 17, 21, 24, 37, 26, 46, 58, 30,

32, 13, 12, 38, 41, 43, 44, 27, 53, 27

Data mentah disortir dan diurutkan naik:12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

Rentang/range: 58 - 12 = 46

Pilih jumlah kelas: 5 (biasanya antara 5 dan 15)

Hitung interval kelas (lebar): 10 (46/5 lalu bulatkan)

Tentukan batas kelas (limit): 10, 20, 30, 40, 50, 60

Hitung nilai/titik tengah: 15, 25, 35, 45, 55

Lakukan perhitungan observasi dan kelaskan

Contoh Distribusi Frekuensi(continued)

Contoh Distribusi Frekuensi

Kelas Frekuensi

10 < 20 3 .15 15

20 < 30 6 .30 30

30 < 40 5 .25 25

40 < 50 4 .20 20

50 < 60 2 .10 10

Total 20 1.00 100

Frekuensi Relatif Prosentase

Data in ordered array:

12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

(continued)

Menggambar Data Numerik: Histogram

Gambar suatu data dalam distribusi frekuensi disebut suatu histogram

Batas Kelas (atau nilai tengah) digambar pada Sumbu Horisontal

Sumbu Vertikal; adalah baik frekuensi, frekuensi relatif, atau prosentase

Batang dengan ketinggian tertentu digunakan untuk menggambarkan angka observasi dengan masing-masing kelas

Histogram: Suhu Tinggi Harian

0

3

6

5

4

2

00

1

2

3

4

5

6

7

5 15 25 35 45 55 More

Fre

ku

en

si

Nilai Tengah Kelas

Contoh Histogram

(Tidak ada Gap

antar batang)

Kelas

10 < 20 15 3

20 < 30 25 6

30 < 40 35 5

40 < 50 45 4

50 < 60 55 2

FrekuensiNilaiTengah

Kelas

Histogram di Excel

Pilih Menu

Tools/Data Analysis

1

Pilih Histogram

2

3

Input data range and bin range (bin range rentang sel yang terdiri dari batas kelas atas untuk setiap kelompok kelas)

Pilih Chart Output Dan klik “OK”

Histogram in Excel(continued)

(

Pertanyaan untuk Pengelompokan Data ke dalam Kelas

1. Berapa lebar kelas yang seharusnya?(Berapa banyak kelas yang sebaiknya dipakai?)

2. Bagaimana seharusnya nilai akhir kelas ditentukan? Sering dijawab dengan coba-coba, tergantung

pertimbangan pemakai Tujuannya adalah membuat suatu distribusi yang tidak

terlalu “renggang" maupun terlalu “padat” Tujuannya adalah untuk memperlihatkan secara benar

pola variasi dari data

Berapa Banyak Interval Kelas?

Banyak (Interval Kelas Menyempit) Dapat menghasilkan distribusi yang

sangat renggang dengan ada kesenjangan dari kelas kosong

Dapat menghasilkan indikasi yang tidak tepat bagaimana variasi frekuensi dari keseluruhan kelas

Sedikit (Interval Kelas Melebar) Dapat memadatkan variasi yang

terlalu banyak dan menghasilkan distribusi yang terblok

Dapat mengaburkan pola-pola penting dari variasi

0

2

4

6

8

10

12

0 30 60 More

TemperatureF

req

ue

nc

y

0

0.5

1

1.5

2

2.5

3

3.5

4 8

12 16 20 24 28 32 36 40 44 48 52 56 60

Mor

e

Temperature

Fre

qu

ency

(X axis labels are upper class endpoints)

Frequency Polygon: Daily High Temperature

0

1

2

3

4

5

6

7

5 15 25 35 45 55 More

Freq

uenc

y

Menggambar Data Numerik: Polygon Frekuensi

Nilai Tengah

Kelas

10 < 20 15 3

20 < 30 25 6

30 < 40 35 5

40 < 50 45 4

50 < 60 55 2

FrekuensiNilai

Tengah

(Dalam suatu polygon sumbu vertikal akan menunjukkan prosentase observasi per kelas)

Tabulasi Data Numerik: Frekuensi Kumulatif

Kelas

10 < 20 3 15 3 15

20 < 30 6 30 9 45

30 < 40 5 25 14 70

40 < 50 4 20 18 90

50 < 60 2 10 20 100

Total 20 100

Persentase Persentase Kumulatif

Data in ordered array:

12, 13, 17, 21, 24, 24, 26, 27, 27, 30, 32, 35, 37, 38, 41, 43, 44, 46, 53, 58

FrekuensiFrekuensi Kumulatif

Penggambaran Frekuensi Kumulatif: The Ogive (Cumulative % Polygon)

Ogive: Daily High Temperature

0

20

40

60

80

100

10 20 30 40 50 60

Cu

mu

lati

ve

Pe

rce

nta

ge

Class Boundaries (Not Midpoints)

Kelas

< 10 10 0

10 < 20 20 15

20 < 30 30 45

30 < 40 40 70

40 < 50 50 90

50 < 60 60 100

Perentase Kumulatif

Batas Bawah Kelas

Diagram Scatter (Diagram Sebaran) digunakan untuk data numerik yang bivariat Data Bivariat terdiri atas sepasang observasi

yang diambil dari 2 variabel numerik

Diagram Scatter: Satu variabel diukur pada sumbu vertikal dan

variabel lainnya diukur pada sumbu horisontal

Diagram Scatter

Contoh Diagram Scatter

Cost per Day vs. Production Volume

0

50

100

150

200

250

0 10 20 30 40 50 60 70

Volume per Day

Cos

t per

Day

Volume per hari

Biaya per hari

23 125

26 140

29 146

33 160

38 167

42 170

50 188

55 195

60 200

Diagram Scatter di Excel

Pilih kotak chart wizard1

2Pilih XY(Scatter), lalu klik

“Next”

Ketika jendela muncul, Masukkan data range, legend, dan halaman tujuan diagram diplot

3

Tabel dan Grafik untuk Data Kategori

Data Kategori

Grafik Data

Pie Charts

Pareto Diagram

Bar Charts

Tabulasi Data

Tabel Ringkasan

Tabel Ringkasan

Contoh: Current Investment Portfolio

Tipe Jumlah Persentase investasi (dalam ribu $) (%)

Stocks 46.5 42.27

Bonds 32.0 29.09

CD 15.5 14.09

Savings 16.0 14.55

Total 110.0 100.0

(Variabel dikategorikan)

data diringkas dengan kategori

Bar and Pie Charts

Bar charts (Diagram Batang) dan Pie charts (Gambar Kue) sering digunakan untuk data qualitatif (kategorik)

Tinggi batang atau potongan kue menunjukkan frekuensi atau prosentase dari masing-masing kategori

Contoh Bar Chart

Investor's Portfolio

0 10 20 30 40 50

Stocks

Bonds

CD

Savings

Amount in $1000's

Tipe Jumlah Persentase Investasi (dalam ribu $) (%)

Stocks 46.5 42.27

Bonds 32.0 29.09

CD 15.5 14.09

Savings 16.0 14.55

Total 110.0 100.0

Current Investment Portfolio

Contoh Pie Chart

Current Investment Portfolio

Savings

15%

CD 14%

Bonds 29%

Stocks

42%

Tipe Jumlah Persentase Investasi (dalam ribu $) (%)

Stocks 46.5 42.27

Bonds 32.0 29.09

CD 15.5 14.09

Savings 16.0 14.55

Total 110.0 100.0

Diagram Pareto

Digunakan untuk menggambarkan data

kategorik

Bar chart, kategori ditunjukkan dengan cara

frekuensi menurun

Polygon juga sering menunjukkan hal yg sama

Digunakan untuk memisahkan hal penting yang

sedikit (“vital few”) dari “trivial many” (banyak

yang sepele)

Contoh Pareto Diagramcu

mu

lative % in

vested

(line g

raph

)%

in

vest

ed i

n e

ach

cat

ego

ry

(bar

gra

ph

)

0%

5%

10%

15%

20%

25%

30%

35%

40%

45%

Stocks Bonds Savings CD

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

Current Investment Portfolio

Tabulasi dan Grafik Data Kategori Multivariat

Tabel Kontijensi Untuk Pilihan Investasi ($1000’s)

Kategori Investor A Investor B Investor C Total Investasi

Stocks 46.5 55 27.5 129

Bonds 32.0 44 19.0 95

CD 15.5 20 13.5 49

Savings 16.0 28 7.0 51

Total 110.0 147 67.0 324

(Masing-masing nilai menggambarkan suatu prosentase dari keseluruhan, prosentase total pada baris, atau pada kolom)

Side by side bar charts

(lanjutan)

Tabulasi dan Grafik Data Kategori Multivariat

Comparing Investors

0 10 20 30 40 50 60

S toc k s

B onds

CD

S avings

Inves tor A Inves tor B Inves tor C

Contoh Side-by-Side Chart Penjualan Catur Wulan dari 3 daerah penjualan:

0

10

20

30

40

50

60

1st Qtr 2nd Qtr 3rd Qtr 4th Qtr

EastWestNorth

1st Qtr 2nd Qtr 3rd Qtr 4th QtrEast 20.4 27.4 59 20.4West 30.6 38.6 34.6 31.6North 45.9 46.9 45 43.9

Kelebihan Penggunaan Gambar/Grafik

Menggambarkan data dengan suatu cara sedemikian rupa dengan unsur-unsur, statistik dan desain

Mengkomunikasikan ide/gagasan yang rumit dengan jelas, akurat dan efisien

Menampilkan sejumlah ide/gagasan dengan cara yang paling efisien

Keunggulan hampir selalu ditunjukkan dalam berbagai dimensi

Memberitahukan kebenaran data

Menggunakan “chart junk”(Gambar sampah)

Gagal menyediakan basisKaitan dalam membandingkan data

antar kelompok/group Kompresi atau distorsi pada sumbu vertikal Tidak ada nilai NOL pada sumbu vertikal

Kesalahan dalam Presentase Data

Chart Junk

Presentase Baik

1960: $1.00

1970: $1.60

1980: $3.10

1990: $3.80

Upah Minimum Upah Minimum

0

2

4

1960 1970 1980 1990

$

Presentase Buruk

Penekanan Sumbu Vertikal

Presentasi Baik

Quarterly Sales Quarterly Sales

Presentase Buruk

0

25

50

Q1 Q2 Q3 Q4

$

0

100

200

Q1 Q2 Q3 Q4

$

Ringkasan Pembahasan

Data mentah biasanya sulit dipakai dalam pengambilan keputusan – Jadi diperlukan organisasi data dalam:

Tabel Grafik/Gambar

Teknik-teknik yang dibahas dalam bab ini:

Tampilan “Ordered array” dan “stem-and-leaf”

Distribusi Frekuensi dan histogram Polygon Prosentase dan “ogives” Diagram Scatter untuk data bivariat Bar charts, pie charts, dan Diagram Pareto Tabel Contingency dan “side-by-side bar charts”