Post on 22-Jan-2018
Luki ArdiantoUNIPDU - 2014
1
Sering digunakan peneliti, khususnya dalam memperhatikan perilaku data dan penentuan dugaan-dugaan yang selanjutnya akan diuji dalam analisis inferensi.
2
Sari numerik (ringkasan angka)◦ Menyatakan nilai-nilai penting dalam statistik
meliputi ukuran pemusatan dan dispersi.
Distribusi◦ Menyatakan pola atau model dari penyebaran
data.
Pencilan◦ Menyatakan nilai data yang berada diluar
kelompok nilai data yang lainnya.
3
Ukuran pemusatan ◦ merupakan ukuran yang menyatakan pusat
dari sebaran data. Ada tiga macam ukuran pemusatan yaitu Rata-rata, Median, dan Modus.
Ukuran penyebaran (dispersi) ◦ adalah ukuran yang dipakai untuk mengukur
tingkat penyebaran data. ◦ Semakin kecil ukuran penyebaran semakin
seragam data tersebut dan semakin besar ukuran penyebaran semakin beragam data tersebut.
4
Rata-rata adalah sebuah nilai yang khas yang dapat mewakili suatu himpunan data.
Rata-rata dari suatu himpunan n bilangan x1, x2 , ….., xn ditunjukkan oleh dan didefinisikan sbb :
5
n
x
n
xxxX
n
i
n
121 .....
Jika bilangan-bilangan x1, x2 , ….., xn masing-masing terjadi f1, f2 , ….., fn maka nilai rata-ratanya adalah :
6
n
i
n
ii
n
nn
f
xf
fff
xfxfxfX
1
1
21
2211
....
.....
Median adalah besaran yang membagi data menjadi dua kelompok yang memiliki persentase sama besar., dimana himpunan bilangan disusun menurut urutan besarnya.
Dimana L1 = batas kelas bawah dari kelas median.n = banyak data(Σ f)1= jumlah frekuensi semua kelas yang lebih rendah dari
kelas median
f med = frekuensi kelas medianc = panjang kelas
7
c
f
fn
LMedianmed
1
1
2
Modus suatu himpunan bilangan adalah nilai yang paling sering muncul (memiliki frekuensi maksimum). Modus mungkin tidak ada. Modus dapat diperoleh dari rumus :
Dimana L1 = batas kelas bawah dari kelas modus.1 = selisih frekuensi kelas modus dan frekuensi
kelassebelumnya
2 = selisih frekuensi kelas modus dan frekuensi kelas
sesudahnyac = panjang kelas
8
cLModus
21
1
1
Derajat atau ukuran sampai seberapa jauh data numerik cenderung untuk tersebar disekitar nilai rata-ratanya.
Yang paling umum adalah Range (rentang), Variansi, dan Simpangan Baku.
Ukuran dispersi lain adalah kuartil, persentil.
9
adalah selisih antara bilangan terbesar dan terkecil dalam himpunan.
Nilai R akan selalu positif. Interpretasi nilai R adalah:◦ R = 0, menunjukkan bahwa data terbesar
sama dengan data terkecil, akibatnya semua data memiliki harga yang sama
◦ R kecil, memberikan informasi bahwa data akan mengumpul di sekitar pusat data
◦ R besar, menyatakan bahwa paling sedikit ada satu data yang harganya berbeda jauh dengan data lainnya
10
Simpangan Baku (Deviasi Standar) suatu himpunan bilangan x1, x2, …, xn dinyatakan dengan s dan didefinisikan sebagai berikut :
11
2
1
222
1
2
11
n
xnx
n
xxs ii
Jika x1, x2, …, xn masing-masing muncul dengan frekuensi f1, f2, …, fn, maka simpangan baku dapat dituliskan :
12
2
1
222
1
2
1
n
xf
n
xf
f
xxfs
iiii
i
ii
ifn
Kuadrat dari simpangan baku adalahvariansi.
Nilai variansi dan simpangan baku selalunon-negatif.
Interpretasi nilai s2 adalah:◦ s2 = 0 atau s = 0 berarti nilai data sama sengan
rata-ratanya, sehingga nilai semua data sama
◦ s2 atau s kecil, berarti perbedaa n harga data yang satu dengan lainnya kecil Akibatnya semuadata akan mengumpul disekitar pusat data.
◦ s2 atau s besar menyatakan bahwa paling sedikitada satu data yang harganya berbeda jauh dengandata lainnya.
13
Simpangan baku (deviasistandar) (3):
Suatu himpunan data membagi himpunan atas empat bagian yang sama. Nilai-nilai ini disebut Kuartil dan dinyatakan dengan Q1, Q2, dan Q3.
Suatu himpunan data membagi data atas sepuluh bagian yang sama disebut Desildan dinyatakan dengan D1, D2, D3, …., D9.
Suatu himpunan data membagi data atas seratus bagian disebut Persentil dan dinyatakan dengan P1, P2, P3, ….., P99.
14
Di mana LQN = batas kelas bawah dari kelas kuartil ke-N n = banyak data (Σ f)N= jumlah frekuensi semua kelas sebelum
kelas kuartil ke N
fQN = frekuensi kelas kuartil ke-N c = panjang kelas
15
Rumus Kuartil ke-N (N = 1,2,3) :
c
f
fn
N
LQQN
N
QNN
4.
Dalam statistika, mempelajari distribusi merupakan suatu hal yang penting, karena akan menentukan metodologi statistika yang akan digunakan.
Distribusi adalah pola atau model penyebaran yang merupakan gambaran kondisi sekelompok data.
16
Mean = median = modus
17
1 2 3 4 5 6 7 8 9 10 11 12
Mean > median > modus
18
1 2 3 4 5 6 7 8 9 10 11 12
Mean < median < modus
19
1 2 3 4 5 6 7 8 9 10 11 12
Rumus Pearson
Dimana
◦ SK = derajat kemenjuluran (skewness)
◦ = mean
◦ Mo = Modus
◦ S = Standar Deviasi
20
S
MoxSK
X
Bila nilai SK = 0 atau mendekati nol, maka dikatakan distribusi data simetri
Bila nilai SK bertanda negatif, maka distribusi data menjulur ke kiri
Bila nilai SK bertanda positif, maka distribusi data menjulur ke kanan
21
Memberikan informasi mengenai data yang harganya jauh berbeda dari harga data lainnya.
Dalam statistika, mendeteksi pencilan sangatpenting karena data yang masuk dalampencilan akan mengganggu hasil analisisdata.
Oleh karena itu, data pencilan harus dianalisistersendiri, terpisah dari kelompoknya.
22
Hitung besarnya nilai sebaran tengah, yaitu dq = QA – QB
Hitung nilai batas bawah pencilan (BBP), yaitu : BBP = QB – (1,5 x dq)
Hitung nilai batas atas pencilan (BAP), yaitu : BAP = QA + (1,5 x dq)
Apabila terdapat data dengan nilai lebih kecil atau sama dengan BBP maka data tersebut disebut pencilan bawah.
Apabila terdapat data dengan nilai lebih besar atau sama dengan BAP maka data tersebut disebut pencilan atas.
23
24
Penyajian Data Tabel
25
Bermanfaat untuk merepresentasikan data
kuantitatif maupun kualitatif yang telah
dirangkum dalam frekuensi, frekuensi
relatif, atau persen distribusi frekuensi.
•Cara:
Pada sumbu horisontal diberi label
yang menunjukkan kelas/kelompok.
Frekuensi, frekuensi relatif, maupun
persen frekuensi dinyatakan dalam
sumbu vertikal yang dinyatakan
dengan menggunakan gambar
berbentuk batang dengan lebar yang
sama/tetap.
• Merupakan grafik dari distribusi frekuensi kumulatif.
• Nilai data disajikan pada garis horisontal (sumbu-x).
• Pada sumbu vertikal dapat disajikan:
– Frekuensi kumulatif, atau
– Frekuensi relatif kumulatif, atau
– Persen frekuensi kumulatif
• Frekuensi yang digunakan (salah satu diatas)masing-
masing kelas digambarkan sebagai titik.
• Setiap titik dihubungkan oleh garis lurus.
Biaya
($)
BiayaBiaya
($)($)
2020
4040
6060
8080
100100
Pers
en
freku
ensi
ku
mula
tif
Pers
en
Pers
en
freku
ensi
freku
ensi
ku
mula
tif
ku
mula
tif
50 60 70 80 90 100 11050 60 70 80 90 100 11050 60 70 80 90 100 110
Diagram scatter (scatter diagram) merupakan metode presentasi secara grafis untuk menggambarkan hubungan antara dua variabel kuantitatif.
Salah satu variabel digambarkan pada sumbu horisontal dan variabel lainnya digambarkan pada sumbu vertikal.
Pola yang ditunjukkan oleh titik-titik yang ada menggambarkan hubungan yang terjadi antar variabel.
xx
yy
xx
yy
xx
yy
xx
yy
xx
yy
xx
yy
Hubungan Positif
Jika X naik, maka
Y juga naik dan
jika X turun, maka
Y juga turun
Hubungan Negatif
Jika X naik, maka
Y akan turun dan
jika X turun, maka
Y akan naik
Tidak ada hubungan
antara X dan Y
Data Kualitatif Data Kuantitatif
Metode
Tabel
Metode
Grafik
Distr. Frekuensi
Distr. Frek.
Relatif
% Distr. Frek.
Tabulasi silang
Metode
Tabel
Metode
Grafik
Data
Grafik
Batang
Grafik
Lingkaran
Distr. Frekuensi
Distr. Frek. Relatif
Distr. Frek. Kum.
Distr. Frek. Relatif Kum.
Diagram Batang-Daun
Tabulasi silang
Plot Titik
Histogram
Ogive
Diagram
Scatter
Merupakan tabel ringkasan data yang menunjukkan frekuensi/banyaknya item/obyek pada setiap kelas yang ada.
Tujuan: mendapatkan informasi lebih dalam tentang data yang ada yang tidak dapat secara cepat diperoleh dengan melihat data aslinya.
Merupakan fraksi atau proporsi frekuensi setiap kelas terhadap jumlah total.
Distribusi frekuensi relatif merupakan tabel ringkasan dari sekumpulan data yang menggambarkan frekuensi relatif untuk masing-masing kelas.
Data Kuantitatif◦ Kepala Sekolah SMA Maju berkeinginan melihat gambaran yang
lebih jelas tentang distribusi penghasilan orang tua siswa. Untukitu diambil 50 orang tua siswa sebagai sampel, kemudian dicatatpenghasilan per bulannya (dalam puluhan ribu rupiah). Berikuthasilnya:
Buatlah : Distribusi frekeuensinya, histogram, ogive, dan rata-rata (mean). Coba saudara buat interpretasi dari data penghasilanorang tua tersebut di atas.
91 78 93 57 75 52 99 80 97 62
71 69 72 89 66 75 79 75 72 76
104 74 62 68 97 105 77 65 80 109
85 97 88 68 83 68 71 69 67 74
62 82 98 101 79 105 79 69 62 73
Distribusi frekuensi dari upah karyawan suatu perusahaan dalam ribuan rupiah per bulan adalah sbb.:
49
Nilai upah Banyaknya
karyawan
100 – 199 15
200 – 299 20
300 – 399 30
400 – 499 25
500 – 599 15
600 – 699 10
700 – 799 5
Hitung mean
dan modus
Hitung kuartil
ke-3 dan
simpangan
baku
Diketahui besarnya pinjaman 7 orang nasabah suatu bank sbb. (dalam juta Rp).
50
Nama A B C D E F G
Pinjama
n
12.57 14.65 25.50 5.75 11.80 16.55 15.89
Selidiki, apakah terdapat nasabah yang pinjamannya cukup sedikit atau sangatbesar dibandingkan dengan nasabah lainnya
Sebuah obyek wisata di Bandung diamati selama30 hari. Setiap hari dicatat banyaknya wisatawandomestik (satuan orang) yang mengunjungiobyek wisata tersebut yang ditampilkan dalamtabel berikut .
51
85 42 45 3 71 97 6 48 60 49
45 55 21 75 80 62 54 62 41 6
95 45 25 81 76 84 45 68 59 15
Dengan memanfaatkan analisis data statistik secara deskriptif, berikan analisisanda terkait dengan masalah di atas.
Banyaknya mobil pribadi yang melewati 7 titik pengamatan pada jam 06.30 – 07.30 di kawasan jalan pahlawan adalah sbb.:
52
Lokas
i
1 2 3 4 5 6 7
Jml
mbl
70 73 93 71 109 75 71
Setelah data di atas dibakukan (*), selidiki betuk distribusinya melaluinilai rata-rata dan median.
Catatan (*):
Membakukan data bertujuan untukmentransformasikan nilai-nilai data menjadi suatu kumpulan data barudengan nilai rata-rata sama dengan noldan variansi sama dengan 1.
Rumus pembakuan data adalah :
53
bakusimpangan
datapemusaukuran
s
xxZ
x
ii
tan