1.1. Pengertian statistik dan statistika
Transcript of 1.1. Pengertian statistik dan statistika
PENDAHULUAN
1.1
da
Ta
Sta
pe
da
sta
pe
be
1
. Pengertian statistik dan statistika
Statistik adalah kumpulan data, bilangan maupun non bilangan yang disusun
lam table dan atau diagram yang melukiskan suatu persoalan
bel nilai statistika
Nilai Jumlah Mahasiswa
A
B
C
D
E
5
9
25
3
1
tistika adalah pengetahuan yang berhubungan dengan cara-cara pengumpulan data,
ngolahan atau penganalisaannya dan penarikan kesimpulan berdasarkan kumpulan data
n penganalisaan yang dilakukan.
Statistika dikelompokkan dalam dua kelompok yaitu statistika deskriptif dan
tistika inferensia. Statistika deskriptif adalah metode yang berkaitan dengan
ngumpulan dan penyajian suatu gugus data sehingga memberikan informasi yang
rguna. Sedangkan pengertian statistika inferensia adalah metode yang berhubungan
dengan analisis sebagian data untuk kemudian sampai pada peramalan atau penarikan
kesimpulan tentang seluruh gugus data induknya.
1.2. Data Statistik
Data statistik adalah keterangan atau ilustrasi mengenai sesuatu hal yang bisa
berbentuk kategori (misalnya rusak, baik, cerah, berhasil) atau bilangan. Selanjutnya data
yang berupa kategori disebut sebagai data kualitatif dan data bilangan disebut data
kuantitatif. Berdasarkan cara perolehannya data kuantitatif dibedakan menjadi data
diskrit dan data kontinu. Data-data yang diperoleh dari hasil menghitung atau membilang
termasuk dalam data diskrit, sedangkan data-data yang diperoleh dari hasil mengukur
termasuk dalam data kontinu.
Menurut sumbernya kita mengenal data intern dan data ekstern. Data intern
adalah data yang diperoleh dari perusahaan atau instansi yang bersangkutan. Sedangkan
data ekstern diperoleh dari luar instansi atau perusahaan tersebut.
Data ekstern dibedakan menjadi data primer dan data sekunder. Data primer
adalah data yang dikeluarkan oleh badan sejenis. Sedangkan data lainnya termasuk data
sekunder. Semua data-data yang beru dikumpulkan dan belum pernah diolah disebut
sebagai data mentah.
1.3. Populasi dan sampel
Populasi adalah keseluruhan pengamatan yang menjadi perhatian kita baik yang
berhingga maupun tak berhingga jumlahnya. Seringkali tidak praktis mengambil data dari
keseluruhan populasi untuk menarik suatu kesimpulan. Untuk itu dilakukan pengambilan
sampel yaitu sebagian atau himpinan bagian dari populasi. Sampel yang diambil haris
dapat merepresentasikan populasi yang ada. Prosedur pengambialan sampel yang
menghasilkan kesimpulan yang konsisten terlalu tinggi atau terlalu rendah mengenai
suatu ciri populasi dikatakan berbias. Untuk menghindari kemungkinan bias ini perlu
dilakukan pengambian contoh acak atau contoh acak sederhana. Contoh acak sederhana
didefinisikan sebagai contoh yang dipilih sedemikian rupa sehingga setiap himpunan
bagian yang berukuran n dari populasi mempunyai peluang terpilih yang sama.
1.4. Pembulatan angka
Dalam perhitungan dan analisis data statistik seringkali diperlukan pembulatan
angka-angka. Berikut ini adalah beberapa aturan tentang pembulatan angka-angka.
1. Jika angka yang harus dihilangkan adalah 4 atau kurang, maka angka terkanan yang
mendahuluinya tetap.
Contoh: Rp. 59.376,- dibulatkan menjadi Rp. 59 ribu.
2. Jika angka yang haarus dihilangkan adalah lebih dari 5 atau angka 5 diikuti angka
bukan nol maka angka yang mendahuluinya ditambah dengan 1.
Contoh: 176,51 kg dibulatkan menjadi 177 kg.
3. Jika angka yang harus dihilangkan hanya angka 5 atau angka 5 diikuti nol, maka
angka yang mendahuluinya tetap jika genap dan ditambah 1 jika ganjil.
Contoh: 8,500 dibulatkan menjadi 8
19,5 dibulatkan menjadi 20
1.5. Penyajian Data
Secara garis besar ada dua macam cara penyajian data dalam statistika yaitu:
1. Tabel atau daftar yang dapat berbentuk:
a. Daftar baris kolom
b. Daftar kontingensi
c. Daftar distribusi frekuensi
2. Grafik atau diagram yang terbagi menjadi:
a. Diagram batang atau balok
b. Diagram garis atau grafik
c. Diagram lingkaran
d. Diagram lambing
e. Diagram peta
f. Diagram pencar
1.6. Daftar distribusi frekuensi dan grafiknya
Dalam distribusi frekuensi data dikelompokkan dalam beberapa kelas interval misalnya
a–b, c-d dan seterusnya. Ada beberapa istilah yang digunakan dalam distribusi frekuensi
yaitu:
1. Limit kelas atau ujung kelas yaitu nilai-nilai terkecil dan terbesar dalam setiap
kelas interval. Nilai terbesar disebut sebagai limit atas kelas dan nilai terkecil
disebut sebagai limit bawah kelas.
2. Batas kelas yaitu limit kelas ± setengah nilai skala terkecil. Nilai yang besar
disebut batas atas kelas dan nilai yang kecil disebut sebagai batas bawah kelas.
3. Titik tengah kelas atau tanda kelas yaitu nilai yang terletak pada engah setiap kelas
interval. Aturan umum yang digunakan untuk menentukan titik tengah kelas atau
tanda kelas adalah:
Tanda kelas = ± ½ (limit bawah + limit atas)
Macam-macam distribusi frekuensi
1. Distribusi frekuensi
2. Distribusi frekuensi. Relative (%)
3. Distribusi frekuensi kumulatif kurang dari
4. Distribusi frekuensi kumulatif lebih dari
1.7. CARA MEMBUAT DIST. FREK.
1. Tentukan Rentang
R = Nilai terbesar – nilai terkecil.
= 99 - 35 = 64
2. Tentukan banyaknya kelas interval.
Acuan aturan Starges
Banyak kelas = 1 + (3,3) log n
= 1 + (3,3) log 80 = 7,28
≈ 7 kelas
3. Tentukan panjang kelas interval
sBanyakkelagtannReP = =
764 = 9,14 = 10
4. Tentukan limit kelas
5. Daftar semua limit keats
6. Menentukan frekwensi → bantuan kolom tabulasi
Contoh:
Nilai Ujian Statistik 80 orang mahasiswa adalah sebagai berikut:
79 49 48 34 81 98 87 80
80 84 90 70 91 93 82 78
70 71 92 38 56 81 74 73
68 72 85 51 65 93 83 86
80 35 83 73 74 43 86 88
92 93 76 71 90 72 67 75
80 91 61 72 97 81 88 81
70 74 98 95 80 59 73 71
83 60 83 82 60 67 89 63
76 63 88 70 66 88 79 75
Dengan menggunakan aturan pembuatan distribusi frekuensi tersebut di atas dapat dibuat sebuah distribusi frekuensi dengan 7 kelas sebagai berikut:
Nilai Ujian Frekuensi (f) 31 – 40 41 – 50 51 – 60 61 – 70 71 – 80 81 – 90 91 - 100
2 3 5 14 24 20 12
1.8. Model Populasi
Adalah pendekatan bentuk polygon frekuensi dengan garis lengkung halus yang
bentuknya secocok mungkin:
a. Model normal
b. Model simetrik
c. Model miring (ke kanan/ke kiri).
Jika suatu frekwensi tidak simetrik maka nilai mean (rata-rata) dan median tidak sama.
Koefisien ke menjuluran pearson (sk)
σµµ
= - ( 3 sk µ = median
µ = mean (rata-rata)
σ = simpangan baku.
TUGAS I :
Berikut ini adalah data daya tahan alat terhadap suatu insektisida dalam satuan menit.
2.4 0.7 3.9 2.8 1.3
1.6 2.9 2.6 3.7 2.1
3.2 3.5 1.8 3.1 0.3
4.6 0.9 3.4 2.3 2.5
0.4 2.1 2.5 1.5 4.3
1.8 2.4 1.3 2.6 1.8
2.7 0.4 2.8 3.5 1.4
1.7 3.9 1.1 5.9 2.0
5.3 6.3 0.2 2.0 1.9
1.2 2.5 1.2 1.2 1.7
Dengan menggunakan 8 kelas interval dan nilai terendah 0,1
a. Buat distribusi frekuensi, distribusi frekuensi relatif (%) dan distribusi frekuensi
kumulatif
b. Dengan menggunakan Microsoft Exel buatlah
1. Diagram balok, histogram, polygon frekuensi, Ogif dan diagram
lingkaran.
2. Tentukan rata-rata (mean), modus, median, kuartil dan desil.
1.9. UKURAN PEMUSATAN
Ukuran pemusatan dibagi dalam dua kelompok
1. Ukuran gejala pusat, meliputi
• Rata-rata hitung (mean)
• Rata-rata ukur
• Rata-rata harmonic
• Rata-rata gabungan
• Modus
2. Ukuran letak, meliputi
• Median
• Kuartil
• Desil
• Persentil
Ukuran-ukuran tersebut di atas dapat dihitung dari kumpulan data populasi atau sampel.
Jika ukuran-ukuran yang diambil dihitung dari data populasi disebut parameter ,
sedangkan jika dihitung dari data sampel disebut statistic.
1.9.1. Rata-rata Hitung (Mean)
Diperoleh dengan membagi jumlah seluruh data dengan banyak data
nx
x i∑=
Jika masing-masing mempunyai frekuensi maka rata-ratanya disebut sebagai rata-rata
terboboti.
∑
∑=i
ii
fxf
x
contoh;
Barang Disimpan (fi) % Rusak (xi) fi xi
A 100 96 96
B 200 46 92
C 160 50 80
D 80 75 60
Berapa persen rata-rata barang yang rusak
%07,60%100x540328
fxf
xi
ii ===∑
∑
Bukan seperti ini
( ) %75,664
%75%50%46%96x =+++
=
1.9.2. Rata-rata Gabungan
Jika kita mempunyai data n1, n2, n3, … dengan nilai rata-rata masing-masing ...,x,x,x 321
maka rata-rata gabungan data di atas dinyatakan dengan
∑
∑=i
iigab n
xnx
Untuk data-data yangv tersusun dalam distribusi frekuensi rata-ratanya dihitung dengan
∑
∑=k
kk
fxf
x
dengan xk : nilai tengah kelas
fk : frekuensi kelas
atau dengan cara singkat/sandi (khusus untuk lebar kelas yang sama) yakni sebagai
berikut
+=
∑∑
i
iio f
cfpxx
dengan xo : tengah kelas acuan fi : frekuensi ke-i
p : lebar kelas ci : harga sandi
1.9.3 Rata-rata Ukur (geometrik)
Digunakan jika perbandingan dua data berturutan tetap atau hampir tetap.
nn321 x...x.x.xU =
Untuk bilangan-bulangan yang besar digunakan
n
xlogUlog i∑=
Untuk fenomena yang bersifat tumbuh seperti pertumbuhan penduduk, bakteri dan lain-
lain digunakan
t
ot 100x1PP
+=
Untuk data-data yang telah disusun dalam daftar distribusi frekuensi rata-rata ukurnya
dinyatakan
( )∑
∑=i
ii
fxlogf
Ulog
1.9.4. Rata-rata Harmonik
Rata-rata harmonik biasanya digunakan untuk merata-ratakan kecepatan beberapa jarak
tempuh atau mencari harga rata-rata suatu komoditi tertentu.
∑
=
ix1
nH
Untuk data-data yang disusun dalam distribusi frekuensi
∑
∑
=
i
i
i
xf
fH
Secara umum hubungan rata-rata hitung ( )x , rata-rata ukur (U) dan rata-rata harmonic
(H) dinyatakan
xUH ≤≤
1.9.5. MODUS
Modus adalah nilai atau fenomena yang paling sering muncul jika datanya telah disusun
dalam distribusi frekuensi .
+
+=21
1o bb
bpbM
dengan b : batas bawah kelas modal (kelas dengan frekuensi tertinggi)
p : panjang/lebar kelas modal
b1: frekuensi kelas modal dikurangi frekuensi kelas sebelumnya
b2: frekuensi kelas modal dikurangi frekuensi kelas sebelumnya
1.9.6. KUARTIL
Jika sekumpulan data dibagi menjadi empat bagian yang sama setelah di urutkan maka
nilai yang membaginya disebut kuartil.
( )4
1nikedatakLetak i+
= ; i = 1, 2, 3
Untuk data yang disusun dalam distribusi frekuensi
−+=
f
F10ni
pbKi ; i = 1, 2, 3
dengan b : batas bawah kelas Di
p : panjang kelas Di
F : jumlah seluruh frekuensi sebelum kelas Di
f : frekuensi kelas Di
1.9.7. PRESENTIL
Jika sekumpulan data dibagi 100 sama besar akan menghasilkan persentil ke 1,2,3,…,99.
( )100
1nikedataPLetak i+
=
Untuk data dalam distribusi frekuensi
f
F100
ni
pbPi
−
+=
dengan b : batas bawah kelas Pi
p : panjang kelas Pi
F : jumlah seluruh frekuensi sebelum kelas Pis
f : frekuensi kelas Pi
QUIZ I
1. Apa yang dimaksud data diskrit dan data kontinu. Berikan masing-masing dua
contoh!
2. Jelaskan perbedaan diagram batang dan histogram. Gambarkan sketsanya!
3. Bagaimana rumus aturan untuk menentukan banyak kelas interval. Beri
keterangan symbol-simbolnya.
4. Berikut adalah data umur 100 karyawan pabrik
52352352585856523140405136524153293144286258243746435832316359512943646544355237673433476835614038345755415952316140414944414456436448283331254527594230404237412626404553473936333534475250675345405144
a. Buat daftar distribusi frekuensi dengan 5 kelas.
b. Gambarkan polygon frekuensinya.
c. Tentukan mean, modus, median
Kuartil 1 dan desil 7 berdasarkan distribusi fekuensi yang telah dibuat.
1.10. UKURAN SIMPANGAN
Ukuran simpangan digunakan sebagai gambaran bagaimana berpencarnya suatu
data kuantitatif. Ukuran-ukuran tersebut yaitu:
a. Rentang = data terbesar – data terkecil
b.Rentang Antar Kuartil (RAK)
RAK = K3 – K1
c. Simpangan Kuartil (SK)
SK = 1/2 RAK = 1/2 (K3 – K1)
d. Rata-rata Simpangan (RS)
RS = n
i∑ χ−χ Selalu positif
e. Simpangan baku/ deviasi standart
• Simpangan baku untuk sampel disimbolkan S
• Simpangan baku untuk populasi disimbolkan σ
Kuadrat simpangan baku disebut Varians
Varians sampel dihitung dengan :
S2 = ( )
1n
2i
−χ−χ∑
atau
S2 = ( )
( )1nnn 2
i2
i
−
χ−χ∑ ∑ Ini lebih dianjurkan karena kesalahannya -
Lebih kecil Jika datanya dalam distribusi frekuensi :
S2 = ( )
1nf 2
ii
−
χ−χ∑
Atau
S2 = ( )
( )1nnffn 2
ii2
ii
−
χ−χ∑ ∑
Cara Sandi xi dapat diganti ci
Simpangn baku gabungan
S2 = ( )
∑∑
−
−
KnS1n 2
ii
ni = jumlah data sampel ke i
Si = Simpangan baku sample ke i
K = jumlah / banyaknya sampel .
Bilangan baku/ Nilai Z
Bilangan baku/nilai z didefinisikan sebagai :
Zi = si∑ χ−χ
; i = 1,2,3,…. N
Atau lengkapnya
Zi =
χ−χ
ss i
oo +χ xo = rata-rata bilangan baku
so = Simpangan baku
Ukuran-ukuran simpangan diatas merupakan ukuran absolut. Jika dari simpangan
absolut diambil simpangan bakunya, maka kita dapat koefisien Variasi
KV = %100xrata-rata
bakuSimpangan
Selain ukuran simpangan/ disperse absolut, dikenal pula dispersi relatif yang dinyatakan :
Dispersi relative = rata-rata
bakuSimpangan