PAKET PROGRAM SIMULASI STATISTIKA
-
Upload
ltryohandoko -
Category
Education
-
view
1.927 -
download
0
description
Transcript of PAKET PROGRAM SIMULASI STATISTIKA
MAKALAH
PAKET PROGRAM SIMULASI STATISTIKA
Dosen Pengampu: Florentina Yuni Arini,S.Kom.,M.Cs.
Disusun oleh:
Luky Triohandoko ( 4112311002 )
Astetika Rosyana ( 4112311023 )
Muhammad Syarif Hidayat ( 4112311030 )
Dania Istiqomah ( 4112311031 )
JURUSAN MATEMATIKA
FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM
UNIVERSITAS NEGERI SEMARANG
2013
DAFTAR ISI
HALAMAN JUDUL ...........................................................................................i
DAFTAR ISI .......................................................................................................iii
BAB I Statistika..................................................................................................1
BAB II Variabel dan Data....................................................................................
BAB III Jenis Data ...............................................................................................
BAB IV Pemilihan presentasi data tepat...............................................................
BAB V Arti ukuran gejala pusat...................................................................
BAB VI Arti Sebaran Data............................................................................
I. STATISTIKA
Statistika adalah ilmu yang mempelajari bagaimana merencanakan,
mengumpulkan, menganalisis, menginterpretasi, dan mempresentasikan data.
Singkatnya, statistika adalah ilmu yang berkenaan dengan data. Istilah 'statistika'
(bahasa Inggris: statistics) berbeda dengan 'statistik' (statistic). Statistika merupakan
ilmu yang berkenaan dengan data, sedang statistik adalah data, informasi, atau hasil
penerapan algoritma statistika pada suatu data. Dari kumpulan data, statistika dapat
digunakan untuk menyimpulkan atau mendeskripsikan data; ini dinamakanstatistika
deskriptif. Sebagian besar konsep dasar statistika mengasumsikan teori probabilitas.
Beberapa istilah statistika antara lain: populasi, sampel, unit sampel, dan probabilitas.
Statistika banyak diterapkan dalam berbagai disiplin ilmu, baik ilmu-ilmu
alam (misalnya astronomi dan biologi maupun ilmu-ilmu sosial
(termasuk sosiologi dan psikologi), maupun di bidangbisnis, ekonomi, dan industri.
Statistika juga digunakan dalam pemerintahan untuk berbagai macam tujuan; sensus
penduduk merupakan salah satu prosedur yang paling dikenal. Aplikasi statistika
lainnya yang sekarang popular adalah prosedur jajak pendapat atau polling (misalnya
dilakukan sebelum pemilihan umum), serta hitung cepat (perhitungan cepat hasil
pemilu) atauquick count. Di bidang komputasi, statistika dapat pula diterapkan
dalam pengenalan pola maupun kecerdasan buatan.
Sejarah
Penggunaan istilah statistika berakar dari istilah istilah dalam bahasa latin
modern statisticum collegium ("dewan negara") dan bahasa
Italia statista ("negarawan" atau "politikus"). Gottfried Achenwall (1749)
menggunakan Statistik dalam bahasa Jerman untuk pertama kalinya sebagai nama
bagi kegiatan analisis data kenegaraan, dengan mengartikannya sebagai "ilmu tentang
negara (state)". Pada awal abad ke-19 telah terjadi pergeseran arti menjadi "ilmu
mengenai pengumpulan dan klasifikasi data". Sir John Sinclair memperkenalkan
nama (Statistics) dan pengertian ini ke dalam bahasa Inggris. Jadi, statistika secara
prinsip mula-mula hanya mengurus data yang dipakai lembaga-lembaga administratif
dan pemerintahan. Pengumpulan data terus berlanjut, khususnya melalui sensus yang
dilakukan secara teratur untuk memberi informasi kependudukan yang berubah setiap
saat.
Pada abad ke-19 dan awal abad ke-20 statistika mulai banyak menggunakan bidang-
bidang dalam matematika, terutama peluang. Cabang statistika yang pada saat ini
sangat luas digunakan untuk mendukung metode ilmiah, statistika inferensi,
dikembangkan pada paruh kedua abad ke-19 dan awal abad ke-20 oleh Ronald
Fisher (peletak dasar statistika inferensi),Karl Pearson (metode regresi linear),
dan William Sealey Gosset (meneliti problem sampel berukuran kecil). Penggunaan
statistika pada masa sekarang dapat dikatakan telah menyentuh semua bidang ilmu
pengetahuan, mulai dari astronomi hingga linguistika. Bidang-
bidang ekonomi, biologi dan cabang-cabang terapannya, serta psikologi banyak
dipengaruhi oleh statistika dalam metodologinya. Akibatnya lahirlah ilmu-ilmu
gabungan seperti ekonometrika, biometrika (atau biostatistika), dan psikometrika.
Meskipun ada pihak yang menganggap statistika sebagai cabang dari matematika,
tetapi sebagian pihak lainnya menganggap statistika sebagai bidang yang banyak
terkait dengan matematika melihat dari sejarah dan aplikasinya. Di Indonesia, kajian
statistika sebagian besar masuk dalam fakultas matematika dan ilmu pengetahuan
alam, baik di dalam departemen tersendiri maupun tergabung dengan matematika.
Beberapa kontributor statistika
Carl Gauss
Blaise Pascal
Sir Francis Galton
William Sealey Gosset (dikenal dengan sebutan "Student")
Karl Pearson
Sir Ronald Fisher
Gertrude Cox
Charles Spearman
Pafnuty Chebyshev
Aleksandr Lyapunov
Isaac Newton
Abraham De Moivre
Adolph Quetelet
Florence Nightingale
John Tukey
George Dantzig
Thomas Bayes
Konsep dasar
Dalam mengaplikasikan statistika terhadap permasalahan sains, industri, atau sosial,
pertama-tama dimulai dari mempelajari populasi. Makna populasi dalam statistika
dapat berarti populasi benda hidup, benda mati, ataupun benda abstrak. Populasi juga
dapat berupa pengukuran sebuah proses dalam waktu yang berbeda-beda, yakni
dikenal dengan istilah deret waktu.
Melakukan pendataan (pengumpulan data) seluruh populasi dinamakan sensus.
Sebuah sensus tentu memerlukan waktu dan biaya yang tinggi. Untuk itu, dalam
statistika seringkali dilakukan pengambilan sampel (sampling), yakni sebagian kecil
dari populasi, yang dapat mewakili seluruh populasi. Analisis data dari sampel
nantinya digunakan untuk menggeneralisasi seluruh populasi.
Jika sampel yang diambil cukup representatif, inferensial (pengambilan keputusan)
dan simpulan yang dibuat dari sampel dapat digunakan untuk menggambarkan
populasi secara keseluruhan. Metode statistika tentang bagaimana cara mengambil
sampel yang tepat dinamakan teknik sampling.
Analisis statistik banyak menggunakan probabilitas sebagai konsep dasarnya hal
terlihat banyak digunakannya uji statistika yang mengambil dasar pada sebaran
peluang. Sedangkanmatematika statistika merupakan cabang dari matematika
terapan yang menggunakan teori probabilitas dan analisis matematika untuk
mendapatkan dasar-dasar teori statistika.
Ada dua macam statistika, yaitu statistika deskriptif dan statistika inferensial.
Statistika deskriptif berkenaan dengan deskripsi data, misalnya dari menghitung rata-
rata dan varians dari data mentah; mendeksripsikan menggunakan tabel-tabel atau
grafik sehingga data mentah lebih mudah “dibaca” dan lebih bermakna. Sedangkan
statistika inferensial lebih dari itu, misalnya melakukan pengujian hipotesis,
melakukan prediksi observasi masa depan, atau membuat model regresi.
Statistika deskriptif berkenaan dengan bagaimana data dapat digambarkan
dideskripsikan) atau disimpulkan, baik secara numerik (misalnya menghitung rata-
rata dan deviasi standar) atau secara grafis (dalam bentuk tabel atau grafik), untuk
mendapatkan gambaran sekilas mengenai data tersebut, sehingga lebih
mudah dibaca dan bermakna.
Statistika inferensial berkenaan dengan permodelan data dan melakukan pengambilan
keputusan berdasarkan analisis data, misalnya melakukan pengujian hipotesis,
melakukan estimasi pengamatan masa mendatang (estimasi atau prediksi), membuat
permodelan hubungan (korelasi, regresi, ANOVA, deret waktu), dan sebagainya.
Metode Statistika
Dua jenis penelitian: eksperimen dan survai
Terdapat dua jenis utama penelitian: eksperimen dan survei. Keduanya sama-sama
mendalami pengaruh perubahan pada peubah penjelas dan perilaku peubah respon
akibat perubahan itu. Beda keduanya terletak pada bagaimana kajiannya dilakukan.
Suatu eksperimen melibatkan pengukuran terhadap sistem yang dikaji, memberi
perlakuan terhadap sistem, dan kemudian melakukan pengukuran (lagi) dengan cara
yang sama terhadap sistem yang telah diperlakukan untuk mengetahui apakah
perlakuan mengubah nilai pengukuran. Bisa juga perlakuan diberikan secara simultan
dan pengaruhnya diukur dalam waktu yang bersamaan pula. Metode statistika yang
berkaitan dengan pelaksanaan suatu eksperimen dipelajari dalam rancangan
percobaan (desain eksperimen).
Dalam survey, di sisi lain, tidak dilakukan manipulasi terhadap sistem yang dikaji.
Data dikumpulkan dan hubungan (korelasi) antara berbagai peubah diselidiki untuk
memberi gambaran terhadap objek penelitian. Teknik-teknik survai dipelajari
dalam metode survei.
Penelitian tipe eksperimen banyak dilakukan pada ilmu-ilmu rekayasa, misalnya
teknik, ilmu pangan, agronomi, farmasi, pemasaran (marketing), dan psikologi
eksperimen.
Penelitian tipe observasi paling sering dilakukan di bidang ilmu-ilmu sosial atau
berkaitan dengan perilaku sehari-hari, misalnya ekonomi, psikologi dan pedagogi,
kedokteran masyarakat, dan industri.
Tipe pengukuran
Ada empat tipe skala pengukuran yang digunakan di dalam statistika, yaitu nominal,
ordinal, interval, dan rasio. Keempat skala pengukuran tersebut memiliki tingkat
penggunaan yang berbeda dalam pengolahan statistiknya.
Skala nominal hanya bisa membedakan sesuatu yang bersifat kualitatif atau kategoris,
misalnya jenis kelamin, agama, dan warna kulit.
Skala ordinal selain membedakan sesuatu juga menunjukkan tingkatan, misalnya
pendidikan dan tingkat kepuasan pengguna.
Skala interval berupa angka kuantitatif namun tidak memiliki nilai nol mutlak
sehingga titik nol dapat digeser sesuka orang yang mengukur, misalnya tahun dan
suhu dalam Celcius.
Skala rasio berupa angka kuantitatif yang memiliki nilai nol mutlak dan tidak dapat
digeser sesukanya, misalnya adalah suhu dalam Kelvin, panjang, dan massa.
Teknik-teknik statistika
Beberapa pengujian dan prosedur yang banyak digunakan dalam penelitian antara
lain:
Analisis regresi dan korelasi
Analisis varians (ANOVA)
khi-kuadrat
Uji t-Student
Statistika Terapan
Bebebarapa ilmu pengetahuan menggunakan statistika terapan sehingga mereka
memiliki terminologi yang khusus. Disiplin ilmu tersebut antara lain:
Aktuaria (penerapan statistika dalam bidang asuransi)
Biostatistika atau biometrika (penerapan statistika dalam ilmu biologi)
Statistika bisnis
Ekonometrika
Psikometrika
Statistika sosial
Statistika teknik atau teknometrika
Fisika statistik
Demografi
Eksplorasi data (pengenalan pola)
Literasi statistik
Analisis proses dan kemometrika (untuk analisis data kimia analis dan teknik kimia)
Statistika memberikan alat analisis data bagi berbagai bidang ilmu. Kegunaannya
bermacam-macam: mempelajari keragaman akibat pengukuran, mengendalikan
proses, merumuskan informasi dari data, dan membantu pengambilan keputusan
berdasarkan data. Statistika, karena sifatnya yang objektif, sering kali merupakan
satu-satunya alat yang bisa diandalkan untuk keperluan-keperluan di atas.
Piranti lunak
Perhitungan statistika modern banyak dilakukan oleh komputer, dan bahkan beberapa
perhitungan hanya dapat dilakukan oleh komputer berkecepatan tinggi,
misalnya jaringan saraf tiruan. Revolusi komputer telah membawa implikasi
perkembangan statistika di masa mendatang, dengan penekanan baru pada statistika
eksperimental dan empirik.
II. VARIABLE DAN DATA
Pengertian Data dan Variabel
Data adalah kumpulan kumpulan fakta atau angka atau segala sesuatu yang dapat
dipercaya kebenarannya sehingga dapat digunakan sebagai dasar menarik suatu
kesimpulan.
Variabel adalah karakteristik yang dapat diamati dari sesuatu (objek) dan mampu
memberikan bermacam-macam nilai atau beberapa kategori.
Penggolongan Data Statistik
1. Ditinjau dari variabel yang diteliti (segi sifat angkanya), data statistik dapat
dibedakan menjadi dua golongan, yaitu: data kontinu dan data diskrit.
- Variabel atau data kontinu adalah data statistik yang angka-angkanya merupakan
deretan angka yang sambung-menyambung. Dengan kata lain, data kontinu ialah data
yang deretan angkanya merupakan suatu kontinum. Contoh:
1. Data statistik mengenai tinggi badan (dalam ukuran sentimeter): 160-160,1- 160,2-
160,3-160,4-160, 5-160,6-160,7 dan seterusnya.
2. Data statistik mengenai berat badan (dalam ukuran kilogram): 50-50,1-50,2- 50,3-
50, 4-50,5-50,6-50,7-50,8-50,9 dan seterusnya.
- Variabel atau data diskrit ialah data statistik yang tidak mungkin berbentuk pecahan.
Contoh:
1. Data statistik tentang jumlah anggota keluarga (dalam satuan orang): 1 – 2 – 3 – 4 –
5 – 6 – 7 dan sebagainya.
2. Data statistik tentang jumlah buku-buku perpustakaan: (dalam satuan eksemplar):
50 – 125 – 307 – 5113 – 12891- dan sebagainya.
Dalam hal ini jelas bahwa tidak mungkin jumlah anggota keluarga = 1,25 – 3,50 dan
sebagainya; demikian pula tidak mungkin jumlah buku perpustakaan = 50,75 – 125,33
– 209,67 – dan sebagainya.
2. Penggolongan berdasarkan cara menyusun angka ditinjau dari segi cara menyusun
angka, data statistik dapat dibedakan menjadi tiga macam; yaitu data nominal, data
ordinal, dan data interval.
- Data Nominal ialah data statistik yang cara menyusun angkanya didasarkan atas
penggolongan atau klasifikasi tertentu. Data nominal juga sering dinyatakan dengan
data hitungan. Disebut demikian, karena data tersebut diperoleh dengan cara
menghitung (dalam hal ini menghitung jumlah siswa, baik menurut tingkatan studi
maupun jenis kelaminnya).
- Data ordinal juga sering disebut dengan data urutan, yaitu data statistik yang cara
menyusun angkanya didasarkan atas urutan kedudukan (ranking).
- Data interval ialah data statistik yang terdapat jarak sama di antara hal-hal yang
sedang diselidiki atau dipersoalkan.
3. Penggolongan Data Berdasarkan Bentuk Angka ditinjau dari segi bentuk angkanya,
data statistik dapat dibedakan menjadi 2 (dua) macam, yaitu data tunggal (un grouped
data) dan data kelompok atau data bergolong (grouped data).
- Data tunggal ialah data statistik yang masing-masing angkanya merupakan satu unit
(satu kesatuan). Dengan kata lain, data tunggal ialah data statistik yang masing-
masing angkanya merupakan satu unit (satu kesatuan) atau data statistik yang angka-
angkanya tidak dikelompokkan.
- Data kelompok ialah data statistik yang tiap-tiap unitnya terdiri dari sekelompok
angka.
4. Penggolongan Data Statistik Berdasarkan Sumbernya ditinjau dari sumber mana
data tersebut diperoleh, data statistik dapat dibedakan menjadi dua macam, yaitu: data
primer dan data sekunder.
- Data primer adalah data statistik yang diperoleh atau bersumber dari tangan pertama
(first hand data). Contoh: data tentang prestasi belajar siswa yang diperoleh dari
bagian kesiswaan.
- Sedangkan data sekunder adalah data statistik yang diperoleh dari tangan kedua
(second hand data). Data tentang jumlah siswa yang tawuran pada tahun 2006,
diperoleh dari surat kabar harian Kompas.
5. Penggolongan Data Statistik Berdasarkan Waktu Pengumpulannya ditinjau dari
segi waktu pengumpulannya, data statistik dapat dibedakan menjadi dua golongan,
yaitu: data seketika (cross section data) dan data urutan waktu (time series data).
- Data seketika adalah data statistik yang mencerminkan keadaan pada satu waktu saja
(at a point time). Contoh, data statistik tentang jumlah guru di “SD Karawaci” dalam
tahun ajaran 2006/2007 (hanya satu tahun ajaran saja).
- Data urutan waktu ialah data statistik yang mencerminkan keadaan atau
perkembangan mengenai sesuatu hal, dari satu alokasi waktu ke waktu yang lain
secara berurutan. Data urutan waktu sering juga dikenal dengan istilah historical data.
Contoh: data statistik tentang jumlah guru di “SD Karawaci” tahun ajaran 2002/2003
sampai dengan tahun 2006/2007.
Penggolongan Variabel
Secara umum, variabel dibagi atas 2 (dua) jenis, yaitu variabel kontinu (continous
variabel) dan variabel deskrit (descrete variabel). Variabel dapat juga dibagi sebagai
variabel dependen dan variabel bebas. Variabel dapat dilihat sebagai variabel aktif
dan variabel atribut.
1. Variabel kontinu adalah variabel yang dapat ditentukan nilainya dalam jarak
jangkau tertentu dengan desimal yang tidak terbatas. Sebagai contoh, berat, tinggi,
luas, pendapatan, dan lain sebagainya. Untuk berat badan misalnya, kita bisa menulis
75,0 kg, atau 76,14 kg, atau 40,5556. Luas panen, bisa 14,2 ha, 19,49 ha, atau
188,0003 ha.
2. Variabel diskrit adalah konsep yang nilainya tidak dapat dinyatakan dalam bentuk
pecahan atau desimal di belakang koma. Variabel ini sering juga dinyatakan sebagai
variabel kategori. Kalau mempunyai dua kategori saja dinamakan juga variabel
dikotomi. Sebagai contoh, jenis kelamin, terdiri atas laki-laki atau perempuan. Status
perkawinan, terdiri atas kawin atau tidak kawin. Apabila ada lebih dari dua kategori,
disebut juga variabel politomi. Tingkat pendidikan adalah variabel politomi, SD,
SMP, SMA, perguruan tinggi, dan sebagainya. Jumlah anak merupakan variabel
diskrit. Jumlah anak hanya dapat: 3, 4, atau 6. Tidak mungkin ada jumlah anak: 4,5;
5,6; 21/2, dan sebagainya.
3. Variabel Dependen dan Variabel Bebas Apabila ada hubungan antara dua variabel,
misalnya antara variabel Y dan variabel X, dan jika variabel Y disebabkan oleh
variabel X, maka variabel Y adalah variabel dependen dan variabel X adalah variabel
bebas. Contoh: jika dibuktikan ada hubungan antara motivasi intrinsik (variabel
bebas) dan prestasi belajar (variabel dependen), maka dengan meningkatnya motivasi
intrinsik meningkat juga skor prestasi belajar. Model matematika hubungan tersebut,
dinyatakan delam fungsi sebagai berikut.
X = f (Y)
Keterangan:
Y = prestasi belajar
X = motivasi intrinsik
f = fungsi
4. Variabel Aktif Variabel aktif adalah variabel yang dimanipulasikan oleh peneliti.
Apabila seorang peneliti memanipulasikan metode mengajar, metode memberikan
hukuman kepada siswa, maka metode mengajar dan memberikan hukuman pada
siswa adalah variabel-variabel aktif, karena variabel ini dapat dimanipulasikan.
5. Variabel Atribut Variabel-variabel yang tidak dapat dimanipulasikan atau sukar
dimanipulasikan, dinamakan variabel atribut. Variabel-variabel atribut umumnya
merupakan karakteristik manusia seperti; inteligensia, jenis kelamin, status
sosial, pendidikan, sikap, dan sebagainya. Variabel-variabel yang merupakan objek
inanimate seperti populasi, rumah tangga, daerah geografis, dan sebagainya, adalah
juga variabel-variabel atribut.
III. JENIS DATA
Sebelum mengenal lebih jauh tentang statistika, sebaiknya kita mengetahui
dahulu jenis data statistika. Dalam ilmu statistika, jenis data dibedakan menjadi empat
yaitu nominal, ordinal, interval dan rasio.
1. Nominal
Data berjenis nominal membedakan data dalam kelompok yang bersifat kualitatif.
Dalam ilmu statistika, data nominal merupakan data dengan level pengukuran yang
paling rendah.
Contohnya:
Data jenis kelamin pada sampel penelitian Departemen Pendidikan, data siswa
dikategorikan menjadi ’laki-laki’ yang diwaliki angka 1 dan ’perempuan’ yang
diwakili angka 2. Konsekuensi dari data nominal adalah tidak mungkin seseorang
memiliki dua kategori sekaligus dan angka yang digunakan di sini hanya sebagai
kode/simbol saja sehingga tidak dapat dilakukan operasi matematika.
2. Ordinal
Dalam ilmu statistika, data berjenis ordinal mempunyai level pengukuran yang lebih
tinggi daripada data nominal dan termasuk data kualitatif. Pada data nominal semua
data dianggap bersifat kualitatif dan setara, sedangkan pada data ordinal terdapat
klasifikasi data berdasarkan tingkatannya.
Contohnya:
Mengenai tingkat pendidikan yang dikategorikan menjadi ’SD’ yang diwakili angka
1, ’SMP’ yang diwakili angka 2, ’SMA’ yang diwakili angka 3, ’Diploma’ yang
diwakili angka 4, dan ’Sarjana’ yang diwakili angka 5. Sama halnya dengan data
nominal, meskipun tingkatannya lebih tinggi, data ordinal tetap tidak dapat dilakukan
operasi matematika. Angka yang digunakan hanya sebagai kode/simbol saja, dalam
contoh tadi tingkat pendidikan tertinggi adalah ’Sarjana’ dan terendah adalah ’SD’
(Sarjana > Diploma > SMA > SMP > SD).
3. Interval
Data berjenis interval termasuk dalam kelompok data kuantitatif. Dalam ilmu
statistika, data interval mempunyai tingkat pengukuran yang lebih tinggi daripada
data nominal maupun ordinal. Angka yang digunakan dalam data ini, selain
menunjukkan urutan juga dapat dilakukan operasi matematika. Angka nol yang
digunakan pada data interval bukan merupakan nilai nol yang nyata.
Contohnya:
Interval nilai pelajaran matematika siswa SMA 4 Surabaya adalah antara 0 sampai
100. Bila siswa A dan B masing-masing mempunyai nilai 45 dan 90, bukan berarti
tingkat kecerdasan B dua kali A. Nilai 0 sampai 100 hanya merupakan rentang yang
dibuat berdasarkan kategori pelajaran matematika dan mungkin berbeda dengan mata
pelajaran lain.
4. Rasio
Dalam ilmu statistika, data rasio merupakan tipe data dengan level pengukuran yang
paling tinggi dibandingkan dengan tipe data lain. Data ini termasuk dalam kelompok
data kuantitatif. Angka yang digunakan pada data ini menunjukkan angka yang
sesungguhnya, bukan hanya sebagai symbol dan memiliki nilai nol yang
sesungguhnya. Pada data ini, dapat dilakukan berbagai operasi matematika.
Contohnya:
Dalam sebuah bank, seseorang mempunyai tabungan dengan saldo 10.000.000 rupiah.
Angka tersebut menunjukkan bahwa orang tersebut benar-benar mempunyai saldo
sebesar 10.000.000 rupiah. Jika seseorang mempunyai saldo -1.000.000 rupiah berarti
orang tersebut mempunyai hutang sebesar 1.000.000 rupiah. Sedangkan jika
seseorang mempunyai saldo 0 rupiah berarti orang tersebut tidak mempunyai
tabungan maupun hutang.
IV. PEMILIHAN PRESENTASI DATA TEPAT
1. Populasi dan Sampel
Populasi yaitu sekelompok orang, kejadian atau segala sesuatu yang mempunyai
karakteristik tertentu. Populasi adalah keseluruhan subjek penelitian anggota populasi
disebut dengan elemen populasi. Apabila seseorang ingin meneliti semua elemen
yang ada dalam wilayah penelitian, maka penelitiannya merupakan penelitian
populasi atau disebut studi populasi, atau juga studi sensus.
Sampel, jika hanya ingin meneliti sebagian dari populasi, maka penelitiannya disebut
penelitian sampel. Sampel adalah sebagian atau wakil dari populasi yang diteliti.
Berdasarkan hasil sampel, peneliti kemudian menarik kesimpulan dalam sampel
sebagai kesimpulan penelitian yang berlaku bagi populasi.
2. Prosedur Pemilihan Sampel
Beberapa faktor yang menjadi alasan kenapa peneliti melakukan penelitian sampel
daripada sensus (populasi) adalah :
1. Jika jumlah elemen populasi-nya terlalu banyak, peneliti tidak akan mungkin
mengumpulkan seluruhnya karena butuh tenaga dan biaya yang relatif mahal.
2. Kualitas data yang dihasilkan oleh penelitian sampel seringkali lebih baik
dibandingkan dengan hasil sensus.
3. Proses penelitian sampel relatif lebih cepat.
4. Alasan lain, adalah jika dilakukan penelitian yang memerlukan pengujian yang
bersifat merusak.
Agar diperoleh sampel yang representatif peneliti perlu menggunakan prosedur
pemilihan sampel yang sistematis. Tahapannya adalah sebagai berikut :
1. Mengidentifikasi populasi target
2. Memilih kerangka pemilihan sampel
3. Menentukan metode pemilihan sampel
4. Merencanakan prosedur penentuan unit sampel
5. Menentukan ukuran sampel
6. Menentukan unit sampel
3. Metode Pemilihan Sampel Probabilitas dan Non-Probabilitas
Metode Pemilihan Sampel Probabilitas Pengambilan sampel probabilitas/acak
adalah suatu metode pemilihan sampel dimana setiap anggota populasi mempunyai
peluang yang sama untuk dipilih menjadi anggota sampel. Dari beberapa cara
pengambilan sampel dengan metode ini, tiga diantaranya adalah sebagai berikut :
1. Cara acak sederhana (Simple Random Sampling) Pengambilan sampel dengan
teknik ini terdiri dari beberapa cara, salah satu diantaranya adalah cara
sistematis/ordinal. Cara sistematis/ordinal merupakan teknik untuk memilih
anggota sampel melalui peluang dan teknik dimana pemilihan anggota sampel
dilakukan setelah terlebih dahulu dimulai dengan pemilihan secara acak untuk
data pertamanya.
2. Cara Stratifikasi (Stratified Random Sampling) Suatu populasi yang dianggap
heterogen menurut suatu karakteristik tertentu dikelompokan dalam beberapa sub-
populasi, sehingga tiap kelompok akan memiliki anggota sampel yang relatif
homogen (keragaman antar populasi tinggi sedangkan antar strata/sub-populasi
rendah). Lalu dari tiap sub-populasi ini secara acak diambil anggota sampelnya.
3. Cara Cluster (Cluster Sampling) Merupakan teknik pengambilan sampel dari
beberapa kelompok populasi secara acak, kemudian mengambil semuanya atau
sebagian dari setiap kelompok yang terpilih untuk dijadikan sampel. Pengambilan
sampel cluster mirip dengan cara stratifikasi, bedanya jika cara stratifikasi
menghasilkan kelompok yang unsur – unsurnya homogen maka dengan cara
cluster unsur – unsurnya menjadi heterogen. Metode Pemilihan Sampel Non-
probabilitas
Dengan cara ini semua elemen populasi belum tentu memiliki peluang yang sama
untuk dipilih menjadi anggota sampel. Cara ini juga sering disebut sebagai
pengambilan sampel berdasarkan pertimbangan, karena dalam pelaksanaanya pe-
riset menggunakan pertimbangan tertentu.
Berikut ini lima macam teknik sampling non-probabilitas :
1) Cara Keputusan (Judgment Sampling)
Sampling diambil berdasarkan kriteria yang telah dirumuskan terlebih dahulu oleh
peneliti. Cara ini lebih cocok dipakai pada saat tahap awal studi eksploratif.
2) Cara Dipermudah (Convinience Sampling)
Sampel dipilih karena ada ditempat dan waktu yang tepat. Penggunaan sampling ini
biasa digunakan pada awal penelitian eksploratif untuk mencari kondisi awal yang
menarik.
3) Cara Kouta (Quota Sampling)
Quota Sampling adalah metode memilih sampel yang mempunyai ciri-ciri tertentu
dalam jumlah atau quota yang diinginkan, teknik ini sangat mudah dan cepat
digunakan namun penentuan sampel cenderung subyektif.
4) Cara Bola Salju (Snowball Sampling)
Cara ini adalah teknik penentuan sampel yang mula – mula jumlahnya kecil
namun kemudian sampel diajak untuk memilih responden lain untuk dijadikan
sampel lagi, begitu seterusnya hingga jumlah sampel menjadi banyak.
5) Area Sampling
Pada prinsipnya cara ini menggunakan “perwakilan bertingkat”. Populasi dibagi
atas beberapa bagian populasi, dimana bagian populasi ini dapat dibagi – bagi
lagi.
3. Penentuan Ukuran Sampel
Ukuran sample tergantung beberapa faktor yang mempengaruhi diantaranya ialah:
a. Homogenitas unit-unit sample:
Secara umum semakin mirip unit-unit sampel; dalam suatu populasi semakin kecil
sample yang dibutuhkan untuk memperkirakan parameter-parameter populasi.
b. Kepercayaan:
Kepercayaan mengacu pada suatu tingkatan tertentu dimana peneliti ingin merasa
yakin bahwa yang bersangkutan memperkirakan secara nyata parameter populasi
yang benar. Semakin tinggi tingkat kepercayaan yang diingnkan, maka semakin
besar ukuran sample yang diperlukan.
c. Presisi:
Presisi mengacu pada ukuran kesalahan standar estimasi. Unutk mendapatkan
presisi yang besar dibutuhkan ukuran ssmpel yang besar pula.
d. Kekuatan Statsitik:
Istilah ini mengacu pada adanya kemampuan mendeteksi perbedaan dalam situasi
pengujian hipotesis. Untuk mendpatkan kekuatan yang tinggi, peneliti
memerlukan sample yang besar.
e. Prosedur Analisa:
Tipe prosedur analisa yang dipilih untuk analisa data dapat juga mempengaruhi
seleksi ukuran sample.
f. Biaya, Waktu dan Personil:
Pemilihan ukuran sample juga harus memeprtimbangkan biaya, waktu dan
personil. Sample besar akan menuntut biaya besar, waktu banyak dan personil
besar juga.
Ada bermacam – macam cara untuk menentukan ukuran sampel dari suatu
populasi, baik untuk ukuran populasi yang diketahui maupun yang tidak diketahui
(atau terlalu besar).
1. Rumus Slovin
Untuk menentukan berapa minimal sampel yang dibutuhkan jika ukuran
populasi diketahui, dapat digunakan rumus slovin.
2. Cara Interval Takisiran
Jika ukuran populasi tidak diketahui atau sangat besar, maka rumus yang
dipakai yakni rumus untuk menaksir parameter µ dan parameter P. Alat
analisis yang digunakan untuk menyesuaikan sampel adalah alat analisis Chi-
Square yang menuntut jumlah observasi tertentu.
Menaksir parameter rata – rata X – Za/2 ( σ/√n) < µ < X + Za/2 (σ/√n)
Menaksir parameter proporsi P ± Za/2 √(p.q/n)
4. Contoh Penerapannya
Penerapan teknik pemilihan sampel biasanya dilakukan untuk membuat
penelitian/riset terhadap suatu kelompok objek yang akan diteliti penerapanya
tersebut dapat berupa kuisioner, wawancara dll.
V. ARTI UKURAN GEJALA PUSAT
1. Pendahuluan
Untuk mendapatkan gambaran yang lebih jelas tentang sekumpulan
data mengenai sesuatu persoalan, baik mengenai sampel atau pun
populasi, selain dari data disajikan dalam tabel dan diagram, masih
diperlukan ukuran-ukuran yang merupakan wakil kumpulan data tersebut.
Dalam bab ini akan diuraikan tentang ukuran gejala pusat (rata-rata atau
rata-rata hitung, rata-rata ukur, rata-rata harmonis dan modus) dan
ukuran letak (median, kuartil, desil, dan persentil).
Ukuran yang dihitung dari kumpulan data dalam sampel dinamakan
statistik. Apabila ukuran itu dihitung dari kumpulan data dalam populasi
atau dipakai untuk menyatakan populasi, maka namanya parameter
bergantung pada apakah ukuran dimaksud untuk sampel atau populasi.
Rata-rata (average) ialah suatu nilai yang mewakili suatu kelompok
data. Nilai ini disebut juga ukuran gejala pusat karena pada umumnya
mempunyai kecenderungan terletak di tengah-tengah dan memusat ke
dalam suatu kelompok data yang disusun menurut besar kecilnya nilai
data.
Beberapa jenis rata-rata yang sering digunakan ialah:
1. Mayor Means terdiri dari:
Rata-rata hitung (Arithmetic means)
Median
Quartile
Decile
Percentile
Modus
2. Minor Means, terdiri dari:
Rata-rata ukur (Geometric means)
Rata-rata Harmonis (Harmonic Means)
Rata-rata Tertimbang
Rata-rata Kuadratis
Rata-rata dari Rata-rata (rata-rata gabungan)
Pengukuran nilai rata-rata dapat dilakukan dengan menggunakan
data populasi maupun data sampel, dan dari data yang belum
dikelompokkan maupun yang sudah dikelompokkan.
2. Ukuran Gejala Pusat
a. Rata-rata atau rata-rata hitung
Nilai –nilai data kuantitatif atau dinyatakan dengan x1, x2..........xn,
apabila dalam kumpulan data itu terdapat n buah nilai, simbol n juga akan
dipakai untuk menyatakan ukuran sampel, yakni banyak data yang diteliti
dalam sampel dengan simbol N dan dipakai untuk menyatakan populasi,
yakni banyak anggota terdapat dalam populasi.
Rata-rata atau lengkapnya rata-rata hitung, untuk data kuantitatif
yang terdapat dalam sebuah sampel dihitung dengan jalan membagi
jumlah nilai data oleh banyak data.
Simbol untuk rata-rata dari sampel ialah X , sedangkan untuk rata-
rata dari populasi dipakai simbol µ. Jadi X adalah statistik yang
merupakan ukuran yang dihitung dari data dalam sampel, sedangkan µ
adalah parameter yang merupakan ukuran yang dihitung dari data dalam
populasi.
Rumus untuk rata-rata X , adalah :
X=x1+x2+……+xn
natau X=
∑i=1
n
x i
n
Dengan :
x1 , x2, ...... : Nilai-nilai individual
n : Juml;ah individu dalam distribusi (sampel).
Contoh :
Jika ada nilai ujian dari 5 orang mahasiswa untuk mata kuliah
statistika berbentuk : 70 :69: 45 : 80 dan 56 jadi untuk ke lima nilai ujian
di atas, nilai rata-ratanya ialah :
X=70+69+45+80+565
=64
b. Modus
Modus disingkat Mo, ukuran yang menyatakan fenomena yang
paling banyak terjadi atau paling banyak terdapat. Untuk data kuantitatif
ditentukan dengan jalan menentukan frekuensi terbanyak di antara data
itu.
Ukuran ini juga dalam keadaan tidak disadari sering dipakai untuk
menentukan “rata-rata” data kualitatif. Jika kita dengan atau baca:
kebanyakan kematian di Indonesia disebabkanoleh penyakit malaria, pada
umumnya kecelakaan lalu lintas karena kecerobohan pengemudi, maka
ini tiada lain masing-masing merupakan modus penyebab kematian dan
kecelakaan lalu lintas.
Contoh :
Terdapat sampel dengan nilai-nilai data : 12, 34, 14, 34, 28, 34, 34,
28, 14. Dalam tabel dapat disusun seperti dibawah ini :
Tabel 1
xi fi
12
14
28
34
1
2
2
4
Jika data kuantitatif telah disusun dalam daftar distribusi frekuensi,
modusnya dapat ditentukan: Mo = b + p ( b1
b1+b2)
Untuk:
Frekuensi terbanyak, ialah f = 4,
terjadi untuk data bernilai 34. Maka
modus Mo = 34.
b = batas bawah kelas modal, ialah kelas interval dengan frekuensi
terbanyak.
P = panjang kelas modal.
b1= frekuensi kelas modal dikurangi frekuensi kelas interval
terdekat sebelumnya.
b2= frekuensi kelas modal dikurangi frekuensi kelas interval
terdekat sebelumnya.
Contoh:
Untuk mencari modus Mo data tabel 1, maka diperoleh :
Tabel 2
Kelembaban (x) f
31 – 40
41 – 50
51 – 60
61 – 70
71 – 80
81 – 90
91 – 100
1
2
5
15
25
20
12
Jumlah 80
Kelas modus = kelas kelima = 71 - 80
b = 70,5
b1 = 25 – 15 = 10
b2 = 25 – 20 = 5
p = 10.
Mo = 70,5 + (10) (1010+5 )
= 77,17
Modus, dibandingkan dengan ukuran lainnya, tidak tunggal
adanya. Ini berarti sekumpulan data tidak bisa mempunyai lebih dari
sebuah modus.
c. Median
Median (Me), menentukan letak data setelah data itu disusun
menurut uratan nilainya, artinya 50 % dari data harga-harganya paling
tinggi sama dengan Me sedangkan 50 % lagi harga-harganya paling
rendak sama dengan Me.
Setelah data disusun menurut nilainya dan jika banyak:
Data ganjil, maka median Me, , merupakan data paling tengah.
Untuk sampel berukuran genap, setelah data disusun menurut
urutan nilainya, mediannya sama dengan rata-rata dihitung dua
data tengah.
Untuk data yang telah disusun dalam daftar distribusi
frekuensinya, mediannya dihitung dengan rumus :
Me = b + p ( 1
2n−F
f )Dengan :
b = batas bawah kelas median, ialah kelas dimana median
akan terletak.
P = panjang kelas mediannya.
n = ukuran sampel atau banyak data
F = jumlah semua frekuensi sebelum kelas median.
f = frekuensi kelas median.
Contoh :
Jika untuk Data Kelembatan Hidrometeorologi di Singomerto
Selama 80 Hari akan dihitung mediannya dengan menggunakan
daftar berikut kita tempuh hal dibawah ini :
Tabel 3
Nilai (f)
31 – 40
41 – 50
51 – 60
61 – 70
71 – 80
81 – 90
91 – 100
1
2
5
15
25
20
12
Jumlah 80
b = 70,5; p = 10,
f = 35, sehingga
Me = 70,5 + (10)(40−2325 )=77 ,3
Setengah dari seluruh data ada 40
buah. Jadi median akan terletak di
kelas interval kelima, karana sampai
dengan ini jumlah frekuensi sudah
lebih dari 40. Dari kelas median ini
didapat
Ada 50 % dari data yang bernilai paling rendah 77,3 dan
setengahnya lagi bernilai paling besar 77,3.
Dari data dalam Daftar 3 tentang nilai ujian 80 mahasiswa, telah
didapat x = 76,62; Mo = 77,17 dan Me = 77,3. Kita lihat bahwa
harga-harga statistik tersebut berlainan
Ketiga nilai, yakni : rata-rata, median dan modus akan sama bila
kurva halusnya simetrik. Untuk fenomena dengan kurva halus positif atau
negatif, terdapat hubungan: Rata-rata – Mo = 3(Rata-rata-Me)
Median sering dipakai untuk “memperbaiki” harga rata-rata untuk
sekumpulan data. Jika terdapat harga ekstrim, sering rata-rata kurang
respresentatif sebagai ukuran gejala pusat. Dalam hal ini median dipakai
untuk “memperbaikinya”.
Kuartil, adalah nilai yang membagi sekelompok data menjadi 4
bagian yang sama banyak, sesudah disusun menurut urutan
nilainya. Ada tiga buah kuartil, ialah kuartil pertama, kuartil
kedua, dan kuartil ketiga yang masing-masing disingkat K1, K2,
K3. Pemberian nama ini dimulai dari kuartil paling kecil. Untuk
menentukan nilai kuartil :
1. susun data menurut urutan nilainya
2. tentukan letak kuartil
3. tentukan nilai kuartil
Letak K1= data ke
i( n+1)4 , dengan I = 1,2, 3
Contoh :
Sampel dengan data 75 82 66 57 64 56 92 94 86 52 60 70
setelah disusun menjadi : 52 56 57 60 64 66 70 75 82 86
92 94
Letak K1 = data ke
12+14 =data ke 3 1/4
K1 = data ke 3 + ¼ (data ke 4 – data ke 3)
= 57 + ¼ (60 – 57) = 57 ¾.
Letak K3 = data ke
3(12+1)4
= data ke 9 ¼.
K3 = data ke-9 + ¾ (data ke-10 – data ke 9)
= 82 + ( ¾ )(86-82) = 85
Untuk data yang telah disusun dalam daftar distribusi frekuensi,
kuartil Ki (i = 1, 2, 3) dihitung dengan rumus :
Ki = b + p ( in
4−F
f ), dengan i = 1,2, 3
Dengan :
b = batas bawah kelas Ki, ialah kelas interval di mana Ki akan
terletak.
p = panjang kelas Ki
F = Jumlah frekuensi sebelum kelas Ki
f = frekuensi kelas Ki
Desil, yaitu nilai yang membagi sekumpulan data menjadi 10
bagian yang sama setelah dta itu diurutkan. Karenanya ada
sembilan buah desil ialah desil pertama, desil kedua,……, desil
kesembilan yang disingkat dengan D1, D2,……….D3.
Desil- desil ini dapat ditentukan dengan jalan.
1. susun data menurut urutan nilainya
2. tentukan letak desil
3. tentukan nilai desil
Letak desil ditentukan oleh rumus :
Letak Di = data ke
i( n+1)10 ,dengan i = 1, 2, 3 ……, 9
Contoh :
Untuk data yang telah disusun dalam contoh terdahulu ialah
52 56 57 60 64 66 70 75 82 86 92 94, maka letak D7 =
data ke
7(12+1)10
=data ke 9,1.
Nilai D7 = data ke-9 + (0,1) (data ke-10 – data ke 9) atau D7 =
82 + (0,1) (86 – 82) = 82,4.
Untuk data dalam daftar distribusi frekuensi, nilai Di (i = 1,2,
….., 9) dihitung dengan rumus :
Di = b + p ( in10
−F
f ), dengan i = 1, 2, 3 …
Dengan :
b = batas bawah kelas Di,
p = panjang kelas Di
F = jumlah frekuensi sebelum kelas Di
f = frekuensi kelas Di.
Jika sekumpulan data yang dibagi menjadi 100 bagian yang
sama akan menghasilkan 99 pembagi yang berturut-turut
dinamakan persentil pertama, persentil kedua,……., persentil
ke 99. Simbol yang digunakan berturut-turut P1, P2 …….., P99.
Karena cara perhitungannya sama seperti perhitungan desil,
maka disini hanya diberikan rumus-rumusnya letak persentil P i
(I = 1,2,3 ….., 99) untuk sekumpulan data ditentukan oleh
rumus : Letak Pi = data ke
i( n+1)100 , dengan i = 1, 2, 3 ……, 99
Untuk nilai Pi untuk data dalam daftar distribusi frekuensi
dihitung dengan :
Pi = b + p ( in100
−F
f ), dengan i = 1, 2, 3 …..,99
Dengan :
b = batas bawah kelas Di, p = panjang kelas Di
F = jumlah frekuensi sebelum kelas Di
f = frekuensi kelas Di.
d. Rata-rata ditimbang
Rata-rata ditimbang adalah rata-rata yang memperhitungkan
frekuensi dari tiap-tiap nilai variabel. Rumus untuk rata-rata ini adalah:
X=∑ f i xi
∑ f i
Contoh :
Jika 5 mahasiswa mendapat nilai 70 : 6 mahasiswa mendapat 69
: 3 mendapat nilai 45 : seorang mahasiswa mendapat nilai 80 :
dan seorang lagi mendapat nilai 56 untuk data tersebut
sebaliknya ditulis sebagai berikut :
X1 f2 F1xX1
70 5 350
69 6 414
45 3 135
80 1 80
56 1 56
Jumlah 16 1035
Pada nilai rata-rata ujian tersebut untuk ke-16 mahasiswa itu
ialah :
X=103516
=64,6
e. Rata-rata gabungan
Rata-rata gabungna, yaitu rata-rata dari beberapa sampel lalu
disajikan satu. Misalnya kalau k buah sampel masing-masing diketahui
Sampel 1 berukuran nk dengan rata-rata x1
Sampel 2 berukuran nk dengan rata-rata x2
Sampel k berukuran nk dengna rata-rata xk, maka rata-rata gabungan dari
k buah sampel itu dihubungkan dengan:
X=∑ ni x1
∑ ni
Contoh :
Tiga sampel masing-masing berkuran 10 : 6 dan 8 sedangkan
rata-rata masing-masing 145 : 118 : 162. Jadi rata-rata
gabungan adalah :
X=(10 ) (145 )+ (6 ) (118 )+(8)(162)
10+6+8=143,9
f. Rata-rata dari distribusi frekuensi
Menghitung rata-rata dari distribusi frekuensi pada hakekatnya
tidak berbeda dengan menghitung rata-rata dari distribusi tunggal. Hanya
saja nilai x disini tidak lagi mewakili nilai variabel individual, melainkan
mewakili titik tengah interval kelas. Jadi x disini adalah mewakili titik dari
interval kelas dalam distribusi. Dalam hal ini cara menghitung rata-rata
daftar distribusi frekuensi adalah dengan cara koding atau cara singkat
dengan rumus sebagai berikut :
X=x0+ p¿¿ dengan :
X : Rata-rata yang sebenarnya / yang dicari
x0 : Rata-rata tekanan (titik tengah)
p : Panjang interval kelas
f ic i : Jumlah deviasi kesalahan akibat tekanan
f i : Jumlah frekuensi
Contoh :
Untuk data nilai ujian 80 mahasiswaa dalam table sebagai
berikut :
Interval kelas
nilai
F1 X1 a F1c1
31 - 40 1 35,5 -4 -4
41 - 50 2 45,5 -3 -6
51 - 60 5 55,5 -2 -10
61 - 70 15 65,5 -1 -15
71 - 80 25 75,5 0 0
81 - 90 20 85,5 1 20
91 - 100 12 95,5 2 24
Jumlah 80 9
Jadi X=75,5+10( 980 )=76,62 (Rata-rata nilai ujian)
g. Rata-rata ukur
Jika perbandingan tiap dua data berurutan tetap atau hampir tetap,
rata-rata umur lebih baik dipakai dari pada rata-rata hitung, apabila
dikehendaki rata-rata. Untuk data bernilai x1, x2, ........., xn maka rata-rata
ukur U didefinisikan sebagai berikut :
U=√x1 x2 x3……… xn
Yaitu akar pangkat n dari produk (x1 x2 x3 ……… xn¿
Contoh : rata-rata ukur untuk data x1 = 2 : x2 = 4 : x3 = 8 adalah
U=3√2.4 .8=4
Untuk bilangan bernilai besar, lebih baik digunakan logaritma
menjadi:
log U ∑ log x1
n
Untuk fenomena yang bersifat tumbuh, seperti pertumbuhan
penduduk, bakteri dan lainnya, sering digunakan rumus yang mempunyai
rata-rata ukur adalah :
Pt=P0( 1+x100 )
t
Dimana
P0 = Keadaan awal
Pt = Keadaan akhir
x = Rata-rata pertumbuhan setiap satuan waktu
t = satuan waktu yang digunakan
Untuk data yang telah disusun dalam daftar distribusi frekuensi
dipakai rumus :
log U=∑ ( f i log x¿¿1)
∑ f i
¿
h. Rata-rata harmonis
Untuk data x1, x2, ........,xn dalam sebuah sampel berukuran n maka
rata-rata harmonis ditentukan oleh :
H= n1/ x i
Contoh : rata-rata harmonis untuk kumpulan data :3, 5, 6, 7, 10,
12 dengan n = 7 adalah :
H= 71/3+…+1/12
=5,87
Untuk data dalam daftar distribusi frekuensi maka rata-rata
harmonis ditulis dengan rumus :
H=∑ f i
∑ ( f i / x i )
i. Modus
Untuk menyatakan fenomena yang paling banyak terjadi atau paling
banyak terjadi. Digunakan modus disingkat Mo. Modus dapat dibatsi
sebagai :
Nilai variabel yang mempunyai frekuensi tertinggi dalam
distribusi (distribusi tunggal)
Titik tengah interval kelas yang mempunyai frekuensi tertinggi
dalam distribusi (distribusi frekuensi).
Modus untuk data kualitatif ditentukan dengan cara menentukan
penyebab dari suatu akibat, sedangkan untuk data kuantitatif adalah
dengan jalan menentukan frekuensi terbanyak diantara data itu. Jadi
modus adalah nilai, bukan frekuensi yang tertinggi .
Contoh : jika dalam distribusi tunggal terdapat sampel dengan nilai-nilai :
12 34 14 34 28 34 34 28 14.
Modus dari data tersebut adalah : Mo = 34
Jika data kuantitatif telah disusun dalam daftar distribusi frekuensi :
modus ditulis dengan rumus :
Mo=b+ p ( b1
b1+b2)
Dimana :
b : batas bawah nyata kelas modus, ialah kelas interval dengan
frekuensi terbanyak
p : Panjang kelas modus
b1 : Frekuensi kelas moduus dikurangi frekuensi kelas interval
sebarannya.
b2 : Frekuensi kelas modus dikurangi frekuensi kelas interval berikutnya.
Contoh:
Interval Kelas (nilai) F1
31 – 40 1
41 – 50 2
51 – 60 5
61 – 70 15
71 – 80 25
81 – 90 20
91 – 100 12
Jumlah 80
Mo=75,5+(10 )( 1010+5 )=77,17
Modus dibanding dengan ukuran lainnya, tidak tunggal adanya. Ini berarti
sekumpulan data biasa mempunyai lebih dari satu modus.
VI. ARTI SEBARAN DATA
1. Pendahuluan
Selain ukuran gejala pusat dan ukuran letak, masih ada lagi
ukuran lain ialah ukuran simpangan atau ukuran dispensi. Ukuran
ini kadang-kadang dinamakan pula ukuran variasi, yang
menggambarkan bagaimana berpencarnya data kuantitatif.
Ukuran sebaran data adalah ukuran yang menunjukkan sebaran
atau penyimpangan tiap observasi data terhadap suatu harga
tengah. Beberapa ukuran dispersi yang terkenal dan akan
diuraikan disini ialah : rentang, rentang antar kuartil, simpangan
kuartil atau deviasi antar kuartil, rata-rata simpangan atau rata-
rata deviasi, simpangan baku atau deviasi standar, varians dan
koefisien variasi.
a. Jangkauan/Rentang (Range)
Jangakauan atau rentang adalah nilai yang diperoleh dengan mengurangkan
nilai maksimum dari data dengan nilai minimun dari data. Range dapat
diartikan juga sebagai selisih nilai tertinggi (maksimum) dan nilai terendah
(minimum).
Range = score max – score min
Misal :
dimiliki data : 1,4,2,5,7,3,8,2 dimana nilai maksimum dan minimum dari data
berturut-turut :8 dan 1.
Maka range atau jangkauan dari data tersebut adalah 8 – 1 = 7
Nilai koefisiemn relatif diberikan sebagai berikut:
Koefisien Relatif Range (KR) = max−minmax+min
Dari data di atas dapat dihitung KR sebagai berikut :
KR = max−minmax+min
= 8−18+1
= 79=0,77.
Karena mudahnya dihitung, rentang ini banyak sekali digunakan dalam cabang
lain statistika, ialah statistika industri.
Rentang antar kuartil juga mudah ditentukan, dan merupakan selisih antar
K3 dan K1. Jadi didapatlah hubungan :
RAK = K3 – K1
Dengan:
RAK = rentang antar kuartil
K3 = kuartil ketiga,
K1 = kuartil pertama.
Simpangan kuartil atau deviasi kuartil atau disebut juga rentang semi antar
kuartil, harganya setengah dari rentang antar kuartil. Jadi, jika simpangan
kuartil disingkat SK, maka :
SK = 12
( K3−K 1)
b. Deviasi Rata-rata
Deviasi rata-rata adalah harga sebaran tiap observasi data terhadap rata-
ratanya. Misalkan data hasil pengamatan berbentuk x1, x2, ......, xn dengan rata-
rata X . Jarak ini, dalam simbol ditulis |X i−X| (baca: harga mutlak dari selisih
X i dengan X ). Dengan |a| berarti sama dengan a jika a positif, sama dengan –
a jika a negatif dan nol jika a = 0. Jadi hargai mutlak, selalu memberikan tanda
positif, karena inilah |X i−X| disebut jarak antara X i dengan X . Jika sekarang
jarak-jarak: |X1−X|, |X2−X|, ................, |Xn−X| dijumlaahkan, lalu dibagi
oleh n, maka dipeeroleh satuan yang disebut rata-rata simpangan atau deviasi
rata-rata. Deviasi rata-rata dapat dirumuskan sebagai berikut :
RS=∑|X1−X|
n
Dengan:
RS berarti = deviasi rata-rata
N = banyaknya data
X = rata-rata
Contoh :
dimiliki data : 340, 525, 450, 210, 275 dan diketahui mean =
360.
X1 ( X i−X ) |X i−X|
210 -150 150
275 -85 85
340 -20 20
450 90 90
525 165 165
0 510
Maka :
RS=∑|X1−X|
n=150
5=102
c. Varians dan simpangan baku
Untuk mengetahui informasi rata-rata menyimpangnya data
dari rataan, orang lebih suka menggunakan informasi varians
atau simpangan baku. Sebenarnya mean simpangan juga
mencerminkan hal dimaksud di atas.
σ 2=1n∑i=1
N
( X1−X )2
Akan tetapi secara statistika nilai mean simpangan tersebut
merupakan nilai bias yang cukup besar terhadap nilai
populasinya, sehingga orang memilih bukan mutlak tetapi
bentuk kuadratnya. Nilai varians populasinya adalah :
s2=1n∑i=1
n
( X1−X )2
Dimana n merupakan jumlah data populasi.
Untuk menjangkau nilai varians populasi tersebut biasanya
diambil sampel sejumlah n data yang representatif yakni x1,
x2, ......, xn. Varians sampel disimbolkan s2, tergeneralisasi, mengiluti
rumusnya di atas diberikan:
Akan tetapi secara statistika dapat dibuktikan bahwa s2 merupakan penaksiran
populasi yang bias. Dengan modifikasi rumus varians sampel yang tak bias
adalah sebagai berikut :
s2= 1n−1
∑i=1
n
( X 1−X )2
Dimana n adalah banyaknya data sampel.
Rumus tersebut dapat disajikan dalam bentuk lain dengan cara menguraikan
bentuk kuadrat dan menyederhanakannya, diperoleh :
Simpangan Baku (S) adalah merupakan akar dari Varians yaitu :
s2=n∑
i=1
n
x12−(∑ x i )
2
n ( n−1 )
S=√s2