Probabilitas Statistik

178
PROBABILITAS STATISTIK Fajar Juniarto 2009420010 UNIVERSITAS MUHAMMADIYAH JAKARTA 2011

Transcript of Probabilitas Statistik

Page 1: Probabilitas Statistik

PROBABILITAS STATISTIK

Fajar Juniarto 2009420010

UNIVERSITAS MUHAMMADIYAH JAKARTA

2011

Page 2: Probabilitas Statistik

PERTEMUAN 1

BERKENALAN DENGAN STATISTIK

Tujuan Belajar Setelah mempelajari bab ini, Anda diharapkan mampu:

- Menjelaskan arti dari data, statistic dan statistika,

- Menjelaskan syarat-syarat data yang baik dan jenis-jenis data,

- Menguraikan peranan statistic dalam kehidupan sehari-hari.

I.1. Arti dan Kegunaan Data Menurut Webster’s New World Dictionary, data berarti sesuatu yang diketahui

atau dianggap. Dengan demikian data dapat memberikan gambaran tentang sesuatu

keadaan atau persoalan. Data tentang sesuatu pada umumnya dikaitkan dengan tempat

dan waktu. Misalnya, harga beras yang bermutu sedang di pasar Senen Jakarta, pada

tanggal 2 Januari 1999 adalah Rp. 450,- per-kg. Penyebutan tempat dan waktu ini

sangat penting, sebab selain data itu (harga beras per-kg) akan berubah-ubah dari

waktu ke waktu, data juga berbeda-beda menurut tempat.

Sesuatu yang dianggap juga merupakan data walaupun data seperti itu belum

tentu benar, sebab masih merupakan sesuatu yang perlu diuji terlebih dahulu. Didalam

praktek banyak sekali anggapan atau asumsi yang dipergunakan sebagai dasar

pembuatan keputusan. Misalnya, karena pemerintah menganggap persediaan beras

cukup (hasil produksi padi meningkat), maka diputuskan untuk tidak mengimpor beras.

Oleh karena suatu anggapan (pendapat atau asumsi) belum tentu benar, maka apabila

dipergunakan sebagai dasar pembuatan keputusan, dan keputusan tersebut bisa saja

salah. Oleh karena itu, anggapan yang masih merupakan hipotesis harus diuji terlebih

dahulu.

Kegunaan data pada dasarnya adalah untuk membuat keputusan oleh para

pembuat keputusan. Data dapat berguna, bila dikaitkan dengan masalah manajemen,

yaitu sebagai :

a. Dasar suatu perencanaan agar perencanaan sesuai dengan kemampuan yang ada

sehingga dapat dicegah perencanaan yang ambisius dan susah dilaksanakan.

Kemampuan yang dimaksud ialah kemampuan personil, kemampuan pembiayaan

(keuangan), serta kemampuan material.

Page 3: Probabilitas Statistik

b. Alat pengendalian terhadap pelaksanaan atau implementasi perencanaan tersebut,

agar bisa diketahui dengan segera kesalahan atau penyimpangan yang terjadi,

sehingga dapat segera dilakukan perbaikan atau koreksi.

c. Dasar evaluasi hasil kerja akhir. Apakah hasil kerja yang telah ditargetkan bisa

dicapai 100%, 90% atau kurang dari itu? Kalau target tidak tercapai, faktor-faktor

apa yang menyebabkannya? Untuk ini semua diperlukan data.

Kebutuhan Terhadap Statistik Bagaimanapun juga, merupakan suatu fakta bahwa anda membutuhkan statistik

untuk membantu anda dalam:

a. Menjabarkan dan memahami suatu hubungan antar variabel

Jumlah data kuantitaif yang dikumpulkan, diolah, dan disajikan kepada umum oleh

para pengambil keputusan dalam suatu organisasi untuk tujuan tertentu, telah

meningkat dengan sangat cepat. Karena itu diperlukan suatu kemampuan untuk

menyaring jumlah yang begitu besar agar kita dapat mengidentifikasi dan

menjabarkan hubungan antar variabel, yang kadang-kadang terselubung, tetapi

seringkali sangat penting dalam pengambilan keputusan.

Contoh: seorang wiraswasta, dengan mengumpulkan data pendapatan dan biaya,

dapat membandingkan hasil pengembalian atau investasi (return on investment)

dalam suatu periode dengan data dari periode-periode sebelumnya.

b. Merupakan alat bantu dalam mengambil keputusan

Seorang administrator dapat menggunakan statistik sebagai alat bantu untuk

menghasilkan keputusan yang lebih baik dalam ketidakpastian.

Contoh: Misalkan, anda adalah seorang manajer pembelian dari suatu pabrik

pengolahan makanan besar yang mengemas ayam goreng beku. Anda bertanggung

jawab atas pembelian 100.000 ekor ayam potong yang sudah dihilangkan bulunya.

Standar yang ditentukan menyebutkan bahwa berat rata-rata ayam dalam suatu

pengiriman harus 1kg (ayam yang melebihi berat tersebut cenderung liat; ayam yang

lebih ringan terlalu kurus). Truk pemasok akan dibongkar asalkan standar berat dan

kualitasnya dipenuhi. Tenaga penjual pemasok meyakinkan anda bahwa barangnya

akan memenuhi standar anda. Apakah anda akan menerima muatan dalam truk

berdasarkan pernyataan tadi? Mungkin sekali tidak, tetapi anda dapat menggunakan

teknik inferensi statistik untuk memlilih sample yang tepat, katakan per 100 ekor dari

populasi sebanyak 100.000 ekor ayam. Kemudian anda dapat menimbang setiap

Page 4: Probabilitas Statistik

sample dan menghitung berat rata-rata 100 ekor ayam tersebut. Dengan informasi

ini, anda dapat mengambil keputusan yang lebih baik mengenai akan diterima atau

tidaknya muatan tersebut.

c. Menangani perubahan

Merencanakan ialah memutuskan sebelum serangkaian tindakan di masa yang akan

datang; oleh karena itu, perencanaan dan keputusan didasari oleh oleh perkiraan

tentang kejadian-kejadian dan/atau hubungan di masa yang akan datang. Jadi, pada

hakekatnya seseorang perlu melakukan proses atau teknik peramalan untuk

memperoleh perkiraan tentang masa depan. Meskipun prosedur statistk jelas tidak

akan memungkinkan kita meramal masa depan dengan tepat tanpa kesalahan,

terdapat bantuan statistik yang bermanfaat seperti ditunjukkan pada contoh berikut,

yang dapat membantu mengukur perubahan saat ini dan meningkatkan proses

peramalan (forecasting).

Contoh: Misalkan seorang manajer penjualan mempunyai data penjualan suatu lini

produksi yang berkembang selama 10 tahun. Jika setelah mempelajari data deret

berkala (time-series) ini, manajer penjualan berkeyakinan bahwa pola masa lalu

yang diidentifikasi akan terus bertahan, ia dapat menyusun ramalan penjualn yang

akan datang dengan menggunakan prosedur statistik untuk memproyeksikan pola

masa lalu ke masa depan. Ia juga dapat mempercepat ramalannya dengan

memperhitungkan variasi musiman, misalnya penjualan yang lebih tinggi selama

bulan Desember dibandingkan dengan Februari.

Metodologi Pemecahan Masalah Secara Statistik Langkah-langkah dasar dalam pemecahan masalah secara statistik adalah :

1. Mengidentifikasi masalah atau peluang

Manajer atau staf riset pertama-tama harus memahami dan mendefnisikan masalah

atau peluang yang dihadapi secara tepat. Informasi kuantitatif yang bermanfaat

dalam hal ini mencakup data yang menggariskan sifat dan luas permasalahan,

misalnya: kurangnya produksi dan pesanan yang belum dipenuhi; fakta tentang

populasi perlu dipelajari dan juga dampak situasi terhadap sumber daya seperti

personalia, material, dana dan waktu.

2. Mengumpulkan fakta yang tersedia

Data yang dikumpulkan harus benar, tepat waktu, selengkap mungkin, dan relevan

terhadap permasalahan yang ditelaah. Sumber data dapat diklasifikasikan ke dalam

Page 5: Probabilitas Statistik

kategori internal dan eksternal. Data bisnis dan ekonomi internal dapat ditemukan di

bagian akuntasi, produksi serta pemasaran, dan juga dibagian lain dalam organisasi.

3. Mengumpulkan data orisinil yang baru

Dalam banyak hal, data yang diperlukan oleh analis tidak tersedia dari sumber-

sumber lain. Sehingga tidak ada alternatif bagi analis kecuali mengumpulkannya

sendiri. Ada bermacam-macam metode untuk memperoleh data yang diinginkan,

dimana yang umum adalah dengan menggunakan wawancara secara pribadi, atau

dengan pengumpulan kuesioner melalui pos.

4. Mengklasifikasikan dan mengikhtisarkan data

Setelah data dikumpulkan, langkah selanjutnya adalah mengorganisasikan atau

mengelompokkan data itu untuk tujuan penelaahan. Identifikasi jenis data dengan

karakteristik serupa dan mengaturnya ke dalam kelompok atau kelas, disebut

klasifikasi. Data produksi dapat diklasifikasikan, misalnya, berdasarkan produk yang

dibuat, lokasi pabrik, atau proses produksi yang digunakan.

5. Menyajikan data

Ikhtisar informasi dalam bentuk table, grafik, dan ukuran kuantitatif yang penting

menyediakan sarana pemahaman masalah, membantu mengidentifikasi hubungan-

hubungan, dan membantu para analis menyajikan serta mengkomunikasikan butir-

butir penting kepada pihak-pihak yang berkepentingan.

6. Menganalisis data

Mereka yang memecahkan masalah harus menginterpretasikan hasil dari langkah-

langkah sebelumnya, menggunakan ukuran deskriptif yang telah dihitung sebagai

dasar untuk menarik kesimpulan secara statistik yang mungkin bernilai, dan

menggunakan alat bantu statistik yang dapat membantu mencari kemungkinan

rangkaian tindakan paling menarik. Pengambil keputusan harus mempertimbangkan

pilihan-pilihan atas dasar sasaran yang telah ditentukan agar menghasilkan satu

rencana atau keputusan yang merupakan jawaban terbaik terhadap

permasalahannya. Sekali lagi, keputusan pilihan tergantung pada keterampilan

analitis (termasuk kemampuan menerapkan teknik kuantitatif yang tepat) dan

kualitas informasi.

I.2. Syarat data yang baik dan pembagian data Dua syarat yang baik untuk pembagian data antara lain:

Page 6: Probabilitas Statistik

1. Obyektif: Data harus sesuai dengan keadaan yang sebenarnya (as it is).

Misalnya: produksi yang turun dilaporkan naik, ini tidak obyektif; harga satu satuan

barang Rp. 500,- dilaporkan Rp. 750,-, walaupun ada kuitansi tetap tidak obyektif.

2. Reprentatif (mewakili): Data harus mewakili obyek-obyek yang diamati.

Misalnya: jika laporan produksi padi dari suatu daerah hanya didasarkan atas hasil

sawah-sawah yang subur saja, ini jelas tidak mewakili; laporan konsumsi susu hanya

dari golongan orang kaya saja juga tidak mewakili.

3. Kesalahan baku (standard error) kecilI: Suatu perkiraan (estimate) dikatakan baik

(mempunyai tingkat ketelitian yang tinggi) apabila kesalahan bakunya kecil.

Ketiga syarat tersebut diatas sering disebut syarat data yang dapat diandalkan

(reliable). Sedangkan kedua syarat berikut lebih menunjukkan manfaat atau

kegunaannya.

1. Tepat waktu

Apabila data akan dipergunakan untuk melakukan pengendalian atau evaluasi,

maka syarat tepat waktu ini penting sekali agar sempat dilakukan penyesuaian atau

koreksi seperlunya kalau ada kesalahan atau penyimpangan yang terjadi di dalam

implementasi suatu perencanaan.

2. Relevan: Data yang dikumpulkan harus ada hubungannya dengan masalah yang

akan dipecahkan.

Misalnya: pemerintah mengetahui faktor-faktor yang menyebabkan kemerosotan

produksi padi selama beberapa tahun terakhir.

Data Menurut Sifatnya, dapat dibedakan menjadi : 1. Data kualitatif: data yang berbentuk angka (nonnumeris).

misalnya: produksi daging sapi meningkat, harga daging ayam mahal dsb.

2. Data kuantitaif: data yang dinyatakan dalam bentuk angka (numeris).

misalnya: produksi padi meningkat 10%, harga daging sapi per kilogram rata-rata

adalah Rp. 15.000,-, sebanyak 99% pupuk telah disalurkan dsb.

Data Menurut Sumbernya, mengacu kepada sumber perolehan data, yaitu eksternal dan internal : 1. Data internal: data yang bersumber dari keadaan atau kegiatan suatu organisasi

atau kelompok.

Page 7: Probabilitas Statistik

Misalnya: data penjualan dan data produksi suatu perusahaan.

2. Data Eksternal: data yang bersumber dari luar suatu organisasi atau kelompok. Misalnya: suatu perusahaaan mencari data mengenai daya beli konsumen kepada

kantor pusat statistic setempat.

Data menurut cara memperolehnya, dapat dibedakan menjadi : 1. Data primer: data yang dikumpulkan dan diolah oleh suatu organisasi atau

perorangan langsung dari obyeknya.

Misalnya: suatu perusahaan ingin mengetahui konsumsi rata-rata penduduk disuatu

daerah dengan cara melakukan wawancara langsung kepada penduduk setempat.

2. Data sekunder: data yang diperoleh dalam bentuk jadi dan telah diolah oleh pihak

lain, yang biasanya dalam bentuk publikasi.

Data Menurut Waktu Pengumpulannya, dapat dibedakan menjadi : 1. Data cross section: data yang yang dikumpulkan dalam suatu periode tertentu,

biasanya menggambarkan keadaan atau kegiatan dalam periode tersebut.

Misalnya: hasil sensus penduduk tahun 1990 menggambarkan keadaan Indonesia

pada tahun 1990 menurut umur, jenis kelamin, agama, tingkat pendidikan dsb.

2. Data Berkala: data yang dikumpulkan dari waktu ke waktu. Tujuannya adalah untuk

menggambarkan perkembangan suatu kegiatan dari waktu ke waktu.

Misalnya: perkembangan produksi padi selama lima tahun terakhir, perkembangan

sembako selama 10 tahun terakhir. Data ini sering disebut sebagai data histories.

I.3. Definisi Statistik Dalam arti sempit, statistik berarti data ringkasan berbentuk angka (kuantitatif).

Statistik penduduk misalnya, adalah data atau keterangan berbentuk angka ringkasan

mengenai penduduk (jumlah, rata-rata umur, distribusinya, persentase yang buta huruf).

Statistik personalia (jumlahnya, rata-rata masa kerja, rata-rata jumlah anggota keluarga,

persentase yang sederhana) dsb.

Dalam arti luas, statistik berarti suatu ilmu yang mempelajari cara pengumpulan,

pengolahan/pengelompokan, penyajian, analisis data, serta cara pengambilan

kesimpulan secara umum berdasarkan hasil penelitian yang tidak menyeluruh.

Pengertian ini merujuk pada istilah statistics yang biasanya diterjemahkan dengan istilah

statistika.

Page 8: Probabilitas Statistik

Peran Komputer dalam Statistik 1. Jumlah masukan (input) yang besar

Semakin besar jumlah data yang harus diolah untuk menghasilkan informasi yang

diperlukan, pengolahan dengan komputer menjadi semakin ekonomis dibandingkan

dengan metode-metode yang lain.

2. Proyek yang negative

Sehubungan dengan biaya yang terlibat dalam menyiapkan tugas untuk pengolahan

komputer, maka seringkali yang paling ekonomis ialah menggunakan komputer

untuk proyek-proyek yang repetitive

3. Diinginkan dan diperlukan kecepatan tinggi dalam pengolahan

Semakin besar kebutuhan akan informasi yang tepat waktu, semakin besar nilai

komputer dibandingkan dengan metode metode-metode yang lainnya.

4. Diinginkan dan diperlukan ketepatan yang lebih besar

Pengolahan komputer akan cukup tepat jika tugas yang harus dilaksanakan telah

disiapkan dengan matang,

5. Mengolah hal-hal yang kompleks yang memerlukan bantuan elektronik

Dalam beberapa situasi yang melibatkan sejumlah besar variable yang berinteraksi,

maka tidak ada alternatif lain selain komputer. Misalnya pengambilan keputusan

dengan alat statistik seperti pemrogaman linier dan simulasi biasanya menggunakan

komputer.

Page 9: Probabilitas Statistik

PERTEMUAN 2 PENGUMPULAN DAN PENGOLAHAN DATA

Tujuan Belajar

Setelah mempelajari bab ini, Anda diharapkan mampu :

- Menggambarkan proses dan metode yang digunakan dalam pengumpulan data

- Menjelaskan proses dan metode yang digunakan dalam pengolahan data

PENGUMPULAN DATA Data statistik yang diharapkan adalah data yang dapat dipercaya dan tepat waktu. Untuk

mencapai tujuan tersebut, maka pengumpulan datanya harus baik dan mencakup seluruh unit yang

menjadi obyek penelitian. Informasi yang dikumpulkan itu harus sesuai dengan keadaan yang

sebenarnya dan dengan metode serta cara yang ditetapkan.

Sebelum pengumpulan data dilakukan, terlebih dahulu harus diketahui untuk apa data itu

dikumpulkan. Apakah data tersebut hanya sekedar untuk mendapatkan gambaran mengenai suatu

keadaan atau untuk memecahkan suatu persoalan. Apapun tujuan pengumpulan data, terlebih

dahulu harus diketahui jenis elemen atau obyek yang akan diselidiki.

Elemen adalah unit terkecil dari obyek penelitian, dapat berupa :

- Orang (pegawai negeri, mahasiswa, pedagang, karyawan, nasabah bank dsb);

- Organisasi/badan usaha (perusahaan, sekolah/universitas, departemen, propinsi,

kabupaten, kecamatan, desa, rumah tangga, pasar dsb);

- Barang (kendaraan, mesin, gedung, senjata dsb).

Tujuan pengumpulan data, selain untuk mengetahui jumlah elemen, juga untuk mengetahui

karakteristik dari elemen-elemen tersebut.

Karakteristik adalah sifat-sifat, ciri-ciri atau hal-hal yang dimiliki oleh elemen, yaitu semua

keterangan mengenai elemen. Misalnya: kalau elemen itu pegawai pemerintah/swasta maka

karakteristik yang perlu diketahui antara lain jenis kelamin, pendidikan, agama, umur, masa kerja,

golongan dan gaji. Sedangkan jika elemen itu perusahaan , maka karakteristiknya antara lain jumlah

karyawan, jumlah kekayaan, hasil produksi dan hasil penjualan,

Variabel atau peubah ialah sesuatu yang nilainya dapat berubah atau berbeda. Nilai

karakteristik suatu elemen merupakan nilai variable, misalnya harga (karakteristik harga suatu barang

akan berubah-ubah menurut waktu atau berbeda-beda menurut tempat). Biasanya untuk

menunjukkan suatu variable dipergunakan huruf latin (X, Y, Z) atau Yunani dsb.

Contoh : Kalau ada 3 perusahaan dengan modal X = modal perusahaan dalam jutaan rupiah dimana

X1 = 5, X2 =7, X3 = 4, berart perusahaan pertama mempunyai modal Rp. 5 juta,

perusahaan kedua Rp. 7 juta, dan perusahaan ketiga Rp. 4 juta.

Populasi adalah kumpulan dari seluruh elemen sejenis tetapi dapat dibedakan satu sama lain.

Perbedaan-perbedaan itu disebabkan karana adanya nilai karakteristik yang berlainan. Misalnya

seluruh karyawan perusahaan merupakan suatu populasi. Disini elemen merupakan orang, yaitu

karyawan perusahaan. Walaupun jenisnya sama, namun karakteristiknya secara keseluruhan akan

Page 10: Probabilitas Statistik

berlainan, misalnya umur, pendidikan, masa kerja, jumlah anak, gaji pokok dsb. Jadi, populasi bisa

merupakan seluruh penduduk Indonesia, seluruh perusahaan industri di Indonesia, seluruh petani di

Jawa Tengah, seluruh kendaraan Departemen Keuangan. Untuk menunjukkan banyaknya elemen

populasi , kita berikan notasi N.

Catatan: Karena pengumpulan data akan menghasilkan nilai observasi sebagai nilai karateristik dari

masing-masing elemen, maka kumpulan seluruh nilai (data) observasi disebut populasi.

Kumpulan seluruh kemungkinan hasil eksperimen juga disebut populasi. Oleh karena itu

populasi dan sample sering ditulis sebagai berikut :

Populasi : X1,X2, ……..,Xi,………XN

Sampel : X1,X2, ,Xi,………Xn

Sampel adalah sebagian dari populasi. Jika n adalah jumlah elemen sample dan N adalah

jumlah elemen populasi, maka n , N. Istilah lain dari sample adalah contoh.

Metode Pengumpulan Data Pada dasarnya terdapat 3 macam metode pengumpulan data dalam riset yaitu :

1. Sensus Sensus adalah cara pengumpulan data dimana seluruh elemen populasi diselidiki. Data yang

diperoleh sebagai hasil pengolahan sensus disebut data yang sebenarnya (true value), atau sering

disebut parameter. Kesimpulan yang ditarik berlaku umum (untuk populasi) dan pasti. Misalnya , hasil

sensus penduduk Indonesia tahun 1980 memberikan data sebenarnya mengenai penduduk

Indonesia (jumlahnya menurut umur, menurut jenis kelamin, menurut lapangan kerja, menurut

agama, pendidikan).

Kebaikan sensus adalah bahwa kita bias memperoleh nilai yang sebenarnya, sedangkan

kelemahannya adalah bahwa sensus itu mahal biayanya, serta makan banyak waktu dan tenaga.,

sehingga jarang dipergunakan dalam riset.

2. Sampling Sampling adalah cara pengumpulan data dimana yang diselidiki adalah elemen sampel dari

suatu populasi. Data yang diperoleh dari hasil sampling merupakan data perkiraan (estimate value),

yang mengandung kesalahan sampling (sampling error). Kesimpulan yang ditarik berlaku umum

(generalisasi) akan tetapi tidak pasti (mengandung unsure ketidakpastian “uncertainty”). Jadi, jika

dari 1.000 perusahaan hanya akan diselidiki 100 saja, maka hasil penyelidikannya merupakan suatu

perkiraan. Misalnya, perkiraan jumlah karyawan, perkiraan jumlah produksi, perkiraan jumlah modal

dsb.

Dibandingkan dengan sensus, pengumpulan data dengan cara sampling membutuhkan biaya

yang jauh lebih sedikit, memerlukan waktu yang lebih cepat, tenaga yang tidak terlalu banyak, dan

dapat menghasilkan cakupan data yang lebih luas serta terperinci. Dalam banyak hal, metode

Page 11: Probabilitas Statistik

pengumpulan data dengan cara sampling lebih disukai dengan pertimbangan keterbatasab biaya dan

waktu.

3. Case Study Case study adalah metode pengumpulan data dengan jalan mengambil beberapa elemen

atau satu elemen saja dan sering tidak jelas populasinya, kemudian masing-masing elemen diselidiki

secara mendalam. Metode ini tidak dapat memperkirakan nilai sesungguhnya, mengingat

populasinya tidak jelas. Kesimpulan yang diambil tidak berlaku umum akan tetapi hanya terbatas

pada kasus yang diteliti.

Misalnya, kita menyelidiki 4 buah pabrik rokok, maka hasil yang kita peroleh dari penyelidikan

4 buah pabrik rokok tersebut tidak bias dipergunakan untuk menyimpulkan keadaan pabrik-pabrik

rokok seluruh Indonesia.

Beberapa Macam Sampling Pada dasarnya ada dua cara pengambilan sampel, yaitu : probability sampling dan

nonprobability sampling.

Probability Sampling ialah suatu sampling yang pemilihan obyek atau elemen dari populasi

yang akan dimasukkan di dalam sampel didasarkan atas nilai probability. Penggunaan probability

sampling ini penting sekali apabila kita akan membuat analisis statistic yang mendalam, misalnya

ingin membuat perkiraan interval (interval estimate) atau pengujian hipotesis atas hasil penelitian

tersebut.

Kalau soalnya hanya ingin membuat perkiraan tunggal (point estimate) misalnya rata-rata,

persentase, maka cukup dengan non-probability sampling. Penelitian harus menggunakan random

sampling yang bersifat obyektif, oleh karena itu harus dilakukan pengujian hipotesis dimana

kesimpulannya tidak pasti berdasarkan konsep probabilitas.

Beberapa contoh Probability Sampling: 1. Simple Random Sampling

2. Stratified Random Sampling

3. Systematic Random Sampling

4. Multi Stage Random Sampling

5. Cluster Random Sampling

Beberapa contoh Non Probability Sampling: 1. Accidental Sampling

2. Quota Sampling

3. Purposive Sampling

4. Judgemental Sampling

5. Convenient Sampling

Page 12: Probabilitas Statistik

Penjelasan :

1. Simple Random Sampling ialah suatu sampel yang terdiri dari n elemen, yang dipilih dari suatu

populasi dengan cara sedemikian rupa, sehingg setiap kombinasi dari n elemen mempunyai

kesempatan yang sama untuk dipilih seperti kombinasi-kombinasi lainnya. Cara pengumpulannya

disebut simple random sampling.

Simple random sample bisa diperoleh dengan cara undian/lotere atau dengan menggunakan

apa yang disebut bilangan random. Cara pengambilan sampel yang demikian akan menjamin

bahwa pemilihan elemen-elemen yang akan diselidiki didasarkan atas obyektivitas, bulan

subyektivitas.

Ada dua cara pemilihan pemilihan sample yaitu :

a. With Replacement : elemen yang terpilih dikembalikan lagi sehingga ada kemingkinan terpilih

lagi.

b. Without Replacement : elemen yang terpilih tidak dikembalikan lagi sehingga tidak akan

terpilih kembali.

2. Stratified Random Sampling

Seringkali sebelum kita mengambil sampel, biasanya populasi yang sangat heterogen / bervariasi

kita bagi-bagi dahulu menjadi beberapa populasi dengan jumlah elemen yang lebih kecil.

Populasi-populasi yang lebih kecil itu deisebut stratum sedangkan proses pembagian tersebut

disebut stratifikasi. Elemen-elemen di dalam setiap stratum harus homogen atau relative

homogen, sehinggarata-rata yang kita ambil dari setiap stratum bias mewakili stratum yang

bersangkutan

3. Systematic Random Sampling

Ialah suatu sampling dimana pengambilan elemen yang pertama sebagai anggota sampel terpilih

secara random, dan pemilihan elemen-elemen selanjutnya ditentukan secara sistematis dengan

menggunakan suatu interval sebesar k, dimana k = N/n

4. Multi Stage Random Sampling

Ialah sampling dimana pemilihan elemen sampel dilakukan secara bertahap (by stages).

Contoh : Penelitian untuk mengetahui rata-rata upah karyawan restoran Padang diseluruh ibu

kota propinsi.

Tahap pertama, memlih sampel kota

Tahap kedua, memilih sampel restoran dari kota terpilih

Tahap ketiga, memilih sampel karyawan dari restoran terpilih

Tahap keempat, lakukan wawancara

5. Cluster Random Sampling

Ialah sampling dimana elemen sampel terdiri dari elemen-elemen yang lebih kecil disebut cluster.

Contoh ; Penelitian untuk mengetahui rata-rata modal yang dibutuhkan oleh pemilik took di

Jakarta. Dalam hal ini “shopping center” dijadikan cluster (Pasar Baru, Blpk M, PIM dsb). Cluster

yang terpilih seluruh elemennya (tokonya) diteliti satu persatu.

Page 13: Probabilitas Statistik

6. Accidental Sampling

Ialah sampling yang cara memilih elemen-elemen untuk menjadi anggota sampel ditentukan

dengan subyektif sekali, artinya sesuka hati saja dan hasilnya kasar sekali sehingga kurang

mewakili.

Contoh : seorang wartawan ingin membuat kabar sensasi, kemudian berdiri di muka salah satu

took di Pasar Baru menanyakan kepada gadis-gadis / teen agers yang lewat dengan pertanyaan :

apakah adik senang rok mini. Dari 100 orang ternyata 80 orang menjawab ya. Kemudian pada

pagi harinya terbaca berita di surat kabar : 80% wanita Indonesia sengan rok mini. Informasi yang

demikian itu kasar sekali / tidak valid.

7. Quota Sampling

Ialah sampling seperti stratified sampling akan tetapi stratum diberi jatah atau quota. Mungkin

pemilihannya juga tidak random / sangat subyektif.

8. Purposive Sampling

Ialah sampling dimana pengmbilan elemen – elemen yang dimasukkan dalam sampel dilakukan

dengan sengaja, dengan catatan bahwa sampel tersebut representative atau mewakili populasi.

Sering juga disebut judgment sampling.

Alat Pengumpulan Data Apabila pengumpulan dsata sudah ditentukan, kemudian ditentukan alat untuk memperoleh

data dari obyek yang akan diteliti, antara lain:

1. Daftar pertanyaan (questioner)

2. Wawancara

3. Observasi atau pengamatan langsung

4. Melalui pos, telepon, atau alat komunikasi lainnya.

Bagian yang sangat penting dalam pengumpulan data adalah merancang kuesioner. Kuesioner

atau daftar isian adalah satu set pertanyaan yang tersusun secara sistematis dan standar sehingga

setiap pertanyaan yang sama dapat diajukan terhadap setiap responden.

Sistematis adalah bahwa item=item pertanyaan disusun menurut logika sesuai dengan maksud dan

tujuan pengumpulan data. Sedangkan yang dimaksud Standar adalah setiap item pertanyaan

mempunyai pengertian, konsep, dan definisi yang sama.

Usaha untuk membuat kuesioner suatu survey yang baik, harus diarahkan pada dua tujuan

utama, yaitu :

- Memperoleh informasi / data yang berhubungan dengan maksud dan tujuan survey

- Mengumpulkan informasi dengan kecermatan dan ketelitian yang dapat dipertanggungjawabkan.

Jenis pertanyaan dalam kuesioner dapat dibedakab menjadi pertanyaan terbuka dan pertanyaan

tertutup. Perbedaan kedua jenis pertanyaan tersebut terletak pada tingkat kebebasan responden

dalam menjawab pertanyaan-pertanyaan kuesioner. Pertanyaan terbuka memungkinkan responden

memberikan jawaban yang dikehendaki dengan kata-kata yang dipilihnya sendiri. Sedangkan

Page 14: Probabilitas Statistik

pertanyaan tertutup membatasi jawaban responden dengan keharusan memilih diantara jawaban-

jawaban yang sudah tercantum dalam kuesioner.

PENGOLAHAN DATA Pengolahan data pada dasarnya merupakan suatu proses untuk memperoleh data / angka

ringkasan berdasarkan kelompok data mentah. Data / angka ringkasan dapat berupa jumlah (total),

proporsi, persentase, rata-rata dsb.

Data statistik pada dasrnya merupakan angka-angka ringkasan dari hasil pengolahan

berdasarkan data mentah, seperti total, rata-rata, persentase, angka indeks, simpangan baku,

koefisien korelasi dan koefisien regresi.

Jadi pada dasarnya tujuan dari pengolahan data adalah mendapatkan data statistic yang

dapat digunakan untuk melihat atau menjawab persoalan secara agregat atau kelompok, bukan satu

persatu atau individu.

Metode Pengolahan Data Untuk menentukan metode pengolahan data yang lebih baik, jawabannya tergantung pada seberapa

besar ukuran datanya. Jika hasil observasi yang dikumpulkan jumlahnya sedikit, maka dapat

dilakukan pengolahan secara manual. Akan tetapi jika jumlah observasi sangat besar, maka

pengolahan data secara elektronik (dengan computer).

Page 15: Probabilitas Statistik

PERTEMUAN 3 PENYAJIAN DATA

Tujuan Belajar

Setelah mempelajari bab ini, anda diharapkan mampu :

- Menggambarkan cara menyajikan data dalam bentuk tabel

- Menjelaskan cara menyajikan data dalam bentuk grafik

- Menyebutkan jenis-jenis table dan grafik yang digunakan dalam menyajikan data

Data statistic tidak hanya cukup dikumpulkan dan diolah, tapi juga perlu disajikan

dalam bentuk yang mudah dibaca dan dimengerti oleh pengambil keputusan.

Penyajian data ini bisa dalam bentuk tabel atau grafik dengan keuntungan bahwa

data tersebut akan lebih mudah ditangkap dan dimengerti daripada disajikan dalam

bentuk kata-kata.

Seorang manajer penjualan bisa menganalisis kecenderungan peningkatan

penjualan dengan melihat grafik penjualan yang menunjukkan kecenderungan

(trend) menaik. Berdasarkan grafik itu, ia dapat memperkirakan berapa jumlah

barang yang akan diproduksi, berapa tingkat permintaan pasar, dan berapa jumlah

barang yang akan terjual, sehingga over production atau under production dapat

dihindari. Dengan kata lain penyajian data dalam bentuk tabel dan grafik akan

membuat proses pengmbilan keputusan lebih tepat, cepat dan akurat.

Selain berupa angka-angka ringkasan (summary figures), penyajian data juga

dapat berbentuk tabel dan grafik. Tabel merupakan kumpulan angka-angka yang

disusun menurut kategori-kategori (misalnya: jumlah pegawai menurut pendidikan

dan masa kerja; jumlah penjualan menurut jenis barang dan daerah penjualan;

jumlah produksi menurut jenis barang dan kantor cabang dsb) sehingga

memudahkan untuk pembuatan analisis data.

Grafik merupakan gambar-gambar yang menunjukkan secara visual data berupa

angka (mungkin dalam bentuk simbol-simbol) yang biasanya berasal dari tabel-tabel

yang telah dibuat. Baik tabel maupun grafik bisa dipergunakan untuk menyajikan

cross section data dan data berkala.

CROSS SECTION DATA Penyajian dengan tabel

Tabel berikut merupakan contoh bentuk data yang disajikan dalam bentuk

tabel.

Page 16: Probabilitas Statistik

Tabel penjualan hiptetis PT. Sinar Sakti menurut jenis barang dan daerah penjualan

pada tahun 1999 (dalam satuan)

Jenis Barang Daerah Penjualan

Total I II III IV

(1) (2) (3) (4) (5) (6)

A 20 30 50 60 160

B 15 25 40 50 130

C 10 20 25 30 85

Total 45 75 115 140 375

Tabel diatas merupakan tabel dua arah (two ways table), yaitu tabel yang

menunjukakan hubungan timbal balik antara dua hal: jenis barang dan daerah

penjualan. Dari tabel tersebut, selain diperoleh jumlah seluruh penjualan (sebesar

375 satuan), juga akan diperoleh gambaran tentang perbandingan hasil penjual

antara daerah yang satu dengan daerah yang lain dan antara jenis barang yang satu

dengan jenis barang lainnya. Hal tersebut akan memudahkan kita untuk melakukan

analisis guna mengetahui jenis barang apa yang paling laku dan di daerah mana,

yang selanjutnya dapat digunakan sebagai dasar penentuan alokasi barang-barang

untuk berbagai daerah. Misalnya berapa jumlah barang A yang harus didrop di

daerah I, II, III dan IV, berapa untuk barang C dsb. Hal tersebut untuk mencegah

atau menghindari pengiriman jenis barang yang terlalu banyak untuk daerah yang

tidak laku atau terlalu sedikit untuk daerah dimana barang tersebut sangat laku. Jadi

tabel semacam itu juga berguna untuk kebijakan logistic.

Penyajian dengan grafik

Data juga bisa disajikan dalam bentuk grafik dengan menggunakan bagan batangan

atau bar chart.

Page 17: Probabilitas Statistik

DATA BERKALA

Penyajian dengan tabel

Tabel perkembangan seluruh hasil penjualan PT. Sinar Sakti menurut jenis barang

dari tahun1993 s/d 1999 (dalam satuan)

Jenis barang Jenis barang Jenis barang

Tahun A B C Jumlah

(1) (2) (3) (4) (5)

1993 90 85 50 225

1994 110 90 55 255

1995 115 105 60 280

1996 130 110 65 305

1997 140 120 75 335

1998 155 125 80 360

1999 160 130 85 375

Dari tabel tersebut diatas, selain bisa dilihat perkembangan jumlah hasil penjualan

pertahun, juga sekaligus hasil penjualan untuk setiap jenis barang.

Penyajian dengan grafik

Gambar tentang perkembangan hasil penjualn akan lebih jelas lagi jika data disajikan

dalam bentuk grafik. Dengan menggunakan grafik, kita dengan cepat dapat melihat

perkembangan hasil penjualan untuk setiap hasil penjualan dari1993-1999, sekaligus

laju perkembangan dari masing-masing jenis barang.

Apabila dilanjutkan dengan analisis yang lebih mendalam, maka bisa diketahui

besarnya laju kenaikan dari masing-masing produk (rate of increase) selama

periode tsb, sehingg untuk masa yang akan dating kita dapat melihat atau

meramalkan jenis produk mana yang akan meningkat dan mana yang selalu

menunjukkan kecenderungan menurun; mungkin jenis barang tersebut tidak laku lagi

dan kalau perlu dibuang untuk diganti dengan yang baru atau cukup diperbaiki

Page 18: Probabilitas Statistik

mutunya saja. Hal ini hanya mungkin dilakukan jika perusahaan melakukan

penelitian dan pengembangan (R&D).

Dari uraian tersebut, sebetulnya sudah bisa ditarik kesimpulan, bahwa penyajian

data dengan tabel bisa memberikan angka-angka yang lebih teliti, tetapi tidak bisa

dengan cepat diambil kesimpulannya. Sedangkan dengan grafik, kesimpulan bisa

dengan cepat diambil tetapi angka-angkanya kurang teliti.

BENTUK TABEL

Ada berbagai bentuk tabel yang dikenal, yaitu tabel satu arah (one way table), tabel

dua arah (two way table), dan tabel tiga arah (three way table).

Tabel satu arah ialah tabel yang memuat keterangan mengenai satu hal atau satu

karakteristik saja, misalnya :

- Data personalia : jumlah personalia menurut : a) pendidikan,b) masa kerja, c)

umur, d) golongan dsb.

- Data peralatan : jumlah kendaraan bermotor menurut : a) merk, b) jenis, c)

umur, d) harga dsb.

Contoh tabel satu arah :

Tabel produksi kayu hutan menurut jenis produksi 1996 – 1997 (000 m3)

Jenis Banyaknya

(1) (2)

Kayu bulat 26.069

Kayu gergajian 3.427

Kayu lapis 10.948

Jumlah 40.444

Sumber : Departemen Kehutanan dalam Statistic Indonesia, 1997, BPS

Tabel dua arah ialah tabel yang menunjukkan hubungan dua hal atau dua

karakteristik, misalnya :

Page 19: Probabilitas Statistik

- Data personalia, menurut masa kerja dan pendidikan, masa kerja dan

golongan, agama dan pendidikan dsb.

- Data peralatan, menurut umur dan merk, umur dan jenis dsb.

Contoh tabel dua arah :

Tabel jumlah Universitas Persada menurut semester dan fakultas tahun 1999 :

Smt Smt Smt Smt Smt Smt Smt

Fakultas I II III IV V VI VII Jumlah

Ekonomi 285 120 113 47 85 - - 650

Pendikan 99 37 33 18 26 - - 213

Ilmu Pasti 75 68 30 10 20 - - 203

Teknik 123 66 54 29 40 - - 312

Hukum 42 29 20 6 19 - - 116

Kedokteran 57 79 70 65 65 64 68 468

Jumlah 681 399 320 175 255 64 68 1962

Tabel tiga arah ialah tabel yang menunjukkan tiga hal atau tiga karakteristik,

misalnya :

- Data personalia, menurut masa kerja, pendidikan, dan golongan ; masa kerja,

umur, serta golongan dsb.

- Data peralatan, menurut umur, merk, dan jenis; merk dan unit kerja dsb

BENTUK GRAFIK

Grafik garis tunggal (single line chart) adalah grafik yang terdiri dari satu garis untuk

menggambarkan perkembangan (trend) dari suatu karakteristik.

Grafik garis berganda (multiple line chart) adalah grafik yang terdiri dari beberapa

garis untuk menggambarkan perkembangan beberapa hal/kejadian sekaligus.

Misalnya, perkembangan export menurut gongan A, B, dan minyak bumi,

perkembangan hasil penjualan menurut jenisnya (barang A,B,C), perkembangan

jumlha korban kecelakaan lalu lintas menurut jenis korban (meninggal, luka berat

dan luka ringan) dsb.

Page 20: Probabilitas Statistik

Grafi garis komponen berganda (Multiple component line chart), serupa dengan

grafik berganda, tetapi garis yang teratas/terakhir menggambarkan jumlah (total) dari

komponen-komponen, sedangkan garis lainnya menggambarkan masing-masing

komponen.

Grafik garis persentase komponen berganda (multiple percentage component line

chart), adalah sama seperti grafik garis berganda, kecuali bahwa masing-masing

nilai komponen dinyatakan dalam persentase, sehingga garis teratas (terakhir)

merupakan garis yang menunjukkan 100%.

Grafik garis berimbang neto (net balanced line). Nilai-nilai selisih dengan garis

timbangan dapat diberi warna yang berbeda untuk menilai selisih yang positif dan

negative.

Grafik batangan tunggal (single bar chart)

Grafik batangan komponen berganda (multi component bar chart)

Grafik batangan berimbang neto (net balanced bar chart)

Grafik lingkaran tunggal (single pie chart), penggambaran ini akan lebih tepat apabila

kita hendak mengetahui perbandingan nilai-nilai karakterisitik yang satu dengan yang

lain, dan dengan keseluruhannya.

Grafik lingkaran berganda (multi pie chart)

Grafik peta (cartogram chart), cartogram adalah grafik berupa peta. Suatu

karakteristik (sifat/hal) yang akan digambarkan, diberi tanda/cirri khusus (berupa

ganbar sederhana) misalnya untuk menggambarkan hasil bumi (kopi) di

daerah/tempat yang menghasilkan hasil bumi (kopi) pada peta diberi tanda gambar

kopi dsb.

Grafik gambar (pictogram chart), adalah grafik yang disajikan dalam bentuk gambar.

Didalam bidang koordinat XY dinyatakan gambar-gambar dengan cirri khusus untuk

suatu karakteristik. Misalnya, untuk menyatakan jumlah penduduk dapat

digambarkan berupa gambar orang (secara sederhana).

Page 21: Probabilitas Statistik

STATISTIK INDUSTRI – MODUL 4 DISTRIBUSI FREKUENSI

Tujuan Belajar Setelah mempelajari bab ini, Anda diharap ,kan mampu :

- menyebutkan arti dan manfaat distribusi frekuensi - menyusun distribusi frekuensi data kualitatif dan kuantitatif - menggambar grafik frekuensi, frekuensi relatif dan frekuensi kumulatif

Untuk dapat memahami data dengan mudah, maka baik data kualitatif maupun kuantitatif harus disajikan dalam bentuk yang ringkas dan jelas. Salah satu cara untuk meringkas data adalah dengan distribusi frekuensi, yaitu pengelompokan data ke dalam beberapa kelompok (kelas) dan kemudian dihitung banyaknya data yang masuk ke dalam tiap kelas. 1. DISTRIBUSI FREKUENSI DATA KUALITATIF

Data pada tabel di bawah ini merupakan data kualitaif 50 orang pembeli komputer dari lima jenis perusahaan komputer. Dari data tersebut kita kesulitan untuk mengetahui dengan cepat jenis komputer mana yang paling banyak diminati. Untuk menjawab pertanyaan tersebut, maka datanya perlu disajikan dalam distribusi frekuensi. Data hipotesis 50 orang pembeli komputer dari beberapa jenis perusahaan komputer IBM Compaq Compaq IBM IBM Compaq Compaq Packard Bell Gateway 2001 Packard Bell Apple Apple IBM Apple Compaq Packard Bell Compaq Compaq IBM Packard Bell Gateway 2000 Apple Apple Packard Bell Compaq IBM Apple Apple Packard Bell Packard Bell Apple Apple Compaq Gateway 2000 Compaq Packard Bell IBM Gateway 2000 Compaq Apple Packard Bell IBM Packard Bell Compaq Packard Bell Gateway 2001 Apple IBM Apple Apple Distribusi Hipotesis Frekuensi Pembelian Komputer

Perusahaan Frekuensi Apple

Compaq Gateway 2000

IBM Packard Bell

13 12 5 9

11 Jumlah 50

Distribusi Frekuensi Relatif dan Persentase Data Kualitatif

Page 22: Probabilitas Statistik

Distribusi frekuensi menunnjukkan jumlah atau banyaknya item dalam setiap kategori.Meskipun demikian, kita sering tertarik untuk mengetahui proporsi atau persentase item dalam setiap kelas. Frekuensi relatif dari suatu kelas adalah proporsi item dalam setiap jumlah kelas terhadap jumlah keseluruhan item dalam data tersebut. Jika sekelompok data memiliki n observasi, maka frekuensi relatif dari setiap kategori atau kelas akan diberikan sebagai berikut : Frekuensi relatif dari suatu kelas = Frekuensi kelas n Sedangkan frekuensi persentase dari suatu kelas adalah frekuensi relatif kelas tersebut dikalikan dengan 100. Distribusi frekuensi relatif adalah ringkasan dalam bentuk tabel dari sekelompok data yang menunjukkan frekuensi relatif bagi setiap kelas. Distribusi frekuensi persentase adalah ringkasan dalam bentuk tabel dari sekelompok data yang menunjukkan frekuensi persentase dari bagi setiap kelas. Dengan menggunakan rumus frekuensi relatif diatas, kita akan mendapatkan data tentang pembelian komputer. Dari tabel diatas dapat kita hitung frekuensi relatif untuk Apple, yaitu 13/50 = 0,26, untuk Compaq ,yaitu 12/50 = 0, 24 dan seterusnya. Sedangkan untuk mendapatkan frekuensi persentase, frekuensi relatif tersebut dikalikan dengan 100. Hasil perhitungan seluruhnya seperti pada tabel dibawah ini. Distribusi Hipotetis Frekuensi Relatif dan Persentase Pembelian Komputer

Perusahaan Frekuensi Relatif Frekuensi Persentase

Apple Compaq Gateway 2001 IBM Packard Bell

0,26 0,24 0,10 0,18 0,22

26 24 10 18 22

Total 1,00 100

2. DISTRIBUSI FREKUENSI DATA KUANTITATIF Definisi tentang distribusi frekuensi adalah sama baik untuk data kualitatif maupun kuantitatif. Meskipin demikian kita harus lebih hati-hati dalam menentukan kelas yang digunakan pada distribusi frekuensi. Ada tiga hal yang perlu diperhatikan dalam menentukan kelas bagi distribusi frekuensi untuk data kuantitatif, yaitu jumlah kelas, lebar kelas dan batas kelas.

Page 23: Probabilitas Statistik

Jumlah Kelas Banyaknya kelas sebaiknya antara 7 dan 15, atau paling banyak 20 (tidak ada aturan umum yang menentukan jumlah kelas). HA Sturges pada tahun 1926 menulis artikel dengan judul : “The Class of a Class Interval” dalam Journal of the American Statistical Association, yang mengemukakan suatu rumus untuk menentukan banyaknya kelas sebagai berikut : k = 1 + 3,322 log n dimana k = banyaknya kelas n = banyaknya nilai observasi Rumus tersebut diberi nama Kriterium Sturges dan merupakan perkiraan tentang banyaknya kelas. Misalnya data dengan n = 100, maka banyaknya kelas k adalah sebagai berikut : k = 1 + 3,322 log 100 = 1 + 3,322 (2) = 1 + 6,644 = 7,644 Jadi banyaknya kelas sebaiknya 7 Interval Kelas Disarankan interval atau lebar kelas adalah sama untuk setiap kelas. Sebenarnya, pemilihan interval kelas dan jumlah kelas atau banyaknya kelas tidak independen. Semakin banyak jumlah kelas berarti semakin kecil interval kelas dan sebaliknya. Pada umumnya, untuk menentukan besarnya kelas (panjang interval) digunakan rumus : Xn – X1 c = ---------- k dimana : c = perkiraan besarnya kelas (class width, class size, class length) k = banyaknya kelas Xn = nilai observasi terbesar X1 = nilai observasi terkecil Ada beberapa hal yang perlu diperhatikan dalam penentuan interval kelas, yaitu : a. Kelas interval tidak perlu harus sama

Page 24: Probabilitas Statistik

Pembuatan kelas interval sangat tergantung pada tujuannya.Misalnya, kita hanya tertarik kepada rincian perusahaan yang mempunyai modal antara 50 – 70 juta dan dibawah 50 serta 70 atau lebih, maka bentuk tabel frekuensinya adalah sebagai berikut :

Batas Kelas Modal f < 50

50 – 59 60 – 69

> 70

5 11 20 64

b. Kalau datanya diskrit, atau hasil pengumpulan data dari variabel diskrit, maka

pembuatan kelas intervalnya seperti terlihat dalam tabel berikut :

Upah Mingguan ( Rp ) Banyaknya Karyawan ( f ) < 1.000

1000 – 1999 2000 - 2999 3000 - 3999 4000 - 4999 5000 - 5999 6000 - 7499 7500 - 9999

10000 – 14999 > 15000

2.918 5.327 6.272 7.275 7.117 6.363 6.940 5.186 3.017

Batas Kelas

Batas kelas bawah menunjukkan kemungkinan nilai data terkecil pada suatu kelas. Sedangkan batas kelas atas menunjukkan kemungkinan nilai data terbesar dalam suatu kelas. Jika diketahui kelas-kelas interval adalah 30 – 39, 40 – 49, 50 – 59, dan seterusnya, maka untuk nilai batas bawahnya (lower limit) adalah 30, 40, 50, dan seterusnya.Sedangkan nilai batas atasnya (upper limit) adalah 39,49,59, dan seterusnya. Perlu diperhatikan bahwa kelas interval 30 – 39, 40 – 49, dan seterusnya secara teoritis mencakup seluruh nilai interval 29,5 – 39,5 ; 39,5 – 49,5, dan seterusnya. Nilai – nilai 29,5 ; 39,5 disebut batas kelas bawah yang sebenarnya (lower class boundary), sedangkan 39,5 ; 49,5, dan seterusnya disebut batas kelas atas yang sebenarnya (upeer class boundary). Jarak batas kelas atas dan batas kelas bawah disebut juga lebar atau panjang kelas.

Page 25: Probabilitas Statistik

Frekuensi Relatif, Frekuensi Kumulatif dan Grafik Seringkali unyuk keperluan analisis selain dibuat tabel frekuensi juga dibuat tabek frekuensi relatif dan kumulatif (untuk analisis tabel), kemudian dibuat grafiknya (untuk analisis grafik). Grafik berupa gambar pada umumnya lebih mudah diambil kesimpulannya secara cepat daripada tabel. Itulah sebabnya data seringkali disajikan dalam bentuk grafik. Pada dasarnya, bentuk tabel frekuensi relatif dan kumulatif adalah seperti terlihat pada tabel berikut :

X f fr fk* fk** X1 X2 .

Xi . .

Xk

f1 f2 . fi . . fk

f1 /n f2 / n

. fi / n

.

. fk / n

f 1 f 1 + f 2

. f 1 + f2 + ..+ fi

.

. f1+f2+..+fi+..+fk

f1+f2+..+fi+..+fk f2+..+fi+..+fk

. fi+..+fk.

.

. fk

Jumlah

k ∑ fi = n

I = 1

∑fi = 1

n

* = ≤ , ** = ≥ Contoh pembuatan tabel frekuensi, frekuensi relatif dan frekuensi kumultaif : Suatu penelitian dilakukan oleh pejabat dari Badan Koordinasi Penanamana Modal (BKPM) terhadap 100 perusahaan. Salah satu karakteristik yang ditanyakan ialah besarnya modal yang dimiliki perusahaan tersebut. Kalau X adalah modal dalam jutaan rupiah, maka nilai X adalah sebagai berikut : 75 86 66 86 50 78 66 79 68 60 80 83 87 79 80 77 81 92 57 52 58 82 73 95 66 60 84 80 79 63 80 80 58 84 96 87 72 65 79 80 86 68 76 41 80 40 63 90 83 94 76 66 74 76 68 82 59 75 35 34 65 63 85 87 79 77 76 74 76 78 75 60 96 74 73 87 52 98 88 64 76 69 60 74 72 76 57 64 67 58 72 80 72 56 73 82 78 45 75 56

Page 26: Probabilitas Statistik

Penyelesaian : Data diatas merupakan data mentah (raw data) yang belum dapat menjawab pertanyaan mengenai misalnya, berapa banyak perusahaan yang mempunyai modal antara Rp. 30 – 39 juta, berapa yang memiliki modal antara Rp. 90 – 90 juta. Kemudian berapa persen perusahaan yang modalnya antara Rp. 90 – 99 juta; kurang dari Rp. 79 juta, berapa rata-rata modal dsb. Untuk menjawab pertanyaan pertama harus dibuat tabel frekuensi; untuk pertanyaan kedua harus dibuat tabel frekuensi relatif; untuk pertanyaan ketiga harus dibuat frekuensi kumulatif, sedangkan untuk pertanyaan terakhir mengenai besarnya rata-rata modal perusahaan harus dilakukan perhitungan

Batas

Kelas Modal (jutaan Rp)

Nilai Tengah/

Mean X

Frekuens

i f

Frekuensi Relatif

fr

Frekuensi Kumulatif

fk*(FL)

fk** (FM)

(1) (2) (3) (4) (5) (6) 30-39 40-49 50-59 60-69 70-79 80-89 90-99

34,5 44,5 54,5 64,5 74,5 84,5 94,5

2 3 11 20 32 25 17

9,02 ( 2%) 0,03 ( 3%) 0,11 (11%) 0,20 (20%) 0,32 (32%) 0,25 (25%) 0,07 ( 7%)

2 ( 2%) 5 ( 5%) 16 (16%) 36 (36%) 68 (68%) 93 (93%) 100 (100%)

100 (100%) 96 ( 96%) 95 ( 95%) 84 ( 84%) 64 ( 64%) 32 ( 32%) 7 ( 7%)

Jumlah 100 1 (100%) FL : Frekuensi data yang lebih kecil dari batas kelas atas yang sebenarnya pada tiap kelas (39,5; 49,5 dan seterusnya) FM : Frekuensi data yang lebih besar dari batas kelas bawah yang sebenarnya pada tiap kelas (29,5; 39,5 dan seterusnya) ISTILAH PENTING Distribusi frekuensi adalah ringkasan dalam bentuk tabel dari suatu kelompok data yang menunjukkan item-item (kategori-kategori) dalam beberapa kelas. Frekuensi relatif adalah proporsi dari jumlah item / kategori dalam setiap kelas terhadap keseluruhan item dalam data tersebut. Frekuensi persentase adalah frekuensi relatif kelas dikalikan 100. Distribusi frekuensi relatif adalah ringkasan dalam bentuk tabel dari sekelompok data yang menunjukkan frekuensi relatif bagi setiap kelas. Distribusi frekuensi persentase adalah ringkasan dalam bentuk tabel dari sekelompok data yang menunjukkan frekuensi persentase bagi setiap kelas. Nilai kelas interval adalah selisih antara dua lower limit ( batas atas kelas)

Page 27: Probabilitas Statistik

STATISTIK INDUSTRI MODUL 5 UKURAN PEMUSATAN

Tujuan Belajar : Setelah mempelajari bab ini, Anda diharapkan :

- mengetahui jenis-jenis ukuran pemusatan - menggunakan rumus-rumus ukuran pemusatan - menghitung beberapa ukuran pemusatan - memahami arti dan manfaat dari beberapa ukuran pemusatan

DEFINISI UKURAN PEMUSATAN Rata-rata (average) adalah nilai yang mewakili himpunan atau sekelompok data (a set of data). Nilai rata-rata umumnya cenderung terletak di tengah suatu kelompok data yang disusun menurut besar kecilnya nilai. Dengan perkataan lain, ia mempunyai kecenderungan memusat, sehingga sering disebut ukuran kecenderungan memusat (measures of central tendency). Beberapa jenis rata-rata yang sering dipergunakan ialah rata-rata hitung (aritmetic mean atau sering disingkat mean saja), rata-rata ukur (geometric mean), dan rata-rata harmonis (harmonic mean). Setiap rata-rata tersebut selain mempunyai keunggulan juga memilki kelemahan, dan ketepatan penggunaannya sangat tergantung pada sifat dari data dan tujuannya (misalnya, untuk melakukan analisis). Dalam modul ini yang dimaksud dengan nilai rata-rata ialah rata-rata hitung, kecuali kalau ada keterangan atau penjelasan lain. Dalam kehidupan sehari-hari rata-rata ini lebih banyak dikenal. Misalnya rata-rata gaji / upah karyawan perusahaan swasta per bulan, rata-rata produksi beras per tahun, rata-rata umur karyawan suatu departemen dsb. Rata-rata hitung, yang untuk selanjutnya kita songkat dengan rata-rata, sering digunakan sebagai dasar perbandingan antara dua kelompok nilai atau lebih. Misalnya ada dua mahasiswa, yaitu Toni dan Joni dari Fakultas Ekonomi suatu perguruan tinggi swasta di Jakarta, yang menempuh ujian lima mata kuliah, yaitu statistik, matematika, teori ekonomi, pemasaran, dan metode riset.. Untuk menentukan mana yang lebih pandai antara Toni dan Joni, dapat dipergunakan nilai rata-rata. Misalkan hasil ujian Toni dan Joni adalah sebagai berikut :

Mata Kuliah Hasil Ujian Toni ( X ) Hasil Ujian Joni ( Y )

Statistik Matematika Teori Ekonomi Pe masaran Metode Riset

8 7 6 8 7

7 6 5 6 6

Jumlah 36 30 Rata-rata 36:5 = 7,2 30:5 = 6 Dari nilai rata-rata tersebut, dapat disimpulkan bahwa Toni lebih pandai dari Joni

Page 28: Probabilitas Statistik

1. Rata-rata Hitung Kalau kita mempunyai nilai variabel X, sebagai hasil pengamatan atau observasi sebanyak N kali, yaitu X1, X2,........, Xb, .......,XN, maka : a. Rata-rata sebenarnya (populasi)

1 N µ = ---- ∑ Xi N i = 1

1 = ---- (X1 + X 2 + .....+ Xi + ......+ XN)

N µ dibaca myu,yaitu rata-rata sebenarnya yang disebut parameter. Rata-rata

hitung ini dihitung berdasarkan populasi. Karena itu, rata-rata sebenarnya sering juga disebut rata-rata populasi.

b. Rata-rata perkiraan (sample)

Kalau rata-rata tersebut dihitung berdasarkan sampel sebanyak n dimana n < N observasi, maka rata-rata yang diperoleh disebut rata-rata perkiraan, atau rata- rata sampel, yang diberi simbol X bar (X dengan garis diatas) yang rumusnya adalah sebagai berikut :

1

n X bar = --- ∑ Xi

n i = 1

= 1 ( X1 + X2 +.......+ Xi +.......+ Xn )

n X dengan garis diatas (dibaca X bar), yaitu simbol rata-rata

X bar merupakan perkiraan µ

Contoh : Berikut disajikan data penjualan suatu perusahaan selama 10 tahun Xi = hasil penjualan dalam jutaan rupiah, i = 10 X1 = 50, X2 = 60, X3 = 40, X4 = 70, X5 = 80, X6 = 90, X7 = 100, X8 = 65, X9 = 75, X10 = 85

(Angka-angka yang digaris bawahi merupakan sampel) a. Hitung rata-rata hasil penjualan sebenarnya b. Ambil sampel sebanyak n = 5. Misalnya sampel yang diambil X2, X4, X5, X8, X10. Hitung rata-rata perkiraan hasil penjualan per tahun

Page 29: Probabilitas Statistik

Penyelesaian : a. Rata-rata sebenarnya = 1/10 (50 + 60 +.......+ 85) = 1/10 (715) = 71,5 Jadi rata-rata hasil penjualan per tahun = Rp. 71,5 juta b. Rata-rata perkiraan = 1/5 ( 60 + 70 + 80 + 65 + 85 ) = 72

Jadi rata-rata perkiraan hasil penjualan per tahun = Rp. 72 juta (sangat mendekati rata-rata sebenarnya)

2. Rata-rata Hitung Data Berkelompok

Apabila data sudah disajikan dalam bentuk tabel frekuensi, dimana X1 terjadi f1 kali, X2 terjadi f2 kali, dan seterusnya fk terjadi fk kali, maka rumus rata-rata dari data yang sudah dibuat tabel frekuensinya adalah sebagai berikut : k ∑ fi Xi

i = 1 X bar = ------------ k ∑ fi i = 1 k k Oleh karena ∑ fi = n, maka X = 1 ∑ fi Xi I = 1 n i = 1 k ∑ Mi fi i = 1 atau X = -------------- , dimana Mi = nilai tengah kelas interval k ke- i (untuk data berkelompok) ∑ fi i = 1 Contoh : Perhatikan tabel berikut. Berdasarkan data tersebut, hitunglah rata-ratanya. x 8 6 4 5 7 9 f 2 3 4 3 2 1

Penyelesaian : ∑ fi Xi 8(2) + 6(3) + 4(4) + 5(3) + 7(2) + 9(1) 88 X bar = --------- = -------------------------------------------------- = --- = 5,87 ∑ fi 2 + 3 + 4 + 3 + 2 + 1 15 Jadi rata-rata dari data diatas adalah 5,87

Page 30: Probabilitas Statistik

3. Rata-rata Hitung Tertimbang Seringkali dalam suatu persoalan, masing-masing nilai mempunyai nilai bobot/timbangan tertentu, misalnya X1 dengan timbangan W1, X2 dengan timbangan W2, dan seterusnya sampai Xn dengan timbangan Wn. Oleh karena itu, ratta-rata yang menggunakan timbangan tersebut disebut rata-rata tertimbang (weighted arithmetic mean) dengan rumus sebagai berikut : ∑ Wi Xi W1X1 + W2X2 + ........+ WiXi + ........+ WkXk X bar = ----------- = ------------------------------------------------------------- ∑ Wi W1 + W2 +,,,,,,,, + Wi + …….+ Wk Perhatikan bahwa dalam rumus diatas, timbangannya berupa frekuensi (Wi=fi) Contoh : Data berikut menunjukkan nilai hasil ujian matematika mahasiswa semester IV sebuah perguruan tinggi. 70 75 45 70 50 60 90 75 45 60 60 90 70 50 45 75 70 60 90 45 90 70 75 60 60 45 50 60 Carilah rata-rata nilai hasil ujian matematika dengan cara : a, data tidak berkelompok b. data dikelompokkan Penyelesaian : ∑ Xi 1 a. X bar = ------- = ----- (70 + 75 + …….. + 60) = 64,46 n 28 b. x 45 50 60 70 75 90 f 5 3 7 5 4 4

X = nilai matematika f = banyak mahasiswa ∑ fiXi 45(5) + 50(3) + 60(7) + 70(5) + 75(4) + 90(4) X bar = ------- = ------------------------------------------------------------ = 64,46 ∑ fi 5 + 3 + 7 + 5 + 4 + 4

4. Beberapa Sifat / Ciri Rata-rata Hitung a.Jumlah deviasi atau selisih dari suatu kelompok nilai terhadap rata- ratanya sama dengan nol, yaitu :

n 1 ∑ ( Xi – X bar) = 0 dimana X bar = --- ∑ Xi atau ∑ Xi = n X i = 1 n

Page 31: Probabilitas Statistik

Bukti : ∑ ( Xi – X bar) = ∑ Xi - ∑ X bar = ∑ Xi - n X bar = ∑ Xi - ∑ Xi = 0 n Ingat : ∑ k = k + k + k + .......+ k = nk I=1 n ∑ X bar = X bar + X Contoh : Diketahui X1 = 5, X2 = 4, X3 = 6, X4 = 7 dan X5 = 3. Hitung rata- ratanya ( X bar) dan tunjukkan bahwa ∑ ( Xi – X bar) = 0 Penyelesaian : 1 1 25 X = ----- ∑ Xi = ------ ( 5 + 4 + 6 + 7 + 3 ) = ------- = 5 n 5 5 ∑ ( Xi – X bar ) = (5 – 5) + (4 – 5) + (6 – 5) + (7 – 5) + (3 – 5) = 0 + (- 1) + 1 + 2 + (-2) = 0 b. Jumlah deviasi kuadrat dari suatu kelompok nilai terhadap nilai k akan minimum ( terkecil) kalau k = X bar. Maksudnya n ∑ ( Xi – k )2 ≥ ∑ ( Xi – X )2

i = 1 i = 1 Contoh :

Diketahui X1 = 5, X2 = 7, X3 = 8. Hitunglah X dan tunjukkan bahwa

∑(Xi - k)2 ≥ ∑ (Xi - X)2 , kalau k merupakan salah satu nilai dari kelompok nilai tersebut. Penyelesaian : 1 1 X = ---- ∑ Xi = ----- ( 5 + 7 + 8 ) = 6,67 n 3 k = 5 -- ∑ ( Xi – 5 )2 = ( 5 – 5 )2 + ( 7 – 5 )2 + ( 8 – 5 )2 = 13 k = 7 -- ∑ ( Xi – 7 )2 = ( 5 – 7 )2 + ( 7 – 7 )2 + ( 8 – 7 )2 = 5 k = 5 -- ∑ ( Xi – 5 )2 = ( 5 – 5 )2 + ( 7 – 5 )2 + ( 8 – 5 )2 = 10 k = X bar = 6,67 -- ∑ ( Xi – X bar)2 = ∑ ( Xi – 6,67 )2

Page 32: Probabilitas Statistik

= (5 – 6,67)2 + (7 – 6,67)2 + (8 – 6,67)2 = 4,67 Jadi ternyata ∑ ( Xi – k )2 ≥ ∑ ( Xi – X bar )2, dimana 13, 5 dan 10 adalah ≥

dari 4,67.

c. Kalau ada kelompok nilai. Kelompok pertama sebanyak f1 nilai dengan rata-rata X1 Kelompok kedua sebanyak f2 nilai dengan rata-rata X2 Kelompok ke-i sebanyak fi nilai dengan rata-rata Xi Kelompok ke-k sebanyak fk nilai dengan rata-rata Xk Oleh karenanya, rata-rata dari seluruh nilai adalah sebagai berikut : ∑ fiXi bar f1X1bar + f2X2bar + ...... + fiXibar + .......+ fkXkbar X = ------------ = ---------------------------------------------------------------------- ∑ fi f1 + f2 + ......+ fi + ......+ fk Contoh : Ada 2 kelompok karyawan. Kelompok pertama terdiri dari 60 orang, dimana masing-masing menerima upah per minggu Rp. 30.000 dan kelompok kedua terdiri dari 20 orang masing-masing menerima upah perminggu Rp. 20.000. a. Hitung rata-rata upah perminggu dari seluruh karyawan b. Apakah hasil perhitungan rata-ratanya akan sama kalau 60 orang tersebut

menerima rata-rata upah per minggu Rp. 30.000 ( Xi = Rp. 30.000 ) dan 20 orang menerima rata-rata upah perminggu Rp. 20.000 ( X2 = Rp. 20.000 )

Penyelesaian : a. X = upah mingguan dalam ribuan rupiah f = banyaknya karyawan yang menerima upah X

X 30 20 F 60 20

f1X1 + f2X2 60(30) + 20(20) 2.200

X bar = ----------------- = -------------------------- = --------- = 27,5 f1 + f2 60 + 20 80

Jadi rata-rata upah mingguan per karyawan = Rp. 27.000.

∑ Xi b. Jika X bar = ------ , maka n X bar = ∑ Xi n

Page 33: Probabilitas Statistik

∑ Xi Kelompok pertama X1 bar = ------ , T1 = ∑ Xi ( kelompok pertama) n1 Karena n1 = f1 , maka T1 = X1 bar.n1 atau X1 barf1 atau f1X1 bar ∑ Xi Kelompok kedua X2 bar = ------ , T2 = ∑ Xi ( kelompok kedua) n2 Karena n2 = f2 , maka T2 = X2 bar.n2 atau X2 barf1 atau f1X2 bar

Jumlah karyawan = f1 + f2 = 60 + 20 atau 80 Jumlah upah seluruh karyawan dibagi dengan banyaknya karyawan T1 + T2 f1X1 bar + f2X2 bar 2.200 X bar = ------------- = ---------------------------- = --------- = 27,5 f1 + f2 60 + 20 80

5. Median

a. Data tidak berkelompok

Kalau ada sekelompok nilai sebanyak n diurutkan mulai dari yang terkecil X1 sampai dengan yang terbesar Xn, maka nilai tengah disebut Median (Med). Untuk n ganjil : Kalau k adalah suatu bilangan konstan dan n ganjil, maka selalu dapat ditulis : n - 1 n = 2k + 1 atau k = ------- 2 Contoh : Ada 7 orang karyawan dengan upah per bulan masing-masing Rp. 20.000, Rp. 80.000, Rp. 75.000, 60.000, Rp. 50.000, Rp. 85.000, dan Rp. 45.000. Tentukan median upah karyawan tersebut. Penyelesaian : Pertama : Urutkan dari yang terkecil sampai dengan yang terbesar X1 = 20.000, X2 = 45.000, X3 = 50.000, X4 = 60.000 X5 = 75.000, X6 = 80.000, X7 = 85.000 Kedua : Tentukan nilai dari k dari 7 = 2k + 1 -- k = 3 Jadi median = Med = Xk + 1 = X4 = Rp. 60.000 Perhatikan bahwa X4 merupakan nilai yang berada di tengah – tengah setelah diurutkan mulai yang terkecil sampai dengan yang terbesar. X1 X2 X3 X4 X5 X6 X7 ---- X4 adalah median

Page 34: Probabilitas Statistik

Untuk n genap : Kalau k adalah suatu bilangan konstan dan n genap, maka selalu dapat ditulis n = 2k atau k = n/2. Misal n = 8, maka k = 4 Median = ½ (Xk + Xk + 1) Contoh ; 8 karyawan mempunyai upah (dalam ribuan rupiah) adalah 20,80,75,60,50,85,45,90. Berapa nilai median? Penyelesaian : X1 = 20, X2 = 45, X3 = 50, X4 = 60 X5 = 75, X6 = 80, X7 = 85, X8 = 90 8 = 2k --- k = 4 Med = ½ ( X4 + X5 ) = ½ ( 60 + 75 ) = 67,5 Jadi median upah karyawan = Rp. 67.500

b.Data Berkelompok Untuk data yang berkelompok, nilai median dicari dengan interpolasi dengan rumus sebagai berikut : n/2 – ( ∑ f i ) 0 Med = L0 + e x ------------------ f m L0 = nilai batas bawah dari kelas yang mengandung atau memuat nilai median n = banyak observasi ∑fi = jumlah frekuensi dari semua kelas dibawah kelas yang mengandung median ( kelas yang mengandung median tidak termasuk ) f m = frekuensi dari kelas yang mengandung median c = besarnya kelas interval, jarak antara kelas yang satu dengan lainnya atau besarnya kelas interval yang mengandung median Secara geometrik median juga merupakan nilai X dari absis ( sumbu horizontal ) sesuai dengan jarak tegak lurus yang membagi suatu histogram ( seluruh kurva ) menjadi dua daerah yang sama luasnya ( 50% sebelah kiri median, 50% sebelah kanan median ). Jadi seluruh observasi seolah-olah dibagi menjadi dua, setengah disebelah kiri median ( yang terdiri dari observasi yang nilainya sama atau lebih kecil dari median ) dan setengahnya lagi disebelah kanan median ( yang terdiri dari observasi yang nilainya sama atau lebih besar dari median ). Contoh : Misalkan X adalah upah bulanan karyawan sebuah perusahaan asing yang dibulatkan menjadi ribuan rupiah. Ada 40 orang karyawan yang sedang diselidiki

Page 35: Probabilitas Statistik

dan salah satu perttanyaan tentang besarnya upah bulanan dalam ribuan rupiah hasilnya adalah sebagai berikut : 146 147 147 148 149 150 150 152 153 154 156 157 158 161 163 164 165 168 173 176 119 125 126 128 132 135 135 135 136 138 138 140 140 142 142 144 144 145 145 146

a. Berapa besarnya nilai median upah karyawan? b. Kalau data dikelompokkan, kelas-kelas disajikan pada tabel dibawah ini.

Dengan menggunakan rumus median untuk data berkelompok, hitunglah nilai median

Upah hipotetis per bulan 40 karyawan

Upah Sistem Tally Frekuensi 118 – 126 127 – 135 136 – 144 145 – 153 154 – 162 163 – 171 172 – 180

/// ///// ///// //// ///// ///// // ///// //// //

3 5 9

12 5 4 2

Jumlah 40 Penyelesaian : a. Data diurutkan dari yang terkecil ( X1) sampai yang terbesar ( X40)

119 125 126 128 132 135 135 135 136 138 138 140 140 142 142 144 144 145 145 (146) 146 147 147 148 149 150 150 152 153 154 156 157 158 161 163 164 165 168 173 176

Menentukan nilai k : 40 = 2 k - k = 40 : 2 = 20 Med = ½ ( Xk + Xk+1) = ½ ( X20 + X20+1) = ½ ( X20 + X21) = ½ ( 146 + 146 ) = 146 b. Perhatikan tabel berikut :

Upah Frekuensi 118 – 126 127 – 135 136 – 144 145 – 153 154 – 162 163 – 171 172 – 180

3 5 9

12 -------- 5 4 2

Kelas mengandung med dengan nilai frekuensi fm = 12

Jumlah 40

Page 36: Probabilitas Statistik

Upah dianggap sebagai bilangan-bilangan yang didistribusikan secara kontinu. Dalam hal ini median merupakan upah yang mempunyai ciri/sifat sedemikian rupa sehingga setengah atau 50% dari observasi (jumlah frekuensi), yaitu 40/2 = 20 observasi, terletak dibawah median dan setengah lainnya diatas median tersebut. Jumlah tiga frekuensi pertama f1 + f2 + f3 = 3 + 5 + 9 = 17 observasi belum sampai 20, atau belum ada setengahnya. Untuk mencapai 20 observasi diperlukan tiga observasi dari kelas keempat yang frekuensinya = f4 = 12. Jadi median terletak dalam kelas keempat. Karena kelas interval yang keempat, yaitu 145 – 153, sama dengan (setelah memperhitungkan bahwa upah merupakan data yang kontinyu) 144,5 – 153,5, maka median akan terletak di posisi 3/12 dalam jarak kelas interval 144,5 – 153,5. L0 = 144,5 (nilai batas kelas bawah,setelah diadakan koreksi kontinuitas) n/2 = 40/2 = 20 (∑fi)0 = f1 + f2 + f3 = 17 fm = 12 c = (153,5 – 144,5 ) = 9 ...> jarak antara nilai batas bawah dan nilai batas atas darikelas interval yang memuat median atau jarak antara suatu kelas dengan kelas berikutnya, baik diukur dengan nilai atas bawah atau batas atas 145-136 = 9 atau 153-144 = 9 (sama) Cara ini disebut interpolasi, sehingga hasilnya tidak tepat seperti kalau dihitung secara langsung. Walaupun demikian, hasilnya akan mendekati nilai sebenarnya. Didalam prpakteknya kita sering tidak tahu data aslinya, tetapi data tersebut sudah disajikan dalam tabel frekuensi, sudah dibuat kelas-kelas, kelompok-kelompok, atau kategori-kategori. Jadi, rumus interpolasi ini sangat penting untuk menghitung median. Dengan menggunakan rumus median untuk data berkelompok, akan dihasilkan sebagai berikut : n/2 – ( ∑ f i ) 0 40/2 – 17 27 Med = L0 + c x ------------------ = 144,5 + 9 x ----------- = 144,5 + ------ f m 12 12 = 146,75

6. Modus

a. Data tidak berkelompok Modus dari suatu kelompok nilai adalah nilai kelompok tersebut yang mempunyai frekuensi tertinggi, atau nilai yang paling banyak terjadi didalam suatu kelompok nilai. Untuk selanjutnya kita sebut Mod.

Page 37: Probabilitas Statistik

X f X1 X2 . .

Xi . .

Xn

f1 f2 . . fi . .

fn

Xi = Modus = Mod kalau fi mempunyai nilai terbesar dibandingkan dengan frekuensi lainnya f1 > f i +1 dan > fi+1 dan f1 > f i – 1, untuk semua i Suatu distribusi mungkin tidak mempunyai Mod atau mungkin mempunyai dua Mod atau lebih. Distribusi disebut Unimodal, kalau mempunyai satu Mod, Bimodal kalau mempunyai dua mod, atau Multimodal kalau mempunyai lebih dari dua mod. Contoh :

Dari data berikut, apakah ada Mod-nya? Kalau ada, tentukan nilainya.

a. 2 2 5 7 9 9 9 10 10 11 12 18 b. 3 5 8 10 12 15 16 c. 2 3 4 4 4 5 5 7 7 7 9 Penyelesaian : a. Langkah pertama susunlah tabel frekuensinya

X F 2 5 7

Mod ------- 9 10 11 12 18

2 1 1 3 2 1 1 1

Jadi Mod = 9, sebab nilai observasi ini yang paling banyak atau mempunyai frekuensi terbesar

Page 38: Probabilitas Statistik

b. Buatlah tabel frekuensi X F 3 5 8

10 12 15 16

1 1 1 1 1 1 1

Karena semua nilai mempunyai frekuensi yang sama, maka distribusi ini tidak mempunyai Mod

c.Buatlah tabel frekuensinya X F 2

3 Mod 1 4 5 Mod 2 7

9

1 1 3 2 3 1

Oleh karena terdapat dua nilai observasi yang mempunyai frekuensi terbanyak, maka distribusi memiliki dua Mod, yaitu 4 dan 7 b. Data berkelompok

Apabila data sudah dikelompokkan dan disajikan dalam tabel frekuensi, maka dalam mencari modusnya harus dipergunakan rumus berikut ini : ( f i ) 0 Mod = L0 + c x ------------------------ ( f i ) 0 +( f 2 ) 0 L0 = nilai batas bawah, kelas yang memuat modus f m0 = frekuensi kelas yang memuat modus ( f 1 ) 0 = f m0 - f( m0 - 1 ) = selisih frekuensi kelas yang memuat modus dengan frekuensi kelas

sebelumnya (bawahnya) ( f 2 ) 0 = f m0 f( m0 + 1 ) = selisih frekuensi kelas yang memuat modus dengan frekuensi kelas sebelumnya (bawahnya) c = besarnya jarak antara nilai batas atas dan nilai batas bawah dari kelas

yang memuat modus Contoh : Dari data yang disajikan dalam tabel frekuensi berikut ini, carilah modusnya

Page 39: Probabilitas Statistik

Kelas F 50,00 – 59,99 60,00 – 69,99 70,00 – 70,99

80,00 – 89,99 90,00 – 99,99

100,00 – 109,00 110,00 – 119,00

8 10

16 ---- kelas yang berisi modus fm0 = 16

14 10 5 2

Jumlah Penyelesaian : L0 = ½ ( 69,99 + 70,00 ) = 69,995

c = 79,995 – 69,995 = 10 f( m0-1) = 10 f( m0+1) = 14 ( f 1 ) 0 = 16 – 10 = 6 ( f 2 ) 0 = 16 – 14 = 2 ( f i ) 0 6 Mod = L0 + c x ------------------------ = 69,995 + 10 x ------ = 77,5 ( f i ) 0 +( f 2 ) 0 6 + 2 Jadi nilai modus = 77,5

7. Perbandingan antara Rata-rata, Median dan Modus Apabila distribusi frekuensi mempunyai kurva yang simetris dengan satu puncak

saja, maka letak rata-rata X bar, Median dan Modus adalah sama, yaitu X bar = Mod = Med

Kalau kurva menceng kekanan, maka nilai rata-rata adalah yang paling besar,

diikuti dengan median, kemudian modus. Kalau kurva menceng kekiri, maka nilai rata-rata paling kecil, diikuti median,

kemudian modus.

8. Rata-rata Ukur Dalam masalah bisnis dan ekonomi seringkali diperlukan data untuk mengetahui

rata-rata persentase tingkat perubahan sepanjang waktu (average percentage rates of change over time), misalnya rata-rata persentase tingkat perubahan hasil penjualan,produksi, harga, dan pendapatan nasional selama 10 tahun yang lalu. Perhatikan data berkala mengenai hasil penjualan suatu perusahaan ( dalam jutaan rupiah ) berikut :

Page 40: Probabilitas Statistik

Tahun 1996 1997 1998 1999 Penjualan 10 8 12 15

Berapa besarnya rata-rata persentase tingkat perubahan per tahun dari data penjualan tersebut ? Pertanyaan ini sebetulnya sama dengan mencari nilai konstan, sebagai persentase tingkat perubahan tahunan yang diperlukan sehingga angka hasil penjualan berubah dari Rp. 10 juta pada tahun 1996 menjadi Rp. 15 juta pada tahun 1999. Nilai ini dapat diperoleh dengan menggunakan rumus rata-rata ukur atau rumus bungan majemuk bersusun (compound interest).Rumus rata-rata ukur adalah sbb : n G = √ X1 . X2........Xn Jadi rata-rata ukur suatu kelompok nilai X1, X2,......,,Xn merupakan akar

pangkat n dari hasil kali masing-masing nilai keompok tersebut. Untuk mencari rata-rata ukur, juga dapat dipergunakan rumus berikut ;

∑ log X1 log G = ------------- n Contoh : Cari rata-rata ukur dari data berikut : X1 = 10, X2 = 8. X3 = 12, X4 = 15 Penyelesaian : 4 4 G = √ (10) (8) (12) (15) = √ 14.400 = 10,95. Atau dapat dihitung dengan : Log G = ¼ (log 10 + log 8 + log 12 + log 15) = ¼ ( 1,0000 + 0,9031 + 1,0792 + 1,1761 ) = 1,0396 G = antilog 1,0396 = 14,5

9. Rata-rata Harmonis Rata-rata harmonis (Rn) dari n angka, X1, X2,....,Xn adalah nilai yang

diperoleh dengan jalan membagi n dengan jumlah kebalikan dari masing- masing X tersebut diatas. Rumusnya adalah sebagai berikut :

n Rn = ------------- n 1 ∑ ---- i = 1 Xi Contoh :

Page 41: Probabilitas Statistik

Seorang pedagang batik di Tegal memperoleh hasil penjualan sebesar Rp. 100.000 per minggu dengan rincian sebagai berikut : Minggu pertama : dapat menjual 10 helai seharga Rp. 10.000 / helai Minggu kedua : dapat menjual 25 helai seharga Rp. 4.000 / helai Minggu ketiga : dapat menjual 20 helai seharga Rp. 5.000 / helai Minggu keempat : dapat menjual 40 helai seharga Rp. 2.500 / helai Berapa harga rata-rata kain tersebut per helai ? Penyelesaian : Untuk menghitung rata-rata harga batik per helai dipergunakan rumus rata- rata

harmonis sebagai berikut : n 4 400.000 Rn = ------------- = -------------------------------------------- = --------- = 4.210,53 n 1 1 1 1 1 95 ∑ ---- ------- + -------- + ------- + --------- i = 1 Xi 10.000 4.000 5.000 2.500 Jadi harga rata-rat batik per helai adalah Rp. 4.210,53 (rata-rata harmonis ini

jarang dipergunakan, dan oleh karena itu kita tidak akan membahasnya lebih lanjut)

10.Kuartil, Desil, dan Persentil

a. Data tak berkelompok Kalau kita berbicara tentang Median, maka nilai ini seolah-olah membagi kelompok data menjadi dua bagian yang sama. Artinya 50% dari kelompok data ini (seluruh nilai observasi) mempunyai nilai sama atau lebih kecil dari median, sedangkan 50% lainnya mempunyai nilai yang sama atau lebih besar dari median tersebut. Ingat bahwa nilai median merupakan salah satu dari nilai observasi / pengamatan. 50% Med 50% ---------------- ----------------- ( X ≤ Med ) , ( X ≥ Med ) Q2,Q3 yang membagi kelompok data tersebut menjadi 4 bagian yang sama, yaitu setiap bagian memuat data yang sama atau jumlah harus dipergunakan rumus berikut : i ( n + 1 ) Qi = nilai yang ke ------------- , i = 1,2,3 4 Contoh : Berikut ini adalah data upah bulanan dari 13 karyawan dalam ribuan rupiah yaitu : 40, 30, 50, 65, 45, 55, 70, 60, 80, 35, 85, 95, 100 (n = 13). Cari nilai Q1, Q2 dan Q3

Page 42: Probabilitas Statistik

Penyelesaian : Pertama -tama data diurutkan dulu : X1 = 30, X2 = 35, X3 = 40, X4 = 45 X5 = 50 ,X6 = 55, X7 = 60, X8 = 65, X9 = 70,X10 = 80, X11 = 85, X12 = 95, X13 = 100 I ( n + 1 ) 1 (13 + 1 ) Q1 = nilai yang ke ------------ = nilai yang ke --------------- 4 4 Q1 = nilai yang ke–3 ½ (nilai ke-3½, berarti rata-rata dari X3 dan X4) Jadi : Q1 = ½ (X3 + X4) = ½ (40 + 45) = 42,5 2 (13 + 1 ) Q2 = nilai yang ke --------------- 4 Q2 = nilai yang ke – 7 (nilai X7) Jadi : Q2 = X7 = 60 3 (13 + 1 ) Q3 = nilai yang ke ------------- 4 Q3 = nilai yang ke–10½ (nilai ke10½ berarti rata-rata dari X10 & X11) Jadi : Q3 = ½ (X10 + X11) = ½ (80 + 85) = 82,5 (nilai kuartil tidak perlu sesuai dengan nilai data yang asl. Untuk kelompok data dimana n ≥ 10, dapat ditentukan 9 nilai yang membagi kelompok data tersebut menjadi 10 bagian yang sama, misalnya D1, D2,......., D3, artinya setiap bagian mempunyai jumlah observasi yang sama, sedemikian rupa sehingga nilai10% observasi sama atau lebih kecil dari D1, nilai 20% observasi sama atau lebih kecil daei D2 dan seterusnya. Nilai tersebut dinamakan desil pertama, kedua dan seterusnya sampai desil kesembilan. Kalau nilai kelompok data tersebut sudah diurutkan dari yang terkecil (=X1) sampai yang terbesar (=Xn), maka rumus desil adalah sebagai berikut :

i(n + 1) Di = nilai yang ke ------------ , 1 = 1, 2, .......,9 10 Contoh :

Page 43: Probabilitas Statistik

Berdasarkan contoh diatas, hitunglah D1, D2 dan D9 1(13 + 1) 4 4 D1 = nilai yang ke ------------ = nilai ke 1 ---- , berarti X1 + --- (X2 – X1) 10 10 101 4 = 30 + ----- (35 – 30) = 31 10 2(13 + 1) 8 8 D2 = nilai yang ke ------------ = nilai ke 2 ---- , berarti X2 + --- (X2 – X1) 10 10 10 8 = 35 + ----- (40 – 35) = 39 10 9(13 + 1) 6 6 D9 = nilai yang ke ------------ = nilai ke 12 ----,berarti X12+ --- (X13–X11) 10 10 10 6 = 95 + ----- (100 – 95) = 98 10

Akhirnya untuk kelompok data, dimana n ≥ 100, dapat ditentukan 99 nilai, P1, P2,.......,P99 yang disebut persentil pertama, kedua, dan ke – 99, yang membagi kelompok data tersebut menjadi 100 bagian; masing-masing mempunyai bagian dengan jumlah observasi yang sama, dan sedemikian rupa, sehingg 1% dari observasi mempunyai nilai yang sama atau lebih kecil dari P1, 2% observasi mempunyai nilai yang sama atau lebih kecil dari P2 dan seterusnya. Apabila data sudah disusun mulai dari yang terkecil (X1) sampai yang terbesar (Xn), maka rumus persentil adalah sebagai berikut : i(n + 1) Pi = nilai yang ke -----------, i = 1,2,......,99 100

b. Data berkelompok

Untuk data berkelompok, yaitu data yang sudah dibuat tabel frekuensinya, maka rumus kuartil, desil, dan persentil adalah sebagai berikut :

in/4 - ( ∑ f i ) 0

Page 44: Probabilitas Statistik

Rumus Kuartil : Qi = L0 + c x -------------------- , i = 1,2,3, f q

dimana : L0 = nilai batas bawah dari kelas yang memuat kuartil ke-i n = banyaknya observasi = jumlah semua frekuensi ( ∑ f i ) 0 = jumlah frekuensi dari semua kelas sebelum kelas yang mengandung kuartil ke-i (kelas yang mengandung kuartil ke-i tidak termasuk)

f q = frekuensi dari kelas yang mengandung kuartil ke-i c = besarnya kelas interval yang mengandung kuartil ke-i atau jarak nilai batas bawah (atas) dari suatu kelas terhadap nilai batas bawah (atas) kelas berikutnya i = 1,2,3, in = i kali n

in/10 - ( ∑ f i ) 0 Rumus Desil : Di = L0 + c x ---------------------- f d

in/100 - ( ∑ f i ) 0 Rumus Persentil : Pi = L0 + c x ----------------------- f p

dimana : L0 = nilai batas bawah dari kelas yang memuat desil ke-I (persentil ke-i) n = banyaknya observasi = jumlah semua frekuensi ( ∑ f i ) 0 = jumlah frekuensi dari semua kelas sebelum kelas yang mengandung desil ke-i (persentil ke-i)

f d = frekuensi dari kelas yang mengandung desil ke-i f p = frekuensi dari kelas yang mengandung persentil ke-i c = besarnya kelas interval yang mengandung desil ke-i (persentil ke-i) Contoh : Berdasarkan data berikut, hitunglah Q1, Q3, D6 dan P50

Nilai Kelas f 72,2 – 72,4 72,5 – 72,7 72,8 – 73,0 73,1 – 73,3

2 5

10 13

Page 45: Probabilitas Statistik

73,4 – 73,6 73,7 – 73,9 74,0 – 74,2 74,3 – 74,5

27 23 16 4

Jumlah ∑ f I = n = 100

Penyelesaian : Untuk menghitung Q1 : f1 + f2 + f3 = 17 belum mencapai 25% (25). Agar mencapai jumlah frekuensi 25, harus ikut dijumlahkan frekuensi kelas yang ke-4, dengan demikian diketahui kelas ke-4 memuat Q1. Dari data ( ∑ f i ) 0 = 17; n = 100; fq = 13.Nilai batas bawah dan batas atas dari kelas yang memuat Q1, masing-masing adalah ½ (73,0 + 73,1) = 73,05 dan ½ (73,3 + 73,4) = 73,35. Jadi c = 73,35 – 73,05 = 0,30 in/4 - ( ∑ f i ) 0 100/4 - 17 Q1 = L0 + c x -------------------- = 73,05 + 0,30 x ------------- = 72,3 f q 13 Untuk menghitung Q3 : f1 + f2 + f3 + f4 + f5 = 2 + 5 + 10 + 13 + 27 = 57, belum mencapai angka 75% (=75), masih kurang (75 – 57) = 18. Kekurangan ini harus ditambah dengan frekuensi kelas ke – 6, sehingga kelas ke – 6 memuat Q3. Dari data ( ∑ f i ) 0 = 57, n = 100 dan f q = 23. Nilai batas bawah dan batas atas dari kelas yang memuat Q3,masing – masing adalah ½ (73,6 + 73,7) = 73,65 dan ½ (73,9 + 74,0) = 73,95; jadi L0 = 73,65; c = 73,95 – 73,65 = 0,30. 3n/4 - ( ∑ f i ) 0 300/4 - 57 Q3 = L0 + c x -------------------- = 73,65 + 0,30 x ------------- = 73,89 f q 23 Untuk menghitung D6 : f1 + f2 + f3 + f4 + f5 = 57 belum mencapai 60% (= 60). Agar mencapai nilai 60, harus ditambah dengan frekuensi dari kelas ke-6, yaitu kelas ke – 6 yang memuat D6 . Dari data ( ∑ f i ) 0 = 57; n = 100; fd = 23. Nilai batas bawah dan batas atas dari kelas yang memuat D6, masing-masing adalah ½ (73,6 + 73,7) = 73,65 dan ½ (73,9 + 74) = 73,95. Jadi c = 73,95 – 73,65 = 0,30 6n/10 - ( ∑ f i ) 0 600/10 - 57 D6 = L0 + c x -------------------- = 73,65 + 0,30 x ------------- = 73,69 f d 23 artinya nilai 60% dari observasi sama atau lebih kecil dari 73,69

Page 46: Probabilitas Statistik

Untuk menghitung P50 : f1 + f2 + f3 + f4 = 2 + 5 + 10 + 13 = 30, belum mencapai angka 50% (=50). Kekurangan ini harus ditutup dengan frekuensi kelas ke – 5. Jadi kelas ke – 5 memuat P50.Dari data ( ∑ f i ) 0 = 30, n = 100 dan f p = 27. Nilai batas bawah dan batas atas dari kelas yang memuat P50,masing – masing adalah ½ (73,3 + 73,4) = 73,35 dan ½ (73,6 + 73,7) = 73,65; jadi L0 = 73,65; c = 73,65 – 73,35 = 0,30. 50n/100 - ( ∑ f i ) 0 5000/100 - 30 P50 = L0 + c x - ------------------------ = 73,35 + 0,30 x ------------------- f p 27 = 73,57, artinya 59% dari observasi mempunyai nilai sama atau lebih kecil dari 73,57

Page 47: Probabilitas Statistik

STATISTIK INDUSTRI MODUL 6 UKURAN VARIASI ATAU DISPERSI

Tujuan Belajar Setelah mempelajari bab ini, Anda diharapkan mampu :

- menjelaskan jenis-jenis ukuran dispersi - menggunakan rumus-rumus ukuran dispersi - menghitung beberapa ukuran dispersi - menjelaskan arti beberapa ukuran dispersi

Dalam kehidupan sehari-hari kita sering mendengar orang menyebutkan data statistik. Misalnya si Toni lulus SMA dengan nilai rata-rata 8, sehingga dapat diterima di universitas negeri. Atau rata-rata upah bulanan karyawan PT. Teguh sebesar Rp. 50.000,-. Setiap kali kita mendengar kata rata-rata, maka secara otomatis kita akan membayangkan sekelompok nilai ”di sekitar” rata-rata tersebut. Ada yang sama dengan rata-rata, ada yang lebih kecil, dan ada yang lebih besar dari rata-rata tersebut. Dengan perkataan lain, ada variasi atau dispersi dari nilai-nilai tersebut, baik terhadap nilai lainnya maupun terhadap rata-ratanya (terhadap rata-rata hitung, median, atau modus). Kita mengenal tiga kelompok nilai, yaitu kelompok nilai homogen (tidak bervariasi), kelompok nilai heterogen (sangat bervariasi), dan kelompok nilai relatif homogen (tidak begitu bervariasi). Perhatikan 3 kelompok data berikut : (1). 50 50 50 50 50 rata-rata hitung = 50 (2). 50 40 30 60 70 rata-rata hitung = 50 (3) 100 40 80 20 10 rata-rata hitung = 50 Walaupun rata-rata hitung dari masing-masing kelompok adalah sama, namun kelompok (1) rata-ratanya dapat mewakili kelompok data dengan baik (sempurna), kelompok (2) cukup baik dan kelompok (3) tidak dapat mewakili dengan baik. Keadaan tingkat variasi ini dapat dilihat dari grafik berikut : Ada beberapa macam ukuran variasi atau dispersi, misalnya nilai jarak (range), rata-rata simpangan (mean deviation), simpangan baku (standard deviation), dan koeffisien variasi (coeffisien of variation). Diantara ukuran variasi tersebut simpangan baku yang sering dipergunakan, khususnya untuk keperluan analisis data. MENGAPA MEMPELAJARI DISPERSI Nilai rata-rata seperti mean atau median hanya menitikberatkan pada pusat data, tapi tidak memberikan informasi tentang sebaran nilai pada data tersebut. Kita tentu tidak akan menyeberangi sebuah danau begitu saja jika kita tahu kedalaman rata-ratanya 2 m. Alasan kedua mempelajari dispersi adalah untuk membandungkan sebaran data dari dua informasi distribusi nilai.Misalnya untuk membandingkan tingkat produktifitas dari dua perusahaan. Meskipun kita mengetahui bahwa produksi rata-rata dari dua perusahaan mobil adalah 20 mobil sehari, namun kita tentu tidak dapat langsung

Page 48: Probabilitas Statistik

mengatakan bahwa tingkat produksi mereka identik. Kita perlu melihat bagaimana sebaran nilai jumlah (jumlah produksi harian) dari kedua perusahaan tersebut. Bisa jadi perusahaan pertama cenderung lebih homogen, dalam arti bahwa jumlah produksi harian tidak jauh dari kisaran rata-rata. Bisa jadi pula perusahaan kedua ternyata cenderung memiliki tingkat distribusi produksi yang lebih heterogen, dalam arti bahwa jumlah produksi harian sangat beragam dan menyebar jauh di sekitar rata-rata. PENGUKURAN DISPERSI 1. Data tidak dikelompokkan a.Nilai Jarak

Diantara ukuran variasi yang paling sederhana dan paling mudah dihitung ialah nilai jarak (range). Kalau suatu kelompok nilai (data) sudah disusun menurut urutan yang terkecil (X1) sampai dengan yang terbesar (Xn), maka untuk menghitung nilai jarak dipergunakan rumus berikut : Nilai jarak = NJ = Xn –X1, atau NJ = nilai maksimum – nilai minimum Contoh : Carilah jarak dari data berikut 50 40 30 60 70 Penyelesaian : X1 = 30, X2 = 40, X3 = 50, X4= 60, X5 = 70 NJ = Xn –X1 = 70 – 30 = 40

b. Rata-rata Simpangan

Apabila dipunyai data X1, X2, ……, Xi,……, Xn, dana rata-rata X bar = 1/n ∑ Xi, maka simpangan terhadap rata-rata hitung diartikan sebagai berikut : (X1 – X bar), (X2 – X bar),......., (Xi – X bar), ……, (Xn– X bar) Rata-rata simpangan (RS) adalah rata-rata hitung dari nilai absolut simpangan yang dirumuskan : RS = 1/n ∑│Xi – X bar│ Untuk simpangan selalu kita ambil nilai mutlaknya. Simpangan terhadap median diartikan sebagai berikut : (X1 – Med), (X2 – Med),......., (Xi – X Med), ……, (Xn– X Med) Jadi, simpangan terhadap median dirumuskan : RS = 1/n ∑│Xi – Med│ Contoh : Cari rata-rata simpangan, baik terhadap rata-rata hitung maupun terhadap median dari contoh diatas

Page 49: Probabilitas Statistik

Penyelesaian : X bar = 1/5 (50 + 40 + 30 + 50 + 70) = 50 Med = 50 RS = 1/5 ∑│Xi – X bar│= 1/5 (│0│+│- 10│+│- 20│+│10│+│20│) = 12 RS = 1/5 ∑│Xi – Med│ = 12

c. Simpangan Baku

Di antara ukuran dispersi atau variasi, simpangan baku adalah yang paling banyak dipergunakan, sebab mempunyai sifat-sifat matematis (mathematical property) yang sangat penting dan berguna sekali untuk pembahasan teori dan analisis. Simpangan baku merupakan salah satu ukuran dispersi yang diperoleh dari akar kuadrat positif varians. Varians adalah rata-rata hitung dan kwadrat simpangan setiap pengamatan terhadap rata-rata hitungnya. Kalau kita mempunyai suatu populasi dengan jumlah elemen sebanyak N dan sampel dengan n elemen, dan selanjutnya nilai suatu karakteristik tertentu kita kumpulkan (umur, hasil penjualan perusahaann, harga barang, produksi barang, nilai ujian), maka kita akan memperoleh sekumpulan nilai observasi sebagai berikut : Populasi : X1,....., X2,......, Xi,......, Xn N µ = 1/N ∑ Xi = rata-rata sebenarnya dari X (rata-rata populasi) i = 1 Sampel : X1,....., X2,......, Xi,......, Xn n X bar = 1/n∑ Xi = rata-rata perkiraan dari X (rata-rata sampel) I = 1 X bar = adalah perkiraan dari Seperti pada rata-rata, dalam varians pun ada yang disebut sebagai varians populasi dan varians sampel. Simpol dari varians populasi adalah (dibaca sigma kuadrat) yang merupakan varians sebenarnya dari X bar. Rumusnya adalah : N α2 = 1/N ∑ (Xi - µ)2 i = 1 dimana (Xi - µ) adalah simpangan (deviasi) dari observasi terhadap rata – rata

sebenarnya. Sedangkan varians sampel (S2) dirumuskan sebagai berikut : 1 N

Page 50: Probabilitas Statistik

S2 = -------- ∑ ( Xi – X bar)2 N i = 1 Atau 1 n S2 = -------- ∑ ( Xi – X bar)2 n I = 1 dimana (Xi – X bar) adalah simpangan (deviasi) dan observasi terhadap rata-rata sampel. Rumus dan simbol dari simpangan baku populasi adalah : N N ∑ ( Xi - µ )2 ( ∑ Xi )2 i = 1 1 i = 1

α = akar dari ----------------- = akar dari ------ { ∑ X2i - ------------}

N N N Dimana α merupakan simpangan baku dari X Pada prakteknya, pengumpulan data yang hanya didasarkan atas sampel tidak menghasilkan varian atau simpangan baku yang sebenarnya, tetapi hanya suatu perkiraan saja dengan rumus sebagai berikut : n n ∑ ( Xi – X bar)2 ∑ ( Xi – X bar)2 i = 1 i = 1 S = akar dari ---------------------- = akar dari ----------------------- n n – 1

Rumus (*) Rumus (**)

Catatan : Simpangan baku perkiraan ( S perkiraan dari α ) / simpangan baku sample. Bisa ditunjukkan secara statistic matematis bahwa kalau pembaginya (penyebutnya) n – 1, E (S2) = α2, artinya S2 “unbiased estimate” dari α2, sehingga dalam prakteknya rumus (**) banyak digunakan. : Rumus (*) dapat ditulis : n

n (∑ Xi ) 2

S = akar dari 1/n x { ∑ X2i - i = 1 } i = 1 n Sedangkan rumus (**) dapat ditulis : n

Page 51: Probabilitas Statistik

n (∑ Xi ) 2

S = akar dari 1/(n – 1) x { ∑ X2i - i = 1 } i = 1 n

2. Data dikelompokkan

a. Nilai Jarak Untuk data berkelompok, nilai jarak (NJ) dapat dihitung dengan dua cara : a. NJ = nilai tengah kelas terakhir – nilai tengah kelas pertama b. NJ = batas atas kelas terakhir – batas bawah kelas pertama Contoh : Hitung nilai jarak dari berat badan 100 mahasiswa

Berat Badan ( kg ) Banyaknya mahasiswa ( f) 60 – 62 63 – 65 66 – 68 69 – 71 72 – 74

5 18 42 27 8

Penyelesaian : Cara i : Nilai tengah kelas terakhir = (72 + 74) : 2 = 73 kg Nilai tengah kelas pertama = (60 + 62) : 2 = 61 kg NJ = nilai tengah kelas terakhir – nilai tengah kelas pertama = 73 – 61 = 12 kg Cara 2 : Batas atas kelas terakhir = (74 + 75) : 2 = 74,5 kg Batas atas kelas pertama = (59 + 60) : 2 = 59,5 kg NJ = batas atas kelas terakhir – batas bawah kelas pertama = 74,5 – 59,5 = 15 kg Catatan : cara 1 cenderung menghilangkan kasus-kasus ekstrim

b. Simpangan baku

Untuk data yang berkelompok dan sudah disajikan dalam tabel frekuensi, rumus simpangan baku populasi adalah sebagai berikut :

n ∑fi (Mi - µ)2

I = 1 α = akar dari --------------- , Mi = nilai tengah dari kelas ke–i =1,2,...,k N Atau :

Page 52: Probabilitas Statistik

k k ∑fi d2i ∑(fi di)2

i = 1 i = 1 α = c x akar dari ---------- - (-----------), untuk kelas interval yang N N sama Dimana : c = besarnya kelas interval fi = frekuensi kelas ke-i

di = deviasi = simpangan dari kelas ke-i terhadap titik asal asumsi

k ( ∑fi Mi2

i = 1 α = akar dari 1/N { ∑fi Mi2 - ----------- }, untuk kelas interval yang

N tidak sama Mi = nilai tengah kelas ke-i

Umtuk data sampel diperooleh simpangan baku sampel dengan rumus :

k k ∑fi d2i ∑(fi di)2

i = 1 i = 1 S = c x akar dari ---------- - (-----------), untuk kelas yang sama n - 1 n - 1 dan

k ( ∑fi Mi2

i = 1 S = akar dari 1/N { ∑fi Mi2 - ----------- }, untuk kelas yang

N tidak sama

Contoh : Hitunglah simpangan baku dari data berikut : 1) Xi = 50 ,X2 = 50 ,X3 = 50 ,X4 = 50 ,X5 = 50 (kelompok karyawan pertama) 2) Xi = 50 ,X2 = 50 ,X3 = 50 ,X4 = 50 ,X5 = 50 (kelompok karyawan kedua) 3) Xi = 50 ,X2 = 50 ,X3 = 50 ,X4 = 50 ,X5 = 50 (kelompok karyawanketiga) X = upah bulanan karyawan suatu perusahaan (dalam jutaan rupiah) Penyelesaian :

N ( ∑ Xi )2

1 i = 1

α = akar dari ----------------- { ∑ X2i - ------------}

N N

Page 53: Probabilitas Statistik

Kelompok 1 Kelompok 2 Kelompok 3

X X2 X X2 X X2

X1 = 50 X2 = 50 X3 = 50 X4 = 50 X5 = 50

2.500 2.500 2.500 2.500 2.500

X1 = 50 X2 = 40 X3 = 30 X4 = 40 X5 = 70

2.500 1.600 900

1600 4900

X1 = 100 X2 = 40 X3 = 80 X4 = 20 X5 = 10

10.000 1. 600 6.400 400 100

∑ X2i = 250 ∑ Xi

2= 12.500

∑ X2i =

250 ∑ X2

i = 13.500

∑ X2i = 250 ∑ X2

i = 18.500

α1 = akar 1/5 {12.500 – (250)2/5} = 0 (Kelompok karyawan pertama upah bulanannya homogen, dengan kata lain tidak bervariasi, nilai simpangannya = α1 = 0 )

α 2 = akar 1/5 {13.500 – (250)2/5} = 14,14 (= Rp 14.140)

α 3 = akar 1/5 {18.500 – (250)2/5} = 34,64 (= Rp. 34.640) Ternyata hasil perhitungan diatas menunjukkan bahwa kelompok data yang heterogen, mempunyai simpangan baku yang besar. α1≤ α1 ≤ α1 ---- > o ≤ 14,14 ≤ 34,34 kelompok data kelompok data heterogen homogen kelompok data relative homogen Contoh : Modal dari 40 populasi perusahaan (dalam jutaan rupiah) adalah sebagai berikut : 138 164 150 132 144 125 149 157 146 158 140 147 136 148 152 144 168 126 138 176 163 119 154 165 146 173 142 147 135 153 140 135 161 145 135 142 150 156 145 128 Kemudian data dikelompokkan dan disajikan dalam bentuk tabel frekuensi sebagai berikut :

Modal (M) Nilai tengah Sistem Tally F 118 – 126 127 – 135 136 - 144

122 131 140

/// /////

///// ////

3 5 9

Page 54: Probabilitas Statistik

145 – 153 154 – 152 163 – 171 172 – 180

149 158 167 176

///// ///// // ///// //// //

12 5 4 2

Jumlah 40 Hitunglah simpangan baku terhadap data yang berkelompok Penyelesaian : Untuk data berkelompok, kalau kita perhatikan jarak antara kelas yang satu dengan kelas berikutnya sama, atau dengan perkataan lain selisih nilai tengah yang satu dengan nilai tengah lainnya sama, yaitu sebesar (131 -132) = (140 – 131) = ...... = 9, jadi c = 9. Kita tentukan titik asumsi = M = 149, yaitu kelas 145 – 153. Dengan demikian kita dapat memperoleh nilai simpangan (deviasi) dari setiap nilai tengah terhadap titik asal asumsi sebagai berikut :

Kelas f d d2 fd fd2 118 – 126 127 – 135 136 - 144 145 – 153 154 – 152 163 – 171 172 – 180

3 5 9

12 5 4 2

-3 -2 -1 0 1 2 3

9 4 1 0 1 4 9

-9 -10 -9 0 5 8 6

27 20 9 0 5

16 18

Jumlah 40 0 0 ∑ fdi = -9 ∑ fdi2 k k ∑fi d2i ∑(fi di)2 i = 1 i = 1

α = c x akar dari ---------- - (-----------) N N = 9 x akar { 95/40 – (-9/40) 2} = 13,72

Contoh : a. Berdasarkan data yang sudah dikelompokkan pada contoh sebelumnya,

hitunglah simpangan baku dengan menggunakan rumus k ( ∑fi Mi2

i = 1 α = akar dari 1/N { ∑fi Mi2 - ----------- }

N b. Dengan menggunakan rumus tersebut diatas, hitunglah simpangan baku

untuk data berikut . X = nilai ujian statistik matematik dari 50 mahasiswa Akademi Ilmu Statistik

Kelas M f 30 – 39 40 – 49 50 – 59 60 – 69

34,5 44,5 54,5 64,5

4 6 8

12

Page 55: Probabilitas Statistik

70 – 79 80 – 89 90 - 100

74,5 84,5 94,5

9 7 4

Karena selisih nilai bawah dan atas dari kelas yang terakhir tidak sama dengan kelas-kelas sebelumnya (100 – 90 = 10, padahal untuk kelas lainnya = 9), maka kelompok data ini dikatakan mempunyai kelas interval yang tidak sama. Penyelesaian : Untuk menghitung simpangan baku, diperlukan lembaran kerja sebagai berikut: a.

M M2 f fM fM2 122 131 140 149 158 167 176

14.484 17.161 19.600 22.201 24.964 27.889 30.976

3 5 9 12 5 4 2

366 655 1260 1788 790 668 352

44.652 85.805 176.400 266.412 124.820 111.556 61.952

Jumlah ∑ fi = 40 ∑ fiM = 5.879 ∑ fiM2 = 871.507

α = akar 1/40 {871.597 – (5.879)2 /40} = 13,72 b.

M M2 f fM fM2 34,5 44,5 54,5 64,5 74,5 84,5 94,5

1.190,25 1.980,25 1.970,25 4.160,25 5.550,25 7.140,25 8.930,25

4 6 8 12 9 7 4

138,0 267,0 436,0 774,0 670,0 591,0 378,0

4.761,00 11.881,50 23,762,00 49.923,00 49.952,25 49.981,75 35.721,00

Jumlah ∑ fi = 50 ∑ fiM = 3.255 ∑ fiM2 =

225.982,50 α = akar 1/50 {225.982,50 – (3.255)2 /50} = 16,78

NILAI ATAU DATA YANG DIBAKUKAN (STANDARDIZED VALUE) Variabel X mempunyai rata-rata µ dengan simpangan baku α. Jadi, Xi / α merupakan nilai baku dari Xi, dan Zi = Xi - µ / α merupakan nilai simpangan atau deviasi yang baku (standardized).

Page 56: Probabilitas Statistik

Contoh : Dari data X1 = 2, X2 = 8, X3 = 10, X4 = 4, X5 = 1 (N = 5)

a. Hitunglah µ, α, dan Xi / α b. Kalau Zi = Xi - µ / α , hitunglah Zi, i = 1,2,.....,5 c. Hitunglah µzdan αz

Penyelesaian : a. µ = 1/N ∑ X = 1/N (X1 + X2+......+ X1) = 1/5 (2 + 8 + ....+ 1) = 25/5 = 5

α = akar 1/N ∑( Xi - µ )2 = akar 1/5 (2 – 5)2 +(2 – 5)2 +.......+ (1 – 5)2 = 3,46 = 3,5

X1 / α = 2 / 3,5 = 0,57; X2 / α = 8 / 3,5 = 2,29 ; X3 / α = 10/ 3,5 = 2,86 X4 / α = 4 / 3,5 = 1,14; X5 / α = 1 / 3,5 = 0,29

b. Z1 = (2 – 5) / 3,5 = - 0,86; Z2 = (8 – 5) / 3,5 = 0,86; Z3 = (10 – 5) / 3,5 = 1,43; Z4 = (4 – 5) / 3,5 = - 0,29; Z5 = (1 – 5) / 3,5 = - 1,14

c. µz = 1/N ∑ Zi = 1/5 (Z1 + Z1 + Z1 + Z1 + Z1 ) = 1/5 (0) = 0 Rata-rata simpangan yang dibakukan = 0, sehingga :

( ∑Zi

2 )

α 2 = akar 1/N { ∑Zi2 - ------------ } N = akar 1/5 { (- 0,86)2 +(- 0,86) (- 0,86)2 + ............+ (-1,14)2 – (0) 2/5} = 0,9907 = 1 Secara teoritis dapat ditunjukkan bahwa µz = 0 dan αz = 1. Variabel X dengan µx dan αx : µx = 1/N ∑ Xi αx = akar 1/N ∑ (Xi - µx)2

Zi = Xi - µx / αx µz = 1/N ∑ Zi = 1/N ∑ (Xi - µx / α) = 1/N αx ∑ (Xi - µx)

Page 57: Probabilitas Statistik

= ∑ Xi - N µx) / N αx = 0 / N αx = 0

αx = akar 1/N ∑ (Xi - µz)2 = 1/N ∑ Zi2 = akar 1/N (∑ (Xi - µz / αx) 2 = akar (1/ αx) (1/N) (∑ (Xi - µz ) 2 = akar αx2 / αx2 = 1

Dengan menggunakan data dari contoh tersebut diatas, perhatikan bahwa antara simpangan baku, nilai X, dan µx berikut : X1 = 2, X2 = 8, X3 = 10, X4 = 4, X5 = 1, µx = 5, αx = 3,5

0 1 2 3 4 5 6 7 8 9 10 ·

X5 X1 X4 µx X2 X3 Makin kecil simpangan bakunya, makin dekat nilai- nilai X pada µx. Sebaliknya makin besar simpangan baku, makin menjauh nilai-nilai X tersebut dari µx. KOEFFISIEN VARIASI Simpangan baku mempunyai satuan yang sama dengan satuan data aslinya. Hal ini merupakan suatu kelemahan kalau kita ingin membandingkan dua kelompok data, misalnya modal dari 10 perusahaan besar di Amerika dengan yang ada di Indonesia, harga 10 mobil (jutaan rupiah) dengan harga 10 ekor ayam (ribuan rupiah), dan berat 10 ekor gajah dengan berat 10 ekor semut. Walaupun nilai simpangan baku untuk berat gajah atau harga mobil lebih besar, naun belum tentu lebih heterogen atau lebih bervariasi daripada berat semut dan harga ayam. Untuk keperluan perbandingan dua kelompok nilai dipergunakan Koeffisen Variasi (KV), yang bebas dari satuan data asli, dengan rumus sebagai berikut : KV = ( α / µ ) x 100 % , untuk populasi kv = ( S / X ) x 100 % , untuk sampel Jika ada dua kelompok data dengan KV1 dan KV2, dimana KV1> KV2, maka kelompok pertama lebih bervariasi atau lebih heterogen daripada kelompok kedua. Contoh : Harga 5 mobil bekas masing-masing adalah Rp. 4.000.000, Rp. 4.500.000, Rp. 5.000.000, Rp. 4.750.000, dan Rp. 4.250.000, dan harga 5 ayam masing – masing Rp. 600, Rp. 800, Rp. 900, Rp. 550, dan Rp. 1.000. Hitunglah simpangan baku harga mobil

Page 58: Probabilitas Statistik

αm atau harga ayam αa . Mana yang yang lebih bervariasi (heterogen), harga mobil atau harga ayam ? Penyelesaian : µm = 1/5 (4.000.000 + 4.500.000 + ...................+ 4.250.000) = Rp. 4.500.000 αm = akar 1/N ∑ (Xi - µm)2 = Rp. 353.550 µa = 1/5 (600 + 800 + ...................+ 1.000) = Rp. 770 αa = akar 1/N ∑ (Xi - µa)2 Rp. 172,05 KVm = ( αm / µm ) x 100% = (352.550/ 4.500.000= 7,865% KVa = ( αa / µa ) x 100% = (172,05 / 770) x 100% = 22.34 % UKURAN KEMENCENGAN KURVA Apabila kita mempunyai sekelompok data sebanyak n : X1, X2,........., Xn, maka yang disebut momen ke – r (Mr), adalah sebagai berikut :

n Mr = 1/n ∑ Xr

i .......... (untuk data tak berkelompok) i =1 Untuk data yang sudah dikelompokkan menjadi k kelas, Mi merupakan nilai tengah kelas ke –i, maka perumusan momen ke – r (Mr) adalah sebagai berikut : n Mr = 1/n ∑ fi M

ri .......... (untuk data berkelompok)

i =1 Untuk r = 1, maka M1 (momen pertama) merupakan rata-rata hitung. Momen tersebut merupakan momen terhadap titik asal, sedangkan momen terhadap rata-rata hitung adalah sebagai berikut : n Mr = 1/n ∑ ( Xi – X bar )r .......... (untuk data tak berkelompok) i =1 n Mr = 1/n ∑ fi ( Mi – X bar ) r .......... (untuk data berkelompok)

Page 59: Probabilitas Statistik

i =1 Untuk r = 2, maka M2 merupakan varians (= kuadrat dari simpangan baku = S r). Momen ketiga dan keempat, yaitu M3 dan M4 masing - masing berguna untuk mengukur kemencengan (skewness) dan keruncingan (kurtosis) dari suatu distribusi frekuensi. UKURAN KEMENCENGAN KURVA (Skewness) Kurva yang tidak simetris dapat menceng ke kiri atau ke kanan. Didalam kurva yamh simetris, letak modus, median da rata-rata (X bar) sama. Ukuran tingkat kemencengan (TK) menurut Pearson adalah sebagai berikut : X bar - Mod TK = ---------------- S Dimana : X bar = rata-rata hitung Mod = modus S = simpangan baku Atau : 3 ( X bar – Med ) TK = ---------------------- S Secara emoiris dapat ditunjukkan bahwa X bar – Mod = 3 ( X bar – Med ). Ukuran tingkat kemencengan dapat juga dihitung berdasarkan momen ketiga dengan rumus sebagai berikut : M3 1 n α3 = ----= ------ ∑ ( Xi – X bar )3 .......... (untuk data tak berkelompok)

S3 n S3 i = 1 Atau : M3 1 n α3 = ----- = ------ ∑ fi ( Mi – X bar )3 ........(untuk data berkelompok,

S3 n S3 i = 1 ada k kelas)

Disini α3 sering disebut momen koeffisien kemencengan (moment coefficient of skewness). Apabila kelas intervalnya sama, maka untuk menghitung α3 dapat dipergunakan rumus berikut :

Page 60: Probabilitas Statistik

c3 1 n 1 1 1 α3 = ----- { ----- ∑ fi d

3i – 3 ( --- ∑ fi d

2i.) (---

∑ fi di.) + 2 (--- ∑ fi di.)3

S3 n i = 1 n i = 1 n i = 1 n i = 1 Dimana : α3 = ukuran tingkat kemencengan S = simpangan baku c = besarnya kelas interval fi = frekuensi kelas ke-i di = simpangan kelas ke-i k = banyaknya kelas Contoh : Berdasarkan data berkelompok berikut, hitunglah TK dan α3

Kelas M F fM d fd fd2 fd3 fd4* 118 – 126 127 – 135 136 – 144 145 – 153 154 – 162 163 – 171 172 - 180

122 131 140 149 158 167 176

3 5 9 12 5 4 2

366 655 1.260 1.788 700 668 352

-3 -2 -1 0 1 2 3

-9 -10 - 9 0 5 8 6

27 20 9 0 5 16 18

-81 -40 -9 0 5 32 54

243 80 9 0 5

64 162

Jumlah ∑ fi=40 ∑ fi Mi =

5,879

∑ fi di = 0

∑ fi d2i

= 95 ∑ fi d

3i

= - 39 fd4i = 563

* Untuk menghitung α4 X bar = ∑ fi Mi / ∑ fi = 5.879 / 40 = 146,975 n/2 – (∑ fi)0 Med = L0 + c { -----------------} fm Dari data f1 + f2 + f3 = 3 + 5 + 7 = 17, belum mencapai 50% observasi ( = 20). Untuk mencapai angka 20, harus ditambah dengan frekuensi kelas keempat. Jadi kelas keempat memuat median fm = 12, (∑ fi)0 = 17. Nilai batas bawah dan atas dari kelas yang menuat median masing-masing adalah : ½ (144 + 145) = 144,5 dan ½ (153 + 154) = 153,5 c = 153,5 – 144,5 = 9 ; L0 = 144,5 Med = 144,5 + 9 {(20 – 170)/12} = 146,75

Page 61: Probabilitas Statistik

S = akar c { ∑ fi di 2 / n - (∑ fi di / n) 2

= akar 9 { 95/40 - ( - 9/40 ) 2 } = 13,72 TK = 3 (X bar – Med) / S = 3 ( 146,975 – 146,75 ) / 13,72 = 0,049 α3 = 93/ (13,72)3 { - 39/40 – 3 (95/40)(-9/40) + 2 ( -9 /40) 3} = 0,282 (0,605) = 0,17 Makin besar α3, kurva suatu distribusi makin menceng atau miring. Ukuran kemencengan lainnya dengan menggunakan kuartil dan persentil adalah sebagai berikut : (Q3 – Q2 ) - (Q2 – Q1 ) (Q3 – Q2 ) (Q3 – 2Q2 + Q1 ) QCS = ------------------------------- = ----------------------------------------- Q3 – Q1 Q3 – Q1 (P90 – P50 ) - (P50 – P10 ) P90 – 2 P50 + P10 10 – 90 PCS = ------------------------------------ = ------------------------- P90 – P10 P90 – P10 QCS = Quartile Coefficient of Skewness (kuartil koeffisien kemencengan) 10 – 90 PCS = 10 – 90 Percentile Coefficient of Skewness (persentil koeffisient kemencengan) UKURAN KERUNCINGAN KURVA (Kurtosis) Dilihat dari tingkat keruncingan kurva distribusi frekuensi dibagi menjadi 3, yaitu leptokurtis (puncaknya sangat runcing), platykurtis (puncak agak datar/merata), dan mesokurtis (puncaknya tidak begitu runcing). Untuk menghitung tingkat keruncingan suatu kurva distribusi dipergunakan α4, yaitu moment of kurtosis yang rumusnya sebagai berikut : M4 n α4 = ---- = {1/n∑ ( Xi – X bar )4} / S4 .... (untuk data tak berkelompok)

S4 i = 1

Atau : M4 n α4 = ----- = { 1/n ∑ fi ( Mi – X bar )4}/ S4 .....(untuk data berkelompok)

S4 i = 1 Kalau kelas intervalnya sama, maka rumus tersebut diatas akan menjadi :

Page 62: Probabilitas Statistik

C4 1 n 1 k 1 k α4 = ----- { ----- ∑ fi di4 – 4 (--- ∑ fi di3.) (--- ∑ fi di.) +

S4 n i = 1 n i = 1 n i = 1 1 k 1 k 1 k

6 (--- ∑ fi di2.) (--- ∑ fi di.)2 – 3 (-- ∑ fi di.)4 } n i = 1 n i = 1 n i = 1 n i = 1 Keterangan simbol-simbol sama seperti pada rumus untuk α3 Contoh : Berdasarkan data pada contoh sebelumnya, hitunglah tingkat keruncingan kurva dengan menggunakan rumus tersebut diatas (lihat juga contoh sebelumnya) α4 = 94/ 13,724{ 1/40 (563) – 4 (-39/40) (-9/40) + 6 (95/40) (-9)/40)2 – 3(-9/40)4} = 2,57 Kalau α4 > 3 dihasilkan kurva leptokurtis (meruncing) α4 = 3 dihasilkan kurva mesokurtis (normal) α4 < 3 dihasilkan kurva platykurtis (mendatar) Rumus lainnya disebut Quartile Coeffisien of kurtosis (QCK), yaitu sebagai berikut : QCK = ½ (Q3 – Q1) / P90 – P10 Suatu distribusi yang mempunyai nilai QCK = 0,263 dapat didekati dengan fungsi normal.

Page 63: Probabilitas Statistik

STATISTIK INDUSTRI MODUL 7 ANALISIS KORELASI DAN REGRESI LINIER SEDERHANA

Tujuan Belajar Sesudah mempelajari bab ini, Anda diharapkan mampu :

Menjelaskan pentingnya analisis hubungan Menghitung koeffisien korelasi dan regresi sederhana Menjelaskan arti koeffisien korelasi dan koeffisien regresi sederhana Memahami dan menerapkan regresi dan korelasi Menggunakan teknik ramalan dan melakukan analisis regresi

PENTINGNYA ANALISIS HUBUNGAN Di dunia ini kita tidak dapat hidup sendiri, tetapi memerlukan hubungan dengan orang lain (dengan tetangga, kawan kantor, kawan sekolah, petugas bank, petugas pajak dan sebagainya). Hubungan ini pada umumnya dilakukan dengan maksud tertentu seperti mendapatkan keringanan pajak, memperoleh kredit, meminjam uang, serta minta pertolingan / bantuan lainnya. Seperti kita ketahui, pada semua kejadian ekonomi maupun lainnya, pasti ada factor yang menyebabkan terjadinya kejadian – kejadian tersebut. Misalnya merosotnya hasil penjualan tekstil mungkin disebabkan karena kalah bersaing dengan tekstil impor, merosotnya produksi padi mungkin disebabkan karena pupuknya berkurang, merosotnya hasil penjualan mungkin karena menurunnya biaya advertensi, dan sebagainya. Uraian diatas menunjukkan adanya hubungan (korelasi) antara kejadian yang satu dengan kejadian lainnya. Kejadian itu dapat dinyatakan dengan perubahan nilai variable. Misalnya, kalau X = variable harga, maka naik turunya harga dapat dinyatakan dengan perubahan nilai X. Apabila Y = variable hasil penjualan, maka naik turunnya hasil penjualan dapat dinyataka dengan perubahan nilai Y. Jadi hubungan antara dua kejadian dapat dinyatakan dengan hubunga dua variable. Hubungan antara X dan Y disebut hubungan linier.

Page 64: Probabilitas Statistik

Apa perlunya mengetahui hubungan antar variable? Di dalam [erencanaan, selain data masa lampau dan masa sekarang, juga diperlukan data hasil ramalan yang menggambarkan kemampuan dimasa yang akan dating. Misalnya, untuk perencanaan impor, pemerintah memerlukan ramalan produksi padi, sedangkan perusahaan dalam merencanakan produksi memerlukan ramalan hasil penjualan (kemampuan menjual di masa yang akan datang, sehingga dapat dicegah terjadinya over production). Over production berarti produksi melebihi permintaan, sehingga banyak yang tidak laku. Sedangkan under production menyebabkan tidak terpenuhinya pesanan (order) yang dapat menghilangkan kesempatan menjual (loss of opportunity to sell). Apabila dua variable X dan Y mempunyai hubungan, maka nilai variable X yang sudah diketahui dapat dipergunakan untuk memperkirakan / menaksir Y. Ramalan pada dasarnya merupakan perkiraan / taksiran mengenai terjadinya suatu kejadian (nilai variable untuk waktu yang akan datang, seperti ramalan produksi dua tahun yang akan datang, ramalan harga bulan depan, ramalan jumlah penduduk 10 tahun yang akan dating, dan sebagainya. Variabel Y yang nilainya akan diramalkan disebut variable tidak bebas (dependent variable), sedangkan variable X yang nilainya dipergunakan untuk meramalkan nilai Y disebut variable bebas (independent variable) atau variable peramal (predictor) dan seringkali disebut variable yang menerangkan (explanatory). Jadi, jelas analisis korelasi ini memungkinkan kita untuk mengetahui sesuatu di luar hasil penyelidikan, misalnya dengan ramalan kita dapat mengetahui terjadinya suatu kejadian baik secara kualitatif (akan turun hujan, akan terjadi perang, akan lulus ujian, dan lain sebagainya), maupun kuantitatif (produksi padi akan mencapai 16 juta ton, indeks harga 9 macam bahan pokok naik 10%, penerimaan devisa turun 5%, dan sebagainya). Salah satu cara untuk melakukan peramalan adalah dengan menggunakan garis regresi. KOEFFISIEN KORELASI DAN KEGUNAANNYA Hubungan dua variable ada yang positif dan negative. Hubungan X dan Y dikatakan positif apabila kenaikan (penurunan) X pada umumnya diikuti oleh

Page 65: Probabilitas Statistik

kenaikan (penurunan) Y. Sebaliknya dikatakan negative kalau kenaikan (penurunan) X pada umumnya diikuti oleh penurunan (kenaikan) Y. Contoh hubungan positif :

X = pupuk Y = produksi X = biaya advertensi Y = hasil penjualan X = berat badan Y = tekanan darah

Contoh hubungan negatif : X = jumlah akseptor Y = jumlah kelahiran X = harga suatu barang Y = permintaan barang X = pendapatan masyarakat Y = kejahatan ekonomi Kuat dan tidaknya suatu hubungan antara X dan Y apabila dinyatakan dengan fungsi linier (paling tidak mendekati), diukur dengan suatu nilai yang disebut Koeffisien Korelasi. Nilai koeffisien korelasi ini paling sedikit – 1 dan paling besar 1. Jadi jika r = koeffisien korelasi, maka nilai r dapat dinyatakan sebagi berikut :

-1 ≤ r ≤ 1

Artinya : Jika r = 1, hubungan X dan Y sempurna dan positif (mendekati 1, yaitu

hubungan sangat kuat dan positif) = - 1, hubungan X dan Y sempurna dan negative (mendekati – 1,

yaitu hubungan sangat kuat dan negative) = 0, hubungan X dan Y lemah sekali atau tidak ada hubungan Disini X dikatakan mempengaruhi Y, jika berubahnya nilai X akan menyebabkan perubahan nilai Y, artinya naik turunnya X akan membuat nilai Y jufga nail turun, sehingga nilai Y akan bervariasi, baik terhadap rata-rata Y maupun terhadap garis linier yang mewakili diagram pencar. Akan tetapi naik turunnya Y adalah sedemikian rupa sehingga nilai Y bervariasi, tidak semata-mata

Page 66: Probabilitas Statistik

disebabkan oleh X, karena masih ada factor lain yang menyebabkannya. Misalnya kalau Y = hasil penjualan, X = biaya iklan (advertensi), maka naik turunya Y selain disebabkan oleh variable X juga oleh factor-faktor (variable) lainnya (seperti pendapatan masyarakat, harga, selera, dan lain-lain). Kemudian timbul pertanyaan, berapa besarnya kontribusi dari X terhadap naik turunnya nilai Y ini? Untuk menjawab pertanyaan ini harus dihitung suatu koeffisien yang disebut koeffisien penentuan (coefficient of determination). Kalau koeffisien penentuan ditulis KP, maka untuk menghitung KP digunakan rumus berikut :

KP = r2

Jika r = 0,9, maka nilai KP = (0,9)2 = 0,81 (=81%), yaitu besarnya sumbangan variabel X terhadap naik turunnya Y adalah 81%, sedangkan 19% disebabkan oleh factor lainnya. Cara menghitung r adalah sebagai berikut :

n n n

r = ( ∑ xiyi ) / ( akar ∑ xi2) ( akar ∑ yi

2 ) (1) i = 1 i = 1 i = 1

n

xi = Xi - X bar = ∑ Xi i = 1 n

yi = Yi - Y bar = ∑ Yi i = 1 Atau : n n n n n n n

r = (n ∑ XiYi - ∑ Xi ∑Yi ) / {akar n∑Xi2 – (∑Xi)

2} {akar n∑Yi2 – (∑Yi)

2} (2)

Page 67: Probabilitas Statistik

i =1 i =1 i =1 i =1 i =1 i =1 i =1 Rumus (1) dan (2) disebut koeffisien korelasi Pearson Contoh : Jika X adalah persentase kenaikan biaya iklan dan Y adalah persentase kenaikan hasil penjualan, maka berdasarkan table di bawah ini, hitunglah koeffisien korelasi (r).

X 1 2 4 5 7 9 10 12

Y 2 4 5 7 8 10 12 14

Penyelesaian : X Y X – X bar Y- Y bar x2

y2 xy (x) (y) 1 2 - 5,25 - 5,75 27,5625 33,0625 30,1875 2 4 - 4,25 - 3,75 18,0625 14,0625 15,9375 4 5 - 2,25 - 2,75 5,0625 7,5625 6,1875 5 7 - 1,25 - 0,75 1,5625 0,5625 0,9375 7 8 0,75 0,25 0,5625 0,0625 0,1875 9 10 2,75 2,25 7,5625 5,0625 6,1875 10 12 3,75 4,25 14,0625 18,0625 15,9375 12 14 5,75 6,25 33,0625 39,0625 35,9375

∑Xi =50 ∑ yi=62 ∑xi =0 ∑yi = 0 ∑ xi2 = 107,5 ∑yi2 =

Page 68: Probabilitas Statistik

117,5 ∑xiyi = 111,5

X bar =6,25 Ybar=7,75 r = 115,5 : (akar 107,5 – akar 117,5) = 0,99 Hubungan X dan Y ternyata sangat kuat dan positif,artinya kenaikan biaya iklan pada umumnya menaikkan harga penjualan. Dari nilai r, dicari nilai KP = r2 = 0,9801 (=98%). Artinya sumbangan biaya iklan terhadap variasi Y (naik turunya hasil penjualan) adalah 0,98 atau 98%, sedangkan sisanya yang 2% disebabkan oleh factor-faktor lainnya, seperti harga dan daya beli masyarakat. Kita juga dapat mencari r dengan menggunakan lembaran kerja yang dari rumus (2)

X Y X2

Y2 XY 1 2 1 4 2 2 4 4 16 8 4 5 16 25 20 5 7 25 49 35 7 8 49 64 56 9 10 81 100 90 10 12 100 144 120 12 14 144 196 168 ∑Xi = 50 ∑Yi = 62 ∑Xi2 = 420 ∑Yi2=598

∑ XiYi = 499

Page 69: Probabilitas Statistik

Memakai rumus (2) :

r = {8(499) – (50)(62)} : {akar (8)(42) – (50)2 - akar 8(598) – (62)2} = 0,99 Kalau hasil rumus (1) dan (2) tidak sama, ini disebabkan hanya karena kesalahan pembulatan atau rounding error. Apabila nilai r negative, missal r = - 99, artinya hubungan X dan Y kuat dan

negative. Dengan demikian, nilai KP = r2 = (0,99)2 = 0,9801 = 0,98 = 98% KOEFFISIEN KORELASI DATA BERKELOMPOK Rumus r untuk data berkelompok adalah sebagai berikut :

r = n (∑uvf) - (∑ufu)(∑ vfv) / {akar n∑u2fu – (∑ufu)2} { akar n∑v2fv

– (∑vfv)2} (3) Contoh : 100 orang mahasiswa Akademi Ilmu Statistik, Jakarta, mengambil ujian, diantaranya mata kuliah statistic dan matematika. Ada suatu pendapat bahwa pada umumnya mahasiswa yang mempunyai kemampuan matematika lemah maka akan mengalami kesulitan dalam belajar statistik, dan sebaliknya. Maksudnya kalau nilai matematika yang diperoleh rendah, maka nilai statistiknya juga rendah.Sebaliknya, kalau nilai matematikanya tinggi, maka nilai statistiknya juga tinggi. Dengan perkataan lain, ada hubungan positif antara nilai ujian matematika (X) dan nilai ujian statistic (Y). Misal setelah dinilai diperoleh hasil yang dikelompokkan sebagai berikut :

Matematika Statistik

40 - 49

50 - 59

60 - 69

70 - 79

80 - 89

90 - 99

Jumlah

Page 70: Probabilitas Statistik

90 – 99 80 – 89 70 – 79 60 – 69 50 – 59 40 – 49

1 3 3

4 6 5

1 5 9 6 4

2 4 10 5 2

4 6 8 2

4 5 1

10 16 24 21 17 12

Jumlah 7 15 25 23 20 10 100 Cara membaca tabel : Jumlah mahasiswa yang mendapat nilai matematika antara 70 – 79 dan nilai statistic antara 70 – 79 adalah 10 orang, sedangkan yang nilai matematikanya antara 40 – 49 dan statistiknya antara 40 – 49 sebanyak 3 orang. Pada umumnya dapat disimpulkan bahwa jika nilai matematikanya rendah, nilai statistiknya juga rendah, sedangkan kalau nilai matematikanya tinggi, maka nilai statistiknya juga tinggi. Sekarang, bagaimana cara menghitung koeffisien korelasinya ? Perhatikan bahwa sebetulnya data dari table yang menunjukkan hubungan nilai matematika dan statistika dapat dilihat sebagai dua tabel frekuensi berikut :

Kelas nilai Nilai Matematika Tengah (X) u fu

40 – 49 44,5 -2 7 50 – 59 54,5 -1 15 60 – 69 64,5 0 25 70 – 79 74,5 1 23 80 – 89 84,5

Page 71: Probabilitas Statistik

Dari tabel tersebut dapat dilihat bahwa u dan v, yang masing-masing adalah skala baru dari X dan Y, hanya merupakan kode saja untuk

menyederhanakan perhitungannya (sebelumnya kita mempergunakan symbol M untuk nilai tengah). Dalam hal ini karena ada dua variable kita pergunakan X dan Y. Kelas mana atau nilai tengah mana yang harus diberi nilai 0? Untuk data genap (seperti dalam contoh ini ada 6 kelas), pilihlah kelas yang dekat dengan nilai tengah, misalnya untuk X - 64,5 atau 74,5, disamakan 0, jadi u = 0. Sedangkan untuk Y juga sama saja. Disini f frekuensi untuk tiap sel, fu = frekuensi untuk X

atau u, dan fv untuk Y atau v.

Apabila dua table frekuensi tersebut dilihat secara bersama-sama, akan diperoleh tabel berikut : u

- 2

- 1

0

1

2

3

fv

2 20 90 – 99 94,5 3 10

Kelas nilai Nilai Statistika Tengah (Y) v fv

90 – 99 94,5 2 10 80 – 89 84,5 1 16 70 – 79 74,5 0 24 60 – 69 64,5 -1 21 50 – 59 54,5 -2 17 40 – 49 44,5 -3 12

Page 72: Probabilitas Statistik

v

2 1 0 1 -2 -3

1 3 3

4 6 5

1 5 9 6 4

2 4 10 5 2

4 6 8 2

4 5 1

10 16 24 21 17 12

fu 7 15 25 23 20 10 100 Kemudian untuk keperluan perhitungan r, harus dibuat table korelasi sebagai berikut (perhatikan perubahan letak u,v, fu, dan fv. (I) (II) (III) (IV) (V)

v fv vfv v2fv uvf

1 3 3

4 6 5

1 5 9 6 4

2 4 10 5 2

4 6 8 2

4 5 1

2 1 0 -1 -2 -3

10 16 24 21 17 12

20 16 0 -21 -34 -36

40 16 0 21 68 108

44 31 0 -3 20 33

(VI)u -2 -1 0 1 2 3 100 -55 253 125 fu ufu

u2fu uvf

7

15 -15

15 31

25 0 0 0

23 23

23 -1

20 40

80 24

10 30

90 39

100 64

236 125

(VII) (VIII)

(IX) (X)

Untuk memudahkan perhitungan :

Page 73: Probabilitas Statistik

u diletakkan di bagian bawah table (kolom VI) v disebelah kanan table (kolom I) Kolom (II) memuat frekuensi fv yang diperoleh dengan jalan

menjumlahkan semua frekuensi untuk semua nilai v, yaitu semua nilai dalam sel. Misal fv pada baris 1 = 2 + 4 + 4 = 10

Pada baris 5 = 3 + 6 + 6 + 2 = 1 …..dan seterusnya Kolom (III) memuat hasil kali vfv, yaitu hasil kali dari kolom (I) dan kolom

(III), misal 2 x 10 = 20, -2 x 17 = -34 ….dan seterusnya

Kolom (IV) memuat hasil kali v2fv yang diperoleh dari hasil perkalian

kuadrat kolom (I) dengan kolom (II), misal 22 x 10 = 40 atau kolom (I) dikalikan dengan kolom (III), misal 2 x 20 = 40…dan seterusnya

Nilai-nilai pada baris VII,VIII dan IX dapat diperoleh dengan jalan yang sama, dengan menggunakan u dan fu.

Perhatikan bahwa :

Jumlah kolom (II) = ∑ fv = n = 100

Jumlah kolom (III) = ∑ vfv = - 55

Jumlah kolom (IV) = ∑ v2fu = 253

Jumlah baris (VII),(VIII) dan (IX) masing-masing = ∑ fu = n = 100, ∑

ufu = 64 dan ∑ v2fu = 236

Untuk menghitung r masih diperlukan ∑ uvf, dimana f adalah frekuensi untuk setiap sel (cell frequency). Misalnya kalau dilihat dari baris ke baris :

Untuk v = 2, nilai f = 2, 4 dan 4 Untuk v = 1, nilai f = 1, 4, 6, dan 5 Untuk v = -3, nilai f = 3, 5, dan 4

(frekuensi v untuk semua nilai u) Sebaliknya f juga dapat dianggap sebagai frekuensi u untuk nilai v. Kalau dilihat dari kolom ke kolom, misalnya :

Untuk u = -2, frekuensinya 1, 3, dan 3

Page 74: Probabilitas Statistik

Untuk u = 2, nilai f = 4,6,8, dan 2 Untuk u = 3, nilai f = 4, 5, dan 1

Jadi ∑ uvf dapat diperoleh sebagai berikut : a. Dengan mengalikan setiap frekuensi sel dengan u dan v yang

bersangkutan :

∑uvf = (1)(2)(2) + (2)(2)(4) + (3)(2)(4) + (0)(1)(1) + (1)(1)(4) + (2)(1)(6) + (3)(1)(5) + (0)(0)(5) + (1)(0)(10) + (2)(0)(8) + (3)(0)(1) + (-2)(-1)(1) + (-1)(-1)(4) + (0)(-1)(9) + (1)(-1)(5) + (2)(-1)(2) + (-2)(-2)(3) +(-1)(-2)(6) + (0)(-2)(6) + (1)(-1)(2) + (-2)(-3)(3) + (-1)(-3)(5) + (0)(-3)(4)

= 125

Dari tabel korelasi di atas dapat diikhtisarkan hasil sebagai berikut :

n = 100 ∑ ufu = 64 ∑ u2fu = 236

∑ uvf = 125 ∑ vfu = - 55 ∑ v2fv = 253

r = {(100)(125) – (64)(-55)} : [{akar (100)(236) – (64)2} x akar (100)(253)– (-55)2}] = 0,7686 atau 0,77 Kesimpulan : Hubungan antara nilai matematika dan statistic cukup kuat dan positif. Artinya, nilai matematika yang diperoleh akan mempengaruhi nilai statistic (pada umumnya mahasiswa dengan nilai matematika yang rendah akan memperoleh nilai ujian statistic yang rendah; sebaliknya jika nilai matematikanya tinggi, maka nilai statistic yang akan dicapai tinggi). Note : Rumus untuk menghitung korelasi bagi data berkelompok penting sekali sebab dalam praktek, misalnya di dalam suatu penelitian, hasil data yang dipeoleh sudah disajikan dalam bentuk data berkelompok dengan kelas interval yang sama.

Page 75: Probabilitas Statistik

KORELASI RANK (PERINGKAT) Misalkan ada dua orang, Joni dan Tono, yang sama-sama penggemar rokok. Kedua orang tersebut diminta untuk memberikan nilai terhadap 10 mek rokok. Rokok yang paling digemari diberi nilai 1 dan seterusnya sampai pada rokok yang tidak disenangi diberi nilai 10. Dengan perkataan lain, Joni dan Tono diminta untuk memberikan rank (peringkat). Pembeian rank ini bias dibalik, maksudnya untuk rokok yang disenangi diberi nomor 10 dan seterusnya, sementara yang tidak disenangi diberi nilai 1. Hasil pemberian rank adalah sebagai berikut : Rank hipotetis nilai rokok Joni dan Tono

Nomer urut Merk Rokok Rank dari Jono Rank dari Tono 1 2 3 4 5 6 7 8 9 10

Kansas Jarum 555 Bentoel Mascot Marlboro Salem Kent Gudang Garam Dunhill

9 5 10 1 8 7 3 4 2 6

8 3 9 2 7 10 4 6 1 5

Apabila dibuat koeffisien korelasi antara rank Joni dan Tono terhadap 10 merk rokok tersebut, maka akan diperoleh koeffisien korelasi rokok :

rrank = 1 - { 6 ∑ di2 / n (n2 – 1) }

dimana : di = selisih dari pasangan rank ke – i

n = banyaknya pasangan rank (dalam hal ini n = 10) Rumus ini disebut rumus Spearman

Page 76: Probabilitas Statistik

Contoh : Cari koeffisien korelasi rank antara rank Tono dan Joni didalam menilai 10 merk rokok

Rank Tono 8 3 9 2 7 10 4 6 1 5 Rank Joni 9 5 10 1 8 7 3 4 2 6 Selisih rank (d) -1 -2 -1 1 -1 3 1 2 -1 -3

d2 1 4 1 1 1 9 1 4 1 9 Penyelesaian :

rrank = 1 - { 6 ∑ di2 / n (n2 – 1) }

= 1 - { 6 (1 + 4 + 1 + ….+1) / 10 (100 – 1) } = 0,85 Contoh (apabila ada nilai yang sama) : Ada 10 calon salesman yang diuji mengenai teknik penjualan. Setelah mereka selesai diuji kemudian ditugaskan untuk melakukan penjualan. Hasil-hasilnya adalah X = hasil ujian, Y = hasil penjualan tahun pertama. Nilai X dan Y dari 10 salesman termasuk rank-nya dan selisih rank (d) adalah sebagai berikut :

Nama

Nilai Ujian

Rank

Hasil Penjualan Tahun Pertama

(ribuan rupiah)

Rank

Selisih rank

(X) (Y) (d) d2

Page 77: Probabilitas Statistik

Amin Joni Tono Amir Ahmad Paulus Purwanto Bambang Jatmiko Aryo

48 32 40 34 30 50 26 50 22 43

3 6 5 7 8

1,5

9 1,5

10 4

312 164 280 196 200 288 146 361 149 252

2 8 4 7 6 3

10 1 9 5

1 - 2

1 0 2

-1,5 -1 0,5 1

-1

1 4 1 0 4

2,25 1 0,25 1 1

Oleh karena Paulus dan Bambang mempunyai nilai sama, maka rank mereka harus sama yaitu (1 + 2) / 2 = 1,5. Mula-mula Pulus diberi rank 1, Bambang rank 2 (atau sebaliknya), kemudian dirata-ratakan. Ada kemungkinan tiga orang mempunyai nilai yang sama dan jatuh pada rank 5, 6, dan 7, dimana masing - masing mendapat rank yang sama, yaitu : (5 + 6 +7) / 3 = 6. Dalam hal ini, masing-masing diberi rank sesuai dengan urutnanya, kemudian dicari rata-rata ranknya. Apabila ada beberapa rank yang sama, maka biasanya koeffisien korelasi rank tidak sama dengan koeffisien korelasi yang dihitung berdasarkan rumus Pearson (product moment coefficient of correlation). Penyelesaian :

rrank = 1 - { 6 ∑ di2 / n (n2 – 1) }

= 1 - {6 (1 + 4 + 1 + ……+ 1) } / 10 (102 – 1) } = 1 - { 6 (15,5) / 10 (99) } = 0,91

Page 78: Probabilitas Statistik

Note : Perhitungan koeffisien korelasi dengan menggunakan rumus koeffisien korelasi rank (Spearman) jauh lebih sederhana dibandingkan rumus product moment dari Pearson, sebab dengan menggunakan rank, angka-angkanya menjadi lebih kecil, sedangkan perhitungan adalah sama atau sangat mendekati. Nilai terendah diberi rank terkecil dan nilai tertinggi diberi rank terbesar. Kalau penilaian terhadap mutu barang didasarkan pada selera atau kegemaran, maka barang yang jelek (tak disenangi) diberi rank terkecil, sedangkan barang yang bagus (paling disenangi) diberi rank terbesar atau sebaliknya. KORELASI DATA KUALITATIF Rumus koeffisien korelasi yang telah diahas diatas hanya berlaku untuk data kuantitatif. Rank juga berupa data kuantitatif sebab berbentuk angka. Banyak sekali hasil pengumpulan data (penelitian) yang menghasilkan data kualitatif, khususnya yang berupa kategori-kategori. Misalnya, penduduk dikategorikan berpendapatan tinggi, sedang/menengah, dan rendah; senang dikategorikan mempunyai mobil sedan berukuran besar, sedang, dan kecil. Kita seringingin mengetahui apakah ada hubungan antara selera konsumen dengan letak geogrfis; antara kedudukan orang tua dengan kedudukan anak (kalau orang tua pangkatnya tinggi, apakah anaknya juga demikian); antara pendidikan orang tua dan anak; antara pendidikan dan pendapatan (makin tinggi pendidikan, makin tinggi pendapatan?) dan sebagainya. Untuk data kualitatif yang dipergunakan dalam mengukur kuatnya hubungan disebut Contingency Coefficient (koeffisien bersyarat) yang mempunyai pengertian sama seperti koeffisien korelasi. Misalnya, hasil penelitian disajikan dalam bentuk p x q table. Telah disebut diatas bahwa koeffisien bersyarat (Cc), dipergunakan untuk mengukur kuatnya hubungan data kualitatif yang mempunyai arti seperti

Page 79: Probabilitas Statistik

koeffisien korelasi, dimana nilai Cc sebesar 0, yang berarti tidak ada hubungan.

Akan tetapi batas Cc tidak sebesar 1, tergantung atau sebagai fungsi

banyaknya kategori (baris atau kolom). Batas tertinggi nilai Cc ialah akar (r-1)/r, dimana nilai r ialah banyaknya baris

atau kolom. Kalau banyaknya baris tidak sama dengan banyaknya kolom, pilih nilai yang terkecil. Adapun untuk menghitung nilai koeffisien bersyarat (Cc) digunakan rumus :

Cc = akar X2 / (X2 + n)

p q p q p q n = ∑ ∑ fij = ∑ ni. = ∑ n.j = ∑ ∑ nij = banyaknya observasi i = 1 j= 1 i = 1 j= 1 i = 1 j= 1 p q

X2 = ∑ ∑ (fij - eij)2 / eij

i = 1 j = 1 Dimana : fij = nij = frekuensi atau banyaknya observasi baris I kolom j

i = 1,2,……..,p j = 1,2,……..,q

X2 dibaca kai skuer atau khi kuadrat II I

1

2

…….

f

……

q

(1) (2) (3) (4) (5) (6) (7) (8) 1 f11

(e11)

f12

(e12)

f1j

(e1j)

f1q

(e1q)

n1.

2 f21

(e21)

f22

(e22)

F2j

(e2j)

f2q

(e2q)

n2.

Page 80: Probabilitas Statistik

.

.

i fi1

(ei1)

fi2

(ei2)

fij

(eij)

fiq

(eiq)

ni.

.

.

p fp1

(ep1)

fp2

(ep2)

fpj

(epj)

fpq

(epq)

np.

n1 n2 nj nq n

fij = frekuensi kategori i dan j

eij = frekuensi harapan kategori I dan j

eij = (ni.)(n.j) / n = frekuensi harapan (expected frecuency)

q p ni. = ∑ fij ---.> ∑ ni. = n

j = 1 i = 1 q p n.j = ∑fij ---.> ∑ n.i = n

i = 1 j = 1 p q ∑ ∑nij = n i = 1 j = 1

Kalau nilai perbandingan Cc dengan batas tertinggi :

Cc < 0,50 maka hubungan lemah

0,50 < Cc < 0,75 maka hubungan sedang / cukup

0,75 < Cc < 0,90 maka hubunga kuat

Page 81: Probabilitas Statistik

0,90 < Cc < 1 maka hubungan sangat kuat

Cc = 1 maka hubungan sempurna

Contoh : Untuk mengetahui apakah ada hubungan antara tingkat pendidikan ibu rumah tangga dengan konsumsi susu dari anggota keluarga mereka, dilakukan penelitian yang hasilnya disajikan dalam table berikut : Pendidikan Konsumsi Kurang Cukup Sangat cukup Tidak tamat SLA 82 65 12 Tamat SLA 59 112 24 Pernah masuk PT 37 94 42 Hitung Cc (contingency coefficient) untuk mengukur hubungan antara tingkat pendidikan dan konsumsi susu Penyelesaian : Untuk memudahkan kita susun table berikut :

II I

1

2

3

Jumlah

1 82 (53,70)

65 (81,76)

12 (23,53)

n1 = 159

2 59 (65,86)

112 (100,28)

24 (28,86)

n2 = 195

3 37

94

42

n3 = 173

Page 82: Probabilitas Statistik

(58,43) (88,96) (25,61) Jumlah n1 = 178 n1 = 271 n1 = 78 n = 527

e11 = n1.n1 / n = (159)(178) / 527 = 53,70

e12 = n1.n2 / n = (159)(271) / 527 = 81,76

e13 = n1.n3 / n = (159)(78) / 527 = 23,53

e21 = n2.n1 / n = (195)(178) / 527 = 65,86

e22 = n2.n2 / n = (195)(271) / 527 = 100,28

e23 = n2.n3 / n = (195)(78) / 527 = 28,86

e31 = n3.n1 / n = (173)(178) / 527 = 58,43

e32 = n3.n2 / n = (173)(271) / 527 = 88,96

e33 = n3.n3 / n = (173)(78) / 527 = 25,61

3 3

X2 = ∑ ∑ (28,30)2 / 53,70 + (-16,76)2 / 81,76 + (-11,53)2 / 23,53 + i = 1 j = 1

(-6,86)2 / 65,86 + (11,72)2 / 100,28 + (-4,86)2 / 28,86 + (-21,43)2 /

58,43(5,04)2 / 88,96 + (16,39)2 / 25,61 = 45,54

Cc = akar X2 / ( X2 + n ) = akar 45,54 / (45,54 + 527) = 0,28

Karena jumlah baris dan jumlah kolom sama dengan 3, maka r = 3. Batas atas Cc ialah akar {(3-1)/3} = 0,82.

Karena nilai perbandingan Cc dengan batas atas lebih kecil dari 0,50, maka

hubungan atau korelasi antara tingkat pendidikan ibu rumah tangga dengan tingkat konsumsi susu anggota rumah tangga tidak begitu kuat, bahkan bias dikatakan lemah. TEKNIK RAMALAN DAN ANALISIS REGRESI

Page 83: Probabilitas Statistik

Teknik ramalan dan analisis regresi adalah untuk menghitung suatu perkiraan atau persamaan yang akan menjelaskan hubungan antara dua variable. Pembahasan ini terbatas pada regresi sederhana, yaitu mengenai hubungan antara dua variable yang biasanya cukup tepat dinyatakan dalam suatu garis lurus. 1. Diagram Pencar (Scatter Diagram)

Setelah ditetapkan bahwa terdapat hubungan logis diantara dua variable, maka untuk mendukung analisis lebih jauh, barangkali tahap selanjutnya adalah menggunakan grafik. Grafik ini disebut diagram pencar, yang menunjukkan titik-titik tertentu. Setiap titik memperlihatkan suatu hasil yang kita nilai svariabel tidak bebas (dependent) maupun bebas (independent). Diagram pencar memiliki dua manfaat, yaitu : a. membantu menunjukkan apakah terdapat hubungan yang bermanfaat

untuk dua variable. b. Membantu menetapkan tipe persamaan yang menunjukkan hubungan

antara kedua variable tersebut

2. Persamaan Regresi Linier

Garis lurus yang terdapat pada diagram pencar dan menggambarkan hubungan antara variable, desebut garis regresi atau garis perkiraan. Persamaan yang digunakan untuk mendapatkan garis regresi pada data diagram pencar disebut persamaan regresi atau persamaan perkiraan. Bentuk persamaan regresi yang menggunakan metode kuadrat terkecil adalah sebagai berikut : Y’ = a + b X Dimana : a = Y pintasan, (nilai Y’ bila X = 0)

Page 84: Probabilitas Statistik

b = kemiringan dari garis regresi (kenaikan atau penurunan Y’ untuk setiap perubahan satuan-satuan X) atau koeffisien regresi, yang mengukur besarnya pengaruh X terhadap Y atau kalau X naik satu unit.

X = nilai tertentu dari variable bebas Y’ = nilai yang diukur / dihitung pada variable tidak bebas. Kesamaan diantara garis regresi dan garis trend tidak dapat berakhir dengan persamaan garis lirus. Garis regresi (seperti garis trend dan nilai tengah aritmatika) memiliki dua sifat-sifat matematis berikut : ∑ (Y – Y’) = 0 Dan ∑ (Y – Y’) = nilai terkecil atau terendah Dengan perkataan lain, garis regresi akan ditempatkan pada data dalam diagram sedemikian rupa sehingga penyimpangan (perbedaan) positif titik-titik terhadap titik peb\ncar di atas garis akan mengimbangi penyimpangan negative tititk-titik pencar yang terletak di bawah garis, sehingga hasil penyimpangan keseluruhan tititk-titik terhadap garis lurus adalah nol. Untuk tujuan kita diatas, perhitungan analisis regresi dan analisis korelasi dapat dipermudah dengan menggunakan rumus dalam bentuk penyimpangan nilai tengah variable X dan Y, yaitu penyimpangan dari X bar dan Y bar. Oleh karena itu, dapat digunakan simbol berikut ini : x = (X – X bar) y = (Y – Y bar) dan xy = (X-X bar) (Y – Y bar) Ciri / sifat kuadrat terkecil :

Page 85: Probabilitas Statistik

∑ (Y – Y ‘) = 0

∑ (Y – Y”)2 = nilai terkecil (atau nilai terendah) Nilai a dan b pada persamaan regresi dapat dihitung dengan rumus berikut :

b = ∑ xiyi /∑ x2i

atau b = (n ∑XiYi – ∑Xi∑Yi) / n ∑X2i – (∑Xi)2

a = Y bar – bX bar Contoh :

Karyawan Hasil produksi Skor tes y x xy x2 y2 (lusin) (Y) (X) (Y–Ybar) (X – Xbar)

A 30 6 - 7 - 1 7 1 49 B 49 9 12 2 24 4 144 C 18 3 -19 - 4 76 16 361 D 42 8 5 1 5 1 25 E 39 7 2 0 0 0 4 F 25 5 -12

Page 86: Probabilitas Statistik

- 2 24 4 144 G 41 8 4 1 4 1 16 H 52 10 15 3 45 9 225 296 56 0 0 185 36 968 Ybar = ∑ Y/N = 296/8 = 37 ; Xbar =∑X / N = 56/8 = 7

b = xy / x2 = 185/36 = 5,138 atau 5,14 a = Ybar – b. Xbar = 37 - 5,14 ( 7 ) = 1,02 Sehingga persamaan regresi yang memperlihatkan hubungan kedua variable antara hasil produksi dan hasil tes kecerdasan karyawan pada pabrik mainan anak-anak “Takey” adalah : Y’ = 1,02 + 5,14 X Penggunaan Persamaan Regresi dalam Peramalan Tujuan utama penggunaan persamaan regresi adalah untuk memperkirakan nilai dari variable tak bebas pada nilai variable bebas tertentu. Misalnya, Hiram Hess, seorang manajer personalia pada pabrik mainan “Takey” sedang mempertimbangkan akan mempekerjakan seorang calon karyawan dengan nilai tes kecerdasan 4. Sedangkan penyelia (supervisor) pada departemen tersebut menginginkan seorang karyawan baru yang dapat berproddukdi pada tingkat minimal 30 lusin. Tentu saja, tidak mungkin untuk mengatakan dengan tepat berapa tingkat produksi si calon karyawan pada waktu mendatang, tetapi Hirem dapat menggunakan persamaan diatas untuk melihat ramalan produksi si calon karyawan pada waktu mendatang.

Page 87: Probabilitas Statistik

Bagaimana? Yaitu dengan menyukihkan (mensubstitusikan) nilai 4 pada X dari persamaan regresi, maka ramalan dapat ddihitung menjadi sebagai berikut : Y’ = 1,02 + 5,14 (x) = 1,02 + 5,14 (4) = 21,58

Page 88: Probabilitas Statistik

STATISTIK INDUSTRI MODUL 8 REGRESI LINIER BERGANDA DAN REGRESI (TREND) NONLINIER

Tujuan Belajar : Setelah mempelajari bab ini, Anda diharapkan mampu :

Memahami hubungan lebih dari dua variable Mendapatkan persamaan regrresi linier berganda Menghitung korelasi berganda dan korelasiparsial Membuat persamaan trend nonlinier dari suatu series data

HUBUNGAN LEBIH DARI DUA VARIABEL REGRESI LINIER BERGANDA

Hubungan linier dari variable X dan Y yang dibahas pada modul 8 menggunakan persamaan regresi linier Y’ = a + bX, misalnya hubungan antara biaya periklanan (X) dan hasil penjualan (Y). Selain biaya periklanan, factor apalagi yang mempengaruhi hasil penjualan ? Apabila terdapat lebih dari dua variable, maka hubungan linier dapat dinyatakan dalam persamaan regresi linier berganda sebagai berikut : Y’ = b0 + b1X1 + b2X2 + …….+ bkXk

(1) Y’i = b0 + b1X1i + b2X2i + …….+ bkXki

(2) Dengan : i = 1,2,…….n Dimana : Y = nilai observasi ( data hasil pencatatan ) Y’ = nilai regresi Disini ada satu variable tidak bebas (dependent variable), yaitu Y’ dan ada k variable (independent variable), yaitu X1, ……., Xk.

Untuk menghitung b0, b1, b2,……, bk kita gunakan Metode Kuadrat Terkecil

(Least Square Method) yang menghasilkan persamaan normal sebagai berikut : b0n + b1∑X1 + b2∑X2 + …….+ bk ∑Xk = ∑Y

Page 89: Probabilitas Statistik

b0∑X1 + b1∑X12 + b2∑X1X2 + ……. bk ∑ X1Xk = ∑ X1Y

b0∑ X2 + b1∑X2 X1 + b2∑X2 2 + ……. bk ∑ X2 Xk = ∑ X22 Y

. . . . . . . . . . . . . . .

b0 ∑Xk + b1∑ Xk X1 + b2∑Xk X2 + ……. bk ∑Xk2 = ∑ Xk Y

Kalau persamaan ini dipecahkan, kita akan memperoleh nilai b0, b1, b2,

…..,bk. Kemudian dapat dibentuk persamaan regresi linier berganda. Apabila

persamaan regresi itu telah diperoleh, barulah kita dapat meramalkan nilai Y dengan syarat kalau nilai X1 , X2 , ……., Xk sebagai variable bebas

(independent/explanatory variables) sudah diketahui. Untuk k = 2, Y’ = b0 + b1X1 + b2X2 , satu variable tak bebas ( Y ),

dan dua variable bebas (X1 dan X2 ), maka b0, b1 dan b2 dapat dihitung

dari persamaan normal berikut : b0n + b1∑X1 + b2∑X2 = ∑Y

b0∑X1 + b1∑X12 + b2∑X1X2 = ∑ X1Y

b0∑ X2 + b1∑X2 X1 + b2∑X2 2 = ∑ X2 Y

. . . . . (ada tiga persamaan dengan tiga variable yang tak diketahui nilainya, yaitu b0,

b1, b2 dan bk ).Persamaan tersebut dapat dinyatakan dalam persamaan

berikut : n ∑X1 ∑X2 b0 ∑Y

∑X1 ∑X12 ∑X1X2 b1 = ∑ X1Y

∑ X2 ∑X2 X1 ∑X2 2 b2 ∑ X2 Y

Page 90: Probabilitas Statistik

. . . A b H Dengan : A = matriks (diketahui) H = vector kolom (diketahui) b = vector kolom (tidak diketahui) Variabel b dapat diselesaikan dengan cara sebagai berikut : Ab = H

b = A-1 H

dimana A-1 adalah kebalikan (invers) dari matriks A. CARA MEMECAHKAN PERSAMAAN LEBIH DARI DUA VARIABEL Banyak sekali cara untuk memecahkan persamaan dengan variable lebih dari dua, diantaranya dengan menggunakan determinan. Contoh 1 : Dalam suatu penelitian yang dilakukan terhadap 10 rumah tangga yang dipilih secara acak, diperoleh data pengeluaran untuk pembelian barang-barang tahan lama per minggu (Y), pendapatan per minggu (X1), dan jumlah anggota rumah

tangga (X2) sebagai berikut :

Y (ratusan rupiah) 23 7 15 17 23 22 10 14 20 19 X1(ratusan rupiah) 10 2 4 6 8 7

4 6 7 6 X1(orang) 7 3 2 4 6

5 3 3 4 3 Kalau seandainya suatu rumah tangga mempunyai X1 dan X2, masing-masing

11 dan 8, berapa besarnya nilai Y, artinya berapa ratus rupiah rumah tangga

Page 91: Probabilitas Statistik

yang bersangkutan akan mengeluarkan untuk pembelian barang-barang tahan lama? Penyelesaian : Langkah pertama adalah mengolah data diatas menjadi sebagai berikut :

Y X1 X2 X1Y X2Y X1X2 Y2 X12 X22

23

15 17 23 22 10 14 20 19

10 2 4 6 8 7 4 6 7 6

7 3 2 4 6 5 3 3 4 3

230

102 184 154

140 114

161 21 30 68 138 110 30 42 80 57

70 6 8 24 48 35 12 18 28 18

529 49 225 289 529 484 100 196 400 361

100 4 16 36 64 49 16 36 49 36

49 9 4 16 36 25 9 9 19

∑ Y = 170

∑X1 = 60

∑X2 = 40

∑X1Y

=1.122

∑X2Y=

737

∑X1X2=

267 ∑Y2 = 3.162

X12=

406

∑ X2

2 =182

Persamaan normal adalah sebagai berikut : b0n + b1∑X1 + b2∑X2 = ∑Y

maka : 10 b0 + 60 b1 + 40 b2 = 170

b0 ∑X1 + b1∑X12 + b2∑X1X2 = ∑ X1Y

maka : 60b0 + 40 b1 + 267 b2 = 1.122

b0∑X2 + b1∑X2 X1 + b2∑X22 = ∑ X2Y

maka : 40 b0 + 267 b1 + 182 b2 = 737

Dengan cara determinan, persamaan diatas menghasilkan b0 = 3,92, b1 = 2,50

dan b2 = - 0,48, sehingga persamaannya adalah sebagai berikut :

Page 92: Probabilitas Statistik

Y = 3,92 + 2,50 X1 - 0,48 X2 = 3,92 + 2,50 (11) - 0,48 (8) =

27,58 Jadi untuk suatu rumah tangga dengan pendapatan per minggu Rp. 11.000 dan jumlah anggota keluarga 8 orang, diperkirakan akan mengeluarkan Rp. 2.758 untuk pembelian barang-barang tahan lama. Kita juga dapat menghitung hubungan antara perubahan pendapatan dan pengeluaran. Untuk tujuan ini, kita gunakan persamaan regresi linier berganda. Y’ = b0 + b1X1 + b2X2

(3) b0 = nilai Y’, kalau X1 = X2 = 0

b1 = besarnya kenaikan (penurunan) Y dalam satuan, kalau X1 naik

(turun) satu satuan, sedangkan X2 konstan

b2 = besarnya kenaikan (penurunan) Y dalam satuan, kalau X2 naik

(turun) satu satuan, sedangkan X1 konstan

Jadi, jika X1 naik Rp. 1.000 sementara X2 konstan, maka Y naik Rp. 250.

Demikian juga jika X2 bertambah satu orang, sedangkan X1 konstan, maka Y

turun (makin besar jumlah anggota keluarga, makin berkurang pengeluaran untuk pembelian barang-barang tahan lama). Nilai b1 dan b2 dinamakan

koeffisien regresi parsial (partial coefficient regression) dan sering ditulis sebagai b1 = b01.2 dan b2 = b02.1.

Korelasi Berganda Pada modul 7, telah dibahas tentang korelasi antara dua variable X dan Y. Koeffisien korelasi antara X dan Y sering diberi symbol rxy atau r saja.

Page 93: Probabilitas Statistik

rxy = ∑xiyi / ( ∑xi2)( ∑yi2)

(4) dimana : xi = X1i - X bar

yi = Yi - Y bar

Apabila kita mempunyai tiga variable Y, X1,X2 maka korelasi X1 dan Y

digambarkan dengan rumus berikut :

rxiy = r1y = ∑ x1iyi / ( ∑ x1i2)( ∑yi2)

(5) dimana : x1i = X1i - X bar

yi = Yi - Y bar

Korelasi X2 dan Y digambarkan dengan rumus berikut :

rx2y = r2y =∑ x2iyi / ( ∑ x2i2)( ∑ yi2)

(6) dimana : x2i = X2i - X2bar

yi = Yi - Ybar

Akhirnya korelasi X1 dan X2 adalah :

rx1x2 = r12 = ∑ x1ix2i / (akar ∑ x1i2)( akar∑ x2i2)

(7) dimana : x1i = X1i - X1bar

Page 94: Probabilitas Statistik

x2i = X2i - X2bar

Koeffisien korelasi antara dua variable yang disebut koeffisien korelasi linier sederhana (KKLS). Kalau kita ingin mengetahui kuatnya hubungan antara variable Y dengan beberapa variable X lainnya (misalnya antara Y dengan X1 dan X2), maka kita

harus menggunakan suatu koeffisien korelasi yang disebut koeffisien korelasi linier berganda (KKLB) yang rumusnya adalah sebagai berikut :

KKLB = Ry.12 = (r21y + r22y - 2 r1yr2yr12 ) / (1 –

r212) (8)

Apabila KKLB dikuadtratkan, maka akan diperoleh koeffisien penentuan (KP), yaitu suatu nilai untuk mengukur besarnya sumbangan (share) dari beberapa variabel X terhadap variasi (naik-turunnya) Y. Kalau Y’ = b0 + b1X1 + b2X2 , KP mengukur besarnya sumbangan X1 dan X2 terhadap variasi atau naik turunnya Y.

KP = R2y.12

(9) Apabila dikalikan dengan 100% akan diperoleh persentase sumbangan X1 dan

X2 terhadap naik turunnya Y.

Misalkan : X1 = biaya iklan

X2 = pendapatan

Y = hasil penjualan Ry.12 = 0,90

KP = (0,90)2 = 0,81 (kalikan 100% = 81%).

Page 95: Probabilitas Statistik

Ini berarti bahwa variasi atau naik turunnya nilai Y , 81 % disebabkan oleh biaya iklan X1 dan pendapatan X2, sementara 19% lainnya, disebabkan olah

faktor-faktor lain yang mempengaruhi hasil penjualan tetapi tidak dimasukkan dalam persamaan regresi linier berganda. Makin besar nilai KP makin baiklah persamaan regresi berganda untuk meramalkan nilai Y. Koeffisien penentuan dapat juga dihitung berdasarkan rumus berikut :

KP = R2y.12 = ( b1∑x1i yi + b2∑x2i yi ) / ∑ yi2

(10) b1 dan b2 diperoleh dari Y’ = b0 + b1X1 + b2X2

Dimana : ∑x1i yi = ∑(X1i – X1bar) (Yi – Y bar)

= ∑X1i Yi - 1/n ∑X1i∑Yi

∑x2i yi = ∑(X2i – X2bar) (Yi – Y bar)

= ∑X2i Yi - 1/n ∑X2i∑Yi

∑yi = ∑ (Yi – Y bar)2

= ∑ Yi2 - 1/n (∑Yi)2 Contoh 2 : Dengan menggunakan contoh 1, hitunglah KP dengan rumus 10 Penyelesaian : Y = 3,92 + 2,50 X1 - 0,48 X2

b1 = 2,50 , b1 = - 0,48 ,

∑X1i Yi= 1.122 , ∑X1i = 60 , ∑Yi = 170

∑x1i yi = = ∑X1i Yi - 1/n ∑X1i∑Yi = 1.122 – 1/10 (60)(170) = 102

∑X2i Yi = 737 , ∑X2i = 40 , ∑Yi = 170

Page 96: Probabilitas Statistik

∑x2i yi = ∑X2i Yi - 1/n ∑X2i∑Yi = 737 - 1/10 (40) (170) = 57

∑ Yi

2 = 3.162 , ∑Yi = 170

∑yi2= ∑ Yi2 - 1/n (∑Yi)2 = 3.162 - 1/10 (170)2 = 272

KP = R2y.12 = ( b1∑x1i yi + b2∑x2i yi ) / ∑ yi2

= {2,50 (102) – 0,48 (57)} / 272 = 0,8369 = 0,84 Jadi besarnya sumbangan pendapatan (X1) dan jumlah anggota rumah tangga

(X2) terhadap variasi atau naik turunnya pengeluaran untuk pembelian barang-

barang tahan lama (Y) adalah 84%, sedangkan sisanya sebesar 16% disebabkan oleh factor-faktor lainnya. Besarnya KKLB adalah sebagai berikut :

KKLB = Ry.12 = akar R2y.12

= akar 0,8369 = 0,90 Koeffisien Korelasi Parsial Kalau variable Y berkorelasi dengan X1 dan X1, maka koeffisien korelasi

antara Y dan X1 (X2 konstan), antara Y dan X2 (X1 konstan), dan antara

X1 dan X2 (Y konstan) disebut Koeffisien Korelasi Parsial (KKP) dengan

rumus sebagai berikut : a. Koeffisien Korelasi parsial Y dan X1 ( kalau X2 konstan ) :

r1y.2 = r1y – r2y r12 / (1 - r2y2) (1 - r12

2)

(11)

Page 97: Probabilitas Statistik

b. Koeffisien Korelasi parsial Y dan X2 ( kalau X1 konstan ) :

r2y.1 = r2y – r1y r12 / (1 - r1y2)( (1 - r12

2)

(12) c. Koeffisien Korelasi parsial X1 dan X2 ( kalau Y konstan ) :

r12.y = r12 – r1y r2y/ (1 - r1y2) ( 1 - r2y

2)

(13) Contoh 3 : Dengan menggunakan contoh 1, hitunglah koeffisien korelasi parsial antara Y dan X1 , Y dan X2 serta X1 dan X2

Penyelesaian :

Dari contoh 2 : ∑x1i yi = 102 , ∑x2i yi = 57 , ∑yi2 = = 272

Dari contoh 1 : ∑X1i2 = ∑X12 = 406 , ∑X1i = ∑X1= 60

∑X2i2 = ∑X2

2 = 182 , ∑X2i = ∑X2 = 40 , ∑X1i X2i = 267

Kemudian dihitung : ∑x1i 2 = ∑X1i 2 - 1/n (∑X1i) 2 = 406 - 1/10 (60)2 =

46

∑x2i 2 = ∑X2i 2 - 1/n (∑X2i) 2 = 182 - 1/10 (40)2 =

22

∑x1ix2i = ∑X1iX2i - 1/n ∑x1i∑x2i = 267 - 1/10 (60)(40) =

27

r1y = ∑ x1iyi / ( ∑ x1i2 ∑y1i2 = 102 / 46 272 = 0,91

Page 98: Probabilitas Statistik

r2y = ∑ x2iyi / ( ∑ x2i2 ∑yi2 = 57 / 22 272 = 0,74

r12 = ∑ x1iy2i / ( ∑ x1i2 ∑x2i2 = 27 / 46 222 = 0,81

r1y.2 = r1y – r2 r12 / (1 - r2y2) (1 - ry2

2)

= { 0,91 - (0,74)(0,85)} / {1 – (0,74)2} {1 – (0,85)2} = 0,80

r2y.1 = r2y – r1y r12 / (1 - r1y2)( (1 - ry2

2)

= { 0,74 - (0,91)(0,85)} / {1 – (0,91)2} {1 – (0,85)2} = - 0,15

r12.y = r12 – r1y r2y/ (1 - r1y2) ( 1 - ry2

2)

= { 0,85 - (0,91)(0,74)} / {1 – (0,91)2} {1 – (0,74)2} = 0,63 Dalam prakteknya kita sering ingin mengetahui koeffisien korelasi antara dua variabel dengan menganggap variabel-variabel lainnya konstan (tidak mempengaruhi). Misal : Y’ = b0 + b1X1 + b2X2

Dimana Y = hasil penjualan, X1 = biaya iklan , X2 = pendapatan masyarakat

r1y.2 = koeffisien korelasi parsial antara biaya iklan dan hasil penjualan kalau pendapatannya konstan. Jadi pengaruh pendapatan terhadap hasil penjualan tidak diperhitungkan

r2y.1 = koeffisien korelasi parsial antara pendapatan dan hasil penjualan kalau

biaya iklan konstan. Jadi pengaruh iklan terhadap hasil penjualan tidak diperhitungkan

Page 99: Probabilitas Statistik

r12.y = koeffisien korelasi parsial antara biaya iklan dan pendapatan kalau

hasil penjualan konstan. Jadi pengaruh hasil penjualan terhadap pendapatan tidak diperhitungkan

Sebenarnya hubungan diatas terjadi secara timbale balik (reciprocal). Misalnya tetapi kalau kita ingin menggunakan garis regresi untuk melakukan biaya iklan mempengaruhi hasil penjualan, tetapi sebaliknya hasil penjualan juga mempengaruhi biaya iklan, sebab sebagian hasil penjualan itu disisihkan untuk biaya iklan. Akan peramalan, maka variable yang dianggap mempengaruhi naik turunnya Y tersebut dinamakan variable bebas (X1, X2 ….., Xk) atau variable yang

menjelaskan / menerangkan. Jika persamaan regresi linier berganda Y’ = b0 + b1X1 + b2X2 + ……

bkXk, ingin dipergunakan untuk meramalkan nilai Y, maka nilai-nilai X1, X2 …..,

Xk harus diketahui terlebih dahulu, yang mungkin sesuai dengan perencanaan

(rencana pembiayaan iklan, rencana pembelian pupuk, dan lainsebagainya) atau yang akan diramalkan. Misal Y’ = 3,4892 - 0,0899 (10) + 0,0637 (20) + 0,0187 (100) = 5,7342 TREND PARABOLA Garis trend pada dasarnya adalah garis regresi dimana variable bebas X merupakan variable waktu. Baik garis regresi maupun trend dapat berupa garis lurus (linear regression) maupun tidak lurus (non linier /trend). Persamaan garis trend parabola adalah sebagai berikut :

Y’ = a + bX + cX2 ( X = waktu )

Page 100: Probabilitas Statistik

Perhatikan bahwa bentuk persamaan seperti persamaan garis regresi linier berganda adalah Y’ = b0 + b1X1 + b2X2 , dimana b0 = a , b1 = b,

b2 = c , X1 = X dan X2 = X2 . Dengan demikian cara menghitung koeffisien

a, b, dan c sama seperti menghitung b0 , b1 dan b2, yaitu menggunakan

persamaan normal sebagai berikut :

an + b∑X1 + c∑X2 = ∑Y

a∑X1 + b∑X2 + c∑X3 = ∑ XY

a∑ X2 + b∑ X3 + c∑X4 = ∑ X2Y . . . . . (ada tiga persamaan dengan tiga variable yang tak diketahui nilainya, yaitu b0,

b1, b2 dan bk ).Persamaan tersebut dapat dinyatakan dalam persamaan

berikut :

n ∑X ∑X 2 a ∑ X

∑X1 ∑X2 ∑X 3 b = ∑ XY

∑ X2 ∑X 3 ∑X4 c ∑ X 2 Y A B C

AB = C ; B = A- 1 ; C A- 1 = kebalikan (invers) A Contoh : Hasil penjualan perusahaan PT. Sinar Surya selama 10 tahun terakhir adalah sebagai berikut : Tahun 1989 1990 1991 199

2 1993

1994

1995

1996 1997 1998 1999

Hasil Penjualan (jutaanRp)

23,2

31,4

39,8

50,2

62,9

76,0

92,0

105,7

122,8

131,7

151,1

Berapa besarnya ramalan hasil penjualan tahun 2000?

Page 101: Probabilitas Statistik

Penyelesaian : Karena jumlah tahunnya adalah ganjil, maka pilih tahun yang ada di tengah sebagai titik asal, X = 0. Perhitungannya adalah sebagai berikut : Tahun X Y X2 X3 X4 XY X2Y 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999

-5 -4 -3 -2 -1 0 1 2 3 4 5

23,2 31,4 39,8 50,2 62,9 76,0 92,0 105,7 122,8 131,7 151,1

25 16 9 4 1 0 1 4 9 16 25

-125 -64 -27 -8 -1 0 1 8 27 64 125

625 256 81 16 1 0 1 16 81 256 625

- 116,0 -125,6 -119,4 -100,4 -62,0 0

92,0 211,4 368,4 525,8 755,5

580,0 502,4 358,2 200,8 62,9 0

92,0 422,8 1.105,2 2.107,2 3,777,5

Jumlah ∑X = 0 ∑Y = 886,9

∑X2= 110

∑ X3=0 ∑ X4= 1.958

∑XY = 1.429,8

∑X2Y = 9.209,0

Persamaan normal : (1) 11a + 0 + 110c = 886,8 (2) 0 + 110b + 0 = 1.429,8 b = 1.492,8 / 110 = 13,0 (3) 110a + 0 + 1.958c = 9.209,0 Persamaan (1) kalikan 10 110a + 1.100c = 8.868 Persamaan (3) 110a + 1.958c = 9.209 ----------------------------------- - - 858c = - 341 c = - 341 / - 858 = 0,40

Page 102: Probabilitas Statistik

Nilai c masukkan ke (1) 11a + 110 (0,40) = 886,8 11a = 886,8 – 44 = 842,8 a = 76,62

Jadi persamaan trend parabola : Y’ = 76,62 + 13,00 X + 0,40X2 Pada tahun 2000, X = 6, ramalan hasil penjualan : Y’ = 76,62 + 13,00 (6) + 0,40 (36) = 169,02 (= Rp. 169,02 juta) TREND EXPONENSIAL (LOGARITMA) Kita telah mengenal trend garis lurus (linear trend) dengan bentuk persamaan Y’ = a + bX. Dalam hal ini b adalah rata-rata kenaikan Y persatuan waktu (per bulan, per tahun dsb). Ada beberapa jenis trend yang tidak linear tetapi dapat dibuat linear dengan jalan melakukan transformasi (perubahan bentuk). Misalnya, trend eksponensial

Y’ = abX dapat diubah menjadi trend semi log : log Y’ = log a + (log b) X ; log Y’ = Y’0 ; log a = a0 dan log b = b0.

Dengan demikian Y’0 = a0 + b0X, dimana koeffisien a0 dan b0 dapat dicari

berdasarkan persamaan normal. Trend eksponensial sering dipergunakan untuk meramalkan jumlah penduduk, pendapatan nasional, produksi, hasil penjualan, dan kejadian-kejadian lian yang perkembangan/pertumbuhannya secara geometris (berkembang dengan cepat sekali).

Page 103: Probabilitas Statistik

Contoh : Hasil penjualan PT. Sinar Surya selama 3 tahun menunjukkan perkembangan yang cepat sekali, seperti ditunjukkan pada table berikut :

Tahun 1997 1998 1999 Hasil penjualan (jutaan rupiah)

20 80 400

Dengan menggunakan trend eksponensial, ramalkan hasil penjualan tahun 2000 Penyelesaian : Persamaan normal : Tahun X Y log Y X log Y X2 1997 1998 1999

-1 0 1

20 80 400

1,30103 1,90309 1,60205

- 1,30103 0

2,60205

1 0 1

Jumlah ∑X = 0 ∑Y = 500 ∑Y0 =886,9 ∑XY0= 1,30102 ∑ X2= 2 Persamaan normal : (1) a0n + b0∑X = ∑Y’0

3 a0 = 5,80617

(2) a0∑X + b0∑X2 = ∑XY’0

2 b0 = 1,30102

Dari persamaan (1) : 3 a0 = 5,80617

a0 = log a = 1/3 (5,80617) = 1,93539

(Dari daftar log dapat diketahui bahwa log a = 1,93539) Dengan demikian, nilai a merupakan antilog 1,93539 = 86,2

Page 104: Probabilitas Statistik

Dari persamaan (2) : 2 b0 = 1,30102

b0 = log b = ½ (1,30102) = 0,65051,

jadi nilai b = 4,47 Garis trend : Y’0 = a0 + b0X

Y’0 = 1,93539 + 0,65051 X (dalam semi log).

Untuk tahun 2000, X = 2 , maka Y’0 = 1,93539 +

0,65051 (2) = 1,93539 + 1,30102 = 3,2364

Dari daftar log, angka yang dekat untuk dengan 3,2364 adalah 3,2380 , jadi Y = 1.730

Y’ = abx , maka Y’ = (86,2)(4,47)x (dalam eksponensial)

Untuk X = 2, maka Y’ = (86,2)(4,47)2 = (86,2)(19,9809) = 1.722,35 (hasilnya ada perbedaan sedikit karena pembulatan).

TREND EKSPONENSIAL YANG DIUBAH Seperti telah diuraikan sebelumnya, trend (regresi) eksponensial mempunyai

bentuk persamaan antara lain seperti Y’ = abx atau Y’ = aXb, yang masing-masing melalui proses transformasi menjadi bentuk linear dalam semilog dan sepenuhnya log, yaitu : Y’0 = a0 + b0X Y’0 = log Y’

(semi log) a0 = log a

b0 = log b

Y’0 = a0 + b0X Y’0 = log Y’

Page 105: Probabilitas Statistik

(log) a0 = log a

X = log X

Bentuk Y’ = abx dapat dikonversi dengan jalan menambah bilangan konstan k. Dengan demikian, persamaannya menjadi :

Y’ = k + abx Misalkan nilai k, a dan b masing-masing adalah 40, - 20 dan ½, sehingga

persamaan menjadi Y’ = 40 – 20 (1/2)x

Untuk X = -1 Y’ = 40 – 20 (1/2) -1 = 0

Untuk X = 0 Y’ = 40 – 20 (1/2) 0 = 20

Untuk X = 1 Y’ = 40 – 20 (1/2) 1 = 30

Untuk X = 2 Y’ = 40 – 20 (1/2) 2 = 35 Makin lama angka-angka diatas makin mendekati nilai k. Dengan perkataan lain, k merupakan nilai asymptote (selalu didekati, tetapi tidak pernah dicapai) Oleh karena bentuk trend (regresi) eksponensial yang diubah tidak dapat dijadikan bentuk linear dengan jalan transformasi, maka untuk memperkirakan atau menghitung a dan b tidak dapat menggunakan metode kuadrat terkecil. Jadi disini harus dipergunakan cara lain, yaitu dengan memilih beberapa titik. Caranya adalah sebagai berikut : Kita peroleh 3 titik, yaitu : X = 0, X = 2, X = 4

Y1 = k + ab0 = k + a

(1)

Y2 = k + ab2

(2)

Y3 = k + ab4

(3)

Page 106: Probabilitas Statistik

Dalam 3 persamaan diatas terdapat 3 bilangan konstan yang tidak diketahui, yaitu k, a dan b. Dengan melakukan pemecahan terhadap persamaan diatas, kita peroleh : k = Y1 - a

(1)

b2 = (Y3 – Y2 ) / (Y2 – Y1)

(2)

a = (Y2– Y1 ) / (b2 – 1)

(3) Apabila banyaknya tahun antara Y1,Y2 dan Y3 bukan 2 tahun, akan tetapi t

tahun, maka rumus untuk menghitung k, a dan b adalah sebagai berikut : k = Y1 - a

(1)

bt = (Y3 – Y2 ) / (Y2 – Y1)

(2)

a = (Y2– Y1 ) / (bt – 1)

(3) Contoh : Hasil penjualan perusahaan XYZ dalam jutaan rupiah selama 6 tahun adalah sebagai berikut : Tahun 1994 1995 1996 1997 1998 1999 Hasilpenjualan 3 7 9 21 33 70

Page 107: Probabilitas Statistik

Dengan menggunakan trend eksponensial yang diubah, berapa besarnya ramalan penjualan untuk tahun 2000 Penyelesaian : Dengan cara memilih beberapa titik, misalnya dipilih 3 titik yaitu tahun penjualan 1994 (X = 0), 1996 (X = 2) dan 1998 (X = 4) dimana masing-masing berjarak 2 tahun, maka dengan menggunakan rumus k, a dan b kita peroleh :

b2 = (Y3 – Y2 ) / (Y2 – Y1) = 33 – 9 / 9 – 3 = 4

b = 2

a = (Y2– Y1 ) / (b2 – 1) = 9 – 3 / 4 – 1 = 2

k = Y1 - a = 3 – 2 = 1

Y’ = k + abx = 1 + (2) x Nilai X yang digunakan untuk meramal penjualan tahun 2000 adalah Y’=1 + (2)

6 = 129 (Rp. 129 juta) TREND LOGISTIK Trend logistic biasanya digunakan untuk mewakili data yang menggambarkan perkembangan / pertumbuhan yang mula-mula cepat sekali, tetapi lambat laun agak lambat, dimana kecepatan pertumbuhannya makin berkurang sampai tercapai suatu titik jenuh (saturation point). Pertumbuhan semacam ini biasanya dialami oleh pertumbuhan suatu jenis industri, dan pertumbuhan biologis lainnya. Bentul trend logistik misalnya adalah sebagai berikut :

Y’ = k / 1 + 10a +bX , dimana k, a dan b adalah konstan, biasanya b < 0

Dalam hal ini kalau X mendekati tak terhingga,, maka 10a +bX mendekati 0, dan Y mendekati k , maka k merupakan asymptote, yaitu batas atas.

Page 108: Probabilitas Statistik

Contoh : Tahun X Y 1994 0 T1 (titik pertama)

Y0

1995 1 Y1

1996 2 T2 (titik kedua)

Y2

1997 3 Y3

1998 4 T3 (titik ketiga)

Y4

1999 5 Y5

Kita pilih titik T1, T2, T3 dengan nilai (X = 0 ; Y0), (X = 2; Y2) dan (X = 4;

Y4)

Setelah nilai X dimasukkan ke persamaan Y’ = k / 1 + 10a +bX , kita dapat mencari persamaan untuk T sebagai berikut :

T1, = k / 1 + 104 (1)

T2 = k / 1 + 10a + 2b (2)

T3 = k / 1 + 10a + 4b (3)

Dari 3 persamaan tersebut, dapat kita peroleh pemecahan yang memberikan nilai b, a dan k. Untuk mencari b, perhatikan bahwa :

Page 109: Probabilitas Statistik

1/ T3 - 1/ T2 10a + 4b - 10a + 2b

---------------------- = -------------------------- = 102b

1/ T2 - 1/ T1 10a + 2b - 10a

Jadi : 102b= log { T1 (T3 – T2)} / { T3 (T2 – T1)} , diambil log-nya

log 102b= log { T1 (T3 – T2)} / { T3 (T2 – T1)}

2b = log { T1 (T3 – T2)} / { T3 (T2 – T1)}

Untuk mencari a, perhatikan bahwa :

T1 1 + 10a + 2b

---- = -----------------

T2 1 + 10a

T1 (1 + 10a ) = T2 ( 1 + 10

a + 2b )

T1 + 10a T1 = T2 + 10

a + 2b T2

= T2 + 10a . 102b T

10a (102b T2 - T1) = T1 – T2

T1 – T2

10a = -----------------------

102b T2 - T1

Setelah diketahui log-nya, dicari nilai a sebagai berikut : T1 – T2

a = -----------------------

102b T2 - T1

Page 110: Probabilitas Statistik

Akhirnya k = T1(1 + 10a )

Pada umumnya kalau titik yang diambil berjarak t tahun, maka : (1) tb = log { T1 (T3 – T2)} / { T3 (T2 – T1)}

(2) a = log { T1 – T2} / {102b (T2 – T1)}

(3) k = T1 (1 + 10a )

Contoh : Perkembangan jumlah perusahaan industri pengolahan di suatu daerah ditunjukkan pada table berikut :

Tahun X Y Titik 1994 1995 1996 1997 1998 1999

0 1 2 3 4 5

2 4 6 9 9 10

T1 = (0,2)

T2 = (2,6)

T3 = (4,9)

Berapa ramalan banyaknya industri pengolahan pada tahun 2000 (X=6) ? Penyelesaian : Kita pilih 3 titik untuk T1, T2 , T3 , yaitu untuk x = 0, 2 dan 4 ; dan Y = 2, 6

dan 9 2b = log { T1 (T3 – T2)} / { T3 (T2 – T1)}

= log {2 (9-6)} / {9 (6 – 2)} = - 0,7782

Page 111: Probabilitas Statistik

b = - 0,3891

a = log { T1 – T2} / {102b (T2 – T1)}

= log (2 – 6) / {6 ( 1/6) – 2} = 0,6021

k = T1 (1 + 10a )

= 2 (1 + 4) = 10

Jadi trend logistic adalah : Y’ = 10 / {1 + 10 0,6021 – 0,3891X} X = 0, pada pertengahan tahun 1994 Untuk tahun 2000, X = 6 :

Y’ = 10 / {1 + 10 0,6021 –

0,3891(6)}

= 10 / {1 + 10 0,6021 –

2,3346} = 9,823 Jadi kalau dibulatkan, ramalan banyaknya perusahaan industri di daerah tersebut pada tahun 2000 = 10 buah. Kalau sudah mencapai titik jenuh, maka ini berarti bahwa nilai Y = 10 (mendekati 10) TREND GOMPERTZ Trend gompertz biasanya dipergunakan untuk meramalkan jumlah penduduk pada usia tertentu. Bentuknya sebagai berikut :

Page 112: Probabilitas Statistik

Y’ = kabX Dimana k, a dan b konstanta

Kalau diambil lognya, log Y’ = log k + (log a) (bX) Selanjutnya, kalau log Y’ = Y’0 ; log k = k0 dan log a = a0 , maka

bentuknya menjadi Y’0 = k0 + a0 bX , sama seperti

trend eksponensial yang diubah. Cara mencari koeffisiennya sama seperti kita menggunakan kurva 1. Contoh 1 : Dalam suatu penelitian yang dilakukan terhadap 10 rumah tangga yang dipilih secara acak, diperoleh data pengeluaran untuk pembelian barang-barang tahan lama per minggu (Y), pendapatan per minggu (X1), dan jumlah anggota rumah

tangga (X2) sebagai berikut :

Y (ratusan rupiah) 23 7 15 17 23 22 10 14 20 19 X1(ratusan rupiah) 10 2 4 6 8 7

4 6 7 6 X1(orang) 7 3 2 4 6

5 3 3 4 3 Kalau seandainya suatu rumah tangga mempunyai X1 dan X2, masing-masing

11 dan 8, berapa besarnya nilai Y, artinya berapa ratus rupiah rumah tangga yang bersangkutan akan mengeluarkan untuk pembelian barang-barang tahan lama? Penyelesaian : Langkah pertama adalah mengolah data diatas menjadi sebagai berikut :

Page 113: Probabilitas Statistik

Y X1 X2 X1Y X2Y X1X2 Y2 X12 X2

2

23

15 17 23 22 10 14 20 19

10 2 4 6 8 7 4 6 7 6

7 3 2 4 6 5 3 3 4 3

230

102 184 154

140 114

161 21 30 68 138 110 30 42 80 57

70 6 8 24 48 35 12 18 28 18

529 49 225 289 529 484 100 196 400 361

100 4 16 36 64 49 16 36 49 36

49 9 4 16 36 25 9 9 19

∑ Y = 170

∑X1 = 60

∑X2 = 40

∑X1Y

=1.122

∑X2Y=

737

∑X1X2=

267 ∑Y2 = 3.162

X12=

406

∑ X2

2 =182

b0n + b1∑X1 + b2∑X2 = ∑Y

maka : 10 b0 + 60 b1 + 40 b2 = 170

b0 ∑X1 + b1∑X12 + b2∑X1X2 = ∑ X1Y

maka : 60b0 + 40 b1 + 267 b2 = 1.122

b0∑X2 + b1∑X2 X1 + b2∑X22 = ∑ X2Y

maka : 40 b0 + 267 b1 + 182 b2 = 737

Dengan cara determinan, persamaan diatas menghasilkan b0 = 3,92, b1 = 2,50

dan b2 = - 0,48, sehingga persamaannya adalah sebagai berikut :

Y = 3,92 + 2,50 X1 - 0,48 X2 = 3,92 + 2,50 (11) - 0,48 (8) =

27,58 Jadi untuk suatu rumah tangga dengan pendapatan per minggu Rp. 11.000 dan jumlah anggota keluarga 8 orang, diperkirakan akan mengeluarkan Rp. 2.758 untuk pembelian barang-barang tahan lama.

Page 114: Probabilitas Statistik

Kita juga dapat menghitung hubungan antara perubahan pendapatan dan pengeluaran. Untuk tujuan ini, kita gunakan persamaan regresi linier berganda. Y’ = b0 + b1X1 + b2X2

(3) b0 = nilai Y’, kalau X1 = X2 = 0

b1 = besarnya kenaikan (penurunan) Y dalam satuan, kalau X1 naik

(turun) satu satuan, sedangkan X2 konstan

b2 = besarnya kenaikan (penurunan) Y dalam satuan, kalau X2 naik

(turun) satu satuan, sedangkan X1 konstan

Jadi, jika X1 naik Rp. 1.000 sementara X2 konstan, maka Y naik Rp. 250.

Demikian juga jika X2 bertambah satu orang, sedangkan X1 konstan, maka Y

turun (makin besar jumlah anggota keluarga, makin berkurang pengeluaran untuk pembelian barang-barang tahan lama). Nilai b1 dan b2 dinamakan

koeffisien regresi parsial (partial coefficient regression) dan sering ditulis sebagai b1 = b01.2 dan b2 = b02.1.

2. Contoh KORELASI BERGANDA : Dengan menggunakan contoh 1, hitunglah

KP dengan rumus 10 Penyelesaian : Y = 3,92 + 2,50 X1 - 0,48 X2

b1 = 2,50 , b1 = - 0,48 ,

∑X1i Yi= 1.122 , ∑X1i = 60 , ∑Yi = 170

∑x1i yi = = ∑X1i Yi - 1/n ∑X1i∑Yi = 1.122 – 1/10 (60)(170) = 102 ∑X2i Yi = 737 , ∑X2i = 40 , ∑Yi = 170

Page 115: Probabilitas Statistik

∑x2i yi = ∑X2i Yi - 1/n ∑X2i∑Yi = 737 - 1/10 (40) (170) =

57 ∑ Yi

2 = 3.162 , ∑Yi = 170

∑yi2= ∑ Yi2 - 1/n (∑Yi)2 = 3.162 - 1/10 (170)2 = 272

KP = R2y.12 = ( b1∑x1i yi + b2∑x2i yi ) / ∑ yi2

= {2,50 (102) – 0,48 (57)} / 272 = 0,8369 = 0,84 Jadi besarnya sumbangan pendapatan (X1) dan jumlah anggota rumah tangga

(X2) terhadap variasi atau naik turunnya pengeluaran untuk pembelian barang-

barang tahan lama (Y) adalah 84%, sedangkan sisanya sebesar 16% disebabkan oleh factor-faktor lainnya. Besarnya KKLB adalah sebagai berikut :

KKLB = Ry.12 = akar R2y.12

= akar 0,8369 = 0,90 3. Contoh KOEFFISIEN KORELASI PARSIAL : Dengan menggunakan contoh 1, hitunglah koeffisien korelasi parsial antara Y dan X1 , Y dan X2 serta X1 dan X2

Penyelesaian :

Dari contoh 2 : ∑x1i yi = 102 , ∑x2i yi = 57 , ∑yi2 = = 272

Dari contoh 1 : ∑X1i2 = ∑X12 = 406 , ∑X1i = ∑X1= 60

∑X2i2 = ∑X22 = 182 , ∑X2i = ∑X2 = 40 , ∑X1i X2i = 267

Page 116: Probabilitas Statistik

Kemudian dihitung : ∑x1i 2 = ∑X1i 2 - 1/n (∑X1i) 2 = 406 - 1/10 (60)2 =

46

∑x2i 2 = ∑X2i 2 - 1/n (∑X2i) 2 = 182 - 1/10 (40)2 =

22

∑x1ix2i = ∑X1iX2i - 1/n ∑x1i∑x2i = 267 - 1/10 (60)(40) =

27

r1y = ∑ x1iyi / ( ∑ x1i2 ∑y1i2 = 102 / 46 272 = 0,91

r2y = ∑ x2iyi / ( ∑ x2i2 ∑yi2 = 57 / 22 272 = 0,74

r12 = ∑ x1iy2i / ( ∑ x1i2 ∑x2i2 = 27 / 46 222 = 0,81

r1y.2 = r1y – r2 r12 / (1 - r2y2) (1 - ry2

2)

= { 0,91 - (0,74)(0,85)} / {1 – (0,74)2} {1 – (0,85)2} = 0,80

r2y.1 = r2y – r1y r12 / (1 - r1y2)( (1 - ry2

2)

= { 0,74 - (0,91)(0,85)} / {1 – (0,91)2} {1 – (0,85)2} = - 0,15

r12.y = r12 – r1y r2y/ (1 - r1y2) ( 1 - ry2

2)

= { 0,85 - (0,91)(0,74)} / {1 – (0,91)2} {1 – (0,74)2} = 0,63 (20) + 0,0187 (100) = 5,7342

Page 117: Probabilitas Statistik

4. Contoh TREND PARABOLA Hasil penjualan perusahaan PT. Sinar Surya selama 10 tahun terakhir adalah sebagai berikut : Tahun 1989 1990 1991 199

2 1993

1994

1995

1996 1997 1998 1999

Hasil Penjualan (jutaanRp)

23,2

31,4

39,8

50,2

62,9

76,0

92,0

105,7

122,8

131,7

151,1

Berapa besarnya ramalan hasil penjualan tahun 2000? Penyelesaian : Karena jumlah tahunnya adalah ganjil, maka pilih tahun yang ada di tengah sebagai titik asal, X = 0. Perhitungannya adalah sebagai berikut : Tahun X Y X2 X3 X4 XY X2Y 1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999

-5 -4 -3 -2 -1 0 1 2 3 4 5

23,2 31,4 39,8 50,2 62,9 76,0 92,0 105,7 122,8 131,7 151,1

25 16 9 4 1 0 1 4 9 16 25

-125 -64 -27 -8 -1 0 1 8 27 64 125

625 256 81 16 1 0 1 16 81 256 625

- 116,0 -125,6 -119,4 -100,4 -62,0 0

92,0 211,4 368,4 525,8 755,5

580,0 502,4 358,2 200,8 62,9 0

92,0 422,8 1.105,2 2.107,2 3,777,5

Jumlah ∑X = 0 ∑Y = 886,9

∑X2= 110

∑ X3=0 ∑ X4= 1.958

∑XY = 1.429,8

∑X2Y = 9.209,0

Page 118: Probabilitas Statistik

Persamaan normal : (1) 11a + 0 + 110c = 886,8 (2) 0 + 110b + 0 = 1.429,8 b = 1.492,8 / 110 = 13,0 (3) 110a + 0 + 1.958c = 9.209,0 Persamaan (1) kalikan 10 110a + 1.100c = 8.868 Persamaan (3) 110a + 1.958c = 9.209 ----------------------------------- - - 858c = - 341 c = - 341 / - 858 = 0,40 Nilai c masukkan ke (1) 11a + 110 (0,40) = 886,8 11a = 886,8 – 44 = 842,8 a = 76,62

Jadi persamaan trend parabola : Y’ = 76,62 + 13,00 X + 0,40X2 Pada tahun 2000, X = 6, ramalan hasil penjualan : Y’ = 76,62 + 13,00 (6) + 0,40 (36) = 169,02 (= Rp. 169,02 juta) 5. Contoh TREND EXPONENSIAL (LOGARITMA) Hasil penjualan PT. Sinar Surya selama 3 tahun menunjukkan perkembangan yang cepat sekali, seperti ditunjukkan pada table berikut :

Page 119: Probabilitas Statistik

Tahun 1997 1998 1999 Hasil penjualan (jutaan rupiah)

20 80 400

Dengan menggunakan trend eksponensial, ramalkan hasil penjualan tahun 2000 Penyelesaian : Tahun X Y log Y X log Y X2 1997 1998 1999

-1 0 1

20 80 400

1,30103 1,90309 1,60205

- 1,30103 0

2,60205

1 0 1

Jumlah ∑X = 0 ∑Y = 500 ∑Y0 =886,9 ∑XY0= 1,30102 ∑ X2= 2 Persamaan normal : (1) a0n + b0∑X = ∑Y’0

3 a0 = 5,80617

(2) a0∑X + b0∑X2 = ∑XY’0

2 b0 = 1,30102

Dari persamaan (1) : 3 a0 = 5,80617

a0 = log a = 1/3 (5,80617) = 1,93539

(Dari daftar log dapat diketahui bahwa log a = 1,93539) Dengan demikian, nilai a merupakan antilog 1,93539 = 86,2 Dari persamaan (2) : 2 b0 = 1,30102

Page 120: Probabilitas Statistik

b0 = log b = ½ (1,30102) = 0,65051,

jadi nilai b = 4,47 Garis trend : Y’0 = a0 + b0X

Y’0 = 1,93539 + 0,65051 X (dalam semi log).

Untuk tahun 2000, X = 2 , maka Y’0 = 1,93539 +

0,65051 (2) = 1,93539 + 1,30102 = 3,2364

Dari daftar log, angka yang dekat untuk dengan 3,2364 adalah 3,2380 , jadi Y = 1.730

Y’ = abx , maka Y’ = (86,2)(4,47)x (dalam eksponensial)

Untuk X = 2, maka Y’ = (86,2)(4,47)2 = (86,2)(19,9809) = 1.722,35 (hasilnya ada perbedaan sedikit karena pembulatan).

6. Contoh TREND EKSPONENSIAL YANG DIUBAH Hasil penjualan perusahaan XYZ dalam jutaan rupiah selama 6 tahun adalah sebagai berikut : Tahun 1994 1995 1996 1997 1998 1999 Hasilpenjualan 3 7 9 21 33 70 Dengan menggunakan trend eksponensial yang diubah, berapa besarnya ramalan penjualan untuk tahun 2000 Penyelesaian : Dengan cara memilih beberapa titik, misalnya dipilih 3 titik yaitu tahun penjualan 1994 (X = 0), 1996 (X = 2) dan 1998 (X = 4) dimana masing-masing berjarak 2 tahun, maka dengan menggunakan rumus k, a dan b kita peroleh :

Page 121: Probabilitas Statistik

b2 = (Y3 – Y2 ) / (Y2 – Y1) = 33 – 9 / 9 – 3 = 4

b = 2

a = (Y2– Y1 ) / (b2 – 1) = 9 – 3 / 4 – 1 = 2

k = Y1 - a = 3 – 2 = 1

Y’ = k + abx = 1 + (2) x Nilai X yang digunakan untuk meramal penjualan tahun 2000 adalah Y’=1 + (2)

6 = 129 (Rp. 129 juta) 7. Contoh TREND LOGISTIK Contoh : Tahun X Y 1994 0 T1 (titik pertama)

Y0

1995 1 Y1

1996 2 T2 (titik kedua)

Y2

1997 3 Y3

1998 4 T3 (titik ketiga)

Y4

1999 5

Page 122: Probabilitas Statistik

Y5

Kita pilih titik T1, T2, T3 dengan nilai (X = 0 ; Y0), (X = 2; Y2) dan (X = 4;

Y4)

Setelah nilai X dimasukkan ke persamaan Y’ = k / 1 + 10a +bX , kita dapat mencari persamaan untuk T sebagai berikut :

T1, = k / 1 + 104 (1)

T2 = k / 1 + 10a + 2b (2)

T3 = k / 1 + 10a + 4b (3)

Dari 3 persamaan tersebut, dapat kita peroleh pemecahan yang memberikan nilai b, a dan k. Untuk mencari b, perhatikan bahwa :

1/ T3 - 1/ T2 10a + 4b - 10a + 2b

---------------------- = -------------------------- = 102b

1/ T2 - 1/ T1 10a + 2b - 10a

Jadi : 102b= log { T1 (T3 – T2)} / { T3 (T2 – T1)} , diambil log-nya

log 102b= log { T1 (T3 – T2)} / { T3 (T2 – T1)}

2b = log { T1 (T3 – T2)} / { T3 (T2 – T1)}

Untuk mencari a, perhatikan bahwa :

T1 1 + 10a + 2b

---- = -----------------

T2 1 + 10a

Page 123: Probabilitas Statistik

T1 (1 + 10a ) = T2 ( 1 + 10

a + 2b )

T1 + 10a T1 = T2 + 10

a + 2b T2

= T2 + 10a . 102b T

10a (102b T2 - T1) = T1 – T2

T1 – T2

10a = -----------------------

102b T2 - T1

Setelah diketahui log-nya, dicari nilai a sebagai berikut : T1 – T2

a = -----------------------

102b T2 - T1

Akhirnya k = T1(1 + 10a )

Pada umumnya kalau titik yang diambil berjarak t tahun, maka : (1) tb = log { T1 (T3 – T2)} / { T3 (T2 – T1)}

(2) a = log { T1 – T2} / {102b (T2 – T1)}

(3) k = T1 (1 + 10a )

Contoh : Perkembangan jumlah perusahaan industri pengolahan di suatu daerah ditunjukkan pada table berikut :

Tahun X Y Titik 1994 0 2 T1 = (0,2)

Page 124: Probabilitas Statistik

1995 1996 1997 1998 1999

1 2 3 4 5

4 6 9 9 10

T2 = (2,6)

T3 = (4,9)

Berapa ramalan banyaknya industri pengolahan pada tahun 2000 (X=6) ? Penyelesaian : Kita pilih 3 titik untuk T1, T2 , T3 , yaitu untuk x = 0, 2 dan 4 ; dan Y = 2, 6

dan 9 2b = log { T1 (T3 – T2)} / { T3 (T2 – T1)}

= log {2 (9-6)} / {9 (6 – 2)} = - 0,7782 b = - 0,3891

a = log { T1 – T2} / {102b (T2 – T1)}

= log (2 – 6) / {6 ( 1/6) – 2} = 0,6021

k = T1 (1 + 10a )

= 2 (1 + 4) = 10

Jadi trend logistic adalah : Y’ = 10 / {1 + 10 0,6021 – 0,3891X} X = 0, pada pertengahan tahun 1994

Untuk tahun 2000, X = 6 : Y’ = 10 / {1 + 10 0,6021 – 0,3891(6)}

Page 125: Probabilitas Statistik

= 10 / {1 + 10 0,6021 –

2,3346 }= 9,823 Jadi kalau dibulatkan, ramalan banyaknya perusahaan industri di daerah tersebut pada tahun 2000 = 10 buah. Kalau sudah mencapai titik jenuh, maka ini berarti bahwa nilai Y = 10 (mendekati 10)

Page 126: Probabilitas Statistik

STATISTIK INDUSTRI MODUL 9

ANALISIS DATA BERKALA

Tujuan Belajar Setelah mempelajari bab ini, Anda diharapkan mampu :

Memahami arti dari data berkala Menyebutkan jenis-jenis gerakan / variasi data berkala Menggunakan berbagai metode untuk memperoleh trend

ARTI DAN PENTINGNYA ANALISIS DATA BERKALA Seperti telah dibahas dalam modul2, data berkala (time series) adalah data yang dikumpulkan dari waktu ke waktu untuk menggambarkan perkembangan suatu kegiatan (perkembanagan produksi, harga, hasil penjualan, jumlah personil,penduduk, jumlah kecelakaan dsb). Analisis data berkala memungkinkan kita untuk mengetahui perkembangan suatu atau beberapa kejadian serta hubungan / pengaruhnya terhadap kejadian lainnya. Misalnya, apakah kenaikan biaya iklan akan diikutui dengan kenaikan penerimaan hasil penjualan, apakah kenaikan jumlah penggunaan pupuk diikuti dengan kenaikan produksi padi, apakah kenaikan gaji diikuti oleh kenaikan prestasi kerja dsb. Dengan perkataan lain, apakah perubahan suatu kejadian akanmempengaruhi kejadian lainnya, dan kalau memang ada pengaruhnya, berapa besar pengaruh tersebut secara kuantitatif? Contohnya, kalau biaya iklan naik Rp. 100 juta, berapa kenaikan hasil penjualan yang dapat diharapkan; kalau gaji naik 1%, berapa % kenaikan prestasi kerja; kalau penggunaan pupuk naik 10 juta ton, berapa ton produksi padi dapat diharapkan, dsb. Hal ini sudah dibahas dalam analisis korelasi dan regresi pada modul 7 dan 8. Dengan data berkala,

Page 127: Probabilitas Statistik

kita juga dapat membuat ramalan-ramalan berdasarkan garis regresi atau garis trend. Olah karena data berkala itu terdiri dari beberapa komponen, maka dengan analisis data berkala kita bisa mengetahui masing-masing komponenn, bahkan dapat menghilangkan satu atau beberapa komponen kalau kita ingin menyelidiki komponen tersebut secara mendalam tanpa kehadiran komponen lainnya. Data berkala, karena adanya pengaruh dari komponen-komponen tersebut, selalu mengalami perubahan sehingga apabila dibuat grafiknya akan menunjukkan suatu fluktuasi (fluctuation), yaitu gerakan naik-turun. KLASIFIKASI GERAKAN / VARIASI / DATA BERKALA Gerakan/variasi data berkala terdiri dari empat macam atau empat komponen sebagai berikut :

1. Gerakan trend jangka panjang (long term movement or secular trend) , yaitu suatu gerakan yang menunjukkan arah perkembangan secara umum (kecenderungan menaik , menurun). Cara menarik garis trend akan diterangkan pada bagian lain. Garis trend sangat berguna untuk membuat ramalan (forecasting) yang sangat diperlukan bagi perencanaan.

2. Gerakan / variasi siklis ( cyclical movement or variations), adalah

gerakan / variasi jangka panjan disekitar garis trend (berlaku untuk data tahunan). Gerakan siklis ini bias terulang setelah jangka waktu tertentu (setiap 3 tahun, 5 tahun, atau lebih) dan bias juga terulang dalam jangka waktu yang sama. Business cycles (konjungtur) adalah suatu contoh gerakan siklis yang menunjukkan waktu terjadinya kemakmuran (prosoeriry), kemunduran (recession), depresi (depression), dan pemulihan (recovery).

Page 128: Probabilitas Statistik

3. Gerakan / variasi musiman (seasonal movement / variation),

adalah gerakan yang mempunyai pola tetap dari waktu ke waktu, misalnya kenaikan harga pohon cemara menjelang hari natal,meningkatnya harga-harga bahan makanan dan pakaian menjelang hari raya idul fitri, menurunnya harga beras pada waktu panen dsb. Walaupun pada umumnya gerakan musiman terjadi pada data bulanan yang dikumpulkan dari tahun ke tahun, namun juga berlaku bagi data harian, mingguan, atausatuan waktu yang lebih kecil lagi.

4. Gerakan / variasi yang tidak teratur (irregular or random

movements), adalah gerakan / variasi yang sifatnya sporadic, misalnya naik-turunnya produksi akibat banjir yang datangnya tidak teratur.

Analisis data berkala pada umumnya terdiri dari uraian (description) secara matematis tentang komponen-komponen yang menyebabkan gerakan-gerakan atau variasi-variasi yang tercermin dalam fluktuasi. Apabila gerakan trend, siklis, musiman, dan acak masing-masing diberi symbol T,C,S dan I, maka data berkala Y merupakan hasil kali dari 4 komponen tersebut, yaitu : Y = T x C x S x I Ada juga ahli statistic yang menganggap bahwa data berkala merupakan penjumlahan dari 4 komponen tersebut, yaitu : Y = T + C + S + I

Page 129: Probabilitas Statistik

Dalam modul 9 ini akan dibahas garis trend linier dan metode untuk memperolehnya. MENENTUKAN TREND Terdapat beberapa metode yang umum digunakan untuk menggambarkan garis trend. Beberapa diantaranya adalah :

1. metode tangan bebas 2. metode rata – rata 3. metode rata – rata bergerak 4. metode kuadrat terkecil

1. Metode Tangan Bebas Langkah – langkah untuk menentukan garis trend dengan menggunakan metode tangan bebas (free hand methode) adalah sebagai berikut : a. Buat sumbu tegak Y dan sumbu mendatar X b. Buat scatter diagram, yaitu kumpulan titik-titik koordinat (X,Y), X =

variable waktu c. Dengan jalan observasi atau pengamatan langsung terhadap bentuk

scatter diagram, tariklah garis yang mewakili atau paling mendekati semua titik koordinat yang membentuk diagram pencar tersebut. Misalnya Y = data berkala, X = waktu (tahun, bulan dsb)

Cara menarik garis trend dengan tangan bebas merupakan cara yang paling mudah, tetapi sifatnya sangat subyektif, maksudnya kalau ada lebih dari satu orang diminta untuk menarik garis trend dengan cara ini, akan diperoleh garis trend lebih dari satu. Sebab masing-masing

Page 130: Probabilitas Statistik

mempunyai pilihan sendiri sesuai dengan anggapannya, garis mana yang mewakil diagram pencar tersebut.

Contoh 1 : Tahun

1992 1993 1994 1995 1996 1997 1998 1999

T 0 1 2 3 4 5 6 7 PDB (Y)

10.164,9

11.169,2

12.054,6

12.325,4

12.842,2

13.511,5

14.180,8

14.850,1

Apabila data tersebut dibuat diagram pencarnya, maka akan terlihat bahwa titik-titik koordinat menurut data tersebut ada yang terletak dibawah atau diatas garis trend, dan ada juga yang terletak tepat pada garis trend. Ramalan dengan garis trend lebih realistis karena sudah memperhitungkan kemampuan masa lampau. Dengan metode tangan bebas, diperoleh nilai ramalan Produk Domestik Bruto pada tahun 2000 kurang lebih sebesar Rp. 15.515,5 milyar (dibaca pada skala).

Misalkan selanjutnya bahwa garis trend tersebut melewati titik koordinat untuk tahun 1992 dan 1999. Kalau tahun 1992 dan 1999, nilai X sama dengan 0 dan 7, maka kita bias mengatakan bahwa garis trend yang lurus mempunyai persamaan Y = a + bX. Seperti telah dijelaskan sebelumnya bahwa metode tangan bebas lebih bersifat subyektif, maka untuk memperoleh garis trend yang lebih obyektif adalah dengan duia tititk koordinat yaitu titik asal dan titik akhir.

Page 131: Probabilitas Statistik

Dalam contoh ini, kita anggap tahun 1992 sebagai tititk asal (X = 0), 1993 titik pertama (X = 1), dan seterusnya. Kalau 1993 sebagai titik asal, maka untuk tahun 1992 (X = -1), 1993 (X = 0), dan seterusnya. Kalau 1992 sebagai titik asal dan 1999 titik akhir, maka kita peroleh dua tititk koordinat [ (0), (10.164,9)] dan [ (7), (14.850,1)]. Kalau nilai-nilai ini kita masukkan ke persamaan garis lurus Y = a + bX, maka kita peroleh persamaan berikut : Untuk [ (0), (10.164,9)] 10.164,9 = a + b (1) a = 10.164,9 Untuk [ (7), (14.850,1)] 14.850,1 = a + b (7) 14.850,1 = 10.164,9 + 7b 7b = 14.850,1 – 10.164,9 = 4.685,2 b = 669,3 jadi Y = 10.164,9 + 669,3 X (X = variable waktu) b = 669,3 berarti bahwa setiap tahun secara rata-rata terjadi

kenaikan PDB sebesar 669,3 milyar. Untuk meramalkan tahun 2000 dan 2001, maka nilai X adalah 8 dan 9, kemudian dimasukkan dalam persamaan tersebut. Jadi ramalan PDB tahun 2000 dan 2001 adalah :

Page 132: Probabilitas Statistik

PDB2000 (X = 8) = 10.164,9 + 669,3 ( 8 ) = Rp. 15.519,3

milyar PDB2001 (X = 9) = 10.164,9 + 669,3 ( 9 ) = Rp. 16.188,6

milyar Cara ini lebih obyektif karena didasarkan atas perumusan matematik dan bukan didasarkan atas penilaian individu yang sering dipengaruhi oleh subyektifitas pribadi. 2. Metode Rata-rata Semi

Metode rata-rata semi memerlukan langkah-langkah sebagai berikut : a. Data dikelompokkan menjadi 2, masing-masing kelompok harus

mempunyai jumlah data yang sama. Kalau datanya 10, menjadi 2 kelompok, masing-masing 5 8, menjadi 2 kelompok, masing-

masing 4 6, menjadi 2 kelompok, masing-

masing 3 Kalau datanya ganjil, hilangkan 1, yaitu yang ditengah. Contoh : 9 data, masing-masing 4 7 data, masing-masing 3 b. Masing-masing kelompok dicari rata-ratanya, misal Y1 bar dan Y2

bar, yang merupakan ordinatnya.

Page 133: Probabilitas Statistik

c. Titik absis harus dipilih dari variable X yang berada di tengah masing-masing kelompok ( tahun atau waktu yang di tengah )

Data 6 tahun : X1, X2, X3, X4, X5, X6

0 1 2 3 4 5 I II

1 dan 4 merupakan titik absis (artinya tahun ke 2 dan 5 sebagai absis)

Data 8 tahun : X1, X2, X3, X4, X5, X6, X7, X8

0 1 2 3 4 5 6 7

Kelompok I : 0 1 2

3 Kelompok II : 4 5 6

7

1,5 dan 5,5 merupakan titik absis (absis pertama antara tahun ke 2 dan 3, absis kedua antara tahun ke 6 dan 7)

Data 7 tahun : X1, X2, X3, X4, X5, X6, X7

0 1 2 3 4 5 6 ----- data ke 3 dihapus

Kelompok I : 0 1 2 Kelompok II : 4 5 6

Page 134: Probabilitas Statistik

1 dan 5 merupakan titik absis (tahun ke 2 dan 6

sebagai absis 0 d. Titik koordinat terdiri dari b) dan c) dimasukkan kedalam

persamaan Y = a + bX, untuk menghitung a dan b; Y1 bar dan

Y2 bar dipergunakan sebagai nilai Y.

Contoh 2 : Berdasarkan data pada contoh 1, buatlah trend dengan metode rata-rata semi.

Tahun X Y Rata-rata 1992 0 10.164,9 1993 1 11.169,2 Rata-rata 1992 – 1995 = Y1 bar

1994 2 12.054,6 = 45.714,1 / 4 = 11.428,5 1995 3 12.325,4 1996 4 12.842,2 1997 5 13.511,5 Rata-rata 1996 – 1999 = Y1 bar 1998 6 14.180,8 = 45.714,1 / 4 = 11.428,5 1999 7 14.850,1

Kita peroleh 2 titik koordinat { (1,5), (11.428,5)] dan [ (5,5) , (13.846,2) ]. Kemudian nilai – nilai ini dimasukkan ke dalam persamaan Y = a + bX sebagai berikut :

Page 135: Probabilitas Statistik

11.428,5 = a + b (1,5) ……(1) 13.846,2 = a + b (5,5) ……(2) Dari (1) -- a = 11.428,5 - 1,5 b -- dimasukkan ke (2) 13.486,2 = 11.428,5 - 1,5 b + 5,5 b = 11.428,5 + 4 b 4 b = 2.417,7 --- b = 604,42 a = 11.428,5 - 1,5 (604,42) = 10.521,87 Y = 10.521,87 + 604,42 X (X = variable waktu) Dari persamaan diatas, ramalan PDB tahun 2000 dan 2001 sebagai berikut :

PDB2000 (X = 8) = 10.521,87 + 604,42 (8) = Rp. 15.357,23

milyar PDB2001 (X = 9) = 10.521,87 + 604,42 (9) = Rp. 15.961,65

milyar Dengan metode rata-rata semi ini tidak diperlukan ganbar (grafik). Kita dapat nilai ramalan langsung dari persamaan. Sedangkan dengan metode tangan bebas, hasil ramalan harus dibaca dari skala pada sumbu Y.

Page 136: Probabilitas Statistik

Dari cintoh 2, rata-rata kenaikan per tahu PDB (=b) adalah 604,42 milyar, yang ternyata lebih rendah daripada dengan cara menghubungkan titik terendah dan tertinggi

3. Metode Rata-rata Bergerak Kalau kita mempunyai data berkala sebanyak n : Y1, Y2,......., Yi,……,

Yn, maka rata-rata bergerak (moving average) n waktu (tahun, bulan,

minggu,hari) merupakan urutan rata-rata hitung sebagai berikut :

Y1+ Y2+.......+ Yn, Y2 + Y3 +.......+ Yn + 1, Y2 + Y3 +.......+

Yn+2

n n n

dan seterusnya. Setiap rata-rata hitung diatas disebut total bergerak (moving total), yang berguna untuk mengurangi variasi dari data asli. Didalam data berkala, rata-rata bergerak sering dipergunakan untuk memuluskan fluktuasi yang terjadi dalam data tersebut. Proses pemulusan ini disebut pemulusan data berkala. Apabila rata-rata bergerak dibau dari data tahunan atau bulanan sebanyak n waktu, maka rata-rata bergerak disebut rata-rata bergerak tahunan atau bulanan dengan orde n (moving average of order n) Contoh 1 : Berikut disajikan data penjualan hipotetis PT. Malvinas

Tahun Penjualan Tahun Penjualan

Page 137: Probabilitas Statistik

(jutaan rupiah)

(jutaan rupiah)

1989 1990 1991 1992 1993 1994

50,0 36,5 43,0 44,5 38,9 38,1

1995 1996 1997 1998 1999

32,6 38,7 41,7 41,1 33,8

Berdasarkan data diatas, buatlah rata-rata bergerak 4 tahun dan 5 tahun, kemudian gambarkan kurva dari data asli, rata-rata bergerak 4 tahun dan 5 tahun dalam satu gambar. Penyelesaian : Perhitungan rata-rata bergerak 4 tahun dan 5 tahun PT. Malvinas

Tahun Y (= jutaan rupiah)

Rata-rata bergerak 4 tahun

Rata-rata bergerak 5 tahun

1989 1990 1991 1992 1993 1994 1995 1996 1997 1998 1999

50,0 36,5 43,0 44,5 38,9 38,1 32,6 38,7 41,7 41,1 33,8

43,5 40,7 41,1 38,5 37,1 37,8 38,5 38,8

42,6 40,2 39,4 39,6 38,0 38,4 37,6

Page 138: Probabilitas Statistik

Apabila data asli digambarkan bersama-sama dengan rata-rata bergerak, maka akan terlihat bahwa makin besar derajat rata-rata bergerak, maka bentukkurva semakin mulus. Maksudnya, makin berkurang fluktuasinya maka tampak dengan jelas adanya trend (pada contoh ini trend menurun). Dengan menggunakan rata-rata bergerak untuk mencari trend, maka kita kehilangan beberapa data dibandingkan dengan data asli. Artinya, banyaknya rata-rata bergerak menjadi tidak sama dengan banyaknya data asli. Dari contoh ini, jumlah asli data yang tadinya 11 berkurang menjadi 8 pada rata-rata bergerak 4 tahun, kemudian berkurang menjadi 7 pada rata-rata bergerak 5 tahun. Pada umumnya, jumlah data asli berkurangs sebanyak (n-1), n = derajat rata-rata bergerak, yaitu banyaknya data (dengan demikian banyaknya waktu) untuk menghitung rata-rata bergerak.

3. Metode Kuadrat Terkecil

Seperti kita ketahui bahwa garis trend linear dapat ditulis sebagai persamaan garis lurus : Y = a + bX Dimana : Y’ = data berkala (time series data) X = waktu (hari, minggu, bulan, tahun) a & b = bilangan konstan Jadi untuk mencari garis trend berarti mencari nilai a dan b. Apabila a dan b sudah diketahui, maka garis trend tersebut dapat dipergunakan untuk meramalkan Y.

Page 139: Probabilitas Statistik

Untuk mencari persamaan trend garis lurus dengan metode kuadrat terkecil, dapat dilakukan dengan beberapa cara. Disini diberikan 2 cara. Cara 1 : Pada cara 1, untuk mengadakan perhitungan diperlukan nilai tertentu pada variable waktu (X) sedemikian rupa , sehingga jumlah nilai variable waktu adalah nol . Xi = 0

Misal : untuk n = 3, maka X1, X2 , X3

- 1 0 1 untuk n = 4, maka X1, X2 , X3 X4

- 3 -1 1 3 Pada umumnya yang diberi nilai 0 adalah variable waktu yang letaknya di tengah. a. Untuk n ganjil ---- n = 2k + 1 2k = n - 1 k = (n – 1) / 2

Xk + 1 = 0

n = 3 ---- k = (3 – 1) / 2 = 2/2 = 1

Page 140: Probabilitas Statistik

Xk

+ 1 = X1 + 1 = X2 = 0

n = 5 ---- k = (5 – 1) / 2 = 4/2 = 2 Xk

+ 1 = X2 + 1 = X3 = 0

n = 7 ---- k = (7 – 1) / 2 = 6/2 = 3 Xk

+ 1 = X3 + 1 = X4 = 0

a. Untuk n genap ---- n = 2k k = n / 2

X k + (k + 1) = 0 , artinya titik 0 terletak antara X k dan X k + 1 ( seolah-olah disisipkan dan tak

perlu dituliskan untuk n genap) X [{ k + (k + 1)} / 2 ] = X ( 5/2) = X2,5

Yang dibagi 2 adalah {k + (k + 1)} n = 4 ---- k = 4/2 = 2 -- X2,5 = 0

Page 141: Probabilitas Statistik

n = 6 ---- k = 6/2 = 3 -- X3,5 = 0

n = 8 ---- k = 8/2 = 4 -- X4,5 = 0 Jarak antara 2 waktu diberi nilai dua satuan. Diatas 0 diberi tanda +, dibawahnya tanda – (0, 1, 3, 5, 7, 9……dan ……, -9, -7, -5, -3, -1, 0) atau …., -7, -5, -1, 1, 3, 5, 7,…… Seperti telah disebutkan sebelumnya, mencari garis trend juga berarti mencari nilai a dan b dari persamaan garis trend Y’ = a + bX. Kalau kita perhatikan, garis trend yang dimaksudkan untuk mewakili suatu diagram pencar. Tidak semua titik koordinat yang membentuk diagram pencar tersebut terletak tepat pada garis trend, ada yang di atas dan ada juga yang di bawahnya. Metode kuadrat terkecil (least square methode) untuk mencari garis trend dimaksudkan suatu perkiraan atau taksiran mengenai nilai a dan b dari persamaan Y’ = a + bX yang didasarkan atas data hasil observasi sedemikian rupa, sehingga dihasilkan jumlah kesalahan kuadrat terkecil (minimum). Tanda aksen sering ditiadakan. Jadi persamaan garis trend, asal tidak membingungkan, dapat ditulis Y = a + bX. Perlu diperhatikan bahwa sebetulnya ada dua macam nilai Y, yaitu berdasarkan pencatatan dan trend.

a = Ybar – bXbar

dimana : Ybar = 1/n sigma∑ Yi = rata-rata Y

Xbar = 1/n sigma∑ Xi = rata-rata X

Page 142: Probabilitas Statistik

n∑ xi Yi - ∑xi ∑Yi

b = ----------------------

n∑Xi2 – ∑ (Xi)2

Rumus ini sama dengan rumus garis regresi linear yang sudah dibahas dalam modul 4, mengenai teknik ramalan. Untuk garis trend lurus, rumusnya menjadi sederhana, karena : ∑Xi = 0 dan Xbar = 1/n∑Xi

Dengan demikian untuk garis trend yang lurus, rumusnya adalah : a = Ybar ∑ Xi Yi

b = ------------

∑ Xi2

Y’ = a + bX (persamaan garis trend linear) dimana X merupakan variable waktu. Contoh : Tahun X Y XY X2 1992 1993 1994 1995 1996 1997

-7 -5 -3 -1 1 3

10.164,9 11.169,2 12.054,6 12.325,4 12.842,2 13.511,5

-71.154,3 -55.846,0 -36.163,8 -12.325,4 12.842,2 40.534,5

49 25 9 1 1 9

Page 143: Probabilitas Statistik

1998 1999

5 7

14.180,8 14.850,1

70.904,0 103.950,7

25 49

∑Y = 101.098,7 Ybar =

12.637,34

∑XY = 52.741,9

∑X2 = 168

a = Ybar = 12.637,3

∑ Xi Yi 52.741,9 b = ------------ = ------------- = 313,94

∑ Xi2

168 Persamaan trend linier : Y = 12.637,34 + 313,94 Y tahun 2000 (X = 9) --- Y = 12.637,34 + 313,94 (9) = 15.426,8 Jadi ramalan PDB tahun 2000 = 15.426,8 milyar Cara 2 : Cara lain untuk menentukan garis trend lurus adalah dengan menentukan periode awal pada variable waktu X = 1, jadi tidak perlu membuat ∑ Xi

= 0. Jika data pengamatan terdiri dari delapan nilai dari tahun 1992 sampai dengan 1999, maka nilai X pada 1992 adalah 1 dan 1999 adalah 9.

Page 144: Probabilitas Statistik

Garis trend lurus dengan cara ini diperoleh dengan rumus sebagai berikut : a = Ybar - Xbar

n∑ Xi Yi - ∑Xi ∑Yi

b = -------------------------

n∑Xi2 – ∑ (Xi)2

Contoh :

Dari data pada contoh sebelumnya, buatlah persamaan garis trend dengan menggunakan metode kuadrat terkecil (gunakan cara 2)

Tahun X Y XY X2 1992 1993 1994 1995 1996 1997 1998 1999

1 2 3 4 5 6 7 8

10.164,9 11.169,2 12.054,6 12.325,4 12.842,2 13.511,5 14.180,8 14.850,1

10.169,4 22.338,4 36.163,8 49.301,6 64.211,0 81.069,0 99.265,6 118.800,8

1 4 9 16 25 36 49 64

36 101.098,7

481.315,1 204

X bar = 36 / 8 = 4,5 Y bar = 101.098,7 / 8 = 12.637,34

n ∑ Xi Yi - ∑ Xi ∑Yi 3.850.520,8 – 3.639.553,2

b = --------------------------- = -----------------------------------------

Page 145: Probabilitas Statistik

n ∑ Xi2 - ∑ (Xi) 2 1.632 - 1.296 = 210.967,6 / 336 = 627,879 atau 627,88 a = Ybar - bXbar = 12.637,34 - 627,88 (4,5) = 9.811,88 Persamaan garis trend linear : Y = 9.811,88 + 627,88X Y pada tahun 2000 (X = 9) --- Y = 9.811,88 + 627,88 (9) = 15.462,8 Jadi ramalan PDB tahun 2000 = 15.462,8 milyar. Nilai ramalan untuk tahun 2000 dengan cara pertama maupun kedua menghasilkan nilai yang sama, walaupun persamaannya berbeda. Jadi yang perlu diperhatikan adalah jika anda mempunyai suatu persamaan trend, cara mana yang anda gunakan perlu dijelaskan atau diketahui karena hal ini menyangkut masalah penggunaan model / persamaan untuk peramalan nilai-nilai mendatang. Sebagai contoh, untuk meramal nilai pada tahun 2001, maka kalau menggunakan cara pertama anda memasukkan nilai X = 11, sedangkan kalau menggunakan cara kedua anda harus memasukkan nilai X = 10. Hal ini akan mendapatkan nilai peramalan yang sama, yaitu 16.090,68 untuk tahun 2001

Page 146: Probabilitas Statistik
Page 147: Probabilitas Statistik

STATISTIK INDUSTRI MODUL 10 INDEKS MUSIMAN DAN GERAKAN SIKLIS

Tujuan Belajar Setelah mempelajari bab ini, Anda diharapkan :

Mengenali komponen data berkala Membedakan masing-masing komponen data berkala Menghilangkan pengaruh musiman

GERAKAN MUSIMAN, PENYESUAIAN DATA BULANAN, DAN INDEKS MUSIMAN Dalam modul 9 telah dibahas salah satu komponen data berkala yaitu trend. Didalam modul ini akan dibahas komponen lainnya seperti gerakan musiman dan gerakan siklis. Gerakan musiman (seasonal movement or variation) merupakan gerakan yang tertentu dalam arti naik turunya terjadi pada waktu-waktu yang sama atau sangat berdekatan. Disebut gerakan musiman oleh karena terjadinya bertepatan dengan pergantian musiman dalam satu tahun (musim panen padi harga beras turun dan pada waktu menjelang panen harga masih tinggi, juga harga buah-buahan seperti rambutan, duku dsb, akan dipengaruhi oleh musim panen. Gerakan lainnya yang terjadi secara teratur dalam waktu yang sangat singkat juga disebut gerakan musiman, misalnya :

Naik turunnya temperature seorang pasien tiap jam dari hari ke hari Naik turunya produksi karet tiap bulan dari tahun ke tahun Naik turunnya jumlah orang keluar negeri pada waktu muism haji

Penegetahuan tentang gerakan musiman ini sangat penting sebagai dasar penentuan langkah-langkah kebijakan dalam rangka mencegah hal-hal yang diinginkan. Untuk menstabilkan harga beras, pemerintah melalui Bulog akan membeli beras pada waktu panen, disimpan di gudang-gudang, kemudian akan dijual lagi kepada masyarakat pada waktu menjelang panen (jauh sebelum panen), agar harga tidak melonjak tinggi. Contoh lainnya : pemilik bioskop menyediakan karcis lebih banyak pada malam minggu, khususnya pada bulan muda, pemilik restoran menyediakan makanan lebih banyak pada malam minggu, pemerintah mengimpor beras menjelang panen dsb). Oleh karena jumlah hari pada setiap bulan tidak sama, maka perlu diadakan penyesuaian data. Pennyesuaian data mempunyai alasan-alasan berikut :

Page 148: Probabilitas Statistik

Jumlah hari tiap bulan tidak sama Jumlah hari kerja tidak sama Jumlah jam kerja tidak sama

Jadi kalau produksi / penjualan suatu barang pada bulan Februari lebih kecil daripada bulan lainnya, itu tidak berarti bahwa ada kemerosotan pada bulan itu, tetapi karena harinya hanya ada 28 hari. Jumlah hari yang terdapat dalam setiap tahun adalah berbeda dari jumlah rata-rata hari dalam setiap bulan. Untuk menyesuaikan data bulanan dengan perbedaan jumlah hari itu, maka data bulanan dari hasil observasi harus dikalikan dengan suatu factor pengali yang diperoleh dengan jalan mengalikan jumlah hari yang terdapat di dalam bulan itu dengan jumlah rata-rata hari dalam setiap bulan. Jika satu tahun = 365 hari, maka jumlah hari per bulan secara rata-rata adalah 365/12 = 30,4167 hari. Perhatikan table 1 berikut ini :

Bulan Jumlah hari Kolom (2) dibagi 365/12

Factor Pengali = 100 x kebalikan kolom (3)

(1) (2) (3) (4) Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember

31 28 31 30 31 30 31 31 30 31 30 31

1,01918 0,92055 1,01918 0,98630 1,01918 0,98630 1,01918 1,01918 0,98630 1,01918 0,98630 1,01918

98,11809 ( = 98,118) 108,63071 ( = 108,631) 98,11809 ( = 98,118 ) 101,38902 ( = 101,389) 98,11809 ( = 98,118 ) 101,38902 ( = 101,389) 98,11809 ( = 98,118 ) 98,11809 ( = 98,118 ) 101,38902 ( = 101,389) 98,11809 ( = 98,118 ) 101,38902 ( = 101,389) 98,11809 ( = 98,118 )

365 12,00000 1.200,000

Kolom (3) dari table diatas menunjukkan hasil bagi dari jumlah hari setiap bulan dengan 30,4167. Penyimpangan hasil bagi itu dari 1 menunjukkan (penyimpangan dalam bentuk

Page 149: Probabilitas Statistik

perbandingan) data yang diamati dengan data yang seharusnya, seandainya setiap bulan mempunyai jumlah hari yang sama. Untuk menyesuaikan data bulanan dengan jumlah kebalikan dari angka yang terdapat dalam kolom (3) tabel tersebut. Factor pengali yang dimaksud dapat dilihat dalam kolom (4). Untuk keperluan penyesuaian , maka data berkala dari hasil observasi seyogyanya dikalikan dengan factor pengali dari kolom (4). Walaupun jumlah hari dalam satu bulan itu sama, namun jumlah hari kerja belum tentu sama. Kalau analisis menghendaki penyesuaian yang lebih teliti, maka angka darikolom (2) diganti dengan jumlah hari kerja tiap bulan. Selanjutnya juga perlu diperhatikan, seandainya jumlah hari dan jumlah hari kerja sama tetapi jumlah jam kerja tidak sama dan perlu penyesuaian terhadap jumlah jam kerja, maka kolom (2) dapat diganti dengan jumlah jam kerja tiap bulan. Jadi factor pengali dalam kolom (4) dapat untuk penyesuaian jumlah hari, jumlah hari kerja, dan jumlah jam kerja, tergantung pada persoalan dan tujuan analisis. Untuk keperluan analisis, seringkali data berkala dinyatakan dalam bentuk angka indeks. Apabila kita ingin menunjukkan ada tidaknya gerakan musiman, perlu dibuat indeks musiman (seasonal index). Pada modul 9 telah dibahas bahwa data berkala yang dinyatakan sebagai variable Y terdiri dari 4 komponen, yaitu : Y = T x C x S x I Kalau pengaruh dari trend (T), siklis (C) dan irregular (I) dihilangkan, tinggallah satu komponen S, yaitu komponen musiman. Apabila S dinyatakan dalam angka indeks, maka kita peroleh indeks musiman. Jadi angka indeks musiman merupakan angka yang menunjukkan nilai relative dari variable Y yang merupakan data berkala selama seluruh bulan dalam satu tahun (dapat lebih dari 1 tahun). Contoh : Diketahui hasil penjualan suatu jenis barang selama bulan Januari, Februari, Maret, April,……, masing-masing sebesar 75%, 125%, 110%, 150%,….dari rata-rata hasil penjualan untuk seluruh tahun. Angka-angka tersebut merupakan angka indeks musiman. Rata-rata angka indeks musiman untuk seluruh tahun seharusnya sebesar 100%, dan

Page 150: Probabilitas Statistik

jumlah seluruh angka indeks musiman harus 1.200% (tanda % sering dihilangkan / tidak ditulis). Beberapa metode untuk menghitung angka indeks musiman, antara lain :

1. Metode rata-rata sederhana (simple average method) 2. Metode relative bersambung (link relative method) 3. Metode rasio terhadap trend (ratio to trend method) 4. Metode rasio tarhadap rata-rata bergerak (ratio to moving average method)

1. Metode Rata-rata Sederhana

Perhatikan table 2 : Produksi Gas Indonesia 1995 - 1998 (000 MCF) Bulan 1995 1996 1997 1998 Jumlah (2)

s/d (5) Rata-rata (6) : 4

(1) (2) (3) (4) (5) (6) (7) Januari Februari Maret April Mei Juni Juli Agustus Se[ptember Oktober November Desember

259.982 244.993 268.423 236.293 251.439 244.756 246.631 254.749 228.903 245.213 243.994 273.852

278.525 259.589 274.530 250.171 248.524 238.479 256.076 267.292 255.964 280.989 273.245 283.237

276.438 276.439 278.306 268.242 263.570 238.531 263.283 272.805 250.000 257.920 263.112 280.028

267.785 239.373 250.492 230.830 236.124 229.838 252.718 262.069 241.952 238.903 257.450 268.948

1.082.730 1.020.394 1.071.751 985.537 999.657 951.604 1.018.708 1.056.915 976.819 1.023.025

270.682,50 255.098,50 267.937,75 246.384,25 249.914,25 237.901,00 254.677,00 264.228,75 244.204,75 255.756,25 259.450,25 276.516,25

Page 151: Probabilitas Statistik

1.037.801 1.106.065

Jumlah 3.082.751,50 Cara menghitung indeks musiman :

a. Hitung produksi rata-rata bulanan untuk seluruh tahun (menggunakan rata-rata hitung, median atau jenis rata-rata lainnya). Angka rata-rata dipakai untuk mewakili bulan Januari, Februari dst.

b. Setelah diperoleh rata-rata untuk tiap bulan, angka rata-rata ini beserta jumlahnya kita pindahkan ke table berikut dibawah ini dalam kolom (2). Rata-rata kemudian dinyatakan sebagai persentase terhadap totalnya {(270.682,50 / 3.082.751,50) x 100% = 8,7805 dst}. Hasil pembagian terdapat di kolom (3)

c. Untuk memperoleh angka indeks musiman pada kolom (4), nilai pada kolom (3) dikalikan dengan 12. Contoh : 8,7805 x 12 = 105,37, dst. Semua dibulatkan menjadi 2 angka dibelakang koma, untuk mendapatkan jumlah kolom (4) yaitu 1.200,00. Perhatikan bahwa karena kesalahan pembulatan, ada kemungkinan jumlah kolom (3) tidak tepat 100, dan jumlah kolom (4) tidak tepat 1.200.

Pengambilan nilai rata-rata tiap bulan dimaksudkan utnuk menghilangkan pengaruh trend (T). Untuk memperoleh gerakan musiman yang murni, pengaruh dari gerakan siklis seharusnya juga dihilangkan. Karena gerakan siklis akan terulang setelah beberapa tahun (4 tahun, 5 tahun atau lebih), maka banyaknya tahun yang diselidiki harus sebanyak tahun terulangnya gerakan siklis tersebut. Apabila indeks musiman dari kolom (4) table berikut kita buat kurvanya, aka akan diperoleh grafik yang menunjukkan terjadinya penurunan indeks musiman produksi gas di Indonesia dari bulan Januari sampai dengan Juni, kemudian meningkat sampai bulan Agustus, dan turun kembali pada bulan September. Setelah itu produksi meningkat kembali sampai dengan bulan Desember. Tabel 3 : Indeks Musiman Produksi Gas Indonesia 1995 – 1998 (000 MSCF) Bulan Harga Rata-rata Persentase (%) terhadap total

dari kolom (2) Indeks Musiman

(1) (2) (3) (4) Januari 270.682,50 8,7805 105,37

Page 152: Probabilitas Statistik

Februari Maret April Mei Juni Juli Agustus Se[ptember Oktober November Desember

255.098,50 267.937,75 246.384,25 249.914,25 237.901,00 254.677,00 264.228,75 244.204,75 255.756,25 259.450,25 276.516,25

8,2750 8,6915 7,9923 8,1069 7,7172 8,2614 8,5712 7,9216 8,2964 8,4162 8,9688

99,30 104,30

95,91 97,28 92,61 88,14 99,14

102,85 95,06 99,56

107,64 Jumlah 3.082.751,50 100,00 1.200,00

2. Metode Relatif Bersambung

Untuk menggunakan metode relative bersambung, data bulanan yang asli mula-

mula dinyatakan sebagai persentase dari data pada bulan yang mendahuluinya. Persentase-persenatse yang didapat dengan cara demikian disebut relative bersambung (link relative).

Jadi, relative bersambung menghubungkan data pada bulan yang mendahuluinya.

Kemudian diambil rata-rata atau median dari persentase – persentase tersebut untuk setiap bulan. Untuk keperluan ilustrasi, perhatikan table 2 yang ditulis kembali untuk memudahkan. Tabel 4 : Produksi Gas Indonesia 1995 – 1998 (000 MSCF) Bulan 1995 1996 1997 1998 (1) (2) (3) (4) (5)

Januari 259.982 278.525 276.438 267.785

Page 153: Probabilitas Statistik

Februari Maret April Mei Juni Juli Agustus Se[ptember Oktober November Desember

244.993 268.423 236.293 251.439 244.756 246.631 254.749 228.903 245.213 243.994 273.852

259.589 274.530 250.171 248.524 238.479 256.076 267.292 255.964 280.989 273.245 283.237

276.439 278.306 268.242 263.570 238.531 263.283 272.805 250.000 257.920 263.112 280.028

239.373 250.492 230.830 236.124 229.838 252.718 262.069 241.952 238.903 257.450 268.948

Jumlah Dari data table 4 dapat dihitung angka relative bersambung sebagai berikut : Data Februari 1885 Untuk Februari 1995 = -------------------------- x 100% Data Januari 1995 = (244,993 / 259.982) x 100% = 94,23% Dengan cara yang sama, angka relative bulan berikutnya dapat dicari. Misalnya angka relative untuk bulan Maret 1995 dan Juni 1995 adalah masing-masing 109,56% dan 97,34%. Angka-angka relative bersambung ini dimasukkan ke table 5, dan kita peroleh rata-rata untuk masing-masing bulan. Rata-rata Januari = (101,71 + 97,60 + 98,31) / 3 = 97,60 Rata-rata Februari = ( 94,23 + 93,20 + 100,00 + 89,39 ) / 3 = 94,21 Rata-rata Maret = ( 109,56 + 105,76 + 100,68 + 104,65 ) / 3 = 105,16 Dan seterusnya…..

Page 154: Probabilitas Statistik

Tabel 5 : Angka Relatif Bersambung Bulan 1995 1996 1997 1998 Rata-rata Median

Januari Februari Maret April Mei Juni Juli Agustus Se[ptember Oktober November Desember

- 94,23

109,56 88,03

106,41 97,34

100,77 103,85

89,85 107,13

99,50 112,24

101,71 93,20

105.76 91,13 99,34 95,96

107,38 104,38

95,76 109,78

97,24 103,66

97,60 100,00 100,68

96,38 98,26 90,50

110,38 103,62

91,64 103,17 102,01 106,43

98,31 89,39

104,65 92,15

102,29 97,34

105,95 103,70

92,32 98,74

107,76 104,47

97,60 94,21

105,16 91,92

101,58 95,28

107,12 103,75

92,40 104,70 101,63 106,70

- 93,72

105,20 91,84

100,82 96,65

108,67 103,66

91,98 105,15 100,76 105,45

Contoh 1 : Berdasarkan data table 5, buatlah indeks musiman dengan menggunakan metode rata-rata Penyelesaian : Perhatikan angka rata-rata pada table 5 diatas :

Kita anggap angka Januari = 100% Angka bulan Februari = 94,21% dari rata-rata data Januari, yaitu 87/94,21

x 100% = 94,21% Untuk Maret angkanya adalah 105,16 dari Februari, yaitu 105,16 x 94,21%

= 99,07% Hasil perhitungan ini disebut relative berantai (chain relative) yang terlihat

pada table 6 berikut : Tabel 6 : Relative Berantai Bulan Rata-rata relative bersambung Relatif Berantai

Januari Februari Maret April

97,60 94,21

105,16 91,92

100,00 94,21 99,07 96,67

Page 155: Probabilitas Statistik

Mei Juni Juli Agustus Se[ptember Oktober November Desember

101,58 95,28

107,12 103,75

92,40 104,70 101,63

106,70

93,79 96,79

102,07 111,13

95,86 96,74

106,41 108,44

Januari* 106,61 *Relative berantai Januari kedua = 98,31% dari Desember (108,44%) = (98,31/100) x 108,44% = 106,61%

Perhatikan table 6 :

Oleh karena nilai relative berantai Januari kedua = 106,61%, baerati terjadi kenaikan sebesar 106,61 – 100% = 6,61%. Kenaikan ini disebabkan adanya pengaruh trend jangka panjang. Untuk menghilangkan pengaruh trend ini, maka relative Januari kedua harus dikurangi {( 12/12 ) x 6,61%, yaitu 106,61% - 6,61% = 100%.

Oleh karena pengaruh trend sudah dihilangkan, maka baik Januari pertama

(baris pertama table 6) maupun Januari kedua (baris terakhir table 6) mempunyai relatif berantai yang sama yaitu sebesar 100,00%.

Untuk Desember = 108,44% - (11/12 x 6,61%) = 102,38%

Untuk November = 106,41% - (10/12 x 6,61%) = 103,99%

Untuk Oktober = 96,74% - (9/12 x 6,61%) = 91,78% dst

Hasil perhitungan ini merupakan angka indeks musiman dengan menggunakan

metode bersambung. Apabila jumlah dari indeks ini (A) = 1.200%, maka perhitungan selesai, tetapi kalau jumlahnya tidak sama dengan 1.200%, maka masing-masing angka indeks dari bulan Januari s/d Desember harus diadakan penyesuaian, yaitu dengan mengalikan masing-masing nilai dengan angka penyesuaian sebesar 1.200 / A (lihat table 7)

Tabel 7 : Indeks Musiman

Page 156: Probabilitas Statistik

Bulan Belum disesuaikan Sudah disesuaikan (1) (2) (3)

Januari Februari Maret April Mei Juni Juli Agustus Se[ptember Oktober November Desember

100,00 93,66 97,97 95,01 91,17 94,03 98,76

107,28 91,45 91,78

103,99 102,38

103,06 96,52

100,96 97,92 93,96 96,91

101,78 110,56

94,25 94,59

106,18 105,51

Januari*

Ternyata jumlah indeks, kolom (2) table 7 adalah 1.164,39 dan bukan 1.200. Dengan demikian setiap angka harus dikalikan dengan angka penyesuaian sebesar 1200 :1.164,39 = 1,0306.

Untuk Januari = 100 x 1,0306 = 103,06. Februari = 93,66 x 1,0306 =

96,52 dst (lihat kolom 3 tabel 7)

Apabila dibuat grafik indeks musiman yang disesuaikan, maka kurvanya menunjukkan bahwa telah terjadi kenaikan produksi pada bulan Agustus. Gerakan musiman ini tidak begitu jelas, sebab ada kecenderungan berfluktuasi dari bulan ke bulan. Dengan jalan yang sama dapat dibuat median sebagai pengganti rata-rata. Angka median terdapat pada kolom (7) table 5.

3. Metode Rasio Terhadap Trend

Didalam metode ini, data asli untuk setiap bulan dinyatakan sebagai persentase dari nilai-nilai trend bulanan. Rata-rata (median) dari persentase ini merupakan indeks musiman. Kalau rata-rata indeks ini ≠ 100%, atau jumlahnya ≠ 1.200 %, perlu diadakan penyesuaian.

Page 157: Probabilitas Statistik

Seperti kita ketahui, suatu data berkala Y mempunyai komponen T (trend), siklis (C) , musiman (S), dan gerakan tidak teratur (I). Jadi Y = TCSI. Apabila dipergunakan sebagai indeks musiman, maka ini sebetulnya bukan merupakan indeks musiman yang murni, tetapi masih mengandung komponen C dan I. Inilah salah satu kelemahan dari cara ini.

Contoh : Dari table rata-rata bulanan berikut, buatlah indeks musiman menggunakan metode rasio terhadap trend (pertama dengan rata-rata, kedua dengan median) Table 8 : penjualan rata-rata bulanan hipotetis PT. Sinar Surya

Tahun 1992 1993 1994 1995 1996 1997 1998 1999 Rata-rata

bulanan

273,7

293,5

315,0

336,8

364,4

394,8

424,2

458,7

Penyelesaian : Seharusnya kita mencari persamaan trend bulanan, tetapi cara ini kurang praktis karena kita harus melakukan perhitungan terhada 12 x 8 angka = 96 angka. Sebagai penggantinya kita akan mencari garis trend tahunan dengan menggunakan angka rata-rata bulanan tersebut yang mewakili angka tahunan. Tren yang akan kita pergunakan merupakan trend garis kurus untuk tahun 1992 – 1999. Dengan mengasumsikan bahwa angka bulanan ini terletak pada pertengahan bulan, maka rata-rata yang mewakili tahun akan terletak pada tanggal 30 Juni - 1 Juli tahun bersangkutan. Untuk mencari trend tahunan diperlukan perhitungan-perhitungan sebagai berikut : Tabel 9 : Tahun X Y XY X2 1992 1993 1994 1995

-7 -5 -3 -1

273,7 293,5 315,0 336,8

-1.915,9 -1.467,5

-945,0 -336,8

49 25

9 1

Page 158: Probabilitas Statistik

1996 1997 1998 1999

1 3 5 7

364,4 394,8 424,2 458,7

-364,4 1.284,4 2.121,0 3.210,9

1 9

25 49

Jumlah 0 2.861,1 2.215,5 168 a = 1/n sigma Yi

= 1/8 x 2.861,1 = 357,64 Xi Yi

b = ----------

Xi2

= 2.215,5 / 168 = 13,19

Y = a + bX = 357,64 + 13,19X

Dalam hal ini X diukur menurut pertengahan tahun (6 bulan) dan titik asalnya pada tanggal 31 Desember 1995 atau 1 Januari 1996. (Ingat bahwa karena jumlah tahun genap, maka jarak antara tahun yang satu dengan tahun lainnya sebesar 2 satuan. Dua satuan = 1 tahun, sehingga satu satuan sama dengan setengah tahun = 6 bulan). Dari persamaan Y = 357,64 + 13,19X, berarti bahwa nilai Y naik sebesar 13,19 setiap 6 bulan. Jadi setiap bulannya naik secara rata-rata 13,19 / 6 = 2,20. Jadi ketika nilai X = 0 ( yaitu pada tanggal 1 Januari 1996 ) --- Y = 357,64 + ½ (2,20) = 358,7, yaitu merupakan nilai trend pada bulan Januari 1996. Dengan melakukan penambahan secara berurutan sebesar 2,20 terhadap 358,7 akan diperoleh nilai trend untuk bulan Februari 1996, Maret 1996, April 1996 dsb, masing-masing sebesar 358,7 + 2,20 = 360,9 ; 360,9 + 2,20 = 363,1 dst.

Dengan cara yang sama, kita bisa memperoleh nilai-nilai trend untuk bulan-bulan pada tahun sebelum 1996, yaitu dengan mengurangkan nilai 2,20 terhadap 358,7 secara berurutan sehingga kita memperoleh nilai trend untuk Desember 1995, November 1995,

Page 159: Probabilitas Statistik

Oktober 1995 dst, masing-masing sebesar 358,7 – 2,20 = 356,5 ; 356,5 – 2,20 = 354,3; 354,3 – 2,20 = 352,1 dst. Hasil perhitungan ini menghasilkan nilai trend dan hasil perhitungan, seluruhnya disajikan pada table 10 berikut : Tabel 10 : Nilai trend PT. Sinar Surya Tahun 1992 1993 1994 1995 1996 1997 1998 1999 (1). (2) (3) (4) (5) (6) (7) (8) (9)

Jan. Feb. Maret April Mei Juni Juli August Sept. Okt. Nov. Des.

253,1 255,3 257,5 259,7 261,9 264,1 266,,3 268,5 270,7 272,9 275,1 277,3

279,5 281,7 283,9 286,1 288,3 290,5 292,7 294,9 297,1 299,3 301,5 303,7

205,9 308,1 310,3 312,5 314,7 316,9 319,1 321,3 323,5 325,7 327,9 330,1

332,3 334,5 336,7 338,9 341,1 343,3 345,5 347,7 349,9 352,1 354,3 356,5

359,7 360,9 363,1 365,3 367,5 369,7 371,9 374,1 376,3 378,5 380,7 382,9

385,1 387,3 389,5 391,7 393,9 396,1 398,3 400,5 402,7 404,9 407,1 409,3

411,5 413,7 415,9 418,1 420,3 422,5 424,7 426,9 429,1 431,3 433,5 435,7

437,9 440,1 442,3 444,5 446,7 448,9 451,1 453,3 455,5 457,7 459,9 462,1

Angka-angka dari table 10 dipergunakan untuk membagi data asli dari tabel 11 berikut . Hasil pembagian ini dinyatakan dalam persentase, misalnya untuk : Januari 1992 = (318 / 253,1) x 100% = 125,64% Februari 1992 = (281 / 255,3 ) x 100% = 110,06% Maret 1992 = (278 / 257,5) x 100% = 107,96% Hasil pembagian ini disajikan dalam table 11 berikut : Tabel 11 : Nilai Rasio terhadap Trend (%)

Page 160: Probabilitas Statistik

Bulan 1992 1993 1994 1995 1996 1997 1998 1999 Rata2 Median (1) (2) (3) (4) (5) (6) (7) (8) (9) (10) (11)

Jan. Feb Maret April Mei Juni Juli Agust Sept. Okt. Nov. Des.

125,6 110,1 108,0 96,3 88,2 81,1 83,7 91,2 99,4 110,7 118,1 125,1

122,4 110,0 105,3 93,7 86,4 81,2 82,7 88,8 96,9 107,3 113,4 119,9

120,0 106,5 103,1 91,8 85,5 79,2 81,2 88,4 95,5 105,9 111,9 119,4

118,0 104,3 101,6 91,8 85,0 79,5 81,6 87,7 93,7 103,4 109,8 117,0

117,1 104,7 101,9 91,4 85,4 80,1 82,0 88,2 94,6 104,6 110,8 118,0

117,6 106,4 102,2 92,4 86,6 81,3 84,1 89,6 97,3 105,5 111,5 118,0

118,3 106,4 103,1 94,0 88,0 81,3 84,1 90,9 96,7 106,0 113,3 118,4

120,8 108,4 104,7 95,2 89,1 84,7 86,2 92,4 98,4 107,7 114,4 121,2

119,98 107,10 103,74 93,33 86,78 81,24 83,20 89,65 96,56 106,39 112,90 119,63

119,2 106,4 103,1 93,0 86,5 81,2 83,2 89,2 96,8 106,0 112,6 189,9

1.200,5 1.196,1 Untuk menghitung indeks musiman dengan menggunakan rata-rata, kitapergunakan kolom (10) table 11. Apabila jumlah tersebut tidak sama dengan 1.200, maka perlu diadakan penyesuaian, tetapi karena jumlahnya = 1.200,50 yang sudah dekat dengan 1.200, maka penyesuaian tidak diperlukan lagi. Kalau median akan dipergunakan untuk menghitung indeks musiman, kita pergunakan kolom (11) table 11. Akan tetapi, karena jumlahnya tidak sama dengan 1.200, maka perlu dilakukan penyesuaian, yaitu dengan mengalikan setiap angka pada kolom (11) table 11 dengan factor pengali sebesar 1.200/ 1.196,1 = 1,003. Setelah dikalikan dengan factor pengali, kita peroleh indeks musiman sebagai berikut : Januari = 119,2 x 1,003 = 119,56 Februari = 106,4 x 1,003 = 106,72 Maret = 103,1 x 1,003 = 103,41 dst

Page 161: Probabilitas Statistik

Apabila seluruhnya dikalikan, maka kita peroleh indeks untuk setiap bulan yang tersaji pada table 12 berikut :

Bulan Indeks Musiman Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember

119,56 106,72 103,41

93,28 86,76 81,44 83,44 89,47 97,09

106,32 112,94 119,26

Jumlah 1.200,00 Apabila indeks musiman dengan menggunakan metode rasio terhadap trend tersebut digambarkan grafiknya, maka kita peroleh bentuk kurva yang memperlihatkan bahwa kurva indeks dengan metode rata-rata maupun median tidak jauh berbeda. Pada umumnya , berdasarkan indeks musiman tersebut terjadi penurunan hasil penjualan pada bulan Juni. 4. Metode Rasio terhadap Rata-rata Bergerak

Didalam metode ini harus dihitung terlebih dahulu rata-rata bergerak selama 12 bulan. Oleh karena hasil perhitungan rata-rata bergerak 12 bulan ini terletak antara

Page 162: Probabilitas Statistik

2 bulan yang berdekatan (tidak terletak di pertengahan bulan), maka harus dibuat rata-rata bergerak 2 bulan yang didasarkan atas rata-rata bergerak 12 bulan tersebut. Ini disebut rata-rata bergerak 12 bulan terpusat (centered 12 months moving average). Apabila rata-rata bergerak 12 bulan terpusat sudah dihitung, maka angka-angka ini dapat dipergunakan untuk membagi data asli yang hasilnya dalam persentase, kemudian dibuat rata-rata angka persentase ini dari bulan ke bulan. Kalau jumlah rata-rata dari bulan ke bulan sudah sama atau dekat sekali dengan 1.200, maka angka rata-rata sudah merupakan angka indeks musiman. Apabila jumlah A tidak sama dengan 1.200, maka harus dilakukan penyesuaian, yaitu dengan jalan mengalikan setiap angka rata-rata (median) dengan factor pengali sebesar 1.200/A Contoh : Dengan menggunakan data table 2, buatlah angka indeks musiman dengan metode rasio terhadap rata-rata bergerak.

Penyelesaian ; Sebagai langkah awal, harus dibuat rata-ata bergerak 12 bulan terpusat terlebih dahulu, seperti ditunjukkan pada table 13 berikut ini.

Table 13 : Rata-rata Bergerak 12 Bulan Terpusat Produksi Gas Indonesia, 1995 – 1999 (000 MSCF)

Tahun & Bulan

(1)

Produksi Gas (Y)

(2)

Rata-rata Bergerak 12 Bulan

(3)

Rata-rata Bergerak 1 Bulan Terpusat

(4) 1995 : 1

2 3 4 5 6 7 8 9

10 11 12 1996 : 1

259.982 244.993 268.423 236.293 251.439 244.756 246.631 254.749 228.903 245.213 243.994 273.852 278.525

249.935,75 251.481,00 252.697,33 253.206,25 254.362,67 254.119,75 253.596,67 254.383,75

250.708,38 252.089,17 252.951,79 253.784,46 254.241,21 253.858,21 253.990,21

Page 163: Probabilitas Statistik

2 3 4 5 6 7 8 9

10 11 12 1997 : 1

2 3 4 5 6 7 8 9

10 11 12 1998 : 1

2 3 4 5 6 7 8 9

10 11 12

259.589 274.530 250.171 248.524 238.479 256.076 267.292 255.964 280.989 273.245 283.237 276.438 276.439 278.306 268.242 263.570 238.531 263.283 272.805 250.000 257.920 263.112 280.028 267.785 239.373 250.492 230.830 236.124 229.838 252.718 262.069 241.952 238.903 257.450 268.948

257.684,08 257684,08 260.665,42 263.103,00 263.885,08 263.711,17 265.115,33 265.430,00 266.935,92 268.189,75 268.194,08 268.794,67 269.254,08 268.757,08 266.834,67 265.990,25 265.722,83 265.001,75 261.912,92 259.595,08 256.477,42 254.190,25 253.465,83 252.585,42 251.690,75 251.020,08 249.435,33 248.963,50 248.040,17

256.556,54 258.556,54 239.174,75 261.884,21 263.292,04 263.798,13 264.413,25 265.272,67 266.182,96 267.562,83 268.191,92 268.494,38 269.024,38 269.005,58 267.795,88 266.412,46 265.856,54 265.362,29 263.437,33 260.754,00 258.036,25 255.333,83 253.828,04 253.025,63 252.138,08 251.355,42 250.227,71 249.199,42 248.502.83

Cara memperoleh angka-angka kolom (3) adalah sebagai berikut :

Page 164: Probabilitas Statistik

259.982 + 244.933 + ……+ 273.852 249.935,75 = --------------------------------------------------- (antara Juni – Juli) 12

244.993 + 268.423 + …….+ 278.525 251.481,00 = --------------------------------------------------- (antara Juli – Agus- 12 tus) dst Kemudian cara memperoleh angka pada kolom (4) adalah sebagai berikut 249.935,75 + 251.481,00 250.708,38 = ----------------------------------- , diletakkan pada Juli 1995 2 251.481,00 + 252.697,33 252.089,17 = ----------------------------------- , diletakkan pada Agustus 1995 2 dst Hasil perhitungan ini menghasilkan rata-rata bergerak 12 bulan terpusat. Angka rata-rata bergerak ini dapat juga diperoleh dengan mencari jumlah bergerak 12 bulan (menjumlahkan 12 angka), kemudian dari angka ini dibuat jumlah bergerak 2 bulan (menjumlahkan 2 angka) dan akhirnya dibagi 24.

Tabel 14 :

Jumlah bergerak 12 bulan

Jumlah bergerak 2 builan dari kolo (1)

Rata-rata bergerak 12 bulan terpusat

(1) (2) (3) = (2) : 24 2.999.229

3.166.621

3.188.674

2.976.482

6.165.850

6.355.295

6.165.136

256.910,42

264.803,96

256.881,50

Page 165: Probabilitas Statistik

Perhatikan bahwa dengan menggunakan rata-rata bergerak kita kehilangan beberapa angka. Angka rata-rata bergerak dimulai pada bulan Juli 1995 (250.708,38) dan berakhir pada bulan Juni 1998 (248.502,83). Langkah selanjutnya, data asli, yaitu mulai Juli 1995 (246.631) sampai pada bulan Juni 1998 (229.838) dibagi dengan angka rata-rata bergerak 12 bulan terpusat. Hasil pembagian dinyatakan dalam persentase. Misal : Hasil pembagian pada Juli 1995 = (246.631 / 250.708,38) x 100% Agustus 1995 = (254.748 / 252.089,17) x 100% Dst Seluruh hasil pembagian dimuat dalam table 15 berikut :

Bulan 1995 1996 1997 1998 Rata-rata Median (1) (2) (3) (4) (5) (6) (7)

Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember

93,37 101,06

90,49 96,62 05,97

107,88

109,66 101,84 107,01

96,53 94,50 90,51 97,07

101,09 96,49

105,56 102,12 105,61

102,96 102,76 103,46 100,17

98,93 89,72 99,22

103,55 95,88 99,95

103,05 110,32

105,83 94,94 99,66 92,25 94,75 92,49

106,15 99,84

103,66 96,31 96,19 90,91 98,22

101,90 94,29

100,71 100,38 107,94

105,83 101,84 103,46

96,53 94,90 90,51 98,37

101,09 95,88 99,95

102,12 107,88

Jumlah 1.196,22 1.198,35 Angka-angka kolom (6) diperoleh dari : 100,66 + 102,96 + 105,83 106,15 = -------------------------------------- 3 101,84 + 102,76 + 94,94 99,84 = ------------------------------------- 3 Angka-angka kolom (7), misal 105,83 yang merupakan nilai tengah data pada bulan Januari dengan mengurutkan dari nilai terkecil sampai terbesar (102,96 ; 105,83 ; 109,66).

Page 166: Probabilitas Statistik

Apabila jumlah rata-rata kolom (6) dan jumlah median kolom (7) sama dengan 1.200, maka masing-masing kolom tersebut dapat dipergunakan sebagao indeks musiman. Akan tetapi kalau jumlahnya tidak sama dengan 1.200, maka perlu diadakan penyesuaian. Terakhir, perlu diadakan penyesuaian, kalau rata-rata akan dipergunakan sebagai indeks musiman, dimana masing-masing nilai dari bulan ke bulan pada kolom (6) harus dikalikan dengan factor pengali 1.200 / 1,196,22 = 1,0014. Setelah dilakukan perkalian terhadap factor pengali, maka kita peroleh indeks musiman yang disajikan dalam tabel 16 berikut : Tabel 16 : Indeks Musiman, Rasio terhadap Rata-rata Bergerak dengan menggunakan

Rata-rata dan Median. Bulan Indeks Musiman dengan

Rata-rata Indeks Musiman dengan

Median (1) (2) (3)

Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember

106,49 100,18 103,70

96,62 96,50 91,19 98,53

102,22 94,58

101,03 100,70 108,28

105,98 101,98 103,60

96,66 95,03 90,63 98,51

101,23 96,01

100,09 100,09 108,02

Jumlah 1.200,00 1.200,00 Data indeks musiman pada table 16, kemudian dibuat kurvanya (untuk rata-rata dan median). Perlu disebutkan disini bahwa nilai rata-rata dari suatu kelompok nilai sangat dipengaruhi oleh adanya nilai ekstrim dalam kelompok tersebut. Oleh karena itu, apabila memang terdapat nilai ekstrim sebaiknya menggunakan median saja. Tetapi kalau seandainya akan dipergunakan rata-rata dalam membuat indeks musiman, maka nilai

Page 167: Probabilitas Statistik

ekstrim harus dihilangkan terlebih dahulu (tidak dimasukkan dalam perhitungan rata-rata tersebut). 5. Menghilangkan Pengaruh Musiman dan Trend

Apabila kita ingin menghilangkan pengaruh musiman terhadap data berkala, maka setiap nilai (data Asli) bulanan dari tahun ke tahun harus dibagi dengan indeks musiman. Angka bulan Januari (dari tahun ke tahun) harus dibagi dengan angka indeks musiman bulan Februari dan seterusnya. Jadi, yang tinggal ialah pengaruh dari trend siklis variasi tak teratur. Contoh : Hilangkan pengaruh musiman terhadap data produksi gas di Indonesia dari table 2. Gambarkan grafiknya sebelum dan sesudah pengaruh musiman dihilangkan. Penyelesaian : Angka indeks musiman yang akan digunakan untuk membagi diambil dari table 16 kolom (3), yaitu indeks musiman dengan menggunakan median. Angka pada bulan Januari 1995 dibagi dengan 105,98% (1,0598), Februari 1995 dengan 101,98%.(1,0598), dan seterusnya. Misal : Januari 1995 = 259.982 : 1,0598 = 245.312,32 Januari 1996 = 278.525 : 1,0598 = 262.809,02, dst Februari1995 = 244.993 : 1,0198 = 240.236,32 Februari 1996 = 259.589 : 1,0198 = 254.548,93, dst Hasil seluruh perhitungan ini menghasilkan data yang bebas dari pengaruh musiman dab disajikan pada table 17 berikut ini.

Tabel 17 : Produksi Gas di Indonesia 1995 – 1998 yang bebas dari pengaruh musiman Bulan 1995 1996 1997 1998

Januari Februari Maret April Mei Juni Juli

245.312,32 240.236,32 259.095,56 244.458,93 264.589,08 270.060,69 250.361,38

262.809,02 254.548,93 264.990,35 258.815,44 261.521,62 263.134,72 259.949,24

260.839,78 271.071,78 266.635,14 277.510,86 277.354,52 263.192,10 267.265,25

252.675,03 234.725,44 241.787,64 238.806,12 248.473,11 253.600,35 256.540,45

Page 168: Probabilitas Statistik

Agustus September Oktober November Desember

251.653,66 238.415,79 244.992,51 238.601,60 253.519,72

264.044,26 266.801,40 280.736,34 267.206,14 262.207,92

269.490,27 260.389,54 257.688,08 257.296,09 259.237,18

258.884,72 252.007,08 238.688,18 251.760,22 248.979,82

GERAKAN SIKLIS DAN CARA MENGUKURNYA Seperti kita ketahui, data berkala diberi symbol Y = TCSI. Apabila dibagi dengan S, maka : Y / S = TCSI / S = TCI (bebas pengaruh musiman) yang kemudian kalau dibagi dengan T menjadi : Y / ST = TCI / T = CI (bebas pengaruh musiman dan trend) Kalau pengaruh musiman dan trend dihilangkan dari data berkala, maka sisanya merupakan gerakan siklis dan gerakan yang tak teratur (CI). Hasil pembagian dinyatakan dalam persentase. Contoh : Berdasarkan data pada table 18 berikut, yang sudah bebas dari pengaruh musiman, hilangkan pengaruh trendnya, kemudian gambarkan grafik dari gerakan siklis dan gerakan yang tak teratur (CI), untuk tahun 1995 – 1998 Tabel 18 : Hasil Penjualan yang Bebas dari Pengaruh Musiman PT. Sinar Surya

Bulan 1995 1996 1997 1998 1999 (1) (2) (3) (4) (5) (6)

Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember

325,6 325,0 328,8 333,3 336,0 339,6 342,2 342,7 341,0 342,1 343,0 345,5

348,8 352,0 355,8 358,0 363,8 368,2 363,1 370,8 370,1 372,2 372,1 374,5

376,2 383,6 382,7 389,2 395,1 400,5 406,6 403,4 407,5 401,3 400,4 408,5

404,5 409,7 412,5 421,2 428,7 431,6 433,3 436,0 431,4 429,5 433,0 427,5

439,4 444,1 445,2 453,4 461,2 472,6 472,1 470,8 465,7 463,3 463,8 464,0

Page 169: Probabilitas Statistik

Penyelesaian : Niali trend mempergunakan data dari table 10. Semua nilai table 18 mulai dari Januari 1995 s/d Desember 1999 harus dibagi dengan nilai trend dari table 10, pada bulan yang bersangkutan Misal untuk : Januari 1995 = (325,6 / 332,3) x 100% = 97,98% Februari 1995 = (325,0 / 334,5) x 100% = 97,16%, dst Seluruh hasil pembagian dapat dilihat dalam table 19 berikut. Tabel 19 : Hasil Penjualan Bebas Pengaruh Musiman dan trend

Bulan 1995 1996 1997 1998 1999 Januari Februari Maret April Mei Juni Juli Agustus September Oktober November Desember

97,98 97,16 97,65 98,35 98,50 98,92 99,04 98,56 97,46 97,16 96,81 96,91

97,24 97,53 97,99 98,00 98,99 99,59 97,63 99,12 98,35 98,34 97,74 97,81

97,69 99,04 98,25 99,36 100,30 191,11 102,08 100,72 101,19 99,11 98,35 99,80

98,30 99,03 99,18 100,74 102,00 102,15 102,02 102,13 100,54 99,58 99,98 98,12

100,34 100,91 100,66 102,00 103,25 102,74 104,66 103,86 102,24 101,22 100,85 100,41

Untuk menggambarkan grafik dari gerakan siklis dan gerakan tak teratur (CI), masing-masing nilai data yang sudah bebas dari pengaruh musiman dan trend dikurangi dengan 100%. Hasilnya merupakan persentase jarak (selisih terhadap 100%). Setelah semua nilai dari table 19 dikurangi dengan 100, kita peroleh hasil perhitungan yang disajikan dalam table 20 untuk dasar pembuatan grafik. Table 20 : Persentase Selisih Data Bebas Pengaruh Musiman dan Trend terhadap

100% Bulan 1995 1996 1997 1998 1999

Januari Februari Maret April Mei

-2,02 -2,84 -2,35 -1,65 -1,50

-2,76 -2,47 -2,01 -2,00 -1,01

-2,31 -0,96 -1,75 -0,64 0,30

-1,70 -0,97 -0,82 0,74 2,00

0,34 0,91 0,66 2,00 3,25

Page 170: Probabilitas Statistik

Juni Juli Agustus September Oktober November Desember

-1,08 -0,96 -1,44 -2,54 -2,84 -3,19 -3,09

-0,41 -2,37 -0,88 -1,65 -1,66 -2,26 -2,19

1,11 2,08 0,72 1,19 -0,89 -1,65 -0,20

2,15 2,02 2,13 0,54 -0,42 -0,12 -1,88

2,74 4,06 3,86 2,24 1,22 0,85 0,41

CONTOH TAMBAHAN MENGENAI INDEKS MUSIMAN Indeks musiman adalah suatu angka yang bervariasi terhadap nilai dasar 100. Jika suatu blan (minggu, kuartal, atau periode musiman lainnya) mempunyai nilai indeks 100, maka nilai ini menunjukkan bahwa pada bulan tersebut tidak ada pengaruh musiman. Dua metode untuk memperoleh indeks musiman akan disajikan disini, yaitu :

1. Metode 1 : Menemukan indeks musiman dengan membandingkan rata-rata musiman dengan nilai tengah utama. Metode ini paling tepat untuk data berkala yang tidak mempunyai trend atau variasi siklis yang kuat.

2. Metode 2 : Membandingkan setiap nilai musiman sebenarnya dengan rata-rata

bergerak tahunan untuk memperoleh sebuah nilai indeks. Indeks hasil akhir berupa rata-rata keseluruhan periode dalam deret. Penggunaan metode ini lebih luas karena dapat memberikan indeks musiman yang berarti untuk data dengan trend dan variasi siklis yang kuat.

Contoh persoalan dalam bab ini adalah bagaimana menentukan indeks musiman untuk setiap kuartal dalam satu tahun. Jika akan menghitung indeks bulanan, maka teknik yang sama dapat digunakan. Kita menghitung indeks kuartalan disini hanya untuk memperlihatkan metodenya tanpa menggunakan ruang yang berlebihan. Contoh : Table 21 berikut menyajikan data kuartalan 10 tahun penjualan produk X. Pabrik merekomendasikan penggunaan produk X tersebut untuk musim semi dan gugur. Tentukan indeks penjualan musiman untuk keempat kuartal dalam setahun. Penyelesaian : Tabel 21 : Perhitungan Indeks Penjualan Kuartalan (dalam ton) Produk X

Tahun Kuartal 1 Kuartal 2 Kuartal 3 Kuartal 4 1 257 288 263 311

Page 171: Probabilitas Statistik

2 3 4 5 6 7 8 9 10

291 319 305 332 368 332 351 355 408

368 485 364 435 520 464 440 504 490

341 325 336 410 415 405 411 449 740

408 381 383 449 444 468 668 527 649

Total 3.318 4.358 4.095 4.688 Total utama = 3.318 + 4.358 + 4.095 + 4.688 = 16.649 Nilai tengah kuartalan (=Total kuartal : 10) 331,8 435,8 409,5 468,8 Nilai tengah utama = (331,8 + 435,8 + 409,5 + 468,8) : 4 = 411,48 Indeks kuartalan = 80,7 105,9 99,5 113,9 (Nilai tengah kuartalan : nilai tengah utama) x 100 Jumlah indeks 400 Berdasarkan perhitungan diatas dapat dijelaskan sebagai berikut :

Rata-rata penjualan kuartal pertama hanya 80,7% dari rata-rata penjualan kuartalan. Sebaliknya, penjualan kuartal keempat adalah 13,9% diatas rata-rata penjualan kuartalan.

Karena indeks musiman bervariasi terhadap 100, maka keempat indeks kuartalan harys berjumlah 400.

Jika indeks yang dihitung adalh indeks bulanan, jumlahnya harus 1.200, yang merata-ratakan nilai 100 untuk setiap bulan.

MENEMUKAN UKURAN MUSIMAN DENGAN PENGGUNAAN REGRESI BERGANDA (MULTIPLE REGRESSION) Metode ini dilaksanakan dengan langkah-langkah sebagai berikut :

1. Kita harus memilih satu musim sebagai musim dasar. Bila data tersedia dalam kuartal, kita boleh memilih kuartal pertama, yaitu musim dingin sebagai musim

Page 172: Probabilitas Statistik

dasar. Semua indeks musiman akan diukur berdasarkan musim ini. Selain tiu, tidak ada aturan tertentu yang mutlak untuk memilih musim dasar ini.

2. Berikutnya, data deret berkala ini dicatat sepanjang periode waktu dengan menggunakan variable dummy untuk menunjukkan musim lain dari musim dasar.

Contoh :

Data penjualan setahun suatu perusahaan adalah $50, $125,$105 dan $60 (dalam ribuan). Bila musim dingin kita pilih sebagi dasar, maka data tersebut dapat dicatat dengan menggunakan indicator atau variable dummy, sebagai berikut :

Y (Penjualan) t (waktu) S2 (Musim Semi) S3 (Musim Panas) S2 (M. Gugur)

50 125 105 60

1 2 3 4

0 1 0 0

0 0 1 0

0 0 0 1

Perhatikan bahwa indeks musiman – musim semi, panas dan gugur – adalah nol

pada periode waktu yang tidak merupakan musimnya. Notasi ini memungkinkan kita menyajikan keempat musim dengan hanya 3 variabel. Sebagai contoh, periode musim dingin disajikan dengan 3 nol dalam variable musiman (0,0,0). Musim semi disajikan dengan (1,0,0), musim gugur denagn (0,0,1).

Dengan data yang disajikan pada model diatas, kita dapat membangun persamaan regresi dari rumus :

Y = a + b1t + b2S2 + b3S3 + b4 S4 Dimana : Y = ramalan hasil penjualan t = waktu

Sj = variable indicator yang menunjukkan musim semi, panas dan

gugur Untuk memperoleh ramalan dengan menggunakan persamaan regresi ini, kita

harus menetapkan periode waktu t dan musim Sj untik ramalan yang

diinginkan. Jika kita menggunakan ramalan untuk kuartal musim panas, dengan mengikuti data terakhir, t = 7, dan indikasi musiman adalah (0,1,0), ramalan akan menjadi :

Y = a + + b1(7) + b2 (0) + b3 (1) + b4(0)

Page 173: Probabilitas Statistik

= a + b1(7) + b3

Dengan hasil ini, kita dapat melihat bahwa ramalan musiman terdiri dari nilai

trend a + b1(7) ditambah jumlah b3 yang merupakan penyesuaian data

musiman dari penjualan musim panas. Dengan alas an yang sama, adalah data yang disesuaikan untuk musim

semi, dan adalah penyesuaian untuk musim gugur. Karena musim dingin adalah musim dasar, maka tidak ada data penyesuaian

yang ditambahkan pada trend. Tentu saja, pada masalah nyata, lebih dari 4 data dibutuhkan untuk mendapatkan persamaan regresi.

Page 174: Probabilitas Statistik

STATISTIK INDUSTRI MODUL 11 ANGKA INDEKS

PENGERTIAN ANGKA INDEKS Angka indeks (indeks) adalah suatu angka yang dibuat sedemikian rupa sehingga

dapat dipergunakan untuk melakukan perbandingan antara kegiatan yang sama (produksi, ekspor, hasil penjualan dsb) dalam waktu yang berbeda. Dari angka indeks bisa diketahui maju mundurnya atau naik turunnya suatu usaha atau kegiatan.

Tujuan pembuatan angka indeks adalah untuk mengukur secara kuantitatif terjadinya perubahan dalam waktu yang berlainan, misalnya indeks harga untuk mengukur perubahan harga, indeks produksi untuk mengetahui perubahan yang terjadi dalam kegiatan produksi dsb.

Angka indeks diperlukan oleh siapa saja yang ingin mengetahui maju mundurnya kegiatan atau usaha yang dilaksanakan, seperti pemilik perusahaan, para pejabat pemerintahan, para ahli ekonomi dan social dsb.

Didalam membuat angka indeks diperlukan dua macam waktu, yaitu waktu dasar (base period) dan waktu yang bersangkutan atau sedang berjalan (current period). Waktu dasar adalah waktu dimana suatu kegiatan (kejadian) dipergunakan sebagai dasar perbandingan, sedangkan waktu yang bersangkutan ialah waktu dimana suatu kegiatan (kejadian) dipergunakan sebagai dasar perbandingan terhadap kegiatan (kejadian) pada waktu dasar.

INDEKS HARGA RELATIF SEDERHANA Indeks harga relative sederhana (simple relative price index) ialah indeks yang terdiri

dari satu macam barang saja, baik untuk indeks produksi maupun indeks harga. Rumus indeks harga sederhana : It,0 = ( pt / p0 ) x 100%

Dimana : It,0 = indeks harga pada waktu t dengan waktu dasar 0

pt = harga pada waktu t

p0 = harga pada waktu 0

Rumus indeks produksi : It,0 = (qt / q0 ) x 100%

Dimana : It,0 = indeks produksi pada waktu t dengan waktu dasar 0

qt = produksi pada waktu t

q0 = produksi pada waktu 0

Page 175: Probabilitas Statistik

INDEKS AGREGATIF Indeks agragatif merupaka indeks yang terdiri dari beberapa barang (kelompok

barang), misalnya indeks harga 9 macam bahan pokok, indeks impor Indonesia, indeks biaya hidup dsb.

Indeks agregatif memungkinkan kita untuk melihat persoalan secara agregatif ( secara makro), yaitu secara keseluruhan, bukan melihat satu per satu.

Indeks agregatif dibagi menjadi 2 yaitu : 1. Indeks agregatif tidak tertimbang, yang digunakan untuk unit-unit yang

mempunyai satuan sama. Indeks diperoleh dengan jalan membagi hasil penjumlahan harga pada waktu yang bersangkutan dengan hasil penjumlahan pada waktu dasar.

Rumus : It,0 = ( pt / p0 ) x 100%

2. Indeks Agregatif tertimbang, ialah indeks yang yang dalam pembuatannya telah mempertimbangkan factor – factor yang akan mempengaruhi naik turunnya angka indeks tersebut.

Timbangan yang akan dipergunakan untuk pembuatan indeks biasanya :

a. Kepentingan relative (relative importance) b. Hal-hal yang ada hubungannya atau ada pengaruhnya terhadap naik

turunnya indeks tersebut. Misalnya, karena produksi akan mempengaruhi harga (produksi naik mengakibatkan suplai naik, apabila daya beli tetap permintaan dan daya beli tetap, maka harga barang tersebut dapat turun. Sebaliknya penurunan produksi menyebabkan harga naik).

Beberapa rumus angka indeks tertimbang adalah sebagai berikut :

1. Rumus Laspeyres a. Indeks harga agregatif tertimbang : Lt,0 = ( ptq0 / p0q0 ) x

100% L = Laspeyres pt = harga waktu t

p0 = harga waktu 0 q0 = produksi waktu 0 sebagai timbangan b. Indeks produksi agregatif tertimbang : Lt,0 = ( p0qt / p0q0 ) x

100%

Page 176: Probabilitas Statistik

qt = produksi waktu t

q0 = produksi waktu 0 p0 = harga waktu 0 sebagai timbangan 2. Rumus Paasche a. Indeks harga agregatif tertimbang : Lt,0 = ( ptqt / p0qt ) x

100% P = Paasche pt = harga waktu t

p0 = harga waktu 0 qt = produksi waktu t, sebagai timbangan b. Indeks produksi agregatif tertimbang : Lt,0 = ( ptqt / ptq0 ) x 100%

qt = produksi waktu t

q0 = produksi waktu 0 pt = harga waktu 0 sebagai timbangan

3. Rumus Irving Fisher

I = akar L x P= akar { { ( ptq0 / p0q0 ) ( ptqt / p0qt ) }

x 100% } 4. Rumus Drobisch

I = ( L x P ) / 2

= { ( ptq0 / p0q0 ) ( ptqt / p0qt ) } x 100%

ANGKA INDEKS BERANTAI It,t- 1 = (qt / qt - 1 ) x 100%

Dimana : qt = ekspor tahun t

qt - 1 = ekspor tahun t – 1

INDEKS RATA – RATA HARGA RELATIF Rumusnya adalah :

It,0 = 1/n ( pt / p0 ) x 100%

Dimana : n = banyaknya jenis barang

Page 177: Probabilitas Statistik

STATISTIK INDUSTRI MODUL 12 PROBABILITAS

1. Pengertian : Probabilitas adakah peluang bahwa sesuatu akan terjadi Suatu nilai yang digunakan untuk mengukur tingkat terjadinya sesuatu

kejadian yang acak 3 kata kunci : eksperimen, hasil (outcome) dan peristiwa (event) Pendekatan : Obyektif : 1. Klasik P (A) = x / n 2. Frekuensi Relatif P (A) = lim fi/n n Subyektif : Didasarkan atas penilaian seseorang dalam menyatakan

tingkat kepercayaan 2. Kejadian :

Interseksi 2 kejadian misal A dan B ditulis A B (dibaca A interseksi B) atau AB, terdiri dari elemen-elemen anggota S yang selain mempunyai sifat atau ciri-ciri A juga B, artinya selain anggota A juga anggota B

Union 2 kejadian A dan B ditulis A B (dibaca A union B) atau A + B merupakan himpunan bagian S yang menjadi anggota A saja atau B saja, atau menjadi A dan B sekaligus

a. Aturan Penjumlahan :

Kejadian saling meniadakan P(A atau B) = P (A B)= P(A)+ P(B) Kejadian tidak saling meniadakan P (A atau B) = P (A) + P (B) - P (A dan B)

Atau P (A B) = P (A) + P (B) - P (A B) b. Aturan Perkalian :

Kejadian tak bebas (bersyarat) : probabilitas kejadian A dengan syarat bahwa B sudah / akan terjadi disebut probabilitas bersyarat

P (A/B) = P (A B) / P (B) atau P (B/A) = P (A B) / P (A) Dengan demikian : P (A B)= P (A) P (B/A =P (B) P (A/B)

P (A) = probabilitas bahwa A terjadi P (B/A) = probabilitas B terjadi dengan syarat A terjadi P (B) = probabilitas bahwa B terjadi P (A/B) = probabilitas A terjadi dengan syarat B terjadi

Kejadian bebas : dua kejadian atau lebih dikatakan merupakan kejadian bebas apabila terjadinya kejadian tersebut tidak saling mempengaruhi. Dua kejadia A dan B dikatakan bebas, kalau kejadian A tidak mempengaruhi B atau sebaliknya Jika A dan B merupakan kejadian bebas, maka : P (A/B) = P(A) dan P(B/A) = P(B) P (A B) = P(A) P(B) = P(B) P(A)

3. Probabilitas Marjinal : Bila R merupakan suatu kejadian sedemikian rupa sehingga salah satu dari kejadian – kejadian yang saling meniadakan S1, S2, ….,Sk harus terjadi

Page 178: Probabilitas Statistik

bersama (joint) dengan salah satu kejadian dari R, kemudian P(R) disebut Probabilitas Marjinal, dan nilai P(R) ditentukan dengan aturan berikut : P(R) = sigma P(RSi) Oleh karena P(RSi) = P(Si)P(R/Si) , maka kita peroleh rumus probabilitas marjinal berikut : k P(R) = sigma ∑ P(Si)P(R/Si) i=1

4. Rumus Bayes Misal suatu himpunan lengkap mengenai berbagai kejadian yang terbagi habis

A1, A2, …., Ai, ….Ak (i = 1,2,….,k). Terjadinya salah satu kejadian, katakan Ai, merupakan salah satu syarat yang diperlukan untuk terjadinya kejadian lainnya, misalnya A yang sudah diketahui sebagai hasil observasi. Maka posterior probability kejadian Ai dengan syarat bahwa A sudah atau akan terjadi dapat dihitung berdasarkan rumus Bayes berikut :

P(Ai) P(A/Ai) P(Ai/A) = ------------------------ k ∑ P(Ai) P(A/Ai) i-1 5. Permutasi Adalah suatu pengaturan atau urutan beberapa elemen atau obyek (missal

hasil suatu eksperimen) dimana urutan itu penting, maksudnya 123 ≠ 213, ABC ≠ BCA dst