Statistika Oleh : R. Fenny Syafariani,...
Transcript of Statistika Oleh : R. Fenny Syafariani,...
Statistika
Oleh : R. Fenny Syafariani, S.Si.,M.Sta
(Digunakan di lingkungan sendiri, sebagai buku ajar
mata kuliah statistika)
Fakultas Teknik dan Ilmu Komputer
Program Studi Sistem Informasi
Universitas Komputer Indonesia
1. Pertemuan 1
Pendahuluan
Kata “statistika” dan “statistik” bukan merupakan kata yang
asing lagi dalam kehidupan sehari-hari. Masyarakat awam sering
salah kaprah dalam mempergunakan kedua kata itu. Jika demikian,
apakah arti kedua kata tersebut sebenarnya?
1.1. Pengertian, statistika sebagai alat bantu, statistika sampel,
statistika populasi, statistika deskriptif dan statistika inferensial.
Kata “statistika” diturunkan dari kata dalam bahasa Latin
status atau Italia statista yang berarti keadaan politik. Di tahun-
tahun awal perkembangannya statistika memiliki konotasi
kumpulan fakta mengenai negara atau penduduk negara tersebut
untuk kepentingan administratif dan politik. Agar
penyelenggaraan pemerintahan di suatu negara dapat
berlangsung baik, pemerintah menyelenggarakan pengumpulan
data mengenai keadaan penduduknya, yang lazim disebut sensus.
Pada saat itu statistika mendapat julukan “ilmu pengetahuan
mengenai negara”. Namun dalam perkembangan selanjutnya,
statistika tidak hanya digunakan untuk mempelajari keadaan
penduduk suatu negara, namun dipergunakan secara sangat luas.
Sir R. A. Fisher memandang ilmu statistika sebagai “matematika
yang diterapkan pada data hasil pengamatan”.
Apa definisi statistika? Pengarang-pengarang buku tentang
statistika memberikan pengertian yang berlainan mengenai
statistika. Dua contoh di antaranya: Spiegel, seorang profesor
matematika di Rensellaer Polytechnic Institute, dalam bukunya
“Theory and Problems of Statistics” menerangkan statistika
sebagai “metode ilmiah untuk mengumpulkan,
mengorganisasikan, meringkas, menyajikan dan menganalisis
data, juga mengambil kesimpulan yang sahih dan membuat
keputusan yang beralasan berdasarkan analisis tersebut;
sedangkan Lind dalam bukunya “Statistical Techniques in
Business and Economics” menyatakan bahwa statistika adalah
adalah ilmu mengumpulkan, mengorganisasikan, menyajikan,
menganalisis, dan menafsirkan data untuk membantu membuat
keputusan dengan lebih efektif”.
Walau berbagai definisi bertebaran dalam banyak
literatur, tetapi pada umumnya terdapat kesamaan maksud, yaitu
bahwa statistika, sebagaimana dijelaskan Spiegel, memuat dua
fase, yaitu statistika deskriptif dan statistika inferensial/induktif.
Statistika deskriptif hanya menggambarkan dan menganalisis
mengenai suatu kelompok tanpa menarik kesimpulan mengenai
kelompok yang lebih besar sedangkan statistika inferensial
berupaya mengambil kesimpulan terhadap populasi berdasarkan
hasil sampling (penarikan contoh). Karena pengambilan sampel
ini bersifat untung-untungan, tentu dalam pengambilan
kesimpulannya terbuka lebar peluang terjadinya kesalahan.
Karena itu statistika inferensial tidak mungkin lepas
hubungannya dengan teori peluang (Probability Theory).
Tadi digunakan istilah populasi dan sampel. Apakah arti
kedua istilah tersebut? Populasi dan sampel tidak lepas
hubungannya dengan dua metode pengambilan data, yaitu sensus
dan sampling (penarikan contoh). Seandainya Anda diminta
untuk menghitung berapa rata-rata tinggi badan seluruh
mahasiswa yang terdaftar di suatu universitas. Cara pertama yang
dapat dilakukan adalah Anda meminta suatu daftar lengkap
mahasiswa dari bagian administrasi kemahasiswaan di
universitas tersebut dan kemudian bagaimana pun caranya Anda
melakukan pengukuran tinggi badan terhadap semua mahasiswa
yang ada dalam daftar itu tanpa terkecuali. Cara inilah yang
disebut dengan cara sensus. Sebagai alternatif, Anda tidak perlu
melakukan pengukuran tinggi badan terhadap semua mahasiswa,
tetapi Anda hanya mengukur tinggi badan terhadap hanya
sebagian saja mahasiswa yang terdapat dalam daftar tersebut,
kemudian berdasarkan data yang diperoleh (dan setelah melalui
suatu perhitungan tertentu) mengambil kesimpulan terhadap rata-
rata tinggi badan seluruh mahasiswa yang terdaftar di universitas
tersebut. Cara inilah yang disebut cara sampling. Jelas cara
pertama (sensus) memerlukan waktu dan sumber daya yang lebih
banyak daripada cara kedua (sampling). Lind menerangkan
populasi dan sampel sebagai berikut. Populasi adalah
keseluruhan individu atau objek yang sedang kita amati atau
hasil-hasil pengukuran yang diperoleh dari individu atau objek
yang kita amati tersebut. Sampel adalah sebagian dari populasi
yang sedang diamati tersebut. Pada contoh mengenai tinggi
badan ini, populasinya adalah seluruh/semua mahasiswa yang
terdaftar di universitas tersebut. Setelah data tinggi badan seluruh
mahasiswa tersebut diperoleh, bisa juga seluruh data ini
dinamakan populasi. Sekarang misalnya digunakan cara kedua,
yaitu cara sampling. Anggaplah terdapat 100 orang mahasiswa
yang diukur tinggi badannya dari antara seluruh mahasiswa yang
terdaftar. Data 100 buah hasil pengukuran tinggi badan ini
dinamakan sampel.
2. Pertemuan 2
Pengumpulan Data
Pengumpulan data dilakukan untuk memperoleh informasi yang
dibutuhkan dalam rangka mencapai tujuan penelitian. Sebelum
melakukan penelitian, seorang peneliti biasanya telah memiliki
dugaan berdasarkan teori yang ia gunakan, dugaan tersebut disebut
dengan hipotesis. Untuk membuktikan hipotesis secara empiris,
seorang peneliti membutuhkan pengumpulan data untuk diteliti
secara lebih mendalam.
2.1. Pengertian data.
Data adalah kumpulan informasi yang diperoleh dari
suatu pengamatan, dapat berupa angka, lambang atau sifat. Data
berasal dari bahasa Latin yakni bentuk jamak dari datum, yang
diartikan sebagai “sesuatu yang diberikan”.
Dalam kehidupan sehari-hari data berarti suatu
pernyataan yang diterima secara apa adanya. Pernyataan ini
adalah hasil pengukuran atau pengamatan suatu variabel yang
bentuknya dapat berupa angka, kata-kata, atau citra.
2.2. Pembagian atau pengelompokkan data dari berbagai sudut
pandang.
A. Jenis Data Menurut Cara Memperolehnya
1. Data Primer
Data primer adalah secara langsung diambil dari objek /
obyek penelitian oleh peneliti perorangan maupun
organisasi. Contoh : Mewawancarai langsung pengguna
angkutan umum untuk meneliti preferensi kepuasan
pengguna.
2. Data Sekunder
Data sekunder adalah data yang didapat tidak secara
langsung dari objek penelitian. Peneliti mendapatkan data
yang sudah jadi yang dikumpulkan oleh pihak lain dengan
berbagai cara atau metode baik secara komersial maupun
non komersial. Contohnya adalah pada peneliti yang
menggunakan data statistik hasil riset dari surat kabar atau
majalah.
B. Macam-Macam Data Berdasarkan Sumber Data
1. Data Internal
Data internal adalah data yang menggambarkan situasi
dan kondisi pada suatu organisasi secara internal. Misal : data
keuangan, data pegawai, data produksi, dsb.
2. Data Eksternal
Data eksternal adalah data yang menggambarkan situasi
serta kondisi yang ada di luar organisasi. Contohnya adalah
data jumlah penggunaan suatu produk pada konsumen,
tingkat preferensi pelanggan, persebaran penduduk, dan lain
sebagainya.
C. Klasifikasi Data Berdasarkan Jenis Datanya
1. Data Kuantitatif
Data kuantitatif adalah data yang dipaparkan dalam
bentuk angka-angka. Misalnya adalah Jumlah penduduk,
jumlah pengguna transportasi umum, luas suatu area, dan
lain-lain.
2. Data Kualitatif
Data kualitatif adalah data yang disajikan dalam bentuk
kata-kata yang mengandung makna. Contohnya seperti
persepsi masyarakat terhadap kinerja pemerintah, anggapan
para ahli mengenai perekonomian di Semarang dan lain-
lain.
D. Pembagian Jenis Data Berdasarkan Sifat Data
1. Data Diskrit
Data diskrit adalah data yang nilainya adalah bilangan
asli. Contohnya adalah berat badan ibu-ibu pkk sumber ayu,
nilai rupiah dari waktu ke waktu, dan lain-sebagainya.
2. Data Kontinyu
Data kontinyu adalah data yang nilainya ada pada suatu
interval tertentu atau berada pada nilai yang satu ke nilai
yang lainnya. Contohnya penggunaan kata sekitar, kurang
lebih, kira-kira, dan sebagainya. Dinas pertanian daerah
mengimpor bahan baku pabrik pupuk kurang lebih 850 ton.
E. Jenis-jenis Data Menurut Waktu Pengumpulannya
1. Data Cross Section
Data cross-section adalah data yang menunjukkan titik
waktu tertentu. Contohnya laporan keuangan per 31
desember 2006, data pelanggan PT. angin ribut bulan mei
2004, dan lain sebagainya.
2. Data Time Series / Berkala
Data berkala adalah data yang datanya menggambarkan
sesuatu dari waktu ke waktu atau periode secara historis.
Contoh data time series adalah data perkembangan nilai
tukar dollar amerika terhadap euro eropa dari tahun 2004
sampai 2006, jumlah pengikut jamaah nurdin m. top dan
doktor azahari dari bulan ke bulan, dll.
3. Pertemuan 3
Penyajian Data
Setelah data dikumpulkan maka data disajikan. Penyajian data
dibuat untuk memberikan deskripsi mengenai data yang telah
dikumpulkan dan memudahkan untuk pengambilan keputusan.
Bentuk penyajian data bisa dalam bentuk daftar atau tabel dan grafik
atau diagram. Tabel (tables) adalahangka yang disusun sedemikian
rupa menurut kategori tertentu sehingga memudahkan pembahasan
dan analisisnya, sedangkan grafik (graphs)merupakan gambar-
gambar yang menunjukkan data secara visual, didasarkan atas nilai-
nilai pengamatan aslinya ataupun dari tabel-tabel yang dibuat
sebelumnya.
3.1. Penyajian data dengan menggunakan table/daftar.
Didasarkan atas pengaturan datanya, tabel dapat dibedakan atas
beberapa jenis, yaitu
I. Tabel Klasifikasi
Tabel klasifikasi adalah tabel yang menunjukkan
pengelompokkan data. Contoh : Tabel jumlah kelahiran di
kota Jepara pada tahun 2010.
II. Tabel Kontingensi
Tabel kontigensi atau biasanya disebut tabel tabulasi
silang atau crosstab merupakan tabel yang disusun
berdasarkan tabulasi data menurut 2 atau lebih kategori.
Berikut ini contoh penyajian data dalam bentuk tabel
kontigensi.
III. Tabel Distribusi Frekuensi
Kabupaten
Semarang Demak Kudus
Tabel distribusi frekuensi adalah susunan data dalam
suatu tabel yang telah diklasifikasikan menurut kelas-kelas
atau kategori tertentu. Dikenal dua bentuk distribusi
frekuensi menurut pembagian kelasnya, yaitu distribusi
frekuensi kualitatif (kategori) dan distribusi frekuensi
kuantitatif (bilangan).Pada distribusi frekuensi kualitatif
pembagian kelasnya didasarkan pada kategori tertentu dan
banyak digunakan untuk data berskala ukur nominal.
Sedangkan kategori kelas dalam tabel distribusi frekuensi
kuantitatif, terdapat dua macam, yaitu kategori data
tunggal dan kategori data berkelompok (bergolong).
Langkah – langkah Distribusi Frekuensi :
Mengurutkan data : dari yang terkecil ke yang terbesar
atau sebaliknya untuk memudahkan dalam melakukan
penghitungan pada langkah ketiga
Membuat ketegori atau kelas data
- Melakukan penturusan atau tabulasi, memasukan nilai ke
dalam interval kelas
a. Tabel Distribusi Frekuensi Relatif
Tabel distribusi frekuensi relatif merupakan tabel
distribusi frekuensi yang dinyatakan dalam bentuk
persentase. Frekuensi relatif merupakan frekuensi yang
dinyatakan dalam angka relatif atau dalam persentase.
Besarnya frekuensi relatif (fr) tiap kelas adalah frekuensi
absolut tiap kelas dibagi seluruh frekuensi dikali 100%.
b. Tabel Distribusi Frekuensi Kumulatif
Seringkali orang tertarik untuk mengetahui dengan
cepat banyaknya data yang memiliki nilai di atas atau di
bawah nilai tertentu. Untuk keperluan itu, kita harus
menyusun tabel frekuensi kumulatif. Frekuensi
kumulatif (fc) dari suatu tabel frekuensi adalah frekuensi
yang dapat menunjukkan jumlah frekuensi yang terletak
di atas atau di bawah suatu nilai tertentu dalam suatu
interval kelas. Jadi tabel distribusi frekuensi kumulatif
adalah tabel frekuensi yang frekuensi tiap kelasnya
disusun berdasarkan frekuensi kumulatif. Frekuensi
kumulatif didapat dengan jalan menjumlahkan
banyaknya frekuensi tiap-tiap kelas.
1. Distribusi Frekuensi Kumulatif “Kurang Dari”
(Less Then) .
Distribusi Frekuensi Kumulatif “Kurang Dari”
merupakan frekuensi yang dapat menunjukan jumlah
frekuensi yang kurang dari nilai tertentu. Frekuensi ini
ditentukan dengan menjumlahkan frekuensi pada kelas-
kelas sebelumnya.
2. Distribusi Frekuensi Kumulatif “Lebih Dari”
(More Then).
Distribusi Frekuensi Kumultaif Lebih Dari
merupakan frekuensi yang dapat menunjukan jumlah
frekuensi yang lebih dari nilai tertentu. Frekuensi ini
ditentukan dengan menjumlahkan frekuensi pada kelas-
kelas sesudahnya.
3.2. Penyajian data dengan menggunakan grafik/diagram. Grafik merupakan gambar-gambar yang menunjukkan
data secara visual, contoh grafik : grafik lingkaran, grafik batang,
grafik garis, grafik titik, grafik lambang, grafik batang dan daun.
1. Grafik/ Diagram Lingkaran
Diagram lingkaran adalah penyajian data statistik
dengan menggunakan gambar yang berbentuk lingkaran.
Bagian-bagian dari daerah lingkaran menunjukkan bagian-
bagian atau persen dari keseluruhan. Untuk membuat
diagram lingkaran, terlebih dahulu ditentukan besarnya
persentase tiap objek terhadap keseluruhan data dan
besarnya sudut pusat sektor lingkaran.
Contoh:
2. Grafik yang dibuat berdasarkan tabel distribusi frekuensi
adalah histogram, poligon dan ogive.
a. Histogram (Histograms)
Histogram merupakan grafik dari distribusi frekuensi
suatu variabel. Tampilan histogram berupa petak-petak
empat persegi panjang. Sebagai sumbu horizontal (absis,
sumbu x) boleh memakai tepi-tepi kelas (class bounderies),
batas-batas kelas (class limits) atau nilai-nilai variabel yang
diobservasi, sedang sumbu vertikal (ordinat, sumbu y)
menunjukan frekuensi. Untuk distribusi
bergolong/kelompok yang menjadi absis adalah nilai tengah
dari masing-masing kelas.
Wilayah Jumlah
Fasilitas Umum
Persentase
Cepu Surakarta Semarang Kudus Blora
12 40 80 20 8
7,5 25 50
12,5 5
Kelas Interval Jumlah Frekuensi (F)
1 215 2122 14
2 2123 4030 3
3 4031 5938 1
4 5939 7846 1
5 7847 9754 1
b. Poligon Frekuensi (Frequency Polygon)
Poligon frekuensi merupakan grafik dari distribusi
frekuensi bergolong suatu variabel. Tampilan poligon
berupa garis-garis patah yang diperoleh dengan cara
menghubungkan puncak dari masing-masing nilai tengah
kelas. Jadi absisnya adalah nilai tengah dari masing-masing
kelas.
c. Ogives (A Cumulative Frequency Distribution)
Ogive merupakan grafik dari distribusi frekuensi
kumulatif suatu variabel. Dalam suatu ogive, yang
digunakan sebagai absis adalah batas kelas (class
bounderies), sedangkan sebagai sumbu vertikal adalah
frekuensi kumulatif. Untuk suatu tabel distribusi frekuensi,
dapat dibuat ogive frekuensi kumulatif “kurang dari”
(positif) dan frekuensi kumulatif “lebih dari” (negatif).
Kelas Nilai Jumlah
Tengah Frekuensi (F)
1 1168.5 14
2 3076.5 3
3 4984.5 1
4 6892.5 1
5 8800.5 1
4. Pertemuan 4
Distribusi Frekuensi (1)
Distribusi frekuensi merupakan suatu uraian atau ringkasan yang
dapat dibuat dalam bentuk tabel suatu kelompok data yang
menunjukkan sebaran data observasi dalam beberapa kelas.
4.1. Membuat table/daftar distribusi frekuensi.
Tahapan-tahapan yang perlu dilakukan untuk membuat tabel
distribusi frekuensi adalah sebagai berikut :
1. Membuat rentang atau selisih nilai terbesar dan terkecil.
2. Membuat jumlah kelas yang dapat diberi lambang k dengan
menggunakan rumus berikut :
Kelas Interval Nilai Tepi
Kelas
Frekuensi kumulatif
Kurang
dari Lebih dari
1 215 2122 214.5 0 20
2 2123 4030 2122.5 14 6
3 4031 5938 4030.5 17 3
4 5939 7846 5938.5 18 2
5 7847 9754 7846.5 19 1 9754.5 20 0
k = 1 + 3.322 log n, n : menunjukkan banyaknya nilai
observasi.
3.Selanjutnya anda tentukan jumlah interval kelas yang diberi
lambang (c), dengan rumus :
Keterangan komponen :
k : Banyaknya kelas
Xn : Nilai observasi terbesar
X1 : Nilai observasi terkecil.
4.Tahap terakhir adalah menentukan batas kelas (tepi bawah dan
tepi atas)
Batas bawah kelas (tepi bawah) menunjukkan kisaran nilai data
terkecil pada suatu kelas (kelompok). Sedangkan batas atas kelas
menunjukkan kemungkinan nilai data terbesar dalam suatu kelas
(kelompok).
Sebagai contoh :
Dalam sebuah kelas bahasa inggiris diperoleh nilai dari 40 siswa
sebagai berikut:
50 53 74 73
75 76 58 67
74 74 73 72
72 73 73 72
79 71 70 75
78 52 74 74
75 74 72 74
75 74 72 68
79 71 79 69
71 70 70 79
Dari data tersebut ingin dibuat sebuah tabel frekuensi
untuk menyajikan data sebaran nilai dari ke 40 siswa saat ujian
bahasa Inggris.
maka;
n =40
k=1+3.322n
k=6.322 ~ 6
c = (79-50)6=4.8~5
Kelas Frekuensi Tepi
Bawah Tepi Atas
50-54 3 49,5 54,5
55-59 1 54,5 59,5
60-64 59,5 64,5
65-69 3 64,5 69,5
70-74 23 69,5 74,5
75-79 10 74,5 79,5
4.2. Membuat distribusi frekuensi relatif dan kumulatif.
Distribusi Frekuensi Realtif
Distribusi frekuensi relatif merupakan suatu jumlah
persentase yang menyatakan banyaknya data pada suatu
kelompok tertentu. Dalam hal ini pembuat distribusi terlebih
dahulu harus dapat menghitung persentase pada masing-masing
kelompok. Distribusi akan memberikan informasi yang lebih
jelas tentang posisi masing-masing bagian dalam keseluruhan,
karena kita dapat melihat perbandingan antara kelompok yang
satu dengan kelompok yang lainnya.
Perhatikan tabel distribusi frekuensi di bawah ini!
Tabel 1
Kelas ke- Nilai Ujian Frekuensi fi
1
2
3
4
5
6
7
31 – 40
41 – 50
51 – 60
61 – 70
71 – 80
81 – 90
91 – 100
2
3
5
13
24
21
12
Jumlah 8
frekuensi relatif kelas ke-1:
fi = 2; n = 80
Frekuensi relatif = 2/80 x 100% = 2.5%
Dengan cara yang sama diperoleh frekuensi relatif untuk kelas
selanjutnya adalah sebagai berikut.
Tabel 2
Kelas ke- Nilai Ujian Frekuensi relatif (%)
1
2
3
4
5
6
7
31 – 40
41 – 50
51 – 60
61 – 70
71 – 80
81 – 90
91 – 100
2.50
3.75
6.25
16.25
30.00
26.25
15.00
Jumlah 100.00
Distribusi Frekuensi Kumulatif
Variasi lain dari distribusi frekuensi standar adalah
frekuensi kumulatif. Terdapat dua jenis
Tabel Distribusi Frekuensi kumulatif, yaitu "kurang dari" dan
"lebih dari".
Distribusi Frekuensi kumulatif "kurang dari"
menyatakan frekuensi total yang ada di bawah
batas bawah. Distribusi Frekuensi kumulatif "kurang dari" untuk
suatu kelas merupakan nilai frekuensi untuk kelas tersebut
ditambah dengan jumlah frekuensi semua kelas sebelumnya.
Tabel distribusi frekuensi kumulatif ini berfungsi untuk
mengetahui berapa banyak data yang ada di bawah suatu nilai.
Ada pun Distribusi Frekuensi kumulatif "lebih dari atau
sama dengan" menyatakan frekuensi total yang ada di atas atau
sama dengan batas bawah. Distribusi Frekuensi kumulatif "lebih
dari atau sama dengan" untuk suatu kelas merupakan nilai total
frekuensi seluruh kelas dikurang frekuensi kelas tersebut.
Tabel distribusi frekuensi kumulatif ini berfungsi untuk
mengetahui berapa banyak data yang ada di atas suatu nilai.
Tabel berikut merupakan Tabel Distribusi Frekuensi
kumulatif "kurang dari" yang diperoleh dari tabel 1 di atas.
Perhatikan bahwa kolom frekuensi selain label headernya diganti
dengan frekuensi kumulatif "kurang dari", batas-batas kelas
diganti dengan “kurang dari” ekspresi yang menggambarkan
kisaran nilai-nilai baru.
Tabel 3
Nilai Ujian Frek. kum. lebih dari atau
sama dengan
lebih dari atau sama dengan 31
lebih dari atau sama dengan 41
lebih dari atau sama dengan 51
lebih dari atau sama dengan 61
lebih dari atau sama dengan 71
lebih dari atau sama dengan 81
lebih dari atau sama dengan 91
lebih dari atau sama dengan
101
80
78
75
70
57
33
12
0
5. Pertemuan 5
Distribusi Frekuensi (2)
5.1. Membuat ogive.
Ogive adalah grafik yang digambarkan berdasarkan data yang
sudah disusun dalam bentuk tabel distribusi frekuensi kumulatif.
Untuk data yang disusun dalam bentuk tabel distribusi frekuensi
kumulatif kurang dari, grafiknya berupaogive positif, sedangkan
untuk data yang disusun dalam bentuk tabel distribusi frekuensi
kumulatif lebih dari, grafiknya berupa ogive negatif.
Data upah karyawan sebelumnya dapat digambarkan ogivenya.
Akan tetapi sebelum itu, buat terlebih dahulu tabel distribusi
frekuensi kumulatifnya.
Dari tabel distribusi frekuensi kumulatif di atas, dapat
digambarkan ogive seperti pada diagram berikut.
5.2. Histogram dan poligon frekuensi.
Histogram
Pengertian Histogram dan Cara Membuatnya – Dalam Statistik,
Histogram merupakan tampilan bentuk grafis untuk menunjukkan
distribusi data secara visual atau seberapa sering suatu nilai yang
berbeda itu terjadi dalam suatu kumpulan data. Histogram juga
merupakan salah satu alat dari 7 alat pengendalian kualitas (QC 7
Tools). Manfaat dari penggunaan Histogram adalah untuk
memberikan informasi mengenai variasi dalam proses dan membantu
manajemen dalam membuat keputusan dalam upaya peningkatan
proses yang berkesimbungan (Continous Process Improvement).
Langkah-langkah Membuat Histogram
Berikut ini adalah Langkah-langkah yang diperlukan dalam
membuat Histogram :
1. Mengumpulkan data Pengukuran
Data yang untuk membuat Histogram adalah data pengukuran
yang berbentuk Numerik.Sebagai contoh:
Seorang Engineer ingin mengumpulkan data pengukuran untuk
panjangnya kaki komponen A seperti tabel dibawah ini :
2. Menentukan besarnya Range
Sebelum menentukan Besarnya nilai Range, kita perlu
mengetahui Nilai terbesar dan Nilai Terkecil dari seluruh data
pengukuran kita. Cara untuk menghitung Nilai Range (R) adalah :
R = Xmaks – Xmins
atau
Range = Nilai terbesar – Nilai terkecil
Catatan :
Jika anda menggunakan Excel , anda bisa memakai Function :
Mencari Nilai Terbesar : @MAX( nomor cell awal : nomor cell
akhir)
Mencari Nilai Terkecil : @MIN(nomor cell awal : nomor cell
akhir)
Untuk contoh diatas, Besarnya Nilai Range adalah 0.6 dengan
perhitungan dibawah ini:
Range = 3.2 – 2.6
Range = 0.6
3. Menentukan Banyaknya Kelas Interval
Sebagai Pedoman, terdapat Tabel yang menentukan Kelas
Interval-nya sesuai dengan banyaknya Jumlah Sample Unit pada Data
Pengukuran.
Untuk contoh kasus diatas, banyaknya sampel data pengukuran
adalah 50 data, maka kita memilih banyaknya kelas interval adalah 7
buah (menurut tabel adalah 6 sampai 10).
4. Menentukan Lebar Kelas Interval, Batas Kelas, dan Nilai
Tengah Kelas
4.1. Menentukan Lebar Kelas Interval :
Yang menentukan Lebar setiap kelas Interval adalah
pembagian Range (Langkah 2) dan Banyaknya Interval Kelas
(Langkah 3).
Kasus yang sama, untuk cara menghitung Lebar Kelas
Interval adalah :
Lebar = Range / Kelas Interval
Lebar = 0.6 / 7
Lebar = 0.1 (dibulatkan)
4.2. Menentukan Batas untuk setiap Kelas Interval :
Untuk menentukan Batas untuk setiap kelas Interval, kita
memakai rumus :
Nilai terendah – ½ x unit pengukuran
(dalam kasus ini kita memakai unit pengukuran 0.1)
Batas Kelas Pertama :
Menentukan Batas bawah Kelas pertama :
2.6 – ½ x 0.1= 2.55
Selanjutnya Batas Bawah kelas pertama ditambah
dengan Lebar Kelas Interval untuk menentukan Batas atas
kelas pertama :
2.55 + 0.1 = 2.65
Batas Kelas Kedua :
Menentukan Batas bawah Kelas Kedua :
Batas Bawah Kedua adalah Batas Atas Kelas Pertama, yaitu :
2.65
Batas Atas Kedua adalah Batas Bawah Kedua ditambah
dengan Lebar Kelas Interval yaitu : 2.65 + 0.1 = 2.75
Batas Kelas Ketiga dan seterusnya :
Dilanjutkan ke kelas ketiga dan seterusnya seperti cara untuk
menentukan Batas Kelas Kedua.
4.3. Menentukan Nilai Tengah setiap Kelas Interval :
Nilai Tengah Kelas Pertama :
Nilai Tengah Kelas Pertama = batas atas + batas bawah kelas
Pertama / 2
= 2.55 + 2.65 / 2
= 2.6
Nilai Tengah Kelas kedua dan seterusnya :
Nilai Tengah Kelas kedua dan seterusnya
mempergunakan cara yang sama seperti menghitung Nilai
Tengah Kelas Pertama.
5. Menentukan Frekuensi dari Setiap Kelas Interval
Untuk mempermudah perhitungan, pakailah tanda
“Tally” pengelompokkan 5 (lima) untuk menghitung satu per
satu jumlah frekuensi yang jatuh dalam kelas Interval.
Masih kasus yang sama, berikut ini tabel hasil
perhitungannya :
6. Membuat Grafik Histogram
1. Membuat Garis Horizontal dengan menggunakan skala
berdasarkan pada unit pengukuran data
2. Membuat Garis Vertikal dengan menggunakan skala
frekuensi
3. Menggambarkan Grafik Batang, tingginya sesuai dengan
Frekuensi setiap Kelas Interval
4. Jika terdapat batasan Spesifikasi yang ditentukan oleh
Customer (Pelanggan) maka tariklah garis vertikal sesuai
dengan spesifikasi tersebut.
Poligon Frekuensi
Poligon Frekuensi merupakan grafik garis yang menghubungkan
nilai tengah tiap sisi atas yang berdekatan dengan nilai tengah jarak
frekuensi mutlak masing-masing.
Perbedaan antara histogram dengan poligon frekuensi adalah :
Histogram menggunakan batas kelas sedangkan poligon
menggunakan titik tengah.
Grafik histogram berwujud segiempat atau menyerupai diagram
batang, sedangkan poligon berwujud garis atau kurva yang saling
berhubungan satu sama lain.
Langkah-langkah membuat POLIGON FREKUENSI :
1. Buat titik tengah kelas dengan cara : (NILAI UJUNG BAWAH
KELAS + NILAI UJUNG ATAS KELAS) x ½
2. Buat tabel distribusi frekuensi yang MUTLAK disertai dengan
kolom tambahan berupa kolom titik tengah kelas tsb.
3. Buat grafik poligon frekuensi dengan melihat data pada tabel
distribusi frekuensi mutlak
a. Buat TITIK TENGAH KELAS
Titik tengah kelas ke-1 : (45 + 51) x ½ = 48
Titik tengah kelas ke-2 : (52 + 58) x ½ = 55
Titik tengah kelas ke-3 : (59 + 65) x ½ = 62
Titik tengah kelas ke-4 : (66 + 72) x ½ = 69
Titik tengah kelas ke-5 : (73 + 79) x ½ = 76
Titik tengah kelas ke-6 : (80 + 86) x ½ = 83
b. Buat Tabel Distribusi Frekuensi Mutlak dengan menambah kolom
TITIK TENGAH KELAS
c. Buat grafik poligon frekuensi
6. Pertemuan 6
Ukuran – statistika (1)
Ukuran statistik adalah bilangan yang diperoleh dari sekumpulan
data statistic melalui proses sritmatik tertentu. Ukuran yang dihitung
dari kumpulan data sampel dinamakan statistic sedangkan apabila
dihitung dari kumpulan data populasi dinamakan paramater.
6.1. Ukuran Gejala Pusat.
Suatu ukuran nilai yang diperoleh dari nilai data observasi dan
mempunyai
kecenderungan berada ditengah - tengah nilai data observasi.
Ukuran gejala
pusat dipakai sebagai alat atau sebagai parameter untuk dapat
digunakan
sebagai bahan pegangan dalam menafsirkan suatu gejala atau
suatu yang
akan diteliti berdasarkan hasil pengolahan daa yang
dikumpulkan.
Beberapa ukuran gejala pusat yaitu :
A. Rata - rata hitung (Mean)
Rata - rata adalah setiap bilangan yang bisa dipakai sebagai
wakil dari rentetan nilai rata-rata itu, wujudnya berupa satu
bilangan saja namun dapat mencerminkan gambaran secara
umum mengenai kumpulan atau deretan bahan keterangan
berupa angka atau bilangan itu. Mean adalalah jumlah dari
keseluruhan bilangan yang ada dibagi dengan banyaknya angka
bilangan tersebut.
Jenis - jenis Mean yaitu :
- Mean data tidak terkelompok
Rumus :
Mean data terkelompok
Rumus :
B. Median
Median adalah titik tengah dari keseluruhan satuan data.
Oleh karena itu terdapat 50% data yang berapa dibawah atau
sama dengan nilai tersebut dan 50% data yang berada diatas atau
sama dengan data tersebut.
Jenis - jenis median yaitu :
- Median data tidak terkelompok
Suatu data yang membagi sekelompok data menjadi 2
bagian sama banyaknya.
Rumus :
Median data terkelompok.
C. Modus
Umumnya modus dipakai sebagai "nilai rata-rata" bagi data
kualitatif yang digunakan sebagai sebuah kesimpulan. Data
observasi yang mempunyai 2 modus disebut bimodus dan data
observasi yang mempunyai lebih dari 2 modus disebut bimodus.
Jenis - jenis modus :
- Modus data tidak terkelompok
Merupakan data yang paling sering muncul atau jumlah
frekuensi terbanyak.
- Modus data terkelompok
Data yang disusun secara terkelompok karena
menggunakan daftar distribusi. Biasanya digunakan untuk
data yang besar/data yang berbobot maupun data yang
tidak berbobot.
Hubungan antara Mean, Median, dan Modus adalah
dapat digunakan untuk mengetahui kemiringan kurva poligon
distribusi frekuensi data observasi.
1. Mean = Median = Modus => Kurvanya simetris
2. Mean < Median < Modus => Bentuk kurvanya miring ke kiri
3. Mean > Median > Modus => Bentuk kurvanya miring ke kanan
6.2. Ukuran Letak.
A. Kuartil
Untuk menentukan kuartil dengan cara :
1. Susun data menurut urutan nilainya
2. Tentukan letak kuartil
3. Tentukan nilai kuartil
Jenis-jenis kuartil :
- Kuartil data tidak terkelompok
Suatu data yang membagi sekelompok data yang sudah
diurutkan menjadi empat bagian yang sama banyaknya, makan
akanditemukan K1, K2, K3 atau Q1, Q2, Q3
- Kuartil data terkelompok
B. Desil
Jika kumpulan data dibagi menjadi 10 bagian yang sama
banyak, maka tiap bagian tersebut persepuluhan atau disebut
desil. Cara menentukan Desil sama seperti menentukan cara
kuartil.
Jenis-Jenis Desil
- Desil data tidak terkelompok
- Desil data terkelompok
C. Persentil
Merupakan ukuran letak yang paling halus karena
pembagiannya 1 sampai 9.
Jenis-jenis Persentil :
- Persentil data tidak terkelompok
- Persentil data terkelompok
7. Pertemuan 7
Ukuran – statistika (2)
7.1. Ukuran Variabilitas.
Variabilitas adalah derajat penyebaran nilai-nilai variabel dari
suatu tendensi sentral dalam suatu distribusi. Variabilitas disebut
juga sebagai dispersi. Jika dua distribusi, misalnya distribusi A dan
B diperbandingkan. Distribusi A menunjukkan penyebaran nilai-nilai
yang lebih besar dari distribusi B, maka dikatakan distribusi A
mempunyai variabilitas yang lebih besar dari distribusi B.
Variabilitas dapat diketahui melalui pengukuran :
1. Range
2. Mean deviation
3. Standard deviation
(1) Range adalah jarak antara nilai tertinggi dengan nilai
terendah.
R = Xt – Xr
R = Range
Xt = nilai tertinggi
Xr = nilai terendah
Kelemahan Range:
1. Penggunaannya sangat terbatas.
2. Sangat tergantung pada nilai tertinggi dan nilai
terendah sehingga mempunyai fluktuasi yang sangat
besar.
3. Range kurang memenuhi definisi sebagai alat
pengukuran variabilitas karena tidak dapat
menunjukkan letak tendensi sentral dan
penyebarannya/ tidak menunjukkan bentuk
distribusi.
Range 10-90
Nilai-nilai yang ekstrem (terlalu rendah atau terlalu
tinggi) adalah nilai-nilai yang tidak stabil.
Untuk menghindari nilai-nilai yang tidak stabil itu,
maka diambil range yang lebih sempit yaitu range
antara persentil ke-10 dengan persentil ke-90.
Range 10-90 memotong distribusi sebanyak 20
persen, yaitu masing-masing 10 persen pada tiap
ujungnya.
Rumus R 10-90 = P90 – P10
Kelemahan : masih tergantung pada nilai-nilai di
bagian ujung distribusi
Range 25-75
Range 25-75 memotong 25 persen dari tiap-tiap
ujung distribusi atau 50 persen frekuensi distribusi.
Disebut juga sebagai “Range antar Kwartil”
R 25-75 = P75 – P25 = K3 – K1
Masih memiliki kelemahan karena masih memiliki
sifat-sifat Range Range Semi Antar Kwartil
Range Semi Antar Kwartil (RSAK) adalah separo
dari range antar kwartil.
RSAK = P75 – P25 = ½ (K3 – K1)
2
Memiliki sifat yang lebih baik daripada range
range sebelumnya.
Biasanya digunakan bersama-sama dengan median.
Median sebagai tendensi sentral dan RSAK untuk
mengetahui variabilitasnya.
(2) Mean Deviation
Mean Deviation = Average Deviation = Deviasi
Rata-rata Adalah rata-rata dari deviasi nilai-nilai
dari mean dalam suatu distribusi, diambil nilai
absolutnya.
Deviasi absolut = nilai-nilai yang positif.
MD = ? |x| atau MD = ? f|x|
N N
MD = Mean deviation
? |x| = Jumlah deviasi dalam harga mutlaknya
N = Jumlah individu / kasus
Kelebihan dan Kekurangan MD
Kelebihan :
Mulai dipenuhinya definisi variabilitas, yaitu
penyebaran nilai-nilai yang ditinjau dari
tendensi sentral
Tidak membuang data sedikitpun. Nilai yang
ekstrem tetap dipakai.
Kelemahan :
Cara penghitungannya mengabaikan tanda-
tanda plus dan minus, sehingga tidak dapat
dikenai perhitungan matematik yang
mempertahankan nilai plus dan minus.
(3) Standard Deviation
Secara matematis, SD adalah akar dari jumlah
deviasi kuadrat dibagi banyaknya individu atau
akar dari rata-rata deviasi kuadrat.
SD = ? ? x2 dimana M = ? x
N N
SD = Standard Deviasi (? )
? x2 = Jumlah deviasi kuadrat
N = jumlah individu/kejadian dalam distribusi
8. Pertemuan 8
UTS
9. Pertemuan 9
Dasar-dasar Teori Peluang (Probabilitas) (1)
Probabilitas didifinisikan sebagai peluang atau kemungkinan
suatu kejadian, suatu ukuran tentang kemungkinan atau derajat
ketidakpastian suatu peristiwa (event) yang akan terjadi di masa
mendatang.Rentangan probabilitas antara 0 sampai dengan 1. Jika
kita mengatakan probabilitas sebuah peristiwa adalah 0, maka
peristiwa tersebut tidak mungkin terjadi. Dan jika kita mengatakan
bahwa probabilitas sebuah peristiwa adalah 1 maka peristiwa tersebut
pasti terjadi. Serta jumlah antara peluang suatu kejadian yang
mungkin terjadi dan peluang suatu kejadian yang mungkin tidak
terjadi adalah satu, jika kejadian tersebut hanya memiliki 2
kemungkinan kejadian yang mungkin akan terjadi.
9.1. Permutasi dan Kombinasi.
Permutasi
Permutasi adalah suatu penyusunan atau pengaturan beberapa
objek ke dalam suatu urutan tertentu.
Contoh :
Ada 3 objek, yaitu ABC. Pengaturan objek-objek tersebut ialah
ABC, ACB, BCA, BAC, CAB, CBA yang disebut permutasi.
Jadi, permutasi 3 objek menghasilkan enam pengaturan dengan
cara yang berbeda.
Rumus-rumus Permutasi :
Permutasi dari m objek seluruhnya tanpa pengembalian : mPm
= m!
Contoh :
Pada suatu tempat terdapat 4 buku matematika yang
berbeda. Buku itu akan disusun pada sebuah rak buku. Berapa
cara susunan yang mungkin dari buku-buku matematika dapat
disusun.
Penyelesaian :
Buku-buku matematika dapat disusun dalam :
4P4 = 4! = 4 x 3 x 2 x 1 = 24 cara.
Permutasi sebanyak x dari m objek tanpa pengembalian :
Contoh :
Dari empat calon pimpinan sebuah perusahaan, misalkan A, B,
C, D hendak dipilih seorang ketua, seorang sekretaris, dan
seorang bendahara.
Berapa cara keempat calon tersebut dipilih?
Penyelesaian:
m = 4 dan x = 3
4P3 =
Permutasi dari m objek dengan pengembalian :
mPx = mx
x ≤ m dan bilangan bulat positif
Contoh :
Tentukan permutasi dari ABC sebanyak 2 unsur dengan
pengembalian unsure yang terpilih!
Penyelesaian :
M = 3 dan x = 2
3P2 = 32 = 9
yaitu : AA, AB, AC, BB, BA, BC, CC, CA, CB
Permutasi dari m objek yang sama :
m!
mPm1, m2, m3, … = ———————–
m1! . m2! . m3! ….
Dengan m1 + m2 + m3 + ….= m
Contoh :
Tentukan permutasi dari kata “TAMAT”
Penyelesaian :
M = 5, m1 = 2, m2 = 2, m3 = 1
5! 5 x 4 x 3 x 2 x 1
5P2, 2, 1 = ————— = ——————– = 30
2! . 2! . 1! 2 x 1 x 2 x 1 x 1
Kombinasi
Kombinasi adalah suatu penyusunan beberapa objek
tanpa memperhatikan urutan objek tersebut.
Contoh :
Ada 4 objek, yaitu : A, B, C, D. Kombinasi 3 dari objek itu adalah
ABC, ABD, ACD, BCD. Setiap kelompok hanya dibedakan
berdasarkan objek yang diikutsertakan, bukan urutannya. Oleh
karena itu :
ABC = ACB = BAC = BCA = CAB = CBA
ABD = ADB = BAD = BDA = DAB = DBA
ACD = CAD = ADC = CDA = DAC = DCA
BCD = BDC = CBD = CDB = DBC = DCB
Rumus-rumus Kombinasi :
Kombinasi x dari m objek yang berbeda :
m!
mCx = ————–
(m – x)!.x!
Contoh :
Dari 5 pemain bulu tangkis, yaitu A, B, C, D, dan E hendak
dipilih dua orang untuk pemain ganda. Berapa banyak pemain
ganda yang mungkin terbentuk?
Penyelesaian :
M = 5 dan x = 2
5!
5C2 = —————- = 10
– 2)! . 2!
9.2. Aturan Probabilitas. Berikut merupakan aturan dalam probabilitas
Jika n = 0 makka peluang terjadinya suatu kejadian pada
keadaan ini adalah sebesar P(A) = 0 atau tidak mungkin
terjadi.
Jika n merupakan semua anggota N maka
probabilitasnya adalah satu, atau kejadian tersebut pasti
akan terjadi
Probabilitas suatu kejadian memiliki rentangan nilai
Jika E menyatakan bukan peristiwa E maka berlaku
9.3. Hukum-hukum Probabilitas
1. Peluang Untuk Peristiwa Yang Tidak Saling Lepas
(Inclusive Event)
Dua peristiwa atau lebih dikatakan peristiwa yang tidak
saling lepas apabila peristiwa peristiwa tersebut dapat terjadi
bersamaan, namun tidak selalu terjadi bersamaan, atau
memiliki bagian titik sampel yang sama.(dihubungkan
dengan kata ”atau”)
Rumus :
P(AUB) = P(A) + P(B) – P(AnB)
2. Peluang Untuk Peristiwa Yang Saling Lepas (Exclusive
Event)
Dua perstiwa atau lebih dikatakan peristiwa yang saling
lepas apabila peristiwa peristiwa tersebut tidak dapat terjadi
bersamaan atau memiliki titik sampel yang berbeda pada
suatu ruang sampel. (dihubungkan dengan kata “atau”)
Rumus :
P(AUB) = P(A) + P(B)
Contoh Soal :
Pada sebuah kantong, terdapat 10 butir kelereng warna
merah, 7 butir kelereng warna kuning, dan 8 butir kelereng
warna hijau. Jika Andi ingin mengambil 1 butir kelereng,
berapakah peluang terambilnya kelereng warna merah atau
kuning?
3. Peluang Untuk Peristiwa Yang Komplementer
2 peristiwa atau lebih dikatakan komplementer apabila
anggota himpunan pada peristiwa yang satu bukan merupakan
anggota himpunan pada peristiwa lainnya, dan jumlah dari
seluruh anggota himpunan itu adalah 1.
Rumus :
P(A) = 1 - P(Ā) atau P(Ā) = 1 - P(A) atau P(Ā) + P(A) = 1
Contoh Soal :
Sasa mengikuti sebuah perlombaan statistik untuk seluruh
Mahasiswa se-Jawa Barat, jika peluang Sasa masuk ke babak
final sebesar 65%, berapakah peluang ia gagal masuk babak
final?
Jawab :
A = lolos
Ā = tidak lolos
P(A) = Peluang lolos ke babak final = 65% = 0,65
P(Ā) = Peluang tidak lolos ke babak final
Maka,
P(Ā) = 1 – P(A)
= 1 – 0.65
= 0,35 = 35 %
Jadi, peluang Sasa gagal masuk ke babak final adalah sebesar
35%.
4. Peluang Untuk Peristiwa Yang Independent (Independent
Event)
Dua peristiwa atau lebih dikatakan Independent apabila
peristiwa yang satu tidak mempengaruhi peristiwa yang
lainnya.(dihubungkan dengan kata “dan”)
Rumus :
P(A n B) = P(A) . P(B)
10. Pertemuan 10
Dasar-dasar Teori Peluang(Probabiltas) (2)
10.1. Probabilitas Bersyarat.
Untuk dua kejadian A dan B, peluang bersyarat dari A, adalah
peluang A dimana B telah terjadi (atau tidak terjadi).
Peluang bersyarat A dimana B didefinisikan sebagai
P(A | B) =
P(A ∩ B)
P(B)
Jika kejadian A dan B saling bebas (independen), P(A ∩ B) =
P(A)P( B).
Sehingga
P(A | B) = P(A)
P(B | A) = P(B)
Jika kejadian A dan B saling terpisah, P(A ∩ B) = 0.
Sehingga, jika P(B) > 0, maka P(A | B) = 0.
Contoh:
Di sebuah daerah, peluang bahwa suatu hari akan berawan adalah
0.4. Diketahui juga bahwa peluang suatu hari berawan dan hujan
adalah 0.3. Jikalau hari ini berawan, berapakah peluang bahwa
hari ini akan hujan?
Marilah kita lambangkan kejadian hari berawan dengan A dan
kejadian hari hujan dengan H.
P(A) = 0.4
P(H ∩ A) = 0.3
P(H | A) =P(H ∩ A)
P(A)
= 0.3
0.4
= 0.75
10.2. Probabilitas Bivariat.
Suatu fungsi fX,Y (x, y) dikatakan fungsi peluang bivariat jika
• fX,Y (x, y) ≥ 0, untuk semua x, y
• ∫ ∫ ∫ 𝑓∞
−∞
∞
−∞𝑋, 𝑌 (x, y) dxdy = 1
Jika fX,Y (x, y) fungsi peluang bivariat maka
FX,Y (x, y) = P(X ≤ x, Y ≤ y) = ∫ ∫ 𝑓𝑥, 𝑦(𝑢, 𝑣)𝑑𝑣𝑑𝑢𝑦
−∞
x
−∞
Sifat-sifat fungsi distribusi bivariat:
1. FX,Y (x,∞) = FX(x)
2. FX,Y (∞, y) = FY (y)
3. FX,Y (∞, ∞) = 1
4. FX,Y (−∞, y) = FX,Y (x, −∞) = FX,Y (−∞, −∞) = 0
5. fX,Y (x, y) = ∂2
∂x ∂y FX,Y (x, y)
fX,Y (x, y)△x△y adalah unsur peluang bersama,
P(x ≤ X ≤ x + △x, y ≤ Y ≤ y + △y) = fX,Y (x, y)△x△y + o(△x△y)
Contoh/Latihan:
1. Jika (X, Y ) ∼ U(a, b, c, d) maka
fX,Y (x, y) = 1
(b − a)(d − c), x ∈ (a, b), y ∈ (c, d)
2. Untuk soal no 1 di atas, misalkan a = c = 0, b = 4, d = 6 maka
P(2.5 ≤ X ≤ 3.5, 1 ≤ Y ≤ 4) = 3/24
P(𝑋2 + 𝑌2 > 16) = 1 − P(𝑋2 + 𝑌2≤ 16) = 1 − π/6
3. Jika fX,Y (x, y) = (6/5) (x+𝑦2) untuk x ∈ (0, 1) dan y ∈ (0, 1).
Tentukan
P(X + Y < 1).
P(X + y < 1) = P(X < 1 − Y ) = ∫ ∫ 𝑓1−y
0
1
0𝑥, 𝑦(𝑥, 𝑦)𝑑𝑥 𝑑𝑦
= · · ·
= 3/10
Untuk menentukan fungsi peluang marginal, integralkan “peubah
yang tidak
diinginkan”:
fX(x) = ∫ 𝑓𝑥, 𝑦(𝑥, 𝑦)𝑑𝑦∞
−∞
fY (y) = ∫ 𝑓𝑥, 𝑦(𝑥, 𝑦)𝑑𝑥∞
−∞
fX,Y (x, y) = ∫ ∫ 𝑓∞
−∞
∞
−∞𝑤, 𝑥, 𝑦, 𝑧(𝑤, 𝑥, 𝑦, 𝑧)𝑑𝑣𝑑𝑧
Pada fungsi peluang fX,Y (x, y) = 6/5(x + 𝑦2) diperoleh
fX(x) = 16 x + 2
5, x ∈ (0, 1)
fY (y) = 2+3
5, y ∈ (0, 1)
dan nilai harapan
E(g(X, Y )) =
E(X) = ∫ ∫ 𝑔(𝑥, 𝑦)𝑓∞
−∞
∞
−∞𝑥, 𝑦 (𝑥, 𝑦)𝑑𝑥𝑑𝑦 = ⋯ = 3/5
10.3. Theorema Bayes
Teorema Bayes, diambil dari nama Rev. Thomas Bayes,
menggambarkan hubungan antara peluang bersyarat dari dua
kejadian A dan B sebagai berikut:
P(A | B) =P(B | A) P(A)
P(B)
atau
P(A | B) = P(B | A) P(A)
P(B | A)P(A) + P(B | A)P(A)
11. Pertemuan 11
Distribusi Peluang (1)
Distribusi peluang adalah sebaran kemungkinan terjadinya
variable acak tertentu. Variable acak adalah peristiwa yang
diharapkan akan terjadi, yang biasanya dilambangkan dengan X.
Atau, suatu bilangan yang ditentukan oleh peristiwa yang dihasilkan
dari eksperimen.
11.1. Distribusi gabungan variable random diskrit.
Variabel random diskrit adalah suatu fungsi yang memetakan
setiap anggota Ruang Sampel S ke bilangan Real. Dalam statistika,
variabel random diskrit disimbolkan dengan huruf-huruf kapital
misalkan X, Y, Z, dll. Variabel acak yang mampu menjalani
bilangan bulat adalah Variabel Acak Diskrit, sedangkan variabel
acak yang mampu menjalan bilangan real adalah Variabel random
Kontinu. Misalkan X adalah variabel acak diskrit maka fungsi
kepadatan probabilitas (probability density funcon, PDF) dapat
didefinisikan sebagai
Dengan kata lain, fungsi pX(x) adalah fungsi distribusi
probabilitas dari X untuk variabel acak diskrit. PDF dari variabel
acak diskrit X harus memenuhi sifat-sifat berikut:
Misalkan X merupakan variabel acak diskrit maka fungsi
kepadatan kumulatif (cumulative density function, CDF) dapat
didefinisikan sebagai.
Dengan kata lain, fungsi FX(x) adalah fungsi distribusi dari X
untuk variabel acak diskrit. CDF dari variabel acak diskrit X dapat
diilustrasikan sebagai berikut.
Jika pX(x) merupakan PDF dari variabel acak diskrit X, maka
terdapat relasi antara PDF dan CDF, yaitu
Dan
Contohnya, dalam suatu keluarga yang memiliki dua anak, distribusi
probabilitas dari banyaknya anak yang terlahir perempuan akan
mengikuti ketentuan ini
Nilai mean dan varian dari banyaknya anak yang terlahir
perempuan akan dihitung sebagai berikut:
Misalkan X adalah banyaknya anak yang sukses terlahir
perempuan, maka
Dan
Jadi, diperoleh mean dan varian dari banyaknya anak yang
terlahir perempuan pada suatu keluarga yang memiliki dua anak
masing-masing adalah 1 dan 0,5 .
11.2. Distribusi binomial.
Distribusi Binomial merupakan distribusi probabilitas dari
banyaknya outcome/kejadian sukses pada n percobaan Bernoulli.
Fungsi kepadatan probabilitas (PDF) dari variabel acak X Binomial
dirumuskan sebagai
Sedangkan, fungsi kepadatan kumulatif (CDF) dari variabel acak X
Binomial adalah
Sebagai Contoh, seorang peneliti ingin meneliti obat A untuk
penyakit asma. Berdasarkan survey ditemukan lima puluh dari
seratus orang yang sembuh dari penyakit asma setelah meminum obat
ini. Jika 20 orang penderita asma diambil secara acak dan diberi
minum obat A, maka tentukan probabilitas bahwa:
a. tepat 10 orang yang sembuh.
b. maksimal 2 orang yang sembuh.
Misalkan X adalah banyak orang yang sembuh penyakit Asma
setelah meminum obat A; maka p = 50/100 = 0,50 , q = 1 – p = 1 –
0,50 = 0,50 dan n = 20 , sehingga:
a. probabilitas tepat 10 orang yang sembuh adalah
b. probabilitas maksimal 2 orang yang sembuh adalah
11.3. Distribusi hipergeometris.
Distribusi Hipergeometris merupakan distribusi probabilitas
dari banyaknya outcome/kejadian sukses pada populasi sebesar N
yang memiliki m elemen dengan kejadian sukses dan N – m
elemen lainnya dengan kejadian gagal yang mana percobaan ini
dilakukan pada n sampel. Fungsi kepadatan probabilitas (PDF) dari
variabel acak X Hipergeometris dirumuskan
Sedangkan, fungsi kepadatan kumulatif (CDF) diskrit dari
variabel acak X Hipergeometris adalah
Sebagai contoh, suatu panitia pemilihan dibentuk berdasarkan
6 orang yang diambil secara acak dari 15 orang yang mendaftar.
Enam puluh persen diantaranya adalah wanita. Jika X variabel
acak yang menyatakan banyaknya wanita yang terpilih, maka
dihitung probabilitas tepat 2 wanita dalam panitia tersebut.
Misalkan X adalah banyaknya wanita yang terpilih dalam
kepanitiaan, maka x = 2, n = 6 , N = 15, dan m = 60% dari N =
(0,60)(15) = 9 , sehingga probabilitas tepat 2 wanita dalam panitia
tersebut adalah
Sebagai tambahan, nilai mean dan varian dari variabel acak
diskrit X berdistribusi Hipergeometrik masing-masing adalah
Dan
Ketika n/N ≤ 0,05 distribusi Hipergeometrik dapat didekati
dengan distribusi Binomial dengan parameter n dan p = m/N.
Selanjutnya, nilai mean dan varian dari variabel acak diskrit X
berdistribusi Hipergeometrik masing-masing adalah μ = np dan σ2
= npq .
11.4. Distribusi poison.
Distribusi Poisson merupakan distribusi probabilitas dari
banyaknya outcome/kejadian sukses X yang terjadi selama interval
waktu atau area tertentu. Interval pengamatan ini dapat berupa waktu
atau ruang 2D/3D, contohnya:
- waktu (berapa banyak pelanggan mengunjungi kantor pos dalam
1 hari),
- ruang 2D (menghitung banyaknya cacat pada cat mobil A),
- ruang 3D (menghitung banyaknya ikan di satu kilometer kubik
laut), dll.
Karakteristik percobaan Poisson diberikan sebagai berikut:
1. Banyaknya outcome/kejadian terjadi dalam interval waktu atau
area tertentu yang independen.
2. Probabilitas bahwa suatu outcome/kejadian tunggal akan terjadi
selama interval waktu yang pendek atau area yang kecil secara
proporsional dan tidak tergantung pada banyaknya
outcome/kejadian pada interval waktu atau area yang lain.
3. Probabilitas bahwa lebih dari satu outcome/kejadian akan terjadi
pada interval waktu yang pendek atau area yang kecil dapat
diabaikan.
Nilai mean banyaknya outcome/kejadian dihitung dari μ = λ t
dengan λ adalah derajat terjadinya outcome/kejadian dan t adalah
ketentuan waktu, jarak, area, atau volume yang menjadi perhatian.
Fungsi kepadatan probabilitas (PDF) dari variabel acak X Poisson
dirumuskan
Sedangkan, fungsi kepadatan kumulatif (CDF) dari variabel acak
X Poisson adalah
Sebagai contoh, mean banyaknya panggilan ke call center dalam
dua hari adalah 6 panggilan. Dihitung probabilitas bahwa:
1. Minimal ada dua panggilan dalam dua hari.
2. Ada tujuh panggilan dalam empat hari.
3. Maksimum ada satu panggilan dalam satu hari.
Misalkan X adalah banyaknya panggilan ke call center dan μ
adalah mean banyaknya panggilan ke call center dalam dua hari (t =
2), maka μ sama dengan 6, sehingga:
1. Jika mean banyaknya panggilan ke call center diberikan dalam
dua hari, maka Probabilitas minimal ada dua panggilan dalam
dua hari akan bernilai
2. Jika mean banyaknya panggilan ke call center diberikan dalam
dua hari, maka Probabilitas ada tujuh panggilan dalam empat hari
akan bernilai
3. Jika mean banyaknya panggilan ke call center diberikan dalam
dua hari, maka Probilitas maksimum ada satu panggilan dalam
satu hari akan bernilai
12. Pertemuan 12
Distribusi Peluang (2) 12.1. Distribusi gabungan variable random kontinu.
Variabel random kontinu adalah suatu fungsi yang memetakan
setiap anggota Ruang Sampel S ke bilangan Real[3]. Dalam
statistika, variabel acak disimbolkan dengan huruf-huruf kapital
misalkan X, Y, Z, dll. Variabel acak yang mampu menjalani
bilangan bulat adalah Variabel Acak Diskrit, sedangkan variabel
random yang mampu menjalani bilangan real adalah Variabel
random Kontinu. Misalkan X adalah variabel random kontinu maka
fungsi kepadatan probabilitas (probability density function, PDF)
dapat didefinisikan sebagai
Dengan kata lain, fungsi fX(x) adalah fungsi distribusi
probabilitas dari X untuk variabel acak kontinu. PDF dari variabel
acak kontinu X harus memenuhi sifat-sifat berikut:
Misalkan X merupakan variabel acak kontinu maka fungsi
kepadatan kumulatif (cumulative Density Function, CDF) dapat
didefinisikan sebagai
Dengan kata lain, fungsi FX(x) adalah fungsi distribusi dari X
untuk variabel acak kontinu. Jika fX(x) merupakan PDF dari
variabel acak kontinu X, maka terdapat relasi antara PDF dan CDF,
yaitu
Rumusan ini tidak dapat digunakan untuk distribusi variabel
acak diskrit. Sebagai tambahan, mean dan varian dari variabel acak
kontinu masing-masing adalah
12.2. Distribusi normal.
Distribusi Normal merupakan distribusi probabilitas kontinu
yang paling penting dalam segala bidang Statistika. Distribusi ini
memiliki karakteristik dari fungsi kepadatan-nya yang berbentuk
kurva simetris menyerupai suatu lonceng, sehingga kurva Normal
ini disebut sebagai kurva berbentuk lonceng (bell-shaped curve).
Disamping itu, distribusi Normal juga disebut juga sebagai
Distribusi Gaussian yang mana hal ini diberikan sebagai
penghargaan untuk Ahli Matematika Jerman Karl Friedrich Gauss
(1777 – 1855) dalam membentuk fungsi distribusi Normal. Fungsi
kepadatan probabilitas (PDF) dari variabel acak X Normal
dirumuskan sebagai
Variabel acak X berdistribusi Normal dengan parameter mean
μ dan varian σ2 yang mana PDF dari distribusi ini dapat
diilustrasikan sebagai berikut.
Misalkan diberikan dua sampel data X1 ~ N(μ1 , σ12) dan X2 ~
N(μ2 , σ22) dengan:
1. kondisi μ1 < μ2 dan σ1 = σ2, maka kurva Normal diilustrasikan
menjadi
2. kondisi μ1 = μ2 dan σ1 < σ2, maka kurva Normal digambarkan
mengikuti
3. kondisi μ1 < μ2 dan σ1 < σ2, maka kurva Normal diilustrasikan
menjadi
Distribusi Normal memiliki kurva yang simetris membentuk
suatu lonceng. Hal ini terjadi ketika nilai mean, median, dan modus
dari data bernilai sama; namun ketika kondisi ini tidak terpenuhi,
distribusi data yang terbentuk akan miring kanan atau miring kiri.
Berdasarkan penyebaran data yang berdistribusi Normal,
penyebaran 68% data pengamatan berada pada interval μ – σ sampai
μ + σ; penyebaran 95% data pengamatan berada pada interval μ – 2σ
sampai μ + 2σ; dan penyebaran 99,7% data pengamatan berada pada
interval μ – 3σ sampai μ + 3σ.
Sedangkan, fungsi kepadatan kumulatif (CDF) dari variabel acak
X Normal adalah
Penyelesaian masalah distribusi Normal dapat diselesaikan
dengan mudah menggunakan Distribusi Normal Standar. Misalkan
diberikan variabel acak X berdistribusi Normal dengan parameter
mean μ dan varian σ2, maka variabel acak Z yang berdistribusi
Normal Standar dengan parameter mean 0 dan varian 1 akan
menghasilkan fungsi kepadatan probabilitas (PDF) sebagai
Sedangkan, fungsi kepadatan kumulatif (CDF) dari variabel acak
Z Normal Standar adalah
Sebagai Contoh, Dari hasil survei satu komplek perumahan,
biaya pengeluaran untuk konsumsi listrik rumah tangga adalah
400.000 rupiah perbulan dan standar deviasinya sebesar 30.000 .
Jika biaya pengeluaran tersebut berdistribusi Normal, maka tentukan
probabilitas:
1. biaya pengeluaran untuk konsumsi listrik sebesar 375.000
rupiah.
[P(X = 375.000) ?]
2. biaya pengeluaran untuk konsumsi listrik maksimal 450.000
rupiah.
[P(X ≤ 450.000) ?]
3. biaya pengeluaran untuk konsumsi listrik diantara 300.000 dan
400.000 rupiah.
[P(300.000 < X < 400.000) ?]
Penyelesaian:
Misalkan X adalah variabel acak yang menyatakan biaya
pengeluaran untuk konsumsi listrik rumah tangga yang memiliki
parameter μ = 400.000 rupiah dan σ = 30.000 . Secara teori,
distribusi Normal dapat diselesaikan kedalam bentuk distribusi
Normal Standar, sehingga:
1. Untuk x = 375.000, perlu dilakukan transformasi kedalam
bentuk Normal Standar.
Jadi, P(X = 375.000) = P(Z = -0,833)
Probabilitas biaya pengeluaran untuk konsumsi listrik
sebesar 375.000 rupiah adalah 0,2820 .
2. Untuk x = 450.000, perlu dilakukan transformasi kedalam
bentuk Normal Standar.
Jadi, P(X ≤ 450.000) = P(Z ≤ 1,67)
Penyelesaian soal (b) diselesaikan dengan bantuan Tabel
Normal Standar.
Jadi, probabilitas biaya pengeluaran untuk konsumsi listrik
maksimal 450.000 rupiah adalah 0,9525 .
3. Untuk x1 = 300.000 dan x2 = 400.000, perlu dilakukan
transformasi kedalam bentuk Normal Standar.
Jadi, P(300.000 < X < 400.000) = P(-3,33 < Z < 0)
Probabilitas biaya pengeluaran untuk konsumsi listrik
diantara 300.000 dan 400.000 rupiah adalah 0,4995 .
13. Pertemuan 13
Penaksiran parameter, pengujian hipotesis.
Statistika berhubungan dengan cara membuat kesimpulan
dari data (sampel) yang telah dikumpulkan untuk suatu
maksud tertentu. Kesimpulan yang dibuat adalah kesimpulan
untuk populasi (parameter dari populasi) dimana sampel telah
diambil. Pada umumnya parameter dari sebuah populasi, tidak
diketahui nilainya atau nilai yang sudah ada diduga sudah tidak
berlaku lagi. Sehingga, apabila diinginkan untuk mengetahui
nilai parameter tersebut, atau ingin membuktikan apakah nilai
yang sudah ada masih berlaku atau tidak, dibutuhkan metoda
tertentu. Dalam statistika metoda untuk mencapai tujuan
tersebut, secara garis besarnya dapat dilakukan melalui
penaksiran atau melalui pengujian (uji) hipotesis.
13.1. Penaksiran rata-rata.
Menaksir rataan, untuk selang kepercayaan μ
a. σ diketahui, n/N > 0,05
Jika rataan suatu sampel acak berukuran n dari suatu populasi
normal sehingga n/N > 0,05 dengan varians σ2 diketahui.
Koefisien kepercayaan δ maka selang kepercayaan untuk μ
b. σ diketahui, n/N ≤ 0,05
c. σ tidak diketahui, n/N > 0,05
Jika x rataan S2 varians sampel acak berukuran n dari suatu
populasi normal atau hampir normal sehingga n/N > 0,05 dengan
varians σ2 tidak diketahui. Koefisien kepercayaan δ maka selang
kepercayaan untuk μ
d. σ tidak diketahui, n/N ≤ 0,05
Jika x rataan S2 varians sampel acak berukuran n dari suatu
populasi normal atau hampir normal sehingga n/N ≤ 0,05 dengan
varians σ2 tidak diketahui. Koefisien kepercayaan δ maka selang
kepercayaan untuk μ
Luas daerah kurava normal menunjuk penfasiran untuk µ - x
dengan σ diketahui.
Jika x dipakai untuk menaksir μ, maka dapat dipercaya α bahwa
galat (d = μ– x)
a. Kurang dari z1/2α
b. Lebih dari suatu bilangan g yang ditetapkan sebelumnya asal
saja ukuran sampel
Jika batas galat telah ditentukan duluan kurang dari suatu bilangan
tertentu g, yang berarti galat mencapai semaksimalnya
g = z1/2α sehingga seminimalnya
n = (z1/2α.σ)2
Contoh :
Sebuah sampel acak terdiri dari 100 mahasiswa telah diambil dari
sebuah universitas lalu nilai-nilai IQnya didapat =112 san s = 10
a. Dalam hal ini titik penafsirannya telah digunakan
b. Jika dikeendaki interval penafsiran IQ rata-rata dengan koeisien
kepercayaan 0,95 maka dipakai rumus
Untuk P = ½ (1+α) = 0,975 dan dk = (n-1) = 99 dengan interpolasi
dari daftar G dalam apendiks, didapat tp = 1,987 dari rumus
didapat :
112 – (1,987) < μ < 112 + (1,987)
Atau 110,0 < μ < 114,0
Jadi didapat 95% interval kepercayaan untuk IQ rata-rata
mahasiswa ialah 110,0 < μ < 114,0 secar lain dapat dikatakan kita
meras 95% yakin bahwa IQ rata-rata mahasiswa akan ada dalam
interval dengan batas 110,0 dan 114,0
13.2. Penaksiran proporsi.
RUMUS YANG DAPAT DIGUNAKAN
Dengan p = x/n dan q = 1-p sedangkan adalah bilangan z
yang dapat dicari pada tabel .
13.3. Penaksiran simpangan baku.
1. Simpangan baku diketahui dan populasinya berdistribusi
normal
2. Simpangan baku tidak diketahui dan populasi berdistribusi
normal
13.4. Konsep uji hipotesis.
A. STATISTIK DAN PENELITIAN
Dalam statistik, hipotesis dapat di artikan sebagai
pernyataan statistik tentang parameter. Statistik adalah ukuran
- ukuran yang di kenakan pada sampel ( x = rata - rata ; s =
simpangan baku;
S2= varians; r = koefisien korelasi ), dan parameter
adalah ukuran - ukuran yang di kenakan pada populasi ( x = rata
- rata, s = simpangan , S2 = variansi; r = koefisien korelasi ).
dengan kata lain hipotesis adalah taksiran terhadap parameter
populasi, melalui data sampel ( lihat gambar pada 4.1 ).
penelitian yang di dasarkan pada data populasi, atau sampling
total, atau sensus dengan tidak melakukan pengujian hipotesis
statistik dari sudut pandang statistik di sebut penelitian
deskriptif.
Terdapat perbedaan mendasar pengertian hipotesis menurut
statistik dan penelitian. dalam penelitian, hipotesis di artikan
sebagai jawaban sementara terhadap rumusan masalah
peneliltian. Rumusa masalah tersebut bisa berupa pernyataan
tentang hhubungan dua variabel atau lebih. disini terdapat
perbedaan lagi pengertian deskriptif dalam penelitian dan
dalam statistik. seperti telah di kemukakan deskriptif dalam
statistik adalah penelitian yang di dasarkan pada populasi (
tidak ada sampel ), sedangkan deskriptif dalam penelitian
menunjukan tingkat ekplanasi yaitu menanyakan tentang
variabel mandiri ( tidak di hubungkan dandi bandingkan ).
dalam statistik dan penelitian terdapat dua macam hipotesis,
yaitu hipotesis nol, dan alternatif. pada statistik, hipotesisn nol
di artikan sebagai tidak adanya perbedaan antara parameter
dengan statistik, atau tidak adanya perbedaan antara ukuran
sampel. dengan demikian hipotesis yang di uji adalah hipotesis
nol, karena memang penelitian tidak mengharapkan adanya
perbedaan antara data populasi dengan data sampel.
B. TIGA BENTUK RUMUSAN HIPOTESIS
Menurut tingkat ekplanasi hipotesis yang akan di uji, maka
rumusan hipotesis dapat di kelompok dapat di kelompok mejadi
tiga macam, yaitu hipotesis deskriptif ( pada satu sampel ) atau
variabel mandiri/ tidak di bandingkan dan di hubungkan
),komparatif dan hubungan.
1. Hipotesis Deskriptif
Hipotesis deskriptif, adalah dugaan tentang nilai suatu
variabel mandiri, tidak membuat perbandingan atau hubungan
sebagai contoh, bila rumusan masalah penelitian sebagai
berikut, maka hipotesis ( jawab sementara ) yang dirumuskan
adalah hipotesis deskriptif.
a. Sebagai tinggi daya tahan lampu merk X ?
b. Seberapa tinggi produktivitas padi di Kabupaten Klaten
?
c. Berapa lama daya tahan lampu merk A dan B ?
d. Seberapa baik gaya kepemimpinan di lembaga X ?
dari tiga pernyataan tersebut antara lain dapat di
rumuskan hipotesis seperti berikut :
a. daya tahan lampu merk X = 800 jam
b. Produktivitas padi di kabupaten Klaten 8 ton/ ha
c. daya Tahan lampu merk A= 450 jam dan merk B= 600
jam
d. Gaya kepemimpinan di lembaga X telah mencapai 70
% dari yang di harapkan.
dalam perumusan hipotesis statistik, antara hipotesis nol ( Ho)
dan hipotesis alternatif ( Ha ) selalu berpasangan, bila salah satu
di tolak, maka yang lain pasti di terima sehingga dapat di buat
keputusan yang tegas, yaitu kalau Ho di tolak pasti Ha di terima.
hipotesis statistik dinyatakan melalui simbol - simbol.
2. Hipotesis Komparatif
hipotesis komparatif adalah pernytaan yang menunjukkan
dugaan nilai dalam satu variabel atau lebih pada sampel
yang berbeda. contoh rumusan masalah komperatif dan
hipotesisnya:
a. Apakah ada perbedaan daya tahan lampu merk A dan B ?
b. Apakah ada perbedaan produktivitas kerja antara pegawai
golongan I, II, III ?
Rumusan Hipotesis adalah :
1). Tidak terapat perbedaan daya tahan antara lampu merk A
dan B.
2) .Daya tahan lampu merk B paling kecil sama dengan lampu
merk A.
3). Daya tahan lampu merk B paling tinggi sama dengan lampu
merk A.
3. Hipotesis Hubungan (Asosiatif )
Hipotesis asosiatif adalah suatu pernyataan yang
menunjukkan dugaan tentang hubungan antara dua variabel
atau lebih. contoh rumusan masalahnya adalah "Apakah ada
hubungan antara gaya kepemimpian dengan efektivitas kerja?.
rumus dan hipotesis nolnya adalah : tidak ada hubungan antar
gaya kepemimpinan dengan efektivitas kerja.
Hipotesi Statistiknya adalah :
Ho :p= 0
Ha ; p ≠ 0 ( p = simbol yang menunjukkan kuatnya hubungan )
dapat di baca : hipotesis nol, yang menunjukkan tidak adanya
hubungan ( nol = tidak ada hubungan ) antara gaya
kepemimpinan dengan efektivitas kerja dalam populasi.
hipotesis alterntifnya menunjukkan ada hubungan ( tidak sama
dengan nol, mungkin lebih besar dari 0 atau lebih kecil dari nol
).
C. TARAF KESALAHAN DALAM PENGUJIAN
HIPOTESIS
seperti telah di kemukakan, pada dasarnya meguji hipotesis
itu adalah manaksirkan parameter populasi berdasarkan data
sampel. terdapat dua cara menaksirkan yaitu. a poit estimate
dan interval estimate atau sering di sebut confidence interval. a
point estimate ( titik taksiran ) adalah suatu taksiran parameter
populasi berdasarkan satu nilai data sampel. sedangkan interval
estimat ( taksiran interval ) adalah suatu taksiran parameter
populasi berdasarkan nilai interval data sampel.
menaksirkan parameter populasi yang menggunakan nilai
tunggal ( point estimate ) akan mempunyai resiko kesalahan
yang estimate,
D. DUA KESALAHAN DALAM PENGUJIAN HIPOTESIS
Dalam menaksirkan parameter populas berdasarkan data
sempel. kemungkinan akan terdapat dua kesalahan yaitu :
1. Kesalahan tipe I adalah suatu kesalahan bila menolak
hipotesis nol ( Ho ) yang benarnya ( seharusnya di terima ).
dalam hal ini tingkat kesalahan di nyatakan dengan alpa
2. kesalahan tipe II adalah kesalahan bila menerima hipotesis
yang salah ( seharusnya di tolak ). tingkat kesalahan untuk ini
di nyatakan dengan betha.
14. Pertemuan 14
Analisis Regresi dan Korelasi
Regresi merupakan suatu alat ukur yang juga dapat digunakan
untuk mengukur ada atau tidaknya korelasi antarvariabel. Jika kita
memiliki dua buah variabel atau lebih maka sudah selayaknya
apabila kita ingin mempelajari bagaimana variabel-variabel itu
berhubungan atau dapat diramalkan.
Dalam teori probabilitas dan statistika, korelasi, juga disebut
koefisien korelasi, adalah nilai yang menunjukkan kekuatan dan
arah hubungan linier antara dua peubah acak (random variable).
14.1. Analisis Regresi Linier.
Regresi Linear Sederhana adalah Metode Statistik yang
berfungsi untuk menguji sejauh mana hubungan sebab akibat antara
Variabel Faktor Penyebab (X) terhadap Variabel Akibatnya. Faktor
Penyebab pada umumnya dilambangkan dengan X atau disebut juga
dengan Predictor sedangkan Variabel Akibat dilambangkan dengan
Y atau disebut juga dengan Response. Regresi Linear Sederhana atau
sering disingkat dengan SLR (Simple Linear Regression) juga
merupakan salah satu Metode Statistik yang dipergunakan dalam
produksi untuk melakukan peramalan ataupun prediksi tentang
karakteristik kualitas maupun Kuantitas.
Contoh Penggunaan Analisis Regresi Linear Sederhana dalam
Produksi antara lain :
1. Hubungan antara Lamanya Kerusakan Mesin dengan
Kualitas Produk yang dihasilkan
2. Hubungan Jumlah Pekerja dengan Output yang diproduksi
3. Hubungan antara suhu ruangan dengan Cacat Produksi yang
dihasilkan.
Model Persamaan Regresi Linear Sederhana adalah seperti
berikut ini :
Y = a + bX
Dimana : Y = Variabel Response atau Variabel Akibat (Dependent) X = Variabel Predictor atau Variabel Faktor Penyebab (Independent) a = konstanta b = koefisien regresi (kemiringan); besaran Response yang ditimbulkan oleh Predictor.
Nilai-nilai a dan b dapat dihitung dengan menggunakan Rumus
dibawah ini :
a = (Σy) (Σx²) – (Σx) (Σxy) . n(Σx²) – (Σx)²
b = n(Σxy) – (Σx) (Σy) . n(Σx²) – (Σx)²
Berikut ini adalah Langkah-langkah dalam melakukan Analisis
Regresi Linear Sederhana :
1. Tentukan Tujuan dari melakukan Analisis Regresi Linear
Sederhana
2. Identifikasikan Variabel Faktor Penyebab (Predictor) dan Variabel
Akibat (Response)
3. Lakukan Pengumpulan Data
4. Hitung X², Y², XY dan total dari masing-masingnya
5. Hitung a dan b berdasarkan rumus diatas.
6. Buatkan Model Persamaan Regresi Linear Sederhana.
7. Lakukan Prediksi atau Peramalan terhadap Variabel Faktor
Penyebab atau Variabel Akibat.
Contoh Kasus Analisis Regresi Linear Sederhana
Seorang Engineer ingin mempelajari Hubungan antara Suhu Ruangan
dengan Jumlah Cacat yang diakibatkannya, sehingga dapat
memprediksi atau meramalkan jumlah cacat produksi jika suhu ruangan
tersebut tidak terkendali. Engineer tersebut kemudian mengambil data
selama 30 hari terhadap rata-rata (mean) suhu ruangan dan Jumlah
Cacat Produksi.
Penyelesaian
Penyelesaiannya mengikuti Langkah-langkah dalam Analisis Regresi
Linear Sederhana adalah sebagai berikut :
Langkah 1 : Penentuan Tujuan
Tujuan : Memprediksi Jumlah Cacat Produksi jika suhu ruangan tidak
terkendali
Langkah 2 : Identifikasikan Variabel Penyebab dan Akibat
Varibel Faktor Penyebab (X) : Suhu Ruangan,
Variabel Akibat (Y) : Jumlah Cacat Produksi
Langkah 3 : Pengumpulan Data
Berikut ini adalah data yang berhasil dikumpulkan selama 30 hari
(berbentuk tabel) :
Tanggal Rata-rata Suhu Ruangan Jumlah Cacat
1 24 10
2 22 5
3 21 6
4 20 3
5 22 6
6 19 4
7 20 5
8 23 9
9 24 11
10 25 13
11 21 7
12 20 4
13 20 6
14 19 3
15 25 12
16 27 13
17 28 16
18 25 12
19 26 14
20 24 12
21 27 16
22 23 9
23 24 13
24 23 11
25 22 7
26 21 5
27 26 12
28 25 11
29 26 13
30 27 14
Langkah 4 : Hitung X², Y², XY dan total dari masing-masingnya
Berikut ini adalah tabel yang telah dilakukan perhitungan X², Y², XY
dan totalnya :
Tanggal
Rata-rata Suhu
Ruangan (X)
Jumlah
Cacat (Y) X2 Y2 XY
1 24 10 576 100 240
2 22 5 484 25 110
3 21 6 441 36 126
4 20 3 400 9 60
5 22 6 484 36 132
6 19 4 361 16 76
7 20 5 400 25 100
8 23 9 529 81 207
9 24 11 576 121 264
10 25 13 625 169 325
11 21 7 441 49 147
12 20 4 400 16 80
13 20 6 400 36 120
14 19 3 361 9 57
15 25 12 625 144 300
16 27 13 729 169 351
17 28 16 784 256 448
18 25 12 625 144 300
19 26 14 676 196 364
20 24 12 576 144 288
21 27 16 729 256 432
22 23 9 529 81 207
23 24 13 576 169 312
24 23 11 529 121 253
25 22 7 484 49 154
26 21 5 441 25 105
27 26 12 676 144 312
28 25 11 625 121 275
29 26 13 676 169 338
30 27 14 729 196 378
Total
(Σ) 699 282 16487 3112 6861
Langkah 5 : Hitung a dan b berdasarkan rumus Regresi Linear
Sederhana
Menghitung Konstanta (a) :
a = (Σy) (Σx²) – (Σx) (Σxy)
. n(Σx²) – (Σx)²
a = (282) (16.487) – (699) (6.861)
30 (16.487) – (699)²
a = -24,38
Menghitung Koefisien Regresi (b)
b = n(Σxy) – (Σx) (Σy)
. n(Σx²) – (Σx)²
b = 30 (6.861) – (699) (282)
. 30 (16.487) – (699)²
b = 1,45
Langkah 6 : Buat Model Persamaan Regresi
Y = a + bX
Y = -24,38 + 1,45X
Langkah 7 : Lakukan Prediksi atau Peramalan terhadap Variabel
Faktor Penyebab atau Variabel Akibat
I. Prediksikan Jumlah Cacat Produksi jika suhu dalam keadaan tinggi
(Variabel X), contohnya : 30°C
Y = -24,38 + 1,45 (30)
Y = 19,12
Jadi Jika Suhu ruangan mencapai 30°C, maka akan diprediksikan akan
terdapat 19,12 unit cacat yang dihasilkan oleh produksi.
II. Jika Cacat Produksi (Variabel Y) yang ditargetkan hanya boleh 4
unit, maka berapakah suhu ruangan yang diperlukan untuk mencapai
target tersebut ?
4 = -24,38 + 1,45X
1,45X = 4 + 24,38
X = 28,38 / 1,45
X = 19,57
Jadi Prediksi Suhu Ruangan yang paling sesuai untuk mencapai target
Cacat Produksi adalah sekitar 19,57°C
14.2. Analisis Korelasi Linier.
Hubungan Linear lebih dari dua variabel.Pada hubungan linear
lebih dari dua variabel ini, perubahan satu variabel dipengaruhi oleh
lebih dari satu variabel lain.
Secara fungsional Y = f (X1, X2, X3, ..., Xk) atau dalam
persamaan matematis dituliskan
Y = a + b1X1 + b2X2 + b3X3 + ... + bkXk
rumus :
Koefisien Korelasi Linier Berganda
Merupakan indeks atau angka yang diigunakan untuk mengukur
keeratan hubungan antara 3 variabel/lebih. Koefisien korelasi
berganda dirumuskan :
Ry1.2 =
Keterangan :
- Ry1.2 : koefisien linier 3 variabel
- ry1 : koefisien korelasi y dan X1
- ry2 : koefisien korelasi variabel y dan X2
- r1.2 : koefisien korelasi variabel X1 dan X2
dimana :
ry1=
ry2=
ry1.2=
Ry1.2=
14.3. Analisis Determinasi.
Analisis diskriminan merupakan teknik menganalisis data,
dimana variabel dependen merupakan data kategorik atau kualitatif
(ordinal atau rasio), sedangkan variabel independen berupa data
kuantitatif (interval atau rasio).
Prinsip Dasar analisis diskriminan
Analisis diskriminan adalah bagian dari analisis statistik peubah
ganda (multivariate statistical analysis) yang bertujuan untuk
memisahkan beberapa kelompok data yang sudah terkelompokkan
dengan cara membentuk fungsi diskriminan. Analisis diskriminan
adalah salah satu teknik statistik yang bisa digunakan pada hubungan
dependensi (hubungan antar variabel dimana sudah bisa dibedakan
mana variabel respon dan mana variabel penjelas). Lebih spesifik
lagi, analisis diskriminan digunakan pada kasus dimana variabel
respon berupa data kualitatif dan variabel penjelas berupa data
kuantitatif.
jika dianalogikan dengan regresi linear, maka analisis
diskriminan merupakan kebalikannya. pada regresi linear, variabel
respon yang harus mengikuti distribusi normal dan homoskedastis,
sedangkan variabel penjelas diasumsikan fixed, artinya variabel
penjelas tidak disyaratkan mengikuti sebaran tertentu. untuk analisis
diskriminan, variabel penjelasnya seperti sudah disebutkan di atas
harus mengikuti distribusi normal dan homoskedastis sedangkan
variabel responnya fixed.
Tujuan analisis diskriminan secara umum
Mengetahui apakah ada perbedaan yang jelas antara kelompok
pada variabel dependen. Bisa juga dikatakan untuk melihat
perbedaan antara anggota grup 1 dengan grup 2.
Jika ada perbedaan, untuk mengetahui variabel bebas mana yang
membuat perbedaan tersebut.
Membuat fungsi atau model diskriminan yang pada dasarnya
mirip dengan persamaan regresi.
Melakukan klasifikasi terhadap objek (dalam terminology spss
disebut baris), dan untuk mengetahui apakah suatu objek termasuk
pada grup 1 atau grup 2 atau lainnya.
Asumsi dan Sampel dalam analisis diskriminan
Sejumlah p variabel independen harus berdistribusi normal.
Matriks ragam-peragam variabel independen berukuran pxp
pada kedua kelompok harus sama.
Tidak ada korelasi antar variabel independen.
Tidak terdapat data yang outlier pada variabel independen.
Menurut Hair et al. (1987 : 76), analisis diskriminan tidak terlalu
sensitif dengan pelanggaran asumsi ini, kecuali pelanggarannya
bersifat ekstrim. Dan Johnson and Wichern (1988: 472) mengatakan
hal yang sama bahwa asumsi ini (kesamaan ragam-peragam) di
dalam praktiknya sering dilanggar.
Tidak ada jumlah sampel yang ideal secara pasti pada analisis
diskriminan. Pedoman yang bersifat umum menyatakan untuk setiap
variabel independen terdapat 5-20 sampel. Dengan demikian, jika
terdapat 6 variabel independen maka seharusnya terdapat minimal
6x5=30 sampel. Secara terminology spss, jika ada enam kolom
variabel independen, sebaiknya ada 30 baris data.
Selain itu, pada analisis diskriminan sebaiknya digunakan dua
jenis sampel, yakni analisis sampel yang digunakan untuk membuat
fungsi diskriminan, serta holdout sampel (split sampel) yang
digunakan untuk menguji hasil diskriminan.
Langkah-langkah dalam analisis diskriminan
1. Memisah variabel-variabel menjadi variabel dependen dan
variabel independen.
2. Menentukan metode untuk membuat fungsi diskriminan.
Pada prinsipnya terdapat dua metode dasar untuk membuat
fungsi diskriminan, yakni:
- Simultaneus estimation, semua variabel independen
dimasukkan secara bersama-sama kemudian dilakukan
proses diskriminan.
- Stepwise estimation, variabel independen dimasukkan
satu per satu kedalam model diskriminan. Pada proses ini
akan ada variabel yang tetap ada dalam model dan ada
variabel yang dibuang dari model.
3. Menguji signifikansi dari fungsi diskriminan yang telah
terbentuk, menggunakan Wilk’s lamda, Pilai, F test dan uji
lainnya.
4. Menguji ketepatan klasifikasi dari fungsi diskriminan serta
mengetahui ketepatan klasifikasi secara individual dengan
casewise diagnostics.
5. Melakukan interpretasi terhadap fungsi diskriminan tersebut.
6. Melakukan uji validasi terhadap fungsi diskriminan.
Suatu fungsi diskriminan layak untuk dibentuk bila terdapat
perbedaan nilai rataan di antara 2 kelompok yang ada. Oleh karena
itu, sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian
terhadap perbedaan vektor nilai rataan dari 2 kelompok tersebut.
Dalam pengujian vektor nilai rataan antar kelompok, asumsi yang
harus dipenuhi adalah peubah-peubah yang diamati berdistribusi
multivariate normality dan semua kelompok populasi mempunyai
matrik ragam-peragam yang sama.
15. Pertemuan 15
Statistika dalam riset.
(Quiz)
16. Pertemuan 16
UAS
DAFTAR PUSTAKA
1. R. Fenny Syafariani. (2010). Statistika. Bahan Ajar. Fakultas
Teknik & Ilmu Komputer, Bandung.
2. Prof. Dr. Sudjana MA. (2005). Metode Statistika, Tarsito,
Bandung.
3. Teori Peluang dan Statistika Untuk Insinyur dan Ilmuwan,
(1992). Penerbit ITB, Bandung.