Statistika Oleh : R. Fenny Syafariani,...

Statistika

Oleh : R. Fenny Syafariani, S.Si.,M.Sta

(Digunakan di lingkungan sendiri, sebagai buku ajar

mata kuliah statistika)

Fakultas Teknik dan Ilmu Komputer

Program Studi Sistem Informasi

Universitas Komputer Indonesia

1. Pertemuan 1

Pendahuluan

Kata “statistika” dan “statistik” bukan merupakan kata yang

asing lagi dalam kehidupan sehari-hari. Masyarakat awam sering

salah kaprah dalam mempergunakan kedua kata itu. Jika demikian,

apakah arti kedua kata tersebut sebenarnya?

1.1. Pengertian, statistika sebagai alat bantu, statistika sampel,

statistika populasi, statistika deskriptif dan statistika inferensial.

Kata “statistika” diturunkan dari kata dalam bahasa Latin

status atau Italia statista yang berarti keadaan politik. Di tahun-

tahun awal perkembangannya statistika memiliki konotasi

kumpulan fakta mengenai negara atau penduduk negara tersebut

untuk kepentingan administratif dan politik. Agar

penyelenggaraan pemerintahan di suatu negara dapat

berlangsung baik, pemerintah menyelenggarakan pengumpulan

data mengenai keadaan penduduknya, yang lazim disebut sensus.

Pada saat itu statistika mendapat julukan “ilmu pengetahuan

mengenai negara”. Namun dalam perkembangan selanjutnya,

statistika tidak hanya digunakan untuk mempelajari keadaan

penduduk suatu negara, namun dipergunakan secara sangat luas.

Sir R. A. Fisher memandang ilmu statistika sebagai “matematika

yang diterapkan pada data hasil pengamatan”.

Apa definisi statistika? Pengarang-pengarang buku tentang

statistika memberikan pengertian yang berlainan mengenai

statistika. Dua contoh di antaranya: Spiegel, seorang profesor

matematika di Rensellaer Polytechnic Institute, dalam bukunya

“Theory and Problems of Statistics” menerangkan statistika

sebagai “metode ilmiah untuk mengumpulkan,

mengorganisasikan, meringkas, menyajikan dan menganalisis

data, juga mengambil kesimpulan yang sahih dan membuat

keputusan yang beralasan berdasarkan analisis tersebut;

sedangkan Lind dalam bukunya “Statistical Techniques in

Business and Economics” menyatakan bahwa statistika adalah

adalah ilmu mengumpulkan, mengorganisasikan, menyajikan,

menganalisis, dan menafsirkan data untuk membantu membuat

keputusan dengan lebih efektif”.

Walau berbagai definisi bertebaran dalam banyak

literatur, tetapi pada umumnya terdapat kesamaan maksud, yaitu

bahwa statistika, sebagaimana dijelaskan Spiegel, memuat dua

fase, yaitu statistika deskriptif dan statistika inferensial/induktif.

Statistika deskriptif hanya menggambarkan dan menganalisis

mengenai suatu kelompok tanpa menarik kesimpulan mengenai

kelompok yang lebih besar sedangkan statistika inferensial

berupaya mengambil kesimpulan terhadap populasi berdasarkan

hasil sampling (penarikan contoh). Karena pengambilan sampel

ini bersifat untung-untungan, tentu dalam pengambilan

kesimpulannya terbuka lebar peluang terjadinya kesalahan.

Karena itu statistika inferensial tidak mungkin lepas

hubungannya dengan teori peluang (Probability Theory).

Tadi digunakan istilah populasi dan sampel. Apakah arti

kedua istilah tersebut? Populasi dan sampel tidak lepas

hubungannya dengan dua metode pengambilan data, yaitu sensus

dan sampling (penarikan contoh). Seandainya Anda diminta

untuk menghitung berapa rata-rata tinggi badan seluruh

mahasiswa yang terdaftar di suatu universitas. Cara pertama yang

dapat dilakukan adalah Anda meminta suatu daftar lengkap

mahasiswa dari bagian administrasi kemahasiswaan di

universitas tersebut dan kemudian bagaimana pun caranya Anda

melakukan pengukuran tinggi badan terhadap semua mahasiswa

yang ada dalam daftar itu tanpa terkecuali. Cara inilah yang

disebut dengan cara sensus. Sebagai alternatif, Anda tidak perlu

melakukan pengukuran tinggi badan terhadap semua mahasiswa,

tetapi Anda hanya mengukur tinggi badan terhadap hanya

sebagian saja mahasiswa yang terdapat dalam daftar tersebut,

kemudian berdasarkan data yang diperoleh (dan setelah melalui

suatu perhitungan tertentu) mengambil kesimpulan terhadap rata-

rata tinggi badan seluruh mahasiswa yang terdaftar di universitas

tersebut. Cara inilah yang disebut cara sampling. Jelas cara

pertama (sensus) memerlukan waktu dan sumber daya yang lebih

banyak daripada cara kedua (sampling). Lind menerangkan

populasi dan sampel sebagai berikut. Populasi adalah

keseluruhan individu atau objek yang sedang kita amati atau

hasil-hasil pengukuran yang diperoleh dari individu atau objek

yang kita amati tersebut. Sampel adalah sebagian dari populasi

yang sedang diamati tersebut. Pada contoh mengenai tinggi

badan ini, populasinya adalah seluruh/semua mahasiswa yang

terdaftar di universitas tersebut. Setelah data tinggi badan seluruh

mahasiswa tersebut diperoleh, bisa juga seluruh data ini

dinamakan populasi. Sekarang misalnya digunakan cara kedua,

yaitu cara sampling. Anggaplah terdapat 100 orang mahasiswa

yang diukur tinggi badannya dari antara seluruh mahasiswa yang

terdaftar. Data 100 buah hasil pengukuran tinggi badan ini

dinamakan sampel.

2. Pertemuan 2

Pengumpulan Data

Pengumpulan data dilakukan untuk memperoleh informasi yang

dibutuhkan dalam rangka mencapai tujuan penelitian. Sebelum

melakukan penelitian, seorang peneliti biasanya telah memiliki

dugaan berdasarkan teori yang ia gunakan, dugaan tersebut disebut

dengan hipotesis. Untuk membuktikan hipotesis secara empiris,

seorang peneliti membutuhkan pengumpulan data untuk diteliti

secara lebih mendalam.

2.1. Pengertian data.

Data adalah kumpulan informasi yang diperoleh dari

suatu pengamatan, dapat berupa angka, lambang atau sifat. Data

berasal dari bahasa Latin yakni bentuk jamak dari datum, yang

diartikan sebagai “sesuatu yang diberikan”.

Dalam kehidupan sehari-hari data berarti suatu

pernyataan yang diterima secara apa adanya. Pernyataan ini

adalah hasil pengukuran atau pengamatan suatu variabel yang

bentuknya dapat berupa angka, kata-kata, atau citra.

2.2. Pembagian atau pengelompokkan data dari berbagai sudut

pandang.

A. Jenis Data Menurut Cara Memperolehnya

1. Data Primer

Data primer adalah secara langsung diambil dari objek /

obyek penelitian oleh peneliti perorangan maupun

organisasi. Contoh : Mewawancarai langsung pengguna

angkutan umum untuk meneliti preferensi kepuasan

pengguna.

2. Data Sekunder

Data sekunder adalah data yang didapat tidak secara

langsung dari objek penelitian. Peneliti mendapatkan data

yang sudah jadi yang dikumpulkan oleh pihak lain dengan

berbagai cara atau metode baik secara komersial maupun

non komersial. Contohnya adalah pada peneliti yang

menggunakan data statistik hasil riset dari surat kabar atau

majalah.

B. Macam-Macam Data Berdasarkan Sumber Data

1. Data Internal

Data internal adalah data yang menggambarkan situasi

dan kondisi pada suatu organisasi secara internal. Misal : data

keuangan, data pegawai, data produksi, dsb.

2. Data Eksternal

Data eksternal adalah data yang menggambarkan situasi

serta kondisi yang ada di luar organisasi. Contohnya adalah

data jumlah penggunaan suatu produk pada konsumen,

tingkat preferensi pelanggan, persebaran penduduk, dan lain

sebagainya.

C. Klasifikasi Data Berdasarkan Jenis Datanya

1. Data Kuantitatif

Data kuantitatif adalah data yang dipaparkan dalam

bentuk angka-angka. Misalnya adalah Jumlah penduduk,

jumlah pengguna transportasi umum, luas suatu area, dan

lain-lain.

2. Data Kualitatif

Data kualitatif adalah data yang disajikan dalam bentuk

kata-kata yang mengandung makna. Contohnya seperti

persepsi masyarakat terhadap kinerja pemerintah, anggapan

para ahli mengenai perekonomian di Semarang dan lain-

lain.

D. Pembagian Jenis Data Berdasarkan Sifat Data

1. Data Diskrit

Data diskrit adalah data yang nilainya adalah bilangan

asli. Contohnya adalah berat badan ibu-ibu pkk sumber ayu,

nilai rupiah dari waktu ke waktu, dan lain-sebagainya.

2. Data Kontinyu

Data kontinyu adalah data yang nilainya ada pada suatu

interval tertentu atau berada pada nilai yang satu ke nilai

yang lainnya. Contohnya penggunaan kata sekitar, kurang

lebih, kira-kira, dan sebagainya. Dinas pertanian daerah

mengimpor bahan baku pabrik pupuk kurang lebih 850 ton.

E. Jenis-jenis Data Menurut Waktu Pengumpulannya

1. Data Cross Section

Data cross-section adalah data yang menunjukkan titik

waktu tertentu. Contohnya laporan keuangan per 31

desember 2006, data pelanggan PT. angin ribut bulan mei

2004, dan lain sebagainya.

2. Data Time Series / Berkala

Data berkala adalah data yang datanya menggambarkan

sesuatu dari waktu ke waktu atau periode secara historis.

Contoh data time series adalah data perkembangan nilai

tukar dollar amerika terhadap euro eropa dari tahun 2004

sampai 2006, jumlah pengikut jamaah nurdin m. top dan

doktor azahari dari bulan ke bulan, dll.

3. Pertemuan 3

Penyajian Data

Setelah data dikumpulkan maka data disajikan. Penyajian data

dibuat untuk memberikan deskripsi mengenai data yang telah

dikumpulkan dan memudahkan untuk pengambilan keputusan.

Bentuk penyajian data bisa dalam bentuk daftar atau tabel dan grafik

atau diagram. Tabel (tables) adalahangka yang disusun sedemikian

rupa menurut kategori tertentu sehingga memudahkan pembahasan

dan analisisnya, sedangkan grafik (graphs)merupakan gambar-

gambar yang menunjukkan data secara visual, didasarkan atas nilai-

nilai pengamatan aslinya ataupun dari tabel-tabel yang dibuat

sebelumnya.

3.1. Penyajian data dengan menggunakan table/daftar.

Didasarkan atas pengaturan datanya, tabel dapat dibedakan atas

beberapa jenis, yaitu

I. Tabel Klasifikasi

Tabel klasifikasi adalah tabel yang menunjukkan

pengelompokkan data. Contoh : Tabel jumlah kelahiran di

kota Jepara pada tahun 2010.

II. Tabel Kontingensi

Tabel kontigensi atau biasanya disebut tabel tabulasi

silang atau crosstab merupakan tabel yang disusun

berdasarkan tabulasi data menurut 2 atau lebih kategori.

Berikut ini contoh penyajian data dalam bentuk tabel

kontigensi.

III. Tabel Distribusi Frekuensi

Kabupaten

Semarang Demak Kudus

Tabel distribusi frekuensi adalah susunan data dalam

suatu tabel yang telah diklasifikasikan menurut kelas-kelas

atau kategori tertentu. Dikenal dua bentuk distribusi

frekuensi menurut pembagian kelasnya, yaitu distribusi

frekuensi kualitatif (kategori) dan distribusi frekuensi

kuantitatif (bilangan).Pada distribusi frekuensi kualitatif

pembagian kelasnya didasarkan pada kategori tertentu dan

banyak digunakan untuk data berskala ukur nominal.

Sedangkan kategori kelas dalam tabel distribusi frekuensi

kuantitatif, terdapat dua macam, yaitu kategori data

tunggal dan kategori data berkelompok (bergolong).

Langkah – langkah Distribusi Frekuensi :

Mengurutkan data : dari yang terkecil ke yang terbesar

atau sebaliknya untuk memudahkan dalam melakukan

penghitungan pada langkah ketiga

Membuat ketegori atau kelas data

- Melakukan penturusan atau tabulasi, memasukan nilai ke

dalam interval kelas

a. Tabel Distribusi Frekuensi Relatif

Tabel distribusi frekuensi relatif merupakan tabel

distribusi frekuensi yang dinyatakan dalam bentuk

persentase. Frekuensi relatif merupakan frekuensi yang

dinyatakan dalam angka relatif atau dalam persentase.

Besarnya frekuensi relatif (fr) tiap kelas adalah frekuensi

absolut tiap kelas dibagi seluruh frekuensi dikali 100%.

b. Tabel Distribusi Frekuensi Kumulatif

Seringkali orang tertarik untuk mengetahui dengan

cepat banyaknya data yang memiliki nilai di atas atau di

bawah nilai tertentu. Untuk keperluan itu, kita harus

menyusun tabel frekuensi kumulatif. Frekuensi

kumulatif (fc) dari suatu tabel frekuensi adalah frekuensi

yang dapat menunjukkan jumlah frekuensi yang terletak

di atas atau di bawah suatu nilai tertentu dalam suatu

interval kelas. Jadi tabel distribusi frekuensi kumulatif

adalah tabel frekuensi yang frekuensi tiap kelasnya

disusun berdasarkan frekuensi kumulatif. Frekuensi

kumulatif didapat dengan jalan menjumlahkan

banyaknya frekuensi tiap-tiap kelas.

1. Distribusi Frekuensi Kumulatif “Kurang Dari”

(Less Then) .

Distribusi Frekuensi Kumulatif “Kurang Dari”

merupakan frekuensi yang dapat menunjukan jumlah

frekuensi yang kurang dari nilai tertentu. Frekuensi ini

ditentukan dengan menjumlahkan frekuensi pada kelas-

kelas sebelumnya.

2. Distribusi Frekuensi Kumulatif “Lebih Dari”

(More Then).

Distribusi Frekuensi Kumultaif Lebih Dari

merupakan frekuensi yang dapat menunjukan jumlah

frekuensi yang lebih dari nilai tertentu. Frekuensi ini

ditentukan dengan menjumlahkan frekuensi pada kelas-

kelas sesudahnya.

3.2. Penyajian data dengan menggunakan grafik/diagram. Grafik merupakan gambar-gambar yang menunjukkan

data secara visual, contoh grafik : grafik lingkaran, grafik batang,

grafik garis, grafik titik, grafik lambang, grafik batang dan daun.

1. Grafik/ Diagram Lingkaran

Diagram lingkaran adalah penyajian data statistik

dengan menggunakan gambar yang berbentuk lingkaran.

Bagian-bagian dari daerah lingkaran menunjukkan bagian-

bagian atau persen dari keseluruhan. Untuk membuat

diagram lingkaran, terlebih dahulu ditentukan besarnya

persentase tiap objek terhadap keseluruhan data dan

besarnya sudut pusat sektor lingkaran.

Contoh:

2. Grafik yang dibuat berdasarkan tabel distribusi frekuensi

adalah histogram, poligon dan ogive.

a. Histogram (Histograms)

Histogram merupakan grafik dari distribusi frekuensi

suatu variabel. Tampilan histogram berupa petak-petak

empat persegi panjang. Sebagai sumbu horizontal (absis,

sumbu x) boleh memakai tepi-tepi kelas (class bounderies),

batas-batas kelas (class limits) atau nilai-nilai variabel yang

diobservasi, sedang sumbu vertikal (ordinat, sumbu y)

menunjukan frekuensi. Untuk distribusi

bergolong/kelompok yang menjadi absis adalah nilai tengah

dari masing-masing kelas.

Wilayah Jumlah

Fasilitas Umum

Persentase

Cepu Surakarta Semarang Kudus Blora

12 40 80 20 8

7,5 25 50

12,5 5

http://4.bp.blogspot.com/-xi4y1kAzItY/UWlsI5TcmQI/AAAAAAAAAEY/hbBU7BOzBew/s1600/Untitled2.png

Kelas Interval Jumlah Frekuensi (F)

1 215 2122 14

2 2123 4030 3

3 4031 5938 1

4 5939 7846 1

5 7847 9754 1

b. Poligon Frekuensi (Frequency Polygon)

Poligon frekuensi merupakan grafik dari distribusi

frekuensi bergolong suatu variabel. Tampilan poligon

berupa garis-garis patah yang diperoleh dengan cara

menghubungkan puncak dari masing-masing nilai tengah

kelas. Jadi absisnya adalah nilai tengah dari masing-masing

kelas.

http://2.bp.blogspot.com/-sDwdtdul2lI/UWlsE89hdcI/AAAAAAAAAEI/PYWoNe9n-a8/s1600/3.png

c. Ogives (A Cumulative Frequency Distribution)

Ogive merupakan grafik dari distribusi frekuensi

kumulatif suatu variabel. Dalam suatu ogive, yang

digunakan sebagai absis adalah batas kelas (class

bounderies), sedangkan sebagai sumbu vertikal adalah

frekuensi kumulatif. Untuk suatu tabel distribusi frekuensi,

dapat dibuat ogive frekuensi kumulatif “kurang dari”

(positif) dan frekuensi kumulatif “lebih dari” (negatif).

Kelas Nilai Jumlah

Tengah Frekuensi (F)

1 1168.5 14

2 3076.5 3

3 4984.5 1

4 6892.5 1

5 8800.5 1

http://2.bp.blogspot.com/-Br93zUCLHgk/UWlsFR7bT8I/AAAAAAAAAEQ/hVrmoqsYQ88/s1600/4.png

4. Pertemuan 4

Distribusi Frekuensi (1)

Distribusi frekuensi merupakan suatu uraian atau ringkasan yang

dapat dibuat dalam bentuk tabel suatu kelompok data yang

menunjukkan sebaran data observasi dalam beberapa kelas.

4.1. Membuat table/daftar distribusi frekuensi.

Tahapan-tahapan yang perlu dilakukan untuk membuat tabel

distribusi frekuensi adalah sebagai berikut :

1. Membuat rentang atau selisih nilai terbesar dan terkecil.

2. Membuat jumlah kelas yang dapat diberi lambang k dengan

menggunakan rumus berikut :

Kelas Interval Nilai Tepi

Kelas

Frekuensi kumulatif

Kurang

dari Lebih dari

1 215 2122 214.5 0 20

2 2123 4030 2122.5 14 6

3 4031 5938 4030.5 17 3

4 5939 7846 5938.5 18 2

5 7847 9754 7846.5 19 1 9754.5 20 0

http://1.bp.blogspot.com/-R_e8Unl2xpk/UWlsJGREWSI/AAAAAAAAAEc/sRXSrHsudVw/s1600/5.png

k = 1 + 3.322 log n, n : menunjukkan banyaknya nilai

observasi.

3.Selanjutnya anda tentukan jumlah interval kelas yang diberi

lambang (c), dengan rumus :

Keterangan komponen :

k : Banyaknya kelas

Xn : Nilai observasi terbesar

X1 : Nilai observasi terkecil.

4.Tahap terakhir adalah menentukan batas kelas (tepi bawah dan

tepi atas)

Batas bawah kelas (tepi bawah) menunjukkan kisaran nilai data

terkecil pada suatu kelas (kelompok). Sedangkan batas atas kelas

menunjukkan kemungkinan nilai data terbesar dalam suatu kelas

(kelompok).

Sebagai contoh :

Dalam sebuah kelas bahasa inggiris diperoleh nilai dari 40 siswa

sebagai berikut:

50 53 74 73

75 76 58 67

74 74 73 72

72 73 73 72

79 71 70 75

78 52 74 74

75 74 72 74

75 74 72 68

79 71 79 69

71 70 70 79

Dari data tersebut ingin dibuat sebuah tabel frekuensi

untuk menyajikan data sebaran nilai dari ke 40 siswa saat ujian

bahasa Inggris.

maka;

n =40

k=1+3.322n

k=6.322 ~ 6

c = (79-50)6=4.8~5

Kelas Frekuensi Tepi

Bawah Tepi Atas

50-54 3 49,5 54,5

55-59 1 54,5 59,5

60-64 59,5 64,5

65-69 3 64,5 69,5

70-74 23 69,5 74,5

75-79 10 74,5 79,5

4.2. Membuat distribusi frekuensi relatif dan kumulatif.

Distribusi Frekuensi Realtif

Distribusi frekuensi relatif merupakan suatu jumlah

persentase yang menyatakan banyaknya data pada suatu

kelompok tertentu. Dalam hal ini pembuat distribusi terlebih

dahulu harus dapat menghitung persentase pada masing-masing

kelompok. Distribusi akan memberikan informasi yang lebih

jelas tentang posisi masing-masing bagian dalam keseluruhan,

karena kita dapat melihat perbandingan antara kelompok yang

satu dengan kelompok yang lainnya.

Perhatikan tabel distribusi frekuensi di bawah ini!

Tabel 1

Kelas ke- Nilai Ujian Frekuensi fi

1

2

3

4

5

6

7

31 – 40

41 – 50

51 – 60

61 – 70

71 – 80

81 – 90

91 – 100

2

3

5

13

24

21

12

Jumlah 8

frekuensi relatif kelas ke-1:

fi = 2; n = 80

Frekuensi relatif = 2/80 x 100% = 2.5%

Dengan cara yang sama diperoleh frekuensi relatif untuk kelas

selanjutnya adalah sebagai berikut.

Tabel 2

Kelas ke- Nilai Ujian Frekuensi relatif (%)

1

2

3

4

5

6

7

31 – 40

41 – 50

51 – 60

61 – 70

71 – 80

81 – 90

91 – 100

2.50

3.75

6.25

16.25

30.00

26.25

15.00

Jumlah 100.00

Distribusi Frekuensi Kumulatif

Variasi lain dari distribusi frekuensi standar adalah

frekuensi kumulatif. Terdapat dua jenis

Tabel Distribusi Frekuensi kumulatif, yaitu "kurang dari" dan

"lebih dari".

Distribusi Frekuensi kumulatif "kurang dari"

menyatakan frekuensi total yang ada di bawah

batas bawah. Distribusi Frekuensi kumulatif "kurang dari" untuk

suatu kelas merupakan nilai frekuensi untuk kelas tersebut

ditambah dengan jumlah frekuensi semua kelas sebelumnya.

Tabel distribusi frekuensi kumulatif ini berfungsi untuk

mengetahui berapa banyak data yang ada di bawah suatu nilai.

Ada pun Distribusi Frekuensi kumulatif "lebih dari atau

sama dengan" menyatakan frekuensi total yang ada di atas atau

sama dengan batas bawah. Distribusi Frekuensi kumulatif "lebih

dari atau sama dengan" untuk suatu kelas merupakan nilai total

frekuensi seluruh kelas dikurang frekuensi kelas tersebut.

Tabel distribusi frekuensi kumulatif ini berfungsi untuk

mengetahui berapa banyak data yang ada di atas suatu nilai.

Tabel berikut merupakan Tabel Distribusi Frekuensi

kumulatif "kurang dari" yang diperoleh dari tabel 1 di atas.

Perhatikan bahwa kolom frekuensi selain label headernya diganti

dengan frekuensi kumulatif "kurang dari", batas-batas kelas

diganti dengan “kurang dari” ekspresi yang menggambarkan

kisaran nilai-nilai baru.

Tabel 3

Nilai Ujian Frek. kum. lebih dari atau

sama dengan

lebih dari atau sama dengan 31







lebih dari atau sama dengan

101

80

78

75

70

57

33

12

0

5. Pertemuan 5

Distribusi Frekuensi (2)

5.1. Membuat ogive.

Ogive adalah grafik yang digambarkan berdasarkan data yang

sudah disusun dalam bentuk tabel distribusi frekuensi kumulatif.

Untuk data yang disusun dalam bentuk tabel distribusi frekuensi

kumulatif kurang dari, grafiknya berupaogive positif, sedangkan

untuk data yang disusun dalam bentuk tabel distribusi frekuensi

kumulatif lebih dari, grafiknya berupa ogive negatif.

Data upah karyawan sebelumnya dapat digambarkan ogivenya.

Akan tetapi sebelum itu, buat terlebih dahulu tabel distribusi

frekuensi kumulatifnya.

Dari tabel distribusi frekuensi kumulatif di atas, dapat

digambarkan ogive seperti pada diagram berikut.

5.2. Histogram dan poligon frekuensi.

Histogram

Pengertian Histogram dan Cara Membuatnya – Dalam Statistik,

Histogram merupakan tampilan bentuk grafis untuk menunjukkan

distribusi data secara visual atau seberapa sering suatu nilai yang

berbeda itu terjadi dalam suatu kumpulan data. Histogram juga

merupakan salah satu alat dari 7 alat pengendalian kualitas (QC 7

Tools). Manfaat dari penggunaan Histogram adalah untuk

memberikan informasi mengenai variasi dalam proses dan membantu

manajemen dalam membuat keputusan dalam upaya peningkatan

proses yang berkesimbungan (Continous Process Improvement).

Langkah-langkah Membuat Histogram

Berikut ini adalah Langkah-langkah yang diperlukan dalam

membuat Histogram :

1. Mengumpulkan data Pengukuran

Data yang untuk membuat Histogram adalah data pengukuran

yang berbentuk Numerik.Sebagai contoh:

Seorang Engineer ingin mengumpulkan data pengukuran untuk

panjangnya kaki komponen A seperti tabel dibawah ini :

2. Menentukan besarnya Range

Sebelum menentukan Besarnya nilai Range, kita perlu

mengetahui Nilai terbesar dan Nilai Terkecil dari seluruh data

pengukuran kita. Cara untuk menghitung Nilai Range (R) adalah :

R = Xmaks – Xmins

atau

Range = Nilai terbesar – Nilai terkecil

Catatan :

Jika anda menggunakan Excel , anda bisa memakai Function :

Mencari Nilai Terbesar : @MAX( nomor cell awal : nomor cell

akhir)

Mencari Nilai Terkecil : @MIN(nomor cell awal : nomor cell

akhir)

Untuk contoh diatas, Besarnya Nilai Range adalah 0.6 dengan

perhitungan dibawah ini:

Range = 3.2 – 2.6

Range = 0.6

3. Menentukan Banyaknya Kelas Interval

Sebagai Pedoman, terdapat Tabel yang menentukan Kelas

Interval-nya sesuai dengan banyaknya Jumlah Sample Unit pada Data

Pengukuran.

Untuk contoh kasus diatas, banyaknya sampel data pengukuran

adalah 50 data, maka kita memilih banyaknya kelas interval adalah 7

buah (menurut tabel adalah 6 sampai 10).

4. Menentukan Lebar Kelas Interval, Batas Kelas, dan Nilai

Tengah Kelas

4.1. Menentukan Lebar Kelas Interval :

Yang menentukan Lebar setiap kelas Interval adalah

pembagian Range (Langkah 2) dan Banyaknya Interval Kelas

(Langkah 3).

Kasus yang sama, untuk cara menghitung Lebar Kelas

Interval adalah :

Lebar = Range / Kelas Interval

Lebar = 0.6 / 7

Lebar = 0.1 (dibulatkan)

4.2. Menentukan Batas untuk setiap Kelas Interval :

Untuk menentukan Batas untuk setiap kelas Interval, kita

memakai rumus :

Nilai terendah – ½ x unit pengukuran

(dalam kasus ini kita memakai unit pengukuran 0.1)

Batas Kelas Pertama :

Menentukan Batas bawah Kelas pertama :

2.6 – ½ x 0.1= 2.55

Selanjutnya Batas Bawah kelas pertama ditambah

dengan Lebar Kelas Interval untuk menentukan Batas atas

kelas pertama :

2.55 + 0.1 = 2.65

Batas Kelas Kedua :

Menentukan Batas bawah Kelas Kedua :

Batas Bawah Kedua adalah Batas Atas Kelas Pertama, yaitu :

2.65

Batas Atas Kedua adalah Batas Bawah Kedua ditambah

dengan Lebar Kelas Interval yaitu : 2.65 + 0.1 = 2.75

Batas Kelas Ketiga dan seterusnya :

Dilanjutkan ke kelas ketiga dan seterusnya seperti cara untuk

menentukan Batas Kelas Kedua.

4.3. Menentukan Nilai Tengah setiap Kelas Interval :

Nilai Tengah Kelas Pertama :

Nilai Tengah Kelas Pertama = batas atas + batas bawah kelas

Pertama / 2

= 2.55 + 2.65 / 2

= 2.6

Nilai Tengah Kelas kedua dan seterusnya :

Nilai Tengah Kelas kedua dan seterusnya

mempergunakan cara yang sama seperti menghitung Nilai

Tengah Kelas Pertama.

5. Menentukan Frekuensi dari Setiap Kelas Interval

Untuk mempermudah perhitungan, pakailah tanda

“Tally” pengelompokkan 5 (lima) untuk menghitung satu per

satu jumlah frekuensi yang jatuh dalam kelas Interval.

Masih kasus yang sama, berikut ini tabel hasil

perhitungannya :

6. Membuat Grafik Histogram

1. Membuat Garis Horizontal dengan menggunakan skala

berdasarkan pada unit pengukuran data

2. Membuat Garis Vertikal dengan menggunakan skala

frekuensi

3. Menggambarkan Grafik Batang, tingginya sesuai dengan

Frekuensi setiap Kelas Interval

4. Jika terdapat batasan Spesifikasi yang ditentukan oleh

Customer (Pelanggan) maka tariklah garis vertikal sesuai

dengan spesifikasi tersebut.

Poligon Frekuensi

Poligon Frekuensi merupakan grafik garis yang menghubungkan

nilai tengah tiap sisi atas yang berdekatan dengan nilai tengah jarak

frekuensi mutlak masing-masing.

Perbedaan antara histogram dengan poligon frekuensi adalah :

Histogram menggunakan batas kelas sedangkan poligon

menggunakan titik tengah.

Grafik histogram berwujud segiempat atau menyerupai diagram

batang, sedangkan poligon berwujud garis atau kurva yang saling

berhubungan satu sama lain.

Langkah-langkah membuat POLIGON FREKUENSI :

1. Buat titik tengah kelas dengan cara : (NILAI UJUNG BAWAH

KELAS + NILAI UJUNG ATAS KELAS) x ½

2. Buat tabel distribusi frekuensi yang MUTLAK disertai dengan

kolom tambahan berupa kolom titik tengah kelas tsb.

3. Buat grafik poligon frekuensi dengan melihat data pada tabel

distribusi frekuensi mutlak

a. Buat TITIK TENGAH KELAS

Titik tengah kelas ke-1 : (45 + 51) x ½ = 48






b. Buat Tabel Distribusi Frekuensi Mutlak dengan menambah kolom

TITIK TENGAH KELAS

c. Buat grafik poligon frekuensi

6. Pertemuan 6

Ukuran – statistika (1)

Ukuran statistik adalah bilangan yang diperoleh dari sekumpulan

data statistic melalui proses sritmatik tertentu. Ukuran yang dihitung

dari kumpulan data sampel dinamakan statistic sedangkan apabila

dihitung dari kumpulan data populasi dinamakan paramater.

6.1. Ukuran Gejala Pusat.

Suatu ukuran nilai yang diperoleh dari nilai data observasi dan

mempunyai

kecenderungan berada ditengah - tengah nilai data observasi.

Ukuran gejala

pusat dipakai sebagai alat atau sebagai parameter untuk dapat

digunakan

sebagai bahan pegangan dalam menafsirkan suatu gejala atau

suatu yang

akan diteliti berdasarkan hasil pengolahan daa yang

dikumpulkan.

Beberapa ukuran gejala pusat yaitu :

A. Rata - rata hitung (Mean)

Rata - rata adalah setiap bilangan yang bisa dipakai sebagai

wakil dari rentetan nilai rata-rata itu, wujudnya berupa satu

bilangan saja namun dapat mencerminkan gambaran secara

umum mengenai kumpulan atau deretan bahan keterangan

berupa angka atau bilangan itu. Mean adalalah jumlah dari

keseluruhan bilangan yang ada dibagi dengan banyaknya angka

bilangan tersebut.

Jenis - jenis Mean yaitu :

- Mean data tidak terkelompok

Rumus :

Mean data terkelompok

Rumus :

B. Median

Median adalah titik tengah dari keseluruhan satuan data.

Oleh karena itu terdapat 50% data yang berapa dibawah atau

sama dengan nilai tersebut dan 50% data yang berada diatas atau

sama dengan data tersebut.

Jenis - jenis median yaitu :

- Median data tidak terkelompok

Suatu data yang membagi sekelompok data menjadi 2

bagian sama banyaknya.

Rumus :

Median data terkelompok.

C. Modus

Umumnya modus dipakai sebagai "nilai rata-rata" bagi data

kualitatif yang digunakan sebagai sebuah kesimpulan. Data

observasi yang mempunyai 2 modus disebut bimodus dan data

observasi yang mempunyai lebih dari 2 modus disebut bimodus.

Jenis - jenis modus :

- Modus data tidak terkelompok

Merupakan data yang paling sering muncul atau jumlah

frekuensi terbanyak.

- Modus data terkelompok

Data yang disusun secara terkelompok karena

menggunakan daftar distribusi. Biasanya digunakan untuk

data yang besar/data yang berbobot maupun data yang

tidak berbobot.

Hubungan antara Mean, Median, dan Modus adalah

dapat digunakan untuk mengetahui kemiringan kurva poligon

distribusi frekuensi data observasi.

1. Mean = Median = Modus => Kurvanya simetris

2. Mean < Median < Modus => Bentuk kurvanya miring ke kiri

3. Mean > Median > Modus => Bentuk kurvanya miring ke kanan

6.2. Ukuran Letak.

A. Kuartil

Untuk menentukan kuartil dengan cara :

1. Susun data menurut urutan nilainya

2. Tentukan letak kuartil

3. Tentukan nilai kuartil

Jenis-jenis kuartil :

- Kuartil data tidak terkelompok

Suatu data yang membagi sekelompok data yang sudah

diurutkan menjadi empat bagian yang sama banyaknya, makan

akanditemukan K1, K2, K3 atau Q1, Q2, Q3

- Kuartil data terkelompok

B. Desil

Jika kumpulan data dibagi menjadi 10 bagian yang sama

banyak, maka tiap bagian tersebut persepuluhan atau disebut

desil. Cara menentukan Desil sama seperti menentukan cara

kuartil.

Jenis-Jenis Desil

- Desil data tidak terkelompok

- Desil data terkelompok

C. Persentil

Merupakan ukuran letak yang paling halus karena

pembagiannya 1 sampai 9.

Jenis-jenis Persentil :

- Persentil data tidak terkelompok

- Persentil data terkelompok

7. Pertemuan 7

Ukuran – statistika (2)

7.1. Ukuran Variabilitas.

Variabilitas adalah derajat penyebaran nilai-nilai variabel dari

suatu tendensi sentral dalam suatu distribusi. Variabilitas disebut

juga sebagai dispersi. Jika dua distribusi, misalnya distribusi A dan

B diperbandingkan. Distribusi A menunjukkan penyebaran nilai-nilai

yang lebih besar dari distribusi B, maka dikatakan distribusi A

mempunyai variabilitas yang lebih besar dari distribusi B.

Variabilitas dapat diketahui melalui pengukuran :

1. Range

2. Mean deviation

3. Standard deviation

(1) Range adalah jarak antara nilai tertinggi dengan nilai

terendah.

R = Xt – Xr

R = Range

Xt = nilai tertinggi

Xr = nilai terendah

Kelemahan Range:

1. Penggunaannya sangat terbatas.

2. Sangat tergantung pada nilai tertinggi dan nilai

terendah sehingga mempunyai fluktuasi yang sangat

besar.

3. Range kurang memenuhi definisi sebagai alat

pengukuran variabilitas karena tidak dapat

menunjukkan letak tendensi sentral dan

penyebarannya/ tidak menunjukkan bentuk

distribusi.

Range 10-90

Nilai-nilai yang ekstrem (terlalu rendah atau terlalu

tinggi) adalah nilai-nilai yang tidak stabil.

Untuk menghindari nilai-nilai yang tidak stabil itu,

maka diambil range yang lebih sempit yaitu range

antara persentil ke-10 dengan persentil ke-90.

Range 10-90 memotong distribusi sebanyak 20

persen, yaitu masing-masing 10 persen pada tiap

ujungnya.

Rumus R 10-90 = P90 – P10

Kelemahan : masih tergantung pada nilai-nilai di

bagian ujung distribusi

Range 25-75

Range 25-75 memotong 25 persen dari tiap-tiap

ujung distribusi atau 50 persen frekuensi distribusi.

Disebut juga sebagai “Range antar Kwartil”

R 25-75 = P75 – P25 = K3 – K1

Masih memiliki kelemahan karena masih memiliki

sifat-sifat Range Range Semi Antar Kwartil

Range Semi Antar Kwartil (RSAK) adalah separo

dari range antar kwartil.

RSAK = P75 – P25 = ½ (K3 – K1)

2

Memiliki sifat yang lebih baik daripada range

range sebelumnya.

Biasanya digunakan bersama-sama dengan median.

Median sebagai tendensi sentral dan RSAK untuk

mengetahui variabilitasnya.

(2) Mean Deviation

Mean Deviation = Average Deviation = Deviasi

Rata-rata Adalah rata-rata dari deviasi nilai-nilai

dari mean dalam suatu distribusi, diambil nilai

absolutnya.

Deviasi absolut = nilai-nilai yang positif.

MD = ? |x| atau MD = ? f|x|

N N

MD = Mean deviation

? |x| = Jumlah deviasi dalam harga mutlaknya

N = Jumlah individu / kasus

Kelebihan dan Kekurangan MD

Kelebihan :

Mulai dipenuhinya definisi variabilitas, yaitu

penyebaran nilai-nilai yang ditinjau dari

tendensi sentral

Tidak membuang data sedikitpun. Nilai yang

ekstrem tetap dipakai.

Kelemahan :

Cara penghitungannya mengabaikan tanda-

tanda plus dan minus, sehingga tidak dapat

dikenai perhitungan matematik yang

mempertahankan nilai plus dan minus.

(3) Standard Deviation

Secara matematis, SD adalah akar dari jumlah

deviasi kuadrat dibagi banyaknya individu atau

akar dari rata-rata deviasi kuadrat.

SD = ? ? x2 dimana M = ? x

N N

SD = Standard Deviasi (? )

? x2 = Jumlah deviasi kuadrat

N = jumlah individu/kejadian dalam distribusi

8. Pertemuan 8

UTS

9. Pertemuan 9

Dasar-dasar Teori Peluang (Probabilitas) (1)

Probabilitas didifinisikan sebagai peluang atau kemungkinan

suatu kejadian, suatu ukuran tentang kemungkinan atau derajat

ketidakpastian suatu peristiwa (event) yang akan terjadi di masa

mendatang.Rentangan probabilitas antara 0 sampai dengan 1. Jika

kita mengatakan probabilitas sebuah peristiwa adalah 0, maka

peristiwa tersebut tidak mungkin terjadi. Dan jika kita mengatakan

bahwa probabilitas sebuah peristiwa adalah 1 maka peristiwa tersebut

pasti terjadi. Serta jumlah antara peluang suatu kejadian yang

mungkin terjadi dan peluang suatu kejadian yang mungkin tidak

terjadi adalah satu, jika kejadian tersebut hanya memiliki 2

kemungkinan kejadian yang mungkin akan terjadi.

9.1. Permutasi dan Kombinasi.

Permutasi

Permutasi adalah suatu penyusunan atau pengaturan beberapa

objek ke dalam suatu urutan tertentu.

Contoh :

Ada 3 objek, yaitu ABC. Pengaturan objek-objek tersebut ialah

ABC, ACB, BCA, BAC, CAB, CBA yang disebut permutasi.

Jadi, permutasi 3 objek menghasilkan enam pengaturan dengan

cara yang berbeda.

Rumus-rumus Permutasi :

Permutasi dari m objek seluruhnya tanpa pengembalian : mPm

= m!

Contoh :

Pada suatu tempat terdapat 4 buku matematika yang

berbeda. Buku itu akan disusun pada sebuah rak buku. Berapa

cara susunan yang mungkin dari buku-buku matematika dapat

disusun.

Penyelesaian :

Buku-buku matematika dapat disusun dalam :

4P4 = 4! = 4 x 3 x 2 x 1 = 24 cara.

Permutasi sebanyak x dari m objek tanpa pengembalian :

Contoh :

Dari empat calon pimpinan sebuah perusahaan, misalkan A, B,

C, D hendak dipilih seorang ketua, seorang sekretaris, dan

seorang bendahara.

Berapa cara keempat calon tersebut dipilih?

Penyelesaian:

m = 4 dan x = 3

4P3 =

Permutasi dari m objek dengan pengembalian :

mPx = mx

x ≤ m dan bilangan bulat positif

Contoh :

Tentukan permutasi dari ABC sebanyak 2 unsur dengan

pengembalian unsure yang terpilih!

Penyelesaian :

M = 3 dan x = 2

3P2 = 32 = 9

yaitu : AA, AB, AC, BB, BA, BC, CC, CA, CB

Permutasi dari m objek yang sama :

m!

mPm1, m2, m3, … = ———————–

m1! . m2! . m3! ….

Dengan m1 + m2 + m3 + ….= m

Contoh :

Tentukan permutasi dari kata “TAMAT”

Penyelesaian :

M = 5, m1 = 2, m2 = 2, m3 = 1

5! 5 x 4 x 3 x 2 x 1

5P2, 2, 1 = ————— = ——————– = 30

2! . 2! . 1! 2 x 1 x 2 x 1 x 1

Kombinasi

Kombinasi adalah suatu penyusunan beberapa objek

tanpa memperhatikan urutan objek tersebut.

Contoh :

Ada 4 objek, yaitu : A, B, C, D. Kombinasi 3 dari objek itu adalah

ABC, ABD, ACD, BCD. Setiap kelompok hanya dibedakan

berdasarkan objek yang diikutsertakan, bukan urutannya. Oleh

karena itu :

ABC = ACB = BAC = BCA = CAB = CBA

ABD = ADB = BAD = BDA = DAB = DBA

ACD = CAD = ADC = CDA = DAC = DCA

BCD = BDC = CBD = CDB = DBC = DCB

Rumus-rumus Kombinasi :

Kombinasi x dari m objek yang berbeda :

m!

mCx = ————–

(m – x)!.x!

Contoh :

Dari 5 pemain bulu tangkis, yaitu A, B, C, D, dan E hendak

dipilih dua orang untuk pemain ganda. Berapa banyak pemain

ganda yang mungkin terbentuk?

Penyelesaian :

M = 5 dan x = 2

5!

5C2 = —————- = 10

– 2)! . 2!

9.2. Aturan Probabilitas. Berikut merupakan aturan dalam probabilitas

Jika n = 0 makka peluang terjadinya suatu kejadian pada

keadaan ini adalah sebesar P(A) = 0 atau tidak mungkin

terjadi.

Jika n merupakan semua anggota N maka

probabilitasnya adalah satu, atau kejadian tersebut pasti

akan terjadi

Probabilitas suatu kejadian memiliki rentangan nilai

Jika E menyatakan bukan peristiwa E maka berlaku

9.3. Hukum-hukum Probabilitas

1. Peluang Untuk Peristiwa Yang Tidak Saling Lepas

(Inclusive Event)

Dua peristiwa atau lebih dikatakan peristiwa yang tidak

saling lepas apabila peristiwa peristiwa tersebut dapat terjadi

bersamaan, namun tidak selalu terjadi bersamaan, atau

memiliki bagian titik sampel yang sama.(dihubungkan

dengan kata ”atau”)

Rumus :

P(AUB) = P(A) + P(B) – P(AnB)

2. Peluang Untuk Peristiwa Yang Saling Lepas (Exclusive

Event)

Dua perstiwa atau lebih dikatakan peristiwa yang saling

lepas apabila peristiwa peristiwa tersebut tidak dapat terjadi

bersamaan atau memiliki titik sampel yang berbeda pada

suatu ruang sampel. (dihubungkan dengan kata “atau”)

Rumus :

P(AUB) = P(A) + P(B)

Contoh Soal :

Pada sebuah kantong, terdapat 10 butir kelereng warna

merah, 7 butir kelereng warna kuning, dan 8 butir kelereng

warna hijau. Jika Andi ingin mengambil 1 butir kelereng,

berapakah peluang terambilnya kelereng warna merah atau

kuning?

3. Peluang Untuk Peristiwa Yang Komplementer

2 peristiwa atau lebih dikatakan komplementer apabila

anggota himpunan pada peristiwa yang satu bukan merupakan

anggota himpunan pada peristiwa lainnya, dan jumlah dari

seluruh anggota himpunan itu adalah 1.

Rumus :

P(A) = 1 - P(Ā) atau P(Ā) = 1 - P(A) atau P(Ā) + P(A) = 1

Contoh Soal :

Sasa mengikuti sebuah perlombaan statistik untuk seluruh

Mahasiswa se-Jawa Barat, jika peluang Sasa masuk ke babak

final sebesar 65%, berapakah peluang ia gagal masuk babak

final?

Jawab :

A = lolos

Ā = tidak lolos

P(A) = Peluang lolos ke babak final = 65% = 0,65

P(Ā) = Peluang tidak lolos ke babak final

Maka,

P(Ā) = 1 – P(A)

= 1 – 0.65

= 0,35 = 35 %

Jadi, peluang Sasa gagal masuk ke babak final adalah sebesar

35%.

4. Peluang Untuk Peristiwa Yang Independent (Independent

Event)

Dua peristiwa atau lebih dikatakan Independent apabila

peristiwa yang satu tidak mempengaruhi peristiwa yang

lainnya.(dihubungkan dengan kata “dan”)

Rumus :

P(A n B) = P(A) . P(B)

10. Pertemuan 10

Dasar-dasar Teori Peluang(Probabiltas) (2)

10.1. Probabilitas Bersyarat.

Untuk dua kejadian A dan B, peluang bersyarat dari A, adalah

peluang A dimana B telah terjadi (atau tidak terjadi).

Peluang bersyarat A dimana B didefinisikan sebagai

P(A | B) =

P(A ∩ B)

P(B)

Jika kejadian A dan B saling bebas (independen), P(A ∩ B) =

P(A)P( B).

Sehingga

P(A | B) = P(A)

P(B | A) = P(B)

Jika kejadian A dan B saling terpisah, P(A ∩ B) = 0.

Sehingga, jika P(B) > 0, maka P(A | B) = 0.

Contoh:

Di sebuah daerah, peluang bahwa suatu hari akan berawan adalah

0.4. Diketahui juga bahwa peluang suatu hari berawan dan hujan

adalah 0.3. Jikalau hari ini berawan, berapakah peluang bahwa

hari ini akan hujan?

Marilah kita lambangkan kejadian hari berawan dengan A dan

kejadian hari hujan dengan H.

P(A) = 0.4

P(H ∩ A) = 0.3

P(H | A) =P(H ∩ A)

P(A)

= 0.3

0.4

= 0.75

10.2. Probabilitas Bivariat.

Suatu fungsi fX,Y (x, y) dikatakan fungsi peluang bivariat jika

• fX,Y (x, y) ≥ 0, untuk semua x, y

• ∫ ∫ ∫ 𝑓∞

−∞

∞

−∞𝑋, 𝑌 (x, y) dxdy = 1

Jika fX,Y (x, y) fungsi peluang bivariat maka

FX,Y (x, y) = P(X ≤ x, Y ≤ y) = ∫ ∫ 𝑓𝑥, 𝑦(𝑢, 𝑣)𝑑𝑣𝑑𝑢𝑦

−∞

x

−∞

Sifat-sifat fungsi distribusi bivariat:

1. FX,Y (x,∞) = FX(x)

2. FX,Y (∞, y) = FY (y)

3. FX,Y (∞, ∞) = 1

4. FX,Y (−∞, y) = FX,Y (x, −∞) = FX,Y (−∞, −∞) = 0

5. fX,Y (x, y) = ∂2

∂x ∂y FX,Y (x, y)

fX,Y (x, y)△x△y adalah unsur peluang bersama,

P(x ≤ X ≤ x + △x, y ≤ Y ≤ y + △y) = fX,Y (x, y)△x△y + o(△x△y)

Contoh/Latihan:

1. Jika (X, Y ) ∼ U(a, b, c, d) maka

fX,Y (x, y) = 1

(b − a)(d − c), x ∈ (a, b), y ∈ (c, d)

2. Untuk soal no 1 di atas, misalkan a = c = 0, b = 4, d = 6 maka

P(2.5 ≤ X ≤ 3.5, 1 ≤ Y ≤ 4) = 3/24

P(𝑋2 + 𝑌2 > 16) = 1 − P(𝑋2 + 𝑌2≤ 16) = 1 − π/6

3. Jika fX,Y (x, y) = (6/5) (x+𝑦2) untuk x ∈ (0, 1) dan y ∈ (0, 1).

Tentukan

P(X + Y < 1).

P(X + y < 1) = P(X < 1 − Y ) = ∫ ∫ 𝑓1−y

0

1

0𝑥, 𝑦(𝑥, 𝑦)𝑑𝑥 𝑑𝑦

= · · ·

= 3/10

Untuk menentukan fungsi peluang marginal, integralkan “peubah

yang tidak

diinginkan”:

fX(x) = ∫ 𝑓𝑥, 𝑦(𝑥, 𝑦)𝑑𝑦∞

−∞

fY (y) = ∫ 𝑓𝑥, 𝑦(𝑥, 𝑦)𝑑𝑥∞

−∞

fX,Y (x, y) = ∫ ∫ 𝑓∞

−∞

∞

−∞𝑤, 𝑥, 𝑦, 𝑧(𝑤, 𝑥, 𝑦, 𝑧)𝑑𝑣𝑑𝑧

Pada fungsi peluang fX,Y (x, y) = 6/5(x + 𝑦2) diperoleh

fX(x) = 16 x + 2

5, x ∈ (0, 1)

fY (y) = 2+3

5, y ∈ (0, 1)

dan nilai harapan

E(g(X, Y )) =

E(X) = ∫ ∫ 𝑔(𝑥, 𝑦)𝑓∞

−∞

∞

−∞𝑥, 𝑦 (𝑥, 𝑦)𝑑𝑥𝑑𝑦 = ⋯ = 3/5

10.3. Theorema Bayes

Teorema Bayes, diambil dari nama Rev. Thomas Bayes,

menggambarkan hubungan antara peluang bersyarat dari dua

kejadian A dan B sebagai berikut:

P(A | B) =P(B | A) P(A)

P(B)

atau

P(A | B) = P(B | A) P(A)

P(B | A)P(A) + P(B | A)P(A)

11. Pertemuan 11

Distribusi Peluang (1)

Distribusi peluang adalah sebaran kemungkinan terjadinya

variable acak tertentu. Variable acak adalah peristiwa yang

diharapkan akan terjadi, yang biasanya dilambangkan dengan X.

Atau, suatu bilangan yang ditentukan oleh peristiwa yang dihasilkan

dari eksperimen.

11.1. Distribusi gabungan variable random diskrit.

Variabel random diskrit adalah suatu fungsi yang memetakan

setiap anggota Ruang Sampel S ke bilangan Real. Dalam statistika,

variabel random diskrit disimbolkan dengan huruf-huruf kapital

misalkan X, Y, Z, dll. Variabel acak yang mampu menjalani

bilangan bulat adalah Variabel Acak Diskrit, sedangkan variabel

acak yang mampu menjalan bilangan real adalah Variabel random

Kontinu. Misalkan X adalah variabel acak diskrit maka fungsi

kepadatan probabilitas (probability density funcon, PDF) dapat

didefinisikan sebagai

Dengan kata lain, fungsi pX(x) adalah fungsi distribusi

probabilitas dari X untuk variabel acak diskrit. PDF dari variabel

acak diskrit X harus memenuhi sifat-sifat berikut:

Misalkan X merupakan variabel acak diskrit maka fungsi

kepadatan kumulatif (cumulative density function, CDF) dapat

didefinisikan sebagai.

Dengan kata lain, fungsi FX(x) adalah fungsi distribusi dari X

untuk variabel acak diskrit. CDF dari variabel acak diskrit X dapat

diilustrasikan sebagai berikut.

Jika pX(x) merupakan PDF dari variabel acak diskrit X, maka

terdapat relasi antara PDF dan CDF, yaitu

Dan

Contohnya, dalam suatu keluarga yang memiliki dua anak, distribusi

probabilitas dari banyaknya anak yang terlahir perempuan akan

mengikuti ketentuan ini

Nilai mean dan varian dari banyaknya anak yang terlahir

perempuan akan dihitung sebagai berikut:

Misalkan X adalah banyaknya anak yang sukses terlahir

perempuan, maka

Dan

Jadi, diperoleh mean dan varian dari banyaknya anak yang

terlahir perempuan pada suatu keluarga yang memiliki dua anak

masing-masing adalah 1 dan 0,5 .

11.2. Distribusi binomial.

Distribusi Binomial merupakan distribusi probabilitas dari

banyaknya outcome/kejadian sukses pada n percobaan Bernoulli.

Fungsi kepadatan probabilitas (PDF) dari variabel acak X Binomial

dirumuskan sebagai

Sedangkan, fungsi kepadatan kumulatif (CDF) dari variabel acak X

Binomial adalah

Sebagai Contoh, seorang peneliti ingin meneliti obat A untuk

penyakit asma. Berdasarkan survey ditemukan lima puluh dari

seratus orang yang sembuh dari penyakit asma setelah meminum obat

ini. Jika 20 orang penderita asma diambil secara acak dan diberi

minum obat A, maka tentukan probabilitas bahwa:

a. tepat 10 orang yang sembuh.

b. maksimal 2 orang yang sembuh.

Misalkan X adalah banyak orang yang sembuh penyakit Asma

setelah meminum obat A; maka p = 50/100 = 0,50 , q = 1 – p = 1 –

0,50 = 0,50 dan n = 20 , sehingga:

a. probabilitas tepat 10 orang yang sembuh adalah

b. probabilitas maksimal 2 orang yang sembuh adalah

11.3. Distribusi hipergeometris.

Distribusi Hipergeometris merupakan distribusi probabilitas

dari banyaknya outcome/kejadian sukses pada populasi sebesar N

yang memiliki m elemen dengan kejadian sukses dan N – m

elemen lainnya dengan kejadian gagal yang mana percobaan ini

dilakukan pada n sampel. Fungsi kepadatan probabilitas (PDF) dari

variabel acak X Hipergeometris dirumuskan

Sedangkan, fungsi kepadatan kumulatif (CDF) diskrit dari

variabel acak X Hipergeometris adalah

Sebagai contoh, suatu panitia pemilihan dibentuk berdasarkan

6 orang yang diambil secara acak dari 15 orang yang mendaftar.

Enam puluh persen diantaranya adalah wanita. Jika X variabel

acak yang menyatakan banyaknya wanita yang terpilih, maka

dihitung probabilitas tepat 2 wanita dalam panitia tersebut.

Misalkan X adalah banyaknya wanita yang terpilih dalam

kepanitiaan, maka x = 2, n = 6 , N = 15, dan m = 60% dari N =

(0,60)(15) = 9 , sehingga probabilitas tepat 2 wanita dalam panitia

tersebut adalah

Sebagai tambahan, nilai mean dan varian dari variabel acak

diskrit X berdistribusi Hipergeometrik masing-masing adalah

Dan

Ketika n/N ≤ 0,05 distribusi Hipergeometrik dapat didekati

dengan distribusi Binomial dengan parameter n dan p = m/N.

Selanjutnya, nilai mean dan varian dari variabel acak diskrit X

berdistribusi Hipergeometrik masing-masing adalah μ = np dan σ2

= npq .

11.4. Distribusi poison.

Distribusi Poisson merupakan distribusi probabilitas dari

banyaknya outcome/kejadian sukses X yang terjadi selama interval

waktu atau area tertentu. Interval pengamatan ini dapat berupa waktu

atau ruang 2D/3D, contohnya:

- waktu (berapa banyak pelanggan mengunjungi kantor pos dalam

1 hari),

- ruang 2D (menghitung banyaknya cacat pada cat mobil A),

- ruang 3D (menghitung banyaknya ikan di satu kilometer kubik

laut), dll.

Karakteristik percobaan Poisson diberikan sebagai berikut:

1. Banyaknya outcome/kejadian terjadi dalam interval waktu atau

area tertentu yang independen.

2. Probabilitas bahwa suatu outcome/kejadian tunggal akan terjadi

selama interval waktu yang pendek atau area yang kecil secara

proporsional dan tidak tergantung pada banyaknya

outcome/kejadian pada interval waktu atau area yang lain.

3. Probabilitas bahwa lebih dari satu outcome/kejadian akan terjadi

pada interval waktu yang pendek atau area yang kecil dapat

diabaikan.

Nilai mean banyaknya outcome/kejadian dihitung dari μ = λ t

dengan λ adalah derajat terjadinya outcome/kejadian dan t adalah

ketentuan waktu, jarak, area, atau volume yang menjadi perhatian.

Fungsi kepadatan probabilitas (PDF) dari variabel acak X Poisson

dirumuskan

Sedangkan, fungsi kepadatan kumulatif (CDF) dari variabel acak

X Poisson adalah

Sebagai contoh, mean banyaknya panggilan ke call center dalam

dua hari adalah 6 panggilan. Dihitung probabilitas bahwa:

1. Minimal ada dua panggilan dalam dua hari.

2. Ada tujuh panggilan dalam empat hari.

3. Maksimum ada satu panggilan dalam satu hari.

Misalkan X adalah banyaknya panggilan ke call center dan μ

adalah mean banyaknya panggilan ke call center dalam dua hari (t =

2), maka μ sama dengan 6, sehingga:

1. Jika mean banyaknya panggilan ke call center diberikan dalam

dua hari, maka Probabilitas minimal ada dua panggilan dalam

dua hari akan bernilai


dua hari, maka Probabilitas ada tujuh panggilan dalam empat hari

akan bernilai


dua hari, maka Probilitas maksimum ada satu panggilan dalam

satu hari akan bernilai

12. Pertemuan 12

Distribusi Peluang (2) 12.1. Distribusi gabungan variable random kontinu.

Variabel random kontinu adalah suatu fungsi yang memetakan

setiap anggota Ruang Sampel S ke bilangan Real[3]. Dalam

statistika, variabel acak disimbolkan dengan huruf-huruf kapital

misalkan X, Y, Z, dll. Variabel acak yang mampu menjalani

bilangan bulat adalah Variabel Acak Diskrit, sedangkan variabel

random yang mampu menjalani bilangan real adalah Variabel

random Kontinu. Misalkan X adalah variabel random kontinu maka

fungsi kepadatan probabilitas (probability density function, PDF)

dapat didefinisikan sebagai

Dengan kata lain, fungsi fX(x) adalah fungsi distribusi

probabilitas dari X untuk variabel acak kontinu. PDF dari variabel

acak kontinu X harus memenuhi sifat-sifat berikut:

Misalkan X merupakan variabel acak kontinu maka fungsi

kepadatan kumulatif (cumulative Density Function, CDF) dapat

didefinisikan sebagai

Dengan kata lain, fungsi FX(x) adalah fungsi distribusi dari X

untuk variabel acak kontinu. Jika fX(x) merupakan PDF dari

variabel acak kontinu X, maka terdapat relasi antara PDF dan CDF,

yaitu

Rumusan ini tidak dapat digunakan untuk distribusi variabel

acak diskrit. Sebagai tambahan, mean dan varian dari variabel acak

kontinu masing-masing adalah

12.2. Distribusi normal.

Distribusi Normal merupakan distribusi probabilitas kontinu

yang paling penting dalam segala bidang Statistika. Distribusi ini

memiliki karakteristik dari fungsi kepadatan-nya yang berbentuk

kurva simetris menyerupai suatu lonceng, sehingga kurva Normal

ini disebut sebagai kurva berbentuk lonceng (bell-shaped curve).

Disamping itu, distribusi Normal juga disebut juga sebagai

Distribusi Gaussian yang mana hal ini diberikan sebagai

penghargaan untuk Ahli Matematika Jerman Karl Friedrich Gauss

(1777 – 1855) dalam membentuk fungsi distribusi Normal. Fungsi

kepadatan probabilitas (PDF) dari variabel acak X Normal

dirumuskan sebagai

Variabel acak X berdistribusi Normal dengan parameter mean

μ dan varian σ2 yang mana PDF dari distribusi ini dapat

diilustrasikan sebagai berikut.

Misalkan diberikan dua sampel data X1 ~ N(μ1 , σ12) dan X2 ~

N(μ2 , σ22) dengan:

1. kondisi μ1 < μ2 dan σ1 = σ2, maka kurva Normal diilustrasikan

menjadi

2. kondisi μ1 = μ2 dan σ1 < σ2, maka kurva Normal digambarkan

mengikuti

3. kondisi μ1 < μ2 dan σ1 < σ2, maka kurva Normal diilustrasikan

menjadi

Distribusi Normal memiliki kurva yang simetris membentuk

suatu lonceng. Hal ini terjadi ketika nilai mean, median, dan modus

dari data bernilai sama; namun ketika kondisi ini tidak terpenuhi,

distribusi data yang terbentuk akan miring kanan atau miring kiri.

Berdasarkan penyebaran data yang berdistribusi Normal,

penyebaran 68% data pengamatan berada pada interval μ – σ sampai

μ + σ; penyebaran 95% data pengamatan berada pada interval μ – 2σ

sampai μ + 2σ; dan penyebaran 99,7% data pengamatan berada pada

interval μ – 3σ sampai μ + 3σ.


X Normal adalah

Penyelesaian masalah distribusi Normal dapat diselesaikan

dengan mudah menggunakan Distribusi Normal Standar. Misalkan

diberikan variabel acak X berdistribusi Normal dengan parameter

mean μ dan varian σ2, maka variabel acak Z yang berdistribusi

Normal Standar dengan parameter mean 0 dan varian 1 akan

menghasilkan fungsi kepadatan probabilitas (PDF) sebagai


Z Normal Standar adalah

Sebagai Contoh, Dari hasil survei satu komplek perumahan,

biaya pengeluaran untuk konsumsi listrik rumah tangga adalah

400.000 rupiah perbulan dan standar deviasinya sebesar 30.000 .

Jika biaya pengeluaran tersebut berdistribusi Normal, maka tentukan

probabilitas:

1. biaya pengeluaran untuk konsumsi listrik sebesar 375.000

rupiah.

[P(X = 375.000) ?]

2. biaya pengeluaran untuk konsumsi listrik maksimal 450.000

rupiah.

[P(X ≤ 450.000) ?]

3. biaya pengeluaran untuk konsumsi listrik diantara 300.000 dan

400.000 rupiah.

[P(300.000 < X < 400.000) ?]

Penyelesaian:

Misalkan X adalah variabel acak yang menyatakan biaya

pengeluaran untuk konsumsi listrik rumah tangga yang memiliki

parameter μ = 400.000 rupiah dan σ = 30.000 . Secara teori,

distribusi Normal dapat diselesaikan kedalam bentuk distribusi

Normal Standar, sehingga:

1. Untuk x = 375.000, perlu dilakukan transformasi kedalam

bentuk Normal Standar.

Jadi, P(X = 375.000) = P(Z = -0,833)

Probabilitas biaya pengeluaran untuk konsumsi listrik

sebesar 375.000 rupiah adalah 0,2820 .

2. Untuk x = 450.000, perlu dilakukan transformasi kedalam

bentuk Normal Standar.

Jadi, P(X ≤ 450.000) = P(Z ≤ 1,67)

Penyelesaian soal (b) diselesaikan dengan bantuan Tabel

Normal Standar.

Jadi, probabilitas biaya pengeluaran untuk konsumsi listrik

maksimal 450.000 rupiah adalah 0,9525 .

3. Untuk x1 = 300.000 dan x2 = 400.000, perlu dilakukan

transformasi kedalam bentuk Normal Standar.

Jadi, P(300.000 < X < 400.000) = P(-3,33 < Z < 0)

Probabilitas biaya pengeluaran untuk konsumsi listrik

diantara 300.000 dan 400.000 rupiah adalah 0,4995 .

13. Pertemuan 13

Penaksiran parameter, pengujian hipotesis.

Statistika berhubungan dengan cara membuat kesimpulan

dari data (sampel) yang telah dikumpulkan untuk suatu

maksud tertentu. Kesimpulan yang dibuat adalah kesimpulan

untuk populasi (parameter dari populasi) dimana sampel telah

diambil. Pada umumnya parameter dari sebuah populasi, tidak

diketahui nilainya atau nilai yang sudah ada diduga sudah tidak

berlaku lagi. Sehingga, apabila diinginkan untuk mengetahui

nilai parameter tersebut, atau ingin membuktikan apakah nilai

yang sudah ada masih berlaku atau tidak, dibutuhkan metoda

tertentu. Dalam statistika metoda untuk mencapai tujuan

tersebut, secara garis besarnya dapat dilakukan melalui

penaksiran atau melalui pengujian (uji) hipotesis.

13.1. Penaksiran rata-rata.

Menaksir rataan, untuk selang kepercayaan μ

a. σ diketahui, n/N > 0,05

Jika rataan suatu sampel acak berukuran n dari suatu populasi

normal sehingga n/N > 0,05 dengan varians σ2 diketahui.

Koefisien kepercayaan δ maka selang kepercayaan untuk μ

b. σ diketahui, n/N ≤ 0,05

c. σ tidak diketahui, n/N > 0,05

Jika x rataan S2 varians sampel acak berukuran n dari suatu

populasi normal atau hampir normal sehingga n/N > 0,05 dengan

varians σ2 tidak diketahui. Koefisien kepercayaan δ maka selang

kepercayaan untuk μ

d. σ tidak diketahui, n/N ≤ 0,05

Jika x rataan S2 varians sampel acak berukuran n dari suatu

populasi normal atau hampir normal sehingga n/N ≤ 0,05 dengan

varians σ2 tidak diketahui. Koefisien kepercayaan δ maka selang

kepercayaan untuk μ

Luas daerah kurava normal menunjuk penfasiran untuk µ - x

dengan σ diketahui.

Jika x dipakai untuk menaksir μ, maka dapat dipercaya α bahwa

galat (d = μ– x)

a. Kurang dari z1/2α

b. Lebih dari suatu bilangan g yang ditetapkan sebelumnya asal

saja ukuran sampel

Jika batas galat telah ditentukan duluan kurang dari suatu bilangan

tertentu g, yang berarti galat mencapai semaksimalnya

g = z1/2α sehingga seminimalnya

n = (z1/2α.σ)2

Contoh :

Sebuah sampel acak terdiri dari 100 mahasiswa telah diambil dari

sebuah universitas lalu nilai-nilai IQnya didapat =112 san s = 10

a. Dalam hal ini titik penafsirannya telah digunakan

b. Jika dikeendaki interval penafsiran IQ rata-rata dengan koeisien

kepercayaan 0,95 maka dipakai rumus

Untuk P = ½ (1+α) = 0,975 dan dk = (n-1) = 99 dengan interpolasi

dari daftar G dalam apendiks, didapat tp = 1,987 dari rumus

didapat :

112 – (1,987) < μ < 112 + (1,987)

Atau 110,0 < μ < 114,0

Jadi didapat 95% interval kepercayaan untuk IQ rata-rata

mahasiswa ialah 110,0 < μ < 114,0 secar lain dapat dikatakan kita

meras 95% yakin bahwa IQ rata-rata mahasiswa akan ada dalam

interval dengan batas 110,0 dan 114,0

13.2. Penaksiran proporsi.

RUMUS YANG DAPAT DIGUNAKAN

Dengan p = x/n dan q = 1-p sedangkan adalah bilangan z

yang dapat dicari pada tabel .

13.3. Penaksiran simpangan baku.

1. Simpangan baku diketahui dan populasinya berdistribusi

normal

2. Simpangan baku tidak diketahui dan populasi berdistribusi

normal

13.4. Konsep uji hipotesis.

A. STATISTIK DAN PENELITIAN

Dalam statistik, hipotesis dapat di artikan sebagai

pernyataan statistik tentang parameter. Statistik adalah ukuran

- ukuran yang di kenakan pada sampel ( x = rata - rata ; s =

simpangan baku;

S2= varians; r = koefisien korelasi ), dan parameter

adalah ukuran - ukuran yang di kenakan pada populasi ( x = rata

- rata, s = simpangan , S2 = variansi; r = koefisien korelasi ).

dengan kata lain hipotesis adalah taksiran terhadap parameter

populasi, melalui data sampel ( lihat gambar pada 4.1 ).

penelitian yang di dasarkan pada data populasi, atau sampling

total, atau sensus dengan tidak melakukan pengujian hipotesis

statistik dari sudut pandang statistik di sebut penelitian

deskriptif.

Terdapat perbedaan mendasar pengertian hipotesis menurut

statistik dan penelitian. dalam penelitian, hipotesis di artikan

sebagai jawaban sementara terhadap rumusan masalah

peneliltian. Rumusa masalah tersebut bisa berupa pernyataan

tentang hhubungan dua variabel atau lebih. disini terdapat

perbedaan lagi pengertian deskriptif dalam penelitian dan

dalam statistik. seperti telah di kemukakan deskriptif dalam

statistik adalah penelitian yang di dasarkan pada populasi (

tidak ada sampel ), sedangkan deskriptif dalam penelitian

menunjukan tingkat ekplanasi yaitu menanyakan tentang

variabel mandiri ( tidak di hubungkan dandi bandingkan ).

dalam statistik dan penelitian terdapat dua macam hipotesis,

yaitu hipotesis nol, dan alternatif. pada statistik, hipotesisn nol

di artikan sebagai tidak adanya perbedaan antara parameter

dengan statistik, atau tidak adanya perbedaan antara ukuran

sampel. dengan demikian hipotesis yang di uji adalah hipotesis

nol, karena memang penelitian tidak mengharapkan adanya

perbedaan antara data populasi dengan data sampel.

B. TIGA BENTUK RUMUSAN HIPOTESIS

Menurut tingkat ekplanasi hipotesis yang akan di uji, maka

rumusan hipotesis dapat di kelompok dapat di kelompok mejadi

tiga macam, yaitu hipotesis deskriptif ( pada satu sampel ) atau

variabel mandiri/ tidak di bandingkan dan di hubungkan

),komparatif dan hubungan.

1. Hipotesis Deskriptif

Hipotesis deskriptif, adalah dugaan tentang nilai suatu

variabel mandiri, tidak membuat perbandingan atau hubungan

sebagai contoh, bila rumusan masalah penelitian sebagai

berikut, maka hipotesis ( jawab sementara ) yang dirumuskan

adalah hipotesis deskriptif.

a. Sebagai tinggi daya tahan lampu merk X ?

b. Seberapa tinggi produktivitas padi di Kabupaten Klaten

?

c. Berapa lama daya tahan lampu merk A dan B ?

d. Seberapa baik gaya kepemimpinan di lembaga X ?

dari tiga pernyataan tersebut antara lain dapat di

rumuskan hipotesis seperti berikut :

a. daya tahan lampu merk X = 800 jam

b. Produktivitas padi di kabupaten Klaten 8 ton/ ha

c. daya Tahan lampu merk A= 450 jam dan merk B= 600

jam

d. Gaya kepemimpinan di lembaga X telah mencapai 70

% dari yang di harapkan.

dalam perumusan hipotesis statistik, antara hipotesis nol ( Ho)

dan hipotesis alternatif ( Ha ) selalu berpasangan, bila salah satu

di tolak, maka yang lain pasti di terima sehingga dapat di buat

keputusan yang tegas, yaitu kalau Ho di tolak pasti Ha di terima.

hipotesis statistik dinyatakan melalui simbol - simbol.

2. Hipotesis Komparatif

hipotesis komparatif adalah pernytaan yang menunjukkan

dugaan nilai dalam satu variabel atau lebih pada sampel

yang berbeda. contoh rumusan masalah komperatif dan

hipotesisnya:

a. Apakah ada perbedaan daya tahan lampu merk A dan B ?

b. Apakah ada perbedaan produktivitas kerja antara pegawai

golongan I, II, III ?

Rumusan Hipotesis adalah :

1). Tidak terapat perbedaan daya tahan antara lampu merk A

dan B.

2) .Daya tahan lampu merk B paling kecil sama dengan lampu

merk A.

3). Daya tahan lampu merk B paling tinggi sama dengan lampu

merk A.

3. Hipotesis Hubungan (Asosiatif )

Hipotesis asosiatif adalah suatu pernyataan yang

menunjukkan dugaan tentang hubungan antara dua variabel

atau lebih. contoh rumusan masalahnya adalah "Apakah ada

hubungan antara gaya kepemimpian dengan efektivitas kerja?.

rumus dan hipotesis nolnya adalah : tidak ada hubungan antar

gaya kepemimpinan dengan efektivitas kerja.

Hipotesi Statistiknya adalah :

Ho :p= 0

Ha ; p ≠ 0 ( p = simbol yang menunjukkan kuatnya hubungan )

dapat di baca : hipotesis nol, yang menunjukkan tidak adanya

hubungan ( nol = tidak ada hubungan ) antara gaya

kepemimpinan dengan efektivitas kerja dalam populasi.

hipotesis alterntifnya menunjukkan ada hubungan ( tidak sama

dengan nol, mungkin lebih besar dari 0 atau lebih kecil dari nol

).

C. TARAF KESALAHAN DALAM PENGUJIAN

HIPOTESIS

seperti telah di kemukakan, pada dasarnya meguji hipotesis

itu adalah manaksirkan parameter populasi berdasarkan data

sampel. terdapat dua cara menaksirkan yaitu. a poit estimate

dan interval estimate atau sering di sebut confidence interval. a

point estimate ( titik taksiran ) adalah suatu taksiran parameter

populasi berdasarkan satu nilai data sampel. sedangkan interval

estimat ( taksiran interval ) adalah suatu taksiran parameter

populasi berdasarkan nilai interval data sampel.

menaksirkan parameter populasi yang menggunakan nilai

tunggal ( point estimate ) akan mempunyai resiko kesalahan

yang estimate,

D. DUA KESALAHAN DALAM PENGUJIAN HIPOTESIS

Dalam menaksirkan parameter populas berdasarkan data

sempel. kemungkinan akan terdapat dua kesalahan yaitu :

1. Kesalahan tipe I adalah suatu kesalahan bila menolak

hipotesis nol ( Ho ) yang benarnya ( seharusnya di terima ).

dalam hal ini tingkat kesalahan di nyatakan dengan alpa

2. kesalahan tipe II adalah kesalahan bila menerima hipotesis

yang salah ( seharusnya di tolak ). tingkat kesalahan untuk ini

di nyatakan dengan betha.

14. Pertemuan 14

Analisis Regresi dan Korelasi

Regresi merupakan suatu alat ukur yang juga dapat digunakan

untuk mengukur ada atau tidaknya korelasi antarvariabel. Jika kita

memiliki dua buah variabel atau lebih maka sudah selayaknya

apabila kita ingin mempelajari bagaimana variabel-variabel itu

berhubungan atau dapat diramalkan.

Dalam teori probabilitas dan statistika, korelasi, juga disebut

koefisien korelasi, adalah nilai yang menunjukkan kekuatan dan

arah hubungan linier antara dua peubah acak (random variable).

14.1. Analisis Regresi Linier.

Regresi Linear Sederhana adalah Metode Statistik yang

berfungsi untuk menguji sejauh mana hubungan sebab akibat antara

Variabel Faktor Penyebab (X) terhadap Variabel Akibatnya. Faktor

Penyebab pada umumnya dilambangkan dengan X atau disebut juga

dengan Predictor sedangkan Variabel Akibat dilambangkan dengan

Y atau disebut juga dengan Response. Regresi Linear Sederhana atau

sering disingkat dengan SLR (Simple Linear Regression) juga

merupakan salah satu Metode Statistik yang dipergunakan dalam

produksi untuk melakukan peramalan ataupun prediksi tentang

karakteristik kualitas maupun Kuantitas.

Contoh Penggunaan Analisis Regresi Linear Sederhana dalam

Produksi antara lain :

1. Hubungan antara Lamanya Kerusakan Mesin dengan

Kualitas Produk yang dihasilkan

2. Hubungan Jumlah Pekerja dengan Output yang diproduksi

3. Hubungan antara suhu ruangan dengan Cacat Produksi yang

dihasilkan.

Model Persamaan Regresi Linear Sederhana adalah seperti

berikut ini :

Y = a + bX

Dimana : Y = Variabel Response atau Variabel Akibat (Dependent) X = Variabel Predictor atau Variabel Faktor Penyebab (Independent) a = konstanta b = koefisien regresi (kemiringan); besaran Response yang ditimbulkan oleh Predictor.

Nilai-nilai a dan b dapat dihitung dengan menggunakan Rumus

dibawah ini :

a = (Σy) (Σx²) – (Σx) (Σxy) . n(Σx²) – (Σx)²

b = n(Σxy) – (Σx) (Σy) . n(Σx²) – (Σx)²

Berikut ini adalah Langkah-langkah dalam melakukan Analisis

Regresi Linear Sederhana :

1. Tentukan Tujuan dari melakukan Analisis Regresi Linear

Sederhana

2. Identifikasikan Variabel Faktor Penyebab (Predictor) dan Variabel

Akibat (Response)

3. Lakukan Pengumpulan Data

4. Hitung X², Y², XY dan total dari masing-masingnya

5. Hitung a dan b berdasarkan rumus diatas.

6. Buatkan Model Persamaan Regresi Linear Sederhana.

7. Lakukan Prediksi atau Peramalan terhadap Variabel Faktor

Penyebab atau Variabel Akibat.

Contoh Kasus Analisis Regresi Linear Sederhana

Seorang Engineer ingin mempelajari Hubungan antara Suhu Ruangan

dengan Jumlah Cacat yang diakibatkannya, sehingga dapat

memprediksi atau meramalkan jumlah cacat produksi jika suhu ruangan

tersebut tidak terkendali. Engineer tersebut kemudian mengambil data

selama 30 hari terhadap rata-rata (mean) suhu ruangan dan Jumlah

Cacat Produksi.

Penyelesaian

Penyelesaiannya mengikuti Langkah-langkah dalam Analisis Regresi

Linear Sederhana adalah sebagai berikut :

Langkah 1 : Penentuan Tujuan

Tujuan : Memprediksi Jumlah Cacat Produksi jika suhu ruangan tidak

terkendali

Langkah 2 : Identifikasikan Variabel Penyebab dan Akibat

Varibel Faktor Penyebab (X) : Suhu Ruangan,

Variabel Akibat (Y) : Jumlah Cacat Produksi

Langkah 3 : Pengumpulan Data

Berikut ini adalah data yang berhasil dikumpulkan selama 30 hari

(berbentuk tabel) :

Tanggal Rata-rata Suhu Ruangan Jumlah Cacat

1 24 10

2 22 5

3 21 6

4 20 3

5 22 6

6 19 4

7 20 5

8 23 9

9 24 11

10 25 13

11 21 7

12 20 4

13 20 6

14 19 3

15 25 12

16 27 13

17 28 16

18 25 12

19 26 14

20 24 12

21 27 16

22 23 9

23 24 13

24 23 11

25 22 7

26 21 5

27 26 12

28 25 11

29 26 13

30 27 14

Langkah 4 : Hitung X², Y², XY dan total dari masing-masingnya

Berikut ini adalah tabel yang telah dilakukan perhitungan X², Y², XY

dan totalnya :

Tanggal

Rata-rata Suhu

Ruangan (X)

Jumlah

Cacat (Y) X2 Y2 XY

1 24 10 576 100 240

2 22 5 484 25 110

3 21 6 441 36 126

4 20 3 400 9 60

5 22 6 484 36 132

6 19 4 361 16 76

7 20 5 400 25 100

8 23 9 529 81 207

9 24 11 576 121 264

10 25 13 625 169 325

11 21 7 441 49 147

12 20 4 400 16 80

13 20 6 400 36 120

14 19 3 361 9 57

15 25 12 625 144 300

16 27 13 729 169 351

17 28 16 784 256 448

18 25 12 625 144 300

19 26 14 676 196 364

20 24 12 576 144 288

21 27 16 729 256 432

22 23 9 529 81 207

23 24 13 576 169 312

24 23 11 529 121 253

25 22 7 484 49 154

26 21 5 441 25 105

27 26 12 676 144 312

28 25 11 625 121 275

29 26 13 676 169 338

30 27 14 729 196 378

Total

(Σ) 699 282 16487 3112 6861

Langkah 5 : Hitung a dan b berdasarkan rumus Regresi Linear

Sederhana

Menghitung Konstanta (a) :

a = (Σy) (Σx²) – (Σx) (Σxy)

. n(Σx²) – (Σx)²

a = (282) (16.487) – (699) (6.861)

30 (16.487) – (699)²

a = -24,38

Menghitung Koefisien Regresi (b)

b = n(Σxy) – (Σx) (Σy)

. n(Σx²) – (Σx)²

b = 30 (6.861) – (699) (282)

. 30 (16.487) – (699)²

b = 1,45

Langkah 6 : Buat Model Persamaan Regresi

Y = a + bX

Y = -24,38 + 1,45X

Langkah 7 : Lakukan Prediksi atau Peramalan terhadap Variabel

Faktor Penyebab atau Variabel Akibat

I. Prediksikan Jumlah Cacat Produksi jika suhu dalam keadaan tinggi

(Variabel X), contohnya : 30°C

Y = -24,38 + 1,45 (30)

Y = 19,12

Jadi Jika Suhu ruangan mencapai 30°C, maka akan diprediksikan akan

terdapat 19,12 unit cacat yang dihasilkan oleh produksi.

II. Jika Cacat Produksi (Variabel Y) yang ditargetkan hanya boleh 4

unit, maka berapakah suhu ruangan yang diperlukan untuk mencapai

target tersebut ?

4 = -24,38 + 1,45X

1,45X = 4 + 24,38

X = 28,38 / 1,45

X = 19,57

Jadi Prediksi Suhu Ruangan yang paling sesuai untuk mencapai target

Cacat Produksi adalah sekitar 19,57°C

14.2. Analisis Korelasi Linier.

Hubungan Linear lebih dari dua variabel.Pada hubungan linear

lebih dari dua variabel ini, perubahan satu variabel dipengaruhi oleh

lebih dari satu variabel lain.

Secara fungsional Y = f (X1, X2, X3, ..., Xk) atau dalam

persamaan matematis dituliskan

Y = a + b1X1 + b2X2 + b3X3 + ... + bkXk

rumus :

Koefisien Korelasi Linier Berganda

Merupakan indeks atau angka yang diigunakan untuk mengukur

keeratan hubungan antara 3 variabel/lebih. Koefisien korelasi

berganda dirumuskan :

Ry1.2 =

Keterangan :

- Ry1.2 : koefisien linier 3 variabel

- ry1 : koefisien korelasi y dan X1

- ry2 : koefisien korelasi variabel y dan X2

- r1.2 : koefisien korelasi variabel X1 dan X2

dimana :

ry1=

ry2=

ry1.2=

Ry1.2=

14.3. Analisis Determinasi.

Analisis diskriminan merupakan teknik menganalisis data,

dimana variabel dependen merupakan data kategorik atau kualitatif

(ordinal atau rasio), sedangkan variabel independen berupa data

kuantitatif (interval atau rasio).

Prinsip Dasar analisis diskriminan

Analisis diskriminan adalah bagian dari analisis statistik peubah

ganda (multivariate statistical analysis) yang bertujuan untuk

memisahkan beberapa kelompok data yang sudah terkelompokkan

dengan cara membentuk fungsi diskriminan. Analisis diskriminan

adalah salah satu teknik statistik yang bisa digunakan pada hubungan

dependensi (hubungan antar variabel dimana sudah bisa dibedakan

mana variabel respon dan mana variabel penjelas). Lebih spesifik

lagi, analisis diskriminan digunakan pada kasus dimana variabel

respon berupa data kualitatif dan variabel penjelas berupa data

kuantitatif.

jika dianalogikan dengan regresi linear, maka analisis

diskriminan merupakan kebalikannya. pada regresi linear, variabel

respon yang harus mengikuti distribusi normal dan homoskedastis,

sedangkan variabel penjelas diasumsikan fixed, artinya variabel

penjelas tidak disyaratkan mengikuti sebaran tertentu. untuk analisis

diskriminan, variabel penjelasnya seperti sudah disebutkan di atas

harus mengikuti distribusi normal dan homoskedastis sedangkan

variabel responnya fixed.

Tujuan analisis diskriminan secara umum

Mengetahui apakah ada perbedaan yang jelas antara kelompok

pada variabel dependen. Bisa juga dikatakan untuk melihat

perbedaan antara anggota grup 1 dengan grup 2.

Jika ada perbedaan, untuk mengetahui variabel bebas mana yang

membuat perbedaan tersebut.

Membuat fungsi atau model diskriminan yang pada dasarnya

mirip dengan persamaan regresi.

Melakukan klasifikasi terhadap objek (dalam terminology spss

disebut baris), dan untuk mengetahui apakah suatu objek termasuk

pada grup 1 atau grup 2 atau lainnya.

Asumsi dan Sampel dalam analisis diskriminan

Sejumlah p variabel independen harus berdistribusi normal.

Matriks ragam-peragam variabel independen berukuran pxp

pada kedua kelompok harus sama.

Tidak ada korelasi antar variabel independen.

Tidak terdapat data yang outlier pada variabel independen.

Menurut Hair et al. (1987 : 76), analisis diskriminan tidak terlalu

sensitif dengan pelanggaran asumsi ini, kecuali pelanggarannya

bersifat ekstrim. Dan Johnson and Wichern (1988: 472) mengatakan

hal yang sama bahwa asumsi ini (kesamaan ragam-peragam) di

dalam praktiknya sering dilanggar.

Tidak ada jumlah sampel yang ideal secara pasti pada analisis

diskriminan. Pedoman yang bersifat umum menyatakan untuk setiap

variabel independen terdapat 5-20 sampel. Dengan demikian, jika

terdapat 6 variabel independen maka seharusnya terdapat minimal

6x5=30 sampel. Secara terminology spss, jika ada enam kolom

variabel independen, sebaiknya ada 30 baris data.

Selain itu, pada analisis diskriminan sebaiknya digunakan dua

jenis sampel, yakni analisis sampel yang digunakan untuk membuat

fungsi diskriminan, serta holdout sampel (split sampel) yang

digunakan untuk menguji hasil diskriminan.

Langkah-langkah dalam analisis diskriminan

1. Memisah variabel-variabel menjadi variabel dependen dan

variabel independen.

2. Menentukan metode untuk membuat fungsi diskriminan.

Pada prinsipnya terdapat dua metode dasar untuk membuat

fungsi diskriminan, yakni:

- Simultaneus estimation, semua variabel independen

dimasukkan secara bersama-sama kemudian dilakukan

proses diskriminan.

- Stepwise estimation, variabel independen dimasukkan

satu per satu kedalam model diskriminan. Pada proses ini

akan ada variabel yang tetap ada dalam model dan ada

variabel yang dibuang dari model.

3. Menguji signifikansi dari fungsi diskriminan yang telah

terbentuk, menggunakan Wilk’s lamda, Pilai, F test dan uji

lainnya.

4. Menguji ketepatan klasifikasi dari fungsi diskriminan serta

mengetahui ketepatan klasifikasi secara individual dengan

casewise diagnostics.

5. Melakukan interpretasi terhadap fungsi diskriminan tersebut.

6. Melakukan uji validasi terhadap fungsi diskriminan.

Suatu fungsi diskriminan layak untuk dibentuk bila terdapat

perbedaan nilai rataan di antara 2 kelompok yang ada. Oleh karena

itu, sebelum fungsi diskriminan dibentuk perlu dilakukan pengujian

terhadap perbedaan vektor nilai rataan dari 2 kelompok tersebut.

Dalam pengujian vektor nilai rataan antar kelompok, asumsi yang

harus dipenuhi adalah peubah-peubah yang diamati berdistribusi

multivariate normality dan semua kelompok populasi mempunyai

matrik ragam-peragam yang sama.

15. Pertemuan 15

Statistika dalam riset.

(Quiz)

16. Pertemuan 16

UAS

DAFTAR PUSTAKA

1. R. Fenny Syafariani. (2010). Statistika. Bahan Ajar. Fakultas

Teknik & Ilmu Komputer, Bandung.

2. Prof. Dr. Sudjana MA. (2005). Metode Statistika, Tarsito,

Bandung.

3. Teori Peluang dan Statistika Untuk Insinyur dan Ilmuwan,

(1992). Penerbit ITB, Bandung.

Statistika Oleh : R. Fenny Syafariani,...

Documents

Transcript of Statistika Oleh : R. Fenny Syafariani,...