CatKuliah-MA20815

31
Catatan Kuliah MA2081 Statistika Dasar Orang Cerdas Belajar StatistikaDosen: Khreshna I.A. Syuhada, MSc. PhD. Kelompok Keilmuan Statistika - FMIPA Institut Teknologi Bandung 2015 1

description

catatan kuliah statiska dasar

Transcript of CatKuliah-MA20815

Page 1: CatKuliah-MA20815

Catatan Kuliah

MA2081 Statistika Dasar

“Orang Cerdas Belajar Statistika”

Dosen: Khreshna I.A. Syuhada, MSc. PhD.

Kelompok Keilmuan Statistika - FMIPA

Institut Teknologi Bandung

2015

1

Page 2: CatKuliah-MA20815

Tentang MAK6281 Topik Statistika IV

Jadwal kuliah: Senin, 13-; Rabu, 9-

Silabus:

- Statistika deskriptif

- Peluang

- Peubah acak dan fungsi peluang/distribusi

- Distribusi diskrit dan kontinu

- Distribusi sampel

- Statistika inferensi: selang kepercayaan

- Statistika inferensi: uji hipotesis

- Analisis variansi

- Analisis regresi dan korelasi

Buku teks:

Ronald Walpole, Raymond Myers, Sharon Myers, Keying Ye, 2007, Probability and

Statistics for Engineers and Scienctists.

Penilaian:

- Ujian 2 kali (75%); UTS - 9 Maret 2015, Pukul 13.00

- Kehadiran/PR/Tugas (15%)

- Praktikum (10%)

2

Page 3: CatKuliah-MA20815

Bab 1 - Statistika Deskriptif

Silabus: Jenis data, ukuran pusat/lokasi, ukuran penyebaran, koefisien variasi, ob-

servasi luar, data kelompok, distribusi frekuensi, grafik

Statistika adalah ilmu yang digunakan untuk mengumpulkan, mengorganisasi, melakukan

inferensi dan menafsirkan data. Secara singkat, statistika adalah ilmu/pekerjaan un-

tuk meyimpulkan tentang suatu fenomena pada populasi menggunakan sampel.

Kajian awal dan utama dalam analisis data adalah statistika deskriptif. Kita da-

pat menghitung berbagai statistik dan membuat grafik serta memberikan interpre-

tasi. Kesimpulan yang diberikan dalam statistika deskriptif bersifat subyektif; walau

demikian, kesimpulan yang salah akan terlihat.

Tujuan yang ingin dicapai dalam memahami statistika deskriptif, secara detil, adalah

1. membedakan jenis data dan memahami data

2. menghitung dan memaknai ukuran lokasi/pusat

3. membedakan variansi dan koefisien variasi

4. mengamati observasi luar

5. memahami data kelompok

6. menentukan distribusi frekuensi

7. membuat dan menafsirkan grafik

Data, Jenis Data, Memahami Data

Data adalah hasil observasi tunggal (datum) yang didapat baik secara langsung (ob-

servasi/survey, praktikum) ataupun tidak langsung (buku, koran, internet). Data

merupakan sumber utama analisis data. Pengumpulan, pengorganisasian dan pen-

golahan data merupakan pekerjaan statistika yang menuntut kerapian dan detil.

3

Page 4: CatKuliah-MA20815

Dalam praktiknya, data yang kita kumpulkan dapat dikelompokkan menjadi data

kategorik atau data numerik. Hal ini merujuk pada sifat data yang memiliki label

(kategorik) atau memiliki nilai (numerik). Data dapat pula dibedakan menjadi jenis

data berikut:

• nominal (jenis kelamin, golongan darah)

• ordinal (tingkat kecemasan, tingkat nyeri)

• rasio/interval (denyut nadi, tekanan darah, nilai ujian)

Latihan:

Perhatikan kalimat-kalimat berikut. Tentukan jenis datanya (nominal, ordinal, ra-

sio/interval).

(a) “dr. KS, SpD. mengatakan bahwa penyakit Noor sudah kronis, bukan akut”

(b) Wanda dan Windi berdebat tentang harga mobil yang kiranya layak untuk mo-

bil yang hendak mereka beli

(c) “Apakah anda lahir pada bulan September?”

Diskusi: Perhatikan data jarak tempuh (dalam meter) ke sekolah dari beberapa

siswa di suatu daerah.

Table 1: Data jarak tempuh ke sekolah dari beberapa siswa.

Siswa- Jarak Siswa- Jarak Siswa- Jarak Siswa- Jarak

1 3265 6 3323 11 2581 16 27592 3260 7 3649 12 2841 17 32483 3245 8 3200 13 3609 18 33144 3484 9 3031 14 2838 19 31015 4146 10 2069 15 3541 20 2834

Apakah analisis data rasio/interval akan lebih “kaya” dibandingkan dengan data

nominal/ordinal? Apa yang bisa kita katakan tentang data tersebut? Dapatkah

data numerik diubah menjadi data kategorik?

4

Page 5: CatKuliah-MA20815

Diskusi: Data peserta ujian di beberapa sekolah di suatu kecamatan tercatat dalam

diagram batang dan daun sebagai berikut. Untuk membaca data, kita perhatikan

kolom disebelah kiri garis yang menyatakan “angka puluhan” dan angka-angka dise-

belah kanan garis yang menyatakan “angka satuan”. Sebagai contoh, “3—5” berarti

jumlah peserta ujian di sekolahg tertentu adalah 35 orang.

0 3578891 0223 5

Apakah data dalam bentuk diagram batang dan daun cukup informatif? Dapatkah

data numerik tersebut diubah menjadi data kategorik?

Ukuran Pusat/Lokasi dan Penyebaran

Setelah data dikumpulkan dan diorganisasikan, kita dapat memberikan tafsiran

sederhana melalui ukuran atau statistik. Beberapa ukuran yang dikenal antara lain

mean dan variansi/deviasi standar yang menyatakan nilai tengah dan simpangan

data.

Ukuran atau statistik yang melekat pada data dapat dibagi menjadi

• Ukuran pusat/lokasi: mean (aritmetik), median, modus

• Ukuran penyebaran: jangkauan, variansi/deviasi standar, kuartil

Misalkan data sampel adalah

x1, x2, . . . , xn,

dimana xi menyatakan titik sampel ke-i. Mean (aritmetik) didefinisikan sebagai

x =

n∑i=1

xi

n.

5

Page 6: CatKuliah-MA20815

Sifat-sifat mean

(a) Untuk suatu konstanta k,

n∑i=1

k xi = · · ·

(b) Jika yi = xi + k maka y = x+ k. Buktikan!

(c) Jika yi = k xi maka y = · · · .

Median atau median sampel seringkali dikatakan sebagai nilai tengah. Dengan

demikian, menghitung median haruslah dilakukan pada data yang sudah diurutkan.

Definisi median adalah

(a) Observasi ke-((n+ 1)/2), (n ganjil), atau

(b) Nilai tengah dari observasi ke-(n/2) dan ke-((n/2) + 1), (n genap)

Diskusi: Bagaimana (perbandingan) nilai mean dan median untuk data yang (i)

simetrik, (ii) menceng ke kanan, (iii) menceng ke kiri?

Modus atau Mode adalah ukuran pusat yang menyatakan nilai observasi yang paling

sering muncul. Menentukan modus dapat dilakukan pada data tanpa diurutkan

(meskipun lebih mudah apabila diurutkan lebih dahulu).

Latihan:

1. Tentukan ukuran lokasi/pusat dari contoh data diatas

2. Diketahui suatu data tentang jumlah saudara (kandung, angkat, tiri) dari 20

orang siswa sekolah menengah. Apabila setiap titik data ditambah tiga maka nilai

mean dan jangkauan menjadi...

Ukuran penyebaran menyatakan seberapa jauh data menyebar dari mean. Misalkan

kita memiliki dua data sampel. Kedua sampel memiliki mean yang sama, namun

mungkin saja memiliki penyebaran data yang berbeda. Beberapa ukuran penye-

baran yang dikenal antara lain:

6

Page 7: CatKuliah-MA20815

1. Jangkauan (Range):

R = xmaks − xmin

2. Variansi atau variansi sampel:

s2 =

n∑i=1

(xi − x)2

n− 1

Catatan:

Deviasi standar atau simpangan baku adalah akar kuadrat dari variansi.

3. Kuartil:

Umumnya kita kenal kuartil pertama dan ketiga, dinotasikan dengan K1 dan

K3. Apa yang dapat kita katakan tentang kuartil kedua atau K2?

4. Kuantil atau persentil:...

Sifat-sifat variansi:

Diketahui data sampel x1, . . . , xn memiliki variansi s2x. Jika data sampel

(a) yi = xi + k,

(b) yi = k xi,

untuk suatu konstanta k, maka

s2y = . . .

Variansi versus Koefisien Variasi: Kita dapat menghitung suatu ukuran yang men-

gaitkan ukuran penyebaran (deviasi standar) dengan ukuran lokasi (mean), yaitu

koefisien variasi (coefficient of variation atau CV):

CV = 100%× (s/x)

7

Page 8: CatKuliah-MA20815

yang tidak dipengaruhi unit ukuran yang dipakai. CV bermanfaat untuk memband-

ingkan variabilitas beberapa sampel yang berbeda relatif terhadap nilai mean-nya.

Dapat pula kita membanding CV dari beberapa variabel.

Latihan:

Data pada tabel berikut menyatakan berbagai faktor yang mempengaruhi masalah

pada sistem jantung dan peredaran darah anak. Tentukan CV dan berikan inter-

pretasinya.

Table 2: Faktor risiko kardiovaskular pada anak.

n mean s CV(%)

Tinggi (cm) 364 142.6 0.31Berat (kg) 365 39.5 0.77

Tekanan darah (mm Hg) 337 104 4.97Kolesterol (mg/dL) 395 160.4 3.44

Mengamati Observasi Luar

Observasi luar atau pencilan atau outlier adalah nilai/observasi yang “menyimpang”

dari nilai-nilai/observasi yang lain. Observasi luar dapat ditentukan/dihitung den-

gan melihat apakah ada nilai/observasi yang LEBIH BESAR dari

K3 + 1.5 (K3 −K1)

atau LEBIH KECIL dari

K1 − 1.5 (K3 −K1),

dengan K1 dan K3 adalah kuartil pertama dan ketiga seperti telah dijelaskan se-

belumnya.

Dalam praktiknya, observasi luar dapat menyatakan sesuatu yang baik/jelek. Mis-

alnya, seseorang dengan tingkat kecerdasan (IQ) yang sangat tinggi (jauh diatas

rata-rata alias observasi luar) adalah baik. Seringkali observasi luar diabaikan dalam

8

Page 9: CatKuliah-MA20815

analisis data meskipun sesungguhnya cara ini tidaklah tepat. Mendeteksi observasi

luar adalah sesuatu yang sangat menantang dalam statistika.

Diskusi: Sekelompok observasi x1, . . . , xn memiliki observasi luar xj untuk suatu j.

Dapatkah kita membandingkan mean dengan dan tanpa observasi luar? Mungkinkah

terdapat lebih dari satu observasi luar?

Data Kelompok

Pandang data sampel dengan 275 observasi. Ukuran sampel tersebut terlalu besar

sehingga menampilkan data apa adanya menjadi tidak efisien. Dengan demikian,

data sampel dapat dikelompokkan. Pengelompokan ini dapat pula terjadi (harus di-

lakukan) karena tingkat keakuratan data yang diambil tidak dapat diperoleh dengan

baik.

Pengelompokan data memberikan masalah: Berapa banyak kelompok atau interval

kelas (class intervals) yang ingin kita buat? Berapa lebar interval (interval width)?

Salah satu formula yang bisa kita pakai adalah Formula Sturges, dimana banyaknya

interval kelas adalah

k = 1 + (3.322× log10 n),

dimana n adalah besar sampel. Lebar intervalnya:

w = R/k,

dengan R adalah jangkauan.

Untuk contoh data sampel dengan 275 observasi, kita peroleh:

k ≈ 8, w = (63− 18)/8 = 5.625

Dengan demikian, lebar kelas interval adalah 5 atau 10. Diketahui obervasi terkecil

dan terbesar, berturut-turut, adalah 18 dan 63. Jadi, kelas interval yang bisa dibuat

9

Page 10: CatKuliah-MA20815

adalah:

10-19

20-29

30-39

40-49

50-59

60-69

Memahami Grafik

Tampilan visual (baca: grafik) dari data merupakan salah satu cara untuk mema-

hami dan menginterpretasi data. Grafik bersifat menarik, memudahkan dalam mem-

bentuk pola, dan prediktif. Beberapa tampilan visualn untuk data adalah diagram

pencar (scatter diagram), diagram bar/batang (bar chart), diagram batang dan daun

(stem-and-leaf plot), histogram, box-plot.

Diagram pencar merupakan bentuk grafik yang sederhana namun cukup informatif.

Diagram ini berupa titik-titik yang menggambarkan nilai observasi. Pola atau ke-

cenderungan data dapat dilihat dengan melihat grafik ini.

Diagram batang dan daun memiliki ke-khas-an berupa tampilan nilai utama/pertama

(batang) dan nilai satuan/kedua (daun). Diagram ini membantu kita untuk menghi-

tung kuantil/persentil data dengan mudah.

10

Page 11: CatKuliah-MA20815

Bab 2 - Peluang

Silabus: Ruang sampel dan kejadian, konsep peluang, peluang bersyarat, Teorema

Bayes.

Setelah kita mempelajari analisis data secara deskriptif, maka kajian berikutnya

adalah melakukan perhitungan secara probabilistik. Hal ini berkaitan dengan kon-

sep distribusi frekuensi relatif yang telah dibahas sebelumnya. Analisis data se-

cara probabilistik memerlukan pemahaman tentang hal-hal yang belum terjadi atau

yang bersifat percobaan. Secara khusus, kita akan membangun ruang sampel dan

mendefinisikan kejadian.

Tujuan yang ingin dicapai dalam mempelajari peluang adalah:

1. Mendefinisikan ruang sampel dan kejadian

2. Menghitung peluang suatu kejadian

3. Mengkaji konsep dan menghitung peluang bersyarat

4. Memanfaatkan Teorema Bayes untuk menghitung peluang bersyarat suatu ke-

jadian

Ilustrasi

Sebagai pengantar, perhatikan ilustrasi-ilustrasi berikut. Pemahaman peluang memer-

lukan pengetahuan tentang cara menyusun atau kombinasi/permutasi. Secara khusus,

kita dituntut untuk dapat membangun pertanyaan peluang.

Ilustrasi-1. Tanti baru saja mengikuti tes mata. Ia masih teringat beberapa huruf

yang muncul: A-E-M-R-S. Kini, Tanti mencoba menyusun kata-kata yang mungkin

dari huruf-huruf tersebut.

Ilustrasi-2. Hanin bermaksud menyumbangkan darahnya di suatu tempat donor.

Hanin terlebih dahulu harus dicek golongan darahnya.

11

Page 12: CatKuliah-MA20815

• Golongan darah yang mungkin untuk Hanin adalah...

• Rupanya Hanin tidak sendirian. Ada Hana dan Hanan disana yang memiliki

maksud yang sama dengan Hanin. Jika seorang diantara mereka dipilih secara

acak menjadi pendonor, berapa peluang orang yang terpilih adalah Hana?

• Jika, diantara mereka bertiga, Hanan terpilih menjadi pendonor, berapa pelu-

ang golongan darah Hanan adalah B?

Ilustrasi-3. B dan G pergi berburu dengan cara menembak. Pada waktu yang

disepakati, B dan G secara bersamaan menembak sasaran tertentu. Peluang tem-

bakan B mengenai sasaran adalah 0.7 sedangkan peluang tembakan G (bebas dari

tembakan B) mengenai sasaran adalah 0.4.

• Berapa peluang sebuah tembakan mengenai sasaran?

• Berapa peluang sasaran tertembak?

Ilustrasi-4. “Ayahku meninggal waktu usiaku tiga tahun. Lalu Ibu kawin lagi.

Dengan ayah tiriku, Ibu mendapat dua orang anak tiri dan melahirkan tiga orang

anak. Ketika usiaku lima belas tahun, Ibu pun meninggal. Ayah tiriku kawin lagi

dengan seorang janda yang sudah beranak dua. Ia melahirkan dua orang anak pula

dengan ayah tiriku”

Konsep Peluang

Ruang sampel, S, adalah himpunan semua hasil mungkin dari suatu percobaan.

Kejadian, E, adalah himpunan bagian dari ruang sampel. Peluang suatu kejadian,

P (E), adalah rasio dari banyaknya titik kejadian dan ruang sampel, atau

P (E) =n(E)

n(S),

dimana n(E) dan n(S), berturut-turut, adalah banyaknya titik kejadian dan ruang

sampel.

12

Page 13: CatKuliah-MA20815

Peluang suatu kejadian haruslah memenuhi aksioma dan sifat-sifat berikut:

1. 0 ≤ P (E) ≤ 1

2. P ({}) = 0

3. P (S) = 1

4. Untuk kejadian A dan B,

P (A ∪B) = P (A) + P (B)− P (A ∩B)

5. Jika kejadian A dan B saling asing maka P (A ∩B) = 0

6. Kejadian A dan kejadian B dikatakan saling bebas jika

P (A ∩B) = P (A)P (B)

Definisi peluang yang lain merujuk pada frekuensi relatif. Misalkan suatu percobaan

dengan ruang sampel S diulang-ulang. Misalkan n(E) banyaknya kejadian E yang

terjadi selama n pengulangan. Peluang kejadian E adalah

P (E) = limn→∞

n(E)

n

Latihan:

1. Dalam suatu rapat yang terdiri dari 20 orang, setiap orang berjabatan tangan

dengan orang lain diakhir rapat. Ada berapa banyak jumlah ’salaman’ yang

terjadi?

2. Sebuah lift bergerak dari lantai dasar berisi 8 orang (tidak termasuk operator

lift) dan orang-orang tersebut akan keluar hingga lift mencapai lantai paling

tinggi yaitu lantai 6. Dalam berapa cara sang operator dapat mengenali orang-

orang yang keluar dari lift jika semuanya nampak mirip bagi sang operator?

13

Page 14: CatKuliah-MA20815

Bagaimana jika 8 orang tersebut terdiri atas 5 pria dan 3 wanita dan sang

operator membedakan pria dan wanita?

3. Lima orang siswa meletakkan tasnya masing-masing ketika memasuki perpus-

takaan. Kemudian, ketika mereka keluar dari perpustakaan mereka mengam-

bil tasnya secara acak tanpa memperhatikan apakah tas yang diambil adalah

benar-benar miliknya. Apakah ruang sampel “percobaan” diatas?

4. Setiap pagi Swarna meninggalkan rumahnya untuk berlari pagi. Swarna pergi

lewat pintu depan atau belakang dengan peluang sama. Ketika meninggalkan

rumah Swarna memakai sepatu olah raga atau bertelanjang kaki jika sepatu

tidak tersedia di depan pintu yang dia lewati. Ketika pulang, Swarna akan

masuk lewat pintu atau belakang dan meletakkan sepatunya dengan pelung

sama. Jika dia memiliki 4 pasang sepatu olah raga, akan dihitung berapa pelu-

ang Swarna akan sering berolah raga dengan bertelanjang kaki. Pertanyaan

awal, tentukan ruang sampelnya!

5. Bapak Kepala Sekolah mengundang guru-guru yang memiliki setidaknya satu

anak laki-laki (L) ke acara syukuran. Seorang guru yang bernama Pak Jaim

memiliki dua anak. Kita akan menghitung peluang bahwa kedua anak Pak

Jaim adalah laki-laki, diberikan bahwa Pak Jaim diundang ke acara syukuran

tersebut. Pertanyaan awal adalah apa ruang sampel “percobaan” diatas?

Peluang Bersyarat dan Teorema Bayes

Ilustrasi-1. Pandang Ilustrasi-3 diatas.

• Jika sebuah tembakan mengenai sasaran, berapa peluang bahwa itu tembakan

G?

• Berapa peluang bahwa, jika sasaran tertembak, kedua tembakan mengenai

sasaran?

• Berapa peluang bahwa, jika sasaran tertembak, tembakan Gmengenai sasaran?

14

Page 15: CatKuliah-MA20815

Ilustrasi-2. Seorang praktikan, Ega, tahu bahwa sebuah lembar kerja praktikum

akan berada di salah satu dari tiga buah kotak surat lab yang ada. Misalkan pi

adalah peluang bahwa Ega akan menemukan lembar kerja praktikum setelah menge-

cek kotak surat lab i dengan cepat jika ternyata surat tersebut berada di kotak surat

lab i, i = 1, 2, 3.

• Misalkan Ega mengecek kotak surat 1 tidak menemukan surat. Berapa peluang

hal itu akan terjadi?

• Jika diketahui Ega mengecek kotak surat 1 tidak menemukan surat, berapa

peluang bahwa surat itu ada di kotak surat 1?

Peluang kejadian A, apabila kejadian B telah terjadi, adalah peluang bersyarat

P (A|B) yaitu:

P (A|B) =P (A ∩B

P (B),

asalkan P (B) > 0. Jelas bahwa jika kejadian A dan B saling bebas maka P (A|B) =

P (A).

Perhatikan bahwa konsep peluang bersyarat dapat digunakan untuk menghitung

peluang total:

P (B) = P (B|A)P (A) + P (B|Ac)P (Ac)

Latihan:

1. Laila memiliki 2 buah koin; satu koin “baik” (memiliki sisi M dan B) dan

satu koin “tidak baik” (memiliki dua sisi M). Sebuah koin dipilih secara acak,

kemudian dilantunkan. Berapa peluang muncul M?

2. Laila memiliki 2 buah koin; satu koin “baik” (memiliki sisi M dan B) dan satu

koin “tidak baik” (memiliki dua sisi M). Sebuah koin dipilih secara acak, kemu-

dian dilantunkan. Muncul M. Berapa peluang bahwa koin yang dilantunkan

adalah koin “baik”?

15

Page 16: CatKuliah-MA20815

TEOREMA BAYES:

Misalkan {B1, B2, . . . , Bn} adalah partisi dari ruang sampel dan misalkan A adalah

kejadian yang terobservasi. Peluang kejadian Bj diberikan A adalah

P (Bj |A) =P (ABj)

P (A)

=P (A|Bj)P (Bj)∑ni=1 P (A|Bi)P (Bi)

Latihan:

Tes darah di suatu laboratorium akan 95% efektif dalam mendeteksi suatu penyakit

tertentu jika penyakit itu ada. Namun demikian, tes tersebut juga memberikan

’hasil positif yang salah’ pada 1% orang sehat yang dites. Jika 0.5% dari populasi

mengidap penyakit tertentu tersebut, tentukan peluang bahwa seseorang menderita

penyakit itu jika hasil tes positif?

16

Page 17: CatKuliah-MA20815

Bab 3 - Peubah Acak dan Fungsi Peluang

Silabus: Konsep peubah acak, fungsi peluang, fungsi distribusi, peluang pada nilai

peubah acak.

Ilustrasi. Maskapai penerbangan mengetahui bahwa lima persen pemesan tiket

tidak akan datang untuk membeli tiketnya. Dengan alasan ini, maskapai tidak

ragu untuk menjual 52 tiket penerbangan pada pesawat dengan kapasitas duduk 50

orang. Berapa peluang akan ada kursi yang tersedia untuk setiap pemesan tiket

yang datang?

Apa yang dapat anda katakan tentang soal peluang pada ilustrasi diatas? Mungkinkah

kita mendefinisikan suatu kejadian? ruang sampel? Perlukah cara lain untuk mema-

hami peluang suatu kejadian?

Peubah acak

Apa yang dapat kita katakan tentang peubah acak?

• Peubah acak tidaklah “acak” dan bukanlah “peubah”

• Peubah acak adalah “fungsi” yang memetakan anggota S ke bilangan real R

Peubah acak X dikatakan diskrit jika terdapat barisan terhitung dari bilangan

{ai, i = 1, 2, . . . } sedemikian hingga

P

(∪i

{X = ai

})=∑i

P(X = ai

)= 1

Catatan: Sebuah peubah acak diskrit tidak selalu berasal ruang sampel diskrit.

Jika diberikan himpunan terhitung {ai, i = 1, 2, . . . } dan bilangan positif {pi, i =

1, 2, . . . } sedemikian hingga∑

i pi = 1, fungsi peluang pX(x) adalah

pX(x) = pi = P (X = ai), dengan x = ai.

17

Page 18: CatKuliah-MA20815

FX disebut fungsi distribusi (diskrit) dari X jika terdapat barisan terhitung {ai, i =

1, 2, . . . } dari bilangan real dan barisan {pi, i = 1, 2, . . . } dari bilangan positif yang

bersesuaian sedemikian hingga

∑i

pi = 1 dan FX(x) =∑ai≤x

pi.

Fungsi distribusi (kumulatif), F (x) = P (X ≤ x), memiliki sifat-sifat:

(a) F fungsi tidak turun

(b) limx→∞

F (x) = 1

(c) limx→−∞

F (x) = 0

(d) F fungsi kontinu kanan

Catatan:

• P (a < X ≤ b) = F (b)− F (a)

• P (X ≤ b) = P (X < b)

• P (X < b) = P(limn→∞

{X ≤ b− 1

n

})= lim

n→∞P(X ≤ b− 1

n

)= lim

n→∞F(b− 1

n

)Misalkan X peubah acak dan fungsi distribusinya FX dapat diturunkan. Fungsi

peluang fX adalah turunan dari fungsi distribusi,

fX(x) =d

dxFX(x) atau dengan kata lain FX(x) =

∫ x

−∞fX(t) dt.

Peubah acak dengan sifat diatas dikatakan sebagai peubah acak kontinu.

Catatan:

• 1 = FX(∞) =∫∞−∞ fX(t) dt

• P (a ≤ X ≤ b) = FX(b)− FX(a) =∫ ba fX(t) dt

• P (X = a) =∫ aa fX(t) dt = 0

18

Page 19: CatKuliah-MA20815

Latihan:

1. Diketahui fungsi peluang sebagai berikut:

f(x) =

p, x = −1.9

0.1, x = −0.1

0.3, x = 20p

p, x = 3

4p, x = 4

0, x yang lain

Hitung P (−1.9 ≤ |X| ≤ 3), F (2), F (F (3.1))

2. Tentukan fungsi peluang dari fungsi distribusi berikut:

F (x) =

0, x < −3.1

3/5, −3.1 ≤ x < 0

7/10, 0 ≤ x < 1

1, 1 ≤ x

3. Diketahui fungsi peluang dari peubah acak kontinu:

f(x) = c e−2x, x > 0,

Hitung (i) c, (ii) P (X > 2)

4. Suatu peubah acak X memiliki fungsi peluang

f(x) = k (1− x2),

untuk −1 < x < 1. Tentukan FX(x).

19

Page 20: CatKuliah-MA20815

Ekspektasi

Nilai harapan/ekspektasi (expected value/expectation) atau ekspektasi dari peubah

acak diskrit/kontinu X adalah

E(X) =∑x

x pX(x)

dan

E(X) =

∫ ∞

−∞x fX(x) dx

dimana pX dan fX adalah fungsi peluang dari X.

Catatan:

1. Ekspektasi adalah rata-rata tertimbang (weighted average) dari nilai yang mungkin

dari X

2. Ekspektasi = mean = momen pertama

3. Ekspektasi suatu peubah acak adalah nilai rata-rata (long-run average value)

dari percobaan bebas yang berulang

3. Apakah ekspektasi harus berhingga? (Diskusi!)

Contoh:

1. Rombongan mahasiswa sebanyak 120 orang akan berangkat ke Jogja dengan

menggunakan 3 bis. Ada 36 mahasiswa di bis 1, 40 mahasiswa di bis 2 dan

44 mahasiswa di bis 3. Ketika bis sampai tujuan, seorang mahasiswa dipilih

secara acak. Misalkan X menyatakan banyaknya mahasiswa di bis dimana

seseorang tersebut terpilih. Hitung E(X). (Solusi: 40.2667)

2. Misalkan X adalah peubah acak dengan nilai yang mungkin −1, 0, 1 dan pelu-

ang:

p(−1) = 0.2, p(0) = 0.5, p(1) = 0.3

Hitung E(X2). (Solusi: 0.5)

20

Page 21: CatKuliah-MA20815

Sifat-sifat ekspektasi:

1. E(g(X)) =∫∞−∞ g(x) fX(x) dx

2. E(aX + b Y ) = aE(X) + bE(Y )

3. E(XY ) = E(X)E(Y ), jika X dan Y saling bebas.

4. E(X) =∫∞0 P (X > x) dx, untuk X > 0 (*)

5. E(Xr) =∫∞−∞ xr fX(x) dx (momen ke-r)

6. E((X − µX)r) =∫∞−∞ (x− µX)r fX(x) dx (momen pusat ke-r)

7. E((X − µX)2) = V ar(X) = E(X2)− (E(X))2

Deviasi standar dari X adalah akar kuadrat Variansi dari X.

21

Page 22: CatKuliah-MA20815

Bab 4 - Distribusi Diskrit dan Kontinu

Silabus: Distribusi peubah acak, distribusi diskrit, distribusi kontinu.

Peubah acak merupakan alat yang dapat digunakan untuk mempelajari konsep pada

tingkat lanjut. Salah satu karakteristik utama peubah acak adalah memiliki distribusi.

Distribusi diskrit adalah fenomena yang digambarkan oleh peubah acak diskrit

melalui fungsi peluang/distribusi. Beberapa distribusi diskrit yang dikenal adalah

binomial, Poisson dan geometrik. Distribusi uniform, eksponensial dan normal

adalah contoh-contoh distribusi kontinu.

Distribusi Binomial

Misalkan S = {sukses, gagal} adalah ruang sampel yang menotasikan ’sukses’ atau

’gagal’ dari suatu percobaan. Definisikan X(sukses) = 1 dan X(gagal) = 0 dan

pX(1) = P (X = 1) = θ; pX(0) = P (X = 0) = 1− θ,

dimana 0 ≤ θ ≤ 1 adalah peluang diperoleh sukses. Peubah acak X dikatakan

peubah acak Bernoulli dengan parameter θ.

Jika dilakukan n percobaan independen dan jika X menyatakan banyaknya sukses

yang diperoleh maka X dikatakan sebagai peubah acak Binomial dengan parameter

(n, θ), dinotasikan X ∼ B(n, θ). Fungsi peluangnya adalah

f(x) = pX(x) = Cnx θx (1− θ)n−x

Latihan:

1. Misalkan X ∼ B(5, 0.2). Hitung: (i) P (0 < X ≤ 1) (ii) P (X ≥ 1)

2. Maskapai penerbangan mengetahui bahwa lima persen pemesan tiket tidak

akan datang untuk membeli tiketnya. Dengan alasan ini, maskapai tidak ragu

22

Page 23: CatKuliah-MA20815

untuk menjual 52 tiket penerbangan pada pesawat dengan kapasitas duduk

50 orang. Berapa peluang akan ada kursi yang tersedia untuk setiap pemesan

tiket yang datang?

3. MisalkanX peubah acak Binomial yang menyatakan banyak orang yang datang

ke toko dan membeli barang. Diketahui nilai parameter “sukses” adalah 0.6.

Jika 10 orang masuk toko, berapa peluang terjadinya maksimal sebuah “suk-

ses”?

4. Tentukan mean dan variansi peubah acak Binomial dengan parameter (n, θ)

5. Suatu hasil produksi (misalkan sebuah TV) akan rusak dengan peluang 0.1.

Hasil produksi saling bebas. Jika terdapat 3 hasil produksi (3 buah TV),

berapa peluang bahwa paling banyak 1 TV rusak?

6. Empat buah koin dilantunkan. Asumsikan bahwa hasil lantunan saling bebas.

Hitung peluang akan muncul 2 Muka dan 2 Belakang?

Distribusi Poisson

Distribusi diskrit lain yang cukup dikenal adalah distribusi Poisson. Umumnya dis-

tribusi ini terlihat pada fenomena banyaknya telfon yang masuk pada suatu hari,

banyaknya kendaraan yang lewat di jalanan pada periode waktu tertentu dsb. Per-

hatian kita adalah pada banyaknya “sukses” pada periode tertentu.

Misalkan X peubah acak dengan fungsi peluang

f(i) = pX(i) = e−λ λi

i!,

untuk i = 0, 1, 2, . . . dan λ > 0. Peubah acak X disebut peubah acak Poisson dengan

parameter λ.

Latihan

1. Banyaknya kecelakaan yang terjadi di tol setiap hari berdistribusi Poisson

dengan parameter λ = 3. Berapa peluang tidak ada kecelakaan pada hari ini?

23

Page 24: CatKuliah-MA20815

2. Misalkan X peubah acak Poisson dengan parameter λ. Tunjukkan bahwa

P (X = i) naik secara monoton sebelum kemudian turun secara monoton untuk

i semakin besar.

Apa yang anda ketahui tentang pendekatan Poisson untuk Binomial?

Misalkan X berdistribusi Binomial dengan parameter (n, θ),

P (X = x) = Cnx θx (1− θ)n−x

and misalkan λ = nθ. Maka,

P (X = x) =n!

x! (n− x)!θx (1− θ)n−x

=n!

x! (n− x)!

n

)x (1− λ

n

)n−x

=n(n− 1) · · · (n− i+ 1)

nx

λx

x!

(1− λ/n)n

(1− λ/n)x

= . . .

≈ e−λ λx

x!

Petunjuk:

Untuk n besar dan λ moderat (karena θ cukup kecil),

(1− λ

n

)n

≈ · · ·

n(n− 1) · · · (n− i+ 1)

nx≈ · · ·(

1− λ

n

)x

≈ · · ·

Latihan:

1. Misalkan peluang sebuah produk susu akan tercemar melamin adalah 0.1. Ten-

tukan peluang bahwa paling banyak 1 produk susu yang tercemar dari sampel

sebanyak 10 produk susu! (0.7361, 0.7368)

24

Page 25: CatKuliah-MA20815

2. Misalkan X ∼ B(n, θ) dan Y ∼ POI(λ). Cari hubungan antara f(k + 1) dan

f(k) untuk kedua peubah acak.

Distribusi Geometrik

Misalkan percobaan-percobaan dilakukan hingga diperoleh sukses yang pertama.

Percobaan-percobaan tersebut saling bebas dan memiliki peluang sukses α. Mis-

alkan X menyatakan banyaknya percobaan yang dilakukan untuk mendapatkan suk-

ses pertama tersebut, maka X dikatakan peubah acak Geometrik dengan parameter

α. Fungsi peluangnya adalah

fX(n) = p(n) = P (X = n) = (1− α)n−1 α,

untuk n = 1, 2, . . . dan α > 0.

Misalkan Y peubah acak yang menyatakan kegagalan yang sudah dialami sebelum

mendapatkan sukses yang pertama; diketahui peluang mendapatkan sukses adalah

α. Fungsi peluang untuk Y adalah

fY (k) = (1− α)k α, k = 0, 1, 2, . . .

Diskusi:

• Apa yang dapat anda katakan tentang mean dan variansi untuk kedua peubah

acak X dan Y tersebut?

• Apakah nilai mean lebih besar daripada variansi?

Latihan:

1. Hitung momen pertama dan kedua untuk peubah acak Geometrik dengan

parameter α

25

Page 26: CatKuliah-MA20815

2. Tiga remaja makan disuatu restoran. Untuk menentukan siapa yang akan

membayar, mereka sepakat untuk mengundi dengan melantunkan koin. Sese-

orang dengan hasil lantunan yang berbeda dengan yang lain wajib membayar

makanan yang telah dipesan. Jika X menyatakan banyaknya lantunan koin

yang harus dilakukan, tentukan: (i) P (X = 3) (ii) P (X > 4)

26

Page 27: CatKuliah-MA20815

Bab 5 - Distribusi Sampel

Silabus: Definisi populasi dan sampel, distribusi X dan S2.

Ketika kita “bekerja” dengan statistika, maka pemahaman tentang populasi dan

sampel menjadi penting. Seperti kita ketahui, pekerjaan statistika adalah melakukan

inferensi tentang populasi dengan menggunakan sampel.

Populasi adalah...

Sampel adalah...

Sampel acak adalah...

Misalkan X1, X2, . . . , Xn sampel acak berukuran n. Mean dan variansi sampel,

berturut-turut, adalah

X =1

n

n∑i=1

Xi

dan

S2 =1

n− 1

n∑i=1

(Xi − X)2.

Misalkan sampel acak tersebut diambil dari X yang berdistribusi normal dengan

parameter (µ, σ2) maka X ∼ · · · dan S2 ∼ · · · .

Teorema Limit Pusat

Jika X mean dari sampel acak berukuran n dari populasi dengan mean µ dan variansi

σ2, maka

Z =X − µ

σ/√n

→ N(0, 1).

Contoh-1. Sebuah perusahaan produsen lampu memberikan klaim bahwa lampu-

lampu yang diproduksi memiliki masa hidup berdistribusi normal dengan mean 800

27

Page 28: CatKuliah-MA20815

(jam) dan deviasi standar 40 (jam). Misalkan diambil sampel berukuran 16. Hitung

peluang bahwa sampel acak lampu-lampu tersebut memiliki masa hidup (average

life) kurang dari 775 (jam).

Contoh-2. Perjalanan 2 kampus Ganes dan Jtnanger dengan bis ditempuh selama

28 menit dengan deviasi standar 5 menit. Pada suatu waktu, dilakukan perjalanan

selama 40 kali. Berapa peluang waktu perjalanannya lebih dari 30 menit?

Contoh-3. Dua eksperimen yang saling bebas dilakukan pada pengecatan sebuah

produk; 18 spesimen masing-masing dicat dengan cat jenis A dan B, lalu lama

waktu pengeringan dicatat. Diketahui deviasi standar populasi adalah 1. Asumsikan

bahwa mean waktu pengeringan kedua tipe cat adalah sama. Tentukan peluang

P (XA − XB > 1).

Latihan: hal. 241-243

Catatan: Pendekatan normal untuk distribusi binomial

Teorema:

Misalkan S2 variansi sampel dari sampel acak berukuran n berdistribusi normal

dengan mean µ dan variansi σ2, maka

(n− 1)S2

σ2∼ χ2

n−1,

dengan χ2n−1 adalah distribusi chi-kuadrat dengan derajat kebebasan ν = n− 1.

Contoh. Batere merk Energiver diklaim memiliki masa hidup 3 tahun dengan deviasi

standar 1 tahun. Pada sampel berukuran 5, diperoleh data masa hidup sebagai

berikut: 1.9, 2.4, 3.0, 3.5, 4.2. Apakah data ini meyakinkan perusahaan batere

tersebut bahwa deviasi standar masa hidup batere 1 tahun? Asumsikan masa hidup

bateri berdistribusi normal.

28

Page 29: CatKuliah-MA20815

Bab 6 - Inferensi Statistik: Penaksiran Titik dan Selang

Silabus: Distribusi t, selang kepercayaan untuk mean dan variansi.

Penaksiran titik dan Selang kepercayaan

Penaksiran titik (point estimate) merupakan langkah awal dalam inferensi statistik

untuk suatu parameter. Pada sampel acak berdistribusi normal dengan parameter

µ dan σ2, maka penaksiran titik untuk kedua parameter tersebut, berturut-turut,

adalah X dan S2. Penaksir X dan penaksir S2 bersifat tak bias (unbiased).

Penaksiran titik seringkali tidak memberikan keleluasaan untuk menafsirkan nilai

parameter. Untuk itu, diberikan penaksiran selang untuk parameter pada tingkat

kepercayaan tertentu. Perhatikan sampel acak normal berukuran n. Kita ketahui

bahwa mean sampel X berdistribusi normal dengan mean µX = µ dan deviasi

standar σX = σ/√n. Kita ingin menentukan selang kepercayaan untuk µ, jika σ

diketahui. Misalkan zα adalah nilai-z sehingga P (Z < zα). Jadi,

P

(−zα/2 < Z =

X − µ

σ/√n

< zα/2

)= 1− α.

Dengan manipulasi aljabar, kita peroleh 100(1−α)%-selang kepercayaan untuk µ, :

x− zα/2σ√n< µ < x+ zα/2

σ√n.

Contoh. Konsentrasi suatu besi (zinc) di 36 lokasi pada sungai K adalah 2.6 gr/ml.

Tentukan selang kepercayaan untuk mean konsentrasi besi pada tingkat α = 1%, 5%.

Asumsikan bahwa deviasi standar populasi adalah 0.3 gr/ml.

Catatan:

• Dapatkah kita menentukan ukuran sampel n agar selang kepercayaan yang kita

buat tidak akan melampaui suatu galat e tertentu?

• Apabila asumsi σ diketahui tidak dapat dipenuhi, bagaimana kita dapat menen-

tukan selang kepercayaan?

29

Page 30: CatKuliah-MA20815

Distribusi t

Misalkan kita punyai sampel acak berukuran n berdistribusi normal. Asumsikan σ

diketahui tidak dapat dipenuhi. Pandang peubah acak

T =X − µ

S/√n

atau T = Z/√

V/ν, dengan Z peubah acak normal standar dan V peubah acak chi-

kuadrat dengan derajat kebebasan ν. Peubah acak T berdistribusi t atau Student-t,

dengan derajat kebebasan ν = n− 1, dan memiliki fungsi peluang

f(t) =Γ((ν + 1)/2)

Γ(ν/2)√πν

(1 +

t2

ν

)−(ν+1)/2

,−∞ < t∞.

Latihan:

1. Hitung P (−t0.025 < T < t0.05)

2. Tentukan k sehingga P (k < T < −1.761) = 0.045; diketahui n = 15

Selang Kepercayaan Untuk σ Tidak Diketahui

Misalkan T berdistribusi Student-t dengan derajat kebebasan n−1. Analog dengan

Z, kita punyai

P(−tα/2 < T < tα/2

)= 1− α.

Karena T = X−µS/

√n, kita dapat menentukan 100(1 − α)%-selang kepercayaan untuk

µ, jika σ tidak diketahui:

x− tα/2s√n< µ < x+ tα/2

s√n.

Contoh. Isi dari tujuh kontainer barang (yang sejenis) adalah 9.8, 10.2, 10.4, 9.8,

10.0, 10.2, 9.6. Tentukan 95%-selang kepercayaan unutk mean isi kontainer. Asum-

sikan data berdistribusi normal namun σ tidak diketahui.

30

Page 31: CatKuliah-MA20815

Diskusi:

Misalkan ukuran sampel dari suatu sampel acak cukup besar, asumsi normalitas

tidak dapat dipenuhi dan σ tidak diketahui. Dapatkan kita menentukan selang

kepercayaan untuk µ?

31