Metode statistik 1 modul 2013

23
Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM Ringkasan materi metode statistik 1 Daftar Isi 1 Pendahuluan Statistik 3 2 Penyajian data 4 2.1 Distribusi frekuensi .......................... 5 2.2 Diagram batang/Histogram ..................... 7 2.3 LATIHAN ............................... 7 3 Ukuran Pemusatan dan letak 7 3.1 Rata-rata ............................... 7 3.1.1 Rata-rata hitung ....................... 8 3.1.2 Rata-rata Ukur ........................ 9 3.1.3 Rata-rata Harmonik ..................... 9 3.2 Modus ................................. 10 3.3 Median ................................ 11 3.4 Ukuran letak Kuartil ......................... 11 4 Ukuran dispersi 12 5 Pengantar peluang/probabilitas 13 6 Distribusi peluang 14 6.1 Distribusi binom ........................... 14 6.2 Distribusi Multinom ......................... 14 6.3 Distribusi Poisson .......................... 14 6.4 Distribusi Normal / Gaussian .................... 14 7 Sampling 15 7.1 Dengan pengembalian ........................ 15 7.2 Tanpa Pengembalian ......................... 15 8 Statistik Inferensi 15 8.1 Hipotesis ............................... 15 8.2 Macam Kekeliruan .......................... 17 8.3 Langkah Pengujian ......................... 17 9 Uji rata-rata sederhana 18 9.1 Uji T Sederhana (Simple T Test) .................. 18 9.1.1 Menguji rata-rata ...................... 18 9.1.2 Menguji rata-rata μ dengan σ diketahui .......... 18 9.1.3 Menguji rata-rata μ dengan σ tidak diketahui ....... 18 9.2 Independent T Test ......................... 19 9.2.1 Menguji Kesamaan dua rata-rata ............. 19 1

description

 

Transcript of Metode statistik 1 modul 2013

Page 1: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

Ringkasan materi metode statistik 1

Daftar Isi1 Pendahuluan Statistik 3

2 Penyajian data 42.1 Distribusi frekuensi . . . . . . . . . . . . . . . . . . . . . . . . . . 52.2 Diagram batang/Histogram . . . . . . . . . . . . . . . . . . . . . 72.3 LATIHAN . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

3 Ukuran Pemusatan dan letak 73.1 Rata-rata . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

3.1.1 Rata-rata hitung . . . . . . . . . . . . . . . . . . . . . . . 83.1.2 Rata-rata Ukur . . . . . . . . . . . . . . . . . . . . . . . . 93.1.3 Rata-rata Harmonik . . . . . . . . . . . . . . . . . . . . . 9

3.2 Modus . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 103.3 Median . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 113.4 Ukuran letak Kuartil . . . . . . . . . . . . . . . . . . . . . . . . . 11

4 Ukuran dispersi 12

5 Pengantar peluang/probabilitas 13

6 Distribusi peluang 146.1 Distribusi binom . . . . . . . . . . . . . . . . . . . . . . . . . . . 146.2 Distribusi Multinom . . . . . . . . . . . . . . . . . . . . . . . . . 146.3 Distribusi Poisson . . . . . . . . . . . . . . . . . . . . . . . . . . 146.4 Distribusi Normal / Gaussian . . . . . . . . . . . . . . . . . . . . 14

7 Sampling 157.1 Dengan pengembalian . . . . . . . . . . . . . . . . . . . . . . . . 157.2 Tanpa Pengembalian . . . . . . . . . . . . . . . . . . . . . . . . . 15

8 Statistik Inferensi 158.1 Hipotesis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158.2 Macam Kekeliruan . . . . . . . . . . . . . . . . . . . . . . . . . . 178.3 Langkah Pengujian . . . . . . . . . . . . . . . . . . . . . . . . . 17

9 Uji rata-rata sederhana 189.1 Uji T Sederhana (Simple T Test) . . . . . . . . . . . . . . . . . . 18

9.1.1 Menguji rata-rata . . . . . . . . . . . . . . . . . . . . . . 189.1.2 Menguji rata-rata µ dengan σ diketahui . . . . . . . . . . 189.1.3 Menguji rata-rata µ dengan σ tidak diketahui . . . . . . . 18

9.2 Independent T Test . . . . . . . . . . . . . . . . . . . . . . . . . 199.2.1 Menguji Kesamaan dua rata-rata . . . . . . . . . . . . . 19

1

Page 2: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

9.2.2 σ1 = σ2 = σ dan σ diketahui . . . . . . . . . . . . . . . . 199.2.3 σ1 = σ2 = σ dan σ tidak diketahui . . . . . . . . . . . . . 199.2.4 σ1 6= σ2 dan tidak diketahui . . . . . . . . . . . . . . . . . 20

9.3 Paired T Test . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

10 Analisis Varians (Anova) satu arah 20

11 Analisis regresi sederhana 2111.1 Metode Kuadrat terkecil . . . . . . . . . . . . . . . . . . . . . . 2111.2 Koefisien Determinasi r2 . . . . . . . . . . . . . . . . . . . . . . . 22

2

Page 3: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

1 Pendahuluan StatistikStatistik merupakan pengetahuan yang berhubungan dengan cara-cara pengumpu-lan data, pengolahan atau penganalisisnya dan penarikan kesimpulan berdasarkankumpulan data dan penganalisisan yang dilakukan. Statistik dalam praktekberhubungan dengan banyak angka, hingga diartikan “numerical decription”oleh banyak orang. Namun selain merupakan kumpulan data, statistik jugadipakai untuk melakukan berbagai analisis terhadap data, seperti melakukanperamalan (forecasting), melakukan berbagai uji hipotesis dan lainnya.

Statistika perlu dipahami untuk :

1. Memahami cara menyajikan informasi dengan tepat, mudah dibaca dandimengerti.

2. Memahami bagaimana menyimpulkan keputusan berdasarkan informasiyang diperoleh.

3. Memahami cara meningkatkan proses.

4. Memperoleh forecast yang layak dan reliable.

Beberapa definisi kunci yang berkaitan dengan statistik :

1.Populasi : Himpunan semua objek yang menjadi perhatian.

2.Variabel : Karakteristik populasi

3.Sampel : Bagian dari populasi yang dipilih untuk analisis.

4.Parameter : Suatu besaran yang dihitung untuk menggambarkan karakteris-tik populasi.

5.Statistik : Suatu besaran yang dihitung untuk menggambarkan karakteristiksampel.

Aplikasi ilmu statistik dibagi dalam dua bagian :

1. Statistik Deskriptif : Mengumpulkan, menyajikan dan menjelaskan (menggam-barkan) karakteristik data, seperti rata-rata, variansi, modus.

2. Statistik induktif (Inferensi) : berusaha membuat berbagai inferensi ter-hadap sekumpulan data yang berasal dari suatu sample. Melakukan perki-raan, peramalan, pengambilan keputusan dan sebagainya.

3

Page 4: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

2 Penyajian dataSumber data :

1. Data primer merupakan sumber data yang diperoleh langsung dari sumberasli (tidak melalui media perantara).

Data primer dapat berupa opini subjek (orang) secara individual ataukelompok, hasil observasi terhadap suatu benda (fisik), kejadian ataukegiatan, dan hasil pengujian. Metode yang digunakan untuk mendap-atkan data primer yaitu : Survie, Observasi, Eksperimen.

2. Data sekunder merupakan data penelitian yang diperoleh peneliti secaratidak langsung melalui media perantara (diperoleh dan dicatat oleh pihaklain).

Data sekunder umumnya berupa bukti, catatan atau laporan historis yangtelah tersusun dalam arsip (data dokumenter) yang dipublikasikan danyang tidak dipublikasikan, biasanya berupa data cetak.

Secara umum tipe data statistik dibagi menjadi 2, yaitu

1. Data kualitatif / data hasil kategori (pemberian kode)Data kualitatif mempunyai ciri tidak dapat dilakukan operasi matematik,seperti penambahan, pengurangan, perkalian, pembagian.

(a) Data NominalData yang paling rendah dalam level pengukuran data, yakni datayang berbentuk kategori tetapi tidak memiliki tingkatan. Contoh :Jenis kelamin ada dua, Pria yang dikategorikan 1 dan wanita dikat-egorikan 2.

(b) Data OrdinalData yang berbentuk kategori tetapi memiliki tingkatan dalam kat-egori, Contoh : Tanggapan Responden sangat setuju, setuju, tidaksetuju, netral, yang dikategorikan menjadi 1,2,3 dan 4.

2. Data KuantitatifData berupa angka dalam arti sebenarnya sehingga operasi matematikadapat dilakukan.

(a) Data IntervalData yang selain bertingkat urutannya, juga urutan tersebut dap-at dikuantitatifkan, misal, Indeks prestasi mahasiswa. Dalam datainterval tidak mengenal nilai nol absolut.

(b) Data RasioData bersifat angka yang sesungguhnya (bukan kategori), perbedaandata Rasio dengan Data interval adalah Data rasio memiliki titik

4

Page 5: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

nol yang sebenarnya. Contoh: Penjualan Hp sejumlah 24, atau jikapenjualannya adalah 0, berarti memang tidak ada satupun hp yangterjual.

Data yang telah dikumpulkan, baik berasal dari populasi maupun sampel, untukkeperluan laporan dan/atau analisis perlu diatur, disusun dalam bentuk yangjelas dan baik, mudah dibaca. Secara umum ada dua cara penyajian datayang sering dipakai adalah tabel atau daftar dan grafik atau diagram. Macam-macam daftar yang dikenal adalah daftar baris kolom, daftar kontingensi, daftardistribusi frekuensi. Sedangkan diagram diantaranya diagran batang, diagramgaris, diagram lambang, diagram pastel dsb. Namun, dalam modul ini hanyaakan dibahas beberapa cara penyajian data.

2.1 Distribusi frekuensiDistribusi frekuensi mencakup penyajian data, pengelompokan data kedalamsuatu daftar atau tabel, kelas interval dari hasil penelitian. Dengan demikian,distribusi frekuensi pengelompokan data ke dalam beberapa kategori yang me-nunjukkan banyaknya data dalam setiap kategori. Setiap data tidak dapat di-masukkan ke dalam dua atau lebih kategori. Contoh distibusi frekuensi padaTabel 1.

Tabel 1: Nilai matematika kelas ANilai Banyak siswa31-40 541-50 351-60 261-70 2471-80 1281-90 2091-100 14Jumlah 80

Dalam distribusi frekuensi, banyak objek dikumpulkan dalam kelompok-kelompok kelas interval [a,b] dan kolom bilangan yang menunjukan berapabanyak data yang terdapat pada tiap kelas inteval yang disebut dengan frekuen-si. Untuk lebih memahami bagaimana cara membuat daftar distribusi frekuensidiberikan data sebagai berikut.

12, 17, 21, 24, 26, 30, 27, 27, 32, 35, 41, 44, 53, 58, 37, 38, 13, 24, 43, 44

Langkah-langkah membuat daftar distribusi frekuensi.

1. Menentukan rentang, yaitu data terbesar dikurangi data terkecil.

data terbesar : 58; data terkecil : 12; Rentang: 58-12=46.

5

Page 6: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

2. Menentukan banyak kelas interval. Biasanya banyak kelas diambil antara5 sampai 15 kelas, menurut keperluan.

Untuk contoh di atas, karena ukuran data kecil yaitu 20, maka ambilbanyak kelas : 5 kelas.

Cara lain untuk n berukuran besar n ≥ 200 misalnya, dapat menggunakanaturan Sturges, yaitu

banyak kelas = 1 + (3.3) log n

Misalkan data berukuran 80, maka banyak kelas : 1+(3.3) log 80 = 7.2802(dapat dibulatkan menjadi 7 atau 8).

3. Menentukan panjang kelas p

p = RentangBanyak kelas

Karena banyak kelas diambil 5 kelas maka panjang kelas = 465 = 9.2

(dibulatkan menjadi 10)

4. Menentukan batas kelas, yaitu dengan menentukan ujung bawah kelasinterval pertama. Nilai ujung bawah kelas pertama dapat diambil nilaiterkecil data atau lebih kecil. Dari contoh, dengan p = 10, data terkecil11, maka ujuang bawah kelas interval pertama dapat diambil 10, sehinggainterval kelas pertama 11-20, kelas kedua 21-30 dst.

5. Mendaftar data sesuai dengan tiap-tiap kelas. Dengan mengambil 5 kelas,maka distribusi frekuensi dapat diperoleh sebagai berikut :

Table 2: Tabel Distribusi FrekuensiNilai Frekuensi Frekuensi Frekuensi Frekuensi

Relatif Komulatif (%) Komulatif11-20 3 15 3 1521-30 6 30 9 4531-40 5 25 14 7041-50 4 20 18 9051-60 2 10 20 100

Jumlah 20 100

Daftar frekuensi yang dinyatakan dalam persen disebut dengan frekuensirelatif. Sedangkan pada setiap kelas dijumlahkan frekuensi demi frekuensimaka diperoleh distribusi frekuensi komulatif (perhatikan tabel di atas).

6

Page 7: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

2.2 Diagram batang/HistogramUntuk menyajikan data distribusi frekuensi menjadi diagram batang, dimanasumbu horizontal menunjukan kelas interval dengan menuliskan batas-batas ke-las interval dan sumbu vertikal menyatakan frekuensi dengan bentuk batang disisi-sisi batang berdekatan harus berhimpitan.

2.3 LATIHANManajer Bengkel Hudson Auto berkeinginan melihat gambaran yang lebih jelastentang distribusi biaya perbaikan mesin mobil. Untuk itu diambil 50 pelanggansebagai sampel, kemudian dicatat data tentang biaya perbaikan mesin mobilnya($). Berikut hasilnya:

Buatlah daftar distribusi frekuensi. Gambarkan grafik dan histogram untukdata di atas.

3 Ukuran Pemusatan dan letakUntuk mendapatkan gambaran yang lebih jelas, selain disajikan dalam distribusifrekuensi atau diagram, masih diperlukan ukuran-ukuran yang dapat menje-laskan karakteristik data yang berupa parameter atau statistik tergantung uku-ran yang dimaksud untuk pupolasi atau sampel. Beberapa macam ukuran yaiturata-rata hitung (mean), rata-rata ukur, rata-rata harmonik, modus dan beber-apa ukuran letak diantaranya median (nilai tengah), kuartil, desil dan persentil.

3.1 Rata-rataRata-rata merupakan ukuran tendensi pusat yang sering digunakan. Nilai rata-rata sangat ekstrim dipengaruhi oleh pencilan atau outlier. Perhatikan ilustrasiberikut

7

Page 8: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

3.1.1 Rata-rata hitung

Nilai-nilai data kuantitatif dinyatakan dalam x1, x2, . . . , xn, dengan n ukuransampel. Rata-rata didefinisikan sebagai jumlah nilai data dibagi dengan banyakdata, yaitu :

x =∑n

i=1 xi

n

Simbol x merupakan statistik yang digunakan untuk menyatakan rata-rata sam-pel, sedangkan rata-rata populasi dinyatakan dengan parameter µ. Dalam pem-bahasan ini, akan digunakan ukuran sampel, untuk keperluan lebih lanjut uku-ran populasi dapat menyesuaikan.

Contoh Terdapat lima nilai ujian dari lima siswa, 70, 69, 45, 80, 56. makanilai rata-rata dari kelima siswa tersebut adalah

x = 70+69+45+80+565 = 64

Untuk data yang dinyatakan dalam distribusi frekuensi, maka rata-rata didefin-isikan sebagai berikut :

x =∑n

i=1 fixi∑fi

dimana ximenyatakan nilai data atau nilai tengah kelas interval, fi menyatakanfrekuensi untuk nilai xi atau tanda kelas interval ke i yang bersesuaian.

Contoh Dengan menggunakan Tabel 2. Maka diperoleh data sebagai berikut.

Nilai Frekuensi Tanda kelasfi xi fixi

11-20 3 15 4521-30 6 25 15031-40 5 35 17541-50 4 45 18051-60 2 55 110∑

20 - 660

dari tabel diperoleh∑

fi = 20 dan∑

fixi = 660,maka rata-rata adalah

x = 66020 = 33.

8

Page 9: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

Dalam perhitngan di atas, diambil tanda kelas, yaitu setengah dari jumlah ujungbawah dan ujung atas, sebagai wakil dari tiap kelas interval.

Cara lain untuk menghitung rata-rata distribusi frekuensi adalah dengancara sandi atau cara singkat. Cara ini dengan mengambil salah satu tandakelas, katakanlah x0diberi harga c = 0,kemudian tanda kelas yang lebih kecildari x0diberi harga-harga sandi c = −1, c = −2, dan seterusnya. Sedangkantanda kelas yang lebih besar dari x0diberi harga-harga sandi c = +1, c = +2,dan seterusnya. Jika p adalah panjang kelas interval, maka rata-rata diperolehdengan :

x = x0 + p(∑

fici∑fi

)Contoh Dengan menggunakan Tabel 2. Maka diperoleh data sebagai berikut.

Nilai Frekuensi Tanda kelas sandifi xi ci fici

11-20 3 15 -1 -321-30 6 25 0 031-40 5 35 +1 541-50 4 45 +2 851-60 2 55 +3 6∑

20 - - 16

dari tabel diperoleh p = 10,∑

fi = 20 dan∑

fici = 16, dengan x0 = 25 makarata-rata adalah

x = 25 + 10(

1620

)= 33.

3.1.2 Rata-rata Ukur

Dalam kasus data berurutan tetap atau hampir tetap, untuk menghitung rata-ratanya rata-rata ukur lebih baik digunakan daripada rata-rata hitung. Rata-rata ukur didefinisikan sebagai berikut :

U = n√

x1 · x2 · . . . · xn

yaitu akar pangkat n dari data x1, x2, ..., xn. Untuk bilangan-bilangan yangbernilai besar, lebih baik menggunakan logaritma, yaitu

log U =∑

log xi

n

3.1.3 Rata-rata Harmonik

Rata-rata Harmonik untuk data x1, x2, ..., xn, didefinisikan sebagai berikut :

H = n∑ 1xi

atau

9

Page 10: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

H = n1

x1+ 1

x2+···+ 1

xn

Untuk memperjelas penggunaan rata-rata harmonik, perhatikan ilustrasi contohberikut

Contoh Seorang mahasiswa pergi ke kampus mengendarai sepeda dengan ke-cepatan 10 km/jam sedangkan ketika pulang dari kampus dengan kecepatan 20km/jam. Berapakah kecepatan rata-rata pulang-pergi?

Jawab : Dengan menggunakan rata-rata hitung diperoleh 12 (10 + 20) =

15km/jam. INI SALAH.Perhatikan, jika jarak rumah ke kampus adalah 20 km, maka untuk pergi

perlu waktu 2 jam dan untuk pulang 1 jam. Sehingga pulang pergi perluwaktu 3 jam dengan jarak tempuh 40 km, jadi rata-rata kecepatannya adalah40/3=13.33 km/jam.

Hal ini tidak lain adalah rata-rata harmonik, yaitu

H = 2110+ 1

20= 40

3 = 13.33

3.2 ModusModus adalah suatu ukuran tendensi pusat yang menyatakan datum yang palingbanyak muncul. ModusTidak terpengaruh oleh harga ekstrim. Nilai modus bisatunggal, lebih dari satu bahwa tidak ada.

Sesaui dengan definisi dari modus, maka untuk mencari modus untuk data tung-gal cukup dengan mencari data dengan frekuensi yang terbanyak. Sedangkanuntuk data yang sudah disusun dalam daftar distribusi frekuensi, maka modusdapat diperoleh dengan

Mo = b + p(

b1b1+b2

)dimana :

b : batas bawah kelas modal, yaitu kelas interval dengan frekuensiterbanyak

p : Panjang kelas

b1 : Frekuensi kelas modal dikurangi frekuensi sebelumnya

b2 : Frekuensi kelas modal dikurangi frekuensi setelahnya

10

Page 11: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

3.3 MedianMedian adalah nilai tengah yang merupakan ukuran tendensi pusat yang tegar,tidak dipengaruhi oleh data ekstrim. Cara sederhana untuk mencari nilai medi-an pada data tunggal yaitu dengan mengurutkan data, nilai median adalah nilaiyang terletak di tengah untuk n ganjil dan rata-rata hitung dua data tengahuntuk n genap.

Sedangkan untuk data dalam distribusi frekuensi, median dapat dihitung den-gan

Me = b + p( 1

2 n−F

f

)dimana :

b : batas bawah kelas median, yaitu kelas dimana median akan ter-letak

p : Panjang kelas

n : banyak data

F : Jumlah semua frekuensi dengan tanda kelas lebih kecil dari tandakelas median

f : frekuensi kelas median

3.4 Ukuran letak KuartilSekumpulan data jika setelah disusun kemduian dibagi menjadi empat bagianyang sama banyak, maka bilangan pembagi disebut dengan kuartil. Ada tigakuartil yang terbentuk, yaitu kuartil pertama (K1), kuartil kedua (K2) dankuartil ketiga (K3). Sedangkan jika data dibagi menjadi 10 bagian yang samamaka terdapat 9 pembagi yang disebut dengan Desil, dan jika dibagi 100 bagianyang sama maka disebut dengan Persentil. Untuk menentukan nilai kuartil,Desil atau Persentil dapat diperoleh dengan cara :

1. Mengurutkan data.

2. Menentukan letak

Kuartil : Letak Ki =data ke i(n+1)4 , i = 1, 2, 3.

Desil : Letak Di =data ke i(n+1)10 , i = 1, 2, . . . , 9.

11

Page 12: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

Persentil : Letak Pi =data ke i(n+1)100 , i = 1, 2, . . . , 99.

3. Menentukan nilai

Untuk data dalam distribusi frekeunsi nilai-nilai Kuartil, Desil, Persentiladalah sebagai berikut :

Kuartil : Ki = b + p(

in4 −F

f

), i = 1, 2, 3.

Desil : Di = b + p(

in10−F

f

), i = 1, 2, . . . , 9.

Persentil : Pi = b + p(

in100−F

f

), i = 1, 2, . . . , 99.

b : batas bawah kelas Ki atau Di atau Pi

p : panjang kelas

F : Jumlah frekuensi tanda kelas lebih kecil dari kelas Ki atauDi atau Pi

f : frekuensi kelas Ki atau Di atau Pi

4 Ukuran dispersiSelain ukuran pemusatan terdapat juga ukuran simpangan atau dispersi yangmenunjukan bagaimana berpencarnya suatu data. Beberapa ukuran dispersidiantaranya adalah sebagai berikut

Rentang Jarak antara data terbesar dengan data terkecil.

Rentang= xmaks − xmin

Rentang antar kuartil Jarak antara kuartil tiga dengan kuartil pertama.

RAK = K3 −K1

Simpangan kuartil atau deviasi kuartil Setengah jarak rentang antarkuartil.

SK = 12 (K3 −K1)

Variansi dan simpangan baku Jika suatu populasi terdapat N data ,x1, x2, · · · , xN , maka variansi di definisikan sebagai berikut

σ2 =∑

(xi−µ)2

N

dan simpangan baku adalah akar dari variansi, yaitu

σ =√∑

(xi−µ)2

N

12

Page 13: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

Sedangkan variansi dan simpangan baku untuk sampel sebanyak n, didefinsikansebagai berikut

s2 =∑

(xi−x)2

n−1

dan

s =√∑

(xi−x)2

n−1

Bentuk lain dari variansi sampel adalah

s2 = n∑

x2i−(

∑xi)

2

n(n−1)

Sedangkan untuk data yang telah disusun dalam daftar distribusi frekuensi,variansi s2 dapat dihitung dengan

s2 =∑

fi(xi−x)2

n−1

atau

s2 = n∑

fix2i−(

∑fixi)

2

n(n−1)

Bilangan Baku Suatu sampel x1, x2, · · · , xn,dengan rata-rata x dan simpan-gan baku s dapat dibentuk menjadi suatu data baru yaitu z1, z2, · · · , zndengan

zi = xi−xs ; i = 1, 2, . . . , n

maka diperoleh penyimpangan atau deviasi data terhadap rata-rata persatuansimpangan baku. Data baru zi;i=1,2,..,n tersebut memiliki nilai rata-rata 0 dansimpangan baku 1. Bilangan ini disebut dengan bilangan baku dengan rata-rata 0 dan simpangan baku 1. Berdasarkan sifat ini maka suatu data denganmelalui bilangan z ini bisa diubah menjadi suatu data dengan distribusi baruyang mempunyai dengan rata-rata x0 dan simpangan baku s0, yaitu dengan

zi = x0 + s0

(xi−x

s

); i = 1, 2, . . . , n

bilangan ini disebut bilangan baku dengan rata-rata x0 dan simpangan bakus0.

5 Pengantar peluang/probabilitasTugas Presentasi

13

Page 14: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

6 Distribusi peluang

6.1 Distribusi binomDistribusi binom menyatakan suatu distribusi variabel acak x dalam sebanyakn percobaan yang identik serta memenuhi kondisi sebagai berikut :

1. Setiap hasil percobaan menghasilkan satu dari dua kemungkinan kejadianyaitu sukses atau gagal.

2. Peluang kejadian sukses dalam percobaan tunggal adalah p, nilai p tetappada setiap percobaan.

3. Percobaan dilakukan secara independen.

Andaikan dilakukan sebanyak n percobaan, terdapat x peristiwa A dan sisanya(n−x) peristiwa A. Jika p adalah peluang A dan 1−p peluang A, maka peluangdistribusi binom diberikan sebagai berikut

p(x) = n!x!(n−x)!p

x(1− p)n−x; x = 0, 1, 2, . . . , n

Distribusi binom hanya memiliki satu parameter p. Rata-rata dan variansidistribusi binom ditunjukan sebagai berikut:

µ = np

σ2 = np(1− p).

6.2 Distribusi MultinomDistribusi mutlinom merupakan perluasan dari distribusi binom, yaitu meng-hasilkan peristiwa-peristiwa A1, A2, . . . , Akdengan peluang p1 = P (A1), p2 =P (A2), · · · , pk = P (Ak) dimana

∑ki=1 pi = 1. Jika dilakukan sebanyak n per-

cobaan, maka peluang akan terdapat peristiwa A1 sebanyak x1, A2sebanyakx2· · · peristiwa Aksebanyak xk, distribusi multinom diberikan sebagai berikut

p(x1, x2, . . . , xk) = n!x1!x2!···xk!p

x11 px2

2 · · · pxk

k

dengan x1 + x2 + · · ·+ xk = n dan 0 < pi < 1, i = 1, 2, . . . , k.

6.3 Distribusi PoissonFungsi densitas distribusi poisson didefinisikan sebagai berikut :

p(x) = P (X = x) = e−λλx

x! ;x = 0, 1, 2, . . .dimanan e merupakan bilangan natural yaitu e = 2, 7183...

6.4 Distribusi Normal / GaussianFungsi densitas distribusi normal didefinisikan sebagai berikut :

f(x) = 1σ√

2πe−

12 ( x−µ

σ )2

14

Page 15: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

7 SamplingTugas Presentasi

7.1 Dengan pengembalian

7.2 Tanpa Pengembalian

8 Statistik InferensiKesimpulan atau keputusan yang diambil biasanya didasarkan pada dugaansementara terhadap suatu perilaku populasi. Statistik inferensi merupakanpengambilan kesimpulan dan/atau keputusan tentang populasi dengan meng-gunakan data sampel. Dengan kata lain, bahwa nilai parameter yang dipakaimerupakan nilai taksiran yang diperoleh dari sampel. Oleh karena itu bisa sajaterdapat kesalahan dalam pengambilan keputusan. Pengujian terhadap dugaanmengenai suatu hal perlu dilakukan.

Isitlah-istilah dalam pengujian

1. Hipotesis : Asumsi atau dugaan mengenai suatu hal yang dibuat untukmenjelaskan hal yang sering dituntut untuk melakukan pengecekannya.

2. Hipotesis statistik : sebuah pernyataan tentang parameter yang menje-laskan sebuag populasi.

3. Hipotesis nol : Sebuah hipotesis yang berlawanan dengan teori yang dibuk-tikan.

4. Hipotesis alternatif : Sebuah hipotesis yang berhubungan dengan teoriyang akan dibuktikan.

5. Daerah penerimaan : Nilai dari tes statistik yang menggagalkan untukpenolakan hipotesis nol.

6. Daerah penolakan : Nilai dari tes statistik untuk penolakan hipotesis nol.

7. Kekuatan statistik : Probabilitas kebenaran/kesalahan pada saat menolakhipotesis nol.

8. Nilai P (P-Value) : Probabilitas, mengasumsikan hipotesis nol benar.

8.1 HipotesisHipotesis berasal dari bahasa yunani

Hupo : lemah atau kurang atau di bawahThesis : teori, proposisi atau pernyataan yang disajikan sebagai bukti

Hipotesis merupakan pernyataan yang masih lemah kebenarannya dan perludibuktikan atau dugaan yang sifatnya masih sementara. Suatu prosedur yangdilakukan dengan tujuan memutuskan apakah menerima atau menolak hipotesismengenai parameter populasi disebut dengan pengujian hipotesis.

15

Page 16: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

Bentuk Rumusan Hipotesis

1. Hipotesis Deskriptif : Hipotesis tentang nilai suatu variabel mandiri, tidakmemuat perbandingan atau hubungan.

Contoh : Seberapa tinggi produktifitas alat penurun berat badan?

. Berapa lama umur baterai jam tangan merk X bisa bertahan?

Rumusan : Produktifitas alat penurun berat badan sebesar 5 kg.

. Umur baterai jam tangan merk X mencapai 2 tahun.

2. Hipotesis komperatif : Pernyataan yang menunjukan dugaan nilai dalamsatu variabel atau lebih pada sampel yang berbeda.

Contoh : Apakah ada perbedaan prestasi siswa kelas A dan kelas B?

Rumusan : Tidak ada perbedaan prestasi siswa kelas A dan kelas B.

Hipotesis : Ho : µ1 = µ2; Ha : µ1 6= µ2.

3. Hipotesis Hubungan (asosiatif) : Pernyataan yang menunjukan dugaantentang hubungan antara dua variabel atau lebih.

Contoh : Apakah ada hubungan antara banyaknya konsentrasi pupukcair terhadap pertumbuhan bunga anggrek?

Rumusan : tidak ada hubungan antara banyaknya konsentrasi pupukcair terhadap pertumbuhan bunga anggrek?

Hipotesis : Ho : ρ = 0; Ha : ρ 6= 0.

Arah Uji

1. Uji satu arah (one-side test)

contoh : Ho : θ = θ0; Ha : θ > θ0 atau Ha : θ < θ0

2. Uji dua arah (two-side test)

contoh : Ho : θ = θ0; Ha : θ 6= θ0

16

Page 17: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

8.2 Macam KekeliruanDalam melakukan pengujian hipotesis terdapat dua macam kekeliruan yangterjadi, yaitu

1. Kekeliruan tipe I : menolak hipotesis yang seharusnya diterima.

2. Kekeliruan tipe II : menerima hipotesis yang seharusnya ditolak.

Hubungan hipotesis, kesimpulan dan kekeliruan dapat dilihat pada tabel berikut:

Kesimpulan Keadaan sebenarnyaHipotesis benar Hipotesis salah

Terima hipotesis BENAR Keliru tipe IITolak hipotesis Keliru tipe I BENAR

Sehingga dalam merencanakan suatu penelitian dalam rangka pengujian hipote-sis, perlu diperhatikan bahwa kedua tipe kekeliruan itu harus dibuat sekecilmungkin. Untuk keperluan itu maka kekeliruan tersebut dinyatakan dalam ben-tuk peluang.

Peluang kekeliruan tipe I biasa dinyatakan dengan α(alpha).Peluang kekeliruan tipe II biasa dinyatakan dengan β (beta).

Dalam penggunaan α disebut dengan taraf signifikan atau taraf arti atau tarafnyata. Harga (1-β) dinamakan kuasa uji. Untuk setiap pengujian dengan αyangditentukan, besar β dapat dihitung. Prinsip penentuan taraf signifikan α danβ memerlukan pemecahan matematika yang rumit, sehingga belum dibahasdidalam modul ini, untuk keperluan praktis α diambil terlebih dahulu denganharga yang biasa digunakan, yaitu α = 0.01 atau α = 0.05. Dengan α = 0.05(5%) misalnya, berarti kira-kira 5 dari 100 kesimpulan bahwa kita akan menolakhipotesis yang seharusnya diterima, dengan kata lain kira-kira 95% yakin bahwakesimpulan yang diambil adalah benar atau sebaliknya.

8.3 Langkah PengujianSecara umum langkah - langkah menguji hipotesis adalah sebagai berikut :

1. Menentukan hipotesis

2. Menentukan statistik uji dan daerah kritis

3. Menghitung statistik hitung dari data

17

Page 18: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

4. Membandingkan statistik hitung dengan statistik uji

5. Mengambil keputusan

9 Uji rata-rata sederhana

9.1 Uji T Sederhana (Simple T Test)9.1.1 Menguji rata-rata

Asumsi pertama dalam uji ini adalah bahwa data berdistribusi normal den-gan rata-rata µ dan simpangan baku σ. Akan di uji parameter µterhadap nilaidugaan µ0. Hipotesis uji rata-rata dalam uji dua pihak

Hipotesis :

{H0 : µ = µ0

Ha : µ 6= µ0

Sedangkan untuk uji satu pihak :

Kanan : Hipotesis :

{H0 : µ = µ0

Ha : µ > µ0

Kiri :Hipotesis :

{H0 : µ = µ0

Ha : µ < µ0

9.1.2 Menguji rata-rata µ dengan σ diketahui

Statistik uji yang digunakan adalah uji Z, yaitu

Z = x−µ0σ/

√n

Uji dua pihak dengan kriteria pengujian H0diterima jika −z 12 (1−α) < z <

z 12 (1−α),dimana z 1

2 (1−α)diperoleh dari daftar normal baku dengan peluang 12 (1−

α). Maka dalam hal lain H0 ditolak.Uji satu pihak, kriteria pengujian pihak kanan H0diterima jika z < z0.5−α,sedangkan untuk pihak kiri H0diterima jika z > −z0.5−α, dimana z0.5−αdiperolehdari daftar normal baku dengan peluang (0.5 − α). Maka dalam hal lain H0

ditolak.

9.1.3 Menguji rata-rata µ dengan σ tidak diketahui

Statistik uji yang digunakan adalah uji t, yaitu

t = x−µ0s/√

n

t berditribusi student dengan dk = (n−1). Karena itu distribusi ini menentukankriteria pengujian dua pihak yaitu H0diterima jika −t1− 1

2 α < t < t1− 12 α,dimana

t1− 12 αdiperoleh dari daftar distribusi t dengan peluang 1− 1

2α dan dk = n− 1.Maka dalam hal lain H0 ditolak. Sedangkan untuk uji satu pihak, dengan

18

Page 19: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

kriteria pengujian pihak kanan H0diterima jika t < t1−α, sedangkan untuk pihakkiri H0diterima jika t > −t1−α, dimana t1−αdiperoleh dari daftar distribusi tdengan peluang 1− α dan dk = n− 1. Maka dalam hal lain H0 ditolak.

9.2 Independent T Test9.2.1 Menguji Kesamaan dua rata-rata

Andaikan terdapat dua populasi normal memiliki rata-rata masing-masing µ1danµ2sedangkan simpangan baku σ1 dan σ2. Secara independen diambil n1sampeldari populasi pertama dan n2dari populasi kedua, diperoleh rata-rata dan sim-pangan baku x1, s1 dan x2, s2.Akan diuji tentang rata-rata µ1dan µ2. Pasanganhipotesis uji dua pihak diberikan sebagai berikut

Hipotesis :

{H0 : µ1 = µ2

Ha : µ1 6= µ2

Pasangan hipotesis uji dua pihak diberikan sebagai berikut

Kanan : Hipotesis :

{H0 : µ1 = µ2

Ha : µ1 > µ2

Kiri :Hipotesis :

{H0 : µ1 = µ2

Ha : µ1 < µ2

9.2.2 σ1 = σ2 = σ dan σ diketahui

Statistik uji :

z = x1−x2

σ√

1n1

+ 1n2

dengan taraf α,H0diterima jika −z 12 (1−α) < z < z 1

2 (1−α).

9.2.3 σ1 = σ2 = σ dan σ tidak diketahui

Statistik uji :

t = x1−x2

s√

1n1

+ 1n2

dengan

s = (n1−1)s21+(n2−1)s2

2n1+n2−2

Statistik t berdistribusi student dengan dk = n1+n2−2, dengan taraf α,H0diterimajika −t1− 1

2 α < t < t1− 12 α.

19

Page 20: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

9.2.4 σ1 6= σ2 dan tidak diketahui

Statistik uji :

t′ = x1−x2√s21n1

+s22n2

Dengan kriteria pengujian dengan taraf α,H0diterima jika

−w1t1+w2t2w1+w2

< t′ < w1t1+w2t2w1+w2

denganw1 = s2

1n1

; w2 = s22

n2.

t1 = t(1− 12 α),(n1−1), Distribusi student dengan peluang 1− 1

2αdan dk = n1 − 1.

t2 = t(1− 12 α),(n2−1), Distribusi student dengan peluang 1− 1

2αdan dk = n2 − 1.Statistik uji pada uji satu pihak menyesuaikan dengan uji dua pihak, dengan

kriteria penerimaan dan penolakan seperti kasus-kasus sebelumnya.

9.3 Paired T Test

10 Analisis Varians (Anova) satu arahAnalisis varians pada dasarnya merupakan perluasan uji rata-rata k > 2 popu-lasi yang masing-masing independen berdistribusi normal serta memiliki variansyang homogen. Andaikan dari k > 2 populasi diambil sampel masing-masingsebanyak n1, n2, · · · , nk dan diperoleh nilai rata-rata µ1, µ2, . . . , µk, akan diujirata-rata dengan hipotesis

Hipotesis :

{H0 : µ1 = µ2 = · · · = µk

Ha : paling tidak ada satu µi 6= µj ; i, j = 1, 2, . . . , k

Perhatikan bahwa selain syarat bahwa data berdistribusi normal dan indepen-den, populasi besifat homogen yaitu σ2

1 = σ22 = · · · = σ2

k. Statistik uji yangdigunakan adalah statistik F yaitu

F = RKPRKS

dengan

RKP =

k∑ni

i=1(yi.−y..)2

k∑i=1

(ni−1)

RKS =

k∑i=1

ni∑j=1

(yij−yi.)2

k−1Kriteria pengujian yaitu tolak H0 jika F ≥ F

(1−α)(k−1,k∑

i=1(ni−1))

.

20

Page 21: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

11 Analisis regresi sederhana

11.1 Metode Kuadrat terkecilMetode kuadrat terkecil (Ordinary Least Squares Method, OLS) merupakanmetode yang populer untuk mengestimasi koefisien regresi. Misalkan Y adalahpeubah tak bebas dan Xipeubah penjelas, u adalah faktor gangguan yangstokastik, dan i menyatakan pengamatan yang ke i, maka model regresi duapeubah dapat didefinisikan sebagai

Yi = β0 + β1Xi + ui (1)

Persamaan 1 dinamakan fungsi regresi populasi (population regression function,PRF).Secara khusus, kita asumsikan bahwa

E(ui, Xi) = 0cov(ui, uj) = 0; i 6= jvar(ui, Xi) = σ2 untuk setiap icov(ui, Xi) = cov(uj , Xj)=0

Suatu model regresi memenuhi keempat asumsi tadi dikenal sebagai model re-gresi klasik, standar, atau linear umum.

Karena fungsi regresi populasi tidak secara langsung dapat diamati, makaharus menaksirnya dari fungsi regresi sampel (Sample regression function).

Yi = β0 + β1Xi + ui (2)

Bila Yi = β0 + β1Xi menyatakan nilai taksiran (rata-rata bersyarat) dari Yt,maka ei(residual) yang merupakan perbedaan anatara nilai Y sebenarnya den-gan yang ditaksir, dapat dinyatakan sebagai

ei = Yi − Yi = Yi − β0 − β1Xi (3)

Sekarang dengan n pasang observasi atas Y dan X yang sudah tentu, kita inginmenetapkan SRF sedemikian rupa sehingga sedekat mungkin dengan nilai Yyang sebenarnya. Menggunakan kriteria kuadrat terkecil, SRF dapat ditetapkandengan cara sedemikian sehingga∑

e2i =

∑(Yi − β0 − β1Xi)2 (4)

Sekecil mungkin. Dengan menggunakan kalkulus, yakni turunkan persamaann4 terhadap β0 dan β1kemudian samakan dengan nol, kita peroleh persamaannormal∑

Yi = nβ0 + βi

∑Xi∑

YiXi = β0

∑Xi + β1

∑X2

i

dengan memecahkan sistem persamaan secara simultasn untuk β0dan β1 diper-oleh :

β1 = n∑

XiYi−∑

Xi

∑Yi

n∑

X2i −(

∑Xi)2

β0 = Y − β1X

21

Page 22: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

dimana X =∑

Xi/n dan Y =∑

Yi/n masing-masing merupakan rata-ratasampel X dan Y . Penaksir yang diperoleh dikenal sebagai penaksir kuadratterkecil.Contoh 1Gunakan regresi dua peubah untuk mencocokan data berikut :

y x5 010 29 2,50 13 427 7

Penyelesaian :i y x x2

i yixi

1 5 0 0 02 10 2 4 203 9 2,5 6,25 22,54 0 1 1 05 3 4 4 126 27 7 7 1896 54 16,5 76,25 243,5

Sehinggaβ1 = n

∑XiYi−

∑Xi

∑Yi

n∑

X2i −(

∑Xi)2

= (6)(243,5)−(16,5)(54)(6)(76,25)−(16,5)2 = 3, 0769

β0 = Y − β1X = 9− (3, 0769)(2, 75) = 0.5385Sehingga taksrian untuk Yiadalah

Yi = 0, 5385 + 3, 0769Xi

Latihan SoalGunakan regresi dua peubah untuk mencocokan data yang diberikan dibawahini

1.x 0 1 2 0 1 2y 19 12 11 24 22 15

2.x 1 1 2 2 3 3 4 4y 18 12,8 25,7 20,6 35 29,8 45,5 40,3

11.2 Koefisien Determinasi r2

Selanjutnya kita akan membahas kebaikan suai (goodness of fit) garis regresiyang dicocokan terhadap data sekumpulan data, yaitu kita ingin mengetahuisebaik mana garis regresi sampel mencocokan data. Koefisien determinasi, dit-ulis sebagai r2, merupakan suatu ukuran untuk mengetahui kebaikan suai.Untuk menghitung r2ini kuadratkan :

(Yi − Y ) = (Yi − ¯Y ) + ei

22

Page 23: Metode statistik 1 modul 2013

Iwan Tri Riyadi Yanto /Ringkasan Metode Statistik 2/NM

pada kedua ruas dan jumlahkan untuk semua sampel, kita peroleh :∑(Yi − Y )2 =

∑(Yi − Y )2 +

∑e2i (5)

dimana ¯Y = Y .

Persamaan 5 menunjukan bahwa total variansi dalam nilai Y yang diamatidisekitar nilai rata-ratanya dapat dipisahkan ke dalam dua bagian, sebagianyang diakibatkan oleh garis regresi dan bagian lain diakibatkan oleh kekuatanrandom karena tidak semua pengamatan Y yang sebenarnya terletak pada garisyang dicocokan.Sekarang dengan membagi persamaan 5 dengan

∑(Yi− Y )2 pada kedua sisinya,

kita peroleh1 =

∑(Yi−Y )2∑(Yi−Y )2

+∑

e2i∑

(Yi−Y )2,

kita definisikan r2 sebagair2 =

∑(Yi−Y )2∑(Yi−Y )2

atau ekuivalen denganr2 = 1−

∑e2

i∑(Yi−Y )2

= 1−∑

(Yi−β0−β1Xi)2∑

(Yi−Y )2

Besaran r2 yang didefinisikan demikian dikenal sebagai koefisien determinasi(sampel) dan merupakan besaran yang lazim digunakan untuk mengukur ke-baikan suai garis regresi. Secara verbal, r2mengukur proporsi (bagian) atauprosentase total variasi dalam Y yang dijelaskan oleh model regresi.

Suatu besaran yang berhubungan dengan erat tetapi secara konsep sangatberbeda dari r2 adalah koefisien korelasi yang merupakan suatu ukuran tingkathubungan antara dua peubah. Besaran tadi dapat dihitung dari

r = ±√

r2

yang dikenal sebagai koefisien korelasi sampel.contohMengacu pada contoh 1, Hitunglah koefisien determinasinya.Penyelesaian :

i y x (yi − y)2 (yi − β0 − β1xi)2

1 5 0 16 19,90532 10 2 1 10,94083 9 2,5 0 0,59174 0 1 81 13,07105 3 4 36 96,94676 27 7 324 24,23676 54 16,5 458 165,6923

Sehingga :r2 = 1−

∑e2

i∑(Yi−Y )2

= 1−∑

(Yi−β0−β1Xi)2∑

(Yi−Y )2= 1− 0, 3618 = 0, 6382.

Latihan SoalMengacu pada latihan 1 dan 2 di atas Hitunglah koefisien determinasinya.

23