Stat Pro Modul 1

73
STATISTIKA DAN PROBABILITAS Pendahuluan Mata kuliah statistika bagi mahasiswa sangat diperlukan terutama ketika seorang mahasiswa harus mengumpulkan, mengolah, menganalisis dan menginterprestasikan data untuk pembuatan skripsi, thesis atau disertasi. Dalam hal ini pengetahuan statistik dipakai dalam menyusun metodologi penelitian. Sebagai suatu ilmu, kedudukan statistika merupakan salah satu cabang dari ilmu matematika terapan. Oleh karena itu untuk memahami statistika pada tingkat yang tinggi, terebih dahulu diperlukan pemahaman ilmu matematika. Dinegara maju seperti Amerika, Eropa dan Jepang, ilmu statistika berkembang dengan pesat sejalan dengan berkembangnya ilmu ekonomi dan teknik. Bahkan kemajuan suatu negara sangat ditentukan oleh sejauh mana negara itu menerapkan ilmu statistika dalam memecahkan masalah- masalah pembangunan dan perencanaan pemerintahannya. Jepang sebagai salah satu negara maju, konon telah berhasil memadukan ilmu statistika dengan ilmu ekonomi, desain produk, psikologi dan sosiologi masyarakat. Sejauh itu ilmu statistika digunakan pula untuk memprediksi dan menganalisis perilaku konsumen, sehingga Jepang mampu menguasai perekonomian dunia sampai saat ini. Statistik dan Statistika Statistik adalah kumpulan data dalam bentuk angka maupun bukan angka yang disusun dalam bentuk tabel Mata Kuliah : Statistika & Probabilitas Modul 1 Dosen : Supriyoko Pramono, S.Kom, MM 1

Transcript of Stat Pro Modul 1

Page 1: Stat Pro Modul 1

STATISTIKA DAN PROBABILITAS

Pendahuluan

Mata kuliah statistika bagi mahasiswa sangat diperlukan terutama ketika seorang mahasiswa harus mengumpulkan, mengolah, menganalisis dan menginterprestasikan data untuk pembuatan skripsi, thesis atau disertasi. Dalam hal ini pengetahuan statistik dipakai dalam menyusun metodologi penelitian.

Sebagai suatu ilmu, kedudukan statistika merupakan salah satu cabang dari ilmu matematika terapan. Oleh karena itu untuk memahami statistika pada tingkat yang tinggi, terebih dahulu diperlukan pemahaman ilmu matematika.

Dinegara maju seperti Amerika, Eropa dan Jepang, ilmu statistika berkembang dengan pesat sejalan dengan berkembangnya ilmu ekonomi dan teknik. Bahkan kemajuan suatu negara sangat ditentukan oleh sejauh mana negara itu menerapkan ilmu statistika dalam memecahkan masalah-masalah pembangunan dan perencanaan pemerintahannya. Jepang sebagai salah satu negara maju, konon telah berhasil memadukan ilmu statistika dengan ilmu ekonomi, desain produk, psikologi dan sosiologi masyarakat.

Sejauh itu ilmu statistika digunakan pula untuk memprediksi dan menganalisis perilaku konsumen, sehingga Jepang mampu menguasai perekonomian dunia sampai saat ini.

Statistik dan Statistika

Statistik adalah kumpulan data dalam bentuk angka maupun bukan angka yang disusun dalam bentuk tabel (daftar) dan atau diagram yang menggambarkan atau berkaitan dengan suatu masalah tertentu.

Contoh : Statistik penduduk adalah kumpulan angka-angka yang berkaitan

dengan masalah penduduk. Statistik ekonomi adalah kumpulan angka-angka yang berkaitan

dengan masalah ekonomi.

Statistika adalah pengetahuan yang berkaitan dengan metode, teknik atau cara mengumpulkan, mengolah, menganalisis dan menginterprestasikan data untuk disajikan secara lengkap dalam bentuk yang mudah dipahami penggunanya.

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

1

Page 2: Stat Pro Modul 1

Pengertian Data

Dalam statistika dikenal beberapa jenis data. Data dapat berupa angka dapat pula bukan berupa angka. Data berupa angka disebut data kuantitatif dan data yang bukan angka disebut data kualitatif.

Berdasarkan nilainya dikenal dua jenis data kuantitatif yaitu data diskrit yang diperoleh dari hasil perhitungan dan data kontinue yang diperoleh dari hasil pengukuran.

Menurut sumbernya data dibedakan menjadi dua jenis yaitu data interen adalah data yang bersumber dari dalam suatu instansi atau lembaga pemilik data dan data eksteren yaitu data yang diperoleh dari luar.

Data eksteren dibagi menjadi dua jenis yaitu data primer dan data sekunder. Data primer adalah data yang langsung dikumpulkan oleh orang yang berkepentingan dengan data tersebut dan data sekunder adalah data yang tidak secara langsung dikumpulkan oleh orang yang berkepentingan dengan data tersebut.

Jenis – Jenis Statistika

Statistika dibedakan berdasarkan jenisnya menjadi dua yaitu Statistika Deskriptif dan Statistika Inferensia.

Statistika deskriptif adalah statistika yang berkaitan dengan metode atau cara medeskripsikan, menggambarkan, menjabarkan atau menguraikan data. Statistika deskripsi mengacu pada bagaimana menata, menyajikan dan menganalisis data, yang dapat dilakukan misalnya dengan menentukan nilai rata-rata hitung, median, modus, standar deviasi atau menggunakan cara lain yaitu dengan membuat tabel distribusi frekuensi dan diagram atau grafik.

Statistika inferensia adalah statistika yang berkaitan dengan cara penarikan kesimpulan berdasarkan data yang diperoleh dari sampel untuk menggambarkan karakteristik dari suatu populasi. Dengan demikian dalam statistika inferensia data yang diperoleh dilakukan generalisasi dari hal yang bersifat kecil (khusus) menjadi hal yang bersifat luas (umum).

Populasi Dan Sampel

Populasi adalah keseluruhan pengamatan atau obyek yang menjadi perhatian sedangkan Sample adalah bagian dari populasi yang menjadi perhatian.

Populasi dan sample masing-masing mempunyai karakteristik yang dapat diukur atau dihitung. Karakteristik untuk populasi disebut parameter dan untuk sample disebut statistik.

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

2

Page 3: Stat Pro Modul 1

Contoh parameter adalah mean ( ), standar deviasi ( ), proporsi (P) dan koefisien korelasi ( ), sedangkan statistik adalah nilai rata-rata ( ), standar deviasi

(s ), proporsi (p) dan koefisien korelasi (r).

Populasi dibedakan menjadi dua jenis yaitu : Populasi orang atau individu adalah keseluruhan orang atau individu

(dapat pula berupa benda-benda) yang menjadi obyek perhatian. Populasi data adalah populasi yang terdiri atas keseluruhan

karakteristik yang menjadi obyek perhatian.Sample juga dibedakan menjadi dua jenis yaitu :

Sampel orang atau individu adalah sampel yang terdiri atas orang-orang (dapat pula berupa benda-benda) yang merupakan bagian dari populasinya yang menjadi obyek perhatian.

Sampel data adalah sebagaian karakteristik dari suatu populasi yang menjadi obyek perhatian.Meskipun populasi merupakan gambaran yang ideal, tetapi sangat

jarang penelitian dilakukan memakai populasi. Pada umumnya yang dipakai adalah sample. Ada beberapa alasan mengapa penelitian dilakukan menggunakan sample :

1. Waktu yang diperlukan untuk mengumpulkan data lebih singkat.2. Biaya lebih murah.3. Data yang diperoleh justru lebih akurat.4. Dengan statistika inferensia dapat dilakukan generalisasi.

Cara Mengumpulkan Data

Untuk memperoleh data yang benar dan dapat dipertanggung jawabkan keabsahannya, data harus dikumpulkan dengan cara dan proses yang benar. Terdapat beberapa cara atau teknik untuk mengumpulkan data yaitu :1. Wawancara (interview) yaitu cara untuk mengumpulkan data dengan

mengadakan tatap muka secara langsung. Wawancara harus dilakukan dengan memakai suatu pedoman wawancara yang berisi daftar pertanyaan sesuai tujuan yang ingin dicapai. Ada dua jenis wawancara yaitu wawancara berstruktur (structured interview) dan wawancara takberstruktur (unstructured interview).

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

3

S (Populasi)Sample

,,

psx ,,

Page 4: Stat Pro Modul 1

Wawancara berstruktur adalah wawancara yang jenis dan urutan dari sejumlah pertanyaannya sudah disusun sebelumnya, sedangkan wawancara takberstruktur adalah wawancara yang tidak secara ketat ditentukan sebelumnya. Wawancara takberstruktur lebih fleksibel karena pertanyaannya dapat dikembangkan meskipun harus tetap pada pencapaian sasaran yang telah ditentukan.Ciri-ciri pertanyaan yang baik adalah :

a. Sesuai dengan masalah atau tujuan penelitian.b. Jelas dan tidak meragukan.c. Tidak menggiring pada jawaban tertentu.d. Sesuai dengan pengetahuan dan pengalaman orang yang

diwawancarai.e. Pertanyaan tidak boleh yang bersifat pribadi.

Kelebihan dari wawancara adalah data yang diperlukan langsung diperoleh sehingga lebih akurat dan dapat dipertanggung jawabkan.Kekurangannya adalah tidak dapat dilakukan dalam skala besar dan sulit memperoleh keterangan yang sifatnya pribadi.

2. Kuesioner (angket) adalah cara mengumpulkan data dengan mengirim atau menggunakan kuesioner yang berisi sejumlah pertanyaan.Kelebihannya adalah dapat dilakukan dalam skala besar, biayanya lebih murah dan dapat memperoleh jawaban yang sifatnya pribadi.Kelemahannya adalah jawaban bisa tidak akurat, bisa jadi tidak semua pertanyaan terjawab bahkan tidak semua lembar jawaban dikembalikan.

3. Observasi (pengamatan) adalah cara mengumpulkan data dengan mengamati obyek penelitian atau kejadian baik berupa manusia, benda mati maupun gejala alam. Data yang diperoleh adalah untuk mengetahui sikap dan perilaku manusia, benda mati atau gejala alam.Kebaikan dari observasi adalah data yang dieroleh lebih dapat dipercaya.Kelemahannya adalah bisa terjadi kesalahan interpretasi terhadap kejadian yang diamati.

4. Tes dan Skala Obyektif adalah cara mengumpulkan data dengan memberikan tes kepada obyek yang diteliti. Cara ini banyak dilakukan pada tes psikologi untuk mengukur karakteristik kepribadian seseorang. Beberapa contoh tes skala obyektif yaitu :

a. Tes kecerdasan dan bakat.b. Tes kepribadian.c. Tes sikap.d. Tes tentang nilai.e. Tes prestasi belajar, dsb.

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

4

Page 5: Stat Pro Modul 1

5. Metode proyektif adalah cara mengumpulkan data dengan mengamati atau menganalisis suatu obyek melalui ekspresi luar dari obyek tersebut dalam bentuk karya lukisan atau tulisan. Metode ini dipakai dalam psikologi untuk mengetahui sikap, emosi dan kepribadian seseorang. Kelemahan dari metode ini adalah obyek yang sama dapat disimpulkan berbeda oleh pengamat yang berbeda.

Skala Pengukuran

Salah satu aspek penting dalam memahami data untuk keperluan analisis terutama statistika inferensia adalah Skala Pengukuran. Secara umum terdapat 4 tingkat/jenis skala pengukuran yaitu :1. Skala nominal adalah skala yang hanya mempunyai ciri untuk

membedakan skala ukur yang satu dengan yang lain. Contoh skala nominal seperti tabel dibawah ini :

Jenis dan Jumlah buah-buahan yangDiproduksi suatu Daerah pada Tahun 1998

Jenis Buah-Buahan JumlahPepaya 2 tonMangga 1,5 tonApel 1 tonDuku 1,4 tonManggis 1,3 ton

Sumber: Data Buatan

2. Skala Ordinal adalah skala yang selain mempunyai ciri untuk membedakan juga mempunyai ciri untuk mengurutkan pada rentang tertentu. Contoh skala ordinal seperti tabel dibawah ini :

Penilaian Anggota Kelompok Belajar“ Bina Pintar “

Kategori Nilai BanyaknyaIstimewa 6 orangBaik 18 orangRata-rata 15 orangKurang 7 orangKurang sekali 0 orangSumber : Data Buatan

3. Skala Interval adalah skala yang mempunyai ciri untuk membedakan, mengurutkan dan mempunyai ciri jarak yang sama. Contoh, suhu tertinggi pada bulan Desember dikota A, B dan C berturut-turut adalah 28, 31 dan

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

5

Page 6: Stat Pro Modul 1

20 derajat Fahrenheit. Kita dapat membedakan dan mengurutkan besarnya suhu, sebab satu derajat Fahrenheit merupakan suatu besaran yang tetap, namun pada saat suhu menunjukkan nol derajat Fahrenheit tidak berarti tidak adanya panas pada kondisi tersebut. Hal ini dapat dijelaskan, misalnya kota A bersuhu 30 derajat Fahrenheit dan kota B bersuhu 60 derajat Fahrenheit, tidak dapat dikatakan bahwa suhu dikota B dua kali lebih panas dari pada suhu dikota A, karena suhu tidak mempunyai titik nol murni (tulen).

4. Skala ratio adalah skala yang mempunyai 4 ciri yaitu membedakan, mengurutkan, jarak yang sama dan mempunyai titik nol yang tulen (berarti). Contoh : Pak Asmuni mempunyai uang nol rupiah, artinya pak Asmuni tidak mempunyai uang.

PENYAJIAN DATA

Secara garis besar ada dua cara penyajian data yaitu dengan tabel dan grafik. Dua cara penyajian data ini saling berkaitan karena pada dasarnya sebelum dibuat grafik data tersebut berupa tabel. Penyajian data berupa grafik lebih komunikatif.

Dilihat dari waktu pengumpulannya, dikenal dua jenis data yaitu : Cross section data adalah data yang dikumpulkan pada suatu

waktu tertentu. Data berkala adalah data yang dikumpulkan dari waktu ke waktu.

Dengan data berkala dapat dibuat garis kecenderungan atau trend.

Penyajian data dengan tabel

Tabel atau daftar merupakan kumpulan angka yang disusun menurut kategori atau karakteristik data sehingga memudahkan untuk analisis data.

Ada tiga jenis tabel yaitu : Tabel satu arah atau satu komponen adalah tabel yang hanya

terdiri atas satu kategori atau karakteristik data. Tabel berikut ini adalah contoh tabel satu arah.

Banyaknya Pegawai Negeri SipilMenurut Golongan Tahun 1990

Golongan Banyaknya (orang)I 703.827II 1.917.920III 309.337IV 17.574

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

6

Page 7: Stat Pro Modul 1

Jumlah 2.948.658Sumber : BAKN, dlm Statistik Indonesia, 1986

Tabel dua arah atau dua komponen adalah tabel yang menunjukkan dua kategori atau dua karakteristik. Tabel berikut ini adalah contoh tabel dua arah.

Jumlah Mahasiswa UPH menurutFakultas dan Kewarganegaraan 1995

Fakultas WNI WNA JumlahFak. Ekonomi 1850 40 1890Fak. Teknologi Industri 1320 10 1330Fak. Seni Rupa & Design 530 5 535Fak. Pasca Sarjana 250 10 260

Jumlah 3950 65 4015Sumber : Data Buatan

Tabel tiga arah atau tiga komponen adalah tabel yang menunjukkan tiga kategori atau tiga karakteristik. Contoh tabel berikut ini.

Jumlah Pegawai Menurut Golongan,Umur dan Pendidikan pada Departeman A

Tahun 2000

GolonganUmur (tahun) Pendidikan

25 – 35 > 35Bukan

SarjanaSajana

I 400 500 900 0II 450 520 970 0III 1200 2750 1850 2100IV 0 250 0 250

Jumlah 2.050 4020 3720 2350Sumber : Data Buatan

Penyajian data dengan grafik/diagram

Penyajian data dengan grafik dianggap lebih komunikatif karena dalam waktu singkat dapat diketahui karakteristik dari data yang disajikan.

Terdapat beberapa jenis grafik yaitu : Grafik garis (line chart)

Grafik garis atau diagram garis dipakai untuk menggambarkan data berkala. Grafik garis dapat berupa grafik garis tunggal maupun grafik garis berganda.

Grafik batang / balok (bar chart)

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

7

Page 8: Stat Pro Modul 1

Grafik batang pada dasarnya sama fugsinya dengan grafik garis yaitu untuk menggambarkan data berkala. Grafik batang juga terdiri dari grafik batang tunggal dan grafik batang ganda.

Grafik lingkaran (pie chart)Grafik lingkaran lebih cocok untuk menyajikan data cross section, dimana data tersebut dapat dijadikan bentuk prosentase.

Grafik Gambar (pictogram)Grafik ini berupa gambar atau lambang untuk menunjukkan jumlah benda yang dilambangkan.

Grafik Berupa Peta (Cartogram).Cartogram adalah grafik yang banyak digunakan oleh BMG untuk menunjukkan peramalan cuaca dibeberapa daerah.

Contoh-contoh grafik :

Grafik Garis (pie chart)

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8

Data

Fre

kuen

si

DATA 1DATA 2

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

8

Page 9: Stat Pro Modul 1

Grafik Batang (Bar Chart)

0

5

10

15

20

25

30

1 2 3 4 5 6 7 8

Frekuensi

Dat

a

DATA 1 DATA 2

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

9

Page 10: Stat Pro Modul 1

PIE CHART

Statistik deskriptif lebih berkenaan dengan pengumpulan dan peringkasan data, serta penyajian hasil peringkasan tersebut. Data-data statistik, yang bisa diperoleh hasil sensus, survei, jajak pendapat atau pengamatan lainnya umumnya masih bersifat acak, “mentah” dan tidak terorganisir dengan baik (raw data). Data-data tersebut harus diringkas dengan baik dan teratur, baik dalam bentuk tabel atau presentasi grafis yang berguna sebagai dasar dalam proses pengambilan keputusan (statistik inferensi).

Penyajian tabel dan grafis yang digunakan dalam statistik deskriptif dapat berupa: Distribusi frekuensi Presentasi grafis seperti histogram, Pie chart dan sebagainya.

Selain tabel dan grafik, untuk mengetahui deskripsi data diperlukan ukuran yang lebih eksak, yang biasa disebut summary statistics (ringkasan statistik).

Dua ukuran penting yang sering dipakai dalam pengambilan keputusan adalah:

1. Mencari central tendency (kecenderungan memusat), seperti Mean, Median, dan Modus

2. mencari ukuran dispersion, seperti Standar Deviasi dan Varians

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

1

Page 11: Stat Pro Modul 1

Selain central tendency dan dispersion, ukuran lain yang dipakai adalah Skewness dan Kurtosis yang berfungsi untuk mengetahui kemiringan data (gradien data).

Kali ini akan dibahas menu dari SPSS yang berhubungan dengan statistik deskriptif, yaitu Summarize. Dalam menu ini terdapat beberapa submenu sebagai berikut:

A. FrequenciesMenu ini membahas beberapa penjabaran ukuran statistik deskriptif seperti Mean, Median, Kuartil, Persentil, Standar Deviasi dan lainnya.

B. DescriptivesMenu ini berfungsi untuk mengetahui skor-z dari suatu distribusi data dan menguji apakah data berdistribusi normal atau tidak.

C. ExploreMenu ini berfungsi untuk memeriksa lebih teliti sekelompok data. Alat utama yang dibahas adalah Box-Plot dan Steam & Leaf Plot, selain beberapa uji tambahan untuk menguji apakah data berasal dari distribusi normal.

D. CrosstabsMenu ini dugunakan untuk menyajaikan deskripsi data dalam bentuk tabel silang (crosstab), yang terdiri aatas baris dan kolom. Selain itu menu ini juga dilengkapi dengan analisis hubungan di antara baris dan kolom, seperti independensi diantara mereka, besar hubungannya dan lainnya.

E. Case SummariesMenu ini digunakan untuk melihat lebih jauh isis statistik deskriptif yang meliputi subgrup dari sebuah kasus, seperti grup “Pria” dan grup “Wanita”, bisa dibuat subgrup “Pria Dewasa” dan “Pria Remaja”, kemudian “Wanita Dewasa” dan “Wanita Remaja”, serta dibagi lagi menjadi yang tinggal di kota dan di desa, dan seterusnya.

Menu FrequenciesContoh penggunaan FrequenciesMisalkan kita memiliki data tentang tinggi badan 25 orang mahasiswa (dalam centimeter) yang diambil secara acak.

No

Tinggi Gender No Tinggi Gender

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

1

Page 12: Stat Pro Modul 1

1 170.2 Pria 14 170.4 Wanita2 172.5 Pria 15 168.9 Wanita3 180.3 Pria 16 168.9 Wanita4 172.5 Pria 17 177.5 Wanita5 159.6 Wanita 18 174.5 Pria6 168.5 Wanita 19 186.6 Wanita7 168.5 Pria 20 164.8 Wanita8 172.5 Pria 21 170.4 Pria9 174.5 Pria 22 168.9 Pria10 159.6 Wanita 23 164.8 Wanita11 170.4 Wanita 24 167.2 Wanita12 161.3 Wanita 25 167.2 Wanita13 172.5 Pria

Yang pertama kita lakukan adalah ada memasukan data terebut ke dalam editor SPSS. Pada bagian awal kita sudah mempelajari bagaimana membuat data baru dalam SPSS.Langkah-langkahnya adalah sebagai berikut.1. Mendefinisikan variabel.Ada banyak cara untuk mendefinisikan variabel,

diantaranya adalah sebagai berikut. Karena pada contoh kita ada dua variabel (Tinggi Badan & Gender),

maka kita akan definisikan 2 variabel tersebut tipenya seperti apa. Pada bagian bawah menu editor data, tekan tombol Variable View. Maka akan tampak tampilan berikut:

Kolom pertama merupakan tempat untuk mendefinisikan nama-nama variabel tersebut. Pada baris pertama-kolom pertama untuk mendefinisikan nama variabel ke-1, baris kedua-kolom pertama untuk

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

1

Page 13: Stat Pro Modul 1

mendefinisikan nama variabel ke-2. Kita ketikan “Tinggi” untuk variabel pertama dan “Gender” untuk variabel kedua.

Untuk deklarasi Type variabel kita gunakan “Numeric” untuk variabel Tinggi dan Gender. Nantinya untuk variabel Gender kita pilih angka “1” untuk menandai gender Pria dan “2” untuk menandai gender Wanita.

Untuk Width, biasanya standar SPSS untuk numeric adalah 8, kita biarkan saja angka 8 karena sudah mencukupi untuk keprluan kita.

Untuk Decimals, untuk variabel Tinggi, karena datanya mengandung 1 angka di belakang koma, kita pilih 1. Sedangkan untuk gender karena bilangan bulat kita pilih angka 0. Untuk itu kita perlu mengganti default yang ada pada editor yaitu 2 dengan angka 1 dan 0 tersebut.

Untuk sementara biarkan submenu-submenu yang lain seperti Values, Label, Missing dll. Seperti apa adanya. Tampilan akhir dapat dilihat seperti gambar berikut ini.

Selanjutnya kita akan memasukan data yang kita punya dengan terlebih dahulu menekan tombol Data View. Lalu ketiklah data yang ada, setelah itu simpan dengan nama Deskriptif1.

2. Bila Anda sudah memiliki data tersebut dalam format Word atau Excel, Anda bisa langsung meng-copy data tersebut dengan cara yang biasa Anda lakukan, yaitu “Copy-Paste”. Setelah mengcopy dari data asal, maka lalu letakan pointer di baris-1 kolom-1 SPSS kemudian klim menu Edit, dan pilih submenu Paste.

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

1

Page 14: Stat Pro Modul 1

3. Setelah data ada, lalu kita olah, yaitu ingin menampilkan deskripsi statistik dari data tersebut yaitu mengenai Mean, Standar Deviasi, Skewness, dll. Selain itu kita ingin pula menampilkan Chart dari data yang sesuai dengan sata kuantitatif, yaitu Histogram dan Bar Chart. Langkah-langkahnya sebagai berikut:

5. Dari baris menu, pilih menu Analyze, lalu pilih submenu Descriptive Statistics, lalu pilih lagi sumenu Frequencies (untuk menampilkan tabel frekuensi). Lalu akan tampil gambar berikut ini.

6. Kolom Variables(s) harus diisi dengan jenis-jenis variabel apa yang ingin kita analisis. Karena ingin dibuat frekuensi dari variabel Tinggi, maka klik variabel Tinggi, kemudia klik tanda , maka variabel Tinggi akan berpindah ke kolom Vraible(s).

7. Klik pilihan Statistics, maka akan tampil di layar gambar berikut:

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

1

Page 15: Stat Pro Modul 1

8. Pilihan Statistics meliputi berbagai ukuran untuk menggambarkan data, antara lain sebagai berikut:

PercentilesValues. Untuk keseragaman klik Quartiles dan Percentile(s). Kemudian pada kotak disamping kanan Percentiles ketik 10, lalu tekan Add. Sekali lagi ketik 90 pada kotak terdahulu, dan klik lagi tombol Add. Pengerjaan ini dimaksudkan untuk membuat nilai persentil pada 10 dan 90.

Dispersion atau penyebaran data. Untuk keseragaman, semua atau keenam jenis pengukuran Dispersion dipilih semua.

Central Tendency atau pengukuran pusat data, untuk keseragaman pilih Mean dan Median.

Distribution atau bentuk distribusi data. Untuk keseragaman, klik Skewness dan Kurtosis.

e. Pilihan Charts…juga diklik, maka akan tampil gambar berikut ini.

Menu Charts berkenaan dengan jenis grafik yang ingin kita pilih. Dari Chart Type, untuk keseragaman kita pilih Histogram. Lalu menu With normal curve-nya akan hidup, maka kita klik juga With normal curve. Lalu klik Continue.

Sekarang editor akan kembali ke tampilan editor Frequencies seperti awal, selanjutnya kita akan memilih menu Format.

f. Setelah menu Format diklik, maka akan tampil gambar berikut:

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

1

Page 16: Stat Pro Modul 1

Pada submenu Order by (data output akan disusun seperti apa ?) kita seragamkan saja dengan memilih output akan disusun naik (dari data terkecil ke data terbesar). Untuk itu pilih Ascending values. Selanjutnya klik OK. Maka semua proses pengisian dan pengolahan data telah selesai, dan kita akan lihat hasilnya (outputnya) pada editor Output.

4. Output SPSS dan AnalisisnyaSelanjutnya data yang telah kita olah tersebut akan kita lihat outputnya. Berikut ini adalah output dari Descriptive.

Frequencies

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

1

Page 17: Stat Pro Modul 1

Statistics

Tinggi25

0

170.1200

1.20655

170.2000

6.03276

36.394

.572

.464

1.460

.902

27.00

159.60

186.60

160.6200

167.2000

170.2000

172.5000

178.6200

Valid

Missing

N

Mean

Std. Error of Mean

Median

Std. Deviation

Variance

Skewness

Std. Error of Skewness

Kurtosis

Std. Error of Kurtosis

Range

Minimum

Maximum

10

25

50

75

90

Percentiles

Output Bagian Pertama (Statistics) N atau jumlah data yang valid adalah 25 buah, sedangkan data

yang hilang (missing) adalah nol. Ini artinya semua data bisa diproses

Mean atau rata-rata tinggi badan adalah 170,12 cm dengan standar error adalah 1,20655 cm. Penggunaan standar error of Mean adalah untuk memeriksa besar rata-rata populasi yang diperkirakan dari sampel. Untuk itu, dengan standar error of Mean tertentu dan pada tingkat kepercayaan 95% (SPSS sebagian besar menggunakan angka ini sebagai stanadar), rata-rata populasi tinggi badan menjadi:Rata-rata Populasi = Rata-rata ± 2 standar error of Mean

= 170,12 ± (2 x 1,20655) cm= (170, 12 + 2.4131) sampai (170, 12 - 2.4131)= 172,5331cm sampai 167, 7069 cm

(Angka 2 digunakan karena tingkat kepercayaan 95%) Median atau titik tengah data jika semua data diurutkan dan dibagi

2 sama besar. Angka median 170,20 cm menunjukkan bahwa 50% tinggi badan adalah 170,20 cm ke atas, dan 50%-nya 170,20 cm ke bawah.

Standar Deviasi adalah 6,03276 cm dan variansinya adalah 36,394 cm. Penggunaan standar deviasi adalah untuk menilai dispersi rata-rata dari sampel. Untuk itu, dengan standar deviasi tertentu dan pada tingkat kepercayaan 95%, rata-rata tinggi badan menjadi:

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

1

Page 18: Stat Pro Modul 1

Rata-rata tingi badan = Rata-rata ± 2 x Standar Deviasi = 170,12 ± (2 x 6,03276) cm = 182.18552 cm sampai 170,12 cm

Perhatikan bahwa kedua batas angka berbeda tipis dengan nilai minimum dan maksimum, ini artinya sebaran data adalah baik.

Ukuran Skewnes adalah 0,572 cm. Untuk penilaian, nilai tersebut diubah ke angka rasio. Rasio kurtosis adalah = nilai kurtosis/standar error kurtosis = 0,572/0,902 = 0,63. Sebagai pedoman, bila rasio kurtosis berada antara -2 sampai dengan +2, maka distribusi data adalah normal.

Ukuran kurtosis adalah 1,460 cm Data minimum adalah 159,60 cm sedangkan data maksimum

adalah 186,60 cm Range data = Data maksimum – Data minimum adalah 27,00 cm Angka Persentil:

o Rata-rata tinggi badan 10% responden di bawah 160,62 cmo Rata-rata tinggi badan 25% responden di bawah 167,20 cmo Rata-rata tinggi badan 50% responden di bawah 170,20 cmo Rata-rata tinggi badan 75% responden di bawah 172,50 cmo Rata-rata tinggi badan 90% responden di bawah 178,62 cm

Tinggi

2 8.0 8.0 8.0

1 4.0 4.0 12.0

2 8.0 8.0 20.0

2 8.0 8.0 28.0

2 8.0 8.0 36.0

3 12.0 12.0 48.0

1 4.0 4.0 52.0

3 12.0 12.0 64.0

4 16.0 16.0 80.0

2 8.0 8.0 88.0

1 4.0 4.0 92.0

1 4.0 4.0 96.0

1 4.0 4.0 100.0

25 100.0 100.0

159.60

161.30

164.80

167.20

168.50

168.90

170.20

170.40

172.50

174.50

177.50

180.30

186.60

Total

ValidFrequency Percent Valid Percent

CumulativePercent

Output bagian kedua (Tinggi)Output ini merupakan gambaran tinggi badan responden dalam tabel frekuensi.

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

1

Page 19: Stat Pro Modul 1

190.00180.00170.00160.00150.00

Tinggi

10

8

6

4

2

0

Freq

uen

cy

Mean = 170.12Std. Dev. = 6.03276N = 25

Histogram

Output bagian ketiga (Histogram)Terlihat grafik data berbentuk seperti lonceng, ini artinya distribusi data adalah normal atau mendekati normal (pengujian secara statistik akan dibahas nanti)

Tabel Frekuensi untuk GenderKarena variabel gender bukan data kuantitatif namun kategori, maka tidak perlu dilakukan dskripsi statistik seperti Mean, Median, Standar Deviasi dan sebagaianya. Untuk data kualitatif chart yang sesuai adalah pie chart.

Langkah-langkah membuat Pie Chart Buka kembali lembar kerja Deskriptif1.sav Dari baris menu, pilih menu Analyze, lalu pilih submenu

Descriptive Statistics, lalu pilih lagi sumenu Frequencies (untuk menampilkan tabel frekuensi). Lalu akan tampil gambar berikut ini.

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

1

Page 20: Stat Pro Modul 1

Kolom Variables(s) harus diisi dengan jenis-jenis variabel apa yang ingin kita analisis. Karena ingin dibuat frekuensi dari variabel Gender, maka klik variabel Gender, kemudia klik tanda , maka variabel Gender akan berpindah ke kolom Vraible(s).

Pilihan Charts…juga diklik, maka akan tampil gambar berikut ini.

Menu Charts berkenaan dengan jenis grafik yang ingin kita pilih. Dari Chart Type, untuk keseragaman kita pilih Pie Chart. Lalu klik Continue

Setelah itu menu Format diklik, maka akan tampil gambar berikut:

Pada submenu Order by (data output akan disusun seperti apa ?) kita seragamkan saja dengan memilih output akan disusun naik (dari data terkecil ke data terbesar). Untuk itu pilih Ascending values. Selanjutnya klik OK. Maka semua proses pengisian dan pengolahan data telah selesai, dan kita akan lihat hasilnya (outputnya) pada editor Output.

Output Gender

Statistics

Gender25

0

Valid

Missing

N

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

2

Page 21: Stat Pro Modul 1

Gender

Frequency Percent Valid PercentCumulative

PercentValid 1 11 44.0 44.0 44.0

2 14 56.0 56.0 100.0Total 25 100.0 100.0

2

1

Gender

Penggunaan Menu DescriptiveLangkah-langkah penggunaan menu Desciptive: Buka kembali file Deskriptif1.sav Dari baris menu, pilih menu Analyze, lalu pilih submenu Descriptive

Statistics, lalu pilih lagi sumenu Descriptives (untuk menampilkan tabel frekuensi). Lalu akan tampil gambar berikut ini.

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

2

Page 22: Stat Pro Modul 1

Kolom Variables(s) harus diisi dengan jenis-jenis variabel apa yang ingin kita analisis. Karena ingin dibuat frekuensi dari variabel Tinggi, maka klik variabel Tinggi, kemudia klik tanda , maka variabel Tinggi akan berpindah ke kolom Vraible(s).

Klik Options, maka akan tampak di layar

Pilihan Options meliputi berbagai ukuran untuk menggambarkan data. Terlihat default dari SPSS yang memilih Mean, Standar deviasi, maksimum, minimum sebagai acuan untuk menghitung statistik deskriptif, untuk keseragaman biarkan pilihan tersebut. Kemudian klik Continue.

Maka akan terlihat kotak pilihan Save standardized values as variables yang telah diberi tanda akan digunakan pilihan tersebut. Hal ini berarti pilihan output SPSS mengenai deskripsi data. Lalu klik OK.

Maka outputnya sebagai berikut:

Descriptive Statistics

N Minimum Maximum Mean Std. DeviationTinggi 25 159.60 186.60 170.1200 6.03276Valid N (listwise)

25

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

2

Page 23: Stat Pro Modul 1

Jika dilihat pada Editor data SPSS selain variabel tinggi dan gender sekarang muncul variabel baru, yaitu zTinggi seperti berikut

Analisisnya Output bagian Pertama

Bagian ini membahas deskripsi statistik dari variabel tinggi yang meliputi Mean dan yang lainnya.

Output bagian KeduaBagian ini membahas penerapan z-score atau Standard Score. Dalam output SPSS, nilai z bisa dipakai untuk secara cepat melihat nilai mana yang menyimpang cukup jauh dari rata-ratanya (outlier)Jika suatu data berdistribusi normal, suatu nilai bisa distandardisasi dengan nilai z, yaitu:

Dimana: xi = nilai data kei; = Mean data dan s=Standar DeviasiSebagai contoh, lihat pada data pertama yaitu tinggi 170,20 cm, nilai z-nya dihitung dengan rumus adalah sbb:

= 0,013 (sama dengan output SPSS)

Data yang lain pun sama prinsipnya.

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

2

Page 24: Stat Pro Modul 1

Melihat Data yang menyimpang (outlier)Jika data berdistribusi normal dan tingkat kepercayaan 95%, maka tingkat signifikansi adalah 100% - 95% = 5%. Jika memakai uji dua sisi (ada tanda + dan - ), maka batas kritis ada pada 5% dibadi dua atau 2,5%. Pada tabel-z perhitungan pada satu sisi atau 50%, maka batas kritis ada pada luas kurva (50% - 2,5%) atau 47,5%.Pada tabel-z, luas kurva untuk 47,5% didapat nilai kritis 1,96.Dari nilai variabel zTinggi terlihat hanya ada satu data yang termasuk outlier, yaitu 186.60 cm nilai zTinggi yang di luar 1,96, yaitu zTingginya 2.73175.Karena dari 25 data hanya ada 1 data yang outlier, maka dapat dikatakan distrubusi mendekati normal.

Analisis Crosstab (Tabel Silang)Sebagaimana pernah dibahas di kelas bahwa salah satu analisis data kualitatif yang berskala nominal (kategori) adalah dengan Crosstab.

Analisis Crosstab untuk Uji Ketergantungan (Test of Independence)

Contoh Kasusnya:Manajer perusahaan yang memproduksi kopi susu dalam kemasan sachet merek deCaFe ingin mengetahui bagaimana sikap konsumen terhadap produk perusahaan, serta bagaimana profil mereka.Untuk itu 25 orang konsumen yang pernah mencicipi produk deCaFe diminta mengisi identitas dan sikap mereka terhadap produk deCaFe.

Berikut ini hasilnya:

No

Pekerjaan Pendidikan Gender

1 Karyawan Akademi Pria2 Petani Sarjana Pria3 wiraswasta Sma Wanita4 Petani Sma Wanita5 wiraswasta Akademi Wanita6 Karyawan Sarjana Pria7 wiraswasta Sma Wanita8 wiraswasta Sma Pria9 Petani Akademi Wanita

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

2

Page 25: Stat Pro Modul 1

10 Petani Akademi Wanita11 Karyawan Sarjana Pria12 Karyawan Sarjana Pria13 Petani Sma Wanita14 wiraswasta Sarjana Pria15 wiraswasta Akademi Wanita16 Karyawan Sarjana Pria17 Petani Sma Wanita18 Karyawan Akademi Pria19 Karyawan Sma Wanita20 Petani Akademi Pria21 wiraswasta Sarjana Wanita22 Petani Sarjana Wanita23 Petani Sarjana Pria24 Karyawan Sma Pria25 Karyawan Sma Pria

Baris pertama, menunjukkan konsumen pertama mempunyai pekerjaan karyawan dan ia seorang pria yang berpendidikan akademi. Demikian seterusnya.Dalam SPSS otomatis no urut konsumen sudah ada, sehingga ada 3 variabel saja.

Langkah penyelesaian: Buka lembar kerja baru Masukkan data seperti ketika Anda memasukan data Deskriptif1.sav.

Jangan lupa definsikan variabelnya. Karena semuanya data kategori pilih Decimalsnya = 0.

Untuk variabel pekerjaan, tipenya numerik, dimana: 1 = karyawan, 2= wiraswasta dan 3= petani.

Untuk variabel pendidikan, tipenya numerik dengan; 1 = Sma, 2= akademi, dan 3=sarjana

Variabel gender seperti sebelumnya, 1=Pria dan 2 = Wanita. Setelah data diketikan lalu simpan data tersebut dengan nama file

Crosstab1.sav pada drive D, dari baris menu, pilih menu Analyze, lalu pilih submenu Descriptive Statistics, lalu pilih lagi sumenu Crosstab. Lalu akan tampil gambar berikut ini.

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

2

Page 26: Stat Pro Modul 1

Row(s) atau variabel yang akan ditempatkan pada baris (row) –untuk keseragaman, kita pilih Gender

Column(s) atau variabel yang akan ditempatkan pada Kolom) –untuk keseragaman, kita pilih Pekerjaan

Klik pilihan Statistics…, akan tampak dilayar gambar berikut.

Karena kita akan melihat hubungan antara dua variabel, untuk keseragaman pilih Chi-Square. Pilihan yang lainnya akan digunakan pada kasus yang relevan di bagian lain. Lalu Klik Continue

Kemudian Klik pilihan Cells…, akan tampak di layar

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

2

Page 27: Stat Pro Modul 1

Pilihan Count untuk menampilkan hitungan Chi-square, apakah perlu disertakan nilai Expected (nilai yang diharapkan) selain nilai observed. Untuk keseragaman klik hanya Observed

Pilihan Percentage untuk menampilkan perhitungan angka pada baris dan kolom dalam persen. Untuk kasus ini biarkan saja kolom tersebut (tidak ada yang dipilih). Lalu klik Continue,

Klik pilihan Format…, akan tampak editor berikut

Row Order atau penempatan nama variabel dalam baris, apakah naik atau turun. Pilih Ascending. Klik Continue.

Pilihan Displayclustered bar charts dan Suppers tables biarkan kosong.

Perhatikan variabel Pendidikan tidak dimasukkan, karena dalam proses ini kita hanya memasukkan dua saja, tidak mesti semua, nanti kita akan gunakan variabel pendidikan pada kasus yang lain.

Klik OK, maka akan tampak output berikut.

Output Crosstab

Case Processing Summary

Cases

Valid Missing Total

N Percent N Percent N Percentgender * Pekerjaan 25 100.0% 0 .0% 25 100.0%

Analisis Output Bagian Pertama (Case Processing Summary)Ada 25 data yang semuanya diproses (tidak ada data missing), sehingga tingkat validitasnya 100%.

gender * kerja Crosstabulation

Count

kerja

Total1 2 3

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

2

Page 28: Stat Pro Modul 1

gender 1 8 2 3 132 1 5 6 12

Total 9 7 9 25

Analisis Output Bagian Kedua (Crosstab antara Gender dengan Pekerjaan)Terlihat tabel silang yang memuat hubungan diantara kedua variabel. Misalnya, pada baris-1 kolom-1, terdapat angka 8. Hal ini berarti ada 8 orang pria (variabel gender) yang mempunyai pekerjaan karyawan (varaibel Pekerjaan). Demikian pula untuk data yanag lainnya.

Chi-Square Tests

Value dfAsymp. Sig. (2-sided)

Pearson Chi-Square 7.702(a) 2 .021Likelihood Ratio 8.505 2 .014Linear-by-Linear Association

5.342 1 .021

N of Valid Cases25

a 6 cells (100.0%) have expected count less than 5. The minimum expected count is 3.36.

Analisis Output bagian Ketiga (Uji Chi-square)Uji Chi-square untuk mengamati ada tidaknya hubungan antara dua variabel (baris dan kolom). Di dalam SPSS, selain alat uji Chi-Square juga dilengkapi dengan beberapa alat uji yang sama tujuannya.

HipotesisHipotesis untuk kasus ini:

Ho: Tidak ada hubungan antara baris dan kolom, atau antara pekerjaan konsumen dengan gender konsumen tersebut.

Hi : Ada hubungan antara baris dan kolom, atau antara pekerjaan konsumen dengan gender konsumen tersebut

Pengambilan KeputusanDasar pengambilan keputusan, yaitu: Berdasarkan perbandingan Chi-Quare Uji dan angka dari Tabel Jika Chi-square Hitung < Chi-square Tabel, Maka Ho diterima Jika Chi-square Hitung > Chi-square Tabel, Maka Ho ditolak

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

2

Page 29: Stat Pro Modul 1

Chi-square Hitung dapat dilihat pada output bagian ketiga yaitu 7.702. Sedangkan Chi-square Tabel, dapat dilihat pada Tabel Uji-Statistik untuk Chi-square. Dalam hal ini untuk tingkat signifikansi () = 5% dan derajat kebebasan (dF) = 2 adalah 5,9915.Karena Chi-square Hitung (7.702) > Chi-square Tabel (5,9915), Maka Ho ditolak Dengan demikian dipsimpulkan bahwa ada hubungan antara baris dan kolom, atau antara pekerjaan konsumen dengan gender konsumen tersebut.

Kita juga bisa menguji hipotesis dengan membandingkan nilai Probabilitas yang nilainya dapat dilihat pada bagian Asymp. Sig. (2-sided), yang dalam kasus ini sebesar 0.021. Jika nilai Probabilitas > 0,05 maka Ho diterima. Tetapi bila nilai Probabilitas < 0,05 maka Ho ditolak. Dalam kasus ini 0.021 < 0,05 artinya Ho ditolak, atau ada hubungan antara baris dan kolom, atau antara pekerjaan konsumen dengan gender konsumen tersebut.

Dari kedua analisis tersebut bisa diambil kesimpulan yang sama, yaitu Ho ditolak atau ada hubungan antara pekerjaan seorang konsumen dengan gender konsumen tersebut. Dengan kiata lain dapat saja dikatakan bahwa kebanyakan pria berprofesi karyawan sedangkan kebanyakan wanita tidak banyak yang berprofesi karyawan, mungkin banyaknya wiraswasta.

Pada kasus dimana, Ho ditolak atau disimpulkan bahwa ada hubungan antara pekerjaan seorang konsumen dengan gender konsumen tersebut, maka dapat ditanyakan pula seberapa besar atau seberapa kuat hubungan tersebut ? Hal ini akan kita bahas pada contoh lain.

Sekarang, tugas Anda adalah berlatih untuk mencari hubungan antara variabel Pekerjaan dengan Tingkat Pendidikan, Jika sudah memasukkan datanya dalam program SPSS simpan pada drive D dengan nama Crosstab2.sav dan outputnya dengan Crosstab2out. Buatlah analisis Anda dalam file word lalu simpan pula pada drive D.

Menguji Keeratan Hubungan Dua Variabel Berskala NominalJika tadi kita contohkan bahwa berdasarkan analisis Crosstab ditemukan terdapat hubungan antara dua variabel berskala nominal, yaitu antara gender dengan pekerjaan. Sekarang kita akan cari tahu seberapa besar keeratan hubungan tersebut.

SPSS menyediakan dua cara untuk mengukur hubungan tersebut, yaitu:

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

2

Page 30: Stat Pro Modul 1

1. Symetric Measures, yaitu hubungan yang setara dan berdasarkan perhitungan Chi-square

2. Directional Measures, yaitu hubungan yang tidak setara dan berdasarkan pada proportional Reduction In Error (PRE)

Kedua cara perhitungan di atas dapat digunakan pada kasus hubungan antara Pekerjaan dengan Gender.

Langkah-langkahnya:1. Buka lagi lembar kerja Crosstab1.sav 2. Darri baris menu, pilih menu Analyze, lalu pilih submenu Descriptive

Statistics, lalu pilih lagi sumenu Crosstab. Lalu akan tampil gambar seperti sebelumnya.

a. Pada menu Row(s) atau variabel yang akan ditempatkan pada baris (row) –untuk keseragaman, kita pilih Gender

b. Column(s) atau variabel yang akan ditempatkan pada Kolom) –untuk keseragaman, kita pilih Pekerjaan

3. Klik pilihan Statistics…, akan tampak dilayar gambar berikut.Karena sudah tahu bahwa antara kedua variabel tersebut terdapat hubungan, maka sekarang tidak perlu lagi Chi-square, oleh karena itu sekarang Chi-square-nya jangan dicentak (tidak diklik). Kalau diklik, hasilnya akan seperti terdahulu.

4. Klik pilihan Correlations untuk mengetahui koefisien korelasi kedua variabel dengan cara Symetric Measures.

5. Pada kolol Nominal (yang berarti khusus untuk data yang berskala Nomonal), klik semua pilihan yaitu Contingency Coefficient, Phi and Cramer’s V, lambda dan Uncertainty coefficient. Pilihaan ini untuk mengetahui koefisien korelasi dengan cara Directional Measures. Lalu klik Continue. Kemudian Klik pilihan Cells…, akan tampak di layar gambar sebelah kanan.

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

3

Page 31: Stat Pro Modul 1

6. Untuk pilihan Count, ntuk keseragaman klik hanya Observed

7. Pilihan Percentage untuk kasus ini biarkan saja kolom tersebut (tidak ada yang dipilih). Demikian pula kolom Residuals biarkan kosong. Lalu klik Continue.

8. Klik pilihan Format. Row Order atau penempatan nama variabel dalam baris, apakah naik atau turun. Pilih Ascending. Klik Continue.

9. Pilihan Displayclustered bar charts dan Suppers tables biarkan kosong.

10.Selanjutnya Tekan OK untuk mendapatkan outputnya.

Output bagian Pertama

Case Processing Summary

Cases

Valid Missing Total

N Percent N Percent N Percentgender * kerja 25 100.0% 0 .0% 25 100.0%

Ada 25 data yang semuanya diproses (tidak ada data missing), sehingga tingkat validitasnya 100%.

Output bagian Kedua

gender * kerja Crosstabulation

Count kerja Total

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

3

Page 32: Stat Pro Modul 1

1 2 3gender 1 8 2 3 13

2 1 5 6 12Total 9 7 9 25

Tabel yang menggambarkan hubungan antara variabel, misalnya pada baris-2 kolom-1 ada angka 1, artinya ada 1 orang konsumen wanita bekerka sebagai karyawan.

Output bagian Ketiga (Symmetric Measures)

Symmetric Measures

Value

Asymp. Std.

Error(a)Approx.

T(b) Approx. Sig.Nominal by Nominal

Phi .555 .021Cramer's V .555 .021Contingency Coefficient .485 .021

Interval by Interval Pearson's R .472 .167 2.566 .017(c)Ordinal by Ordinal Spearman Correlation .472 .173 2.566 .017(c)N of Valid Cases 25

a Not assuming the null hypothesis.b Using the asymptotic standard error assuming the null hypothesis.c Based on normal approximation.Disi

Di sini hanya diperhatikan besar korelasi antara Nominal-Nominal. Hal ini karena kedua variabel berskala nominal, karena itu besaran Pearson dan Spearman tidak relevan untuk dibahas.Ada 3 besaran untuk menghitung korelasi antara variabel pekerjaan dengan gender, dan ketiganya mempunyai angka signifikan atau nilai Probabilitas 0,021. Karena nilai Probabilitas di bawah 5%, maka bisa dikatakan ada hubungan antara kedua variabel tersebut (seperti telah terbukti sebelumnya).Besaran korelasi (Phi dan Cramer) menghasilkan angka sama yaitu 0,555. Sedangkan koefisien kontingensi menghasilkan angka 0,485 (lebih kecil). Dari ketiga besaran itu bisa disimpulkan adanya hubungan yang cukup erat antara (disebut erat jika mendekati angka 1 dan tidak ada hubungan bila mendekati angka 0) antara variabel pekerjaan dengan variabel jender.

Output bagian Keempat (Directional Measures)

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

3

Page 33: Stat Pro Modul 1

Directional Measures

.393 .163 2.003 .045

.500 .236 1.572 .116

.313 .137 2.041 .041

.308 .165 .025c

.160 .095 .021c

.191 .114 1.673 .014d

.246 .147 1.673 .014d

.156 .093 1.673 .014d

Symmetric

gender Dependent

kerja Dependent

gender Dependent

kerja Dependent

Symmetric

gender Dependent

kerja Dependent

Lambda

Goodman andKruskal tau

Uncertainty Coefficient

Nominal byNominal

ValueAsymp.

Std. Errora

Approx. Tb

Approx. Sig.

Not assuming the null hypothesis.a.

Using the asymptotic standard error assuming the null hypothesis.b.

Based on chi-square approximationc.

Likelihood ratio chi-square probability.d.

Disini juga ada 3 ukuran untuk mengukur hubungan antara kedua variabel tersebut. Namun di sini ada pembedaan, yaitu satu variabel sebagai dependen sedangkan yang lainnya sebagai variabel independen.

Untuk lebih jelasnya lihat besaran pada korelasi lambda. Symmetric atau kedua variabel setara (bebas), maka besar korelasinya

adalah 0,393 atau cukup lemah (kurang dari 0,50). Angka signifikansinya adalah 0,045 atau di bawah 0,05 yang berarti kedua variabel memang berhubungan secara nyata.

Jika ada perkataan Dependent, dipakai pedoman (berlaku untuk ketiga alat uji) berikut: Jika angka korelasi 0, maka pengetahuan akan variabel independen

tidak menolong dalam usaha memprediksi variabel dependen Jika angka korelasi = 1, maka pengetahuan akan variabel independen

menolong dalam usaha memprediksi variabel dependen Contoh analisis pada Lambda

Gender Konsumen Dependen atau Gender sebagai variabel dependen (tergantung), dimana Pekerjaan adalah variabel independennya. Karena angka signifikansi 0,116 lebih besar daripada 0,05 (5%), maka variabel Independen/bebas yaitu Pekerjaan tidak dapat memprediksi variabel dependen yaitu Gender.

Pekerjaan Konsumen Dependen atau Pekerjaan sebagai variabel dependen (tergantung), dimana gender adalah variabel independennya. Karena angka signifikansi 0,041 lebih besar daripada 0,05 (5%), maka variabel Independen/bebas yaitu Pekerjaan dapat memprediksi variabel dependen yaitu Gender. Tetapi Angka Korelasi lambdanya 0,313 < 0,50 ini artinya korelasinya lemah. Bisa dikatakan bahwa pengetahuan akan gender seorang konsumen tidak begitu

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

3

Page 34: Stat Pro Modul 1

menolong dalam mupaya memprediksi pekerjaan konsumen tersebut. Atau pekerjaan konseumen sebagai karyawan atau petani atau wiraswasta tidak bisa diperkirakan begitu saja karena ia seoraang pria atau wanita.

Analisis pada Korelasi Goodman dan Kruskal TauDari angka signifikansi keduanya adalah signifikan (berbeda dengan Lambda), namun besar korelasinya juga tidak kuat. Atau variabel gender tidak bisa memprediksi secara kuat variabel Pekerjaan seorang konsumen, demikian pula sebaliknya.

Analisis pada Korelasi Uncertainty CoefficientDari angka signifikansi ketiganya adalah signifikan, namun besar korelasinya juga tidak kuat. Atau variabel gender tidak bisa memprediksi secara kuat variabel Pekerjaan seorang konsumen, demikian pula sebaliknya.

Analisis pada Korelasi Asymptotic Standard ErrorDi sini syaratnya harus didapatkan korelasi yang signifikan. Sebagai contoh angka korelasi lambda sebesarr 0,313 yang signifikan, didapat standar error 0,137.Pada tingkat kepercayaan 95% atau ada dua standar deviasi, maka rentang korelasi adalah: 0,313 ± (2 x 0,137) atau antara 0,039 sampai 0,587

STATISTIK SAMPEL

Sampel adalah realitas yang teramati dari Populasi. Seperti halnya

Populasi, sampel memiliki ukuran-ukuran (statistik) sebagai berikut.

Mean Sampel:

Andaikan X1, X

2, ......, X

n adalah sampel acak yang

independent dan berdistribusi identik X. Statistik

adalah mean sampel dan diberi notasi .

Median Sampel:

Andaikan X1, X

2, ......, X

n adalah sampel acak yang disusun

urut (dari kecil ke besar). Median sampel, , adalah

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

3

Page 35: Stat Pro Modul 1

Varian dan Standar Deviasi Sampel:

Andaikan X1, X

2, ......, X

n adalah sampel acak yang

independent dan berdistribusi identik X. Statistik berikut

disebut Varian Sampel, S2,

dan disebut standar deviasi sampel.

Rumus hitung untuk varian sampel adalah sebagai berikut:

Range Sampel:

Selisih antara nilai sampel terbesar dengan yang terkecil.

Mata Kuliah : Statistika & Probabilitas Modul 1Dosen : Supriyoko Pramono, S.Kom, MM

3

Page 36: Stat Pro Modul 1

ESTIMASI

Usaha memperkirakan nilai parameter statistik suatu

populasi berdasarkan pengamatan terhadap sampelnya.

ESTIMASI TITIK

Pada setiap persoalan perkiraan, paling tidak terdapat satu parameter,

yang harus diperkirakan nilainya

Perkiraan dilaksanakan menggunakan cara-cara statistik yang sesuai.

Satistik yang dipergunakan untuk mengestimasi parameter populasi

disebut Estimator Titik (Point Estimator) dengan notasi . Nilai numerik yang

dimiliki oleh estimator bila diterapkan pada suatu sampel disebut nilai

estimasi untuk

Suatu estimator disebut baik apabila:

tidak bias terhadap memiliki varian yang kecil bila ukuran sampel besar.

Sebuah estimator, , disebut tidak bias terhadap parameter bila dan

hanya bila E[ ]=θ.

Andaikan X1, X

2, ......, X

n adalah sampel acak yang independent dan

berdistribusi identik X dengan mean . Mean Sampel, adalah estimator

tak bias bagi .

Andaikan adalah mean sampel yang diperoleh dari sampel acak

berukuran n dari distribusi X dengan mean dan varian 2. Maka

Andaikan S2 adalah varian sampel yang diperoleh dari sampel acak

berukuran n dari distribusi X dengan mean dan varian 2. Maka

S2adalah estimator tak bias bagi 2.

ESTIMATOR CARA MOMENT

Seringkali moment pertama (mean) dan moment kedua (varian) dapat

dipergunakan sebagai estimator karena rumusannya terkait dengan

parameter populasi.

ST2 36/59

Page 37: Stat Pro Modul 1

Contoh:

Rimbawan ingin meneliti pengaruh hujan terhadap pertumbuhan benih pohon pinus. Ditanamnya 5 deret dengan 20 batang pada setiap deretan. Setelah setahun dilakukan pengamatan terhadap jumlah yang hidup pada setiap deret.

Berapakah peluang hidup benih pinus tersebut?Persoalan ini dapat digambarkan sebagai berikut:

1. Setiap deret dipandang sebagai satu sampel. Jadi diperoleh ukuran sampel m = 5.

2. Variabel random yang jadi perhatian ialah jumlah benih pinus yang hidup pada setiap deret. Dinyatakan dengan X.

3. X pada setiap sampel (deret) mempunyai distribusi binomial dengan ukuran n = 20 dan peluang p (yang belum diketahui).

4. Harapan bagi nilai X dari setiap deret adalah

E[X] = np = 20p

Berapakah nilai E[X]?

Karena telah diketahui bahwa moment pertama X adalah estimator tak bias bagi E[X] maka

Jadi estimator bagi p dapat diperoleh sebagai

Setelah dilakukan percobaan, hasilnya sebagai berikut:x

1 = 18 x

2 = 17 x

3 = 15 x

4 = 19 x

5 = 20

maka

ESTIMATOR MAXIMUM LIKELIHOOD (PALING MUNGKIN)

Dasar kerjanya ialah memilih nilai yang akan menghasilkan

peluang terbesar (paling mungkin) bagi diperolehnya hasil

pengamatan seperti yang telah diperoleh dari sampel berukuran n.

Contoh:

ST2 37/59

Page 38: Stat Pro Modul 1

Sejumlah contoh air telah diambil dari K. Surabaya yang diduga telah tercemari oleh buangan domestik. Sebagai indikator pengamatan adalah jumlah bakteri koli per ml, dinyatakan sebagai variabel random X. Karena jumlah bakteri koli sangat sedikit maka dipergunakan distribusi Poisson bagi variabel random X.

Berapakah nilai k dari distribusi Poisson yang memberi peluang terbesar diperoleh nilai seperti yang ditunjukkan oleh contoh-contoh air tersebut?

Karena contohnya random (acak) maka berarti pula bahwa masing-masing contoh tak saling terikat, sehingga

Density bagi X ialah Oleh karenanya peluang diperoleh nilai seperti sample adalah

yang merupakan fungsi dari k. Secara khusus fungsi tersebut diberi notasi L(k) dan disebut fungsi "maximum likelihood".

Nilai k berapakah yang akan mengasilkan L(k) maksimum?

Dengan meminjam cara calculus untuk mencari titik maksimum, akan diperoleh

dan

ST2 38/59

Page 39: Stat Pro Modul 1

Misal diperoleh hasil pengamatan:

x1 = 12 x

2 = 15 x

3 = 16 x

4 = 17

Maka .

Contoh:

Andaikan x1, x

2, x

3, ........, x

n adalah variabel random dari distribusi

normal dengan meandan varian2. Densiti untuk X ialah

Fungsi Likelihood untuk sampel adalah

Logaritma dari fungsi likelihood tersebut ialah:

Fungsi ini kemudian dimaksimumkan terhadap nilai dan. Dengan meminjam cara calculus maka diperoleh estimator dan menurut pendekatan maximum likelihood sebagai

FUNGSI VARIABEL RANDOMAndaikan X

1 dan X

2 adalah variabel random yang tak saling

terikat dan andaikan . Maka

DISTRIBUSI Andaikan X

1, X

2, X

3, ....., X

n adalah n buah sampel acak dari suatu

distribusi normal dengam mean dan varian . Maka berdistribusi

ST2 39/59

Page 40: Stat Pro Modul 1

normal dengan mean dan varian .

ESTIMASI INTERVAL (SELANG KEYAKINAN) Estimasi titik hanya menghasilkan satu nilai untuk setiap parameter .

Estimasi titik tak dapat memberi gambaran seberapa dekat nilai tersebut dengan nilai sesungguhnya.

Estimasi interval (selang keyakinan) dapat memberi batasan atas-bawah terhadap nilai parameter yang dicari berdasarkan tingkat makna (significance level) yang dipercayai/dipilih.

Tingkat makna (significance level),ialah harga batas probabiliti dimana kejadian (event) dengan probabiliti dibawah harga tersebut dianggap jarang atau bukan kebiasaan dari variasi suatu populasi.

Suatu 100(1-)% selang keyakinan (confidence interval) dari nilai parameter adalah interval random [L

1, L

2] yang memenuhi

P[L1< < L

2] = 1 -

Berapapun nilai . adalah nilai probabiliti kritis atau tingkat makna

(significance level). Andaikan adalah n buah sampel acak dari suatu distribusi

normal dengan mean dan varian . Selang keyakinan 100(1- )% bagi ialah

Contoh:

Leukemia myeloblastik akut adalah jenis kanker yang paling mematikan. Pengalaman menunjukan bahwa masa hidup pasien setelah positip ter-identifikasi berdistribusi normal dengan mean 13 bulan dan standar deviasi 3 bulan. Suatu pengobatan baru diusahakan dapat memperpanjang masa hidup rata-rata tanpa mempengaruhi standar deviasi distribusi.

Andaikan X1, X

2, X

3, ....., X

n menunjukkan sampel random pasien

dengan pengobatan baru. Kita pergunakan anggapan sampel berdistribusi normal dengan dan tidak diketahui.

Kita ingin mengetahui statistik L1 dan L

2 pada tingkat makna = 5%,

yakni . Dari kurva normal standar diperolehP[-1.96 < Z < 1.96] = 0.95

Pada contoh ini,

ST2 40/59

Page 41: Stat Pro Modul 1

oleh karena itu

Dengan manipulasi aljabar maka dapat diperoleh batasan untuk ialah:

Maka diperoleh batasan bawah L1 dan batasan atas L

2 untuk selang

keyakinan 95%, yaitu:

Kurva distribusi normal:

-3.00 -2.00 -1.00 0.00 1.00 2.00 3.00

TEOREMA CENTRAL LIMITAndaikan X

1, X

2, X

3, ....., X

n adalah n buah sampel acak dari suatu

distribusi dengan mean dan varian . Maka untuk n yang

banyak, rata-rata akan mendekati normal dengan mean dan

varian . Sedang variabel random mendekati normal standar

(baku).

Contoh:

Sebuah populasi mempunyai anggota terdiri atas: 25% bernilai 1, 25% bernilai 2, 25% bernilai 3, dan 25% bernilai 4.

ST2 41/59

0.95

0.025 0.025

Page 42: Stat Pro Modul 1

Diambil sampel berukuran n = 2. Susunan anggota sampel tersebut ialah:

Sampel Rata-rata

X

Sampel Rata-rata X

1 1 1.0 3 1 2.0

1 2 1.5 3 2 2.5

1 3 2.0 3 3 3.0

1 4 2.5 3 4 3.5

2 1 1.5 4 1 2.5

2 2 2.0 4 2 3.0

2 3 2.5 4 3 3.5

2 4 3.0 4 4 4.0

Tabel distribusi frequensi untuk rata-rata sampel:

Rata-rata X Frequensi, f

1.0 1.0

1.5 2.0

2.0 3.0

2.5 4.0

3.0 3.0

3.5 2.0

4.0 1.0

Gambar distribusi densiti atau frequensi densiti adalah sebagai berikut:

ST2 42/59

Page 43: Stat Pro Modul 1

Populasi Sample

Tampaklah dari kedua gambar tersebut bahwa distribusi sangat berbeda dengan populasi induknya dan sangat mendekati distribusi normal.

ST2 43/59

Page 44: Stat Pro Modul 1

ESTIMASI INTERVAL VARIABILITAS Andaikan X

1, X

2, X

3, ....., X

n adalah n buah sampel acak dari suatu distribusi

dengan mean dan varian . Maka variabel random

mempunyai distribusi chi-squared dengan n - 1 derajad kebebasan.

Andaikan X1, X

2, X

3, ....., X

n adalah n buah sampel acak dari suatu distribusi

dengan mean dan varian . Maka 100(1-)% selang keyakinan (confidence interval) bagi adalah interval random [L

1, L

2] yang bernilai

batas:

Contoh:

Salah satu cara pembobotan beban komputer ialah dengan menghitung banyaknya penggunaan CPU dan input-output (I/O) per satuan waktu. Berikut adalah hasil pengamatan selama satu jam pada waktu-waktu yang ditentukan secara acak.

3.4 3.6 4.0 0.4 2.03.0 3.1 4.1 1.4 2.51.4 2.0 3.1 1.8 1.63.5 2.5 1.7 5.1 0.74.2 1.5 3.0 3.9 3.0

Diagram batang-daun (Stem-leaf) berikut tidak menunjukkan penyimpangan yang jauh dari distribusi normal.

0 71 4574862 05053 4056110904 2015 1

Gambar berikut menunjukkan pembagian kurva distribusi chi-squared ( ) untuk mendapatkan nilai batas interval.

ST2 44/59

Page 45: Stat Pro Modul 1

0 10 20 30 40 50

Dari data diperoleh

Batas untuk selang keyakinan 95% bagi varian ialah:

Batas untuk standar deviasi ialah:

ST2 45/59

0.95

Â224Â224

12.4 39.4

Page 46: Stat Pro Modul 1

DISTRIBUSI STUDENT-T

Andaikan Z adalah variabel random dengan distribusi normal standard

dan adalah variabel random berdistribusi chi-squared yang bebas

dengan derajad kebebasan γ. Maka variabel random t

berdistribusi t dengan derajad kebebasan γ .

Distribusi t ditentukan oleh nilai derajad kebebasan γ. Setiap nilai γ

memberikan satu distribusi t sehingga banyaknya tak terbatas. Derajad

kebebasan adalah bilangan real positip bulat.

Setiap variabel random t adalah kontinyu. Fungsi densiti dari t dengan

derajad kebebasan γ ialah

Grafik fungsi densiti distribusi t berbentuk simetris seperti bel dengan garis

tengah pada t=0.

Parameter γ adalah parameter bentuk. Yakni dengan berubahnya nilai γ

maka bentuk grafik berubah. Semakin tinggi nilai γ maka grafiknya

semakin runcing dan pada nilai distribusinya menjadi normal.

-6 -4 -2 0 2 4 6

ST2 46/59

Normal

t5

Page 47: Stat Pro Modul 1

ESTIMASI INTERVAL BAGI MEAN BILA VARIAN TAK DIKETAHUI

Walaupun merupakan estimator tak bias bagi dan tidak tergantung

pada tetapi untuk memperkirakan intervalnya diperlukan

Apabila tak diketahui (umumnya persoalan), nilainya diperkirakan dari

estimatornya, yakni S.

Andaikan X1, X

2, X

3, ....., X

n adalah n buah sampel acak dari distribusi

normal dengan mean dan varian . Maka variabel random

berdistribusi Student-t dengan derajad kebebasan v = n-1.

Andaikan X1, X

2, X

3, ....., X

n adalah n buah sampel acak dari suatu

distribusi dengan mean dan varian . Maka 100(1-)% selang keyakinan (confidence interval) bagi adalah interval random [L

1, L

2]

yang bernilai batas:

Contoh

Sulfur dioksida dan nitrogen oksida merupakan senyawa hasil pembakaran batu bara dan minyak bumi. Kedua senyawa ini dipercaya sebagai biang dari terjadinya hujan asam yang telah merusak hutan di banyak negara maju.

Untuk menjaga kelestarian lingkungan, kadar senyawa SO2 di suatu

wilayah yang diduga tercemari oleh gas-gas hasil pembakaran perlu diamati terus menerus. Berikut adalah data dari pengamatan kadar SO

2 (dalam microgram per meter kubik) di hutan Bavaria, Jerman.

52.7 43.9 41.7 71.5 47.6 55.162.2 56.5 33.4 61.8 54.3 50.045.3 63.4 53.9 65.5 66.6 70.052.4 38.6 46.1 44.4 60.7 56.4

Dari data tersebut dapat dihitung:

ST2 47/59

Page 48: Stat Pro Modul 1

Nilai t (dari distribusi Student t) untuk batas kiri dan kanan 0.025 (tingkat makna 5%) dan v=23 ialah:

t0.025,23

= 2.069

Maka estimasi interval (keyakinan 95%) bagi mean adalah:

atau

Andaikan kadar ambang batas kerusakan adalah 20 g/m3. Karena nilai ini tidak tercakup dalam interval mean maka secara statistik meyakinkan bahwa kadar SO

2 di wilayah yang diamati tersebut telah

melebihi ambang batas.

ST2 48/59

Page 49: Stat Pro Modul 1

TESTING HIPOTESA

Estimasi memperkirakan nilai parameter dengan tanpa memerlukan

pengetahuan awal tentang besarnya nilai tersebut.

Testing hipotesa memerlukan pengetahuan awal tentang nilai parameter

yang ingin diuji. Pada hakekatnya, testing hipotesa berkaitan dengan

pemilihan atas dua atau lebih nilai estimasi parameter berdasarkan sampel

yang diperoleh dari populasi.

Hipotesa dikemas dalam bentuk pernyataan dan paling sedikit ada dua

penyataan. Bentuk-bentuk pernyataan tersebut misalnya: sama - tidak

sama, baik - tidak baik, tidak lebih baik - lebih baik.

Pernyataan yang isinya bertentangan/tidak sama dengan nilai parameter

yang telah dimiliki/diketahui/ diyakini diberi nama Hipotesa Utama atau Hipotesa Nol, H

0 .

Pernyataan yang isinya setuju dengan nilai parameter yang telah dimiliki/diketahui/diyakini diberi nama Hipotesa Alternatif, H

1, H

2, ....

Pada akhirnya, suatu keputusan harus diambil apakah hipotesa utama (H0)

berhasil atau gagal ditolak pada tingkat makna/selang keyakinan tertentu.

Keputusan yang sebenarnya diinginkan adalah menolak hipotesa utama

dan mendukung hipotesa alternatif.

Contoh:

Ahli jalan raya mendapatkan bahwa salah satu faktor yang mempengaruhi kenampakan rambu jalan di malam hari ialah ketepatan setelan lampu mobil.

Dipercaya bahwa lebih dari 50% lampu mobil yang berjalan di malam hari tidak disetel dengan benar. Apabila anggapan ini benar maka perlu pengawasan yang ketat terhadap kelaikan jalan setiap mobil. Persoalan ini perlu pendekatan secara statistik agar meyakinkan hasilnya.

Andaikan p menyatakan proporsi mobil yang salah setelan lampunya. Karena diinginkan bahwa anggapan p > 0.5 terdukung secara statistik, maka sebagai hipotesa utama adalah yang bertentangan dengan anggapan tersebut.

H0: p<0.5 H

1: p>0.5

ST2 49/59

Page 50: Stat Pro Modul 1

Pengambilan keputusan didasarkan pada pengamatan beberapa nilai

statistik dari n buah sample yang diambil dari populasi.

Jadi pengujian hipotesa sebenarnya bertumpu pada pengujian statistik yang

dimiliki sample dengan distribusi yang telah diketahui.

Karena hipotesa utama merupakan pokok perhatian maka seluruh

rangkaian pengujian statistik (statistics test) dilakukan dibawah anggapan

seandainya nilai parameter yang sesungguhnya adalah sama dengan H

0 .

Nilai parameter disebut sama dengan nilai yang diajukan hipotesa

utama apabila nilai tersebut berada didalam batas makna dari distribusi

yang berlaku bagi sampel.

Batas makna ditentukan dari tingkat makna (significance level), . Yaitu

nilai batas probabiliti yang diterapkan pada distribusi populasi dan

merupakan batasan jumlah kejadian (event) yang menjadi

perhatian/cakupan. Dengan kata lain, pada tingkat makna akan terdapat

% kejadian yang diabaikan dan sebanyak (100-)% yang diperhatikan.

Kejadian (nilai variabel) yang tidak menjadi perhatian ialah kejadian yang

mempunyai nilai probabiliti dibawah nilai probabiliti batas (lazim pula disebut

berada dalam wilayah kritis). Kejadian yang demikian disebut sebagai

kejadian jarang, kejadian diluar kebiasaan, atau kejadian kebetulan.

Bentuk wilayah kritis ditentukan oleh bentuk hipotesa alternatif yang

diajukan. Terdapat 3 macam bentuk:

1. Batas satu sisi kanan

Bentuk Hipotesa:H

0 <

H1 >

Bentuk Batas pada distribusi densiti:

2. Batas satu sisi kiri

Bentuk Hipotesa:H

0 >

ST2 50/59

Page 51: Stat Pro Modul 1

H1 <

Bentuk Batas pada distribusi densiti:

3. Batas dua sisi (kiri dan kanan)

Bentuk Hipotesa:H

0 =

H1 ≠ (H

1 > dan H

1 < )

Bentuk Batas pada distribusi densiti:

Berkaitan dengan pengujian hipotesa ini, terdapat 4 macam kemungkinan keputusan:

H0 ditolak padahal seharusnya tidak. Dalam hal demikian terjadilah kesalahan tipe I (Type I error) dengan peluang

H0 ditolak seperti seharusnya karena H1 yang benar. Berarti keputusan yang diambil benar.

H0 tidak berhasil ditolak padahal seharusnya ditolak karena H1 yang benar. Dalam demikian terjadilah kesalahan tipe II (Type II error) dengan peluang

H0 tidak berhasil ditolak karena H0 benar dan H1 salah. Berarti keputusan yang diambil benar.

ST2 51/59

Page 52: Stat Pro Modul 1

Kenyataan (tetapi tak diketahui)

Keputusan H0 benar H

1 benar

Tolak H0 Kesalahan Tipe I

(Peluang Keputusan tepat

Jangan Tolak H0 Keputusan tepat Kesalahan Tipe II

(Peluang

Peluang diperlukan untuk mengetahui ukuran atau derajad

ketidakpastian suatu peristiwa. Di dalam statistik, peluang dipakai antara lain

terkait dengan cara pengambilan sampel dari suatu populasi.

Mengundi dengan sebuah mata uang logam atau sebuah dadu,

membaca temperatur dengan termometer tiap hari, menghitung barang rusak

yang dihasilkan tiap hari, mencatat banyak kendaraan yang melalui pertigaan

jalan tertentu setiap jam, dan masih banyak contoh yang lain, merupakan

eksperimen yang dapat diulangi. Semua hasil yang mungkin terjadi bisa

dicatat. Segala bagian yang mungkin didapat dari hasil ini dinamakan

peristiwa.

Contoh:

Eksperimen mencatat banyak kendaraan yang melalui sebuah tikungan

X setiap jam. Hasilnya bisa didapat 0, 1, 2, 3, … buah kendaraan setiap

jam yang melalui tikungan X.

Beberapa peristiwa yang didapat misalnya: tidak ada kendaraan selama

satu jam, lebih dari tiga kendaraan selama satu jam, ada 6 kendaraan

dalam satu jam, dsb.

Simbol untuk menyetakan peristiwa misalnya dengan huruf besar A, B,

C, ….baik disertai indeks atu tidak. Misal: A berarti tidak ada kendaraan yang

melalui tikungan dalam satu jam. B berarti ada 10 kendaraan yang melalui

tikungan dalam satu jam, dsb.

Definisi: Dua peristiwa atau lebih dinamakan saling ekslusif jika terjadinya

peristiwa yang satu mencegah terjadinya yang lain.

ST2 52/59

Page 53: Stat Pro Modul 1

Contoh:

5. Jika E menyatakan suatu peristiwa terjadi, maka E digunakan untuk

menyatakan peristiwa itu tidak terjadi. Peristiwa-peristiwa E dan E jelas

saling eksklusif.

6. Jika E menyatakan barang yang dihasilkan rusak, maka E digunakan untuk

menyatakan barang yang dihasilkan tidak rusak. Dua peristiwa E dan E jelas

saling eksklusif.

7. Jika muka G dan muka H digunakan untuk menyatakan dua sisi dari mata

uang logam yang homogin, maka bila dilakukan pengundian dengan mata

uang logam tersebut muka antara muka G dan muka H tidak akan pernah

muncul secara bersamaan. Muka G dan muka H merupakan dua peristiwa

yang saling ekslusif.

8. Sebuah dadu dengan muka 6 memiliki muka satu (1 titik), muka dua (2

titik), muka tiga, …, muka enam. Bila dilakukan pengundian dengan dadu

akan tampak hanya ada satu muka yang menghadap ke atas. Dalam hal ini

akan didapat enam peristiwa yang saling eksklusif.

Definisi: Jika peristiwa E dapat terjadi sebanyak n kali di antara N peristiwa

yang saling eksklusif dan masing-masing terjadi dengan kesempatan

yang sama, maka peluang peristiwa E terjadi adalah n/N dan

dinyatakan dengan P(E) = n/N.

Contoh:

Pengundian dengan mata uang logam yang homogen dengan muka G dan

muka H untuk menyatakan kedua sisinya. Jika E = muka G di atas, maka

P(E) = P(muka G di atas) = ½ dan P(E) = P(H) = ½

Pengundian dengan sebuah dadu yang homogen menghasilkan 6 peristiwa.

Untuk E = muka 4 di atas, maka P(E) = P(muka 4 di atas) = 1/6. Dengan

cara yang sama dapat diperoleh untuk P(E) = P(muka 1 di atas) = 1/6, P(E)

= P(muka 2 di atas) = 1/6, P(E) = P(muka di atas) = 1/6.

Sebuah kotak berisi 20 kelereng yang identik kecuali warnanya. Di dalam

kotak tersebut terdapat 5 kelereng warna merah, 12 warna kuning, dan

sisanya warna hijau. Jika kelereng dalam kotak di aduk-aduk dan diambil

ST2 53/59

Page 54: Stat Pro Modul 1

secara acak dengan mata tertutup (setelah diambil dikembalikan lagi),

maka peluang mengambil kelereng berwarna merah P(Merah) = 5/20 = ¼,

peluang mengambil kelereng berwarna kuning P(Kuning) = 12/20 = 3/5,

dan peluang mengambil kelereng berwarna hijau P(Hijau) = 3/20.

Berdasar rumus peluang dan beberapa contoh tersebut di atas, dapat

dikatakan bahwa P(E)= 0 bila n = 0 dan P(E) = 1 bila n = N. Secara

matematika dituliskan 0 ≤ P(E) ≤1. Jika E menyatakan bukan peristiwa E,

maka berarti jika P(E) = n/N maka P(E) = 1 – P(E). Hal itu berarti P(E) + P(E) =

1.

Contoh:

Jika peluang muncul muka 6 pada pengundian dengan dadu adalah P(E) =

P(6) = 1/6 maka peluang muncul bukan muka 6 adalah P(E) = P(bukan

muka enam) = 1 – 1/6 = 5/6.

Jika peluang mendapat hadiah adalah P(Hadiah) = 0,61, maka peluang

tidak mendapat hadiah adalah P(Tidak dapat hadiah) = 1- 0,61 = 0,39.

Peristiwa-peristiwa yang saling eksklusif dihubungkan dengan kata ATAU .

Untuk itu berlaku aturan: Jika k buah peristiwa E1, E2, E3, …, Ek, saling

eksklusif, maka peluang untuk terjadinya E1 atau E2, atau … atau Ek sama

dengan jumlah peluang tiap peristiwa. P(E1 atau E2 atau … atau Ek) =

P(E1 + E2 + E3 + … + Ek).

Contoh:

Sebuah kotak berisi 10 kelereng merah, 18 kelereng hijau, dan 22 kelereng

kuning. Kecuali warna, lain-lainnya identik. Bila semua kelereng

dimasukkan ke dalam kotak dan diaduk-aduk, maka berapakah peluang

warna merah atau hijau yang terambil dari kotak jika kelereng diambil

secara acak dengan mata tertutup?

Jawab:

Misal A = mengambil warna merah

B = mengambil warna kuning

C = mengambil warna hijau

ST2 54/59

Page 55: Stat Pro Modul 1

P(A) = 10/(10+18+22) = 0,2

P(B) = 18/(10+18+22) = 0,36

P(C) = 22/(10+18+22) = 0,44

Ketiga peristiwa di atas adalah saling eksklusif, sehingga berlaku:

P(A atau C) = P(A) + P(C) = 0,2 + 0,44 = 0,64

Hal itu berarti jika pengambilan kelereng dilakukan dalam jangka waktu

lama, maka 64 dari setiap 100 kali mengambil akan terambil kelereng

warna merah atau kuning.

Ada 200 lembar undian berhadiah, dan di dalamnya terdapat sebuah

hadiah pertama, 5 hadiah kedua, 10 hadiah ketiga, dan sisanya tak

berhadiah. Berapakah peluang seseorang akan mendapatkan hadiah

pertama atau kedua?

Jawab:

Misal A = mengambil lembar undian hadiah pertama

B = mengambil lembar undian hadiah kedua

C = mengambil lembar undian hadiah ketiga

D = mengambil lembar undian tanpa hadiah

P(A) = 1/(1+5+10+184) = 0,005

P(B) = 5/(1+5+10+184) = 0,025

P(C) = 10/(1+5+10+184) = 0,05

P(D) = 184/(1+5+10+184) = 0,92

Keempat peristiwa di atas adalah saling eksklusif, sehingga berlaku:

P(A atau B) = P(A) + P(B) = 0,005 + 0,025 = 0,03

Hal itu berarti jika pengambilan kertas undian dilakukan terus-menerus,

maka 3 dari setiap 100 kali mengambil akan terambil lembar undian hadiah

pertama atau hadiah kedua.

Hubungan kedua yang terdapat antara peristiwa adalah hubungan

bersyarat. Dua peristiwa dikatakan mempunyai hubungan bersyarat jika

peristiwa yang satu menjadi syarat terjadinya peristiwa yang lain. Peristiwa

tersebut ditulis dengan A|B untuk menyatakan peristiwa A terjadi dengan

didahului terjadinya peristiwa B. Peluangnya ditulis P(A|B) yang disebut

peluang bersyarat. Jika terjadinya atau tidak terjadinya peristiwa B tidak

ST2 55/59

Page 56: Stat Pro Modul 1

mempengaruhi terjadinya peristiwa A, maka A dan B disebut peristiwa

peristiwa bebas atau independent. Untuk menyatakan kedua peristiwa terjadi

maka ditulis A dan B atau P(A dan B) = P(A) . P(B)

Contoh:

Jika dilakukan undian dengan sebuah mata uang sebanyak dua kali. Bila

peristiwa A adalah tampak muka dan peristiwa B juga tampak muka, maka

peristiwa A dan B adalah independent. Peluang peristiwa A dan peluang

peristiwa B adalah P(A dan B) = P(A) . P(B) = ½ . ½ = ¼

A menyatakan si Y akan hidup dalam tempo 80 tahun, B menyatakan si Z akan

hidup dalam tempo juga 80 tahun. Jika diberikan P(A) = 0,65 dan P(B) =

0,52 Berapakah peluang si Y dan si Z dua-duanya akan hidup dalam tempo

80 tahun?

P(A dan B) = P(A) . P(B) = 0,65 . 0,52 = 0,338

Sebuah kotak berisi 10 kelereng merah, 18 kelereng hijau, dan 22 kelereng

kuning. Kecuali warna, lain-lainnya identik, dan di dalam kotak kelereng

diaduk-aduk. Dari dalam kotak diambil kelereng dua kali, tiap kali sebuah

kelereng. Kelereng yang telah diambil pertama tidak dimasukkan kembali

ke dalam kotak. Berapakah peluang kelereng warna hijau bila kelereng

pada pengambilan pertama berwarna merah?

Jawab:

Misal E = kelereng yang diambil pertama berwarna merah, dan F =

kelereng yang diambil kedua kali berwarna hijau. Peristiwa-peristiwa E dan

F tidak independent. P(E) = 0,2 merupakan peluang kelereng warna merah

pada pengambilan pertama, dan P(F|E) = peluang kelereng pada

pengambilan kedua berwarna hijau bila pada pengambilan kelereng

pertama berwarna merah.

P(F|E) = 18/(9+18+22) = 18/49

P(E dan F) = P(E) . P(F|E) = 0,2 x 18/49 = 0,073

Merupakan peluang kelereng warna hijau pada pengambilan kedua setelah

kelereng warna merah pada pengambilan pertama.

Hubungan yang ketiga adalah hubungan inklusif, yaitu atau A atau B

atau kedua-duanya terjadi, P(A+B) = P(A) + P(B) – P(A dan B). Contoh:

ST2 56/59

Page 57: Stat Pro Modul 1

Tumpukan kartu bridge ada 52 kartu terdiri dari 4 kartu hati, keriting, wajik,

dan skop. Tiap macam terdiri dari 13 kartu yang bernomor dari 2, 3, ..., 10, J,

Q, K, dan AS. Peluang menarik kartu hati, keriting, wajik, dan skop masing-

masing 0,25. Misalkan E = menarik kartu AS dari tumpukan dan F = menarik

kartu hati. Dalam hal ini E dan F dua peristiwa yang tidak eksklusif karena kita

dapat menarik selembar kartu As dari kelompok kartu hati. Peluang menarik

kartu AS atau sebuah hati adalah:

P(E+F) = P(E) + P(F) – P(E dan F)

= 4/52 + 13/52 – 1/52

= 16/52 = 4/13

Probabilitas Diskrit

Variabel yang biasanya hanya dapat dinyatakan dengan bilangan bulat. Misal hasil pelemparan mata uang logam, apakah hasilnya muka satu atau dua. Contoh lain jumlah penduduk, jumlah mesin, jumlah kepala keluarga, dll.

Contoh probabilitas diskrit:Jika sebuah mata uang dilemparkan sebanyak 3 kali, akan menghasilkan 8 kemungkinan keluaran, yaitu: MMM MMB MBM MBB BMM BMB BBM BBB

Tampak M/BX

Frekuensi Tampak M/B

Prob relatiff(X)

Prob kumF(X)

0 1 1/8 1/81 3 3/8 4/82 3 3/8 7/83 1 1/8 8/8

Jumlah 8 8/8

8/8 7/8

3/8 4/8

1/8 1/8

0 1 2 3 0 1 2 3Probabilitas Kontinue

Variabel yang biasanya hanya dapat dinyatakan dengan bilangan yang berada di suatu interval, misal: berat badan, lama bekerja dalam jam, dll. Jika X suatu variabel random kontinue, maka variabel X itu berada dalam suatu nilai: -~ <

ST2 57/59

Page 58: Stat Pro Modul 1

X < +~ sehingga akan mempunyai probabilitas antara a dan b yakni P(a ≤ X ≤ b).

- ~ + ~

X

Permutasi

Jumlah alternatif susunan objek dalam suatu himpunan.

Kombinasi

Dalam kombinasi yang diperhatikan bukan urutan n tetapi kombinasi dari n tsb.

ST2 58/59

Page 59: Stat Pro Modul 1

ST2 59/59