Muhammad Iqbal Amin (0707101050059)-Tugas Statistika A

11
Muhammad Iqbal Amin 0707101050059 Tugas Statistika. 1. Pengertian Mean, median, Modus, Standar Deviasi dan Quartil  Contoh :  Daftar Nilai Ujian Matematika elas !" SD N # $anda %&eh a. Mean Definisi : meru'akan nilai (ang di'eroleh dengan menjumlahkan semua nilai data dan mem"agin(a dengan jumlah data. Mean meru'akan nilai (ang menunjukkan 'usat dari nilai data dan meru'akan nilai (ang da'at me)akili keter'usatan data. *Pur)anto S.., #+1# -al ini da'at dirumuskan se"agai  "erikut ini. Di mana: Me  Mean *rata/rata 0 'silon *"a&a jumlah 2i Nilai 3 ke i sam'ai ke n  No Nama Nilai 1 4uslan 5+ # %li 5+ ! 6atimah 57 8 9aina" + 7 Saddal 5+ ; %<nil =7 = ori =7 $alam 1++ 5 4eski =7 1+ >ki 5+ ?otal ;+

description

statistik uye

Transcript of Muhammad Iqbal Amin (0707101050059)-Tugas Statistika A

Muhammad Iqbal Amin

0707101050059

Tugas Statistika.

1. Pengertian Mean, median, Modus, Standar Deviasi dan Quartil Contoh :

Daftar Nilai Ujian Matematika Kelas 3b SD N 2 Banda Aceh

NoNamaNilai

1Ruslan90

2Ali90

3Fatimah95

4Zainab80

5Saddal90

6Aznil75

7Kori75

8Balam100

9Reski75

10Oki90

Total860

a. Mean

Definisi : merupakan nilai yang diperoleh dengan menjumlahkan semua nilai data dan membaginya dengan jumlah data. Mean merupakan nilai yang menunjukkan pusat dari nilai data dan merupakan nilai yang dapat mewakili keterpusatan data. (Purwanto S.K., 2012) Hal ini dapat dirumuskan sebagai

berikut ini.

Di mana:

Me = Mean (rata-rata)

= Epsilon (baca jumlah)

Xi = Nilai x ke i sampai ke n

n = Jumlah individuContoh (Berdasarkan data didatas)

Me = 860 : 10

= 86

Untuk Group data (data berkelompok)

b. Median

merupakan salah satu ukuran pemusatan. Median merupakan suatu nilai yang berada di tengah-tengah data, setelah data tersebut diurutkan. (Purwanto S.K., 2012)

Menghitung median:

Jika jumlah data ganjil, maka median adalah nilai tengah dari urutan data

Jika jumlah data genap maka untuk menentukan mediannya diambil 2 data tengah dijumlah, kemudian dibagi 2

Untuk menentukan median dari data yang dikelompokkan dalam data distribusi frekuensi menggunakan rumus :

Dimana :

b = tepi batas bawah kelas median

P = panjang kelas/interval

F = Jumlah frekuensi sebelum kelas median

f = Frekuensi kelas median

n = jumlah seluruh frekuensi

Contoh (Berdasarkan data didatas)

Urutkan data dari yang kecil ke yang besar :

75

75

75

80

90

90

90

90

95

100

Maka

Median = (90+90): 2

= 90

d. ModusModus merupakan salah satu ukuran pemusatan di sampling rata-rata hitung dan median. Modus adalah suatu nilai pengamatan yang paling sering muncul. (Purwanto S.K., 2012)

Untuk data berkelompok menggunakan rumus :

Dengan

Mo = ModusL = Tepi bawah kelas yang memiliki frekuensi tertinggi (kelas modus) i = Interval kelasb1 = Frekuensi kelas modus dikurangi frekuensi kelas interval terdekat sebelumnyab2 = frekuensi kelas modus dikurangi frekuensi kelas interval terdekat sesudahnyaBedasarkan data tersebut, maka modus atau nilai yang paling sering muncul adalah 90. Karena munculnya sebanyak 4 kali atau frekuensinya 4. Jadi dapat dikatakan bahwa nilai yang sering muncul pada siswa kelas 3b adalah 90.e. Standar Deviasi

Salah satu teknik statistik yang digunakan untuk menjelaskan homogenitas kelompok adalah variansi. Variansi merupakan jumlah kuadrat semua deviasi nilai-nilai individual terhadap rata-rata kelompok. Akar variansi disebut standar deviasi atau simpangan baku. Variansi untuk sampel diberi simbol s2 dan standar deviasi sampel diberi simbol s.

Rumus di atas digunakan untuk data populasi, sedangkan untuk data sampel rumusnya tidak hanya dibagi dengan n saja, tetapi dibagi dengan n-1 (derajat kebebasan) menjadi berikut ini.

Contoh (Berdasarkan data didatas)

Maka

NoNamaNilai(x-Me)(x-Me)2

1Ruslan90416

2Ali90416

3Fatimah95981

4Zainab80-636

5Saddal90416

6Aznil75-11121

7Kori75-11121

8Balam10014196

9Reski75-11121

10Oki90416

Jadi Standar Deviasi =

Standar Deviasi= 8,60f. Quartil

Kuartil adalah nilai ukuran yang membagi data yang sudah terurut menjadi empat bagian yang sama. Contoh suatu data terurut seperti berikut. Data yang terdapat pada batas pengelompokan pertama disebut kuartil bawah (Q1), batas pengelompokan kedua disebut kuartil tengah (Q2), dan batas pengelompokan ketiga disebut kuartil atas (Q3). Untuk menentukan nilai-nilai kuartil, kita tentukan nilai kuartil tengah (Q2) terlebih dahulu. Nilai Q2 adalah median dari data tersebut. Selanjutnya, seluruh data yang berada di sebelah kiri Q2, digunakan untuk mencari Q1. Nilai Q1 adalah median dari data sebelah kiri Q2, sedangkan Q3 adalah median dari seluruh data di sebelah kanan Q2. Contoh (berdasarkan data pada soal)

75

75

75

80

90

90

90

90

95

100

Karena Q2 adalah median maka nilainya sama dengan 90. Setelah menentukan nilai Q2 terdapat dua kelompok yaiyu kuartil bawah dan kuartil atas. Nilai median pada kuartil bawah di sebut Q1 yaitu 75. Sedangkan nilai median kuartil atas adalah Q3 yaitu 90.

Uji Statistik Inheresial1. Data Para Metrik

T- Test

DefinisiSalah satu tes statistik yang dipergunakan untuk menguji kebenaran atau kesalahan hipotesis nihil yang dinyatakan dalam bentuk statemen bahwa diantara dua rata-rata hitung tiddak terdapat perbedaan yang signifikan. Uji t hanya dapat dipergunakan untuk menguji perbedaan rata-rata dari dua sampel yang diambil dari suatu populasi yang normal dengan cara random, serta data yang diperoleh adalah data dalam skala interval atau ratio.

Asumsi1. Sampel (data) diambil dari populasi yang mempunyai distribusi normal. Jika 10 sampel Tinggi Badan diambil dari populasi 5000 Mahasiswa sebuah Perguruan Tinggi, maka data Tinggi Badan 5000 Mahasiswa tersebut haruslah berdistribusi normal atau bisa dianggap normal.

2. Pada uji t dan uji F untuk dua sampel atau lebih, kedua sampel diambil dari dua populasi yang mempunyai varians sama. Jadi jika diambil sampel 10 Tinggi Badan Pria dan 10 Tinggi Badan Wanita dari 3000 Pria dan 2000 Wanita, maka varians 3000 Tinggi Badan Pria dan varians 2000 Tinggi Badan Wanita haruslah sama atau bisa dianggap sama 3. Variabel (data) yang diuji haruslah data bertipe interval atau rasio, yang tingkatnya lebih tinggi dari data tipe nominal atau ordinal. Tinggi Badan Pria atau Wanita (centimeter) jelas bertipe rasio, karena didapat dari proses mengukur. Namun Pendapat atau Sikap Pria dan Wanita (Suka atau Tidak Suka yang diukur dengan skala Likert) bukanlah data interval atau rasio, namun data Ordinal

SyaratUji T dapat berlaku untuk sampel yang berkorelasi atau sampel terpisah, karena dari sampel yang independent mungkin mempunyai cirri varian homogen yang heterogen. Bagi sampel terpisah yang homogen mempunyai formula tersendiri, demikian juga yang variannya heterogen

Manfaat1. Digunakan untuk menguji hipotesa komparatif (uji perbedaan)2. Digunakan untuk sample kecil & varian populasi tidak diketahui3. Merupakan salah satu tehnik statistik parametrik4. Membedakan mean kelompok

ANOVA (Analysis of Variance)

DefinisiSuatu metode Uji statistik untuk menguraikan keragaman total data menjadi komponen-komponen yang mengukur berbagai sumber keragaman.

Asumsi1. Data berdistribusi normal, karena pengujiannya menggunakan uji F-Snedecor

2. Varians atau ragamnya homogen, dikenal sebagai homoskedastisitas, karena hanya digunakan satu penduga (estimate) untuk varians dalam contoh

3. Masing-masing contoh saling independen, yang harus dapat diatur dengan perancangan percobaan yang tepat

4. Komponen-komponen dalam modelnya bersifat aditif (saling menjumlah)

Syarat1. Sampel diambil secara acak dari masing-masing populasi.

2. Jika sampel mendapat perlakuan yang berbeda, maka penetapan jenis perlakuan dilakukan dengan cara randomisasi.

3. Populasi-populasi asal sampel mempunyai distribusi normal.

4. Setiap populasi mempunyai varian sama.

5. Data yang diambil dalam skala data ratio atau interval.

ManfaatUntuk menguji perbedaan mean (rata-rata) data lebih dari dua kelompok atau perbedaan rata-rata antara berbagai grup yg mengalami perlakuan berbeda signifikan atau tidak

Regresi linier

DefinisiSebuah Metode uji statistikaUntuk mengukur besarnya pengaruh variabel bebas terhadap variabel tergantung dan memprediksi variabel tergantung dengan menggunakan variabel bebas. Gujarati (2006) mendefinisikan analisis regresi sebagai kajian terhadap hubungan satu variabel yang disebut sebagai variabel yang diterangkan (the explained variabel) dengan satu atau dua variabel yang menerangkan (the explanatory). Variabel pertama disebut juga sebagai variabel tergantung dan variabel kedua disebut juga sebagai variabel bebas. Jika variabel bebas lebih dari satu, maka analisis regresi disebut regresi linear berganda. Disebut berganda karena pengaruh beberapa variabel bebas akan dikenakan kepada variabel tergantung.

Asumsi1. Model regresi harus linier dalam parameter

2. Variabel bebas tidak berkorelasi dengan disturbance term (Error) 3. Nilai disturbance term sebesar 0 atau dengan simbol sebagai berikut: (E (U / X) = 0

4. Varian untuk masing-masing error term (kesalahan) konstan

5. Tidak terjadi otokorelasi

6. Model regresi dispesifikasi secara benar. Tidak terdapat bias spesifikasi dalam model yang digunakan dalam analisis empiris.

7. Jika variabel bebas lebih dari satu, maka antara variabel bebas (explanatory) tidak ada hubungan linier yang nyata

Syarat1. Model regresi dikatakan layak jika angka signifikansi pada ANOVA sebesar < 0.05

2. Predictor yang digunakan sebagai variabel bebas harus layak. Kelayakan ini diketahui jika angka Standard Error of Estimate < Standard Deviation

3. Koefesien regresi harus signifikan. Pengujian dilakukan dengan Uji T. Koefesien regresi signifikan jika T hitung > T table (nilai kritis)

4. Tidak boleh terjadi multikolinieritas, artinya tidak boleh terjadi korelasi yang sangat tinggi atau sangat rendah antar variabel bebas. Syarat ini hanya berlaku untuk regresi linier berganda dengan variabel bebas lebih dari satu.

5. Tidak terjadi otokorelasi. Terjadi otokorelasi jika angka Durbin dan Watson (DB) sebesar < 1 dan > 3

6. Keselerasan model regresi dapat diterangkan dengan menggunakan nilai r2 semakin besar nilai tersebut maka model semakin baik. Jika nilai mendekati 1 maka model regresi semakin baik. Nilai r2 mempunyai karakteristik diantaranya: 1) selalu positif, 2) Nilai r2 maksimal sebesar 1. Jika Nilai r2 sebesar 1 akan mempunyai arti kesesuaian yang sempurna. Maksudnya seluruh variasi dalam variabel Y dapat diterangkan oleh model regresi. Sebaliknya jika r2 sama dengan 0, maka tidak ada hubungan linier antara X dan Y.

7. Terdapat hubungan linier antara variabel bebas (X) dan variabel tergantung (Y)

8. Data harus berdistribusi normal

i. Data berskala interval atau rasio

9. Kedua variabel bersifat dependen, artinya satu variabel merupakan variabel bebas (disebut juga sebagai variabel predictor) sedang variabel lainnya variabel tergantung (disebut juga sebagai variabel response)

Manfaat1. Mampu mendeskripsikan fenomena data melalui terbentuknya suatu model hubungan yang bersifatnya numerik.

2. Dapat digunakan untuk melakukan pengendalian (kontrol) terhadap suatu kasus atau hal-hal yang sedang diamati melalui penggunaan model regresi yang diperoleh. regresi

3. Dapat dimanfaatkan untuk melakukan prediksi untukvariabel terikat.

Pearson Correlation

DefinisiKorelasi antara variabel adalah ukuran dari seberapa baik variabel yang terkait. Ukuran yang paling umum dari korelasi dalam statistik adalah Korelasi Pearson (secara teknis disebut Korelasi Pearson Product Moment atau PPMC), yang menunjukkan hubungan linier antara dua variabel. Dua huruf yang digunakan untuk mewakili korelasi Pearson: huruf Yunani rho () untuk populasi dan huruf "r" untuk sampel.

AsumsiAsumsi dalam korelasi Pearson, data harus berdistribusi normal. Korelasi dapat menghasilkan angka positif (+) dan negatif (-). Jika angka korelasi positif berarti hubungan bersifat searah. Searah artinya jika variabel bebas besar, variabel tergantung semakin besar. Jika menghasilkan angka negatif berarti hubungan bersifat tidak searah. Tidak searah artinya jika nilai variabel bebas besar, variabel tergantung semakin kecil. angka korelasi berkisar antara 0-1.

SyaratMengukur hubungan linear antara dua variabel dan memiliki nilai antara 1 sampai 1, dimana -1 melambangkan korelasi negatif dan 1 menunjukkan korelasi positif, mengindikasikan user yang memiliki interest kesamaan yang tinggi. Pearson melakukan pengukuran korelasi secara langsung dan merupakan standar pengukuran korelasi karena pengukurannya memberikan hasil korelasi yang baik antara dua variabel.

ManfaatDigunakan untuk mengetahui ada tidaknya hubungan antara 2 variabel, yaitu variabel bebas dan variabel tergantung yang berskala interval atau rasio (parametrik) yang dalam SPSS disebut scale.

2. Data Non ParaMetrik

Chi-Square

DefinisiChi square adalah pengujian hipotesis mengenai perbandingan antara frekuensi observasi atau yang benar-benar terjadi atau aktual dengan frekuensi harapan. Yang dimaksud dengan frekuensi harapan adalah frekuensi yang nilainya dapat di hitung secara teoritis (e). sedangkan dengan frekuensi observasi adalah frekuensi yang nilainya di dapat dari hasil percobaan (o).

AsumsiSampelnya adalah sampel acak dan skala pengukurannya adalah skala nominal

SyaratNilai chi square adalah nilai kuadrat karena itu nilai chi square selalu positif. Bentuk distribusi chi square tergantung dari derajat bebas (Db)/degree of freedom. Pengertian pada uji chi square sama dengan pengujian hipotesis yang lain, yaitu luas daerah penolakan Ho atau taraf nyata pengujian.

Karakteristik ChiSquare:

Nilai ChiSquare selalu positip.

Terdapat beberapa keluarga distribusi ChiSquare, yaitu distribusi ChiSquare dengan DK=1, 2, 3, dst.

Bentuk Distribusi ChiSquare adalah menjulur positip.

ManfaatUji Chi Square berguna untuk menguji hubungan atau pengaruh dua buah variabel nominal dan mengukur kuatnya hubungan antara variabel yang satu dengan variabel nominal lainnya (C = Coefisien of contingency).

Willcoxon Test

DefinisiTes Wilcoxon signed-rank adalah sebuah tes hipotesis non-parametrik statistik yang digunakan ketika membandingkan dua sampel yang berhubungan atau pengukuran ulang pada sampel tunggal untuk menilai apakah populasi mereka berarti berbeda (yakni merupakan uji perbedaan pasangan).

Asumsia) Data untuk analisis terdiri atas n buah beda Di = Yi Xi . Setiap pasangan hasil pengukuran (Xi , Yi) diperoleh dari pengamatan terhadap subjek yang sama atau terhadap subjek-subjek yang telah dijodohkan menurut suatu variabel atau lebih. Pasangan-pasangan (Xi , Yi) dalam sampel ini diperoleh secara acak.

b) Selisih variabel (Yi Xi) mewakili hasil-hasil pengamatan terhadap suatu variabel acak yang kontinu.

c) Distribusi populasi (di) tersebut setangkup (simetri).

SyaratNilai chi square adalah nilai kuadrat karena itu nilai chi square selalu Uji wilcoxon digunakan untuk menganalisis hasil-hasil pengamatan yang berpasangan dari dua data apakah berbeda atau tidak. Wilcoxon signed Rank test ini digunakan hanya untuk data bertipe interval atau ratio, namun datanya tidak mengikuti distribusi normal.

ManfaatUji peringkat bertanda Wilcoxon digunakan jika besaran maupun arah perbedaan relevan untuk menentukan apakah terdapat pebedaan yang sesungguhnya antara data yang satu dengan data yang lainnya. Uji peringkat bertanda Wilcoxon tidak hanya memanfaatkan informasi tentang arah tetapi juga besarnya perbedaan pasangan nilai itu.

Korelasi Tata Jenjang (Spearman)

DefinisiSalah satu tes statistik yang dipergunakan untuk menguji jika data variabel ordinal (berjenjang atau peringkat). Disebut juga korelasi non parametrik

Asumsi1. Data tidak berdistribusi normal dan

2. Data diukur dalam skala Ordinal.

SyaratData variabel ordinal (berjenjang atau peringkat).

ManfaatUji Spearman merupakan salah satu uji statistik non paramateris. Digunakan apabila ingin mengetahui kesesuaian antara 2 subjek di mana skala datanya adalah ordinal