EKSPLORASI DATA Pemeriksaan Data Variabel Tunggal · telah cukup simetris dan tidak terdapat nilai...

19
E k s p l o r a s i D a t a | 1 EKSPLORASI DATA Pemeriksaan Data Variabel Tunggal 1.1 Pendahuluan Kumpulan data yang merupakan hasil pengukuran terhadap variabel tertentu, pada umumnya tidak akan memiliki nilai yang persis sama satu dengan yang lain. Nilai-nilai keberagaman dapat dilihat melalui sebaran datanya sehingga sangat berguna dalam penentuan karakteristik data tersebut. Ukuran numerik yang penting meliputi pemusatan data (central tendency), sebaran data (dispersion) dan bentuk/pola dari sebaran data (shape). 1.2 Ukuran Pemusatan Salah satu aspek yang paling penting untuk menggambarkan sebaran data adalah nilai pusat dari data pengamatan. Setiap pengukuran aritmatika yang ditujukan untuk menggambarkan suatu nilai yang mewakili nilai pusat atau nilai sentral dari suatu gugus data (himpunan pengamatan) dikenal sebagai ukuran tendensi sentral. Ukuran nilai pusat/tendensi sentral (average) merupakan nilai yang mewakili dari suatu distribusi data, sehingga memiliki sifat-sifat berikut: mempertimbangkan semua elemen dalam data ada yang sensitif oleh nilai-nilai pencilan (outlier) memberikan gambaran tentang nilai pusat dari kumpulan data Dari beberapa ukuran nilai pusat, rata-rata (arithmatic mean) memenuhi semua sifat tersebut, khususnya bahwa rata-rata hitung tidak tertimbang dipengaruhi oleh nilai pencilan. Sebagai contoh, jika nilai amatan pengukuran adalah 2, 4, 5, 6, 6, 6, 7, 7, 8, 9 maka rata-rata hitung tidak tertimbang, median dan modus semua bernilai sama, yaitu 6. Jika nilai terakhir adalah 90 bukan 9, rata-rata hitung tidak tertimbang akan menjadi 14.10, sedangkan median dan modus tidak berubah. Dalam hal ini artinya untuk memberikan informasi tentang nilai pusat dari sekumpulan data numerik diperlukan untuk memeriksa terlebih dahulu adakah nilai pencilan dalam data, sebelum menentukan ukuran statistik yang sesuai untuk menggambarkan karakteristik datanya. 1.2.1 Rata-rata Hitung Tidak Tertimbang Rata-rata hitung tidak tertimbang adalah nilai yang mewakili himpunan atau sekelompok data (a set of data). Rata-rata hitung tidak tertimbang layak digunakan apabila sebaran data merata atau nilai antara data yang satu dengan yang lainnya tidak jauh berbeda (homogen). Rata-rata hitung (arithmatic mean) digunakan apabila: 1) skala pengukuran variabelnya interval atau rasio. 2) memiliki pola sebaran data yang relatif simetrik. 3) tidak terdapat nilai pencilan (outlier).

Transcript of EKSPLORASI DATA Pemeriksaan Data Variabel Tunggal · telah cukup simetris dan tidak terdapat nilai...

  • E k s p l o r a s i D a t a | 1

    EKSPLORASI DATA

    Pemeriksaan Data Variabel Tunggal

    1.1 Pendahuluan Kumpulan data yang merupakan hasil pengukuran terhadap variabel

    tertentu, pada umumnya tidak akan memiliki nilai yang persis sama satu

    dengan yang lain. Nilai-nilai keberagaman dapat dilihat melalui

    sebaran datanya sehingga sangat berguna dalam penentuan karakteristik

    data tersebut. Ukuran numerik yang penting meliputi pemusatan data

    (central tendency), sebaran data (dispersion) dan bentuk/pola dari

    sebaran data (shape).

    1.2 Ukuran Pemusatan

    Salah satu aspek yang paling penting untuk menggambarkan sebaran

    data adalah nilai pusat dari data pengamatan. Setiap pengukuran

    aritmatika yang ditujukan untuk menggambarkan suatu nilai yang

    mewakili nilai pusat atau nilai sentral dari suatu gugus data (himpunan

    pengamatan) dikenal sebagai ukuran tendensi sentral.

    Ukuran nilai pusat/tendensi sentral (average) merupakan nilai yang

    mewakili dari suatu distribusi data, sehingga memiliki sifat-sifat

    berikut:

    mempertimbangkan semua elemen dalam data

    ada yang sensitif oleh nilai-nilai pencilan (outlier)

    memberikan gambaran tentang nilai pusat dari kumpulan data

    Dari beberapa ukuran nilai pusat, rata-rata (arithmatic mean)

    memenuhi semua sifat tersebut, khususnya bahwa rata-rata hitung tidak

    tertimbang dipengaruhi oleh nilai pencilan. Sebagai contoh, jika nilai

    amatan pengukuran adalah 2, 4, 5, 6, 6, 6, 7, 7, 8, 9 maka rata-rata

    hitung tidak tertimbang, median dan modus semua bernilai sama,

    yaitu 6. Jika nilai terakhir adalah 90 bukan 9, rata-rata hitung tidak

    tertimbang akan menjadi 14.10, sedangkan median dan modus tidak

    berubah. Dalam hal ini artinya untuk memberikan informasi tentang

    nilai pusat dari sekumpulan data numerik diperlukan untuk memeriksa

    terlebih dahulu adakah nilai pencilan dalam data, sebelum menentukan

    ukuran statistik yang sesuai untuk menggambarkan karakteristik

    datanya.

    1.2.1 Rata-rata Hitung Tidak Tertimbang Rata-rata hitung tidak tertimbang adalah nilai yang mewakili himpunan

    atau sekelompok data (a set of data). Rata-rata hitung tidak tertimbang

    layak digunakan apabila sebaran data merata atau nilai antara data yang

    satu dengan yang lainnya tidak jauh berbeda (homogen).

    Rata-rata hitung (arithmatic mean) digunakan apabila:

    1) skala pengukuran variabelnya interval atau rasio. 2) memiliki pola sebaran data yang relatif simetrik. 3) tidak terdapat nilai pencilan (outlier).

  • 2 | E k s p l o r a s i D a t a

    Contoh 1.1:

    Pengeluaran rata-rata perbulan (dalam ratusan ribu) dari 6 rumah tangga

    di suatu daerah adalah sebagai berikut:

    Daerah 1 2 3 4 5 6 Rata - Rata

    Perdesaan A 20 23 16 20 24 17 20

    Perkotaan B 8 50 7 8 12 35 20

    Data di atas dapat digambarkan sebagai berikut:

    Rata-rata

    Gambar 1. Letak nilai rata-rata pada data perdesaan A

    Rata-rata

    Gambar 2. Letak nilai rata-rata pada data perkotaan B

    Pada contoh di atas, nilai rata-rata hitung tidak tertimbang akan relatif

    mewakili data pada pedesaan A karena datanya cenderung

    merata/homogen, sedangkan pada perkotaan B nilai rata-rata hitung

    tidak tertimbang kurang mewakili keseluruhan data karena datanya

    terpencar (heterogen) dengan jarak yang bervariasi.

    Contoh 1.2 :

    Hitunglah nilai rata-rata hitung tidak tertimbang dari nilai ujian

    matematika kelas 3 SMU berikut ini:

    2, 4, 5, 6, 6, 7, 7, 7, 8, 9

    Jawab:

  • E k s p l o r a s i D a t a | 3

    Apakah nilai rata-rata hitung tidak tertimbang ujian matematika

    sebesar 6.10 sudah mewakili gugus data tersebut? Artinya diperlukan

    pemeriksaan lebih lanjut untuk mengetahui pola sebaran data, apakah

    telah cukup simetris dan tidak terdapat nilai pencilan.

    Contoh 1.3 :

    Misalkan suatu kelompok data yang terdiri dari 20 anggota mempunyai

    rata-rata hitung tidak tertimbang 7.50. Tentukan rata-rata hitung tidak

    tertimbang yang baru jika pada kelompok data tadi ditambahkan 3 buah

    data baru: 5.50, 6.25 dan 8.75.

    Penyelesaian:

    Misalkan sampel 1 terdiri dari 20 anggota mempunyai rata-rata

    X1 = 7,50

    sampel 2 mempunyai 3 anggota mempunyai rata-rata

    X2 = (5,50 + 6,25 + 8,75)/3 = 6,83. Jadi rata-rata gabungannya adalah:

    X =

    = 7,41

    Apakah kelompok data sampel pertama menjadi berubah nilai rata-

    ratanya setelah digabungkan dengan kelompok data sampel kedua?

    Dalam hal ini perhatikanlah bagaimana pola sebaran data pada

    kelompok data pertama dengan penambahan kelompok data kedua,

    apakah pola sebaran datanya menjadi berubah dari sebelumnya?

    adakah terdapat nilai pencilan sehingga dapat mempengaruhi

    pengukuran nilai rata-rata hitung tidak tertimbang.

    1.2.2 Median

    Median adalah nilai yang terletak di tengah dari data yang telah

    diurutkan. Nilai median dipengaruhi oleh banyaknya pengamatan,

    tidak tergantung besarnya nilai pengamatan walaupun nilainya sangat

    ekstrem, sehingga median cocok untuk mewakili data yang

    sebarannya tidak homogen. Sebagai contoh nilai pusat pada data

    perkotaan B cocok menggunakan median untuk menggambarkan

    pengeluaran dari keenam rumah tangga tersebut.

    Median digunakan bila:

    1) skala pengukuran variabel adalah ordinal, interval atau rasio 2) pola sebaran data yang tidak simetrik 3) terdapat beberapa nilai pencilan

    Contoh 1.4:

    Hitunglah median dari nilai ujian matematika kelas 3 SMU berikut ini:

    8, 4, 5, 6, 7, 6, 7, 7, 2, 9, 10

  • 4 | E k s p l o r a s i D a t a

    Jawab:

    jumlah data amatan ganjil, yaitu n = 11

    data setelah diurutkan: 2, 4, 5, 6, 6, 7, 7, 7, 8, 9, 10

    banyaknya data (n) = 11

    posisi Me = ½ (11+1) = 6

    Nilai Median = 7 (data yang terletak pada urutan ke-6)

    Contoh 1.5:

    Hitunglah median dari nilai ujian matematika kelas 3 SMU berikut ini:

    8, 4, 5, 6, 7, 6, 7, 7, 2, 9

    Jawab:

    jumlah data amatan genap, yaitu n = 10

    data setelah diurutkan: 2, 4, 5, 6, 6, 7, 7, 7, 8, 9

    posisi Me = ½ (10+1) = 5.5

    Data tengahnya: 6 dan 7

    Jadi nilai Median = ½ (6+7) = 6.5 (rata-rata dari 2 data yang terletak

    pada urutan ke-5 dan ke-6)

    1.2.3 Modus

    Modus adalah nilai yang paling sering muncul dari sekumpulan data,

    dan nilainya dapat dihitung untuk variabel dengan skala pengukuran

    nominal, ordinal, interval, maupun rasio. Nilai modus tidak dipengaruhi

    oleh nilai ekstrem. Modus biasanya digunakan untuk tujuan deskriptif

    karena tidak mempertimbangkan sebaran data. Kalau nilai-nilai

    pengamatan sangat bervariasi maka modus tidak sesuai untuk dalam

    mengambarkan ukuran pemusatan data.

    Contoh 1.6 :

    Seorang agen intelijen negara memberi informasi kepada kepolisian

    bahwa komplotan buronan yang selama ini mereka cari sering muncul

    secara bersama-sama antara tanggal 5-10 di setiap bulannya. Dalam

    satu bulan, mereka hanya muncul bersama-sama sebanyak 1 kali untuk

    melakukan konsolidasi. Pihak kepolisian harus memutuskan sebuah

    tanggal dimana pada tanggal tersebut akan dilakukan penggerebekan

    terhadap para buronan tersebut. Pihak kepolisian tidak mungkin akan

    selalu berjaga-jaga dengan membawa berbagai senjata dan kendaraan

    khusus antara tanggal 5 hingga 10 di setiap bulannya di titik lokasi

    tersebut karena hal ini akan membuat para buronan curiga dan kabur.

    Data tanggal setiap bulan mengenai kemunculan para buronan yang

    direkam selama 2 tahun adalah sebagai berikut:

    6 5 5 5 6 6 9 5 5 7 8 5 7 5 7 5 5 7 7 5 6 5 10 5

    Untuk itulah, kepala polisi memutuskan untuk menentukan modus

    dari data tanggal tersebut sebagai tanggal dimana akan dilakukan

    penggerebekan terhadap para buronan.

  • E k s p l o r a s i D a t a | 5

    Nilai modus dari data tanggal tersebut adalah: 5 (kemunculan

    terbanyak, sebanyak 12 kali dari 24 buah data tanggal amatan)

    Dengan demikian pihak kepolisian akan melakukan penggerebekan

    terhadap para buronan tepat pada tanggal 5.

    1.3 Ukuran Penyebaran Ukuran penyebaran digunakan untuk mengetahui sebaran dari data.

    Karena ukuran pemusatan tidak selalu mewakili sekelompok data,

    maka data perlu diketahui ukuran sebarannya. Ukuran penyebaran atau

    ukuran keragaman pengamatan dari nilai rata-ratanya disebut

    simpangan (deviation/dispersi). Terdapat beberapa ukuran untuk

    menentukan dispersi data pengamatan, seperti jangkauan/rentang

    (range), simpangan kuartil (quartile deviation), simpangan rata-rata

    (mean deviation), simpangan baku/standar deviasi (standard deviation),

    dan ragam/varian (variance).

    1.3.1 Rentang (Range) Range merupakan ukuran dari selisih antara nilai maksimum dengan

    nilai minimum. Dari contoh 1, didapatkan range pedesaan A = 8 dan

    range perkotaan B = 42. Nilai range mempunyai kelemahan dalam

    mengukur sebaran data karena hanya memperhatikan dua buah nilai

    terkecil dan terbesar dari sekumpulan data.

    1.3.2 Varians Dan Standar Deviasi Varians dan standar deviasi adalah ukuran rata-rata hitung tidak

    tertimbang posisi data terhadap rata-ratanya, sehingga menunjukkan

    seberapa besar simpangan pengamatan terhadap rata-ratanya.

    atau

    Sedangkan Standar Deviasi Sampel memiliki formula:

    s = atau

    Dari contoh 1.1 didapatkan standar deviasi perdesaan A = 3.16 (rata-

    rata=20), artinya secara umum data berada 3.16 di sekitar rata-ratanya

    yaitu antara 16.84 dan 23.16. Standar deviasi perkotaan B = 18.14

    (rata-rata=20), artinya secara umum data berada 18.14 di sekitar rata-

    ratanya yaitu antara 1.86 dan 38.14. Karena standar deviasi perdesaan

    A lebih kecil dari perkotaan B, maka dikatakan bahwa sebaran data

    perdesaan A lebih homogen dari pada perkotaan B.

    Jika nilai varian dan standar deviasi adalah nol artinya semua amatan

    mempunyai nilai yang sama.

  • 6 | E k s p l o r a s i D a t a

    Contoh 1.7:

    Diberikan data mengenai hasil perolehan nilai pada 2 Quiz yg

    berbeda, sebagai berikut ini :

    1 2 3 4 5 6 7 8 9 10 11

    Quiz 1: 1 20 20 20 20 20 20 20 20 20 20

    Quiz 2: 2 3 4 5 6 14 15 16 17 18 19

    Quiz 1: rata-rata =18.27

    Quiz 2: rata-rata = 10.82

    No

    Quiz 1

    (xi)

    Quiz 2

    (xi)

    1 1 -17.27 298.35 2 -8.82 77.76

    2 20 1.73 2.98 3 -7.82 61.12

    3 20 1.73 2.98 4 -6.82 46.49

    4 20 1.73 2.98 5 -5.82 33.85

    5 20 1.73 2.98 6 -4.82 23.21

    6 20 1.73 2.98 14 3.18 10.12

    7 20 1.73 2.98 15 4.18 17.49

    8 20 1.73 2.98 16 5.18 26.85

    9 20 1.73 2.98 17 6.18 38.21

    10 20 1.73 2.98 18 7.18 51.58

    11 20 1.73 2.98 19 8.18 66.94

    Jumlah 328.1818 453.6364

    Quiz 1:

    Quiz 2:

    Kesimpulan:

    Berdasarkan nilai ragam dan standar deviasi, Quiz ke-2 lebih

    bervariasi dibandingkan dengan Quiz ke-1. (terlihat bahwa

    kesimpulan tentang keragaman data dengan varians ataupun standar

    deviasi berbeda dengan kesimpulan berdasarkan range)

  • E k s p l o r a s i D a t a | 7

    1.3.3 Koefisien Variasi

    Koefisien variasi adalah perbandingan antara standar deviasi dengan

    nilai rata-rata yang dinyatakan dengan persentase. Koefisien Variasi

    digunakan untuk keperluan perbandingan dua kelompok nilai yang

    bebas dari satuan data asli. Koefisien variasi adalah perbandingan

    antara standar deviasi dengan rata-ratanya.

    Dari contoh 1.1 didapatkan koefisien variasi pedesaan A = 15.8% dan

    koefisien variasi B = 90.7%. Ini berarti sebaran data pedesaan A lebih

    baik dari sebaran data perkotaan B.

    Contoh 1.8 :

    Perhatikan gugus data untuk Kelompok A dan Kelompok B

    A 2 4 5 6 6 7 7 7 8 9

    B 3 6 7 9 9 10 10 10 11 12

    Kelompok A: Rata-rata = 6.1; s = 2.0

    Kelompok B: Rata-rata = 8.7; s = 2.7

    1.4 Pola Sebaran Data

    Bentuk/Pola sebaran data dapat dikelompokkan menjadi simetris

    (symmetric) dan tidak simetris (asymmetric/skewnees).

    a) Rata-rata > median> modus : skewness positif atau menceng kiri b) Rata-rata = median : simetris c) Rata-rata < median < modus: skewness negatif atau menceng

    kanan

    Gambar 3. Macam Kemencengan (Skewness)

  • 8 | E k s p l o r a s i D a t a

    1.4.1 Diagram Dahan Dan Daun (Stem-And-Leaf Plot)

    Diagram dahan dan daun adalah teknik yang cukup efektif untuk

    menggambarkan pola sebaran bagi data yang berukuran kecil. Dengan

    teknik ini gambaran distribusi data akan dapat diketahui dengan mudah.

    Diagram dahan dan daun membagi data menjadi digit depan (leading)

    dan satu digit belakang (trailing). Sebagai contoh apabila data

    semuanya terdiri dari dua digit, maka digit depan merupakan puluhan

    dan digit di belakangnya merupakan satuan. Jika data 47 berarti

    dahan = 4 dan daun = 7, jika data 2 maka dahan = 0 dan daun = 2.

    Contoh 1.9

    Data pengeluaran rumah tangga di suatu daerah untuk 44 rumah tangga

    (dalam ratusan ribuan) adalah sebagai berikut:

    47, 11, 46, 33, 19, 42, 27, 22, 62, 10, 44, 2, 15, 21, 67, 20, 26, 25, 6, 53,

    18, 3, 30, 7, 21, 25, 20, 40, 16, 8, 4, 10, 46, 31, 14, 15, 8, 10, 19, 17, 12,

    16, 42, 16

    Dari data di atas, maka digit depan (sebagai dahan) yang paling kecil

    adalah 0 dan yang paling besar adalah 6

    Diagram dahan dan daunnya sebagai berikut:

    Dahan Daun

    0 2 6 3 7 8 4 8

    1 1 9 0 5 8 6 0 4 5 0 9 7 2 6 6

    2 7 2 1 0 6 5 1 5 0

    3 3 0 1

    4 7 6 2 4 0 6 2

    5 3

    6 2 7

    Gambar 4. Contoh Stem-And-Leaf

  • E k s p l o r a s i D a t a | 9

    Dahan Daun

    0L 2 3 4

    0H 6 7 8 8

    1L 1 0 5 0 4 5 0

    1H 9 8 6 9 7 6

    2L 2 1 0 5 1 5 0

    2H 7 6

    3L 3 0 1

    3H

    4L 2 4 0 2

    4H 7 6 6

    5L 3

    5H

    6L 2

    6H 7

    Gambar 5. Contoh Stem-and-leaf

    Gambar 4 menunjukkan diagram dahan dan daun yang daunnya

    merupakan nilai digit kedua dari data. Sedangkan Gambar 5

    menunjukkan diagram dahan dan daun yang mana daunnya dibagi

    menjadi 2, yaitu 5 ke bawah dan di atas lima, sehingga batangnya

    dibagi menjadi 2 juga yaitu L (low) untuk daun 5 ke bawah dan

    H (high) untuk daun di atas 5.

    1.4.2 Kuantil

    Kuantil merupakan ukuran yang sangat berguna untuk melihat

    ketidaksimetrisan data kuantitatif yang berskala besar. Kadang-kadang

    penggambaran ini menggunakan persentil (yang membagi data menjadi

    100 kelompok), desil (yang membagi data ke dalam 10 kelompok) dan

    kuartil (yang membagi data menjadi 4 kelompok). Untuk kepentingan

    selanjutnya, di sini akan dibahas tentang kuartil.

    Kuartil pertama (Q1), nilai yang membagi 25% data yang lebih kecil dan 75% data yang lebih besar.

    Kuartil kedua (Q2), nilai yang membagi 50% data yang lebih kecil dan 50% data yang lebih besar.

    Kuartil ketiga (Q3), nilai yang membagi 75% data yang lebih kecil dan 25% data yang lebih besar.

  • 10 | E k s p l o r a s i D a t a

    1.4.3 Diagram Kotak-Garis (Box Plot)

    Box plot adalah representasi grafik dari sekelompok data yang memuat

    5 ringkasan data yaitu median, Q1, Q3, minimum dan maksimum.

    Untuk data yang simetris, me = (Q1 + Q3)/2 = (min + maks)/2,

    sehingga cukup alasan untuk menganggap bahwa Q3 – me = me - Q1 =

    (Q3 - Q1)/2.

    Boxplot menggambarkan distribusi dari data, sehingga dari grafik ini

    akan kelihatan kemencengan data, dan adanya pencilan.

    Contoh 1.10

    Berikut 20 amatan tentang penggunaan microcomputer selama

    seminggu (dalam jam) oleh mahasiswa pada jurusan matematika di

    suatu perguruan tinggi: 12, 16, 12, 13, 16, 14, 15, 15, 16, 17, 18, 14, 18,

    19, 11, 15, 13, 15, 17, 14.

    Diagram box plotnya sebagai berikut:

    20.00

    18.00

    16.00

    14.00

    12.00

    10.00

    microcomputer

    Gambar 6. Boxplot data pada contoh 1.10

    Kalau data mengikuti sebaran normal, maka data berada pada interval

    rata-rata ± 1.96 standar deviasi. Secara matematis pola data yang

    simetris akan memenuhi ketentuan:

  • E k s p l o r a s i D a t a | 11

    Berarti amatan yang berada di luar interval di atas dan median tidak

    sama dengan separuh rentang antar kuartil akan merupakan amatan

    pencilan.

    Contoh 1.11

    16.8 25.7 21.4 22.7 28.1 17.5 14.4 20.9

    13.1 15.8 21.7 26.2 18.7 20.2 24.6 24.2

    14.6 16.9 14.9 26.7 20.2 21.6 15.1 6.9

    22.6 12.9 14.1 25.8 17.9 17.7 18.6 20.3

    24.4 16.6 20.5 19.7 17.3 18.0 13.7 17.3

    Distribusi datanya sebagai berikut: Diagram Dahan dan Daun

    data Stem-and-Leaf Plot

    Frequenc

    1,00

    3,00

    6,00

    8,00

    4,00

    8,00

    2,00

    5,00

    2,00

    1,00

    Stem width: 10,00

    Each leaf: 1 case(s)

    30.00

    25.00

    20.00

    15.00

    10.00

    5.00

    VAR00002

    Gambar 7. Boxplot data pada contoh 1.7

    y Stem & Leaf

    (=

  • 12 | E k s p l o r a s i D a t a

    3.

    Untuk lebih memperjelas pemeriksaan pola sebaran data diberikan

    penyajian visual dengan diagram dahan-daun dan diagram kotak-garis

    pada contoh 1.11.

    Terlihat pola sebaran data relatif simetris dengan sebuah amatan

    pencilan yang nilainya sangat kecil dibandingkan sekumpulan data

    lainnya.

    1.5 Eksplorasi Data dengan SPSS for Windows

    Untuk mendapatkan output eksplorasi data menggunakan SPSS

    for Windows, langkah-langkahnya adalah sebagai berikut:

    1. Aktifkan datanya 2. Klik menu Analyze → Decriptive Statistics → Explore

    Gambar 8. Windows SPSS pada saat memilih Analyze →

    Decriptive Statistics → Explore

    4. Maka akan muncul window seperti di bawah ini

    Gambar 9. kotak Dialog Explore

  • E k s p l o r a s i D a t a | 13

    Dependent List, adalah daftar variabel yang akan dianalisis

    Factor List, adalah daftar variabel yang akan mengelompokkan

    output dari variabel yang dianalisis, yaitu pengeluaran rumah

    tangga berdasarkan daerah (kota dan desa). Berarti factor list-nya

    adalah daerah.

    Label Cases by, isian variabel yang akan ditampilkan pada output

    untuk masing-masing data, misalkan nomor rumah tangga.

    Display, bisa dipilih salah satu dari tiga opsi yang ada. Both: ditampilkan statistik dan ploting datanya. Statistics: akan

    ditampilkan output statistik saja. Plots: hanya ditampilkan ploting datanya saja.

    Statistics, berisi output statistik sebagai berikut:

    Gambar 10. kotak dialog Explore: Statistics

    Descriptives, menampilkan output mean, median, modus, 5%

    trimmed mean, standar error, variancs, standar deviasi, minimum,

    maksimum, range, interquartile range, skewness, standar error

    skewness, kurtosis dan standard error kurtosis.

    M-estimators, menampilkan output robust maximum-likelihood estimators of central tendency.

    Outliers, menampilkan output lima data terkecil dan lima data terbesar. Pada outputnya akan ditampilkan nilai extreme.

    Percentiles, akan menampilkan output persentil: 5, 10, 25, 50, 75,

    90, 95 dan Tukey's hinges.

    Plots, berisi output ploting data sebagai berikut:

    Gambar 11. Kotak dialog Explore : Plots

  • 14 | E k s p l o r a s i D a t a

    Boxplots, organisasi output boxplot. Factor level together: boxplot dikelompokkan berdasarkan faktor. Dependents

    together, boxplot dikelompokkan berdasarkan dependent variabel untuk faktor yang sama. None: tidak menampilkan

    boxplot

    Descriptive, menampilkan plot descriptive. Steam and-leaf,

    menampilkan output steam-and-leaf. Histogram, menampilkan histogram data

    Normalty plot with test, menampilkan output uji kenormalan.

    Option, perlakuan analisis dengan mempertimbangkan missing

    value

    Gambar 12. Kotak Dialog Explore : Options

    Exclude cases listwise, missing value tidak diikutkan dalam analisis.

    Exclude cases pairwise, output menyertakan hasil analisis dengan missing value dan tidak dengan missing value.

    Report values, mendefinisikan missing value sebagai data tersendiri.

  • E k s p l o r a s i D a t a | 15

    Contoh 1.12:

    Perhatikan contoh data berikut:

    47, 11, 46, 33, 19, 42, 27, 22, 62, 10, 44, 2, 15, 21, 67, 20, 26, 25, 6, 53,

    18, 3, 30, 7, 21, 25, 20, 40, 16, 8, 4, 10, 46, 31, 14, 15, 8, 10, 19, 17, 12,

    16, 42, 16,

    Output SPSS-nya adalah:

    Explore

    Case Processing Summary

    Cases

    Valid Missing Total

    N Percent N Percent N Percent

    data6 44 100,0% 0 ,0% 44 100,0%

    Descriptives

    Statistic

    Std.

    Error

    data6 Mean 23,77 2,423

    95% Confidence

    Interval for Mean

    Lower Bound 18,89

    Upper Bound 28,66

    5% Trimmed Mean 22,74

    Median 19,50

    Variance 258,319

    Std. Deviation 16,072

    Minimum 2

    Maximum 67

    Range 65

    Interquartile Range 21

    Skewness ,944 ,357

    Kurtosis ,250 ,702

    Percentiles

    Percentiles

    5 10 25 50 75 90 95

    Weighted

    Average

    (Definition 1)

    data6 3,25 6,50 11,25 19,50 32,50 46,50 59,75

  • E k s p l o r a s i D a t a | 17

    Percentiles

    Percentiles

    5 10 25 50 75 90 95

    Weighted

    Average

    (Definition 1)

    data6 3,25 6,50 11,25 19,50 32,50 46,50 59,75

    Tukey's Hinges data6 11,50 19,50 32,00

    Tests of Normality

    Kolmogorov-Smirnova Shapiro-Wilk

    Statistic df Sig. Statistic Df Sig.

    data6 ,159 44 ,007 ,916 44 ,003

    a. Lilliefors Significance Correction

    Gambar 13. Histogram data contoh 1.12

  • 18 | E k s p l o r a s i D a t a

    Stem-and-Leaf Plot

    Frequency Stem & Leaf

    7,00 0 . 2346788

    15,00 1 . 000124556667899

    9,00 2 . 001125567

    3,00 3 . 013

    7,00 4 . 0224667

    1,00 5 . 3 1,00 6 . 2

    1,00 Extremes (>=67)

    Stem width: 10

    Each leaf: 1 case(s)

    Gambar 14. Normal Q-Q plot dari data pada contoh 1.12

  • E k s p l o r a s i D a t a | 19

    Gambar 15. Detrend Normal Q-Q plot data pada contoh 1.12

    Gambar 16. Box-Plot Data Pada Contoh 1.12