Download - ModulPenggabunganData spss

Transcript
Page 1: ModulPenggabunganData spss

MODUL 7 CARA PENGGABUNGAN DATA

HASIL ENTRI KUESIONER RISKESDAS 2007

BADAN PENELITIAN DAN PENGEMBANGAN KESEHATAN DEPARTEMEN KESEHATAN RI

JAKARTA – 2007

RISET KESEHATAN DASAR 2007

Page 2: ModulPenggabunganData spss

ii

DAFTAR ISI

Daftar Isi ii

1. Pendahuluan 1

2. Pengenalan File 2

3. Persiapan Penggabungan 3

3.1 Transfer File 4

3.2 Pengelompokan File Data 6

4. Penggabungan Data 8

4.1 Variabel Kunci 9

4.2 Proses Penggabungan Data 10

Page 3: ModulPenggabunganData spss

1

1. PENDAHULUAN

Data hasil entri pada sistem jaringan maupun bukan sistem jaringan tetap harus

melakukan tahapan penggabungan data sebelum dilakukan proses manajemen data

selanjutnya. Modul ini bertujuan memberikan pedoman beberapa cara penggabungan data.

Penggabungan data dapat menggunakan perangkat lunak yang dapat mengaktifkan file

dengan extension *.dbf, seperti Fox Pro, Visual Fox Pro, atau SPSS. Perangkat lunak tersebut

mempunyai kelebihan dan kekurangan masing-masing.

Modul ini berisi pedoman penggabungan data dengan menggunakan perangkat lunak

SPSS. Keunggulan perangkat lunak SPSS adalah dapat menampung jumlah variabel yang

lebih banyak daripada Fox Pro atau Visual Fox Pro yang hanya dapat menampung sekitar 255

variabel. Keunggulan lain, jika terjadi kesalahan dalam proses penggabungan data, dengan

menggunakan program SPSS masih dapat membatalkan proses tersebut selama belum

dilakukan penyimpanan hasil penggabungan data.

Perangkat lunak Fox Pro atau Visual Fox Pro mempunyai keunggulan lebih mudah

untuk menggabungkan data dibandingkan SPSS, namun sulit membatalkan proses yang salah

yang telah kita lakukan. Hal ini sangat berbahaya bagi petugas manajemen data yang belum

terbiasa menggunakan perangkat lunak tersebut. Oleh karena itu, pada pengelolaan

manajemen data Riskesdas menggunakan SPSS dengan mempertimbangkan keunggulannya

dan keamanan penggunaannya.

Penggabungan data dilakukan pada hasil entri harian yang telah dikumpulkan dari

beberapa komputer dan ditampung dalam folder BACK UP DATA ENTRI pada server.

Penggabungan data dilakukan terhadap file-file hasil entri dari satu komputer dan

penggabungan data juga dilakukan untuk menambahkan record-record yang berasal dari

beberapa komputer. Cara penggabungannya akan dibahas pada bagian-bagian dari modul 7

ini.

Page 4: ModulPenggabunganData spss

2

2. PENGENALAN FILE

Data dari kuesioner Rumah Tangga (RKD07.RT) dan kuesioner Individu

(RKD07.Ind) yang dientri akan tersimpan dalam 7 file database yang tergabung dalam folder

dbase-rkd. Tiga file database yang berada dalam folder yang sama, merupakan data-data

pokok yang menjadi acuan program entri. Ketiga file tersebut tidak digunakan dalam proses

penggabungan data. Rincian nama file dan keterangan data yang dicakup dalam file tersebut

adalah sebagai berikut:

1. File rt.DBF berisi data-data Rumah Tangga mencakup Blok I sampai dengan Blok III dan Blok VI sampai dengan Blok VIII

2. File rt_blok 4.DBF berisi data-data Anggota Rumah Tangga mencakup blok IV 3. File rt_blok5.DBF berisi data-data Anggota Rumah Tangga yang meninggal

mencakup blok V dan catatan 4 File bag_abcef.DBF berisi data-data Individu bagian A, B, C, E dan F 5 File bag_d.DBF berisi data-data Individu khusus blok D 6 File bag_gh.DBF berisi data-data Individu blok g dan h

7. File pengukuran.DBF berisi data-data bagian Individu Blok XI Pengukuran dan catatan

8. File kab_garun.DBF berisi nama-nama Kabupaten/Kota khusus sampel urin dan garam (tidak digunakan)

9. File PROV.DBF berisi nama-nama kecamatan pada propinsi RISKESDAS (tidak digunakan)

10. File KABUP.DBF berisi nama-nama kabupaten pada kabupaten pada provinsi (tidak digunakan)

Gambar 2.1.

Page 5: ModulPenggabunganData spss

3

3. PERSIAPAN PENGGABUNGAN

Kegiatan persiapan penggabungan terdiri dari pengambilan data dan

pengorganisasiannya, serta transfer data ke perangkat lunak yang akan digunakan dalam

penggabungan. Tahap pengambilan data dengan sistim jaringan berbeda dengan bukan sistim

jaringan. Penggunaan sistim jaringan lebih cepat dalam pengambilan data dibandingkan

bukan sistim jaringan. Dalam sistim jaringan juga ada dua cara. Cara pertama, data dari

beberapa komputer masuk ke dalam satu database di satu server. Cara kedua, data berada di

masing-masing komputer tetapi dapat diambil melalui jaringan tanpa harus mendatangi di

masing-masing komputer. Cara pertama lebih mudah dan cepat untuk proses pengambilan

data.

Pengambilan data entri sebaiknya dilakukan setelah jumlah record cukup banyak atau

diperkirakan setiap 1 sampai dengan 3 hari. Dalam hal ini satu folder dbase-rkd dari berbagai

komputer dikumpulkan dalam satu folder DATA10OKT di server, sebagai langkah awal

persiapan penggabungan data. Sebagai contoh pada gambar 3.1, dalam satu folder data10okt

berisi folder dbase-rkd-K1-10okt (berasal dari komputer 1 dan diambil pada tanggal 10

Oktober), folder dbase-rkd-K2-10okt (berasal dari komputer 2 dan diambil pada tanggal 10

Oktober), dan seterusnya.

Gambar 3.1

Page 6: ModulPenggabunganData spss

4

Dalam folder-folder seperti gambar 3.1 terdiri dari 7 file dbase seperti yang tertulis

pada bab 2. Ketujuh file dari masing-masing folder tersebut harus ditransfer ke dalam bentuk

data *.sav karena proses penggabungan data Riskesdas menggunakan perangkat lunak SPSS.

3.1 Transfer File

Langkah-langkah untuk transfer file sebagai berikut:

- Aktifkan Program SPSS

- Pilih menu File

- Pilih perintah Open dan lanjutkan dengan perintah Data

Gambar 3.2

- Pilih folder yang akan dibuka pada kotak atas Look in, letakkan cursor pada tanda ▼.

Sebagai contoh pada gambar 3.3 yang dipilih adalah folder C:\hasil entri\dbase-rkd-K1-

10okt

- Pilih file data yang akan diaktifkan. Jika belum tampak nama file di layar monitor, lihat

type yang menjadi default dari perangkat lunak tersebut. Default type dari SPSS adalah

SPSS(*.sav). Type dari file data yang akan diaktifkan dapat dipilih dari perintah File of

type di kotak bagian bawah, letakkan cursor pada tanda ▼ dan pilih dBase (*.dbf)

- Setelah tampak seperti gambar 3.4 maka buka satu per satu file *.dbf tersebut, dengan

cara cursor diletakkan pada nama file dan lanjutkan dengan perintah Open.

- Setelah data terbuka pada lembar kerja data SPSS, lanjutkan dengan perintah Save yang

berada di bawah menu File

- Pada lembar perintah Save Data As, ganti Save as type – nya menjadi *.sav dan isi File

Name dengan nama file yang sedang diaktifkan (jika menggunakan sistim jaringan dan

Page 7: ModulPenggabunganData spss

5

menyimpan dalam satu database) dan ditambah dengan nama komputer jika database

disimpan sementara dalam masing-masing komputer pengentri. Lihat gambar 3.5.

Gambar 3.3 Gambar 3.4

Gambar 3.5

Gambar 3.6

Page 8: ModulPenggabunganData spss

6

Pada gambar 3.7 memperlihatkan file hasil transfer dari *.dbf ke *.sav. Daftar file tersebut

dapat dilihat pada Windows Explorer.

Gambar 3.7 Pergunakan langkah-langkah di atas untuk melanjutkan proses transfer seluruh file data yang

sudah dikerjakan pada masing-masing komputer.

3.2 Pengelompokan File Data

Setelah seluruh file sudah selesai ditransfer maka buatlah satu folder data gabung,

sebagai contoh beri nama DATA GABUNG 10 OKT. Di dalam folder tersebut, kembali

dibuat nama folder kosong sesuai dengan nama-nama *.dbf pada dbase-rkd , yaitu:

Gambar 3.8

- RT

- RT_4

- RT_5

- BAG_ABCEF

- BAG_D

- BAG_GH

- PENGUKURAN

Page 9: ModulPenggabunganData spss

7

Setelah membuat folder-folder sesuai dengan kelompok nama file, langkah selanjutnya

memindahkan file-file sesuai dengan nama kelompoknya. Sebagai contoh: pindahkan seluruh

file yang sudah dalam bentuk *.sav dari folder dbase-K2-10okt ke folder DATA GABUNG

10 OKT. Masukkan file *.sav ke masing-masing folder yang sesuai. Lakukan proses ini untuk

file-file yang berasal dari komputer lain.

Gambar 3.9

Gambar 3.10 adalah contoh hasil pengelompokan bag_abcef yang berasal dari Komputer 1

sampai dengan Komputer 5.

Gambar 3.10

Page 10: ModulPenggabunganData spss

8

4. PENGGABUNGAN DATA

Seluruh data hasil entri yang berasal dari beberapa komputer, harus digabungkan

sesuai dengan unit analisa dan nama-nama variabelnya. Unit analisa yang dimaksud di sini

adalah jika data-data tersebut menggambarkan level jumlah rumah tangga maka data tersebut

dikelompokkan menjadi satu. Demikian juga data-data yang menggambarkan level jumlah

individu maka data tersebut dikelompokkan menjadi satu.

Selain unit analisa, nama variabel juga menjadi pertimbangan pengelompokan. Satu

kelompok data mempunyai variabel yang sama, sebagai contoh pada data Riskesdas jika file

yang akan digabung adalah Blok VI maka seluruh file dari berbagai komputer harus berisi

variabel-variabel dari Blok VI.

Penggabungan data yang harus dilakukan untuk data Riskesdas adalah 2 cara. Cara

pertama bertujuan untuk menambah variabel, sehingga jumlah “file akhir” tidak banyak. Cara

kedua bertujuan untuk menambah record, sehingga dapat tergabung seluruh sampel

Riskesdas. Penggabungan dengan tujuan menambah variabel harus memperhatikan unit

analisanya, untuk data Riskesdas dapat digabung sebagai berikut:

FILE 1 File rt.DBF berisi data-data Rumah Tangga mencakup Blok I sampai

dengan Blok III dan Blok VI sampai dengan Blok VIII FILE 2 File rt_blok5.DBF berisi data-data Anggota Rumah Tangga yang meninggal

mencakup blok V dan catatan FILE 3

1. File rt_blok 4.DBF berisi data-data Anggota Rumah Tangga mencakup blok IV 2. File bag_abcef.DBF berisi data-data Individu bagian A, B, C, E dan F 3. File bag_d.DBF berisi data-data Individu khusus blok D 4. File pengukuran.DBF berisi data-data Individu Blok XI Pengukuran dan catatan FILE 4 File bag_gh.DBF berisi data-data Individu blok g dan h (khusus balita)

Hasil akhir dari proses penggabungan adalah data Riskesdas tersimpan dalam empat

file dan mempunyai record pada file Rumah tangga kurang lebih 280.000 record yang

meliputi seluruh wilayah provinsi di Indonesia dan file individu secara umum diperkirakan

sekitar 1.260.000 record.

Langkah-langkah penggabungan file dapat dilihat sebagai berikut.

Page 11: ModulPenggabunganData spss

9

4.1 Variabel Kunci

Variabel kunci diperlukan untuk penggabungan file yang bertujuan menambahkan

variabel. File data yang dihasilkan dari program entri Riskesdas sudah membentuk variabel

kunci secara otomatis yaitu idrt dan idart. Variabel idrt digunakan untuk penggabungan data

dalam level Rumah Tangga. Variabel idart digunakan untuk penggabungan data dalam level

Individu.

Dalam membuat variabel kunci, perlu pemahaman terhadap type data. Tipe variabel

numeric atau string (karakter), keduanya dapat digunakan membuat variabel kunci. Jika

variabel kunci belum dibuat, type varibel sangat penting diperhatikan karena tingkat

ketelitiannya berbeda. Dianjurkan untuk membuat variabel kunci dengan variabel bertipe

string supaya tidak banyak membuat kesalahan. Gambar 4.1 memperlihatkan variabel kunci

idrt yang sudah otomatis dibuat oleh program entri. Type variabel dapat dilihat seperti contoh

pada gambar 4.2.

Gambar 4.1

Gambar 4.2

Page 12: ModulPenggabunganData spss

10

Jika variabel kunci belum ada atau ingin membuat variabel kunci baru, dapat

dilakukan dengan perintah Compute dalam menu bar Transform. Variabel kunci idrt dapat

dibuat dari gabungan variabel keterangan tempat, seperti kode provinsi, kode kabupaten, dan

seterusnya (contoh variabel b1r1, b1r2, b1r3, b1r4, b1r5, b1r7, b1r8). Jika variabel kunci idart

yang akan dibuat, variabel yang diperlukan b1r1, b1r2, b1r3, b1r4, b1r5, b1r7, b1r8, b4k1.

Gambar 4.3

Langkah-langkah: (lihat gambar 4.3)

1. Semua variabel yang akan dijumlahkan dan variabel baru sebagai tempat

penjumlahan harus dalam status string

2. Lebar variabel baru yang akan dibuat harus sama dengan penjumlahan lebar semua

variabel

3. Pilih menu Transform dan click dua kali pada perintah Compute

4. Isi kotak Target Variable dengan Nama variabel baru

5. Pilih perintah Type & Label, pastikan variabel baru dalam String dan jumlah digit

sama dengan jumlah digit seluruh variabel yang akan dibuat variabel kunci

6. Pilih Concat pada kotak Function, pindahkan ke kotak String Expression

7. Pindahkan seluruh variabel di kotak sebelah kiri yang akan dijumlahkan ke kotak

String Expression di kotak sebelah kanan

4.2 Proses Penggabungan Data

Salah satu fungsi penting yang dapat digunakan dari menu Data adalah penggabungan

data. Ada 2 macam penggabungan yang dapat dilakukan, yaitu menambah observasi pada

variabel yang sama atau menambah variabel dalam satu file. Dalam proses penggabungan

Page 13: ModulPenggabunganData spss

11

data yang bertujuan menambah variabel, memerlukan variabel kunci sebagai penghubung

antar 2 file.

Untuk melakukan hal tersebut, dalam menu bar Data pilih perintah merge files.

i. Add variables, perintah ini untuk menambah variabel dari file lain. Hal penting yang harus

diperhatikan pada proses penggabungan ini adalah variabel kunci sebagai penghubung 2

file yang akan digabung harus sama.

Terdapat 2 macam cara penggabungan file untuk menambah variabel:

1. One to One, menggabungkan 2 file data yang masing-masing record-nya mempunyai

variabel kunci yang unik, misalnya file “Blok 4 yang berisi data karakteristik

individu” sebagai file I akan digabung dengan file “bag_abcef yang berisi data

penyakit” sebagai file II.

Langkah-langkahnya sebagai berikut:

(Lihat Gambar 4.4)

1. Buka file pertama, jika diperlukan buat variabel kunci (idart)

2. Sort variabel kunci secara ascending dengan perintah Sort cases di bawah

menu bar Data. File setelah di-sort kemudian disimpan dengan perintah Save

3. Buka file kedua, buat variabel kunci (id)

4. Sort variabel kunci secara ascending dengan perintah Sort cases di bawah

menu bar Data. File setelah di-sort kemudian disimpan dengan perintah Save.

Gambar 4.4

Page 14: ModulPenggabunganData spss

12

(Lihat Gambar 4.5)

5. Pilih menu Data kemudian pilih merge file

6. Pilih Add variables

7. Pilih File yang akan digabungkan, tekan icon Open

(Lihat Gambar 4.6)

8. Beri tanda pada Match cases on key variables in sorted files

9. Pilih Both files provide cases

10. Pindahkan variabel kunci yang terdapat pada kotak Excluded Variables ke

dalam kotak Key Variables, tekan OK

11. Lakukan perintah Save as.

Gambar 4.5

Gambar 4.6

Page 15: ModulPenggabunganData spss

13

2. One to many, menggabungkan 2 file data yang salah satunya mempunyai variabel kunci

yang unik dan file lainnya satu variabel kunci dimiliki oleh beberapa record, misalnya file

“rumah tangga yang berisi Keterangan Rumah Tangga” akan digabung dengan file

“individu yang berisi data karakteristik Anggota Rumah Tangga”.

Langkah-langkahnya sebagai berikut:

(Lihat Gambar 4.7)

1. Buka file pertama (file rumah tangga), jika diperlukan buat variabel kunci (idrt)

2. Sort variabel kunci secara ascending dengan perintah Sort cases di bawah menu

bar Data. Setelah di-sort kemudian disimpan dengan perintah Save.

3. Buka file kedua (file individu), jika diperlukan buat variabel kunci (idrt)

4. Sort variabel kunci secara ascending dengan perintah Sort cases di bawah menu

Data. File setelah di-sort kemudian disimpan dengan perintah Save.

Gambar 4.7

Page 16: ModulPenggabunganData spss

14

(Lihat Gambar 4.8)

5. Pilih menu Data kemudian pilih merge file

6. Pilih Add variables

7. Pilih File yang akan digabungkan (file rumah tangga yang sudah di sort)

8. Beri tanda pada Match cases on key variables in sorted files

9. Pilih External file is keyed table

Catatan:

• Jika file yang terakhir aktif adalah file yang mempunyai variabel kunci unik

dimiliki oleh beberapa record maka pilih External file is keyed table

Gambar 4.8

Page 17: ModulPenggabunganData spss

15

• Jika file yang terakhir aktif adalah file yang mempunyai variabel kunci unik di

masing-masing record, maka yang dipilih adalah Working data file is keyed table

(Gambar 4.9)

Gambar 4.9

10. Pindahkan variabel kunci (idrt) yang terdapat pada kotak Excluded Variables ke

dalam kotak Key Variables, tekan OK

11. Lakukan perintah Save as.

ii. Add cases, perintah ini untuk menambah observasi (record) dari file lain. Dalam proses

penambahan jumlah observasi, tidak diperlukan variabel kunci, namun hal penting yang

harus diperhatikan pada proses ini adalah nama variabel antar file yang ingin digabungkan

harus sama. Misalnya File bag_acef_k1 berisi variabel ca01, ca02, dan ca03a maka File

bag_acef_k2 juga harus berisi variabel yang sama ca01, ca02, dan ca03a. Proses

penambahan observasi dapat dimulai sebagai berikut:

Page 18: ModulPenggabunganData spss

16

(Lihat gambar 4.10)

1. Buka File 1 (misal bag_abcef_k1.sav)

2. Pilih menu bar Data

3. Pilih perintah merge file dan lanjutkan dengan add cases

4. Pilih File 2 (misal bag_abcef-k2.sav) dan tekan Open

Gambar 4.10

Gambar 9.

5. Lihat tampilan gambar 4.11. Jika ada variabel yang berbeda antara kedua file

tersebut akan terlihat dalam kotak Unpaired Variables. Akhiri proses ini dengan

menekan OK

Gambar 4.11

Page 19: ModulPenggabunganData spss

17

6. Setelah pilih OK maka jumlah record akan bertambah pada file yang sedang aktif

(lihat gambar 4.12)

Gambar 4.12

7. Lanjutkan dengan menyimpan data hasil gabungan. Sebaiknya gunakan perintah

Save As agar file yang sedang aktif masih merupakan file asli. File-file asli yang

tidak diubah berguna untuk penelusuran jika terjadi kesalahan penggabungan

atau kesalahan pada saat proses imputasi.

Gambar 4.13