Program Magister Ilmu Kesehatan Masyarakat,...

13
Program Magister Ilmu Kesehatan Masyarakat, Program Pascasarjana, Universitas Sebelas Maret ---------------------------------------- 1 | Prof Bhisma Murti VARIABEL “The greatest of faults, I should say, is to be conscious of none” - Thomas Carlyle Pengumpulan data dalam penelitian adalah mengukur variabel. Pengukuran (measurement) adalah prosedur menentukan kuantitas atau kualitas dari karak- teristik subjek penelitian yang disebut variabel. Secara etimologis, variabel atau “variable” berasal dari kata “vary” dan “able”. Jadi variabel merupakan sesuatu yang bisa bervariasi (beragam). Variabel merupakan entitas atau karakteristik, dari individu, kasus, atau subjek penelitian, yang memiliki variasi nilai atau atribut, baik variasi antar waktu atau antar individu. Contoh, tekanan darah merupakan variabel, sebab bisa bervariasi antar individu, misalnya 110 mmHg, 120 mmHg, 125 mmHg. Pengukuran (disebut juga pengamatan, observasi) variabel merupakan elemen kunci metodologi riset epidemiologi. Pengukuran yang benar terhadap varia- bel penelitian merupakan prinsip yang tidak dapat dikompromikan dari sebuah riset. Pengukuran variabel menghasilkan sekumpulan nilai atau atribut dari individu- individu yang disebut data. Data dianalisis untuk menghasilkan informasi. Informasi diinterpretasikan dan digunakan oleh pengguna hasil penelitian. Kesalahan dalam pengukuran, disebut measurement bias (measurement error), menghasilkan data yang tidak valid, mengakibatkan hasil-hasil penelitian tidak valid, tidak benar, tidak sah. Kesalahan dalam pengukuran merupakan kesalahan yang sangat serius, jauh lebih serius daripada besar sampel (sample size) yang sering dipersoalkan oleh orang-orang yang awam dalam metodologi riset, baik di dalam maupun di luar kampus. Ibarat orang menembak ke sasaran tembak, laras senapan yang digunakan hendaknya lurus, tidak lancung (bengkok). Senapan lancung (measurement error) tidak akan mengenai sasaran dengan benar meski digunakan berkali-kali (ukuran sampel besar). Makalah ini menjelaskan berbagai aspek variabel, mencakup definisi dan klasifikasi variabel berdasarkan level (tingkat pengukuran). Setiap penjelasan umumnya disertai dengan contoh. VARIABEL Variabel adalah entitas, atau karakteristik dari individu, kasus, atau subjek penelitian yang memiliki variasi nilai kuantitatif atau kategori kualitatif, baik variasi antar waktu atau antar individu (Vogt, 1993; Streiner dan Norman, 2000). Contoh, umur merupakan variabel, sebab umur bervariasi nilai antar individu, atau antar waktu pada individu yang sama, misalnya 1 tahun, 5 tahun, 17 tahun, 22 tahun, 35 tahun, 50 tahun, 70 tahun. Tekanan darah merupakan variabel, karena memiliki variasi nilai dalam satuan mmHg. Tetapi variabel tidak harus memiliki nilai kuantitatif alias numerik, bisa juga nilai kualitatif alias atribut. Atribut adalah nilai kualitatif spesifik dari suatu variabel. Contoh, variabel seks (gender, jenis kelamin) memiliki dua atribut, yaitu laki-laki atau perempuan. Laki-laki dan perempuan bukan variabel, melainkan atribut dari variabel seks atau gender.

Transcript of Program Magister Ilmu Kesehatan Masyarakat,...

Page 1: Program Magister Ilmu Kesehatan Masyarakat, …fkm.malahayati.ac.id/wp-content/uploads/2015/12/Variabel...... maka terhadap data variabel interval dapat dihitung mean. Variabel rasio

Program Magister Ilmu Kesehatan Masyarakat, Program Pascasarjana, Universitas Sebelas Maret ----------------------------------------

1 | Prof Bhisma Murti

VARIABEL

“The greatest of faults, I should say, is to be conscious of none” - Thomas Carlyle

Pengumpulan data dalam penelitian adalah mengukur variabel. Pengukuran (measurement) adalah prosedur menentukan kuantitas atau kualitas dari karak-teristik subjek penelitian yang disebut variabel. Secara etimologis, variabel atau “variable” berasal dari kata “vary” dan “able”. Jadi variabel merupakan sesuatu yang bisa bervariasi (beragam). Variabel merupakan entitas atau karakteristik, dari individu, kasus, atau subjek penelitian, yang memiliki variasi nilai atau atribut, baik variasi antar waktu atau antar individu. Contoh, tekanan darah merupakan variabel, sebab bisa bervariasi antar individu, misalnya 110 mmHg, 120 mmHg, 125 mmHg.

Pengukuran (disebut juga pengamatan, observasi) variabel merupakan elemen kunci metodologi riset epidemiologi. Pengukuran yang benar terhadap varia-bel penelitian merupakan prinsip yang tidak dapat dikompromikan dari sebuah riset. Pengukuran variabel menghasilkan sekumpulan nilai atau atribut dari individu-individu yang disebut data. Data dianalisis untuk menghasilkan informasi. Informasi diinterpretasikan dan digunakan oleh pengguna hasil penelitian. Kesalahan dalam pengukuran, disebut measurement bias (measurement error), menghasilkan data yang tidak valid, mengakibatkan hasil-hasil penelitian tidak valid, tidak benar, tidak sah. Kesalahan dalam pengukuran merupakan kesalahan yang sangat serius, jauh lebih serius daripada besar sampel (sample size) yang sering dipersoalkan oleh orang-orang yang awam dalam metodologi riset, baik di dalam maupun di luar kampus. Ibarat orang menembak ke sasaran tembak, laras senapan yang digunakan hendaknya lurus, tidak lancung (bengkok). Senapan lancung (measurement error) tidak akan mengenai sasaran dengan benar meski digunakan berkali-kali (ukuran sampel besar).

Makalah ini menjelaskan berbagai aspek variabel, mencakup definisi dan klasifikasi variabel berdasarkan level (tingkat pengukuran). Setiap penjelasan umumnya disertai dengan contoh.

VARIABEL

Variabel adalah entitas, atau karakteristik dari individu, kasus, atau subjek penelitian yang memiliki variasi nilai kuantitatif atau kategori kualitatif, baik variasi antar waktu atau antar individu (Vogt, 1993; Streiner dan Norman, 2000). Contoh, umur merupakan variabel, sebab umur bervariasi nilai antar individu, atau antar waktu pada individu yang sama, misalnya 1 tahun, 5 tahun, 17 tahun, 22 tahun, 35 tahun, 50 tahun, 70 tahun. Tekanan darah merupakan variabel, karena memiliki variasi nilai dalam satuan mmHg. Tetapi variabel tidak harus memiliki nilai kuantitatif alias numerik, bisa juga nilai kualitatif alias atribut. Atribut adalah nilai kualitatif spesifik dari suatu variabel. Contoh, variabel seks (gender, jenis kelamin) memiliki dua atribut, yaitu laki-laki atau perempuan. Laki-laki dan perempuan bukan variabel, melainkan atribut dari variabel seks atau gender.

Page 2: Program Magister Ilmu Kesehatan Masyarakat, …fkm.malahayati.ac.id/wp-content/uploads/2015/12/Variabel...... maka terhadap data variabel interval dapat dihitung mean. Variabel rasio

Program Magister Ilmu Kesehatan Masyarakat, Program Pascasarjana, Universitas Sebelas Maret

----------------------------------

Terdapat sejumlah cara membedakan variabel, tetapi yang terpenting adalah pembagian ke dalam dua jenis: (1) variabel kategorikal/ kualitatif, dan (2) variabel metrik/ numerik/ kuantitatif. Variabel metrik/ numerik/ kuantitatif bisa dibedakan menjadi: (1) variabel diskret; dan (2) variabel kontinu. Contoh variabel diskret: jumlahbayi yang diimunisasi per hari (tidak bisa 30.5 bayi per hari, melainkan 30 bayi per hari atau 31 bayi per hari). Contoh variabel kontinu: kadar hemoglobin (10.5 g/dL, 11,7 g/dL, 12.0 g/dl). Meskipun demikian variabel metrik/ numerik/ kuantitatif tersebut dalam jurnal internasional lazim disebut variabel kontinu, dengan kata lain: variabel metrik= numerik= kuantitatif= kontinu.

Pembedaan jenis variabel antara variabel kategorikal versus kontinu sangat penting untuk lima keperluan:

1. Memilih statistik deskriptif yang tepat 2. Memilih ukuran hubungan yang tepat 3. Memilih uji statistik yang tepat 4. Memilih model analisis statistik yang tepat 5. Memilih rumus besar sampel yang tepat

Contoh: jika data kontinu, berdistribusi normal, maka statistik deskriptif yang tepat untuk menggambarkan (mendeskripsikan) data adalah mean dan standa deviasi (SD). Uji statistik untuk dua kelompok data dengan karakteristik seperti itu, jika berasal dari pengamatan yang independen, adalah uji t. Rumus yang tepat untuk memperkirakan besar sampel dalam penelitian itu adalah rumus besar untuk menguji hipotesis tentang perbedaan mean dari dua kelompok. Gambar 1 menyajikan diagram tentang klasifikasi variabel berdasarkan level pengukuran.

Variabel kategorikal, disebut juga variabel kualitatif, non-metrik, atau variabel kualitatif, yaitu variabel yang terdiri atas kategori-kategori yang berbeda secara kualitatif dan terpisah satu dengan lainnya (Kleinbaum et al., 1988).Vogt, 1993). Variabel kategorikal tidak menunjukkan suatu kesinambungan (kontinuitas) variasi nilai-nilai. Contoh, mortalitas (mati/ hidup), morbiditas (berpenyakit/ normal), ras

Kategorikal (kualitatif)

Metrik (numerik, kontinu, kuantitatif)

Nominal (Seks, ras)

Variabel

Gambar 1. Klasifikasi variabel

Rasio (BB, TB, elektrolit serum)

Ordinal (Stadium kanker, kelas sosial)

Kontinu Diskret (jumlah pasien

per hari)

Interval (Suhu Celcius)

Page 3: Program Magister Ilmu Kesehatan Masyarakat, …fkm.malahayati.ac.id/wp-content/uploads/2015/12/Variabel...... maka terhadap data variabel interval dapat dihitung mean. Variabel rasio

Program Magister Ilmu Kesehatan Masyarakat, Program Pascasarjana, Universitas Sebelas Maret -------------------------------------------

3 | Prof Bhisma Murti

(kaukasoid/ mongoloid/ negroid), merupakan variabel kategorikal, sebab terdiri dari kategori-kategori. Demikian pula, mortalitas tidak memiliki variasi nilai-nilai kontinu, misalnya 1/1000 mati, 2/1000 mati, 3/1000 mati, dan seterusnya, melain-kan memiliki variasi kategori, yakni mati (= 1000/1000 mati) atau hidup (=0/1000 mati). Contoh lainnya, Physicians’ Health Study (Hennekens et al., 1996) merupakan sebuah Randomized Controlled Trial (RCT) yang meneliti hubungan antara penggu-naan aspirin dan pencegahan primer infark otot jantung. Penggunaan aspirin meru-pakan variabel kategorikal terdiri dari kategori-kategori, misalnya menggunakan aspirin, atau tidak menggunakan aspirin. Demikian pula, infark otot jantung meru-pakan variabel, terdiri dari kategori-kategori, yaitu mengalami infark otot jantung, atau tidak mengalami infark otot jantung.

Variabel metrik (numerik, kontinu, kuantitatif) adalah variabel yang terdiri dari nilai-nilai yang berkesinambungan (kontinu) dengan variasi nilai yang secara konseptual tak terbatas (Kleinbaum et al., 1988). Variabel metrik dapat dibedakan ke dalam dua jenis: (1) Variabel diskret; dan (2) Variabel kontinu. Variabel diskret merupakan variabel yang pengukurannya menghasilkan nilai kuantitatif yang bulat, bukan nilai kuantitatif pecahan atau desimal. Contoh: jumlah bayi yang diimunisasi per hari, jumlah pasien yang mengunjungi klinik per hari. Variabel kontinu merupakan variabel yang pengukurannya menghasilkan nilai kuantitatif hingga pecahan atau desimal. Contoh: tekanan darah (mmHg), kadar hemoglobin (g/dl), kadar gula darah (mg/dl), tinggi badan (cm), berat badan (kg), body mass index (kg/m2), dan berbagai keadaan subjektif, seperti nyeri, dan kualitas hidup terkait kesehatan (HRQoL), merupakan variabel kontinu.

Variabel kategorikal merupakan variabel yang pengukurannya “hanya” menghasilkan kategori. Variabel kategorikal dapat dibedakan menjadi dua jenis: (1) Variabel nominal; dan (2) Variabel ordinal. Variabel nominal merupakan kategori yang memiliki nama alias atribut. Contoh: mortalitas (mati/hidup), morbiditas (sakit/ normal), jenis kelamin (laki–laki/perempuan), tekanan darah (hipertensi/ normotensi), ras (kaukasoid, mongoloid, negroid). Atribut dalam variabel nominal tidak bisa diurutkan, dan jarak atribut (kategori) satu dengan lainnya tidak memiliki interval yang sama, sehingga tidak bisa dihitung rata-rata (mean). Contoh, terhadap variabel seks jelas tidak dapat dibuat rata-rata. Tetapi dalam analisis data peneliti boleh saja menghitung mean dari variabel nominal, hanya saja harus ditafsirkan sebagai proporsi. Contoh, jika laki-laki diberi kode 0, perempuan kode 1, maka andaikata mean= 0.6 maka hal itu berarti proporsi perempuan adalah 0.6, sedang laki-laki 0.4.

Variabel ordinal merupakan variabel yang pengukurannya menghasilkan kategori yang bisa diurutkan atau dibuat peringkat (rank). Contoh: stadium kanker (I/II/III/IV), status sosial ekonomi (tinggi/ menengah/ bawah). Tetapi antara satu kategori dengan kategori lainnya tidak terdapat interval atau jarak yang sama, sehingga terhadap variabel ordinal tidak bisa dihitung rata-rata. Demikian juga pendapat subjek penelitian tentang suatu hal bisa didefinisikan terdiri dari sejumlah atribut (lazimnya lima atribut) menghasilkan data berskala ordinal: (1) Sangat tidak setuju; (2) Tidak setuju; (3) Netral; (4) Setuju; (5) Sangat setuju.

Variabel nominal maupun ordinal tidak memiliki interval yang sama antara satu atribut dan atribut lainnya, sehingga tidak bisa dibuat histogram tentang distribusi frekuensi, tidak mengenal distribusi normal teoretis Gauss, dan tidak

Page 4: Program Magister Ilmu Kesehatan Masyarakat, …fkm.malahayati.ac.id/wp-content/uploads/2015/12/Variabel...... maka terhadap data variabel interval dapat dihitung mean. Variabel rasio

Program Magister Ilmu Kesehatan Masyarakat, Program Pascasarjana, Universitas Sebelas Maret

----------------------------------

memiliki mean (sebuah ukuran tendensi sentral). Implikasinya, kelompok-kelompok sampel tidak bisa dibedakan berdasarkan mean, dan tidak bisa diuji dengan statistik uji parametrik seperti uji t dan uji F. Sebagai gantinya, beda atribut variabel tersebut dideskripsikan dengan diagram balok, pie chart, dan sebagainya. Beda kelompok-kelompok sampel diuji dengan metode statistik non-parametrik (tidak menggunakan perbedaan mean), misalnya uji Chi Kuadrat, uji Proporsi, Wilcoxon, Mann-Whitney, Friedman, Kruskall-Wallis, dan sebagainya (Murti, 1996).

Variabel kontinu dapat dibedakan menjadi dua jenis: (1) Variabel interval; dan (2) Variabel rasio. Variabel interval merupakan variabel di mana interval atau selisih antara nilai-nilai pengukuran memiliki arti kuantitatif. Contoh: suhu (derajat Celcius), tekanan darah (mmHg). Interval 0-1 derajat C memiliki kalor (=panas) yang sama dengan interval 2-3 derajat C, 14-15 derajat C, 19-20 derajat C, dan sebagainya. Dengan demikian dapat dikatakan suhu 40 derajat C memiliki kalor 20 derajat lebih tinggi daripada suhu 20 derajat C. Tetapi karena suhu 0 derajat Celcius bukan merupakan titik absolut ketiadaan panas, maka 40 derajat C tidak berarti menunjukkan kalor 2 kali suhu 20 derajat C. Karena masing-masing nilai yang berurutan memiliki perbedaan kuantitatif yang sama, maka terhadap data variabel interval dapat dihitung mean.

Variabel rasio merupakan variabel di mana rasio (= perbandingan) antar nilai pengukuran memiliki arti kuantitatif, karena memiliki nilai nol absolut. Contoh: suhu (derajat Kelvin), berat badan (kg), tinggi badan (cm) adalah variabel rasio, sebab memiliki nilai nol absolut sebagai titik referensi perbandingan. Jadi, ayah berbobot 70 kg dapat diartikan 2 kali bobot anak 35 kg, sebab 0 kg merupakan 0 absolut dalam arti tanpa bobot sama sekali.

Variabel interval maupun variabel rasio memiliki interval, sehingga kedua variabel kontinu itu memiliki distribusi frekuensi. Implikasinya, kedua variabel kontinu mengenal distribusi normal teoretis Gauss, dan peneliti dapat menggunakan metode statistik parametrik seperti uji t dan uji F yang berbasis dis-tribusi normal untuk menguji perbedaan kelompok-kelompok sampel dalam hal kedua variabel itu. Variabel interval dan rasio dalam ilmu ekonomi disebut juga variabel kardinal.

Skor yang diperoleh dari pengukuran dengan skala Likert sejatinya merupa-kan variabel ordinal. Tetapi jika nilai dari data ordinal tersebut banyak, maka data variabel ordinal tersebut akan mendekati kontinu. “Generally long ordinal scales, or scales with a large number of discrete categories, are treated as continuous data for the purpose of analysis” (Alderson dan Green, 2002). Contoh, variabel depresi diukur dengan menggunakan kuesioner yang terdiri atas 10 item pertanyaan, dengan ≥5 respons skala Likert. Pengukuran variabel dengan kuesioner dengan skala Likert tersebut, dengan 5 respons bertingkat, menghasilkan data ordinal. Tetapi karena variabel depresi tidak hanya diukur dengan sebuah pertanyaan, melainkan 10 pertanyaan, maka hasil pengukuran menghasilkan data terdiri atas 50 respons atau nilai (10 pertanyaan x 5 respons). Karena skor yang dihasilkan cukup banyak, maka skala ordinal mendekati sifat kontinu. Implikasinya, peneliti bisa menggunakan mean dan uji statistik berbasis distribusi normal seperti uji t dan uji F untuk menguji perbedaan kelompok-kelompok. Sebaliknya, makin sedikit skor ordinal, makin sulit mengatakannya memiliki sifat kontinu, dan peneliti tidak boleh menggunakan mean dan uji statistik berbasis distribusi normal untuk menguji perbedaan kelompok-

Page 5: Program Magister Ilmu Kesehatan Masyarakat, …fkm.malahayati.ac.id/wp-content/uploads/2015/12/Variabel...... maka terhadap data variabel interval dapat dihitung mean. Variabel rasio

Program Magister Ilmu Kesehatan Masyarakat, Program Pascasarjana, Universitas Sebelas Maret -------------------------------------------

5 | Prof Bhisma Murti

kelompok. Penulis buku dan artikel pada jurnal internasional umumnya mengang-gap data ordinal dengan rentang minimal 10 skor ordinal sebagai data kontinu (Streiner dan Norman, 2000).

Sejumlah dosen dan mahasiswa gemar menggunakan istilah “variabel rasional”, bukan “variabel rasio”. Benarkah pemakaian istilah itu? Salah. Kata “rasio” dalam variabel rasio berasal dari kata Inggris “ratio”, yang berarti perbandingan, dan tidak ada hubungannya dengan masalah rasionalitas maupun nalar. Penggunaan istilah “variabel rasional” menyesatkan pemakainya, seolah hanya variabel rasio yang rasional, dan semua variabel lainnya irasional, tidak masuk di akal, tidak nalar.

Kesalahan “fatal” lainnya adalah anggapan bahwa skala rasio lebih baik daripada interval, interval lebih baik daripada ordinal, ordinal lebih baik daripada nominal. Jika menuruti pemikiran sesat itu, maka pengukuran jenis kelamin merupakan contoh pengukuran yang buruk tentang variabel, karena hanya menghasilkan data dalam skala nominal, yakni laki-laki dan perempuan, bukan 1/8 laki-laki dan 7/8 perempuan, 1/5 laki-laki dan 4/5 perempuan, dan sebagainya. Demikian pula andaikata skala rasio dan interval lebih baik daripada ordinal dan nominal, maka setiap dokter yang mendiagnosis pasien berpenyakit X atau tidak berpenyakit X, atau mendiagnosis pasien mengalami hipertensi atau normal sebelum memutuskan untuk mengobati atau tidak mengobati tekanan darah pasien, telah melakukan langkah keliru. Anggapan tersebut salah dan tersesat.

Variabel kontinu memiliki perbedaan esensial dengan variabel kategorikal. Hasil pengukuran variabel kontinu dapat ditransformasi menjadi variabel kategorikal, disebut data collapsing (Murti, 1996). Sebaliknya variabel kategori tidak dapat diubah menjadi kontinu. Contoh, Indeks Massa Tubuh (= Body Mass Index) mula-mula merupakan pengukuran kontinu (kg/m2). Menurut WHO (Weisell, 2002), untuk orang Asia, BMI dapat diubah menjadi kategori obese II (BMI≥ 30 kg/m2), obese I (BMI 25-29.9 kg/m2), berisiko obesitas (23-24.9 kg/m2), normal (BMI 19-22.9 kg/m2), dan berat badan kurang (≤18.9 kg/m2).

Sebaliknya variabel kategorikal seperti jenis kelamin tidak dapat diubah menjadi kontinu. Implikasinya, peneliti hendaknya mengukur dan mencatat variabel kontinu diukur dalam skala kontinu, bukan dalam skala kategorikal. Contoh, tekanan darah sebaiknya diukur dan dicatat dalam unit mmHg, jangan dalam kate-gori “hipertensi” versus “normal”. Dua alasan melatari anjuran tersebut. Pertama, variabel yang terukur dalam kategori tidak mungkin dihitung rata-rata. Demikian pula income sebaiknya diukur dan dicatat dalam unit Rupiah, bukan dalam kategori Rupiah, karena jika diukur dalam kategori tidak mungkin dihitung rata-rata. Kedua, bukti-bukti riset menunjukkan, tekanan darah memiliki hubungan dengan risiko penyakit kardiovaskuler (CVD); hubungan tersebut bersifat langsung, bertingkat, dan kontinu. Peningkatan risiko CVD sudah dimulai sejak tekanan darah sistolik (TDS) 115 mmHg dan tekanan darah diastolik (TDD) 75 mmHg (Verdecchia dan Angeli, 2005). Artinya, apabila peneliti hanya mencatat TDS dalam kategori hipertensi sistolik (TDS ≥140 mmHg) dan kategori tidak hipertensi sistolik (TDS <140 mmHg), maka ia tidak dapat lagi mengevaluasi peningkatan risiko CVD pada individu dengan TDS di dalam kategori itu, misalnya peningkatan risiko CVD pada individu dengan TDS ≥120 mmHg dibandingkan TDS <120 mmHg.

Semua skala pengukuran variabel penting, baik kategorikal maupun kontinu. Tetapi variabel yang paling banyak dijumpai dalam literatur, dan sangat berguna

Page 6: Program Magister Ilmu Kesehatan Masyarakat, …fkm.malahayati.ac.id/wp-content/uploads/2015/12/Variabel...... maka terhadap data variabel interval dapat dihitung mean. Variabel rasio

Program Magister Ilmu Kesehatan Masyarakat, Program Pascasarjana, Universitas Sebelas Maret

----------------------------------

dalam pembuatan keputusan epidemiologis maupun klinis adalah variabel kategori-kal dalam dua kategori, disebut variabel dikotomi. Variabel dikotomi lebih populer, informatif, praktis, dan “clinically useful” daripada variabel kontinu (Kleinbaum et al., 1982; Alderson dan Green, 2002). Contoh, klinisi umumnya mengambil keputusan klinis secara dikotomi, yakni memberikan obat antihipertensi kepada individu dengan TDS ≥140 mmHg dan tidak memberikan obat tersebut kepada individu dengan TDS <140 mmHg, meski bukti-bukti riset menunjukkan peningkatan risiko CVD sudah dimulai secara bertahap sejak TDS ≥115 mmHg. Demikian pula terhadap pasien yang telah diperiksa, klinisi akan membuat diagnosis secara dikotomi, bahwa pasien tersebut mengalami atau tidak mengalami suatu penyakit, bukannya secara kontinu bahwa pasien tersebut mengalami 1/100, 2/100, ......, 99/100 penyakit tersebut.

DUMMY VARIABLE

Dummy variable, disebut juga indicator variable atau design variable, adalah sebuah variabel kategorikal yang memiliki lebih dari dua kategori (k) yang diubah (direka) menjadi beberapa variabel dikotomi, diberi kode 0 bila tidak menunjukkan suatu kondisi, kode 1 bila menunjukkan kondisi tersebut (Kleinbaum et al., 1988 Hosmer dan Lemeshow, 1989; Pagano dan Gauvreau, 2000; Last, 2001 ). Kode 0 dan 1 dalam dummy variable tidak mengandung nilai kuantitatif yang sesungguhnya, karena itu disebut “kosong” (dummy). Kondisi dengan kode 0 lazimnya berfungsi sebagai rujukan (pembanding). Dummy variable berfungsi sebagai “penunjuk”, sehingga disebut juga indicator variable (Pagano dan Gauvreau, 2000).

Dummy variable biasanya digunakan sebagai salah sebuah variabel independen dalam analisis regresi, yaitu suatu model statistik yang dibuat untuk menjelaskan dan memprediksi perubahan-perubahan pada variabel dependen (Y) berdasarkan informasi sebuah atau lebih variabel independen (X1, X2,…, Xk) (Kleinbaum et al., 1988; Rosner, 1990). Dengan dummy variable dapat diketahui seberapa besar perubahan dari satu kondisi (kode 0) ke kondisi lainnya (kode 1) dari suatu variabel independen (Xi) membawa perubahan kepada variabel dependen (Y). Jumlah dummy variable yang dapat dibuat dari sebuah variabel independen katego-rikal yang memiliki k kategori adalah k – 1. Contoh: Menurut WHO, Indeks Massa Tubuh (BMI) untuk orang Asia dapat dibagi menjadi 5 kategori (Weisell, 2002). Jumlah dummy variable adalah = 5 – 1 = 4, yakni D1, D2, D3, D4. Tabel 1 menyajikan dummy variable BMI.

Tabel 1 Dummy variabel untuk variabel 5 kategori

Indeks Massa Tubuh (BMI) D1 D2 D3 D4

Berat badan kurang (≤ 18.9 kg/m2) 0 0 0 0

Normal (19-22.9 kg/m2) 0 0 0 1 Berisiko obesitas (23.-24.9 kg/m2) 0 0 1 0

Obese I (25-29.9 kg/m2) 0 1 0 0 Obese II (≥ 30 kg/m2) 1 0 0 0

Perhatikan, kategori berat badan kurang (underweight) dipilih sebagai kategori rujukan (pembanding), diwakili oleh D1=0, D2,=0, D3=0, dan D4=0. Jadi, subjek

Page 7: Program Magister Ilmu Kesehatan Masyarakat, …fkm.malahayati.ac.id/wp-content/uploads/2015/12/Variabel...... maka terhadap data variabel interval dapat dihitung mean. Variabel rasio

Program Magister Ilmu Kesehatan Masyarakat, Program Pascasarjana, Universitas Sebelas Maret -------------------------------------------

7 | Prof Bhisma Murti

penelitian yang memiliki nilai dummy variable D1=0, D2=0, D3=0, dan D4=0 termasuk dalam kategori underweight.

Berdasarkan kerangka hubungan kausal, variabel dapat dibedakan menjadi beberapa jenis: (1) Variabel Dependen; (2) Variabel Independen; (3) Kovariat; (4) Faktor Perancu; (5) Pengubah efek.

1. VARIABEL DEPENDEN

Variabel dependen adalah variabel yang dihipotesiskan dipengaruhi atau tergantung oleh variabel lain. Variabel dependen disebut juga variabel hasil (outcome variable), variabel terpengaruh, variabel terikat, variabel respons, regresan, prediktan, variabel endogen. Penggunaan padanan kata tergantung konteks analisis. Dalam studi epide-miologi, variabel dependen adalah penyakit, atau indikator keadaan kesehatan lainnya. Tabel 2 menyajikan terminologi variabel dalam studi analitik.

2. VARIABEL INDEPENDEN

Variabel independen adalah variabel yang dihipotesiskan mempengaruhi, menentukan, atau menjelaskan terjadinya variabel lainnya. Variabel independen dapat diubah sesuai keperluan, tetapi nilai-nilainya bukan merupakan masalah yang ingin dijelaskan dalam analisis. Variabel independen disebut juga variabel bebas, variabel pengaruh, variabel penjelas (explanatory variable), prediktor, regresor, dan sebagainya. Dalam studi observasional, variabel independen adalah paparan (exposure), disebut juga faktor penelitian (study factor). Dalam studi eksperimental, faktor penelitian adalah perlakuan (treatment) atau intervensi, diberikan secara se-ngaja kepada subjek penelitian. Contoh: Sebuah studi kohor meneliti dampak debu radioaktif pabrik cat yang mengandung radium terhadap Ca paru pada pekerja. Peneliti mengklasifikasikan subjek ke dalam kelompok terpapar dan tidak terpapar debu radioaktif berdasarkan kategori ukuran rad (radiation absorbed dose). Paparan dalam contoh ini merupakan variabel independen, diukur dalam skala dikotomi (kategorikal dalam dua kategori). Lalu peneliti mengikuti kohor selama suatu peri-ode waktu, mengamati apakah terjadi Ca paru atau tidak. Ca paru merupakan variabel dependen, diukur dalam skala dikotomi.

Tabel 2. Terminologi variabel dalam studi analitik

Variabel dependen Variabel independen

Variabel terikat/ tergantung/ terpengaruh Variabel bebas

Variabel dijelaskan (explained variable) Variabel penjelas (explanatory variable)

Variabel hasil (outcome variable) Variabel input (input variable)

Penyakit (disease) Paparan (exposure)

Efek (effect) Penyebab, kausa (cause)

Regresan Regresor

Prediktan Prediktor

Variabel respons (response variable) Stimulus

Variabel endogen Variabel eksogen

Page 8: Program Magister Ilmu Kesehatan Masyarakat, …fkm.malahayati.ac.id/wp-content/uploads/2015/12/Variabel...... maka terhadap data variabel interval dapat dihitung mean. Variabel rasio

Program Magister Ilmu Kesehatan Masyarakat, Program Pascasarjana, Universitas Sebelas Maret

----------------------------------

Ketika peneliti menempatkan hubungan variabel-variabel dependen dan independen dalam kerangka konseptual penelitian, maka ia sedang melakukan studi analitik. Tetapi studi analitik tidak harus memiliki variabel-variabel dependen dan independen. Studi korelasi (correlational study) tidak memiliki variabel-variabel dependen dan independen. Korelasi merupakan model statistik yang menganalisis hubungan dua variabel (X,Y) yang eksis bersama secara random (korelasi berasal dari “co-related”), tanpa mengasumsikan variabel mana mempengaruhi (independen) dan variabel mana dipengaruhi (dependen) (Rosner, 1990). Contoh, tinggi badan berkorelasi dengan berat badan anak balita, tetapi tidak dihipotesiskan “tinggi badan mempengaruhi berat badan” atau “berat badan mempengaruhi tinggi badan”, sehingga problem ini lebih tepat dianalisis dengan model korelasi. Karakte-ristik tersebut membedakan korelasi dengan regresi. Regresi merupakan teknik statistik untuk menjelaskan atau memprediksi variabilitas sebuah variabel dependen (Y) dengan menggunakan informasi dari sebuah atau lebih variabel independen (X1, X2, ….Xk) (Vogt, 1993; Rosner, 1990; Kleinbaum et al., 1988). Model regresi dengan eksplisit mengindikasikan variabel dependen dan variabel independen.

3. KOVARIAT

Tujuan studi analitik adalah meneliti hubungan variabel X1 dan Y, atau pengaruh variabel X1 terhadap variabel Y. Sesuai dengan namanya, kovariat (covariate) adalah variabel X2, X3, ..., Xk, yang seperti halnya X1 diduga bisa mempengaruhi terjadinya variabel Y, karena itu pengaruhnya ingin dikendalikan oleh peneliti (Vogt1993; Last, 2001). Kovariat juga disebut faktor ketiga (third factor), karena merupakan variabel di luar variabel dependen dan variabel independen utama yang menjadi perhatian peneliti. Kovariat bisa merupakan faktor perancu (confounding factor) atau pengu-bah efek (effect modifier (Last, 2001). Kovariat disebut juga concomitant variable, karena variabel itu “menyertai” variabel independen utama (Kothari, 1990). Kovariat disebut juga variabel kontrol (control variable), karena pengaruhnya terhadap vari-abel dependen akan dikendalikan.

Pengaruh kovariat dalam suatu eksperimen lazimnya dikontrol dengan teknik randomisasi. Tetapi pengaruh kovariat bisa juga dikendalikan dalam analisis data dengan teknik statistik tertentu, misalnya Analisis Kovarians. Analisis kovarians (disingkat ANCOVA, atau ANACOVA, atau ANOCOVA) merupakan “saudaranya” ANOVA, hanya saja terhadap model ANOVA kali ini ditambahi sebuah variabel independen yang disebut kovariat. Baik ANOVA maupun ANCOVA merupakan “special case” analisis regresi ganda. Dalam model ANCOVA, variabel dependen diu-kur dalam skala kontinu, faktor penelitian terukur dalam skala kategorikal (misalnya, kelompok eksperimen dan kelompok kontrol), dan kovariat terukur dalam skala kontinu (Rosner, 1990; Kothari, 1990; Kleinbaum et al., 1988).

Contoh: sebuah eksperimen berminat meneliti efikasi obat antikolesterol. Untuk mengetahui pengaruh obat dalam menurunkan kadar kolesterol, peneliti mengukur kadar kolesterol sebelum dan sesudah pemberian obat, menggunakan sebuah desain eksperimen kuasi yang disebut “before and after with no comparison design”. Kadar kolesterol sebelum pemberian obat tentu mempengaruhi kadar kolesterol sesudah pemberian obat. Salah satu cara mengontrol pengaruh itu adalah memperhitungkannya dalam analisis data dengan model ANCOVA, dengan persamaan sebagai beikut:

Page 9: Program Magister Ilmu Kesehatan Masyarakat, …fkm.malahayati.ac.id/wp-content/uploads/2015/12/Variabel...... maka terhadap data variabel interval dapat dihitung mean. Variabel rasio

Program Magister Ilmu Kesehatan Masyarakat, Program Pascasarjana, Universitas Sebelas Maret -------------------------------------------

9 | Prof Bhisma Murti

b2X2 X1 b1 a Y

Y = kadar kolesterol darah setelah pemberian obat (mg/dl). X1 = obat antikolesterol (1 = Ya; 0 = Tidak) faktor penelitian. X2 = kadar kolesterol sebelum pemberian obat (mg/dl) kovariat.

4. FAKTOR PERANCU

Sebuah konsep yang berperan sentral dalam studi epidemiologi analitik adalah faktor perancu (confounding factor). Ketika seorang peneliti menganalisis hubung-an/ pengaruh variabel independen (paparan) terhadap variabel dependen (penyakit), ia harus sadar dan berupaya mengontrol variabel-variabel lain yang juga berpe-ngaruh terhadap terjadinya variabel dependen yang diteliti, disebut faktor perancu.

Gagasan faktor perancu berasal dari disiplin epidemiologi, merupakan “faktor ketiga” (“third factor”) yang memiliki sifat: (1) Faktor risiko (atau faktor pencegah) penyakit, (2) Berhubungan dengan paparan, dan (3) Bukan merupakan variabel antara dalam mekanisme kausal paparan-penyakit (Clayton dan Hills, 1998; Hennekens dan Buring, 1987; Rothman, 2002; Last, 2001) (lihat Gambar 8.3). Pengaruh faktor perancu harus dikendalikan. Jika peneliti tidak mengendalikan (=mengontrol) pengaruh faktor perancu, maka pengaruh tersebut akan merancukan (=mendistorsi, mencampuri) penilaian hubungan/ pengaruh variabel independen terhadap variabel dependen yang sedang diteliti, sehingga kesimpulan peneliti tentang hubungan variabel tersebut salah alias tidak valid dan hanya bernilai untuk dimasukkan ke dalam keranjang sampah.

Faktor perancu merupakan “special case” dari kovariat, tetapi tidak semua kovariat merupakan faktor perancu. Faktor perancu tidak sama dengan variabel luar (extraneous variable), yaitu variabel di luar variabel dependen dan variabel independen yang sedang diteliti. Semua faktor perancu adalah variabel luar, tetapi tidak semua variabel luar adalah faktor perancu. Tidak semua variabel luar perlu dikontrol. Contoh, Gambar 3 memeragakan hubungan antara paparan (paritas) dan penyakit (sindroma Down) terancukan oleh faktor perancu (umur ibu). Hitungan statistik dengan mudah dapat menunjukkan, ibu yang telah melahirkan beberapa kali mempunyai risiko lebih besar untuk melahirkan anak dengan sindroma Down? Benarkah kesimpulan bahwa paritas merupakan faktor risiko sindroma Down? Salah. Bukan paritas merupakan faktor risiko sindroma Down, melainkan umur ibu. Hubungan yang tampak antara paritas dan sindroma Down telah tercampur oleh pengaruh umur ibu sebagai faktor perancu. Pengaruh faktor perancu harus dikendalikan agar penilaian hubungan variabel independen dan dependen yang diteliti benar.

3 Sindroma Down

(penyakit)

Gambar 3 Umur ibu sebagai faktor perancu

Paritas (paparan)

Umur ibu (faktor perancu)

1 2

Page 10: Program Magister Ilmu Kesehatan Masyarakat, …fkm.malahayati.ac.id/wp-content/uploads/2015/12/Variabel...... maka terhadap data variabel interval dapat dihitung mean. Variabel rasio

Program Magister Ilmu Kesehatan Masyarakat, Program Pascasarjana, Universitas Sebelas Maret

----------------------------------

Sejumlah pihak menggunakan istilah “faktor pengganggu” sebagai padanan confounding factor. Penggunaan istilah faktor pengganggu adalah salah. Pertama, confounding factor tidak sekedar “mengganggu” tetapi lebih fundamental lagi merancukan (mencampur-adukkan) pengaruh confounding factor dengan pengaruh paparan terhadap penyakit yang sedang diteliti. Dalam literatur epidemiologi berbahasa Inggris percampuran pengaruh itu disebut “masking”, “mixing” atau “distortion of effects”. Kedua, jika “faktor pengganggu” digunakan, maka confoun-ding akan diterjemahkan sebagai “gangguan”. Kata “gangguan” akan menimbulkan kejanggalan bagi peneliti, pembaca hasil penelitian, maupun penulis buku epide-miologi. Sebab kata tersebut mengandung konotasi di luar domain metodologi pe-nelitian, misalnya “gangguan kamtibnas” (gangguan keamanan dan ketertiban nasional) – sebuah istilah populer zaman orba. Ketiga, penggunaan istilah “ganggu-an” secara konseptual akan disalahtafsirkan identik dengan sejumlah konsep gangguan lain yang telah lama dikenal dalam literatur kedokteran, misalnya “distur-bance“, “disorder”, dan “impairment”.

5. PENGUBAH EFEK

Konsep lainnya tentang faktor ketiga yang perlu diketahui adalah pengubah efek. Pengubah efek (effect modifier) merupakan faktor ketiga yang memodifikasi (= mengubah) pengaruh paparan terhadap penyakit (Clayton dan Hills, 1998; Last, 2001; Rothman, 2002). Pengubahan efek (effect modification) disebut juga interaksi (interaction) (Kleinbaum et al., 1982; Clayton dan Hills, 1998). Meski sama-sama faktor ketiga, pengubah efek berbeda dengan faktor perancu. Faktor perancu mengakibatkan distorsi penaksiran pengaruh paparan terhadap penyakit, sedang pengubah efek tidak mengakibatkan distorsi penaksiran tersebut, melainkan mengubah pengaruh paparan terhadap penyakit sesuai dengan level dari pengubah efek tersebut. Implikasinya, kerancuan perlu dikontrol, sedang modifikasi efek tidak perlu dikontrol melainkan dideskripsikan.

Contoh, Merlo et al. (2005) melakukan studi di Swedia untuk mempelajari pengaruh lingkungan tetangga terhadap tekanan darah sistolik pada 25000 subjek penelitian yang bertempat tinggal di 39 lingkungan tetangga. Peneliti menggunakan multilevel regression analysis (MLRA) untuk menganalisis hubungan antara tekanan darah sistolik dan body mass index (BMI), serta pengaruh income lingkungan tetangga terhadap hubungan tersebut. Gambar 8.4 menunjukkan hubungan positif antara BMI dan tekanan darah sistolik. Makin tinggi BMI, makin meningkat rata-rata tekanan darah sistolik.

Di samping itu Gambar 4 menunjukkan interaksi, bahwa peningkatan tekanan darah sistolik yang berkaitan dengan meningkatnya body mass index diubah (dimodifikasi) oleh income lingkungan tetangga. Peningkatan tekanan darah yang berkaitan dengan meningkatnya BMI makin besar pada individu-individu yang bertempat tinggal pada lingkungan tetangga ber-income rendah dibandingkan income tinggi. Perbedaan “daya ungkit” pengaruh income lingkungan tetangga terhadap pengaruh BMI terhadap tekanan darah sistolik antara income rendah dan income tinggi ditunjukkan oleh garis regresi yang berpotongan antara kedua kelompok tersebut. Koefisien regresi BMI lebih besar pada kelompok lingkungan tetangga berincome rendah daripada income tinggi. Kalau saja garis tersebut sejajar, maka income lingkungan tetangga tidak berinteraksi dengan BMI dalam mempenga-

Page 11: Program Magister Ilmu Kesehatan Masyarakat, …fkm.malahayati.ac.id/wp-content/uploads/2015/12/Variabel...... maka terhadap data variabel interval dapat dihitung mean. Variabel rasio

Program Magister Ilmu Kesehatan Masyarakat, Program Pascasarjana, Universitas Sebelas Maret -------------------------------------------

11 | Prof Bhisma Murti

ruhi tekanan darah sistolik, dan koefisien regresi antara kedua kelompok lingkungan tetangga akan sama.

REFERENSI

Alderson P, Green S (2002). Cochrane Collaboration open learning material for reviewers Version 1.1 The Cochrane Collaboration. www.cochrane-net.org/openlearning/PDF. Diakses Juli 2007.

Baum FE, Ziersch AM (2003). Social capital. J Epidemiol Community Health;57:320–323

Cohen, J. (1960). Coefficient of agreement for nominal scales. Educational and Psychological Measurement, 20: 37–46.

Clayton D, Hills M (1998). Statistical models in epidemiology. Oxford: Oxford University Press.

Garson GD (2008). Reliability analysis. Statnotes. [email protected]. Diakses Januari 2008.

Gay, L.R. (1976). Educational research: Competencies for analysis and application. Columbus, OH: Bell & Howell Company.

Gerstman B.B. (1998). Epidemiology kept simple: An introduction to classic and modern epidemiology. New York: Wiley-Liss.

Gordis, L (2000). Epidemiology. Philadelphia, PA: WB Saunders Co.

Grogan S, Conner M, Norman P, Willits D, Porter I (2000). Validation of a questionnaire measuring patient satisfaction with general practitioner services. Quality in Health Care 210 (9):210–215

Hardell L, Carlberg M, Soderqvist F, Mild KH, Morgan L (2007). Long-term use of cellular phones and brain tumours: increased risk associated with use for ≥10

Gambar 4 Interaksi income antara lingkungan tetangga dan body mass index dalam mempengaruhi

tekanan darah sistolik (Sumber: Merlo et al., 2005)

Page 12: Program Magister Ilmu Kesehatan Masyarakat, …fkm.malahayati.ac.id/wp-content/uploads/2015/12/Variabel...... maka terhadap data variabel interval dapat dihitung mean. Variabel rasio

Program Magister Ilmu Kesehatan Masyarakat, Program Pascasarjana, Universitas Sebelas Maret

----------------------------------

years. Occup Environ Med, 64: 626-632.

Hennekens CH, Buring JE, Manson JE (1996). Lack of effect of long term supplementation with beta-carotene on the incidence of malignant neoplasms and cardiovascular disease. N Engl J Med, 334: 1145-1149.

Hennekens, C.H. dan Buring, J.E. (1987). Epidemiology in medicine. Boston: Little, Brown and Company.

Hicks CR (1982). Fundamental concepts in the design of experiments. Forth Worth, TX: Saunders College Publishing.

Hornby AS (2003). Oxford Advanced Learner’s Dictionary of Current English. Oxford: Oxford University Press.

Hosmer DW, Lemeshow S (1989). Applied logistic regression. New York: John Wiley & Sons.

Kleinbaum DG, Kupper LL, Muller KE (1988). Applied regression analysis and other multivariable methods. Boston: PWS-Kent.

Kleinbaum, D.G., Kupper, L.L., dan Morgenstern, H. (1982). Epidemiologic research: Principles and quantitative methods. New York: Van Nostrand Reinhold.

Kothari, C.R. (1990). Research methodology: Methods and techniques. New Delhi: Wiley Eastern Limited.

Landis, J.R., dan Koch, G.G. (1977). The measurment of observer agreement for categorical data. Biometrics 33: 159–74

Last JM (2001). A dictionary of epidemiology. Oxford: Oxford University Press.

Lomas J (1998). Social capital and health: Implications for public health and epidemiology. Soc. Sci. Med. 47(9): 1181-1188

MedCalc (2007). Inter-rater agreement. MedCalc Version 9.3.7.0 - © 1993-2007. Frank Schoonjans. Last modified: 15 August 2007.MedCalc Software, Broekstraat 52, 9030 Mariakerke, Belgium

Mercer D (1991). Intermediate epidemiology (Coursework). New Orleans, LA: Tulane School of Public Health and Tropical Medicine.

Merlo J, Chaix B, Yang M, Lynch J, Råstam L (2005). A brief conceptual tutorial on multilevel analysis in social epidemiology: interpreting differences and the effect of neighbourhood characteristics on individual health. J. Epidemiol. Community Health; 59;1022-1029

Murti B (1996). Penerapan metode statistik non-parametrik dalam ilmu-ilmu kesehatan. Jakarta: Gramedia Pustaka Utama.

O’Loughlin J, Tarasuk J, Difranza J, Paradis G (2002). Reliability of selected measures of nicotine dependence among adolescents. Ann Epidemiol, 12: 353-362.

Pagano M, Gauvreau K (2000). Principles of biostatistics. Pacific Grove, CA: Duxbury.

Polgar S, Thomas SA (2000). Introduction to research in the health sciences. London: Churchill Livingstone/ Harcourt Publishers Ltd.

Page 13: Program Magister Ilmu Kesehatan Masyarakat, …fkm.malahayati.ac.id/wp-content/uploads/2015/12/Variabel...... maka terhadap data variabel interval dapat dihitung mean. Variabel rasio

Program Magister Ilmu Kesehatan Masyarakat, Program Pascasarjana, Universitas Sebelas Maret -------------------------------------------

13 | Prof Bhisma Murti

Rosner, B. (1990). Fundamentals of biostatistics. Boston: PWS-Kent Publishing Company.

Rothman, K.J. (2002). Epidemiology: An introduction. New York: Oxford University Press.

Sackett DL, Haynes RB, Guyatt GH, Tugwell P (1991). Clinical epidemiology: A basic science for clinical medicine. Boston: Little, Brown, and Company.

Streiner DL, Norman GR (2000). Health measurement scales: A practical guide to their development and use. Oxford: Oxford University Press.

Streiner DL, Norman GR, Blum HM (1989). PDQ Epidemiology. Toronto: BC Decker, Inc.

Verdecchia P, Angeli F (2005). Natural history of hypertension subtypes. Circulation, 111:1094-10

Vogt WP (1993). Dictionary of statistics and methodology. Newbury Park, CA: Sage Publications, Inc.

Weisell RC (2002). Body mass index as an indicator of obesity. Asia Pacific J Clin Nutr, 11(Suppl):S681-S684