BAB II TEORI PENUNJANG -...

download BAB II TEORI PENUNJANG - digilib.its.ac.iddigilib.its.ac.id/public/ITS-NonDegree-7426-706030024-bab2.pdf · tumbuh dalam otot uterus. Mereka terjadi terutama pada wanita-wanita pada

If you can't read please download the document

Transcript of BAB II TEORI PENUNJANG -...

  • Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes

    7

    BAB II TEORI PENUNJANG

    2.1 Machine Learning 2.1.1 Pengenalan Machine Learning

    Machine learning adalah salah satu disiplin ilmu dari Computer Science yang mempelajari bagaimana membuat komputer atau mesin itu mempunyai suatu kecerdasan. Oleh karena itu agar komputer atau mesin dapat memiliki kecerdasan maka harus belajar. Di mana proses pembelajaran itu terdiri dari :

    1. Supervised Learning : Learning dari contoh-contoh Didasari dari Teorema Bayes Menggunakan data positive dan negative Tidak diharuskan menggunakan data yang konsisten Jawaban ditunjukkan oleh nilai probabilitas Biasanya dipakai untuk fngsi - fungsi klasifikasi

    2. Unsupervised Learning : Tidak melibatkan jawaban dalam data Hanya membuat suatu klasifikasi tanpa label atau jawaban Labelisasi (pemberian jawaban) menjadi tanggung jawab

    user 3. Reinforcement learning :

    Learning dari percobaan Memakai konsep reward dan punishment dalam proses

    learning

    2.1.2 Latar Belakang Machine Learning Latar belakang atau ide dasar adanya konsep mesin

    pembelajaran atau machine learning adalah adanya penyajian keputusan berdasarkan fakta seperti berikut ini :

    Fakta harian dalam 6 hari dan keputusan untuk berolah raga sebagai berikut ini

  • Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes

    8

    Tabel 2. 1 Tabel Cuaca

    Sehingga muncul kasus seperti berikut ini yang membutuhkan suatu penyelesaian

    1. Ketika cuaca cerah, apakah akan berolah raga? 2. Ketika cuaca cerah dan temperatur normal, apakah akan

    berolah raga?

    2.1.3 Data Training Berikut ini merupakan contoh dari data training dari tabel cuaca :

    Gambar 2. 1 Data Training Cuaca

    Keterangan : Attribut adalah kolom data, terdapat atribut itu sendiri

    dan target. Instance adalah isis dari atribut sebagai contoh seperti

    atribut cuaca mempunyai instance cerah dan hujan, sering ditulis dengan cuaca = {cerah, hujan}.

    Record atau tuple adalah baris data.

  • Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes

    9

    2.1.4 Macam - Macam Data Macam-macam data yang ada dalam mesin pembelajaran

    meliputi berikut ini : 1. Data konsisten

    Gambar 2. 2 Data Konsisten

    Atribut cuaca dan temperatur mempunyai nilai yang sama dalam satu keputusan (berolah raga), maka data ini adalah data yang konsisten. Sedangkan data tidak konsisten seperti berikut ini.

    Gambar 2. 3 Data Tidak Konsisten

    Tidak satupun atribut yang mempuyai nilai yang sama dalam satu keputusan (berolah raga), maka data ini adalah data yang tidak konsisten

    2. Data Bias

    Gambar 2. 4 Data Bias

    Dari data di atas, data ke-4. Data ini mempunyai keputusan yang berbeda dengan data 1 dan data 2. Tetapi instance pada semua atributnya sama, sehingga data ini disebut dengan data bias.

  • Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes

    10

    2.2 Kanker Kandungan 2.2.1 Pengertian Kanker

    Kanker adalah suatu kelompok yang banyak dari penyakit yang berhubungan. Semua kanker dimulai di sel-sel, unit dasar kehidupan dari tubuh. Sel-sel membuat jaringan-jaringan, dan jaringan-jaringan membuat organ-organ tubuh.

    Secara normal, sel-sel tumbuh dan membelah membentuk sel-sel baru ketika mereka dibutuhkan oleh tubuh. Ketika sel-sel tumbuh menua dan mati, sel-sel baru mengambil tempat mereka. Kadangkala proses yang teratur ini berjalan salah. Sel-sel baru terbentuk ketika tubuh tidak memerlukan mereka, dan sel-sel tua tidak mati ketika mereka seharusnya mati. Sel-sel ekstra ini dapat membentuk suatu massa dari jaringan yang disebut suatu pertumbuhan atau tumor. 2.2.2 Jenis Kanker Kandungan

    Jenis kanker kandungan bukan hanya 1, setiap bagian kandungan dapat terkena kanker seperti:

    Cervical Cancer : leher rahim Endometrial : dinding rahim Ovarian : indung telur Fallopian tube : saluran antara indung telur ke lengan pelepas

    sel telur Vaginal : jalan lahir bayi Vulvar : daerah luar vagina Placenta (Gestational Throphoblastic Disease) : sisa placenta

    bayi Untuk menemukan adanya kanker kandungan yang paling

    penting harus diketahui adanya perubahan pada diri sendiri. Contoh perubahan :

    Gejala samar seperti rasa tidak nyaman di perut atau perut kambung

    Sering buang air kecil Pencernaan terganggu Perdarahan vagina Perdarahan setelah hubungan seks Perdarahan dari vagina yang tidak beratutan Cairan keluar dari vagina atau gumpalan darah Sakit pada bagian perut bawah atau punggung

  • Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes

    11

    Adapun jenis lain seperti tumor adalah 1. Tumor-tumor jinak bukan kanker. Biasanya , dokter-

    dokter dapat mengangkat/menghilangkan mereka. Sel-sel dari tumor-tumor jinak tidak menyebar ke bagian-bagian lain tubuh. Pada kebanyakan kasus-kasus, tumor-tumor jinak tidak datang kembali setelah mereka diangkat/dihilangkan. Paling penting, tumor-tumor jinak jarang adalah suatu ancaman nyawa. Tumor jinak ini meliputi Fibroids adalah tumor-tumor jinak yang umum yang

    tumbuh dalam otot uterus. Mereka terjadi terutama pada wanita-wanita pada umur empatpuluhannya. Wanita-wanita mungkin mempunyai banyak fibroids pada waktu bersamaan. Fibroids tidak berkembang menjadi kanker. Ketika seorang wanita mencapai menopause, fibroids kemungkinan menjadi lebih kecil, dan kadangkala mereka menghilang. Biasanya, fibroids tidak menyebabkan gejala-gejala dan tidak memerlukan perawatan. Namun tergantung dari ukuran dan lokasi mereka, fibroids dapat menyebabkan perdarahan, kotoran vagina (vaginal discharge), dan kencing yang seringkali. Wanita-wanita dengan gejala-gejala ini harus mengunjungi seorang dokter. Jika fibroids menyebabkan perdarahan yang berat, atau jika mereka menekan pada organ-organ yang berdekatan dan menyebabkan nyeri, dokter mungkin menyarankan operasi atau perawatan lainnya.

    Endometriosis adalah kondisi jinak lainnya yang mempengaruhi uterus. Ia adalah paling umum pada wanita-wanita yang berumur tigapuluhan dan empatpuluhan, terutama pada wanita-wanita yang belum pernah hamil. Itu terjadi ketika jaringan endometrial mulai tumbuh pada bagian luar uterus dan pada organ-organ yang berdekatan. Kondisi ini dapat menyebabkan periode-periode menstruasi yang menyakitkan, perdarahan vagina yang abnormal, dan kadangkala kehilangan kesuburan (kemampuan

  • Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes

    12

    menjadi hamil), namun itu tidak menyebabkan kanker. Wanita-wanita dengan endometriosis dapat dirawat dengan hormon-hormon atau operasi.

    Endometrial hyperplasia adalah suatu peningkatan dalam jumlah sel-sel lapisan uterus. Itu bukan kanker. Kadangkala itu berkembang menjadi kanker. Periode-periode menstruasi yang berat, perdarahan diantara periode-periode, dan perdarahan setelah menopause adalah gejala-gejala umum dari hyperplasia. Itu adalah paling umum setelah umur 40 tahun. Untuk mencegah endometrial hyperplasia dari pengembangan ke kanker, dokter dapat merekomendasikan operasi untuk mengangkat uterus (hysterectomy) atau perawatan dengan hormon-hormon (progesterone) dan pemeriksaan-pemeriksaan follow-up secara teratur.

    2. Tumor-tumor ganas adalah awal dari kanker. Mereka

    umumnya adalah lebih serius dan mungkin mengancam nyawa. Sel-sel kanker dapat menyerang dan merusak jaringan-jaringan dan organ-organ yang berdekatan. Juga, sel-sel kanker dapat pecah keluar dari suatu tumor ganas dan masuk kedalam aliran darah atau sistim getah bening (sistim limfatik). Itu adalah bagaimana sel-sel kanker menyebar dari tumor asal membentuk tumor-tumor baru pada organ-organ lain. Penyebaran dari kanker disebut metastasis. Tipe kanker uterus (kandungan) yang paling umum mulai pada lapisan (endometrium). Disebut juga kanker edometrial (endometrial cancer), kanker kandungan, atau kanker uterus. Disini kita akan memakai istilah kanker kandungan atau kanker uterus untuk merujuk pada kanker yang mulai pada endometrium.

    Tumor-tumor jinak bukan kanker. Biasanya , dokter-dokter dapat mengangkat/menghilangkan mereka. Sel-sel dari tumor-tumor jinak tidak menyebar ke bagian-bagian lain tubuh. Pada kebanyakan kasus-kasus, tumor-tumor jinak tidak datang kembali setelah mereka diangkat/dihilangkan. Paling penting, tumor-tumor jinak adalah jarang menjadi suatu ancaman nyawa.

  • Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes

    13

    menyebabkan perdarahan, kotoran vagina (vaginal discharge), dan kencing yang seringkali. Wanita-wanita dengan gejala-gejala ini harus mengunjungi seorang dokter. Jika fibroids menyebabkan perdarahan yang berat, atau jika mereka menekan pada organ-organ yang berdekatan dan menyebabkan nyeri, dokter mungkin menyarankan operasi atau perawatan lainnya.

    Endometriosis adalah kondisi jinak lainnya yang mempengaruhi uterus. Ia adalah paling umum pada wanita-wanita yang berumur tigapuluhan dan empatpuluhan, terutama pada wanita-wanita yang belum pernah hamil. Itu terjadi ketika jaringan endometrial mulai tumbuh pada bagian luar uterus dan pada organ-organ yang berdekatan. Kondisi ini dapat menyebabkan periode-periode menstruasi yang menyakitkan, perdarahan vagina yang abnormal, dan kadangkala kehilangan kesuburan (kemampuan menjadi hamil), namun itu tidak menyebabkan kanker. Wanita-wanita dengan endometriosis dapat dirawat dengan hormon-hormon atau operasi.

    Endometrial hyperplasia adalah suatu peningkatan dalam jumlah sel-sel lapisan uterus. Itu bukan kanker. Kadangkala itu berkembang menjadi kanker. Periode-periode menstruasi yang berat, perdarahan diantara periode-periode, dan perdarahan setelah menopause adalah gejala-gejala umum dari hyperplasia. Itu adalah paling umum setelah umur 40 tahun. Untuk mencegah endometrial hyperplasia dari pengembangan ke kanker, dokter dapat merekomendasikan operasi untuk mengangkat uterus (hysterectomy) atau perawatan dengan hormon-hormon (progesterone) dan pemeriksaan-pemeriksaan follow-up secara teratur.

  • Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes

    14

    3. Tumor-tumor ganas adalah kanker. Mereka umumnya adalah lebih serius dan mungkin mengancam nyawa. Sel-sel kanker dapat menyerang dan merusak jaringan-jaringan dan organ-organ yang berdekatan. Juga, sel-sel kanker dapat pecah keluar dari suatu tumor ganas dan masuk kedalam aliran darah atau sistim getah bening (sistim limfatik). Itu adalah bagaimana sel-sel kanker menyebar dari tumor asal membentuk tumor-tumor baru pada organ-organ lain. Penyebaran dari kanker disebut metastasis. Tipe kanker uterus (kandungan) yang paling umum mulai pada lapisan (endometrium). Disebut juga kanker edometrial (endometrial cancer), kanker kandungan, atau kanker uterus. Disini kita akan memakai istilah kanker kandungan atau kanker uterus untuk merujuk pada kanker yang mulai pada endometrium.

    Tumor-tumor jinak bukan kanker. Biasanya , dokter-dokter dapat mengangkat/menghilangkan mereka. Sel-sel dari tumor-tumor jinak tidak menyebar ke bagian-bagian lain tubuh. Pada kebanyakan kasus-kasus, tumor-tumor jinak tidak datang kembali setelah mereka diangkat/dihilangkan. Paling penting, tumor-tumor jinak adalah jarang menjadi suatu ancaman nyawa. 2.3 Naive Bayes 2.3.1 Pengertian Naive Bayes

    Naive Bayes merupakan pendekatan statistik untuk melakukan inferensi induksi pada persoalan klasifikasi. Metode ini menggunakan probabilitas bersyarat sebagai dasarnya. Dalam ilmu statistik, probabilitas bersyarat dinyatakan sebagai :

    Probabilitas X di dalam Y adalah probabilitas interseksi X dan

    Y dari probabilitas Y, atau dengan kata lain P(X|Y) adalah prosentase banyaknya X di dalam Y.

  • Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes

    15

    Gambar 2. 5 Diagram Ven pada Relasi Probabilitas Bersyarat

    Misalkan terdapat data set cuaca seperti tampak pada tabel di bawah ini.

    Tabel 2. 2 Tabel Set Cuaca

    Banyaknya data berolah raga = ya adalah 4 dari 6 data maka dituliskan P(Olahraga=ya)=4/6. Banyaknya data cuaca=cerah dan berolahraga=ya adalah 4 dari 6 data maka dituliskan P(cuaca=cerha dan Olahraga=ya)=4/6. Dari informasi tersebut, maka probabilitas cuaca cerah pada saat berolah raga adalah

    Metode Bayes dapat dinyatakan dengan probabilitas bersyarat

    seperti yang diilustrasikan oleh gambar berikut

  • Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes

    16

    Gambar 2. 6 Probabilitas Bersyarat

    Gambar di atas dapat dinyatakan dengan persamaan :

    Dimana, keadaan Posterior (Probabilitas Xk di dalam Y) dapat

    dihitung dari keadaan prior(Probabilitas Y di dalam Xk dibagi dengan jumlah dari semua probabilitas Y di dalam semua Xi).

    2.3.2 Keunggulan Metode Naive Bayes

    Kelebihan metode Naive Bayes sehingga digunakan dalam aplikasi ini adalah

    Metode Find-S tidak dapat digunakan untuk data yang tidak konsisten dan data yang bias, sehingga untuk bentuk data semacam ini salah satu metode sederhana yang dapat digunakan adalah metode bayes.

    Metode Bayes ini merupakan metode yang baik di dalam mesin pembelajaran berdasarkan data training, dengan menggunakan probabilitas bersyarat sebagai dasarnya. Sedangkan kelemahan dari metode Naive Bayes adalah

    Metode Bayes hanya bisa digunakan untuk persoalan klasifikasi dengan supervised learning dan data-data kategorikal.

    Metode Bayes memerlukan pengetahuan awal untuk dapat mengambil suatu keputusan. Tingkat keberhasilan metode ini sangat tergantung pada pengetahuan awal yang diberikan.

  • Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes

    17

    2.3.3 Pemanfaatan Metode Naive Bayes Metode Naive Bayes dapat diamanfaatkan dalam beberapa

    bidang untuk menyelesaikan permasalahan seperti

    Menentukan diagnosa suatu penyakit berdasarkan datadata gejala (sebagai contoh hipertensi atau sakit jantung).

    Mengenali buah berdasarkan fitur-fitur buah seperti warna, bentuk, rasa dan lain-lain

    Mengenali warna berdasarkan fitur indeks warna RGB Mendeteksi warna kulit (skin detection) berdarkan fitur warna

    chrominant

    Menentukan keputusan aksi (olahraga, art, psikologi) berdasarkan keadaan.

    Menentukan jenis pakaian yang cocok untuk keadaankeadaan tertentu (seperti cuaca, musim, temperatur, acara, waktu, tempat dan lain-lain)

    2.3.4 Penerapan Metode Naive Bayyes

    Cara mengetahui seseorang menderita kanker atau tidak dengan menggunakan Naive Bayes adalah sebagai berikut : Misalkan seorang pasien melakukan tes laboratorium dan hasilnya adalah positif. Ini diketahui bahwa hasil tes yang benar untuk positif hanya 98% dari kasus-kasus dan hasil yang benar untuk hasil negatif hanya 97% dari kasus-kasus. Sedangkan hanya 0.008 dari keseluruhan popoulation terkena penyakit ini.

    1. Berapa kemungkinan pasien ini menderita kanker? 2. Berapa kemungkinan pasien ini tidak menderita kanker? 3. Apa diagnosisnya?

    Maka penyelesaiannya adalah

  • Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes

    18

    ??.3

    ...........................)|(.2

    ..........)(

    03.0)|(

    ...................................................................

    )()|()()|()(

    008.0)(

    98.0)|(

    ...................................

    .........................

    )(

    )()|()|(.1

    '':

    }'':2

    '':1

    Diagnosis

    cancerP

    cancerP

    cancerP

    cancerPcancerPcancerPcancerPP

    cancerP

    cancerP

    P

    cancerPcancerPcancerP

    data

    Hspacehypothesiscancerhypothesis

    cancerhypothesis

    =+

    ==+

    =+++=+

    ==+

    ==+

    +=+

    +

    2.4 HMAP 2.4.1 Pengenalan HMAP

    Terminologi dari HMAP (Hypothesis Maximum Approri Probability) menyatakan hipotesa yang diambil berdasarkan kondisi prior yang diketahui.

    HMAP adalah model penyederhanaan dari metode bayes yang disebut dengan Naive Bayes. HMAP dapat digunakan sebagai metode untuk mendapatkan hipotesis dari suatu keputusan. HMAP dapat diartikan mencari probabilitas terbesar dari semua instance pada atribut target atau semua kemungkinan keputusan. Contoh implementasi HMAP :

    Diketahui hasil survey yang dilakukan sebuah lembaga kesehatan menyatakan bahwa 30% penduduk di dunia menderita sakit

  • Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes

    19

    paru-paru. Dari 90% penduduk yang sakit paru-paru ini 60% adalah perokok, dan dari penduduk yang tidak menderita sakit paru-paru 20% perokok. Fakta ini bisa didefinisikan dengan: X=sakit paru-paru dan Y=perokok. Maka : P(X) = 0.9

    P(~X) = 0.1 P(Y|X) = 0.6 P(~Y|X) = 0.4 P(Y|~X) = 0.2 P(~Y|~X) = 0.8 Dengan metode bayes dapat dihitung: P({Y}|X) = P(Y|X).P(X) = (0.6) . (0.9) = 0.54 P({Y}|~X) = P(Y|~X) P(~X) = (0.2).(0.1) = 0.02

    Bila diketahui seseorang merokok, maka dia menderita sakit paru-paru karena P({Y}|X) lebih besar dari P({Y}|~X). HMAP diartikan mencari probabilitas terbesar dari semua instance pada attribut target atau semua kemungkinan keputusan. Pada persoalan keputusan adalah sakit paru-paru atau tidak

    2.4.2 HMAP pada Data Training

    Tabel 2. 3 Data Set Cuaca

    Berdasarkan tabel set cuaca di atas maka dapat diasumsikan

    bahwa Y = berolahraga, X1 = cuaca, X2 = temperatur, X3 = kecepatan angin.

    Fakta menunjukkan: P(Y=ya) = 4/6 P(Y=tidak) = 2/6

    Fakta: P(X1=cerah|Y=ya) = 1, P(X1=cerah|Y=tidak) = 0

    P(X3=kencang|Y=ya) = 1/4 , P(X3=kencang|Y=tidak) = 1/2

  • Aplikasi Diagnosis Kanker Kandungan dengan Naive Bayes

    20

    HMAP dari keadaan ini dapat dihitung dengan: P( X1=cerah,X3=kencang | Y=ya ) = { P(X1=cerah|Y=ya).P(X3=kencang|Y=ya) } . P(Y=ya) = { (1) . (1/4) } . (4/6) = 1/6 P( X1=cerah,X3=kencang | Y=tidak ) = { P(X1=cerah|Y=tidak).P(X3=kencang|Y=tidak) } .

    P(Y=tidak) = { (0) . (1/2) } . (2/6) = 0

    Keputusannya adalah berolah raga = YA