ISSN - lppm.trigunadharma.ac.id M... · komunikasi antar Web Server dengan ... Dan dapat digunakan...

12
197 ANALISIS WEB SERVER LOG DALAM PENCARIAN POLA PENGUNJUNG WEB DENGAN TEKNIK ASSOCIATION RULES Muhammad Dahria #1 , Muhammad Syahril #2 #1,2 Program Studi Sistem Informasi, STMIK Triguna Dharma Jl. A.H. Nasution No. 73 F-Medan E-mail: #1 [email protected] Abstrak Sebuah Web Server Log akan menyimpan seluruh aktifitas pengunjung web site dalam sebuah server. Banyaknya interaksi yang dilakukan oleh pengunjung web, akan meningkatkan ukuran rekaman data log yang tersimpan dalam sebuah web, akan meningkatkan ukuran rekaman data log yang tersimpan dalam sebuah web server, sehingga pembengkakan volume data tidak dapat dihindari. Sayangnya, kebanyakan web administrator tidak mengetahui bagaimana manfaat data log yang tersimpan tersebut agar menggali informasi yang bermanfaat untuk pengembangan sebuah situs web. Data mining merupakan suatu cara untuk menambang data sehingga informasi yang sebelumnya tidak diketahui dapat diperoleh. Informasi yang dimasukkan difokuskan pada penemuan pola kunjungan web server log dengan menggunakan teknik Association Rules dan pemanfaatan Algoritma Apriori. Analisis web server log yang dilakukan mampu memberikan informasi mengenai pola kunjungan dan menemukan beberapa aturan asosiasi yang berguna untuk peningkatan efektifitas sebuah web site dimasa yang akan datang, serta memberikan layanan informasi dan komunikasi terbaik bagi publik. Kata Kunci: Web Server Log, Assocition Rules, Algoritma Apriori Abstract A Web Server Log will store all over the web site visitor activity in a server. Number of interactions that are performed by web visitors, will increase the size of the log data records stored in a web, will increase the size of the log data records stored in a web server, thus swelling the volume of data is inevitable. Unfortunately, most web administrators do not know how the benefits of log data stored in order to dig up information that is beneficial to the development of a web site. Data mining is a way to mine the data so that the information previously unknown can be obtained. The information included is focused on the discovery of a pattern of visits the web server logs by using the technique of Association Rules and exploiting a priori Algorithm. Web server log analysis is conducted to provide information on the pattern of visits and found some useful Association rules for the enhancement of the effectiveness of a web site in the future, as well as providing the best information and communication service to the public. Keywords: Web Server Logs, Assocition Rules, Apriori Algorithm ISSN : 1978-6603

Transcript of ISSN - lppm.trigunadharma.ac.id M... · komunikasi antar Web Server dengan ... Dan dapat digunakan...

Page 1: ISSN - lppm.trigunadharma.ac.id M... · komunikasi antar Web Server dengan ... Dan dapat digunakan secara efektif pada bidang Web Mining yang diilustrasikan sebagai berikut : pada

197

ANALISIS WEB SERVER LOG DALAM PENCARIAN POLAPENGUNJUNG WEB DENGAN TEKNIK ASSOCIATION RULES

Muhammad Dahria#1, Muhammad Syahril#2

#1,2Program Studi Sistem Informasi, STMIK Triguna DharmaJl. A.H. Nasution No. 73 F-Medan

E-mail: #[email protected]

Abstrak

Sebuah Web Server Log akan menyimpan seluruh aktifitas pengunjung web site dalam sebuah server.Banyaknya interaksi yang dilakukan oleh pengunjung web, akan meningkatkan ukuran rekaman data logyang tersimpan dalam sebuah web, akan meningkatkan ukuran rekaman data log yang tersimpan dalamsebuah web server, sehingga pembengkakan volume data tidak dapat dihindari. Sayangnya, kebanyakanweb administrator tidak mengetahui bagaimana manfaat data log yang tersimpan tersebut agarmenggali informasi yang bermanfaat untuk pengembangan sebuah situs web. Data mining merupakansuatu cara untuk menambang data sehingga informasi yang sebelumnya tidak diketahui dapat diperoleh.Informasi yang dimasukkan difokuskan pada penemuan pola kunjungan web server log denganmenggunakan teknik Association Rules dan pemanfaatan Algoritma Apriori. Analisis web server log yangdilakukan mampu memberikan informasi mengenai pola kunjungan dan menemukan beberapa aturanasosiasi yang berguna untuk peningkatan efektifitas sebuah web site dimasa yang akan datang, sertamemberikan layanan informasi dan komunikasi terbaik bagi publik.

Kata Kunci: Web Server Log, Assocition Rules, Algoritma Apriori

Abstract

A Web Server Log will store all over the web site visitor activity in a server. Number of interactions thatare performed by web visitors, will increase the size of the log data records stored in a web, will increasethe size of the log data records stored in a web server, thus swelling the volume of data is inevitable.Unfortunately, most web administrators do not know how the benefits of log data stored in order to digup information that is beneficial to the development of a web site. Data mining is a way to mine the dataso that the information previously unknown can be obtained. The information included is focused on thediscovery of a pattern of visits the web server logs by using the technique of Association Rules andexploiting a priori Algorithm. Web server log analysis is conducted to provide information on the patternof visits and found some useful Association rules for the enhancement of the effectiveness of a web site inthe future, as well as providing the best information and communication service to the public.

Keywords: Web Server Logs, Assocition Rules, Apriori Algorithm

ISSN : 1978-6603

Page 2: ISSN - lppm.trigunadharma.ac.id M... · komunikasi antar Web Server dengan ... Dan dapat digunakan secara efektif pada bidang Web Mining yang diilustrasikan sebagai berikut : pada

Muhammad Dahria dan Muhammad Syahril, Analisis Web Server Log dalam Pencarian Pola………

198Jurnal SAINTIKOM Vol. 13, No. 3, September 2014

PENDAHULUANInternet telah dimanfaatkan oleh

berbagai perusahaan atau institusi untukmenyediakan sumber daya informasi maupunlayanan melalui situs Web. Pengunjung suatusitus web akan berinteraksi melaluiserangkaian permintaan (request) yangbertalian dan berhubungan selama melakukansuatu kunjungan tunggal yang sering disebutdengan istilah session. Interaksi ini dilakukanuntuk mendapatkan informasi maupunlayanan yang diinginkan oleh pengunjung situsweb.

Pengunjung situs web dalam sebuahsession dapat berinteraksi dengan berbagaifungsi yang telah disediakan. Interaksi yangdilakukan oleh pengunjung yang satu denganpengunjung yang lainnya mungkin berbedabaik dalam urutan rangkaian permintaannyamaupun frekuensi kunjungannya. Pengunjungyang sama dalam suatu session yang berbedamungkin melakukan rangkaian permintaanyang berbeda. Tingkah laku atau interaksipengunjung situs Web dalam sebuahsessiondapat pula dimodelkan dengan suatugraph.

Demikian halnya dengan layananinformasi yang disediakan dalam situs resmiPemerintah Kota Medan(http://www.pemkomedan.go.id). Seluruhaktifitas yang dilakukan oleh user pada sebuahwebsite ini akan tersimpan dalam web serverlog. Semakin banyak kunjungan yangdilakukan pada sebuah web, semakin besarpula data yang terekam dalam web server log.Ukuran data yang tersimpan dalam web serverlog tidak hanya dalam ukuran megabyte,tetapi dapat juga terabyte atau bahkan sampaipetabyte. Karena jumlah data yang ada padadata web server log cukup besar, makadiperlukan analisis terhadap data tersebut,sehingga informasi yang tersembunyi dibalik

data web server log dapat digali. Analisis yangdilakukan terhadap web server log diharapkanakan dapat memberikan informasi untukpeningkatan efektifitas sebuah website.

Analisis ini tentunya juga bermanfaatbagi pengelola web bilamana pada waktutertentu diperlukan adanya pengembanganmaupun perancangan ulang sebuah layananinformasi seperti halnya website milikPemerintah Kota Medan. Salah satu cara yangdapat dipakai untuk melakukan analisis, lebihdari sekedar analisis statistik, adalahmenggunakan webmining. Webminingmenerapkan teknik dalam data mining. Datamining merupakan suatu cara untuk‘menambang’ data sehingga informasi yangsebelumnya tidak diketahui, akan diperoleh.Karena webmining menggunakan teknik datamining, maka teknik yang dapat digunakanadalah association rule, sequential pattern,clustering, decision tree, classification danmasih banyak lagi.

Begitu juga dengan pencarian polatingkah laku pengunjung situs Webyang dapatdigunakan untuk mengetahui bagaimana polakunjungan untuk masing- masing pengunjungdalam sebuah session. Informasi polakunjungan ini dapat digunakan untukmengetahui fungsi-fungsi mana saja yangsering dilakukan ataupun yang jarangdilakukan oleh pengunjung. Hal ini terkaitdengan bagaimana pengaturan distribusibeban pada sumber daya yang ada sehinggalayanan yang disediakan dalam situs Webdapat optimal.

LANDASN TEORI1. Knowledge Discovery in Databases

Knowledge Discovery yang seringdisebut Data Mining secara sederhana dapatdikatakan sebagai proses mengekstrak ataumenggali pengetahuan atau informasi yang

Page 3: ISSN - lppm.trigunadharma.ac.id M... · komunikasi antar Web Server dengan ... Dan dapat digunakan secara efektif pada bidang Web Mining yang diilustrasikan sebagai berikut : pada

Muhammad Dahria dan Muhammad Syahril, Analisis Web Server Log dalam Pencarian Pola………

Jurnal SAINTIKOM Vol. 13, No. 3, September 2014 199

berharga (interesting knowledge) darisejumlah besar data, baik yang disimpan didalam database, datawarehouse maupunmedia penyimpanan informasi lainnya (Han,Kamber, 2001). Dari definisi tersebutdidapatkan berbagai istilah yang beredar danmemiliki arti hampir sama dengan DataMining yaitu knowledge mining fromdatabases, knowledge extraction, data /pattern analysis, data archeolgy, datadredging, information harvesting dan businessintelligence.

2. Data MiningBanyak orang menyamakan istilah Data

Mining dengan Knowledge Discovery inDatabases (KDD) . Sebenarnya Data Miningmerupakan salah satu tahap yang terdapat didalam knowledge discovery.Proses DataMining seperti yang digambarkan padagambar 1

3. Web MiningWeb Miningmerupakan penerapan

teknik data mining terhadap web dengantujuan untuk memperoleh pengetahuan daninformasi lebih dari dalam web.

Webminingdapat dikategorikan ke dalam tigaruang lingkup yang berbeda, yaitu webcontent mining, web structure mining dan webusage mining (Srivastavaet al., 2000).

Sedangkan menurut Colley et al. (1997b)dalam jurnalnya yang berjudul “Web Mining :Information and Pattern Discovery on WorldWide Web Browsing” mendefenisikan webmining secara umum sebagai pencarian dananalisis informasi yang berasal dari WorldWide Web. Web mining secara garis besardibagi menjadi dua macam, yaitu web contentmining, yang merupakan proses menambangisi dari sumber online seperti web, dan webusage mining, yang mencari informasi daripenggunaan sumber online seperti web.

4. Web ServerWeb Server adalah software server yang

menjadi tulang belakang dari World WideWeb (WWW). Web server menunggupermintaan dari client yang menggunakanbrowser seperti netscape navigator,Internet Explorer, modzilla, dan programbrowser lainnya. Jika ada permintaan daribrowser, maka Web Server akan memprosespermintaan itu dan kemudian memberikanhasil prosesnya berupa data yang diinginkankembali ke browser. Data ini mempunyaiformat yang standar disebut dengan formatSGML ( Standard General Markup Language).Data yang berupa format ini kemudian akanditampilkan oleh browser sesuai dengankemampuan browser itu.

Web Server, untuk berkomunikasidengan clientnya (web browser)mempunyai potokol sendiri yaitu HTTP (HyperText Transfer Protocol). Dengan protokol ini,komunikasi antar Web Server dengan(browser) dapat saling dimengerti dan lebihmudah. Seperti telah dijelaskan di atas,Standar format data pada World Wide

Gambar 1. Proses Data Mining

Page 4: ISSN - lppm.trigunadharma.ac.id M... · komunikasi antar Web Server dengan ... Dan dapat digunakan secara efektif pada bidang Web Mining yang diilustrasikan sebagai berikut : pada

Muhammad Dahria dan Muhammad Syahril, Analisis Web Server Log dalam Pencarian Pola………

200Jurnal SAINTIKOM Vol. 13, No. 3, September 2014

Webadalah SGML. Tapi sudah menjadi halyang umum bahwa para pengguna internetlebih banyak menggunakan format HTML(Hyper Text Markup Language) karenapenggunaannya yang lebih sederhana danmudah dipelajari. Kata Hyper Textmempunyai arti bahwa seorang penggunainternet dengan web browsernya dapatmembuka dan mambaca dokumen-dokumen yang ada dalam komputernyaatau bahkan komputer yang jauhtempatnya sekalipun. Hal ini memberikancita rasa dari suatu proses yangtridimensional, artinya pengguna internetdapat membaca dari satu dokumen kedokumen yang lain hanya denganmengklik beberapa bagian dari halaman-halaman dokumen (web) itu.

Proses yang dimulai daripermintaan webclient (browser), diterimaweb server, diproses, dan dikembalikanhasil prosesnya oleh web server kewebclient lagi dilakukan secara transparan.Setiap orang dapat dengan mudahmengetahui apa yang terjadi pada tiap-tiapproses. Secara garis besarnya Web Serverhanya memproses semua masukan yangdiperolehnya dari web clientnya.

5. Web Server LogSeluruh aktifitas yang dilakukan oleh

user pada sebuah website ini akan tersimpandengan sendirinya dalam web server log.Semakin banyak kunjungan yang dilakukanpada sebuah web, semakin besar pula datayang terekam dalam web server log. Ukurandata yang tersimpan dalam web server logtidak hanya dalam ukuran megabyte, tetapidapat juga terabyte atau bahkan sampaipetabyte. Karena jumlah data yang besar danpentingnya data web server log, makadiperlukan analisis terhadap data tersebut,sehingga informasi yang tersembunyi dibalikdata web server log dapat digali. Analisis yang

dilakukan terhadap web server log diharapkanakan dapat memberikan informasi untukpeningkatan efektifitas sebuah website.

6. Association RulesAssociation rulesmerupakan salah satu

teknik data mining yang berfungsi untukmenemukan asosiasi antar variabel, korelasiatau suatu struktur diantara item atau objek-objek didalam database transaksi, databaserelasional, maupun pada penyimpananinformasi lainnya. Association rules Discoveryseringkali digunakan dalam Market BasketAnalysis dan juga sebagai Affinity Grouping.Association rules mining digunakan untukmencari pola-pola yang sering muncul,asosiasi-asosiasi, korelasi atau hubungansebab akibat diantara himpunan dari item-item atau objek-objek dalam database.

Fungsi ini paling banyak digunakanuntuk menganalisa data dalam rangkakeperluan strategi pemasaran, desain katalog,dan proses pembuatan keputusan bisnis. Tipeassociation rule bisa dinyatakan sebagaimisal : "70% dari orang orang yangmembeli mie, jus dan saus akan membelijuga roti tawar".

Aturan asosiasi mengcapture item ataukejadian dalam data berukuran besar yangberisi data transaksi. Dengan kemajuanteknologi, data penjualan dapat disimpandalam jumlah besar yang disebut dengan"basket data." Aturan asosiasi yangdidefinisikan pada basket data, digunakanuntuk keperluan promosi, desain katalog,segmentasi customer dan target pemasaran.

Secara tradisional, aturan asosiasidigunakan untuk menemukan trend bisnisdengan menganalisa transaksi customer.Dan dapat digunakan secara efektif padabidang Web Mining yang diilustrasikansebagai berikut : pada Webaccess log, kita

Page 5: ISSN - lppm.trigunadharma.ac.id M... · komunikasi antar Web Server dengan ... Dan dapat digunakan secara efektif pada bidang Web Mining yang diilustrasikan sebagai berikut : pada

Muhammad Dahria dan Muhammad Syahril, Analisis Web Server Log dalam Pencarian Pola………

Jurnal SAINTIKOM Vol. 13, No. 3, September 2014 201

menemukan bahwa aturan asosiasi : "Aand B implies C," memiliki nilai confidence80%, dimana A, B, dan C adalah halamanWeb yang bisa diakses. Jika seorang usermengunjungi halaman A dan B, makaterdapat 80% kemungkinan diaakanmengunjungi halaman C juga padasession yang sama, sehingga halaman C perludiberi direct link dari A atau B. Informasiini dapat digunakan untuk membuat linksecara dinamik ke halaman C dari halaman Aatau B sehingga user dapat melakukan directlink ke halaman C. Informasi semacam inidigunakan untuk melakukan link kehalaman produk yang berbeda secara dinamikberdasarkan interaksi web visitors.

PEMBAHASAN1. Penyedia Data Sumber

Format web server log yang digunakandalam penelitian adalah ECLF (ExtendedCommon Log Format). Sumber data yangdiambil sebagai bahan penelitian berasal daritools raw access log yang terdapat dalam webserver log disajikan dalam format textmerupakan data mentah, yang siap untuk diolah dalam proses data mining untukmengeksplorasi informasi yang menarik,maupun knowledge yang bermanfaat bagipihak yang membutuhkannya.

Tabel 1. Nama dan Isi Elemen Data Log

Adapun arti dari setiap isi elemen adalahElemen-elemen yang teleh diterangkan padaTabel 1 merupakan bagian keterangan darisebuah pembacaan log yang menjadi targetpenelitian. Secara lengkap bentuk datamentah yang akan dikupas memiliki formatbertipe teks (Log*.txt) seperti yang terlihatpada gambar2 berikut ini.

2. Pra Processing (Cleaning) DataDi dalam Knowledge Discovery

Database(KDD) diperlukan adanyapemrosesan pembersihan data yangmerupakan operasi dasar seperti meliputipenghapusan noise yang dilakukan. Sebelumproses data mining dapat dilaksanakan perludilakukan proses cleaning pada data yangmenjadi fokus KDD. Proses cleaning mencakupantara lain membuang duplikasi data,memeriksa data yang inkonsisten, danmemperbaiki kesalahan pada data sepertikesalahan cetak (tipografi).Pada proses persiapan ini data asli dari webserver log disaring sehingga hanya data yangvalid saja yang akan diolah. Proses persiapanyang dilakukan adalah :

Gambar 2. Format Data Log

Page 6: ISSN - lppm.trigunadharma.ac.id M... · komunikasi antar Web Server dengan ... Dan dapat digunakan secara efektif pada bidang Web Mining yang diilustrasikan sebagai berikut : pada

Muhammad Dahria dan Muhammad Syahril, Analisis Web Server Log dalam Pencarian Pola………

202Jurnal SAINTIKOM Vol. 13, No. 3, September 2014

1. Menghapus seluruh request dari data-datadengan jenis file grafik, yaitu file-filerequest yang berekstensi gif, jpeg, jpg,bmp, ico, swf dan format gambar lainnya.Juga menghapus request file sound, videodan file sejenis lainnya.

2. Menghapus seluruh request yang error.Untuk mengetahui apakah sebuah requestberstatus error atau tidak, dapat diisi dari

3. elemen status dan kata awal dari isielemen request. Kode status menunjukkanrespon dari server terhadap permintaanuser. Jika kode statusnya bernilai 200berarti bahwa request adalah valid,sedangkan kode status lainnya seperti 404berarti bahwa dokumen yang dimintatidak ada di dalam website. Kata awal darielemen request menunjukkan permintaanuser kepada server. Jika diawali dengankata GET berarti user meminta sebuahdokumen untuk ditampilkan. Sedangkanjika kodenya adalah head berarti userhanya menginginkan informasi daridokumen, tetapi tetapi bukandokumennya itu sendiri. Arti kode statusdan kata awal dari request merupakanketentuan dari protokol HTTP (Hyper TextTransfer Protocol)

3. Transformasi DataData log di atas akan dikonversikan

dalam bentuk database yang telah memilikibaris kolom, hasil dari pengelompokan data iniseperti yang diperlihatkan pada tabel 2.

Tabel 2. Data Akses Log Setelah di Konversi

Data log yang ada dapat melewatiproses enrichment yaitu “memperkaya” datayang sudah ada dengan data atau informasilain yang relevan dan diperlukan untuk KDDseperti data atau informasi eksternal.

Adalah perlu memanfaatkan datasumber untuk keperluan pengayaan sumberdata baru yang dapat memberikan informasitambahan kepada para pihak yangmembutuhkan. Untuk itu data sumber yangsudah disiapkan akan dikelola lagi untukmenghasilkan informasi berkenaan dengan :

1) Berapa jumlah pengunjung dalam sehari ?2) Bagaimana respon server dalam

menangani request dari pengunjung ?3) Berapa banyak halaman yang dikunjungi

untuk seorang pengunjung dalam waktuyang sama ?

4) Berapa banyak pengunjung yangmembuka satu halaman tertentu padawaktu tertentu ?

5) Bagaimana pola kunjungan pengunjungpada waktu tertentu ?

Informasi diatas dapat diperoleh denganmelakukan filter dan pengelolaan data yangberasal dari data log sumber. Data PengayaanWeb Log terlampir pada bagian akhirpenelitian ini.

4. Penemuan Pola KunjunganKarena data yang diambil adalah data

untuk pencarian halaman halaman yangdikunjungi oleh alamat ip/host, maka datayang diambil dibatasi pada :

a. Alamat Hostb. Date-Timec. Halaman Tujuan

Page 7: ISSN - lppm.trigunadharma.ac.id M... · komunikasi antar Web Server dengan ... Dan dapat digunakan secara efektif pada bidang Web Mining yang diilustrasikan sebagai berikut : pada

Muhammad Dahria dan Muhammad Syahril, Analisis Web Server Log dalam Pencarian Pola………

Jurnal SAINTIKOM Vol. 13, No. 3, September 2014 203

Tabel 3. Contoh Data yang akan Dianalisis

5. Analisa Data dan InisialisasiUntuk menggambarkan keberadaan

sebagian besar halaman yang akan diteliti,maka dibawah ini akan ditampilkan daftarnama file yang ada di dalam sebuah web siteserver.

Tabel 4. Contoh Data yang Dianalisis

Kebutuhan data untuk mencari asosiasipada suatu kunjungan situs web, dibatasi padaField Host dan Refferer. Sehingga data yangtelah dikumpulkan mempunyai format sebagaiberikut

Tabel 5. Hasil Pola Kunjungan

Proses menghitungan Assosiation Rulesdengan menggunakan algoritma apriori yangakan dilakuka nanti akan lebih mudah jikaproses inisialisasi telah dilakukan untuk semuapola kunjungan setiap alamat host yangmelakukan interaksi dengan situs web .Adapun bentuk yang akan digunakan untukperhitungan algoritma tersebut terhadapsetiap host seperti yang digambarkan dalamtabel 6.

Tabel 6. Hasil Pola Kunjungan Tujuan

6. Association Rules yang DitemukanBerdasarkan data yang telah dianalisis,

maka hasil sementara pola kunjungan untukdata satu hari pada tanggal 5 Juli 2014 adalahseperti pada tabel 7.

Tabel 7. Pola Kunjungan Web

Page 8: ISSN - lppm.trigunadharma.ac.id M... · komunikasi antar Web Server dengan ... Dan dapat digunakan secara efektif pada bidang Web Mining yang diilustrasikan sebagai berikut : pada

Muhammad Dahria dan Muhammad Syahril, Analisis Web Server Log dalam Pencarian Pola………

204Jurnal SAINTIKOM Vol. 13, No. 3, September 2014

7. Algorima AprioriAlgoritma Aprioridigunakan untuk

menghasilkan candidat itemset yangmenyebabkan tidak seluruh itemset diolahpada proses selanjutnya, melainkan hanyayang memenuhi syarat saja yang akandiproses pada tahap berikutnya.

Berdasarkan data yang telah diprosesterdapat jumlah item tunggal yang akanditeliti lebih lanjut. Adapun jumlah item

tunggal yang dimaksud adalah sepertiyang ditunjukkan oleh Tabel 1.

Tabel 8. Daftar Index dan Jumlah Item

Dari hasil pengujian denganmenggunakan tools program, telah ditemukansebanyak 10 besar item yang sering sekalidikunjungi oleh pengunjung web. Dan jumlahIP pengunjung setelah diurut berdasarkanbanyaknya transaksi yang dilakukan berjumlah17 pengunjung dengan alamat IP Address yangberbeda-beda.

8. Penentuan Frequent Item SetAdapun pola pencarian FIS (Frequent

Item Set) dilakukan melalui beberapapengujian dan penghitungan dengan urutan-urutan tertentu seperti yang diuraikan dibagian di bawah ini.

a. Penentuan Nilai Support KunjunganSupport dari sebuah pola asosiasi

mengacu pada prosentase jumlah transaksi-transaksi data yang relevan untuk polatertentu. Sintak Umum pencarian supportsebagai berikut :

Untuk permasalahan yang sedang dibahasmaka perhitungannya adalah sebagai berikut :

Tabel 9. Database Pola Kunjungan :

Hasil perhitungan persentase untuk tiap-tiapitem kunjungan adalah seperti yangdipaparkan pada tabel 10.

Page 9: ISSN - lppm.trigunadharma.ac.id M... · komunikasi antar Web Server dengan ... Dan dapat digunakan secara efektif pada bidang Web Mining yang diilustrasikan sebagai berikut : pada

Muhammad Dahria dan Muhammad Syahril, Analisis Web Server Log dalam Pencarian Pola………

Jurnal SAINTIKOM Vol. 13, No. 3, September 2014 205

Tabel 10. HasilSupport Item Kunjungan

b. Penentuan Nilai Minumun SupportPenentuan nilai Minimum Support

sebuah kunjungan adalah bergantung padakebutuhan user. Artinya setiap user bebasuntuk menentukan berapa nilai minimumsupport yang layak untuk dimasukkan sebagaiketentuan pengisian sebuah support.Sebagai pengujian awal penulis akanmemasukkan nilai 20% untuk masing-masingminimum support dan minimum confidence.

c. Data Analisis Association RuleUntuk mencari hubungan asosiasi dari

tiap-tiap item kunjungan. Jika kita akanmenguji seorang Host akan mengunjungihalaman BERITA (ANS1), maka ia juga akanmengunjungi halaman KOMENTAR (P3), makaformulasi untuk mencari asosiasi antarakeduanya adalah :- SupportANS1 => P3 adalah :

-

- ConfidenceANS1 => P3 adalah :

- Sehingga Confidence P3 => ANS1 :

Demikian proses perhitungan Support danConfidence antar item set yang lain.

9. Frequent Item Set yang DitemukanPenentuan Frequent Item Set (FIS)

bergantung pada nilai minimum support danminimum confidence yang dimasukkan sejakawal perhitungan ini, yaitu :

sehingga sebuah item akan dikatakaninterest jika nilai Support nya >= NilaiMinimum Support. Hasil penentuan ini sepertiyang dihasilkan pada Tabel 11.

Tabel 11. Penentuan Interest dan Uninterest

Data yang memenuhi syarat akandipisahkan untuk segera diproses kembaliuntuk penentuan pencarian FIS lebih lanjut.Suatu subset dari FIS harus juga Frequent atauInterest.

Minimum Support : 20%

Minimum Confidence : 20%

Page 10: ISSN - lppm.trigunadharma.ac.id M... · komunikasi antar Web Server dengan ... Dan dapat digunakan secara efektif pada bidang Web Mining yang diilustrasikan sebagai berikut : pada

Muhammad Dahria dan Muhammad Syahril, Analisis Web Server Log dalam Pencarian Pola………

206Jurnal SAINTIKOM Vol. 13, No. 3, September 2014

Tabel 12. Penentuan Data Interest

Berdasarkan data di atas, makaditemukan daftar Interest Association Ruleshanya sampai pada 2 item set. Data yangdihasilkan pada sampel penelitian yang telahdibahas adalah :

Tabel 13. Tabel Interest Association Rules

Jika kita telah menguji asosiasikunjungan halaman BERITA (ANS1), terhadapkunjungan halaman KOMENTAR (P3), makalebih lanjut kita akan membahas bagaimanahugungan asosiasi antara halaman DINASDAERAH (C4) dengan halaman PROFILPEJABAT DAERAH (A5), maka untukmenghitung Minimum Support dan MinimumConfidence dari dua asosiasi diatas dapatdiuraikan dengan paparan di bawah ini :

Rules {C4}=> {A5}:Diketahui :Support A5= 6/17 * 100% = 35,29%Support C4 = 6/17 * 100% = 35,29%

10. Interesting Rules yang DitemukanBerdasarkan perhitungan dan analisis

yang telah dilakukan terhadap data sampelyang ada maka ditemukanlah beberapa aturanyang dianggap diterima, yaitu :

Page 11: ISSN - lppm.trigunadharma.ac.id M... · komunikasi antar Web Server dengan ... Dan dapat digunakan secara efektif pada bidang Web Mining yang diilustrasikan sebagai berikut : pada

Muhammad Dahria dan Muhammad Syahril, Analisis Web Server Log dalam Pencarian Pola………

Jurnal SAINTIKOM Vol. 13, No. 3, September 2014 207

11. Hasi Akhir

Dari daftar Interest Association Rulesyang dihasilkan di atas, maka ditetapkanlahbeberapa aturan sebagai berikut :1. Aturan asosiasi antara halaman Berita

yang diinisialisasikan dengan simbol ANS1,dengan halaman Komentar yangdiinisialisasikan dengan simbol P3,memiliki dukungan data Support sebesar23,53%. Dengan kekuatan hubungandiantara keduanya bernilai 50%. Artinyabahwa setiap kunjungan yang dilakukanoleh pengunjung untuk meminta halamanBerita, selalu diikuti dengan permintaanhalaman halaman Komentar memilikikekuatan hubungan 50%.

2. Berdasarkan data komposisi tiap menupada halaman web, kedua halaman Beritadan Komentar selalu dikunjungi secarabersama dan disajikan pada kedalamanlevel yang sama pula, sehingga untukasosiasi ini penyajian menu halamanwebsite Pemerintah Kota Medankhususnya halaman Berita dan halamanKomentar sudah dapat dikatakan efektif.

3. Berdasarkan data komposisi tiap menupada halaman web, kedua halaman ProfilPejabat Daerah dan halaman Dinas Daerahselalu dikunjungi secara bersama namundisajikan pada kedalaman level yangberbeda, sehingga untuk asosiasi inipenyajian menu halaman websitePemerintah Kota Medan khususnya

halaman Profil Pejabat Daerah danhalaman Dinas Daerah belum dapatdikatakan efektif, karena seorangpengunjung harus melewati level menuberbeda untuk mencari halaman yangmemiliki aturan asosiasi yang kuat.Sehingga untuk keperluan pengembanganmaupun perancangan ulang komposisimenu pada halaman web site PemerintahKota Medan dimasa yang akan datangperlu memposisikan kedua halamantersebut kedalam level yang sama untukmemudahkan pengunjung mengaksesinformasi yang diinginkan. Adalah perlujuga mempertimbangkan aspek bebanakses dan perancangan antar muka padahalaman-halaman web yang masuk dalaminteresting association rules ini dengantujuan agar setiap halaman dapat diakseslebih cepat dan dapat disajikan secaralebih menyenangkan.

SIMPULAN

Dengan mengacu kepada analisis webserver log yang dilakukan dan implementasisystem yang ada didapatkan beberapakesimpulan, antara lain :1. Data Mining mampu dijadikan sebagai

alat bantu untuk proses analisis webserver log dalam pencarian polakunjungan website Pemerintah KotaMedan dengan menerapkan metode yangtepat yaitu metode Association Rule yangmampu menghasilkan aturan-aturanasosiasi yang menggambarkan polakunjungan terhadap website PemkoMedan.

2. Penerapan teknik Association Rulesmenggunakan Algoritma Apriori yaitudengan menentukan nilai Support (jumlahdukungan) dan Confidence (kekuatanhubungan) terhadap data kunjungan yangada dalam web server log.

Page 12: ISSN - lppm.trigunadharma.ac.id M... · komunikasi antar Web Server dengan ... Dan dapat digunakan secara efektif pada bidang Web Mining yang diilustrasikan sebagai berikut : pada

Muhammad Dahria dan Muhammad Syahril, Analisis Web Server Log dalam Pencarian Pola………

208Jurnal SAINTIKOM Vol. 13, No. 3, September 2014

3. Bahwa telah ditemukan pola pengujunghalaman situs web pemerintah KotaMedan dengan pemanfaatan Data Miningdan teknik Association Rules dan berhasilmenemukan asosiasi yang mengandunginformasi berharga untuk dimanfaatkandalam melakukan pengembangan ataurestrukturisasi halaman web yang lebihbaik dimasa yang akan datang.

4. Tidak semua data dari web server logmerupakan data yang siap untukdigunakan dan sangat sedikit sekali daridata tersebut yang merupakan data yang‘berarti’.

5. Berdasarkan data komposisi tiap menupada halaman web, kedua halaman Beritadan Komentar selalu dikunjungi secarabersama dan disajikan pada kedalamanlevel yang sama pula, sehingga untukasosiasi ini penyajian menu halamanwebsite Pemerintah Kota Medankhususnya halaman Berita dan halamanKomentar sudah dapat dikatakan efektif.

6. Berdasarkan data komposisi tiap menupada halaman web, kedua halaman ProfilPejabat Daerah dan halaman DinasDaerah selalu dikunjungi secara bersamanamun disajikan pada kedalaman levelyang berbeda, sehingga untuk asosiasi inipenyajian menu halaman websitePemerintah Kota Medan khususnyahalaman Profil Pejabat Daerah danhalaman Dinas Daerah belum dapatdikatakan efektif, karena seorangpengunjung harus melewati level menuberbeda untuk mencari halaman yangmemiliki aturan asosiasi yang kuat.Sehingga untuk keperluan pengembanganmaupun perancangan ulang komposisimenu pada halaman web site PemerintahKota Medan dimasa yang akan datangperlu memposisikan kedua halamantersebut kedalam level yang sama untuk

memudahkan pengunjung mengaksesinformasi yang diinginkan

DAFTAR PUSTAKA

Jiawei Han and Michelin Kamber. 2000.DataMining: Concept and Tecniques,Intellegent Database System ResearchLab School of Computing Science,Canada, Chap. 6.

Ah-Hwee Tan. 1999. Text Mining: Promisesand Challenges. Kent Ridge Digital LabsSingapore: Email,[email protected]

R. Cooley B.Mobahseeer, and J. Srivastava.1998. Web Mining : Information andPattern Discovery on the World WideWeb, Departemen of ComputerScience and Engineering Univ. Ofminnesota, 55455, USA

R. Agrawal, R. Srikant. 2001. Mining SequentialPatterns.Proc. IEEE Int. Conf. On DataEngineering (ICDE ’01), 1995

Ramakharisnan Srikant, Yunghui Yang. 2001.Mining Web Logs to Improve WebsiteOrganization.Hongkong: Journal

Yongjian Fu, mario Creado, Chunhua Ju. 1970.Reorganizing Web Sites Based on UserAcces Patterns. USA:Journal, Unversityof Missouri-Rolla Miner Circle.

Gregoris S. Budhi, Ibnu Gunawan, FerryYuwono. 2007. Algoritma PorterStemmer For Bahasa Indonesia UntukPre-Processing Text Mining BerbasisMetode Market Basket Analysis:Surabaya: Jurnal UK Petra jurusanTeknik Informatika.

Arrummaisha Adrifina, Juwita UP, I WayanSW. 2008. Pemilihan Artikel BeritaDengan Text Mining.