DMining 1.docx

11
DATA MINING “Tugas 1 Pertemuan 1” OLEH : NIM : 130030174 NAMA : I WAYAN SUMALYA JENJANG STUDI : STRATA SATU (S1) PROGRAM STUDI : SISTEM INFORMASI

description

Istilah data mining

Transcript of DMining 1.docx

Page 1: DMining 1.docx

DATA MINING

“Tugas 1 Pertemuan 1”

OLEH :NIM : 130030174NAMA : I WAYAN SUMALYAJENJANG STUDI : STRATA SATU (S1)PROGRAM STUDI : SISTEM INFORMASI

SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN TEKNIK KOMPUTER

(STMIK) STIKOM BALI2014

Page 2: DMining 1.docx

Tuliskan pengertian dari istilah berikut ini :

a. Data

b. Informasi

c. Warehousing

d. Jaringan syaraf tiruaan

e. Pengenalan pola

f. Algoritma Genetika

g. Analisis diskriminan

h. Regresi

i. Regresi Linier

j. Regresi Non Linier

Jawaban :

a. Data

Menurut Kristanto (2004:4) data adalah “Sesuatu yang nyata, fakta

mengenai objek yang dapat mengurangi derajat ketidakpastian

tentang suatu keadaan atau kejadian”.

Dari pengertian tersebut maka dapat disimpulkan bahwa data

merupakan catatan nyata dari suatu obyek seperti tempat, benda

dan orang-orang yang benar-benar terjadi atau merupakan

representasi dari kenyataan namun belum sepenuhnya dapat

dimengerti dan dimanfaatkan oleh orang yang membutuhkan dan

masih perlu dilakukan pengolahan sehingga nantinya data tersebut

menjadi sebuah informasi.

b. Informasi

Berdasarkan pendapat bebrpa ahli informasi di definisikan sebagai

berikut :

Abdul Kadir (2002: 31); McFadden dkk (1999)

mendefinisikan informasi sebagai data yang telah diproses

Page 3: DMining 1.docx

sedemikian rupa sehingga meningkatkan pengetahuan

seseorang yang menggunakan data tersebut.

Azhar Susanto (2004:46) dalam bukunya Sistem Informasi

Akuntansi, menyatakan bahwa informasi adalah hasil

pengolahan data yang memberikan arti dan manfaat.

Burch dan Strater menyatakan bahwa informasi adalah

pengumpulan atau pengolahan data untuk memberikan

pengetahuan atau keterangan.

George R. Terry berpendapat bahwa informasi adalah data

yang penting yang memberikan pengetahuan yang berguna.

Jogianto (2004:8) dalam bukunya yang berjudul Analisis dan

Desain Sistem Informasi, berpendapat bahwa informasi

adalah data yang diolah menjadi bentuk yang lebih berguna

bagi yang menerimanya.

Menurut Gordon B. Davis (1991: 28), informasi adalah data

yang telah diolah menjadi sebuah bentuk yang berarti bagi

penerimanya dan bermanfaat bagi pengambilan keputusan

saat ini atau mendatang.

Menurut Jogiyanto HM., (1999: 692), informasi adalah hasil

dari pengolahan data dalam suatu bentuk yang lebih

berguna dan lebih berarti bagi penerimanya yang

menggambarkan suatu kejadian – kejadian (event) yang

nyata (fact) yang digunakan untuk pengambilan keputusan.

Berdasarkan Pengertian informasi menurut para ahli yang telah

disebutkan diatas, dapat disimpulkan bahwa informasi adalah

sekumpulan fakta-fakta yang telah diolah menjadi bentuk data,

sehingga dapat menjadi lebih berguna atau bermakna dan dapat

digunakan oleh siapa saja yang membutuhkan informasi tersebut

sebagai pengetahuan ataupun dapat digunakan dalam

pengambilan keputusan.

Page 4: DMining 1.docx

c. Warehousing

Warehousing (penggudangan) adalah penyimpanan barang

(storage) sebelum digunakan, dalam arti luas, juga termasuk

fasilitas dan lokasi dalam menyediakan pergudangan (menurut : taff

dalam coyke et al,1992)

Sementara dalam konsep Data warehouse adalah suatu konsep

dan kombinasi teknologi yang memfasilitasi organisasi untuk

mengelola dan memelihara data historis yang diperoleh dari sistem

atau aplikasi operasional (Ferdiana, 2008).

Jadi, data warehouse merupakan metode dalam perancangan

database, yang menunjang DSS (Decission Support System) dan

EIS (Executive Information System). Secara fisik data warehouse

adalah database, tapi perancangan data warehouse dan database

sangat berbeda. Dalam perancangan database tradisional

menggunakan normalisasi, sedangkan pada data warehouse

normalisasi bukanlah cara yang terbaik.

d. Jaringan Syaraf Tiruan

Jaringan syaraf tiruan (artifical neural network) adalah sistem

komputasi yang arsitektur dan operasinya diilhami dari

pengetahuan tentang sel syaraf biologis di dalam otak. Jaringan

syaraf tiruan merupakan salah satu representasi buatan dari otak

manusia yang selalu mencoba menstimulasi proses pembelajaran

pada otak manusia tersebut. Jaringan syaraf tiruan dapat

digambarkan sebagai model matematis dan komputasi untuk fungsi

aproksimasi non-linear, klasifikasi data cluster dan regresi non-

parametrik atau sebuah simulasi dari koleksi model jaringan syaraf

biologi.

Model jaringan syaraf ditunjukkan dengan kemampuannya dalam

emulasi, analisis, prediksi dan asosiasi. Kemampuan yang dimiliki

jaringan syaraf tiruan dapat digunakan untuk belajar dan

menghasilkan aturan atau operasi dari beberapa contoh atau input

Page 5: DMining 1.docx

yang dimasukkan dan membuat prediksi tentang kemungkinan

output yang akan muncul atau menyimpan karakteristik input yang

diberikan kepada jaringan syaraf tiruan.

Salah satu organisasi yang sering digunakan dalam paradigma

jaringan syaraf tiruan adalah perambatan galat mundur atau

backpropagation. (Hermawan, 2006)

e. Pengenalan Pola

Pengenalan pola merupakan cabang dari kecerdasan buatan Atau

Artificial Inteligence. Beberapa definisi tentang pengenalan pola, di

antaranya:

Suatu ilmu untuk mengklasifikasikan atau menggambarkan

sesuatu berdasarkan pengukuran kuantitatif fitur (ciri) atau

sifat utama dari suatu obyek. (Putra, Darma : 2010).

Penentuan suatu objek fisik atau kejadian ke dalam salah

satu atau beberapa kategori. (Duda dan Hart dalam Al Fatta,

Hanif, 2009).

Berdasarkan definisi di atas, pengenalan pola dapat didefinisikan

sebagai cabang kecerdasan buatan yang menitikberatkan pada

metode pengklasifikasian objek ke dalam kelas-kelas tertentu untuk

menyelesaikan masalah tertentu.

f. Algoritma Genetika

Algoritma genetika adalah algoritma komputasi yang diinspirasi

teori evolusi yang kemudian diadopsi menjadi algoritma komputasi

untuk mencari solusi suatu permasalahan dengan cara yang lebih

“alamiah”, algoritma genetik juga merupakan algoritma pencarian

secara heuristik. Salah satu fungsinya ialah untuk mencari solusi

atas permasalahan optimasi kombinasi, yaitu mendapatkan suatu

nilai solusi optimal terhadap suatu permasalahan yang mempunyai

banyak kemungkinan solusi. Teori dasar dari Algoritma Genetika

dikembangkan oleh John Holland awal tahun 1975 di Universitas

Page 6: DMining 1.docx

Michigan, Amerika Serikat. Dimana prinsip algoritma genetik

diambil dari teori Darwin yaitu setiap makhluk hidup akan

menurunkan satu atau beberapa karakter ke anak atau

keturunannya. Penyelesaian menggunakan algoritma genetik

sangat berpengaruh dari kromosom yang dibangun, dimana

kromosom ialah sebuah molekul yang berisi DNA dimana terdapat

informasi genetik dalam setiap sel gen yang disimpan.

g. Analisis Diskriminan

Analisis diskriminan adalah bagian dari analisis statistik peubah

ganda (multivariate statistical analysis) yang bertujuan untuk

memisahkan beberapa kelompok data yang sudah terkelompokkan

dengan cara membentuk fungsi diskriminan. Analisis diskriminan

adalah salah satu teknik statistik yang bisa digunakan pada

hubungan dependensi (hubungan antar variabel dimana sudah bisa

dibedakan mana variabel respon dan mana variabel penjelas).

Lebih spesifik lagi, analisis diskriminan digunakan pada kasus

dimana variabel respon berupa data kualitatif dan variabel penjelas

berupa data kuantitatif.

Menurut Johnson and Wichern (1982 : 470), tujuan dari analisis

disriminan adalah untuk menggambarkan ciri-ciri suatu

pengamatan dari bermacam-macam populasi yang diketahui, baik

secara grafis maupun aljabar dengan membentuk fungsi

diskriminan. Dengan kata lain, analisis diskriminan digunakan untuk

mengklasifikasikan individu ke dalam salah satu dari dua kelompok

atau lebih.

h. Regresi

Regresi adalah suatu metode analisis statistik yang digunakan

untuk melihat pengaruh antara dua atau lebih variabel. Hubungan

variabel tersebut bersifat fungsional yang diwujudkan dalam suatu

model matematis. Pada analisis regresi, variabel dibedakan

Page 7: DMining 1.docx

menjadi dua bagian, yaitu variabel respons (response variable)

atau biasa juga disebut variabel bergantung (dependent variable)

dan variabel explanory atau biasa disebut penduga (predictor

variable) atau disebut juga variabel bebas (independent variabel).

Jenis-jenis regresi terbagi menjadi beberapa jenis, yaitu regresi

sederhana (linier sederhana dan nonlinier sederhana) dan regresi

berganda (linier berganda atau nonlinier berganda).

i. Regresi Linier

Dalam Somantri (2011:243), dinyatakan bahwa Regresi

Linier Sederhana bertujuan untuk mempelajari hubungan

linier antara dua variabel.

Sedangkan dalam Sugiyono (2011: 261), dinyatakan bahwa

Regresi sederhana didasarkan pada hubungan fungsional

ataupun kausal satu variabel independen dengan satu

variabel dependen.

Model regresi linier sederhana : y = a+bx, dimana y adalah

variabel tak bebas (nilai duga), x adalah variabel bebas, a

adalah penduga bagi intersap (α), b adalah penduga bagi

koefisien regresi ( ), dan α, ß adalah parameter yang nilainya

tidak diketahui sehingga diduga menggunakan statistik sampel.

j. Regresi Non Linier

Regresi non linier adalah suatu metode untuk mendapatkan model

non linier yang menyatakan veriabel dependen dan independen.

Apabila hubungan fungsi antara variabel bebas X dan variabel tidak

bebas Y bersifat non linier, maksudnya jika data asli Xi dan Yi

ditebarkan pada diagram tebar (scater diagram) tidak mengikuti

garis lurus tetapi mengikuti suatu bentuk kurva tertentu, katakanlah

kurva eksponensial, maka analisis regresi yang cocok untuk

Page 8: DMining 1.docx

menerangkan hubungan antara X dan Y tersebut adalah analisis

regresi non linier sederhana.