DMining 1.docx
-
Upload
wayan-sumalya -
Category
Documents
-
view
223 -
download
2
description
Transcript of DMining 1.docx
DATA MINING
“Tugas 1 Pertemuan 1”
OLEH :NIM : 130030174NAMA : I WAYAN SUMALYAJENJANG STUDI : STRATA SATU (S1)PROGRAM STUDI : SISTEM INFORMASI
SEKOLAH TINGGI MANAJEMEN INFORMATIKA DAN TEKNIK KOMPUTER
(STMIK) STIKOM BALI2014
Tuliskan pengertian dari istilah berikut ini :
a. Data
b. Informasi
c. Warehousing
d. Jaringan syaraf tiruaan
e. Pengenalan pola
f. Algoritma Genetika
g. Analisis diskriminan
h. Regresi
i. Regresi Linier
j. Regresi Non Linier
Jawaban :
a. Data
Menurut Kristanto (2004:4) data adalah “Sesuatu yang nyata, fakta
mengenai objek yang dapat mengurangi derajat ketidakpastian
tentang suatu keadaan atau kejadian”.
Dari pengertian tersebut maka dapat disimpulkan bahwa data
merupakan catatan nyata dari suatu obyek seperti tempat, benda
dan orang-orang yang benar-benar terjadi atau merupakan
representasi dari kenyataan namun belum sepenuhnya dapat
dimengerti dan dimanfaatkan oleh orang yang membutuhkan dan
masih perlu dilakukan pengolahan sehingga nantinya data tersebut
menjadi sebuah informasi.
b. Informasi
Berdasarkan pendapat bebrpa ahli informasi di definisikan sebagai
berikut :
Abdul Kadir (2002: 31); McFadden dkk (1999)
mendefinisikan informasi sebagai data yang telah diproses
sedemikian rupa sehingga meningkatkan pengetahuan
seseorang yang menggunakan data tersebut.
Azhar Susanto (2004:46) dalam bukunya Sistem Informasi
Akuntansi, menyatakan bahwa informasi adalah hasil
pengolahan data yang memberikan arti dan manfaat.
Burch dan Strater menyatakan bahwa informasi adalah
pengumpulan atau pengolahan data untuk memberikan
pengetahuan atau keterangan.
George R. Terry berpendapat bahwa informasi adalah data
yang penting yang memberikan pengetahuan yang berguna.
Jogianto (2004:8) dalam bukunya yang berjudul Analisis dan
Desain Sistem Informasi, berpendapat bahwa informasi
adalah data yang diolah menjadi bentuk yang lebih berguna
bagi yang menerimanya.
Menurut Gordon B. Davis (1991: 28), informasi adalah data
yang telah diolah menjadi sebuah bentuk yang berarti bagi
penerimanya dan bermanfaat bagi pengambilan keputusan
saat ini atau mendatang.
Menurut Jogiyanto HM., (1999: 692), informasi adalah hasil
dari pengolahan data dalam suatu bentuk yang lebih
berguna dan lebih berarti bagi penerimanya yang
menggambarkan suatu kejadian – kejadian (event) yang
nyata (fact) yang digunakan untuk pengambilan keputusan.
Berdasarkan Pengertian informasi menurut para ahli yang telah
disebutkan diatas, dapat disimpulkan bahwa informasi adalah
sekumpulan fakta-fakta yang telah diolah menjadi bentuk data,
sehingga dapat menjadi lebih berguna atau bermakna dan dapat
digunakan oleh siapa saja yang membutuhkan informasi tersebut
sebagai pengetahuan ataupun dapat digunakan dalam
pengambilan keputusan.
c. Warehousing
Warehousing (penggudangan) adalah penyimpanan barang
(storage) sebelum digunakan, dalam arti luas, juga termasuk
fasilitas dan lokasi dalam menyediakan pergudangan (menurut : taff
dalam coyke et al,1992)
Sementara dalam konsep Data warehouse adalah suatu konsep
dan kombinasi teknologi yang memfasilitasi organisasi untuk
mengelola dan memelihara data historis yang diperoleh dari sistem
atau aplikasi operasional (Ferdiana, 2008).
Jadi, data warehouse merupakan metode dalam perancangan
database, yang menunjang DSS (Decission Support System) dan
EIS (Executive Information System). Secara fisik data warehouse
adalah database, tapi perancangan data warehouse dan database
sangat berbeda. Dalam perancangan database tradisional
menggunakan normalisasi, sedangkan pada data warehouse
normalisasi bukanlah cara yang terbaik.
d. Jaringan Syaraf Tiruan
Jaringan syaraf tiruan (artifical neural network) adalah sistem
komputasi yang arsitektur dan operasinya diilhami dari
pengetahuan tentang sel syaraf biologis di dalam otak. Jaringan
syaraf tiruan merupakan salah satu representasi buatan dari otak
manusia yang selalu mencoba menstimulasi proses pembelajaran
pada otak manusia tersebut. Jaringan syaraf tiruan dapat
digambarkan sebagai model matematis dan komputasi untuk fungsi
aproksimasi non-linear, klasifikasi data cluster dan regresi non-
parametrik atau sebuah simulasi dari koleksi model jaringan syaraf
biologi.
Model jaringan syaraf ditunjukkan dengan kemampuannya dalam
emulasi, analisis, prediksi dan asosiasi. Kemampuan yang dimiliki
jaringan syaraf tiruan dapat digunakan untuk belajar dan
menghasilkan aturan atau operasi dari beberapa contoh atau input
yang dimasukkan dan membuat prediksi tentang kemungkinan
output yang akan muncul atau menyimpan karakteristik input yang
diberikan kepada jaringan syaraf tiruan.
Salah satu organisasi yang sering digunakan dalam paradigma
jaringan syaraf tiruan adalah perambatan galat mundur atau
backpropagation. (Hermawan, 2006)
e. Pengenalan Pola
Pengenalan pola merupakan cabang dari kecerdasan buatan Atau
Artificial Inteligence. Beberapa definisi tentang pengenalan pola, di
antaranya:
Suatu ilmu untuk mengklasifikasikan atau menggambarkan
sesuatu berdasarkan pengukuran kuantitatif fitur (ciri) atau
sifat utama dari suatu obyek. (Putra, Darma : 2010).
Penentuan suatu objek fisik atau kejadian ke dalam salah
satu atau beberapa kategori. (Duda dan Hart dalam Al Fatta,
Hanif, 2009).
Berdasarkan definisi di atas, pengenalan pola dapat didefinisikan
sebagai cabang kecerdasan buatan yang menitikberatkan pada
metode pengklasifikasian objek ke dalam kelas-kelas tertentu untuk
menyelesaikan masalah tertentu.
f. Algoritma Genetika
Algoritma genetika adalah algoritma komputasi yang diinspirasi
teori evolusi yang kemudian diadopsi menjadi algoritma komputasi
untuk mencari solusi suatu permasalahan dengan cara yang lebih
“alamiah”, algoritma genetik juga merupakan algoritma pencarian
secara heuristik. Salah satu fungsinya ialah untuk mencari solusi
atas permasalahan optimasi kombinasi, yaitu mendapatkan suatu
nilai solusi optimal terhadap suatu permasalahan yang mempunyai
banyak kemungkinan solusi. Teori dasar dari Algoritma Genetika
dikembangkan oleh John Holland awal tahun 1975 di Universitas
Michigan, Amerika Serikat. Dimana prinsip algoritma genetik
diambil dari teori Darwin yaitu setiap makhluk hidup akan
menurunkan satu atau beberapa karakter ke anak atau
keturunannya. Penyelesaian menggunakan algoritma genetik
sangat berpengaruh dari kromosom yang dibangun, dimana
kromosom ialah sebuah molekul yang berisi DNA dimana terdapat
informasi genetik dalam setiap sel gen yang disimpan.
g. Analisis Diskriminan
Analisis diskriminan adalah bagian dari analisis statistik peubah
ganda (multivariate statistical analysis) yang bertujuan untuk
memisahkan beberapa kelompok data yang sudah terkelompokkan
dengan cara membentuk fungsi diskriminan. Analisis diskriminan
adalah salah satu teknik statistik yang bisa digunakan pada
hubungan dependensi (hubungan antar variabel dimana sudah bisa
dibedakan mana variabel respon dan mana variabel penjelas).
Lebih spesifik lagi, analisis diskriminan digunakan pada kasus
dimana variabel respon berupa data kualitatif dan variabel penjelas
berupa data kuantitatif.
Menurut Johnson and Wichern (1982 : 470), tujuan dari analisis
disriminan adalah untuk menggambarkan ciri-ciri suatu
pengamatan dari bermacam-macam populasi yang diketahui, baik
secara grafis maupun aljabar dengan membentuk fungsi
diskriminan. Dengan kata lain, analisis diskriminan digunakan untuk
mengklasifikasikan individu ke dalam salah satu dari dua kelompok
atau lebih.
h. Regresi
Regresi adalah suatu metode analisis statistik yang digunakan
untuk melihat pengaruh antara dua atau lebih variabel. Hubungan
variabel tersebut bersifat fungsional yang diwujudkan dalam suatu
model matematis. Pada analisis regresi, variabel dibedakan
menjadi dua bagian, yaitu variabel respons (response variable)
atau biasa juga disebut variabel bergantung (dependent variable)
dan variabel explanory atau biasa disebut penduga (predictor
variable) atau disebut juga variabel bebas (independent variabel).
Jenis-jenis regresi terbagi menjadi beberapa jenis, yaitu regresi
sederhana (linier sederhana dan nonlinier sederhana) dan regresi
berganda (linier berganda atau nonlinier berganda).
i. Regresi Linier
Dalam Somantri (2011:243), dinyatakan bahwa Regresi
Linier Sederhana bertujuan untuk mempelajari hubungan
linier antara dua variabel.
Sedangkan dalam Sugiyono (2011: 261), dinyatakan bahwa
Regresi sederhana didasarkan pada hubungan fungsional
ataupun kausal satu variabel independen dengan satu
variabel dependen.
Model regresi linier sederhana : y = a+bx, dimana y adalah
variabel tak bebas (nilai duga), x adalah variabel bebas, a
adalah penduga bagi intersap (α), b adalah penduga bagi
koefisien regresi ( ), dan α, ß adalah parameter yang nilainya
tidak diketahui sehingga diduga menggunakan statistik sampel.
j. Regresi Non Linier
Regresi non linier adalah suatu metode untuk mendapatkan model
non linier yang menyatakan veriabel dependen dan independen.
Apabila hubungan fungsi antara variabel bebas X dan variabel tidak
bebas Y bersifat non linier, maksudnya jika data asli Xi dan Yi
ditebarkan pada diagram tebar (scater diagram) tidak mengikuti
garis lurus tetapi mengikuti suatu bentuk kurva tertentu, katakanlah
kurva eksponensial, maka analisis regresi yang cocok untuk
menerangkan hubungan antara X dan Y tersebut adalah analisis
regresi non linier sederhana.