PHP_C_5212100121_5212100132_5212100148
-
Upload
afifa-fifaliani -
Category
Documents
-
view
35 -
download
0
description
Transcript of PHP_C_5212100121_5212100132_5212100148
-
Tugas 4 Kelas: C
Mata Kuliah:
Pengelolaan Hubungan Pelanggan (CRM)
Semester Ganjil 2012/2013
Management
Dikumpulkan Senin Tanggal 23 Desember 2013, Jam 09.30 (Softcopy)
Senin Tanggal 30 Desember 2013, Jam 09.30 (Hardcopy)
Nama NRP
AFIFA FILIANI SEHATO 5212100121
WIDYA MUKTI
PINANDHITANINGRUM
5212100132
KHAIRUNNISA ROFIFAH 5212100148
JURUSAN SISTEM INFORMASI
FAKULTAS TEKNOLOGI INFORMASI
INSTITUT TEKNOLOGI SEPULUH NOPEMBER
2013
IMPLEMENTASI FUNGSI DATA MINING CLASSIFY, ESTIMATE, CLUSTERING PADA EXCEL
Komentar:
-
DAFTAR ISI
DAFTAR ISI.................................................................................................................................................... 2
DAFTAR TABEL ............................................................................................................................................ 3
DAFTAR GAMBAR........................................................................................................................................ 3
BAB 1. PENDAHULUAN ............................................................................................................................... 5
1.1 Latar Belakang Permasalahan .......................................................................................................... 5
1.2 Tujuan ............................................................................................................................................. 6
1.3 Batasan Masalah .............................................................................................................................. 6
BAB 2. KAJIAN TEORI .................................................................................................................................. 7
2.1 Data Mining .................................................................................................................................... 7
Langkah-langkah untuk melakukan data mining ........................................................................................ 7
2.2 Implementasi ke CRM ..................................................................................................................... 8
Beberapa solusi yang bisa diselesaikan dengan data mining dalam CRM ................................................... 8
2.3 Penerapannya di Excel ..................................................................................................................... 9
kegunaan tools data mining pada excel ...................................................................................................... 9
BAB 3. IMPLEMENTASI DATA MINING DALAM MICROSOFT EXCEL ................................................ 10
3.1 Classification ................................................................................................................................. 10
3.2 Estimation ..................................................................................................................................... 13
3.3 Clustering ...................................................................................................................................... 16
BAB 4. ANALISA DAN PEMBAHASAN ..................................................................................................... 21
4.1 Analisa .......................................................................................................................................... 21
4.1.1 Classify ..................................................................................................................................... 21
4.1.2 Estimate .................................................................................................................................... 23
4.1.3 Cluster....................................................................................................................................... 24
4.2 Pembahasan .......................................................................................................................................... 27
4.2.1 Tugas- Tugas yang Bisa Diselesaikan Menggunakkan Data Mining ............................................ 27
4.2.2 Penyelesaian Data Mining Menggunakan Fungsi Microsoft Excel .............................................. 28
4.2.3 Penerapan Data Mining di Excel Menggunakan Fungsi classify, estimate, dan clustering ............ 29
-
BAB 5. PENUTUP ......................................................................................................................................... 30
5.1 Kesimpulan ................................................................................................................................... 30
5.2 Saran ............................................................................................................................................. 30
DAFTAR PUSTAKA ..................................................................................................................................... 31
DAFTAR TABEL
Tabel 1. Penerapan Fungsi Classify, Estimate, dan Clustering pada Excel ........................................................ 29
DAFTAR GAMBAR
Gambar 1 Langkah-langkah Penggunaan Data Mining ...................................................................................... 7
Gambar 2. (Data Mining Add-ins for Excel) ..................................................................................................... 9
Gambar 3. Pilih icon classify .......................................................................................................................... 10
Gambar 4. Classify Wizard ............................................................................................................................. 10
Gambar 5. Select source data - Classify Wizard .............................................................................................. 11
Gambar 6. Klasifikasi - Pilih kolom yang akan di analisa ................................................................................ 11
Gambar 7. Percentage data for testing - Classify ............................................................................................. 11
Gambar 8. Finishing - Classify ....................................................................................................................... 12
Gambar 9. Decision tree Classify ................................................................................................................. 12
Gambar 10. Dependency network - Classify .................................................................................................... 13
Gambar 11. Pilih icon Estimate ....................................................................................................................... 13
Gambar 12. Estimate Wizard .......................................................................................................................... 14
Gambar 13. Select source data - Estimate ........................................................................................................ 14
Gambar 14. Column to analysis - Estimate ...................................................................................................... 14
Gambar 15. Percentage data Estimate........................................................................................................... 15
Gambar 16. Finishing - Estimate ..................................................................................................................... 15
Gambar 17. Decision tree - Estimate ............................................................................................................... 15
Gambar 18. Hasil Dependency network - Estimate .......................................................................................... 16
Gambar 19. Pilih icon cluster .......................................................................................................................... 16
Gambar 20. Cluster Wizard ............................................................................................................................ 17
-
Gambar 21. Select source data Cluster ......................................................................................................... 17
Gambar 22. Clustering .................................................................................................................................... 17
Gambar 23. Percentage data Cluster ............................................................................................................. 18
Gambar 24. Finishing Cluster ...................................................................................................................... 18
Gambar 25. Cluster diagram Clustering........................................................................................................ 18
Gambar 26. Cluster Profiles ............................................................................................................................ 19
Gambar 27. Cluster Characteristics ................................................................................................................. 19
Gambar 28. Cluster Discrimination ................................................................................................................. 20
Gambar 29. Analisa klasifikasi income ........................................................................................................... 21
Gambar 30. Analisa decision tree pada classify ............................................................................................... 21
Gambar 31. Analisa dependency network pada classify ................................................................................... 22
Gambar 32. Analisa Cars pada Estimate .......................................................................................................... 23
Gambar 33. Analisa decision tree pada estimate .............................................................................................. 23
Gambar 34. Hasil Dependency network Estimate ......................................................................................... 24
Gambar 35. Analisa Clustering ....................................................................................................................... 24
Gambar 36. Analisa cluster diagram ............................................................................................................... 25
Gambar 37. Analisa cluster profiles ................................................................................................................ 25
Gambar 38. Mining Legend - Clustering ......................................................................................................... 26
Gambar 39. Analisa Cluster Characteristics..................................................................................................... 26
Gambar 40. Analisa cluster discrimination ...................................................................................................... 27
-
BAB 1. PENDAHULUAN
Pada BAB ini akan dijelaskan mengenai latar belakang, tujuan, dan batasan masalah yang
diimplementasikan pada data mining untuk CRM.
1.1 LATAR BELAKANG PERMASALAHAN
Pada beberapa tahun belakangan ini telah terjadi perkembangan yang sangat pesat terhadap
teknologi pengoleksian dan penyimpanan data. Perkembangan teknologi tersebut
memungkinkan pengumpulan dan penyimpanan data dengan lebih cepat, kapasitas yang lebih
besar, dan harga yang lebih murah. Pada akhirnya perkembangan teknologi tersebut
menimbulkan penumpukan koleksi data, misalnya: data transaksi penjualan pada sebuah
swalayan, data pasien pada rumah sakit, data rekening pada bank, dan sebagainya. Ukuran
basis data meningkat baik dalam jumlah record (baris data) maupun jumlah atribut pada
record. Hal ini didukung oleh perkembangan perangkat keras dan teknologi basis data yang
memungkinkan penyimpanan dan pengaksesan data secara efisien dan murah. Tetapi
kecepatan bertambah banyaknya data tersebut tidak diimbangi dengan banyaknya penarikan
informasi dari data tersebut. Jadi bisa dikatakan kita kaya akan data, tetapi miskin akan
informasi.
Dari sisi yang sama pula, kumpulan data jika dibiarkan begitu saja tidak akan dapat
memberikan nilai tambah berupa pengetahuan yang bermanfaat. Pengetahuan yang
bermanfaat ini misalnya, dari basis data penjualan pada perusahaan produk konsumen, dapat
diperoleh pengetahuan tentang hubungan antara penjualan barang tertentu dan golongan
konsumen dengan demografi tertentu. Pengetahuan ini dapat digunakan untuk melakukan
promosi penjualan baru yang keuntungannya dapat diprediksi relatif terhadap promosi
pemasaran lainnya. Basis data seringkali merupakan sumber daya potensial tidak aktif yang
sebenarnya dapat menghasilkan manfaat yang besar.
Secara konvensional, untuk memperoleh pengetahuan dari data dilakukan analisa dan
interpretasi secara manual. Namun analisa data manual sifatnya lambat, mahal, dan sangat
subjektif. Dengan fakta bahwa volume data sangat besar (hingga jutaan record dan ratusan
atribut pada tiap record dalam basis data), penggunaan analisa data manual menjadi sangat
tidak praktis, sehingga perlu beralih menggunakan teknik komputasi untuk menekan biaya
dan waktu yang terbuang. Proses pencarian pengetahuan bermanfaat dari data menggunakan
teknik komputasi ini dikenal dengan istilah Datamining atau Knowledge Discovery in
Databases (KDD). Dengan adanya sistem datamining ini sebuah perusahaan maupun
institusi nantinya mampu meningkatkan kompetisi strategis yang tepat dengan
menggabungan antara proses bisnis dan teknologi untuk mengembangkan pengetahuan yang
lebih mendalam mengenai perilaku pelanggan. Pengetahuan yang didapat digunakan untuk
meningkatkan (enhance) layanan kepada pelanggan, mendapatkan (acquire) pelanggan yang
baru, dan juga mempertahankan (retain) pelanggan, yang sangat erat kaitannya dengan
loyalitas pelanggan itu sendiri.
-
1.2 TUJUAN
Tujuan dari pengimplementasian data mining untuk CRM adalah:
1. Membuktikan bahwa perusahaan bisa meningkatkan marketing, sales dan customer support operation melalui pemahaman yang lebih baik terhadap pelanggan.
2. Membuktikan bahwa sebagian besar proses berkaitan dengan building models. 3. Membuktikan bahwa pekerjaan seperti Classification, Estimation, Prediction, Affinity
grouping, Clustering, Description and profiling bisa diselesaikan menggunakan data
mining.
4. Mempraktekkan keuntungan yang didapatkan dari proses data mining
1.3 BATASAN MASALAH
Batasan masalah yang kami gunakan hanya tiga yaitu:
1. Tugas apa saja yang bisa diselesaikan menggunakkan data mining? 2. Bagaimana penyelesaian data mining menggunakan fungsi yang disediakan pada
microsoft excel ?
3. Bagaimana penerapan data mining di excel menggunakan fungsi classify, estimate, dan clustering?
-
BAB 2. KAJIAN TEORI
BAB 2 ini menjelaskan tentang teori-teori mengenai data mining, implementasi ke CRM, dan
penerapannya di excel.
2.1 DATA MINING
Data mining merupakan serangkaian proses untuk menggali nilai tambah berupa informasi
yang selama ini tidak diketahui secara manual dari suatu basisdata dengan melakukan
penggalian pola-pola dari data dengan tujuan untuk memanipulasi data menjadi informasi
yang lebih berharga yang diperoleh dengan cara mengekstraksi dan mengenali pola yang
penting atau juga dapat dilakukan dengan menarik data yang terdapat dalam basisdata.
Data mining juga biasa dikenal dengan nama lain seperti Knowledge discovery (mining) in
database (KDD), ekstraksi pengetahuan, dan analisa data/pola dan kecerdasan bisnis.
Datamininng sangat perlu dilakukan terutama dalam mengelola data yang sangat besar untuk
memudahkan aktifitas recording suatu transaksi dan untuk proses data warehousing agar
dapat memberikan informasi yang akurat bagi penggunanya.
LANGKAH-LANGKAH UNTUK MELAKUKAN DATA MINING
Gambar 1 Langkah-langkah Penggunaan Data Mining
1. Data cleaning (untuk menghilangkan noise data yang tidak konsisten)
2. Data integration (di mana sumber data yang terpecah dapat disatukan)
3. Data selection (di mana data yang relevan dengan tugas analisa dikembalikan ke dalam database)
4. Data transformation (di mana data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau operasi agresi)
5. Data mining (proses esensial di mana metode yang intelejen digunakan untuk mengekstrak pola data)
6. Pattern evolution (untuk mengidentifikasi pola yang benar-benar menarik yang mewakili pengetahuan berdasarkan atas beberapa tindakan yang menarik)
7. Knowledge presentation (di mana gambaran teknik visualisasi dan pengetahuan digunakan untuk memberikan pengetahuan yang telah ditambang kpada user).
-
Secara umum seperti istilah yang telah biasa digunakan, data mining sendiri juga dapat
berarti eksplorasi dan analisa data dalam jumlah besar untuk menemukan pola dan aturan
yang bmemiliki arti. Untuk tujuan lebih spesifiknya sendiri , di dalam buku Data Mining
Technique for CRM mengasumsikan bahwa tujuan data mining adalah untuk memungkinkan
perusahaan untuk meningkatkan pemasaran , penjualan , dan operasi dukungan pelanggan
melalui pemahaman yang lebih baik dari pelanggan (value dari pelanggan).
2.2 IMPLEMENTASI KE CRM
Setelah pembahasan teori datamining diatas, seperti yang kita ketahui bahwa data mining
juga dipergunakan oleh perusahaan di berbagai industri untuk melakukan analisa baik secara
logika (logical analysis) maupun statistik (statistical analysis) data transaksi, dan menemukan
sebuah pola (pattern) yang dapat membantu proses pengambilan keputusan. Misalnya,
seorang analis di sebuah perusahaan telekomunikasi melakukan data mining dari sistem CRM
(Customer Relationship Management) untuk menemukan pola aktivitas pelayanan pelanggan
dan calon pelanggan agar dapat meningkatkan kualitas servis perusahaan tersebut. Dengan
data mining, tanpa harus menggunakan call center or mail service, hanya prospek yang
mempunyai probabilitas tinggi untuk merespons terhadap sebuah penawaran saja yang di
kontak ataupun dikirim brosur.
Sehingga dapat dikatakan bahwa tujuan utama dari penerapan data mining di bisnis adalah
penemuan dari suatu pengetahuan (knowledge discovery) dan model prediksi (prediction
model) dari data transaksi yang telah dicatat oleh berbagai aplikasi, di mana pengetahuan
ataupun prediksi tersebut dapat membantu manajemen senior dalam mengidentifikasi tren
bisnis (business trend) untuk pengambilan keputusan strategis.
Knowledge discovery menyajikan informasi eksplisit dalam format yang mudah dibaca dan
dimengerti oleh seorang analis sedangkan prediction model menyajikan prediksi terhadap apa
yang akan terjadi pada masa mendatang di mana model tersebut cukup bervariatif, ada yang
mudah dimengerti ataupun yang sangat kompleks.
BEBERAPA SOLUSI YANG BISA DISELESAIKAN DENGAN DATA
MINING DALAM CRM
1. Menembak target pasar Data mining dapat melakukan pengelompokan (clustering) dari model-model pembeli
dan melakukan klasifikasi terhadap setiap pembeli sesuai dengan karakteristik yang
diinginkan seperti kesukaan yang sama, tingkat penghasilan yang sama, kebiasaan
membeli dan karakteristik lainnya.
2. Melihat pola beli pemakai dari waktu ke waktu Data mining dapat digunakan untuk melihat pola beli seseorang dari waktu ke waktu.
3. Cross-Market Analysis Kita dapat memanfaatkan data mining untuk melihat hubungan antara penjualan satu
produk dengan produk lainnya.
4. Profil Customer Data mining dapat membantu untuk melihat profil customer/pembeli/ nasabah
sehingga kita dapat mengetahui kelompok customer tertentu membeli produk apa saja.
5. Identifikasi Kebutuhan Customer Mengidentifikasi produk-produk yang terbaik untuk tiap kelompok customer dan
menyusun faktor-faktor yang dapat menarik customer baru untuk bergabung/membeli.
-
6. Menilai Loyalitas Customer VISA International Spanyol menggunakan data mining untuk melihat kesuksesan
program-program customer loyalty mereka.
7. Informasi Summary Memanfaatkan data mining untuk membuat laporan summary yang bersifat multi-
dimensi dan dilengkapi dengan informasi statistik lainnya
2.3 PENERAPANNYA DI EXCEL
Data Mining Client untuk Excel adalah seperangkat alat yang memungkinkan Anda
melakukan tugas-tugas data mining umum, dari pembersihan data untuk model bangunan dan
prediksi permintaan.
Gambar 2. (Data Mining Add-ins for Excel)
KEGUNAAN TOOLS DATA MINING PADA EXCEL
Berikut ini adalah kegunaan yang bisa didapatkan dari tools data mining pada excel.
Data access, data cleansing, and data management Memuat data ke Excel, dan membersihkan data, memeriksa outlier, dan
membuat ringkasan statistik. Kita juga dapat melakukan berbagai jenis
sampling, profil data, dan model uji menggunakan data eksternal.
Modelling tools Tools ini menyediakan antarmuka wizard, diuji secara empiris dengan
algoritma data mining, termasuk pengelompokan (K-means dan EM), analisa
asosiasi, analisa time series, dan pohon keputusan. Pilihan pemodelan maju
untuk setiap Wizard memungkinkan Anda memilih algoritma yang berbeda,
seperti Nave Bayes atau jaringan saraf, dan menyesuaikan perilaku seperti
benih cluster atau ukuran awal sampling.
Testing, prediction, and validation Data Mining Client menyediakan alat-standar industri untuk model pengujian,
termasuk grafik angkat dan cross-validasi. Para penyihir yang disediakan
membuatnya mudah untuk menguji validitas dari kumpulan data dan
akurasinya. Permintaan Wizard membangun query untuk menggunakan model
untuk prediksi dan scoring.
Scalability and extensibility Mempertahankan koneksi aktif ke server, sehingga dapat menyimpan model
data mining Anda ke server, untuk digunakan dalam pengujian lebih lanjut,
atau untuk menyebarkan ke server produksi untuk skalabilitas yang lebih besar.
(Network)
-
BAB 3. IMPLEMENTASI DATA MINING DALAM MICROSOFT EXCEL
Seperti yang telah dibahas pada BAB 1. Batasan masalah yang kami gunakan yaitu classify,
estimate, dan clustering. Berikut ini adalah implementasi dari batasan masalah tersebut.
3.1 CLASSIFICATION
Langkah-langkahnya, yaitu:
1. Pilih data yang akan dianalisa dengan classify 2. Klik icok classify pada data mining ribbon
Gambar 3. Pilih icon classify
3. Kemudian akan muncul classify wizard, klik Next
Gambar 4. Classify Wizard
-
1. Pilih data yang akan dijadikan sumber data. Dapat pilih berdasarkan table ataupun range data pada table atau berasal dari sumber data luar. Kemudian klik Next
Gambar 5. Select source data - Classify Wizard
4. Pilih kolom yang akan dianalisa dan centang input column nya apa saja setelah itu klik Next
Gambar 6. Klasifikasi - Pilih kolom yang akan di analisa
5. Tentukan persentasi data yang akan di test, kemudian klik Next
Gambar 7. Percentage data for testing - Classify
-
6. Finishing, tuliskan nama struktur (atau menggunakan nama struktur default). Kemudian klik Finish
Gambar 8. Finishing - Classify
7. Berikut adalah hasil decision tree dari analisa data mining classify
Gambar 9. Decision tree Classify
-
8. Gambar berikut adalah Hasil Dependency Network pada analisa data mining Classify.
Gambar 10. Dependency network - Classify
3.2 ESTIMATION
Langkah-langkahnya, yaitu:
2. Pilih data yang akan dianalisa dengan estimate 3. Klik icok estimate pada data mining ribbon
Gambar 11. Pilih icon Estimate
-
4. Kemudian akan muncul estimate wizard, klik Next
Gambar 12. Estimate Wizard
5. Pilih data yang akan dijadikan sumber data. Dapat pilih berdasarkan table ataupun range data pada table atau berasal dari sumber data luar. Kemudian klik Next
Gambar 13. Select source data - Estimate
6. Pilih kolom yang akan dianalisa dan input column nya, kami menginputkan kolom, yaitu kolom income, children,education, occupation, home owner, age, region, dan
commute distance. Kemudian klik Next
Gambar 14. Column to analysis - Estimate
-
7. Tentukan persentasi data yang akan di test. Kemudian klik Next
Gambar 15. Percentage data Estimate
8. Memberi nama struktur (atau menggunakan nama struktur default). Kemudian klik Finish
Gambar 16. Finishing - Estimate
9. Berikut adalah hasil decision tree pada analisa data mining estimate
Gambar 17. Decision tree - Estimate
-
10. Berikut adalah hasil dependency network dari analisa data mining estimate
Gambar 18. Hasil Dependency network - Estimate
3.3 CLUSTERING
Langkah-langkahnya, yaitu:
Pilih data yang akan dianalisa dengan cluster
Klik icok Cluster pada data mining ribbon
Gambar 19. Pilih icon cluster
-
Kemudian akan muncul Cluster Wizard, Klik Next
Gambar 20. Cluster Wizard
Pilih data yang akan menjadi sumber data yang ingin di cluster. Dapat pilih berdasarkan table ataupun range data pada table atau berasal dari sumber data luar.
Kemudian klik Next.
Gambar 21. Select source data Cluster
Mengecek kolom table untuk melakukan grouping baris bersama-sama dengan menentukan number of segment dan input column berdasarkan yearly income,
education, occupation, dan age. Kemudian klik Next
Gambar 22. Clustering
-
Menentukan persentasi data untuk test. Kemudian klik Next
Gambar 23. Percentage data Cluster
Terakhir yaitu memberi nama struktur (atau menggunakan nama struktur default). Kemudian klik Finish.
Gambar 24. Finishing Cluster
Berikut adalah hasil cluster berdasarkan shading variable bachelor education.
Gambar 25. Cluster diagram Clustering
-
Hasil cluster profilnya adalah seperti pada gambar di bawah
Gambar 26. Cluster Profiles
Berikut adalah karakteristik cluster dari keseluruhan populasi
Gambar 27. Cluster Characteristics
-
Berikut adalah Cluster Discrimination dari cluster 2 (yang berpendidikan bachelor terbanyak) dengan lawan dari cluster 2.
Gambar 28. Cluster Discrimination
-
BAB 4. ANALISA DAN PEMBAHASAN
4.1 ANALISA
Berikut ini adalah analisa dari beberapa fungsi data mining pada excel, yaitu Classify,
Estimate, dan Clustering
4.1.1 CLASSIFY
Analisa Income Pilih kolom yang akan dianalisa dan centang input column nya apa saja setelah itu
klik Next. Kelompok kami mengganalisa income (pendapatan) berdasarkan education,
occupation, region, dan age.
Gambar 29. Analisa klasifikasi income
Hasil decision tree
Gambar 30. Analisa decision tree pada classify
-
Kita melakukan analisa income berdasarkan occupation, region, education, dan age. Decision
tree pada classify menunjukkan klasifikasi ada 4 level, yaitu level 1 (Dari keseluruhan) Dapat
dilihat paling banyak yaitu income antara 39050-71062 dengan probability 48.35% dan
terdiri dari 343 cases. Pada klasifikasi level 2, yaitu diklasifikasikan berdasarkan occupation.
Yang memiliki occupation Manual dan Clerical mendapatkan income terbanyak yaitu senilai
kurang dari 39050. Sedangkan pada occupation Skilled Manual, Professional, dan
Management memiliki nilai income terbanyak yaitu antara 39050-71062. Pada klasifikasi
level 3, yaitu diklasifikasikan berdasarkan region, education, dan age. Yang memiliki
occupation management dan age (umur) lebih dari sama dengan 53 memiliki income
terbanyak yaitu antara 39050-71062, sedangkan yang memiliki age (umur) kurang dari 53
memiliki income terbanyak yaitu antara 97111-127371. Pada occupation professional dan
berada di wilayah bukan eropa, memiliki income terbanyak yaitu antara 39050-71062,
sedangkan yang berada pada wilayah Eropa memiliki income terbanyak yaitu lebih dari sama
dengan 127371. Pada occupation Skilled Manual diklasifikasikan berdasarkan education yang
dimiliki, yang memiliki education High School memiliki income terbanyak yaitu kurang dari
39050, sedangkan yang memiliki education bukan high school memiliki income terbanyak
yaitu antara 39050-71062. Pada occupation Clerical diklasifikasikan berdasarkan umur, yang
memiliki umur lebih dari sama dengan 39 memiliki income terbanyak yaitu kurang dari
39050, sedangkan yang memiliki umur kurang dari 39 memiliki income terbanyak yaitu ada
dua, kurang dari 39050 dan antara 39050-71062. Pada klasifikasi level 4, yaitu yang memiliki
occupation management dan berumur lebih dari sama dengan 53 diklasifikasikan lagi
berdasarkan region. Yang memiliki region Eropa memiliki income terbanyak antara 71062-
97111. Pada occupation Professional di wilayah region bukan Eropa diklasifikasi lagi
berdasarkan age, yang memiliki umur kurang dari 53 memiliki income terbanyak yaitu antara
39050-71062. Sedangkan yang memiliki umur lebih dari sama dengan 53 memiliki income
semuanya antara 39050-71062.
Hasil dependency network
Gambar 31. Analisa dependency network pada classify
Dari keterangan warna pada gambar yang di beri lingkar merah, dapat dilihat pada
dependency network data mining classify menunjukkan bahwa income (pendapatan)
diprediksikan oleh age (umur), region (wilayah), occupation (profesi), dan education
(pendidikan)
-
4.1.2 ESTIMATE
Analisa Implementasi untuk fungsi estimate wizard yang kami gunakan yaitu kolom nama
income, children, education, occupation, dan home owner. Beri check list pada combo
box. Lalu klik next.
Gambar 32. Analisa Cars pada Estimate
Decision tree
Gambar 33. Analisa decision tree pada estimate
Jika pada fungsi classification decision tree di analisa berdasarkan inputan dari database
DMAddins_SampleData_EN.xlsx menggunakan 4 variabel yaitu occupation education, age,
region maka output dari klasifikasi menghasilkan 6 rentang income dengan klasifikasi <
39650, >= 127371, 39050 71602, 71602 97111, 97111 127371, dan missing dengan nilai tertentu.
Sedangkan dengan inputan database yang sama yaitu DMAddins_SampleData_EN.xlsx
dengan 5 variabel yaitu income, children, occupation, education, dan home owner
menghasilkan output yang berbeda. Output dari database yang sama dengan database pada
wizard klasifikasi (DMAddins_SampleData_EN.xlsx) tidak menghasilkan keluaran
klasifikasi dengan rentang nilai tertentu, melainkan menghasilkan keluaran berupa estimasi
value 0, 1, 2, 3, 4, dan missing.
-
Dependency Network
Gambar 34. Hasil Dependency network Estimate
Dari keterangan warna pada gambar yang di beri lingkar merah, dapat dilihat pada
dependency network data mining estimate menunjukkan bahwa mobil diprediksikan oleh
jumlah anak, umur, pendapatan, region, commute distance, education, dan occupation
4.1.3 CLUSTER
Analisa Kelompok kami melakukan pengclusteran berdasarkan yearly income, education, occupation, dan age.
Gambar 35. Analisa Clustering
-
Cluster Diagram
Gambar 36. Analisa cluster diagram
Pada cluster diagram diatas menunjukkan beberapa clustering berdasarkan yearly income,
education, occupation, dan age. Terdapat 11 cluster. Kelompok kami memilih shading
variable nya berdasarkan yang memiliki education bachelor, ternyata dari keterangan density
didapatkan bahwa Cluster 2 dan 9 yang memiliki tingkat education bachelor terbanyak.
1. Cluster Profile
Gambar 37. Analisa cluster profiles
Cluster profiles ini adalah profil dari clustering tersebut. Kelompok kami melihat profil dari
keseluruhan populasi berdasarkan education nya, dan dapat dilihat jumlah distribusinya pada
Mining Legend. Dengan jumlah distribusi terbanyak (penyebaran terbanyak) sebesar 0.269
yaitu yang memiliki Educatin Partial College di semua cluster.
-
Gambar 38. Mining Legend - Clustering
Cluster Characteristics
Gambar 39. Analisa Cluster Characteristics
Cluster characteristics adalah karakteristik pada cluster, agar dapat melihat secara
keseluruhan populasi, kelompok kami memilih Cluster Population(all) dan akan di dapat
karakteristik variable dan nilainya seperti pada gambar diatas.
-
Cluster Discrimination
Gambar 40. Analisa cluster discrimination
Pada cluster discrimination ini kita akan dapat melihat perbedaan variable dan value antara
dua cluster. Kelompok kami menggunakan perbedaan antara cluster 2 dan lawan dari cluster
2, pasti akan memiliki value yang sangat jauh berbeda dari cluster 2.
4.2 PEMBAHASAN
Berikut ini adalah pembahasan yang kami ulas dari hasil implementasi data mining untuk
CRM
4.2.1 TUGAS- TUGAS YANG BISA DISELESAIKAN MENGGUNAKKAN
DATA MINING
Kita dapat secara efektif menggunakan data mining untuk melakukan tugas-tugas berikut
pada tabel Excel:
1. Menganalisa bagaimana nilai-nilai dalam kolom data yang dipengaruhi oleh nilai-nilai dalam semua kolom lain
2. Mendeteksi kelompok baris dengan karakteristik yang sama 3. Secara otomatis mengisi kolom dengan nilai-nilai didasarkan pada beberapa contoh
yang kita berikan
4. Melakukan peramalan deret waktu 5. Mencari baris yang tidak seperti kebanyakan baris lainnya (menarik atau anomali) 6. Melakukan skenario (tujuan-seeking atau what-if) analisa 7. Melakukan analisa basket shopping dan mengidentifikasi peluang cross selling
(MacLennan, Tang, & Crivat, 2009)
-
4.2.2 PENYELESAIAN DATA MINING MENGGUNAKAN FUNGSI
MICROSOFT EXCEL
Banyak masalah intelektual, ekonomi, dan bisnis yang dapat diselesaikan menggunakan data
mining dalam enam fungsi data mining berikut:
1. Classification Klasifikasi, salah satu tugas data mining yang paling umum. Klasifikasi terdiri dari
pemeriksaan fitur dari objek yang baru disajikan dan disisipkan ke salah satu set
standar kelas.
2. Estimation Estimasi hampir mirip dengan classification, jika klasifikasi menghasilkan output
diskrit seperti ya atau tidak estimasi mengeluarkan output yang berkaitan dengan
nilai-nilai yang berkalanjutan. Output yang berbeda dari klasifikasi dan estimasi ini
berasal dari input yang sama.
3. Prediction Hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari
hasil akan ada dimasa datang (memperkirakan hal yang belum terjadi). Kita bisa
menunggu hingga hal itu terjadi untuk membuktikan seberapa tepat prediksi kita.
4. Affinity grouping Adalah salah satu pendekatan sederhana untuk menghasilkan aturan dari data. Dan
juga untuk menentukan hal-hal yang bisa di kelompokkan bersama-sama.
5. Clustering Mirip dengan klasifikasi, yang membedakan adalah pengelompokan yang tidak
bergantung pada kelas yang telah ditetapkan. Clustering adalah tugas segmentasi
populasi heterogen menjadi nomor sub kelompok lebih homogen atau kluster.
6. Description and profiling Mendeskripsikan database untuk meningkatkan kepahaman kita dalam mengerti
perilaku pelanggan, produk atau memproses data.
(Berry & Linoff, 2004)
-
4.2.3 PENERAPAN DATA MINING DI EXCEL MENGGUNAKAN FUNGSI
CLASSIFY, ESTIMATE , DAN CLUSTERING
Penjelasan lebih lengkap mengenai langkah-langkah menggunakkan ketiga fungsi ini telah
dijelaskan lebih lengkap pada BAB 3. Implementasi Data Mining pada Microsoft Excel,
untuk itu pada BAB 4 ini hanya mengulas mengenai bantuan apa yang dihasilkan dari wizard
classify, estimate, dan clustering pada microsoft excel.
Tabel 1. Penerapan Fungsi Classify, Estimate, dan Clustering pada Excel
No Fungsi Penerapan
1. Clasify
Klasifikasi wizard membantu kita membangun sebuah model klasifikasi berdasarkan data yang ada dalam tabel Excel,
berbagai Excel, atau sumber data eksternal. Sebuah model
klasifikasi ekstrak pola dalam data Anda yang menunjukkan
persamaan dan membantu Anda membuat prediksi
berdasarkan pengelompokan nilai-nilai. Sebagai contoh,
sebuah model klasifikasi dapat digunakan untuk memprediksi
berdasarkan pendapatan atau pola pengeluaran risiko.
Classification Wizard pada penggunaan Microsoft ini membantu algoritma data mining seperti: Decision Trees
algorithm, Logistic Regression, Nave Bayes, neural
Networks.
2. Estimate
Estimate wizard membantu kita dalam membuat model estimasi. Sebuah model estimasi ekstrak pola dari data dan
menggunakan pola untuk memprediksi hasil numerik, seperti
currency, sales amount, date, or time.
Estimate Wizard pada penggunaan Microsoft ini membantu algoritma data mining seperti: Decision Trees, Linear
Regression, Logistic Regression, and Neural Networks.
3. Clustering
Wizard Cluster membantu kita membangun sebuah model clustering. Sebuah model pengelompokan mendeteksi
kelompok baris yang berbagi karakteristik serupa. Wizard ini
berguna untuk menjelajahi pola dalam semua jenis data.
Wizard Cluster menggunakan algoritma Microsoft Clustering, yang meliputi K-means dan EM.
-
BAB 5. PENUTUP
BAB 5 ini berisi kesimpulan dan saran mengenai implementasi data mining untuk Customer
Relationship Management (CRM).
5.1 KESIMPULAN
Kesimpulan yang dapat diambil dari implementasi data mining untuk CRM ini yaitu:
1. Terbukti bahwa dengan menggunakan data mining perusahaan bisa meningkatkan marketing, sales dan customer support operation melalui pemahaman yang lebih baik
terhadap pelanggan. Karena data mining adalah eksplorasi dan analisa dari data
dengan jumlah yang besar untuk menemukan pola dan aturan-aturan yang berguna.
Pola-pola inilah yang digunakan sebagai analisa pemasaran, penjualan dan
pengelolaan hubungan pelanggan.
2. Terbukti bahwa sebagian besar proses berkaitan dengan building models. Sebuah model hanyalah sebuah algoritma atau seperangkat aturan yang menghubungkan
kumpulan input (seringnya berbentuk database perusahaan) ke target atau hasil
tertentu. Regresi, neural networks, decision trees, dan sebagian besar teknik data
mining lain yang dibahas dalam buku ini adalah teknik untuk menciptakan model.
Input dan target dalam teknik data mining inilah yang berkaitan dengan building
models.
3. Membuktikan bahwa pekerjaan seperti Classification, Estimation, Prediction, Affinity grouping, Clustering, Description dan profiling bisa diselesaikan menggunakan data
mining. Untuk Classification, Estimation, Prediction merupakan contoh data mining,
di mana tujuannya adalah untuk menemukan nilai dari variabel target tertentu. Affinity
grouping dan clustering tujuannya adalah untuk mengungkap struktur data tanpa
mengacu terhadap variabel target tertentu. Profiling adalah tugas deskriptif yang
mungkin akan diarahkan atau tidak diarahkan.
4. Dapat mengetahui keuntungan yang didapatkan dari proses data mining. Data mining menggunakan prinsip-prinsip statistik untuk menemukan pola dalam data Anda,
membantu Anda membuat keputusan cerdas tentang masalah yang kompleks. Dengan
menerapkan algoritma data mining di Analysis Services, Anda dapat meramalkan tren,
mengidentifikasi pola, membuat aturan dan rekomendasi, menganalisa urutan
peristiwa dalam set data yang kompleks, dan mendapatkan wawasan baru.
5.2 SARAN
Berdasarkan eksplorasi dari tugas implementasi data mining untuk CRM saran yang kami
rekomendasikan yaitu:
1. Sebaiknya menggunakan sql server yang standard / enterprise edition 2. Untuk office 2007 sebaiknya menggunakan sql server 2008 3. Untuk office 2008 dan 2010 sebaiknya menggunakan sql server 2012
-
DAFTAR PUSTAKA
Berry, M. J., & Linoff, G. S. (2004). Data Mining Techniques Second Edition. Indiana: Wiley
Publishing Inc.
MacLennan, J., Tang, Z. H., & Crivat, B. (2009). Data Mining with Microsoft SQL Server
2008 . Indiana: Wiley Publishing, Inc.
Network, M. D. (n.d.). Data Mining Client for Excel (SQL Server Data Mining Add-ins).
Retrieved December 22, 2013, from Microsoft Developer Services:
http://msdn.microsoft.com/en-us/library/dn282385(v=sql.120).aspx
Tarigan, Avinanta. Data Mining Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. 2008.
Fadli, Arif. Konsep Data Miniing. 2003