PHP_C_5212100121_5212100132_5212100148

31
Tugas 4 Kelas: C Mata Kuliah: Pengelolaan Hubungan Pelanggan (CRM) Semester Ganjil 2012/2013 Dikumpulkan Senin Tanggal 23 Desember 2013, Jam 09.30 (Softcopy) Senin Tanggal 30 Desember 2013, Jam 09.30 (Hardcopy) Nama NRP AFIFA FILIANI SEHATO 5212100121 WIDYA MUKTI PINANDHITANINGRUM 5212100132 KHAIRUNNISA ROFIFAH 5212100148 JURUSAN SISTEM INFORMASI FAKULTAS TEKNOLOGI INFORMASI INSTITUT TEKNOLOGI SEPULUH NOPEMBER 2013 IMPLEMENTASI FUNGSI DATA MINING CLASSIFY, ESTIMATE, CLUSTERING PADA EXCEL Komentar:

description

tugas php

Transcript of PHP_C_5212100121_5212100132_5212100148

  • Tugas 4 Kelas: C

    Mata Kuliah:

    Pengelolaan Hubungan Pelanggan (CRM)

    Semester Ganjil 2012/2013

    Management

    Dikumpulkan Senin Tanggal 23 Desember 2013, Jam 09.30 (Softcopy)

    Senin Tanggal 30 Desember 2013, Jam 09.30 (Hardcopy)

    Nama NRP

    AFIFA FILIANI SEHATO 5212100121

    WIDYA MUKTI

    PINANDHITANINGRUM

    5212100132

    KHAIRUNNISA ROFIFAH 5212100148

    JURUSAN SISTEM INFORMASI

    FAKULTAS TEKNOLOGI INFORMASI

    INSTITUT TEKNOLOGI SEPULUH NOPEMBER

    2013

    IMPLEMENTASI FUNGSI DATA MINING CLASSIFY, ESTIMATE, CLUSTERING PADA EXCEL

    Komentar:

  • DAFTAR ISI

    DAFTAR ISI.................................................................................................................................................... 2

    DAFTAR TABEL ............................................................................................................................................ 3

    DAFTAR GAMBAR........................................................................................................................................ 3

    BAB 1. PENDAHULUAN ............................................................................................................................... 5

    1.1 Latar Belakang Permasalahan .......................................................................................................... 5

    1.2 Tujuan ............................................................................................................................................. 6

    1.3 Batasan Masalah .............................................................................................................................. 6

    BAB 2. KAJIAN TEORI .................................................................................................................................. 7

    2.1 Data Mining .................................................................................................................................... 7

    Langkah-langkah untuk melakukan data mining ........................................................................................ 7

    2.2 Implementasi ke CRM ..................................................................................................................... 8

    Beberapa solusi yang bisa diselesaikan dengan data mining dalam CRM ................................................... 8

    2.3 Penerapannya di Excel ..................................................................................................................... 9

    kegunaan tools data mining pada excel ...................................................................................................... 9

    BAB 3. IMPLEMENTASI DATA MINING DALAM MICROSOFT EXCEL ................................................ 10

    3.1 Classification ................................................................................................................................. 10

    3.2 Estimation ..................................................................................................................................... 13

    3.3 Clustering ...................................................................................................................................... 16

    BAB 4. ANALISA DAN PEMBAHASAN ..................................................................................................... 21

    4.1 Analisa .......................................................................................................................................... 21

    4.1.1 Classify ..................................................................................................................................... 21

    4.1.2 Estimate .................................................................................................................................... 23

    4.1.3 Cluster....................................................................................................................................... 24

    4.2 Pembahasan .......................................................................................................................................... 27

    4.2.1 Tugas- Tugas yang Bisa Diselesaikan Menggunakkan Data Mining ............................................ 27

    4.2.2 Penyelesaian Data Mining Menggunakan Fungsi Microsoft Excel .............................................. 28

    4.2.3 Penerapan Data Mining di Excel Menggunakan Fungsi classify, estimate, dan clustering ............ 29

  • BAB 5. PENUTUP ......................................................................................................................................... 30

    5.1 Kesimpulan ................................................................................................................................... 30

    5.2 Saran ............................................................................................................................................. 30

    DAFTAR PUSTAKA ..................................................................................................................................... 31

    DAFTAR TABEL

    Tabel 1. Penerapan Fungsi Classify, Estimate, dan Clustering pada Excel ........................................................ 29

    DAFTAR GAMBAR

    Gambar 1 Langkah-langkah Penggunaan Data Mining ...................................................................................... 7

    Gambar 2. (Data Mining Add-ins for Excel) ..................................................................................................... 9

    Gambar 3. Pilih icon classify .......................................................................................................................... 10

    Gambar 4. Classify Wizard ............................................................................................................................. 10

    Gambar 5. Select source data - Classify Wizard .............................................................................................. 11

    Gambar 6. Klasifikasi - Pilih kolom yang akan di analisa ................................................................................ 11

    Gambar 7. Percentage data for testing - Classify ............................................................................................. 11

    Gambar 8. Finishing - Classify ....................................................................................................................... 12

    Gambar 9. Decision tree Classify ................................................................................................................. 12

    Gambar 10. Dependency network - Classify .................................................................................................... 13

    Gambar 11. Pilih icon Estimate ....................................................................................................................... 13

    Gambar 12. Estimate Wizard .......................................................................................................................... 14

    Gambar 13. Select source data - Estimate ........................................................................................................ 14

    Gambar 14. Column to analysis - Estimate ...................................................................................................... 14

    Gambar 15. Percentage data Estimate........................................................................................................... 15

    Gambar 16. Finishing - Estimate ..................................................................................................................... 15

    Gambar 17. Decision tree - Estimate ............................................................................................................... 15

    Gambar 18. Hasil Dependency network - Estimate .......................................................................................... 16

    Gambar 19. Pilih icon cluster .......................................................................................................................... 16

    Gambar 20. Cluster Wizard ............................................................................................................................ 17

  • Gambar 21. Select source data Cluster ......................................................................................................... 17

    Gambar 22. Clustering .................................................................................................................................... 17

    Gambar 23. Percentage data Cluster ............................................................................................................. 18

    Gambar 24. Finishing Cluster ...................................................................................................................... 18

    Gambar 25. Cluster diagram Clustering........................................................................................................ 18

    Gambar 26. Cluster Profiles ............................................................................................................................ 19

    Gambar 27. Cluster Characteristics ................................................................................................................. 19

    Gambar 28. Cluster Discrimination ................................................................................................................. 20

    Gambar 29. Analisa klasifikasi income ........................................................................................................... 21

    Gambar 30. Analisa decision tree pada classify ............................................................................................... 21

    Gambar 31. Analisa dependency network pada classify ................................................................................... 22

    Gambar 32. Analisa Cars pada Estimate .......................................................................................................... 23

    Gambar 33. Analisa decision tree pada estimate .............................................................................................. 23

    Gambar 34. Hasil Dependency network Estimate ......................................................................................... 24

    Gambar 35. Analisa Clustering ....................................................................................................................... 24

    Gambar 36. Analisa cluster diagram ............................................................................................................... 25

    Gambar 37. Analisa cluster profiles ................................................................................................................ 25

    Gambar 38. Mining Legend - Clustering ......................................................................................................... 26

    Gambar 39. Analisa Cluster Characteristics..................................................................................................... 26

    Gambar 40. Analisa cluster discrimination ...................................................................................................... 27

  • BAB 1. PENDAHULUAN

    Pada BAB ini akan dijelaskan mengenai latar belakang, tujuan, dan batasan masalah yang

    diimplementasikan pada data mining untuk CRM.

    1.1 LATAR BELAKANG PERMASALAHAN

    Pada beberapa tahun belakangan ini telah terjadi perkembangan yang sangat pesat terhadap

    teknologi pengoleksian dan penyimpanan data. Perkembangan teknologi tersebut

    memungkinkan pengumpulan dan penyimpanan data dengan lebih cepat, kapasitas yang lebih

    besar, dan harga yang lebih murah. Pada akhirnya perkembangan teknologi tersebut

    menimbulkan penumpukan koleksi data, misalnya: data transaksi penjualan pada sebuah

    swalayan, data pasien pada rumah sakit, data rekening pada bank, dan sebagainya. Ukuran

    basis data meningkat baik dalam jumlah record (baris data) maupun jumlah atribut pada

    record. Hal ini didukung oleh perkembangan perangkat keras dan teknologi basis data yang

    memungkinkan penyimpanan dan pengaksesan data secara efisien dan murah. Tetapi

    kecepatan bertambah banyaknya data tersebut tidak diimbangi dengan banyaknya penarikan

    informasi dari data tersebut. Jadi bisa dikatakan kita kaya akan data, tetapi miskin akan

    informasi.

    Dari sisi yang sama pula, kumpulan data jika dibiarkan begitu saja tidak akan dapat

    memberikan nilai tambah berupa pengetahuan yang bermanfaat. Pengetahuan yang

    bermanfaat ini misalnya, dari basis data penjualan pada perusahaan produk konsumen, dapat

    diperoleh pengetahuan tentang hubungan antara penjualan barang tertentu dan golongan

    konsumen dengan demografi tertentu. Pengetahuan ini dapat digunakan untuk melakukan

    promosi penjualan baru yang keuntungannya dapat diprediksi relatif terhadap promosi

    pemasaran lainnya. Basis data seringkali merupakan sumber daya potensial tidak aktif yang

    sebenarnya dapat menghasilkan manfaat yang besar.

    Secara konvensional, untuk memperoleh pengetahuan dari data dilakukan analisa dan

    interpretasi secara manual. Namun analisa data manual sifatnya lambat, mahal, dan sangat

    subjektif. Dengan fakta bahwa volume data sangat besar (hingga jutaan record dan ratusan

    atribut pada tiap record dalam basis data), penggunaan analisa data manual menjadi sangat

    tidak praktis, sehingga perlu beralih menggunakan teknik komputasi untuk menekan biaya

    dan waktu yang terbuang. Proses pencarian pengetahuan bermanfaat dari data menggunakan

    teknik komputasi ini dikenal dengan istilah Datamining atau Knowledge Discovery in

    Databases (KDD). Dengan adanya sistem datamining ini sebuah perusahaan maupun

    institusi nantinya mampu meningkatkan kompetisi strategis yang tepat dengan

    menggabungan antara proses bisnis dan teknologi untuk mengembangkan pengetahuan yang

    lebih mendalam mengenai perilaku pelanggan. Pengetahuan yang didapat digunakan untuk

    meningkatkan (enhance) layanan kepada pelanggan, mendapatkan (acquire) pelanggan yang

    baru, dan juga mempertahankan (retain) pelanggan, yang sangat erat kaitannya dengan

    loyalitas pelanggan itu sendiri.

  • 1.2 TUJUAN

    Tujuan dari pengimplementasian data mining untuk CRM adalah:

    1. Membuktikan bahwa perusahaan bisa meningkatkan marketing, sales dan customer support operation melalui pemahaman yang lebih baik terhadap pelanggan.

    2. Membuktikan bahwa sebagian besar proses berkaitan dengan building models. 3. Membuktikan bahwa pekerjaan seperti Classification, Estimation, Prediction, Affinity

    grouping, Clustering, Description and profiling bisa diselesaikan menggunakan data

    mining.

    4. Mempraktekkan keuntungan yang didapatkan dari proses data mining

    1.3 BATASAN MASALAH

    Batasan masalah yang kami gunakan hanya tiga yaitu:

    1. Tugas apa saja yang bisa diselesaikan menggunakkan data mining? 2. Bagaimana penyelesaian data mining menggunakan fungsi yang disediakan pada

    microsoft excel ?

    3. Bagaimana penerapan data mining di excel menggunakan fungsi classify, estimate, dan clustering?

  • BAB 2. KAJIAN TEORI

    BAB 2 ini menjelaskan tentang teori-teori mengenai data mining, implementasi ke CRM, dan

    penerapannya di excel.

    2.1 DATA MINING

    Data mining merupakan serangkaian proses untuk menggali nilai tambah berupa informasi

    yang selama ini tidak diketahui secara manual dari suatu basisdata dengan melakukan

    penggalian pola-pola dari data dengan tujuan untuk memanipulasi data menjadi informasi

    yang lebih berharga yang diperoleh dengan cara mengekstraksi dan mengenali pola yang

    penting atau juga dapat dilakukan dengan menarik data yang terdapat dalam basisdata.

    Data mining juga biasa dikenal dengan nama lain seperti Knowledge discovery (mining) in

    database (KDD), ekstraksi pengetahuan, dan analisa data/pola dan kecerdasan bisnis.

    Datamininng sangat perlu dilakukan terutama dalam mengelola data yang sangat besar untuk

    memudahkan aktifitas recording suatu transaksi dan untuk proses data warehousing agar

    dapat memberikan informasi yang akurat bagi penggunanya.

    LANGKAH-LANGKAH UNTUK MELAKUKAN DATA MINING

    Gambar 1 Langkah-langkah Penggunaan Data Mining

    1. Data cleaning (untuk menghilangkan noise data yang tidak konsisten)

    2. Data integration (di mana sumber data yang terpecah dapat disatukan)

    3. Data selection (di mana data yang relevan dengan tugas analisa dikembalikan ke dalam database)

    4. Data transformation (di mana data berubah atau bersatu menjadi bentuk yang tepat untuk menambang dengan ringkasan performa atau operasi agresi)

    5. Data mining (proses esensial di mana metode yang intelejen digunakan untuk mengekstrak pola data)

    6. Pattern evolution (untuk mengidentifikasi pola yang benar-benar menarik yang mewakili pengetahuan berdasarkan atas beberapa tindakan yang menarik)

    7. Knowledge presentation (di mana gambaran teknik visualisasi dan pengetahuan digunakan untuk memberikan pengetahuan yang telah ditambang kpada user).

  • Secara umum seperti istilah yang telah biasa digunakan, data mining sendiri juga dapat

    berarti eksplorasi dan analisa data dalam jumlah besar untuk menemukan pola dan aturan

    yang bmemiliki arti. Untuk tujuan lebih spesifiknya sendiri , di dalam buku Data Mining

    Technique for CRM mengasumsikan bahwa tujuan data mining adalah untuk memungkinkan

    perusahaan untuk meningkatkan pemasaran , penjualan , dan operasi dukungan pelanggan

    melalui pemahaman yang lebih baik dari pelanggan (value dari pelanggan).

    2.2 IMPLEMENTASI KE CRM

    Setelah pembahasan teori datamining diatas, seperti yang kita ketahui bahwa data mining

    juga dipergunakan oleh perusahaan di berbagai industri untuk melakukan analisa baik secara

    logika (logical analysis) maupun statistik (statistical analysis) data transaksi, dan menemukan

    sebuah pola (pattern) yang dapat membantu proses pengambilan keputusan. Misalnya,

    seorang analis di sebuah perusahaan telekomunikasi melakukan data mining dari sistem CRM

    (Customer Relationship Management) untuk menemukan pola aktivitas pelayanan pelanggan

    dan calon pelanggan agar dapat meningkatkan kualitas servis perusahaan tersebut. Dengan

    data mining, tanpa harus menggunakan call center or mail service, hanya prospek yang

    mempunyai probabilitas tinggi untuk merespons terhadap sebuah penawaran saja yang di

    kontak ataupun dikirim brosur.

    Sehingga dapat dikatakan bahwa tujuan utama dari penerapan data mining di bisnis adalah

    penemuan dari suatu pengetahuan (knowledge discovery) dan model prediksi (prediction

    model) dari data transaksi yang telah dicatat oleh berbagai aplikasi, di mana pengetahuan

    ataupun prediksi tersebut dapat membantu manajemen senior dalam mengidentifikasi tren

    bisnis (business trend) untuk pengambilan keputusan strategis.

    Knowledge discovery menyajikan informasi eksplisit dalam format yang mudah dibaca dan

    dimengerti oleh seorang analis sedangkan prediction model menyajikan prediksi terhadap apa

    yang akan terjadi pada masa mendatang di mana model tersebut cukup bervariatif, ada yang

    mudah dimengerti ataupun yang sangat kompleks.

    BEBERAPA SOLUSI YANG BISA DISELESAIKAN DENGAN DATA

    MINING DALAM CRM

    1. Menembak target pasar Data mining dapat melakukan pengelompokan (clustering) dari model-model pembeli

    dan melakukan klasifikasi terhadap setiap pembeli sesuai dengan karakteristik yang

    diinginkan seperti kesukaan yang sama, tingkat penghasilan yang sama, kebiasaan

    membeli dan karakteristik lainnya.

    2. Melihat pola beli pemakai dari waktu ke waktu Data mining dapat digunakan untuk melihat pola beli seseorang dari waktu ke waktu.

    3. Cross-Market Analysis Kita dapat memanfaatkan data mining untuk melihat hubungan antara penjualan satu

    produk dengan produk lainnya.

    4. Profil Customer Data mining dapat membantu untuk melihat profil customer/pembeli/ nasabah

    sehingga kita dapat mengetahui kelompok customer tertentu membeli produk apa saja.

    5. Identifikasi Kebutuhan Customer Mengidentifikasi produk-produk yang terbaik untuk tiap kelompok customer dan

    menyusun faktor-faktor yang dapat menarik customer baru untuk bergabung/membeli.

  • 6. Menilai Loyalitas Customer VISA International Spanyol menggunakan data mining untuk melihat kesuksesan

    program-program customer loyalty mereka.

    7. Informasi Summary Memanfaatkan data mining untuk membuat laporan summary yang bersifat multi-

    dimensi dan dilengkapi dengan informasi statistik lainnya

    2.3 PENERAPANNYA DI EXCEL

    Data Mining Client untuk Excel adalah seperangkat alat yang memungkinkan Anda

    melakukan tugas-tugas data mining umum, dari pembersihan data untuk model bangunan dan

    prediksi permintaan.

    Gambar 2. (Data Mining Add-ins for Excel)

    KEGUNAAN TOOLS DATA MINING PADA EXCEL

    Berikut ini adalah kegunaan yang bisa didapatkan dari tools data mining pada excel.

    Data access, data cleansing, and data management Memuat data ke Excel, dan membersihkan data, memeriksa outlier, dan

    membuat ringkasan statistik. Kita juga dapat melakukan berbagai jenis

    sampling, profil data, dan model uji menggunakan data eksternal.

    Modelling tools Tools ini menyediakan antarmuka wizard, diuji secara empiris dengan

    algoritma data mining, termasuk pengelompokan (K-means dan EM), analisa

    asosiasi, analisa time series, dan pohon keputusan. Pilihan pemodelan maju

    untuk setiap Wizard memungkinkan Anda memilih algoritma yang berbeda,

    seperti Nave Bayes atau jaringan saraf, dan menyesuaikan perilaku seperti

    benih cluster atau ukuran awal sampling.

    Testing, prediction, and validation Data Mining Client menyediakan alat-standar industri untuk model pengujian,

    termasuk grafik angkat dan cross-validasi. Para penyihir yang disediakan

    membuatnya mudah untuk menguji validitas dari kumpulan data dan

    akurasinya. Permintaan Wizard membangun query untuk menggunakan model

    untuk prediksi dan scoring.

    Scalability and extensibility Mempertahankan koneksi aktif ke server, sehingga dapat menyimpan model

    data mining Anda ke server, untuk digunakan dalam pengujian lebih lanjut,

    atau untuk menyebarkan ke server produksi untuk skalabilitas yang lebih besar.

    (Network)

  • BAB 3. IMPLEMENTASI DATA MINING DALAM MICROSOFT EXCEL

    Seperti yang telah dibahas pada BAB 1. Batasan masalah yang kami gunakan yaitu classify,

    estimate, dan clustering. Berikut ini adalah implementasi dari batasan masalah tersebut.

    3.1 CLASSIFICATION

    Langkah-langkahnya, yaitu:

    1. Pilih data yang akan dianalisa dengan classify 2. Klik icok classify pada data mining ribbon

    Gambar 3. Pilih icon classify

    3. Kemudian akan muncul classify wizard, klik Next

    Gambar 4. Classify Wizard

  • 1. Pilih data yang akan dijadikan sumber data. Dapat pilih berdasarkan table ataupun range data pada table atau berasal dari sumber data luar. Kemudian klik Next

    Gambar 5. Select source data - Classify Wizard

    4. Pilih kolom yang akan dianalisa dan centang input column nya apa saja setelah itu klik Next

    Gambar 6. Klasifikasi - Pilih kolom yang akan di analisa

    5. Tentukan persentasi data yang akan di test, kemudian klik Next

    Gambar 7. Percentage data for testing - Classify

  • 6. Finishing, tuliskan nama struktur (atau menggunakan nama struktur default). Kemudian klik Finish

    Gambar 8. Finishing - Classify

    7. Berikut adalah hasil decision tree dari analisa data mining classify

    Gambar 9. Decision tree Classify

  • 8. Gambar berikut adalah Hasil Dependency Network pada analisa data mining Classify.

    Gambar 10. Dependency network - Classify

    3.2 ESTIMATION

    Langkah-langkahnya, yaitu:

    2. Pilih data yang akan dianalisa dengan estimate 3. Klik icok estimate pada data mining ribbon

    Gambar 11. Pilih icon Estimate

  • 4. Kemudian akan muncul estimate wizard, klik Next

    Gambar 12. Estimate Wizard

    5. Pilih data yang akan dijadikan sumber data. Dapat pilih berdasarkan table ataupun range data pada table atau berasal dari sumber data luar. Kemudian klik Next

    Gambar 13. Select source data - Estimate

    6. Pilih kolom yang akan dianalisa dan input column nya, kami menginputkan kolom, yaitu kolom income, children,education, occupation, home owner, age, region, dan

    commute distance. Kemudian klik Next

    Gambar 14. Column to analysis - Estimate

  • 7. Tentukan persentasi data yang akan di test. Kemudian klik Next

    Gambar 15. Percentage data Estimate

    8. Memberi nama struktur (atau menggunakan nama struktur default). Kemudian klik Finish

    Gambar 16. Finishing - Estimate

    9. Berikut adalah hasil decision tree pada analisa data mining estimate

    Gambar 17. Decision tree - Estimate

  • 10. Berikut adalah hasil dependency network dari analisa data mining estimate

    Gambar 18. Hasil Dependency network - Estimate

    3.3 CLUSTERING

    Langkah-langkahnya, yaitu:

    Pilih data yang akan dianalisa dengan cluster

    Klik icok Cluster pada data mining ribbon

    Gambar 19. Pilih icon cluster

  • Kemudian akan muncul Cluster Wizard, Klik Next

    Gambar 20. Cluster Wizard

    Pilih data yang akan menjadi sumber data yang ingin di cluster. Dapat pilih berdasarkan table ataupun range data pada table atau berasal dari sumber data luar.

    Kemudian klik Next.

    Gambar 21. Select source data Cluster

    Mengecek kolom table untuk melakukan grouping baris bersama-sama dengan menentukan number of segment dan input column berdasarkan yearly income,

    education, occupation, dan age. Kemudian klik Next

    Gambar 22. Clustering

  • Menentukan persentasi data untuk test. Kemudian klik Next

    Gambar 23. Percentage data Cluster

    Terakhir yaitu memberi nama struktur (atau menggunakan nama struktur default). Kemudian klik Finish.

    Gambar 24. Finishing Cluster

    Berikut adalah hasil cluster berdasarkan shading variable bachelor education.

    Gambar 25. Cluster diagram Clustering

  • Hasil cluster profilnya adalah seperti pada gambar di bawah

    Gambar 26. Cluster Profiles

    Berikut adalah karakteristik cluster dari keseluruhan populasi

    Gambar 27. Cluster Characteristics

  • Berikut adalah Cluster Discrimination dari cluster 2 (yang berpendidikan bachelor terbanyak) dengan lawan dari cluster 2.

    Gambar 28. Cluster Discrimination

  • BAB 4. ANALISA DAN PEMBAHASAN

    4.1 ANALISA

    Berikut ini adalah analisa dari beberapa fungsi data mining pada excel, yaitu Classify,

    Estimate, dan Clustering

    4.1.1 CLASSIFY

    Analisa Income Pilih kolom yang akan dianalisa dan centang input column nya apa saja setelah itu

    klik Next. Kelompok kami mengganalisa income (pendapatan) berdasarkan education,

    occupation, region, dan age.

    Gambar 29. Analisa klasifikasi income

    Hasil decision tree

    Gambar 30. Analisa decision tree pada classify

  • Kita melakukan analisa income berdasarkan occupation, region, education, dan age. Decision

    tree pada classify menunjukkan klasifikasi ada 4 level, yaitu level 1 (Dari keseluruhan) Dapat

    dilihat paling banyak yaitu income antara 39050-71062 dengan probability 48.35% dan

    terdiri dari 343 cases. Pada klasifikasi level 2, yaitu diklasifikasikan berdasarkan occupation.

    Yang memiliki occupation Manual dan Clerical mendapatkan income terbanyak yaitu senilai

    kurang dari 39050. Sedangkan pada occupation Skilled Manual, Professional, dan

    Management memiliki nilai income terbanyak yaitu antara 39050-71062. Pada klasifikasi

    level 3, yaitu diklasifikasikan berdasarkan region, education, dan age. Yang memiliki

    occupation management dan age (umur) lebih dari sama dengan 53 memiliki income

    terbanyak yaitu antara 39050-71062, sedangkan yang memiliki age (umur) kurang dari 53

    memiliki income terbanyak yaitu antara 97111-127371. Pada occupation professional dan

    berada di wilayah bukan eropa, memiliki income terbanyak yaitu antara 39050-71062,

    sedangkan yang berada pada wilayah Eropa memiliki income terbanyak yaitu lebih dari sama

    dengan 127371. Pada occupation Skilled Manual diklasifikasikan berdasarkan education yang

    dimiliki, yang memiliki education High School memiliki income terbanyak yaitu kurang dari

    39050, sedangkan yang memiliki education bukan high school memiliki income terbanyak

    yaitu antara 39050-71062. Pada occupation Clerical diklasifikasikan berdasarkan umur, yang

    memiliki umur lebih dari sama dengan 39 memiliki income terbanyak yaitu kurang dari

    39050, sedangkan yang memiliki umur kurang dari 39 memiliki income terbanyak yaitu ada

    dua, kurang dari 39050 dan antara 39050-71062. Pada klasifikasi level 4, yaitu yang memiliki

    occupation management dan berumur lebih dari sama dengan 53 diklasifikasikan lagi

    berdasarkan region. Yang memiliki region Eropa memiliki income terbanyak antara 71062-

    97111. Pada occupation Professional di wilayah region bukan Eropa diklasifikasi lagi

    berdasarkan age, yang memiliki umur kurang dari 53 memiliki income terbanyak yaitu antara

    39050-71062. Sedangkan yang memiliki umur lebih dari sama dengan 53 memiliki income

    semuanya antara 39050-71062.

    Hasil dependency network

    Gambar 31. Analisa dependency network pada classify

    Dari keterangan warna pada gambar yang di beri lingkar merah, dapat dilihat pada

    dependency network data mining classify menunjukkan bahwa income (pendapatan)

    diprediksikan oleh age (umur), region (wilayah), occupation (profesi), dan education

    (pendidikan)

  • 4.1.2 ESTIMATE

    Analisa Implementasi untuk fungsi estimate wizard yang kami gunakan yaitu kolom nama

    income, children, education, occupation, dan home owner. Beri check list pada combo

    box. Lalu klik next.

    Gambar 32. Analisa Cars pada Estimate

    Decision tree

    Gambar 33. Analisa decision tree pada estimate

    Jika pada fungsi classification decision tree di analisa berdasarkan inputan dari database

    DMAddins_SampleData_EN.xlsx menggunakan 4 variabel yaitu occupation education, age,

    region maka output dari klasifikasi menghasilkan 6 rentang income dengan klasifikasi <

    39650, >= 127371, 39050 71602, 71602 97111, 97111 127371, dan missing dengan nilai tertentu.

    Sedangkan dengan inputan database yang sama yaitu DMAddins_SampleData_EN.xlsx

    dengan 5 variabel yaitu income, children, occupation, education, dan home owner

    menghasilkan output yang berbeda. Output dari database yang sama dengan database pada

    wizard klasifikasi (DMAddins_SampleData_EN.xlsx) tidak menghasilkan keluaran

    klasifikasi dengan rentang nilai tertentu, melainkan menghasilkan keluaran berupa estimasi

    value 0, 1, 2, 3, 4, dan missing.

  • Dependency Network

    Gambar 34. Hasil Dependency network Estimate

    Dari keterangan warna pada gambar yang di beri lingkar merah, dapat dilihat pada

    dependency network data mining estimate menunjukkan bahwa mobil diprediksikan oleh

    jumlah anak, umur, pendapatan, region, commute distance, education, dan occupation

    4.1.3 CLUSTER

    Analisa Kelompok kami melakukan pengclusteran berdasarkan yearly income, education, occupation, dan age.

    Gambar 35. Analisa Clustering

  • Cluster Diagram

    Gambar 36. Analisa cluster diagram

    Pada cluster diagram diatas menunjukkan beberapa clustering berdasarkan yearly income,

    education, occupation, dan age. Terdapat 11 cluster. Kelompok kami memilih shading

    variable nya berdasarkan yang memiliki education bachelor, ternyata dari keterangan density

    didapatkan bahwa Cluster 2 dan 9 yang memiliki tingkat education bachelor terbanyak.

    1. Cluster Profile

    Gambar 37. Analisa cluster profiles

    Cluster profiles ini adalah profil dari clustering tersebut. Kelompok kami melihat profil dari

    keseluruhan populasi berdasarkan education nya, dan dapat dilihat jumlah distribusinya pada

    Mining Legend. Dengan jumlah distribusi terbanyak (penyebaran terbanyak) sebesar 0.269

    yaitu yang memiliki Educatin Partial College di semua cluster.

  • Gambar 38. Mining Legend - Clustering

    Cluster Characteristics

    Gambar 39. Analisa Cluster Characteristics

    Cluster characteristics adalah karakteristik pada cluster, agar dapat melihat secara

    keseluruhan populasi, kelompok kami memilih Cluster Population(all) dan akan di dapat

    karakteristik variable dan nilainya seperti pada gambar diatas.

  • Cluster Discrimination

    Gambar 40. Analisa cluster discrimination

    Pada cluster discrimination ini kita akan dapat melihat perbedaan variable dan value antara

    dua cluster. Kelompok kami menggunakan perbedaan antara cluster 2 dan lawan dari cluster

    2, pasti akan memiliki value yang sangat jauh berbeda dari cluster 2.

    4.2 PEMBAHASAN

    Berikut ini adalah pembahasan yang kami ulas dari hasil implementasi data mining untuk

    CRM

    4.2.1 TUGAS- TUGAS YANG BISA DISELESAIKAN MENGGUNAKKAN

    DATA MINING

    Kita dapat secara efektif menggunakan data mining untuk melakukan tugas-tugas berikut

    pada tabel Excel:

    1. Menganalisa bagaimana nilai-nilai dalam kolom data yang dipengaruhi oleh nilai-nilai dalam semua kolom lain

    2. Mendeteksi kelompok baris dengan karakteristik yang sama 3. Secara otomatis mengisi kolom dengan nilai-nilai didasarkan pada beberapa contoh

    yang kita berikan

    4. Melakukan peramalan deret waktu 5. Mencari baris yang tidak seperti kebanyakan baris lainnya (menarik atau anomali) 6. Melakukan skenario (tujuan-seeking atau what-if) analisa 7. Melakukan analisa basket shopping dan mengidentifikasi peluang cross selling

    (MacLennan, Tang, & Crivat, 2009)

  • 4.2.2 PENYELESAIAN DATA MINING MENGGUNAKAN FUNGSI

    MICROSOFT EXCEL

    Banyak masalah intelektual, ekonomi, dan bisnis yang dapat diselesaikan menggunakan data

    mining dalam enam fungsi data mining berikut:

    1. Classification Klasifikasi, salah satu tugas data mining yang paling umum. Klasifikasi terdiri dari

    pemeriksaan fitur dari objek yang baru disajikan dan disisipkan ke salah satu set

    standar kelas.

    2. Estimation Estimasi hampir mirip dengan classification, jika klasifikasi menghasilkan output

    diskrit seperti ya atau tidak estimasi mengeluarkan output yang berkaitan dengan

    nilai-nilai yang berkalanjutan. Output yang berbeda dari klasifikasi dan estimasi ini

    berasal dari input yang sama.

    3. Prediction Hampir sama dengan klasifikasi dan estimasi, kecuali bahwa dalam prediksi nilai dari

    hasil akan ada dimasa datang (memperkirakan hal yang belum terjadi). Kita bisa

    menunggu hingga hal itu terjadi untuk membuktikan seberapa tepat prediksi kita.

    4. Affinity grouping Adalah salah satu pendekatan sederhana untuk menghasilkan aturan dari data. Dan

    juga untuk menentukan hal-hal yang bisa di kelompokkan bersama-sama.

    5. Clustering Mirip dengan klasifikasi, yang membedakan adalah pengelompokan yang tidak

    bergantung pada kelas yang telah ditetapkan. Clustering adalah tugas segmentasi

    populasi heterogen menjadi nomor sub kelompok lebih homogen atau kluster.

    6. Description and profiling Mendeskripsikan database untuk meningkatkan kepahaman kita dalam mengerti

    perilaku pelanggan, produk atau memproses data.

    (Berry & Linoff, 2004)

  • 4.2.3 PENERAPAN DATA MINING DI EXCEL MENGGUNAKAN FUNGSI

    CLASSIFY, ESTIMATE , DAN CLUSTERING

    Penjelasan lebih lengkap mengenai langkah-langkah menggunakkan ketiga fungsi ini telah

    dijelaskan lebih lengkap pada BAB 3. Implementasi Data Mining pada Microsoft Excel,

    untuk itu pada BAB 4 ini hanya mengulas mengenai bantuan apa yang dihasilkan dari wizard

    classify, estimate, dan clustering pada microsoft excel.

    Tabel 1. Penerapan Fungsi Classify, Estimate, dan Clustering pada Excel

    No Fungsi Penerapan

    1. Clasify

    Klasifikasi wizard membantu kita membangun sebuah model klasifikasi berdasarkan data yang ada dalam tabel Excel,

    berbagai Excel, atau sumber data eksternal. Sebuah model

    klasifikasi ekstrak pola dalam data Anda yang menunjukkan

    persamaan dan membantu Anda membuat prediksi

    berdasarkan pengelompokan nilai-nilai. Sebagai contoh,

    sebuah model klasifikasi dapat digunakan untuk memprediksi

    berdasarkan pendapatan atau pola pengeluaran risiko.

    Classification Wizard pada penggunaan Microsoft ini membantu algoritma data mining seperti: Decision Trees

    algorithm, Logistic Regression, Nave Bayes, neural

    Networks.

    2. Estimate

    Estimate wizard membantu kita dalam membuat model estimasi. Sebuah model estimasi ekstrak pola dari data dan

    menggunakan pola untuk memprediksi hasil numerik, seperti

    currency, sales amount, date, or time.

    Estimate Wizard pada penggunaan Microsoft ini membantu algoritma data mining seperti: Decision Trees, Linear

    Regression, Logistic Regression, and Neural Networks.

    3. Clustering

    Wizard Cluster membantu kita membangun sebuah model clustering. Sebuah model pengelompokan mendeteksi

    kelompok baris yang berbagi karakteristik serupa. Wizard ini

    berguna untuk menjelajahi pola dalam semua jenis data.

    Wizard Cluster menggunakan algoritma Microsoft Clustering, yang meliputi K-means dan EM.

  • BAB 5. PENUTUP

    BAB 5 ini berisi kesimpulan dan saran mengenai implementasi data mining untuk Customer

    Relationship Management (CRM).

    5.1 KESIMPULAN

    Kesimpulan yang dapat diambil dari implementasi data mining untuk CRM ini yaitu:

    1. Terbukti bahwa dengan menggunakan data mining perusahaan bisa meningkatkan marketing, sales dan customer support operation melalui pemahaman yang lebih baik

    terhadap pelanggan. Karena data mining adalah eksplorasi dan analisa dari data

    dengan jumlah yang besar untuk menemukan pola dan aturan-aturan yang berguna.

    Pola-pola inilah yang digunakan sebagai analisa pemasaran, penjualan dan

    pengelolaan hubungan pelanggan.

    2. Terbukti bahwa sebagian besar proses berkaitan dengan building models. Sebuah model hanyalah sebuah algoritma atau seperangkat aturan yang menghubungkan

    kumpulan input (seringnya berbentuk database perusahaan) ke target atau hasil

    tertentu. Regresi, neural networks, decision trees, dan sebagian besar teknik data

    mining lain yang dibahas dalam buku ini adalah teknik untuk menciptakan model.

    Input dan target dalam teknik data mining inilah yang berkaitan dengan building

    models.

    3. Membuktikan bahwa pekerjaan seperti Classification, Estimation, Prediction, Affinity grouping, Clustering, Description dan profiling bisa diselesaikan menggunakan data

    mining. Untuk Classification, Estimation, Prediction merupakan contoh data mining,

    di mana tujuannya adalah untuk menemukan nilai dari variabel target tertentu. Affinity

    grouping dan clustering tujuannya adalah untuk mengungkap struktur data tanpa

    mengacu terhadap variabel target tertentu. Profiling adalah tugas deskriptif yang

    mungkin akan diarahkan atau tidak diarahkan.

    4. Dapat mengetahui keuntungan yang didapatkan dari proses data mining. Data mining menggunakan prinsip-prinsip statistik untuk menemukan pola dalam data Anda,

    membantu Anda membuat keputusan cerdas tentang masalah yang kompleks. Dengan

    menerapkan algoritma data mining di Analysis Services, Anda dapat meramalkan tren,

    mengidentifikasi pola, membuat aturan dan rekomendasi, menganalisa urutan

    peristiwa dalam set data yang kompleks, dan mendapatkan wawasan baru.

    5.2 SARAN

    Berdasarkan eksplorasi dari tugas implementasi data mining untuk CRM saran yang kami

    rekomendasikan yaitu:

    1. Sebaiknya menggunakan sql server yang standard / enterprise edition 2. Untuk office 2007 sebaiknya menggunakan sql server 2008 3. Untuk office 2008 dan 2010 sebaiknya menggunakan sql server 2012

  • DAFTAR PUSTAKA

    Berry, M. J., & Linoff, G. S. (2004). Data Mining Techniques Second Edition. Indiana: Wiley

    Publishing Inc.

    MacLennan, J., Tang, Z. H., & Crivat, B. (2009). Data Mining with Microsoft SQL Server

    2008 . Indiana: Wiley Publishing, Inc.

    Network, M. D. (n.d.). Data Mining Client for Excel (SQL Server Data Mining Add-ins).

    Retrieved December 22, 2013, from Microsoft Developer Services:

    http://msdn.microsoft.com/en-us/library/dn282385(v=sql.120).aspx

    Tarigan, Avinanta. Data Mining Pengenalan Sistem & Teknik, Serta Contoh Aplikasi. 2008.

    Fadli, Arif. Konsep Data Miniing. 2003