Pert 9-Analisis Cluster

download Pert 9-Analisis Cluster

of 25

description

asas

Transcript of Pert 9-Analisis Cluster

  • ANALISIS GEROMBOL

    (Cluster Analysis)

    Novi Hidayat P

  • CLUSTER ANALYSIS Cluster Analysis adalah suatu teknik analisis multivariate metode interdependen,

    dengan tujuan meringkas data dengan penggerombolan obyek (responden)

    sehingga terbentuk beberapa kelompok, disebut cluster. Obyek di dalam suatu

    cluster lebih mirip dibandingkan antar cluster. Kemiripan ini sudah didasarkan

    pada sekumpulan variabel secara simultan.

    KEGUNAAN

    identifikasi banyaknya cluster dari sekumpulan obyek identifikasi karakteristik setiap cluster prediksi jumlah anggota masing-masing subpopulasi berdasarkan perhitungan anggota setiap cluster yang diperoleh dari data sampel

    BASIS KLASTERING DAN INPUT

    Pengelompokka dibuat berbasis pada kesamaan (similiarities) atau jaraknya (disimiliarities)

    Input yang diperlukan berupa ukuran kesamaan atau data dimana kesamaan dapat dihitung

  • CLUSTER ANALYSIS Analisis Cluster dalam beberapa bidang keilmuan

    Dalam analisis Pemasaran, Cluster analysis dapat digunakan untuk (a) mengetahui

    segmentasi dan menentukan target pasar yang dituju; (b) mengetahui positioning produk

    dan menentukan pengembangan produk baru; (c) Memilih pasar yang akan dipilih untuk

    produk baru perusahaan.

    Dalam analisis penelitian pendidikan, data untuk clustering dapat berupa data siswa,

    orang tua, jenis kelamin atau nilai ujian. Clustering merupakan metode penting untuk

    memahami dan utilitas dari cluster dalam penelitian pendidikan, msialnya untuk

    pengelompokkan siswa ataupun sekolah.

  • CLUSTER ANALYSIS Ukuran ketakmiripan

    Ukuran jarak yang sering digunakan adalah jarak euclidean (d) dengan

    mengukur proximity pada ruang dua dimensi sehingga jarak antara dua

    observasi menunjukkan kesamaan. Secara Umum Jarak euclid antara 2

    amatan dengan p variabel dinyatakan sebagai

    p

    k

    kjki XXdij1

    2)(

    Ukuran Mikowski dan Mahalanobis m

    p

    k

    m

    jkik XXdij

    /1

    1

    )(

    jt

    j Sdij XXXX ii 1

  • CLUSTER ANALYSIS Ukuran kemiripan

    Sifat-sfat ukuran ketakmiripan:

    d(uv) 0

    d(uu)= 0

    d(uv)= d(vu)

    d(uv) akan meningkat nilainya dengan semakin tak miripnya gerombol u dan v

    Nilai jarak tersebut akan disajikan dalam matriks jarak yang disebut dengan

    matriks proksimitas/proximity

    (2) Asumsi Analisis Gerombol

    Data antar pengamatan (case) independen

    Sampel diambil secara random

    Antar variabel tdak saling bebas (berkorelasi)

    Data untuk seluruh variabel minimal memiliki skala interval

    (terutama bila ukuran kemiripan yang digunakan adalah jarak)

  • CLUSTER ANALYSIS

    Metode analisis :

    1) Hirarki (berjenjang) :

    - Terstruktur

    - Dapat ditelusuri penggerombolan suatu objek dengan objek lainnya

    - Stabil

    - Banyak kelompok belum diketahui

    - Output berupa dendogram

    - pemotongan : jarak lompatan terjauh

    2) Tidak Berhirarki :

    - Tidak terstruktur

    - Banyak kelompok ditentukan terlebih dahulu (diketahui)

    - Menggunakan Iterasi

    - Kurang Stabil

    - Output : anggota kelompok dan centroid

  • CLUSTER ANALYSIS Metode yang sering digunakan untuk pengelompokan obyek pada

    Hierarchical clustering adalah

    Metode penggumpalan (agglomeratif)

    Setiap obyek dianggap sebagai suatu gerombol/cluster,

    kemudian dikelompokkan dengan obyek yang memeiliki jarak

    terdekat

    Metode pembagian (divisive)

    Bekerja dengan membagi 2 berdasarkan jumlah objek,

    dipisahkan dengan dicari obyek yang mempunyai jarak terjauh

  • CLUSTER ANALYSIS Hirarki (berjenjang)

    Metode yang sering digunakan untuk pengelompokan obyek pada

    Hierarchical clustering adalah metode penggumpalan

    (agglomeratif)

    Terdapat 7 metode pengelompokkan

    Agglomerative yang sering

    dipergunakan untuk perhitungan jarak

    antar cluster dengan obyek atau

    dengan cluster lain di dalam

    penggerombolan berjenjang, yaitu

    single lingkage (pautan tunggal),

    complete linkage (pautan lengkap,

    avarage linkage (pautan rata-rata),

    centroid, median, minimum variance,

    ward

  • CLUSTER ANALYSIS Hirarki (berjenjang)

    Untuk teknik pengelompokkan dengan metode Divisive ada 2

    metode yang sering digunakan yaitu :

    A splinter- Average Distance Method

    Automatic Interaction Detection

  • CLUSTER ANALYSIS Hirarki (berjenjang)

    Output : berupa dendogram

    Z

    K

  • CLUSTER ANALYSIS Hirarki (berjenjang)

    Latihan:

    Diketahui data variabel pendidikan dan pendapatan untuk 6 amatan

    adalah sebagai berikut:

    Nilai Pendapatan: 5,6,15,16,25,30

    Nilai Pendidikan: 5,6,14,15,20,19

    Dengan menggunakan metode Pautan tunggal

  • CLUSTER ANALYSIS Hasil

    Pendapatan Pendidikan Kelompok

    5 5 1

    6 6 1

    15 14 2

    16 15 2

    25 20 2

    30 19 2

  • CLUSTER ANALYSIS APLIKASI

    Suatu penelitian dilakukan dengan cara survey, bertujuan ingin

    mengetahui peta karakteristik anak jalanan. Bilamana mapping ini

    dapat dilakukan, diharapkan dapat dikembangkan model pembinaan

    yang efektif.

    Variabel yang diamati adalah pendidikan, alasan dan keinginan

    selengkapnya dapat dilihat pada Materi Bahasan Analisis Faktor.

    Analisis dilakukan dengan program SPSS

  • Data ini akan digunakan untuk membuat pemetaan karakteristik anak

    jalanan dengan analisis cluster.

    Dat Pendididkan Alasan Menjadi Anak Jalanan dan

    Keinginan Anak Jalanan

  • CLUSTER ANALYSIS HASIL ANALISIS

    Koefisien agglomerasi menghasilkan lompatan (selisih) terbesar dari

    stage 98 ke 99, yaitu dari 8.814 ke 12.466. Dengan demikian dapAt

    diketahui bahwa dari 100 anak jalanan tersebut membentuk 2 cluster.

  • CLUSTER ANALYSIS HASIL ANALISIS

    Penempatan setiap obyek (case) ke dalam cluster dapat dilihat pada

    tabel di bawah ini.

  • CLUSTER ANALYSIS HASIL ANALISIS

    Anak jalanan yang berjumlah 100 orang membentuk dua cluster

    dan untuk melakukan identifikasi karakteristik setiap cluster

    dilakukan analisis diskriptif.

    Karakteristik cluster 1 adalah pendidikan orang tua cukup tinggi akan tetapi

    pendidikan anak tidak terurus, mereka menjadi anak jalanan bukan karena

    keadaan (ekonomi) dan sebenarnya mereka tidak ingin menjadi anak jalanan.

    Tampaknya anak jalanan di dalam kelompok ini lebih disebabkan karena

    sangat kurangnya perhatian orang tua.

  • CLUSTER ANALYSIS HASIL ANALISIS

    Karakteristik cluster 2 adalah pendidikan orang tua rendah, untuk

    bisa bertahan hidup mereka harus menjadi anak jalanan sehingga

    ada keinginan yang tinggi untuk menjadi anak jalanan. Pada

    cluster ini, tampaknya mereka menjadi anak jalanan

    dilatarbelakangi kondisi ekonomi keluarga.

    Pembinaan anak jalanan pada cluster 1 seharusnya berbeda

    dengan pada cluster 2. Dengan kata lain, dari hasil pemetaan

    (mapping) ini selanjutnya dapat dirancang model dan program

    pembinaan anak jalanan yang efektif.

  • CLUSTER ANALYSIS Tidak Hirarki (tidak berjenjang)

    Pada analisis gerombol tidak berjenjang jumlah cluster harus

    ditetapkan terlebih dahulu sebelum kita melakukan analisis data.

    Dengan kata lain, non hierarchical clustering digunakan bilamana

    jumlah gerombol dapat ditentukan sebelum analisis dilakukan.

    Penentuan jumlah cluster dapat didasarkan pada rurjukan teoritis,

    kondisional, common sense, dan atau tujuan penelitian.

    Metode yang banyak digunakan adalah Metode K-rataan (K -

    mean Method).

  • CLUSTER ANALYSIS APLIKASI

    Suatu penelitian dilakukan dengan tujuan untuk mengetahui karakteristik

    karyawan. Bilamana terdapat beberapa kelompok karaktersitik, maka pada

    setiap kelompok ingin diketahui faktor apa yang dominan berpengaruh

    terhadap kinerjanya (perform). Variabel yang diamati adalah loyalitas,

    motivasi, kepuasan dan kinerja.

    Pengembangan model dan program pembinaan karyawan guna

    meningkatkan kinerjanya ditetapkan hanya 2 macam. Oleh karena itu,

    karyawan akan dikelompokkan menjadi 2, selanjutnya akan diidentifikasi

    karakteristik dari dari setiap kelompok. Informasi ini akan digunakan

    sebagai bahan pengembangan model dan program pembinaan karyawan.

    Mengingat jumlah cluster (kelompok) sudah ditetapkan terlebih

    dahulu, maka analisis untuk penggerombolan yang paling tepat

    adalah analisis gerombol tidak berjenjang. Hasil analisis data,

    menggunakan SPSS, disajikan sebagai berikut.

  • CLUSTER ANALYSIS HASIL ANALISIS

    Kelompok (cluster) 1 beranggotakan

    49 orang karyawan, dengan center

    (mean) untuk semua variabel positif.

    Dengan demikian, pada kelompok ini

    upaya pembinaan diarahkan untuk

    lebih meningkatkan kinerja.

  • CLUSTER ANALYSIS HASIL ANALISIS

    Kelompok 2 beranggotakan 46 orang karyawan, dengan center

    semuanya negatif. Sehingga pada kelompok ini diperlukan upaya

    pembinaan yang tujuannya adalah perbaikan berbagai aspek perilaku

    karyawan.

    Kemudian pada kelompok 2 ini akan diidentifikasi faktor apa yang dominan

    berpengaruh terhadap kinerja (perform)

  • CLUSTER ANALYSIS UKURAN EVALUASI KLUSTER

    1. Root Mean Square Standart Deviation (RMSSTD)

    Tidak ada kriteria khusus, untuk pengelompokkan yang baik niali tsb harus kecil

    2. R-Square (RS)

    RS bernilai antara 0 dan 1, semakin esar nilai RS seamkin baik pengelompokkan yang

    dilakukan

    *Dengan nilai SS diperoleh dari tabel One-way ANOVA niali amatan yang sudah dikelompokkan*

    variabelsemua df pooled

    variabelsemua SS pooledRMSSTD

    SStotal

    SSbetweenRS

  • CLUSTER ANALYSIS

    7377,083,2028,498

    3,1763,341

    RS

  • TERIMA KASIH