Presentation Slide Data Cube

download Presentation Slide Data Cube

of 29

  • date post

    21-Feb-2018
  • Category

    Documents

  • view

    230
  • download

    0

Embed Size (px)

Transcript of Presentation Slide Data Cube

  • 7/24/2019 Presentation Slide Data Cube

    1/29

  • 7/24/2019 Presentation Slide Data Cube

    2/29

    Data Cube

    Data warehouse dan OLAP didasarkan padamultidimensional data model.

    Model ini merepresentasikan data dalam bentukdata cube, yaitu data dimodelkan dan ditampilkan

    sebagai multiple dimension. Data cube ini didasarkan pada dimensions table

    dan facts table.

  • 7/24/2019 Presentation Slide Data Cube

    3/29

    D data cube, according to the dimension time,location, item

  • 7/24/2019 Presentation Slide Data Cube

    4/29

    Cube Materialization

    !ull Cube

    "ceberg Cube

    Closed Cube

    #hell Cube

  • 7/24/2019 Presentation Slide Data Cube

    5/29

    General Strategies forCube Computation

    $ #orting, hashing, and grouping

    %& #imultaneous aggregation and cachingintermediate results

    & Aggregation from the smallest child, when

    there e'istmultiple child cuboids.

    (& )he Apriori pruning method can be e'plored tocompute

    iceberg cubes e*ciently

  • 7/24/2019 Presentation Slide Data Cube

    6/29

    $. Multiway ArrayAggregation

  • 7/24/2019 Presentation Slide Data Cube

    7/29

    %. +C

    BUC: Computing Iceberg Cubes from the ApexCuboi !ownwar

  • 7/24/2019 Presentation Slide Data Cube

    8/29

    4.2 Pengembangan lebih lanjut dari data Cube dan OLAP teknologi

    1 Discovery-driven exploration Cubes data

    Disco-erydri-en e'ploration adalah pendekataneksplorasi kubus tersebut. Dalam disco-ery dri-en

    eksplorasi, tindakan precomputed menun/ukkanpengecualian data yang digunakan untukmemandu pengguna dalam proses analisis data, disemua tingkat agregasi.

    )indakan ini sebagai indikator terkecuali. #ecara

    intuitif, pengecualian adalah nilai sel kubus datayang berbeda secara signi0kan dari dana nilaiyang diantisipasi, berdasarkan modelstatistik.Model mempetimbangkan -ariasi dan polanilai ukuran di semua dimensi yang dimiliki sel.

  • 7/24/2019 Presentation Slide Data Cube

    9/29

  • 7/24/2019 Presentation Slide Data Cube

    10/29

    " Agregasi #omple$s i Beberapagranular

    3ubus Data memfasilitasi pen/awab pertanyaandata mining karena mereka memungkinkanperhitungan data agregat pada berbagai tingkatgranularity.

    Pada bagian ini, akan membahas tentangmultifeature kubus, yang menghitung pertanyaankompleks yang melibatkan beberapa agregattergantung pada berbagai granularities . 3ubus inisangat berguna dalam praktek. banyak kompleks

    4uery data mining dapat di/awab oleh multifeaturekubus tanpa signi0kan peningkatan biayakomputasi, dibandingkan dengan perhitungankubus untuk pertanyaan sederhana dengan batudata standar.

  • 7/24/2019 Presentation Slide Data Cube

    11/29

    Penggunaan langkahlangkah ini untukeksplorasi penemuandidorong dari kubus data

    yang digambarkan di contoh berikut.

  • 7/24/2019 Presentation Slide Data Cube

    12/29

    %& 'embatasan Analisis Graient

    +anyak aplikasi data kubus perlu menganalisisperubahan tindakan kompleks in multidimensionalruang

    Misalnya, dalam real estate, kita mungkin ingin

    bertanya apa sa/a perubahan harga rumah ratarata di daerah 5ancou-er pada tahun %66(dibandingkan dengan tahun %66,dan /awabannyabisa 7harga ratarata untuk yang di/ual untuk paraprofesional di thewest 2nd turun sebesar %68,

    sedangkan yang di/ual kepada orangorang bisnisdi Metrotown naik sebesar $68, dll 72kspresiseperti7 profesional di thewest 2nd 7sesuai dengansel berbentuk kubus dan menggambarkan sektorbisnis dimodelkan dengan kubus data.

  • 7/24/2019 Presentation Slide Data Cube

    13/29

    Perubahan pertambangan problemof tindakankompleks dalam ruang amultidimensional

    adalah pertama kali diusulkan oleh "mielinski,

    3hachiyan, andAbdulghani 9"3A6%: sebagaimasalah cubegrade,yang dapat dilihat sebagai

    generalisasi dari asosiasi rules; dan kubusdata. "ni mempela/ari bagaimana perubahandalam serangkaian langkahlangkah

  • 7/24/2019 Presentation Slide Data Cube

    14/29

    Di sini kita memeriksa -ersi terbatas tapi menarik dari masalahcubegrade, disebut dibatasi analisis gradien multidimensi, yangmengurangi ruang pencarian dan berasal hasil yang menarik.Menggabungkan /enis berikut kendala&

    $. #igni0kansi kendala& >al ini memastikan bahwa kita meneliti

    hanya selsel yang memiliki tertentu 7#igni0kansi statistik7 dalam data, seperti yang mengandung

    setidaknya se/umlah tertentu

    sel dasar atau total pen/ualan setidaknya tertentu. Dalamkonteks data kubus, kendala ini

    bertindak sebagai kondisi gunung es, yang plum se/umlah besar

    sel sepele dari men/awab ditetapkan.

    %. Probe kendala& ini memilih subset sel

  • 7/24/2019 Presentation Slide Data Cube

    15/29

    . kendala ?radient& ini menentukan kisaranpengguna dari bunga gradien

  • 7/24/2019 Presentation Slide Data Cube

    16/29

    !ata Generalization yaitu merangkum data dengan

    mengganti relatif nilai tingkat rendah (seperti nilai numerikuntuk atribut usia) dengan konsep-tingkat yang lebih tinggi

    (seperti muda, middleaged, dan senior).

    Concept !escription menghasilkan deskripsi untuk

    karakterisasi dan perbandingan data. al ini kadang-kadang

    disebut kelas deskripsi, ketika konsep yang akan di!elaskan

    mengacu pada kelas ob!ek. "arakterisasi menyediakan

    rangkuman yang ringkas dan singkat dari koleksi data yangdiberikan, sementara konsep atau perbandingan kelas (!uga

    dikenal sebagai diskriminasi) memberikan deskripsi

    membandingkan dua atau koleksi lebih dari data.

    AttributeOriented "[email protected] Alternati-eMethod for Data ?eneraliation and Concept Description

  • 7/24/2019 Presentation Slide Data Cube

    17/29

    "nduksi +erorientasi Atribut

    Diusulkan tahun $BB

  • 7/24/2019 Presentation Slide Data Cube

    18/29

    1#$%&

    Contoh: #ara$terisasi Analitis 'ugas

    enambang karakteristik umum yangmenerangkan graduate studentsmenggunakan karakterisasi analitis

    Diberikan

    tribut-atribut name, gender, major,birth_place, birth_date, phone#, dan

    gpa

    Gen(ai)* konsep hierarki atas ai

    Ui* atribut ambang analitis untuk ai

    Ti* atribut ambang general untuk aiR* atribut ambang yang relevan

  • 7/24/2019 Presentation Slide Data Cube

    19/29

    1%$%&

    Contoh: #ara$terisasi Analitis1. "oleksi data

    "elas target+ graduate student "elas laannya+ undergraduate student

    . eneralisasi analitis menggunakan /i

    0enghapusan atribut enghapus namedanphone#

    eneralisasi atribut enggeneralisasi major, birth_place, birth_date

    dangpa

    engumpulkan !umlah record

    "andidat relasi+gender, major,birth_country, age_rangedangpa

  • 7/24/2019 Presentation Slide Data Cube

    20/29

    &$%&

    Contoh: #ara$terisasi Analitis

    Kandidat relasi untuk kelas Target: Graduate

    students (

    =120)

    Kandidat relasi untuk kelas lawan : Undergraduate

    students (=130)

    gender major birth_country age_range gpa count

    cience Canada &-2 3ery4good 15

    6 cience 6oreign 2-7& 8xcellent

    8ngineering 6oreign 2-7& 8xcellent 1#

    6 cience 6oreign 2-7& 8xcellent 2

    cience Canada &-2 8xcellent 1

    6 8ngineering Canada &-2 8xcellent 1#

    gender major birth_country age_range gpa count

    cience 6oreign 9& 3ery4good 1#

    6 :usiness Canada 9& 6air &

    :usiness Canada 9& 6air

    6 cience Canada &-2 6air ;

    8ngineering 6oreign &-2 3ery4good

    6 8ngineering Canada 9& 8xcellent ;

  • 7/24/2019 Presentation Slide Data Cube

    21/29

    1$%&

    Contoh: #ara$terisasi Analitis7. nalisis

  • 7/24/2019 Presentation Slide Data Cube

    22/29

    $%&

    Contoh: #ara$terisasi Analitis7. nalisis umlah grad studentsdalam [email protected]

    >umlah undergradstudents dalam

    [email protected]

    A#A7.&;

    ;log

    ;

    ;

    ;

    &log

    ;

    &

    2&

    ;

    #

    ;5log

    #

    ;5

    #

    75log

    #

    75

    2&

    #

    15

    ;log

    15

    ;

    15

    #;log

    15

    #;

    2&

    15)(

    =

    +

    +

    +

    +

    +

    =majorE

  • 7/24/2019 Presentation Slide Data Cube

    23/29

    7$%&

    Contoh: #ara$terisasi Analitis enghitung perolehan informasi untuk

    masing-masing atribut

    =nformation gain untuk seluruh atribut

    112.&A#A7.&%%##.&)(),()( 1 === majorESSImajorGain

  • 7/24/2019 Presentation Slide Data Cube

    24/29

    ;$%&

    Contoh: #ara$terisasi Analitis;. =nitial orking relation (B&) derivation

    < * &.1

    :uang atribut yang tak relevan $ relevan tapi lemah

    dari kandidat relasi * buanggender, birth_country

    remove contrasting class candidate relation

    2. elakukan induksi berorientasi atribut atas B&

    menggunakan 'i

  • 7/24/2019 Presentation Slide Data Cube

    25/29

    2$%&

    #omparasi #elas Mining "omparasi+ membandingkan dua atau lebih kelas etoda+

    0artisi himpunan data relevan kedalam kelas target dankelas kontrasnya

    eneralisasi kedua kelas ke level tinggi konsep yang

    sama embandingkan tuple dengan deskripsi level tinggi yang

    sama emberikan setiap tuple deskripsinya dan ukuran+

    support distribusi didalam kelas tunggal komparasi distribusi antara kelas

    enon!olkan tuple dengan fitur deskriminan yang kuat

    nalisis

  • 7/24/2019 Presentation Slide Data Cube

    26/29

    5$%&

    Contoh: #omparasi Analitis Diberikan

    tribut-atribut name, gender, major,

    birth_place, birth_date, reidence, phone#

    dangpa

    Gen(ai)* konsep hierarki atas atribut-atribut ai

    Ui* ambang analitis atribut untuk atribut ai

    Ti* ambang generalisasi atribut untukatribut ai

    R* ambang relevan atribut

  • 7/24/2019 Presentation Slide Data Cube

    27/29

    A$%&

    Contoh: #omparasi Analitis

    1. "oleksi data "elas target dan kontrasnya

    . nalisis relevan atribut

    embuang atribut name, gender,major, phone#

    7. inkronisasi generalisasi

    Dikontrol oleh ambang dimensiyang diberikan user

  • 7/24/2019 Presentation Slide Data Cube

    28/29

    #$%&

    Contoh: #omparasi Analitis

    Relasi utama yang digeneralisasi untuk kelas target

    !raduate students

    Relasi utama yang digeneralisasi untuk kelas target

    "ndergraduate students

  • 7/24/2019 Presentation Slide Data Cube

    29/29

    %$%&

    Contoh: #omparasi Analitis;. Eperasi EF0 drill don, roll up dan

    operasi lainnya atas kelas target dankontras untuk menyesuaikan levelabstraksi dari hasil deskripsi

    2. 0resentasi ebagai generalisasi relasi, crosstabs, bar

    charts, pie charts, atau kaidah-kaidah

    /kuran kontras untuk merefleksikan

    komparasi antara kelas target dan kelaskontrasnya Contoh countG