PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

66
KERJA PRAKTIK KI141330 Pembuatan Data Preparation dan Data Visualization pada Data Exchange (DX) Telkom Divisi Digital Service PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE Jl. Sisingamangaraja No.4, RT.2/RW.1, Selong, Kec. Kby. Baru, Kota Jakarta Selatan, Daerah Khusus Ibukota Jakarta 12110 Periode: 1 Juli 2020 - 30 September 2020 Oleh: Pembimbing Departemen Dr. Eng. Chastine Fatichah S. Kom, M. Kom Pembimbing Lapangan Rakhman Imansyah S.T., M.T. DEPARTEMEN TEKNIK INFORMATIKA Fakultas Teknologi Elektro dan Informatika Cerdas Institut Teknologi Sepuluh Nopember Surabaya 2020

Transcript of PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

Page 1: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

1

KERJA PRAKTIK – KI141330

Pembuatan Data Preparation dan Data Visualization pada

Data Exchange (DX) Telkom Divisi Digital Service

PT. TELEKOMUNIKASI INDONESIA, Tbk

DIVISI DIGITAL SERVICE

Jl. Sisingamangaraja No.4, RT.2/RW.1, Selong, Kec. Kby.

Baru, Kota Jakarta Selatan, Daerah Khusus Ibukota Jakarta

12110

Periode: 1 Juli 2020 - 30 September 2020

Oleh:

Pembimbing Departemen

Dr. Eng. Chastine Fatichah S. Kom, M. Kom

Pembimbing Lapangan

Rakhman Imansyah S.T., M.T.

DEPARTEMEN TEKNIK INFORMATIKA

Fakultas Teknologi Elektro dan Informatika Cerdas

Institut Teknologi Sepuluh Nopember

Surabaya 2020

Page 2: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

2

[Halaman ini sengaja dikosongkan]

Page 3: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

3

KERJA PRAKTIK – KI141330

Pembuatan Data Preparation dan Data Visualization pada

Data Exchange (DX) Telkom Divisi Digital Service

PT.TELEKOMUNIKASI INDONESIA,Tbk

DIVISI DIGITAL SERVICE

Jl. Sisingamangaraja No.4, RT.2/RW.1, Selong, Kec. Kby.

Baru, Kota Jakarta Selatan, Daerah Khusus Ibukota Jakarta

12110

Periode: 1 Juli 2020 - 30 September 2020

Oleh:

Pembimbing Departemen

Dr. Eng. Chastine Fatichah S. Kom, M. Kom

Pembimbing Lapangan

Rakhman Imansyah S.T., M.T.

DEPARTEMEN TEKNIK INFORMATIKA

Fakultas Teknologi Elektro dan Informatika Cerdas

Institut Teknologi Sepuluh Nopember

Surabaya 2020

Page 4: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

4

[Halaman ini sengaja dikosongkan]

Page 5: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

5

LEMBAR PENGESAHAN

KERJA PRAKTIK

Pembuatan Data Preparation dan Data Visualization

pada Data Exchange (DX) Telkom Divisi Digital Service

Oleh:

Isnaini Nurul KurniaSari 05111740000010

Zahrul Zizki Dinanto 05111740000168

Mengetahui, Menyetujui,

Telkom STO Gambir Dosen Pembimbing

Pembimbing Kerja Praktik Kerja Praktik

Rakhman Imansyah S.T., M.T. Dr.Eng. Chastine Fatichah S.Kom, M.Kom

NIP: 197512202001122002

SURABAYA, OKTOBER, 2020

Page 6: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

6

[Halaman ini sengaja dikosongkan]

Page 7: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

7

Pembuatan Data Preparation dan Data Visualization

pada Data Exchange (DX) Telkom Divisi Digital Service

Nama Mahasiswa : Isnaini Nurul KurniaSari

NRP : 05111740000010

Nama Mahasiswa : Zahrul Zizki Dinanto

NRP : 05111740000168

Departemen : Teknik Informatika FTEIC-ITS

Pembimbing Departemen: Dr. Eng. Chastine Fatichah S.Kom,

M.Kom

Pembimbing Lapangan : Rakhman Imansyah S.T., M.T.

Page 8: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

8

ABSTRAK

PT Telekomunikasi Indonesia (Persero) Tbk, atau Telkom

Indonesia atau biasa disebut Telkom adalah perusahaan BUMN di bidang informasi dan komunikasi serta salah satu penyedia jasa dan

jaringan telekomunikasi terbesar di Indonesia. Telkom mengklaim

sebagai perusahaan telekomunikasi terbesar di Indonesia, dengan

jumlah pelanggan telepon tetap sebanyak 15 juta dan pelanggan telepon seluler sebanyak 104 juta.

Salah satu proyek yang dikembangkan adalah Data

Exchange. Data Exchange atau disebut dengan DX adalah sebuah platform yang mempertemukan supplier dan demand data sehingga

DX berfungsi sebagai marketplace. Untuk mengembangkan

produktivitas perusahaan, Telkom mengoptimalkan pengolahan data sesuai dengan kebutuhan proses bisnis. Dalam pengolahan data yang

banyak, diperlukan suatu manajemen yang baik sehingga

menghasilkan informasi data yang mudah dipahami. Hal tersebut

menjadi fokus utama kegiatan kerja praktek yang dilakukan oleh penulis dalam pengoptimalan pengolahan data berupa data

preparation serta visualisasi data yang dapat memberikan informasi

yang mudah dipahami.

Dalam proses mengolah data, penulis menganalisis data

berdasarkan kebutuhan proses bisnis serta diperlukan adanya data preparation untuk mengubah data mentah menjadi data berkualitas.

Data preparation dapat berupa data cleansing, data integration, dan

data transformation. Dalam melakukan proses data preparation,

penulis menggunakan Bahasa pemrograman Python dan menggunakan tools jupyter notebook. Untuk menghasilkan

informasi data yang mudah dipahami diperlukan adanya suatu

visualisi data. Penulis menggunakan tools tableau, sehingga menghasilkan visualisasi data yang efektif dan efisien berupa

infografis.

Kata kunci : Data Preparation, Data Cleansing, Data

Integration, Data Transformation, Data Visualization, Jupyter

Notebook, Tableau, Infografis

Page 9: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

9

KATA PENGANTAR

Puji syukur kami haturkan kepada Allah SWT karena berkat

rahmat-Nya kami dapat melaksanakan salah satu kewajiban kami

sebagai mahasiswa Departemen Teknik Informatika, yakni Kerja

Praktek (KP). Kami menyadari masih ada kekurangan baik dalam pelaksanaan

kerja praktik maupun penyusunan buku laporan ini. Namun, kami

berharap buku laporan ini dapat menambah wawasan pembaca dan

dapat menjadi sumber referensi. Kami mengharapkan kritik dan saran yang membangun untuk kesempurnaan buku laporan kerja

praktik ini.

Melalui buku ini, kami juga ingin menyampaikan rasa terima kasih kepada orang-orang yang telah membantu, baik langsung

maupun tidak langsung, dalam pelaksanaan kerja praktik hingga

penyusunan laporan. Orang-orang tersebut antara lain adalah:

1. Kedua orang tua penulis. 2. Ibu Dr. Eng. Chastine Fatichah, S. Kom, M. Kom selaku

dosen pembimbing kerja praktik.

3. Bapak Ary Mazharuddin Shiddiqi, S.Kom., M.Comp.Sc.,

Ph.D. selaku koordinator Kerja Praktik.

4. Bapak Rakhman Imansyah S.T., M.T., selaku pembimbing lapangan kerja praktik kami di Big Data Management, PT.

Telekomunikasi Indonesia, Tbk.

Surabaya, Oktober 2020

Isnaini Nurul KurniaSari, Zahrul Zizki Dinanto

Page 10: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

10

[Halaman ini sengaja dikosongkan]

Page 11: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

11

DAFTAR ISI

LEMBAR PENGESAHAN 5

ABSTRAK 8

KATA PENGANTAR 9

DAFTAR ISI 11

DAFTAR TABEL 14

DAFTAR GAMBAR 17

DAFTAR KODE 17

BAB I PENDAHULUAN 18

1.1. Latar Belakang . 19

1.2. Tujuan 19

1.3. Manfaat 20

1.4. Rumusan Masalah 20

1.5. Lokasi dan Waktu Kerja Praktik 20

1.6. Metodologi Kerja Praktik 21

1.7. Sistematika Laporan 23

BAB II PROFIL PERUSAHAAN 26

2.1. Profil Telkom Divisi Digital Service 26

2.2. Visi dan Misi Telkom Divisi Digital Service 26

2.3. Produk Telkom Digital Service 26

2.4. Anak Perusahaan PT. Telkomunikasi Indonesia 27

BAB III TINJAUAN PUSTAKA 30

3.1. Pemrograman 30

3.1.1. Python 30

Page 12: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

12

3.1.2. Jupyter Notebook 31

3.1.3. Shell Script 31

3.2. Visualisasi Data 31

3.2.1. Tableau 31

3.3. Database 31

3.3.1. Postgresql 31

3.3.2. Pentahoo 32

BAB IV IMPLEMENTASI SISTEM 34

4.1. Analytical Data Visualization 34

4.1.1. Visualisasi Data dengan Tableau 34

4.2. Pembuatan Dashboard dengan Tableau 36

4.3. Ekstraksi Data Trend Apps Name 37

4.3.1. Ekstrasi Data dengan Apache Hive 37

4.3.2. Pemindahan Hasil Bash dari Server ke Local 38

4.3.3. Import CSV ke Database 39

4.3.4. Menggabungkan Tabel 40

4.4. Data Preparation 40

4.4.1. Crawling Data dari PDF 40

4.4.2. Data Cleansing 43

4.5. Menggabungkan Tabel 47

4.5.1. Melakukan Import Library dan File CSV 47

4.5.2. Melakukan Pembuatan Kolom Baru 48

4.5.3. Menggabungkan Kedua Tabel menjadi Satu 48

4.5.4. Menampilkan Kolom Penting dan Export CSV 50

Page 13: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

13

4.5.5. Mengambil kolom penting dan export menjadi csv 50

BAB V PENGUJIAN DAN EVALUASI 52

5.1. Tujuan Pengujian 52

5.2. Kriteria Pengujian 52

5.3. Skenario Pengujian 52

BAB VI KESIMPULAN DAN SARAN 57

6.1. Kesimpulan 57

6.2. Saran 57

DAFTAR PUSTAKA 59

BIODATA PENULIS I 61

BIODATA PENULIS II 64

Page 14: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

14

DAFTAR TABEL

Tabel 5.1 Kriteria dan Hasil Pengujian 55

Page 15: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

15

DAFTAR GAMBAR

Gambar 4.1 Data Analitik Trend Aplikasi e-Commerce 34

Gambar 4.2 Data Analitik Trend Aplikasi Perbankan 35

Gambar 4.3 Data Analitik Trend Aplikasi Games 35

Gambar 4.4 Design Infografis di Bidang Communications 36

Gambar 4.5 Design Infografis di Bidang eCommerce 37

Gambar 4.6 Template Bash Script Create Tabel Komunikasi 38

Gambar 4.7 Template Bash Script Create Tabel eCommerce 38

Gambar 4.8 Template Bash Script Create Tabel Games 38

Gambar 4.9 Template Bash Script Create Tabel Banking 38

Gambar 4.10 Pemindahan CSV dari Server ke Local 39

Gambar 4.11 Import CSV ke Database menggunakan Pentahoo 39

Gambar 4.12 SQL Syntax untuk Penggabungan Tabel Games 40

Gambar 4.13 Import Library 40

Gambar 4.14 Inisialisasi Variable Page 41

Gambar 4.15 Convert dari pdf ke CSV per page 41

Gambar 4.16 Menggabungkan File CSV 41

Gambar 4.17 Membuka file CSV dan Menyimpan ke Array 41

Gambar 4.18 Rename Kolom 42

Gambar 4.19 Rename Kolom dan menghilangkan null id_kel 42

Gambar 4.20 Export File ke CSV 42

Gambar 4.21 Import Library 43

Gambar 4.22 Import Data dari CSV 43

Gambar 4.23 Menampilkan informasi tabel 43

Page 16: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

16

Gambar 4.24 Mengisi Data Kosong pada Kolom 43

Gambar 4.25 Menampilkan Informasi Tabel Terbaru 44

Gambar 4.26 Menyeleksi id_kelurahan 44

Gambar 4.27 Menghilangkan noise integer 44

Gambar 4.28 Menampilkan Informasi Tabel 45

Gambar 4.29 Menambahkan Kolom Provinsi dan Keterangan 45

Gambar 4.30 Split String id_dukcapil 45

Gambar 4.31 Menambahkan Kolom Kelurahan_desa 46

Gambar 4.32 Mengambil dan Menyimpan Kolom 46

Gambar 4.33 Menampilkan Output Akhir dari Dataframe 46

Gambar 4.34 Export Dataframe ke File CSV 46

Gambar 4.35 Informasi Tabel Longitude dan Lattitude 47

Gambar 4.36 Tabel Master Dukcapil 47

Gambar 4.37 Import Library dan File CSV 47

Gambar 4.38 Membuat Kolom Baru 48

Gambar 4.39 Menggabungkan Dua Tabel 49

Gambar 4.40 Menampilkan dan Membaca Data 50

Gambar 4.41 Export to CSV 50

Gambar 5.1 Contoh Salah Satu Data Analitik Trend Apps Name 53

Gambar 5.2 Contoh Salah Satu Design Infografis Apps Name 53

Gambar 5.3 Ekstraksi Data dengan Hive 54

Gambar 5.4 Penggabungan Tabel Per Bulan Tiap Kategori 54

Gambar 5.5 Output Setelah Proses Cleansing Data 54

Gambar 5.6 Output Akhir dari Dataframe 55

Page 17: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

17

DAFTAR KODE

Page 18: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

18

BAB I

PENDAHULUAN

1.1 Latar Belakang

PT Telekomunikasi Indonesia (Persero) Tbk, atau biasa disebut Telkom Indonesia atau Telkom adalah perusahaan informasi

dan komunikasi serta penyedia jasa dan jaringan telekomunikasi

secara lengkap di Indonesia. Telkom memiliki jumlah pelanggan telepon tetap sebanyak 15 juta dan pelanggan telepon seluler

sebanyak 104 juta. Telkom merupakan salah satu BUMN yang

mayoritas sahamnya dimiliki oleh Pemerintah Indonesia.[1]

Seiring berkembangnya zaman, penggunaan data dan pengolahan data merupakan hal yang marak digunakan oleh

perusahaan-perusahaan. Banyak perusahaan-perusahaan swasta

maupun startup yang menggunakan data-data yang sudah diolah dalam menentukan pengambilan suatu keputusan bisnis. Telkom

sebagai salah satu BUMN, dan perusahaan yang bergerak di bidang

komunikasi dan informasi juga mulai menggunakan pengolahan data-data yang dimiliki. Hal ini ditujukan untuk menunjang proses

bisnis yang ada dan dapat terus bersaing dengan perusahaan-

perusahaan swasta. Langkah yang diambil Telkom adalah dengan

memiliki sebuah tim khusus, yaitu tim Big Data dibawah Telkom Divisi Digital Service untuk mengolah data dan memproses data agar

dapat berguna untuk menunjang proses bisnis di perusahaan.

Salah satu proyek yang dikembangkan adalah Data Exchange. Data Exchange atau disebut dengan DX adalah sebuah platform yang

mempertemukan supplier dan demand data sehingga DX berfungsi

sebagai marketplace. Untuk mengembangkan produktivitas

perusahaan, DX mengoptimalkan pengolahan data sesuai dengan kebutuhan proses bisnis. Dalam pengolahan data diperlukan suatu

manajemen yang baik sehingga menghasilkan informasi data yang

mudah dipahami. Pengolahan data tersebut dilakukan dengan data preparation agar efektif & efisien dan data visualization untuk

memberikan informasi yang mudah dipahami.

Page 19: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

19

Dalam proses mengolah data, penulis menganalisis data

berdasarkan kebutuhan proses bisnis. Data preparation diperlukan untuk mengubah data mentah menjadi data berkualitas dan berfungsi

untuk memanajemen data secara efektif dan efisien agar

menghasilkan data optimal & akurat dan sesuai dengan proses bisnis. Penulis melakukan data preparation meliputi data cleansing, data

integration, dan data transformation. Data cleansing dilakukan

dengan mengisi missing value, mengidentifikasi outlier, menangani

data noise, mengoreksi data yang tidak konsisten, dan menyelesaikan masalah redudansi data. Data integration dilakukan

dengan menggabungkan data dari beberapa sumber. Data

transformation berfungsi untuk mengubah suatu data supaya diperoleh data yang lebih berkualitas dengan cara menghilangkan

noise dari data (smoothing), meng-agregasi data, generalisasi data,

normalisasi data, dan pembentukan atribut/fitur.

Dalam melakukan proses data preparation, penulis

menggunakan bahasa pemrograman Python dan menggunakan tools jupyter notebook. Penulis menggunakan tools tableau untuk

menghasilkan visualisasi data berupa infografis sehingga

memudahkan pembaca dalam menerima informasi data secara praktis.

1.2 Tujuan

Tujuan kerja praktik ini adalah untuk mengembangkan

produktivitas perusahaan dengan mengoptimalkan pengolahan data

sesuai dengan kebutuhan proses bisnis dan menghasilkan informasi data yang mudah dipahami dengan menggunakan visualisasi data

berupa infografis.

1.3 Manfaat

Manfaat yang kami peroleh dari kerja praktik selama

menyelesaikan kerja praktik ini adalah sebagai berikut :

- Mengembangkan kemampuan untuk dapat memahami tahapan-tahapan persiapan data atau data preparation.

Page 20: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

20

- Mengembangkan kemampuan untuk melakukan pemetaan

data sehingga diperoleh data yang optimal dan akurat. - Mengembangkan kemampuan untuk melakukan

visualisasi data berupa data infografis.

- Mengetahui penggunaan data agar dapat digunakan dalam menunjang proses bisnis di suatu perusahaan.

- Berpikir inovatif dan solutif terhadap suatu masalah.

- Memahami dan mengetahui kondisi nyata dalam

lingkungan kerja dan implementasi scrum dalam divisi sebuah perusahaan.

1.4 Rumusan Masalah Berikut ini rumusan masalah pada kerja praktik pada Data

Exchange (DX) adalah sebagai berikut :

1. Bagaimana cara mengoptimalkan data parameter pada

Data Exchange (DX) dilakukan secara efektif dan efisien? 2. Bagaimana cara memperoleh data parameter yang akurat

pada Data Exchange (DX)?

3. Bagaimana cara menggambarkan informasi data pada

Data Exchange (DX) agar mudah dipahami oleh masyarakat?

1.5 Lokasi dan Waktu Kerja Praktik

Kerja praktik ini dilaksanakan pada waktu dan tempat sebagai berikut:

Lokasi : Work From Home (WFH)

Alamat : 1. Gabusan, RT 01/05 Kel. Jombor, Kec.

Bendosari, Kab. Sukoharjo 2. Perum Griya Praja Indah RT 02/23 Kel.

Kuripan Kec. Purwodadi Kab. Grobogan

Waktu : 1 Juli 2020 - 30 September 2020 Hari Kerja : Senin s.d Jumat

Jam Kerja : 08.00 WIB - 17.00 WIB

Page 21: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

21

1.6 Metodologi Kerja Praktik

Tahapan pengerjaan kerja praktik dapat dijabarkan sebagai

berikut:

1. Perumusan Masalah

Untuk mengetahui permasalahan apa yang harus diselesaikan,

diberikan penjelasan mengenai masalah yang dihadapi dan pendekatan seperti apa yang bisa dilakukan. Dijelaskan juga secara

rinci mengenai bagaimana alur mengolah data secara optimal dan

menghasilkan data yang akurat itu dapat berjalan. Penjelasan mengenai hal ini dijelaskan oleh pembimbing lapangan kerja praktik.

Dari penjelasannya dihasilkan catatan-catatan penting mengenai

tahapan dalam mengolah data berupa data preparation dan data

visualization. Dengan begitu dapat diputuskan bahasa pemrograman yang digunakan adalah python dengan tools pendukung Jupyter.

Untuk menghasilkan visualisasi data berupa data infografis, penulis

menggunakan tools tableau.

2. Studi Literatur

Setelah ditentukan bahasa pemrograman, alur, algoritma-

algoritma terkait dan tools tambahan yang akan digunakan dilakukan

studi literatur mengenai cara implementasinya dalam bahasa python. Bahasa pemrograman python berfungsi untuk membantu penulis

dalam melakukan data preparation.Pada tahap ini dilakukan proses

pencarian, pembelajaran, pengumpulan dan pemahaman informasi serta literatur yang berkaitan untuk membantu dalam implementasi

ke dalam bahasa python.

Untuk membuat data visualization berupa infografis, penulis

menggunakan tools tableau dalam membuat analisis visual interaktif

dalam bentuk dashboard sesuai dengan pola analisis bussines intelegence. Pada tahap data preparation dilakukan proses

eksplorasi mengenai tools pentahoo dan postgresql untuk melakukan

integrasi data secara optimal. Informasi bisa diperoleh dari internet untuk istilah-istilah umum yang digunakan dalam proses

implementasi ke bahasa python dan tools tableau untuk

menghasilkan visualisasi data berupa infografis.

Page 22: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

22

3. Analisis dan Perancangan

Tahap ini meliputi penjelasan tentang proses implementasi ke

bahasa python berdasarkan studi literatur. Tahap ini mendefinisikan alur dari implementasi. Langkah-langkah yang dikerjakan juga

didefinisikan ditahap ini sebagai berikut:

a. Memahami python sebagai bahasa pemrograman yang digunakan.

b. Memahami Jupyter Notebook sebagai tools pendukung yang

digunakan dalam membuat syntax. c. Memahami Tableau sebagai tools pendukung yang digunakan

dalam membuat visualisasi data infografis.

d. Memahami Tabula sebagai library pada python yang berfungsi

untuk melakukan data crawling tabel dari file berekstensi pdf untuk dibaca pada python.

e. Memahami pentahoo dan postgresql untuk integrasi data. f. Memahami metode scrum dengan prinsip-prinsip pendekatan

Agile yang bertumpu pada kekuatan kolaborasi tim, incremental

product dan proses iterasi untuk mewujudkan hasil akhir.

4. Implementasi

Implementasi didasarkan informasi yang sudah diperoleh dan

dipelajari dari tahap-tahap sebelumnya. Pada tahap ini penulis melakukan data preparation dengan melakukan proses/langkah

untuk mengolah data mentah menjadi data yang berkualitas sehingga

diperoleh input yang baik untuk data mining tools. Setelah melakukan data preparation penulis membuat visualisasi data agar

informasi data dapat mudah dipahami oleh masyarakat. Pengerjaan

dilakukan selama tiga bulan. Jika ada masukan atau evaluasi terhadap data preparation dan data visualization maka segera

diaplikasikan karena pengerjaan ini dilakukan dengan metode scrum

dengan teknik Agile sehingga memungkinkan untuk melakukan

perubahan atau update secara cepat dengan tim Data Exchange (DX).

Page 23: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

23

5. Pengujian dan Evaluasi

Pengujian dilakukan dengan melakukan pengecekan pada

beberapa sampling data secara manual. Data yang sudah diproses dicek apakah sudah testandarisasi dengan akurat, sehingga dapat

dilanjutkan dan diproses lebih lanjut untuk menunjang proses bisnis

di Telkom. Jika ada beberapa kasus yang belum dapat ditangani oleh

program atau masih kurang efisien dari segi waktu maupun penggunaan memori, maka dapat dijadikan bahan evaluasi untuk

program yang dirancang.

6. Kesimpulan dan Saran

Kesimpulan yang kami dapatkan diantaranya adalah

visualisasi data berupa infografis menggunakan tools Tableau memudahkan masyarakat dalam memahami informasi data, dan

pembuatan data parameter melalui data preparation tergolong baik,

efektif dan efisien. Saran yang penulis berikan antara lain diperlukan

adanya persiapan dan eksplorasi data dalam pembuatan data parameter agar lengkap, efektif, dan efisien serta tidak memakan

waktu yang lama.

1.7 Sistematika Laporan

Laporan kerja praktik ini terdiri dari tujuh bab dengan rincian

sebagai berikut:

1. Bab I Pendahuluan Pada bab ini dijelaskan tentang latar belakang permasalahan,

tujuan, waktu pelaksanaan, serta sistematika pengerjaan kerja

praktik dan juga penulisan laporan kerja praktik.

2. Bab II Profil Perusahaan Pada bab ini, dijelaskan secara rinci tentang profil perusahaan

tempat kami melaksanakan kerja praktik, yaitu Telkom Digital Service.

3. Bab III Tinjauan Pustaka Pada bab ini, dijelaskan mengenai tinjauan pustaka dan literatur

yang digunakan dalam penyelesaian kerja praktik di Telkom Digital

Service.

4. Bab IV Implementasi

Page 24: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

24

Pada bab ini, berisi penjelasan tahap-tahap yang dilakukan

untuk proses implementasi data preparation dan data visualization menggunakan bahasa pemrograman python. Visualisasi data berupa

data infografis menggunakan tools Tableau.

5. Bab V Pengujian dan Evaluasi

Pada bab ini, dijelaskan tentang hasil pengujian dan evaluasi

dari sistem yang telah dikembangkan selama pelaksanaan kerja

praktik di Telkom Digital Service.

6. Bab VI Kesimpulan dan Saran Pada bab ini, dipaparkan kesimpulan yang dapat diambil dan

juga saran selama pengerjaan kerja praktik.

Page 25: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

25

[Halaman ini sengaja dikosongkan]

Page 26: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

26

BAB II

PROFIL PERUSAHAAN

2.1 Profil Telkom Divisi Digital Service

Divisi Digital Service adalah salah satu Divisi “centralized”

di Telkom yang diperankan untuk penyelenggaraan aktivitas binis

dengan fokus pada pengelolaan pengembangan product scouping khususnya digital product innovation melalui coherence

inovation, discovery, incubation & acceleration (DIA) process,

research, standardization & quality assurane (RSQA) process, dan big data analytic.

2.2 Visi dan Misi Telkom Divisi Digital Service

Visi dan misi dari Perusahaan Telkom Divisi Digital Service

adalah sebagai berikut:

● Visi : Be the King of Digital in the Region. ● Misi : Lead Indonesian Digital Innovation and

Globalization.

2.3 Produk Telkom Digital Service

Produk dari Perusahaan Telkom Divisi Digital Service adalah sebagai berikut:

1. Bandung Digital Valley (BDV)

Program BDV ini terdiri dari Indigo Creative Nation

merupakan program apresiasi kepada startup/entrepreneur yang dinilai berhasil membuat ide, produk, maupun bisnis inovatif digital

yang diinginkan pelanggan (right product), serta mendorong

tumbuhnya digitalpreneur baru dalam industri digital.

2. UDATA Produk pengelolaan data yang kompleks menjadi suatu

insight, efektifitas, dan efisiensi dalam pengambilan keputusan dalam perusahaan dapat di tingkatkan.

3. ATOM Produk jasa pembuatan aplikasi mobile android dan IOS

Apple dengan cepat, mudah, professional dan harga terjangkau.

Page 27: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

27

4. PeduliLindungi

Aplikasi yang dikembangkan untuk menghentikan penularan

Coronavirus Disease (COVID-19). Aplikasi ini mengandalkan kepedulian (peduli) dan partisipasi masyarakat untuk saling

membagikan data lokasinya saat bepergian agar penelusuran riwayat

kontak dengan penderita COVID-19 dapat dilakukan.

2.4 Anak Perusahaan PT. Telekomunikasi Indonesia

1. PT. Telekomunikasi Seluler (Telkomsel)

2. Telkomsel Finance B.V (TFBV)

3. Telekomunikasi Seluler Finance Limited (TSFL)

4. PT. Multimedia Nusantara (Telkom Metra)

5. Mojopia (Metranet)

6. PT. Sigma Cipta Caraka (TelkomSigma)

7. PT. Sigma Solusi Integrasi

8. PT. Sigma Karya Sempurna

9. PT. Signet Pratama

10. PT. Sigma Tata Sadaya

11. PT. Sigma Metrays Solution

12. PT. Graha Telkomsigma 13. PT. Administrasi Medika (AdMedika) 14. PT. Finnet Indonesia (Finnet) 15. PT. Melon Indonesia (Melon)

16. PT. Patra Telekomunikasi Indonesia 17. PT. Infomedia Nusantara (Infomedia) 18. PT. Balebat Dedikasi Prima (Balebat)

19. PT. Telekomunikasi Indonesia International (TII/Telin)

20. PT. Telekomunikasi Indonesia International (Hong Kong) Ltd. (Telin Hong Kong)

21. PT. Telekomunikasi Indonesia International Pte., Ltd. (Telin

Singapore)

22. Telekomunikasi Indonesia Internasional, S.A. (Telin Timor

Leste)

Page 28: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

28

23. Telekomunikasi Indonesia International Australia Pty., Ltd.

(Telkom Australia)

24. Scicom (MSC) Bhd. (Scicom) 25. PT. Infrastruktur Telekomunikasi Indonesia (Telkom Infra) 26. PT. Dayamitra Telekomunikasi (Mitratel/Dayamitra)

27. PT. Graha Sarana Duta (TelkomProperty/GSD) 28. PT. Telkom Akses

29. PT. Napsindo Primatel Internasional (Napsindo)

Page 29: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

29

[Halaman ini sengaja dikosongkan]

Page 30: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

30

BAB III

TINJAUAN PUSTAKA

Pada bab ini, akan dijelaskan mengenai dasar teori yang digunakan selama proses kerja praktik.

3.1. Pemrograman

3.1.1. Python

Bahasa Pemrograman tinggi yang dapat melakukan eksekusi

sejumlah instruksi multi guna secara langsung (interpretative)

dengan metode orientasi objek serta menggunakan semantic dinamis

untuk memberikan tingkat keterbacaan syntax.

Python bahasa pemrograman open source, banyak sekali perusahaan yang mengembangkan bahasa pemrograman python

secara komersial untuk memberikan layanan. Python diklaim

mampu memberikan kecepatan dan kualitas. Hal ini didukung oleh adanya library dengan modul-modul baik standart maupun tambahan

misalnya Numpy,Scipy, dan lain-lain.

3.1.1.1. Pandas Pandas adalah sebuah librari berlisensi BSD dan open source

yang menyediakan struktur data dan analisis data yang mudah

digunakan dan berkinerja tinggi untuk bahasa pemrograman

Python.[2]

3.1.1.2. Numpy

Sebuah library pada python yang berfungsi untuk melakukan operasi vektor dan matriks dengan mengolah array dan array

multidimensi. [3]

3.1.1.3. Tabula Merupakan library pada python yang berfungsi untuk

melakukan data crawling tabel dari file berekstensi pdf untuk dibaca

pada python.

3.1.1.4. Tqdm

Tqdm merupakan modul python yang berguna untuk

menampilkan progress bar dengan perulangan yang sederhana.[4]

Page 31: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

31

3.1.1.5. FuzzyWuzzy

FuzzyWuzzy merupakan modul Python yang berguna untuk

untuk mendapatkan persentase kemiripan pada sebuah string dengan string lainnya.

3.1.1.6. OS

OS merupakakan modul python yang berguna untuk Menjalankan Perintah Unix Dalam Program Python.

3.1.1.7. Glob

Glob adalah module Python yang digunakan untuk membuat daftar urutan file dari hasil pencarian pada direktori atau file dalam

satu direktori.

3.1.2. Jupyter Notebook

Jupyter pengembangan dari IPython, IPpython disini

bertindak sebagai kernel dan Jupyter menggunakan antarmuka Notebook Interface lebih mirip document interaktif. Jupyter ini

adalah editor dalam bentuk web applikasi di localhost komputer kita

dan banyak yang bisa dilakukan seperti menulis kode Python.

3.1.3 Shell Script

Script shell adalah program komputer yang dirancang untuk

dijalankan oleh shell Unix, sebuah interpreter baris perintah.

3.2. Visualisasi Data

3.2.1 Tableau Tableau adalah sebuah tools yang dapat mempermudah

pembuatan analisis visual interaktif dalam bentuk dashboard.

3.3. Database

3.3.1 Postgresql

PostgreSQL adalah sebuah sistem basis data yang dapat

dugunakan secara bebas menurut Perjanjian lisensi BSD. Perangkat lunak ini merupakan salah satu basis data yang paling banyak

digunakan saat ini, selain MySQL dan Oracle. PostgreSQL

Page 32: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

32

menyediakan banyak fitur yang berguna untuk berbagai keperluan

basis data.

3.3.2. Pentahoo Pentahoo adalah perangkat lunak intelijen bisnis yang

menyediakan integrasi data, layanan OLAP, pelaporan, dashboard

informasi, penggalian dan ekstraksi data, transformasi, kemampuan untuk memuat data.

Page 33: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

33

[Halaman ini sengaja dikosongkan]

Page 34: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

34

BAB IV

IMPLEMENTASI SISTEM

Pada bab ini membahas tentang implementasi dari data

preparation dan data visualization pada data exchange (DX) Big

Data Management, Telkom. Implementasi ini akan dibagi ke dalam berbagai kategori sesuai dengan task yang diberikan. Berikut adalah

implementasinya data preparation dan data visualization sebagai

berikut:

4.1 Analytical Data Visualization

Pada tahap ini dilakukan proses visualisasi data pelanggan

indihome pada data top 10 trend industri berbagai macam kategori

sebagai berikut :

4.1.1 Visualisasi Data Dengan Tableau Pada tahap ini, kami bertujuan untuk melakukan visualisasi

terhadap data pelanggan indihome terhadap penggunaan top 10 trend

industri eCommerce yang ditunjukkan pada gambar 4.1, bidang

Perbankan ditunjukkan pada gambar 4.2, serta bidang Games ditunjukkan pada gambar 4.3.

Gambar 4.1 Data Analitik Trend Aplikasi e-Commerce

Page 35: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

35

Gambar 4.2 Data Analitik Trend Aplikasi Perbankan

Gambar 4.3 Data Analitik Trend Aplikasi Games

Page 36: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

36

4.2 Pembuatan Dashboard dengan Tableau

Pada tahap ini dilakukan proses pembuatan dashboard trend

Apps name pengguna indihome di Indonesia dengan menambahkan keterangan informasi terhadap visualisasi data yang telah dilakukan.

Infografis dashboard pada bidang trend Apps name Communications

ditunjukkan pada gambar 4.4, sedangkan infografis dashboard pada bidang trend Apps name eCommerce ditunjukkan pada gambar 4.5

sebagai berikut :

Gambar 4.4 Design infografis di bidang Communications

Page 37: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

37

Gambar 4.5 Design infografis di bidang eCommerce

4.3 Ekstraksi Data Trend Apps Name

Pada tahap ini dilakukan prosesekstraksi data yaitu melakukan

ekstraksi join data dengan apache hive,mengambil hasil ekstrak data dengan filezilla, melakukan import data dengan pentahoo, dan

menggabungkan data dengan sql postgresql.

4.3.1. Ekstraksi Data Dengan Apache Hive

Pada tahap ini dilakukan proses untuk membuat bash script

menggunakan modul apache hive yang terdapat di terminal server. Kami mengambil data sesuai kategori (Communication dan banking)

satu persatu dan diambil sesuai bulan yang dibutuhkan. Template

bash script untuk mendapatkan data pada kategori Communications ditunjukkan pada gambar 4.5, template bash script kategori

eCommerce ditunjukkan pada gambar 4.6, template bash script

kategori Games ditunjukkan pada gambar 4.7, template bash script

kategori Banking ditunjukkan pada gambar 4.8 sebagai berikut :

Page 38: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

38

Gambar 4.6 Template Bash Script Create Tabel Komunikasi

Gambar 4.7 Template Bash Script Create Tabel eCommerce

Gambar 4.8 Template Bash Script Create Tabel Games

Gambar 4.9 Template Bash Script Create Tabel Banking

4.3.2 Pemindahan hasil bash dari server ke local Pada tahap ini dilakukan proses pemindahkan data dari server

ke local menggunakan filezilla ditunjukkan pada gambar 4.10

sebagai berikut :

Page 39: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

39

Gambar 4.10 Pemindahan CSV dari Server ke Local

4.3.3 Import csv ke database

Untuk melakukan import ke database postgresql, platform

yang digunakaan adalah hadoop, dimana apps ini mendukung sercara optimal untuk melakukan perpindahan data ke database

dalam skala besar. Import csv ke database menggunakan Pentahoo

ditunjukkan pada gambar 4.11 sebagai berikut :

Gambar 4.11 import csv ke database menggunakan Pentahoo

Page 40: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

40

4.3.4 Menggabungkan tabel

Setalah meimport csv ke database, langkah selanjutnya adalah

melakukan penggabungan semua bulan pada tabel kategori yang ditargetkan. Berikut adalah query untuk melakukan penggabungan

bulan pada kategori yang sama ditunjukkan pada gambar 4.12

sebagai berikut:

Gambar 4.12 Sql syntaq untuk penggabungan tabel Games

Pada gambar 4.12 adalah contoh query penggabungan tabel kategori Games. Untuk menggabungkan tabel, tabel yang diimport

adalah semua bulan menjadi 1 kategori yang sama.

4.4 Data Preparation

Pada tahap ini dilakukan proses data preparation dengan mendapatkan data dari pdf dan melakukan cleansing data agar data

tersebut lengkap dan dapat diproses untuk diolah dengan baik.

4.4.1 Crawling data dari pdf

4.4.1.1 Mengimport library yang dibutuhkan dapat dilihat pada

gambar 4.13 sebagai berikut :

Gambar 4.13 Import library

Page 41: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

41

4.4.1.2 Menginisiasi variabel page yang ingin dicetak dan

pembuatan direktori untuk menyimpan hasil output. Inisialisasi variable page dapat dilihat pada gambar 4.14 sebagai berikut :

Gambar 4.14 Inisialisasi variable page

4.4.1.3 Melakukan convert dari pdf ke csv page per page pada case

ini output dari file csv per page disimpan didalam direktori. Convert data dari pdf ke csv dapat dilihat pada gambar 4.15 sebagai berikut:

Gambar 4.15 Convert dari pdf ke csv page per page

4.4.1.4 Menggabungkan file csv tersebut menjadi 1, dapat dilihat

pada gambar 4.16 sebagai berikut :

Gambar 4.16 Menggabungkan file CSV

4.4.1.5 Membuka file csv tersebut dan menyimpannya dalam

sebuah array.dan menggabungkannya dapat dilihat pada gambar

4.17 sebagai berikut :

Gambar 4.17 Membuka file CSV dan menyimpan ke dalam array

Page 42: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

42

4.4.1.6 Merename dan menata ulang column menggunakan pandas

dapat dilihat pada gambar 4.18 sebagai berikut :

Gambar 4.18 Rename kolom

4.4.1.7 Melakukan filter menghilangkan id_kelurahan null

menggunakan pandas dan menampilkannya dapat dilihat pada

gambar 4.19 sebagai berikut :

Gambar 4.19 Rename kolom dan menghilangkan null pada id_kel

4.4.1.8 Melakukan export file ke csv dapat dilihat pada gambar 4.20

sebagai berikut :

Gambar 4.20 Export file ke CSV

Page 43: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

43

4.4.2 Data Cleansing

4.4.2.1 Mengimport library yang dibutuhkan dan melakukan inisiasi variabel dapat dilihat pada gambar 4.21 sebagai berikut :

Gambar 4.21 Import library

4.4.2.2 Melakukan import data dari csv dapat dilihat pada gambar

4.22 dan menampilkan informasi tabel dapat dilihat pada gambar 4.23 sebagai berikut :

Gambar 4.22 Import data dari csv

Gambar 4.23 Menampilkan informasi tabel

4.4.2.3 Mengisi data kosong pada kolom kabupaten dan kecamatan

dapat dilihat pada gambar 4.24, dan menampilkan informasi tabel dapat dilihat pada gambar 4.25 sebagai berikut :

Gambar 4.24 Mengisi data kosong pada kolom

Page 44: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

44

Gambar 4.25 Menampilkan informasi tabel

4.4.2.4 Menyeleksi kolom kelurahan sesuai dengan output yang diminta dengan menghilangkan id_kelurahan yang digit kurang dari

11, karena data yang valid yang memiliki lebih dari 10 digit.

Menyeleksi kolom id_kelurahan dapat dilihat pada gambar 4.26 sebagai berikut :

Gambar 4.26 Menyeleksi kolom id_kelurahan

4.4.2.5 Menghilangkan integer pada kolom desa, kelurahan,

kecamatan, dan kabupaten dengan menghilangkan noise integer dan \r pada kolom kabupaten, kecamatan, kelurahan, dan desa.

Menghilangkan noise integer dapat dilihat pada gambar 4.27 dan

menampilkan informasi tabel dapat dilihat pada gambar 4.28 sebagai berikut :

Gambar 4.27 Menghilangkan noise integer

Page 45: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

45

Gambar 4.28 Menampilkan informasi tabel

4.4.2.6 Menambahkan kolom provinsi yang diisi oleh variabel

provinsi dan membuat kolom keterangan berisi keterangan row

apakah kelurahan atau desa dapat dilihat pada gambar 4.29 sebagai berikut :

Gambar 4.29 Menambahkan kolom provinsi dan keterangan

4.4.2.7 Split string dari id_dukcapil untuk mendapatkan id

kabupaten, kecamatan dan kelurahan dapat dilihat pada gambar 4.30

sebagai berikut :

Gambar 4.30 Split string id_dukcapil

Page 46: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

46

4.4.2.8 Menambahkan kolom kelurahan_desa yang merupakan

gabungan dari kolom desa dan kelurahan dapat dilihat pada gambar 4.31 sebagai berikut :

Gambar 4.31 Menambahkan kolom kelurahan_desa

4.4.2.9 Mengambil dan menyimpan kolom yang diperlukan dapat

dilihat pada gambar 4.32 sebagai berikut :

Gambar 4.32 Mengambil dan menyimpan kolom yang diperlukan

4.4.2.10 Melihat output akhir dari dataframe dapat dilihat pada gambar

4.33 sebagai berikut :

Gambar 4.33 Menampilkan output akhir dari dataframe

4.4.2.11 Melakukan export dataframe ke file csv dapat dilihat pada

gambar 4.32 sebagai berikut :

Gambar 4.34 Export dataframe ke file csv

Page 47: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

47

4.5 Menggabungkan Tabel

Pada tahap ini dilakukan proses penggabungkan hasil dari

tabel master dukcapil yang telah di cleansing dengan data baru yang memiliki longitude dan latitude yang memiliki id berbeda tetapi

memiliki nama kelurahan dan kabupaten yang mirip dan beberapa

tidak identik. Informasi tabel longitude dan latitude dapat dilihat

pada gambar 4.35, dan informasi tabel master dukcapil dapat dilihat pada gambar 4.36 sebagai berikut :

Gambar 4.35 Informasi tabel longitude dan latitude

Gambar 4.36 Tabel master dukcapil

4.5.1. Melakukan import library dan file csv

Gambar 4.37 Import library dan file csv

Page 48: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

48

4.5.2. Melakukan pembuatan kolom baru yang berisi pengurangan

kata pada kolom kabupaten_kota dan kecamatan, dan pengkapitalisasi string kolom ke 7 yang berisi nama kabupaten serta

menghilangkan duplikasi tabel dukcapil agar data ringan saat

menjalankan script s. Membuat kolom baru dapat dilihat pada gambar 4.38 sebagai berikut :

Gambar 4.38 Membuat kolom baru

4.5.3. Menggabungkan kedua tabel menjadi satu berdasarkan nama

kecamatan dan kabupaten yang sama menggunakan library similarity fuzzywuzzy,dimana yang memiliki similarity lebih dari

40% akan diambil dan dicari yang tertinggi di kolom kabupaten dan

kecamatan. Penggabungan kedua tabel dapat dilihat pada gambar 4.39 sebagai berikut :

Page 49: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

49

Gambar 4.39 Menggabungkan dua tabel

Page 50: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

50

4.5.4. Menampilkan informasi data dari penggabungan tabel dapat

dilihat pada 4.40 sebagai berikut :

Gambar 4.40 Menampilkan tabel

4.5.5. Mengambil kolom penting dan mengexportnya menjadi csv dapat dilihat pada gambar 4.41 sebagai berikut :

Gambar 4.41 Export to csv

Page 51: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

51

[Halaman ini sengaja dikosongkan]

Page 52: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

52

BAB V

PENGUJIAN DAN EVALUASI

Bab ini menjelaskan tahap uji coba dilakukan terhadap

visualisasi data tableu, script python, fungsi query yang telah kami buat sebagai berikut :

5.1. Tujuan Pengujian

Pengujian dilakukan dengan hasil visualisasi data berupa

informasi yang mudah dipahami serta script python. Pengujian juga

dilakukan dengan fungsi query terhadap tabel data yang telah

dimasukkan kedalam database yang bertujuan untuk melakukan

perhitungan jumlah baris tabel total dan yang memiliki value null.

5.2 Kriteria Pengujian

Penilaian atas pencapaian tujuan pengujian didapatkan dengan

memperhatikan beberapa hasil yang diharapkan berikut ini:

- Melakukan data preparation berupa data integration, data

cleansing, dan data transformation untuk menghasilkan data

yang lengkap.

- Dengan visualisasi data, menghasilkan informasi data yang

akurat dan mudah untuk dipahami oleh masyarakat.

- Hasil visualisasi data berhasil di publish dengan baik di

website Data Exchange (DX).

- Menghilangkan noisy data dan mengisi missing value pada

data.

5.3 Skenario Pengujian

Skenario pengujian dilakukan dengan melakukan query perhitungan row dan null terhadap data yang telah dimasukkan

kedalam database.

1. Hasil Pengujian

Terdapat hasil dari code yang telah dibuat pada Bab IV sebelumnya sebagai berikut :

Page 53: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

53

- Data Visualization Hasil implementasi visualisasi data berupa data analitik trend apps

name (salah satunya di bidang Games) dapat dilihat pada gambar 5.1

dan visualisasi berupa pembuatan dashboard infografis dapat dilihat

pada gambar 5.2 sebagai berikut :

Gambar 5.1 Contoh Salah Satu Data Analitik Trend Apps Name

Gambar 5.2 Contoh Salah Satu Design Infografis Apps Name

Page 54: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

54

- Data Preparation

Hasil implementasi Data preparation atau persiapan data berupa

ekstrasi data dengan hive dapat dilihat pada gambar ,

Gambar 5.3 Ekstraksi Data dengan Hive

Gambar 5.4 Penggabungan tabel tiap bulan pada masing” kategori

Pada tahap ini juga dilakukan proses data preparation dengan mendapatkan data dari pdf dan melakukan cleansing data agar data

tersebut lengkap dan dapat diproses serta diolah dengan baik. Hasil

implementasi tersebut dapat dilihat pada gambar 5.5 yaitu output file

setelah dilakukan proses data preparation sebagai berikut:

Gambar 5.5 Output Setelah Proses Cleansing Data

Page 55: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

55

Pada tahap ini diperlukan proses penggabungan kedua tabel berdasarkan nama kecamatan dan kabupaten yang sama menggunakan library similarity fuzzywuzzy. Hasil output akhir dapat dilihat pada gambar 5.6 sebagai berikut :

Gambar 5.6 Output Akhir dari Dataframe

2. Evaluasi Pengujian

Hasil evaluasi pengujian hasil implementasi dapat dilihat pada

tabel 5.1 kriteria dan hasil pengujian sebagai berikut :

Tabel 5.1. Kriteria dan Hasil Pengujian

No. Kriteria Pengujian Hasil

Pengujian

1. Melakukan data preparation berupa data

integration, data cleansing, dan data

transformation untuk menghasilkan data

yang lengkap.

Terpenuhi

2. Menghilangkan noisy data dan mengisi

missing value pada data.

Terpenuhi

3. Dengan melakukan visualisasi data,

menghasilkan informasi data yang

akurat dan mudah untuk dipahami oleh

masyarakat.

Terpenuhi

4. Hasil visualisasi data berhasil di publish

dengan baik di website Data Exchange

(DX).

Terpenuhi

Page 56: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

56

[Halaman ini sengaja dikosongkan]

Page 57: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

57

BAB VI

KESIMPULAN DAN SARAN

6.1. Kesimpulan

Kesimpulan yang diperoleh setelah melakukan proses

data preparation dan data visualization pada Data Exchange

(DX) Telkom DDS adalah sebagai berikut :

1. Membuat visualisasi berupa infografis telah sesuai dengan

proses bisnis dan permintaan perusahaan, sehingga

informasi mudah dipahami oleh masyarakat.

2. Seluruh hasil visualisasi data berhasil di publish dalam

server Tableau Data Exchange (DX) PT Telkom Indonesia.

3. Pembuatan berbagai data parameter melalui data

preparation tergolong lengkap dan baik sehingga siap

untuk digunakan dan diolah dengan baik untuk visualisasi

ataupun pengolahan data lainya.

4. Telah melakukan proses data preparation dan data

cleansing sehingga kualitas data menjadi lebih baik dan

lengkap.

6.2. Saran

Saran yang penulis berikan untuk pembuatan parameter

dan visualisasi data yaitu persiapan data parameter yang

lengkap sangat diperlukan untuk melakukan visualisasi data,

oleh karena itu untuk pembuatan data parameter, diperlukan

pengalaman eksplorasi data agar data parameter yang akan

diolah baik dan lengkap.

Page 58: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

58

[Halaman ini sengaja dikosongkan]

Page 59: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

59

DAFTAR PUSTAKA

[1] Telkom, “Telkom Indonesia”, [Online]

https://id.wikipedia.org/wiki/Telkom_Indonesia [Accessed 8 Oktober 2020]

[2] Python, “Pandas”, [Online]

https://medium.com/@16611092/mengenal-pandas-dalam-python-cc66d0c5ea40

[Accessed 8 Oktober 2020]

[3] Python, “numpy”, [Online]

https://medium.com/@yasirabd/pengenalan-numpy-pandas-matplotlib-b90bafd36c0

[Accessed 8 Oktober 2020]

[4] Python, “tqdm”, [Online]

https://www.codepolitan.com/5-modul-python-yang-wajib-anda-

coba

[Accessed 8 Oktober 2020]

Page 60: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

60

[Halaman ini sengaja dikosongkan]

Page 61: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

61

BIODATA PENULIS I

Nama : Isnaini Nurul KurniaSari

Tempat, Tanggal Lahir : Sukoharjo, 26 Juni 1999 Jenis Kelamin : Perempuan

Agama : Islam Status : Belum menikah

Alamat Asal : Gabusan RT 01/05 Kel Jombor, Kec Bendosari, Kab Sukoharjo, Jawa Tengah

Alamat Surabaya : -

Telepon : 085735632955 Email : [email protected]

PENDIDIKAN FORMAL 2017 – sekarang : Mahasiswa S1 Teknik Informatika ITS

2014 – 2017 : SMA Negeri 1 Sukoharjo

2012 – 2014 : SMP Negeri 1 Sukoharjo

2006– 2012 : SD Negeri Gayam 1

KEMAMPUAN

Programming (C, C++, Python, Java)

Software Microsoft (Microsoft Word, Excel, dan PowerPoint)

Data Analytics (Python)

Data Science (Python)

Business Intelligence (Python)

Web Programming (HTML, PHP, CSS, Javascipt)

Database Manajemen (Oracle, MySQL, Pentahoo, Hadoop)

DataVisualization (Tableau)

Bahasa (Indonesia, Inggris)

AKADEMIS

Kuliah : Departemen Teknik Informatika – Fakultas Teknologi Elektro dan Informatika Cerdas

Page 62: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

62

(ELECTICS) Institut Teknologi Sepuluh

Nopember Surabaya

Angkatan 2017 Semester : 7 (Tujuh) IPK : 3.59 (Semester 6)

Page 63: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

63

[Halaman ini sengaja dikosongkan]

Page 64: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

64

BIODATA PENULIS II

Nama : Zahrul Zizki Dinanto

Tempat, Tanggal Lahir : Grobogan, 14 Agustus 1998 Jenis Kelamin : Laki-laki

Agama : Islam Status : Belum menikah

Alamat Asal : Perumahan Griya Praja Indah RT 02 RW

23, Kel Kuripan, Kec Purwodadi, Kab Grobogan, Jawa Tengah

Alamat Surabaya : -

Telepon : 082137594134 Email : [email protected]

PENDIDIKAN FORMAL 2017 – sekarang : Mahasiswa S1 Teknik Informatika ITS

2014 – 2017 : SMA Negeri 1 Purwodadi

2012 – 2014 : SMP Negeri 1 Purwodadi 2006– 2012 : SD Negeri 12 Purwodadi

KEMAMPUAN

Programming (C, C++, Python, Java)

Software Microsoft (Microsoft Word, Excel, dan PowerPoint)

Data Analytics (Python)

Data Science (Python)

Business Intelligence (Python)

Web Programming (HTML, PHP, CSS, Javascipt)

Database Manajemen (Oracle, MySQL, Pentahoo, Hadoop)

DataVisualization (Tableau)

Bahasa (Indonesia, Inggris)

AKADEMIS

Kuliah : Departemen Teknik Informatika – Fakultas Teknologi Elektro dan Informatika Cerdas

Page 65: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

65

(ELECTICS) Institut Teknologi Sepuluh

Nopember Surabaya

Angkatan 2017 Semester : 7 (Tujuh) IPK : 3.46 (Semester 6)

Page 66: PT. TELEKOMUNIKASI INDONESIA, Tbk DIVISI DIGITAL SERVICE …

66