Crawl or Mining Twitter with Rstudio

17
MINING TWITTER MENGGUNAKAN RSTUDIO 1 linkedin.com/in/apakabarnizam

Transcript of Crawl or Mining Twitter with Rstudio

Page 1: Crawl or Mining Twitter with Rstudio

MINING TWITTER MENGGUNAKAN RSTUDIO

1

linkedin.com/in/apakabarnizam

Page 2: Crawl or Mining Twitter with Rstudio

2

DATA SCIENCE PROCESS

Page 3: Crawl or Mining Twitter with Rstudio

3

ANDA AKAN BELAJAR DI AREA INI

Page 4: Crawl or Mining Twitter with Rstudio

Ada beberapa tahapan yang perlu diiku2 :

1. Anda perlu menda7ar akun twi9er, lewa2 jika sudah memiliki akun.

2. Memiliki API (Applica2on Programming Interface), dengan cara menda7arkan diri anda sebagai pengembang aplikasi twi9er.

3. Memiliki RStudio dan beberapa package yang diperlukan.

4. Melakukan proses oten2fikasi dan verifikasi.

5. Mengambil Data dari Twi9er dengan kriteria yang anda inginkan (batasan waktu, 2meline seseorang, hashtagh, lokasi, dll..)

4

BAGAIMANA CARA MENDAPATKAN DATA DARI TWITTER?

Page 5: Crawl or Mining Twitter with Rstudio

MARI LAKUKAN LANGKAH2 DISLIDE SEBELUMNYA

5

Kecuali nomor satu ya, karna pas2 anda sudah memilikinya :)

Page 6: Crawl or Mining Twitter with Rstudio

1. Sign in ke akun twi9er anda (pas2kan email dan mobile phone sudah terverifikasi).

2. Buka h9ps://apps.twi9er.com/app/new

3. Sign In API Development for Applica2on on Twi9er

4. Isilah informasi yang diminta, kemudian klik “Agree”

Catatan:

1. Jika terjadi warning maka pas2kan email dan mobile phone sudah terverifikasi.

2. Pas2kan penulisan Url menggunakan awalan h/p://

6

2. MEMBUAT API

Page 7: Crawl or Mining Twitter with Rstudio

7

CONTOH PENGISIAN DATA

Page 8: Crawl or Mining Twitter with Rstudio

Setelah berhasil menda7ar, klik Keys and access tokens scrool ke bawah page. Lalu klik Create My Access Token.

8

LANJUTAN API

Page 9: Crawl or Mining Twitter with Rstudio

3. PACKAGE -RSTUDIO

9

h/r

package yg berguna untuk mongkoneksikan Rstudio ke internet.

twi/eR

package yang berguna untuk mengcrawl data twi9er.

Package adalah, kumpulan syntax/perintah yang dibuat developer. anda membutuhkan 2 package untuk mengcrawl data:

Page 10: Crawl or Mining Twitter with Rstudio

CARA INSTALL DAN MENGAKTIFKAN PACKAGE

10

+

#01

#02

install.packages(“NamaPackage") perintah/syntax untuk menginstal package.

contoh: install.packages("twitteR")

library(“NamaPackage") perintah/syntax untuk meng-aktif-kan package.

contoh: library("twitteR")

Page 11: Crawl or Mining Twitter with Rstudio

11

4. OTENTIFIKASI DAN VERIFIKASI

setup_twi/er_oauth("ConsumerKey", "ConsumerSecretKey", "AccessToken", "AccessSecretToken")

perintah/syntax untuk untuk oten2fikasi dan verifikasi, sebagai berikut:

Page 12: Crawl or Mining Twitter with Rstudio

12

5. MENGAMBIL DATA

tweets <- searchTwi/er(“macet”, n=500)

perintah/syntax untuk untuk mengambil data dari 1 kata.

perintah/syntax untuk untuk mengambil data lebih dari 2 kata.tweets <- searchTwi/er(“bandung AND macet”, n=200)

perintah/syntax untuk untuk mengambil data lebih dari 2 object dengan 1 kata.

tweets <- searchTwi/er(“bandung OR jakarta AND macet”, n=3200) tweets <- searchTwi/er(“telkomsel OR axis AND sinyal”, n=1600)

Page 13: Crawl or Mining Twitter with Rstudio

13

5.1. MENYIMPAN DATA CRAWL

tweets <- twListToDF(tweets)silahkan run perintah/syntax twListToDF untuk merubah values menjadi data

Setelah anda menjalankan perintah/syntax searchTwi/er, maka akan muncul seper2 ini:

maka akan berubah menjadi seper2 ini:

Jika ingin melihat data, gunakan perintah View() dan jika ingin menyimpan data gunakan perintah write.csv().

Page 14: Crawl or Mining Twitter with Rstudio

14

NOTES PENTING1. Anda hanya bisa meng-crawl 10 hari terakhir dari twi9er. 2. Jika setelah me-run searchTwi/er() dan terjadi warning seper2 berikut:

tenang, jangan khawa2r. itu menandakan bahwa data dengan kata kunci yang anda inginkan 2dak tersedia dan atau 2dak mencapai target yang anda minta.

3. jangan lupa melakukan perintah setwd() diawal script, agar 2dak kebingungan mencari hasil data crawl.

Page 15: Crawl or Mining Twitter with Rstudio

15

SAATNYA MEMPRAKTEKAN

Page 16: Crawl or Mining Twitter with Rstudio

16

LATIHAN1. Buatlah script seper2 dibawah ini.

2. Kata kunci (pada line 8) boleh anda gan2 sesuai yg anda inginkan.

Page 17: Crawl or Mining Twitter with Rstudio

17

PEKERJAAN RUMAH KODE 41. Buatlah kelompok yang beranggota 3 orang. 2. Buatlah dataset dari Perusahaan besar di Indonesia dengan syarat

dan R script nya jgn lupa dikumpulkan.

Paling lambat H-2 sebelum kelas bigdata ke: bit.ly/yaampuntugasbigdata

Penamaan file: harikelasbigdata_jammasuk_Kodetugas_namakelompok contoh: senin_0930_Pekerjaan41_Atambu.csv senin_0930_pekerjaan42_Atambu.r