Sentiment analysis
-
Upload
ike-kurniati -
Category
Data & Analytics
-
view
122 -
download
3
Transcript of Sentiment analysis
Sentiment Analysis- R-Twitter
Oleh:IkeKurniati M.Kom
1.Kebutuhan Sentiment Analysis2.Text Mining untuk Sentiment Analysis3.Pengolahan kata Text Mining menggunakan Machine
Learning4.Studi Kasus Sentiment Analysis
Overview
Sentiment Analisis
Goals:Audiencememahami arti,kebutuhan,tujuan dan ruang lingkup dari SentimentAnalysis
SocialMedia
BerbagiInformasi
Opini Publik
PeranPengawasan
• Meningkatnya penggunaan social media di masyarakat, berdampakpada bertambahnya peranberbagi infromasi di ruangpublic, yang selanjutnyamenyebabkan berkembangnyaopini publik.
• Kemudian hal tersebutdimanfaatkan menggunakanmetoda tertentu untuk tujuanpengawasan terhadap suatuobjek.
Kebutuhan Sentiment Analysis
SentimenAnalisis adalah jenis natural language yaitu pengolahan kata untuk melacak mood masyarakat tentang
produk atau topik tertentu. Analisis sentimen, disebut opinion mining.
Definisi Sentiment Analysis
(G.Vinodhini, M.Chandrasekaran 2012)
Keyword
Text Mining
Visual
Text sebagai Objekyang di proses menggunakan MetodaText Mining danhasilnya dalamrepresentasi Visual.
Ruang Lingkup
MenemukanKata kunci
10Destinasi Wisata yangdiprioritaskanoleh Kemenpar
PilkadaDKI Jakarta
Jadwal Ganjil Genap
Pemilihan Key Word
Pemilihah Sumber data Untuk sentiment. Pemilihan harusberdasar pada kegunaansosmed.
•Adafasilitas Repostyangmemilikiistilah Reshared, jadi kita langsungbisa mengutip sebuah statusdariteman yangada pada circlekita.Ini mirip seperti Retweet diTwitter•-Atur statusStatus yangkita buatbisa diatur apakah itu tidak bolehdishare kembali atau tidak bolehdikomentari.
G+
•mediabisnis onlinemelalui jaringanpertemanan yangtelah dimiliki.
• -Upload gambar mudah,dan bisa dibuatalbumfoto.
• -Terdapataplikasichatyangmembuatpanggunayangsedangonlinebisachatdengantemannyayangsedangonlinejuga.
• -Pengguna bisa membuat/bergabungdengan groupkesukaan/hobi/bisnis/pertemanan yangmemungkinkan pembagian informasi lebihspesifik,mudah, dan tepat sasaran.
•Menjangkau tidak hanya antara teman,tetapi komunikasi antara artis dengan fans-nya juga menjadi lebih mudah.
• -Komunikasi ditwitterterjadi sangat cepat.Sering terjadi berita-berita terupdate,seperti terjadinya suatu bencana misalnya,lebih dahulu didapatkan infonya melaluitwitter.
• -Terdapat fitur trendingtopicyangmemungkinkan kita untuk mengetahui apasaja yangsedang inatau happeningdibicarakan oleh parapengguna twitter.
• -Dapatmemasarkanproduksecarageratis.
•Memperindah foto kita•bisa menshare video•memasarkan produk atauberjualan online
•sharingapa saja yangkita mau,maupun itu lagu,curhatan, foto,tempat/lokasi kita berada.•Pathbersifat privasi,tidak sepertifacebook dan twitter•Pathmemiliki 8FreeFilter Lensesutk mempercantik foto/video
Path
http://suckrockers.blogspot.co.id/2013/12/sosial-media-beserta-kelebihan-dan.html
Pemilihan Sumber Data (Sosmed)
Text Mining untuk Sentiment Analysis
Goals:Audiencemengerti dan memahami apa yang
dimassud dengan tText Mining
Statistic
Artificial Intelligence
Pattern Recognition
Basis Data
Akar Ilmu
• Komputational• Visualisasi
Statistika
• MachineLearning
ArtificialIntelleigence
• Asosiasi• Sekuensial
PatternRecognition
• BasisData
BasisData
Definisi Text Mining
Text mining mengacu pada pencarian informasi, pertambangan data, mesin-learning, statistik, dan komputasi linguistic terhadap informasi yang disimpan sebagai teks(Bridge, C 2011).
Proses Text Mining
Data Teks Tokenisaisi
Sentimen Positif
Algoritma Machine Learning
Sentimen Negatif
End
Input Proses Output
Twitter data
Autentifikasi berdasarkan Token akun
Ekstrak berdasarkan
filter
Data Preparation
Visualisasi sentimen
analisis dalam Bentuk grafik
WEB Mining
•mengekstraksi katakunci yangterkandung pada dokumen web.Isidatawebantara laindapat berupateks,citra,audio,video,metadata,dan hyperlink.
WebContentMining
•struktur linkdari hyperlink•Membangun rangkuman websitedanhalaman web.•Salahsatu manfaatnya adlahuntuk menentukan pagerank padasuatu halaman web
WebStructureMining
•teknikuntukmengenaliperilakupelanggandanstrukturwebmelaluiinformasiyangdiperolehdarilog,clickstream,cookies,danquery
WebUsageMining
Pengolahan Text Miningmenggunakan Machine-Learning
Goals:Audiencemengetahui konsep Machine–Learning,Tugas,Carakerja dan AlgoritmaMachineLearning
Definisi “Machine Learning”
TomMitchel,1998
T:Task:Tugas;P:Performance:Nilaihasilkerja;E:Experience:Pengalaman
komputerdikatakanmelakukanlearning apabiladalammengerjakantugasT,hasilkerjanyaPsemakinbaik
denganbertambahnyapengalamanE
TugasSederhana Tugasrumit
Capaian yangdiinginkan Jelas Jelas
Uraian capaian Dapatdirinci Sulit dirinci
Cara mencapai Prosedurrumus
MemperkirakanCoba-coba
Sifatcapaian eksak Kira-kira
Cara dikomputer Pemrograman,algoritmakonvensional
Machinelearning
Tugas Sederhana & Tugas Rumit
Tugas Sederhana VS TugasRumit– Kelulusan Siswa
– Profit/Lost
– Suku Bunga Deposito
– Menentukan kadar gula dalam darah
– Prediksi harga saham
– Menentukan kalimat positif dannegatif
– Keindahan Gunung Bromo sangatmempesona
– Penduduk disekitar taman nasionalgunung bromo baik dan ramah
– Fasilitas dibukit pananjakan kurangmemadai
– Gunung Bromo banjir pengunjung
– Fasilitas ditempat itu tidak jelek
– Keindahan bukit mandalika selamaini tidak banyak yangtau
– Regresi
Input kontinyu/diskrit, output kontinyu, dengan targetspesifik
– Klasifikasi
Input kontinyu/diskrit, outputdiskrit, dengan target spesifik– Clustering
Input kontinyu/diskrit, outputdiskrit, dengan target terbuka
Jenis Tugas Machine-Learning
– Supervisedlearning
manusiamemberiseperangkatcontohhasilyangbenar,komputermenggunakancontohtersebutuntukmenemukanhasilbagidatamasukanlain
– Unsupervisedlearning
manusiatidakcampurtanganmemberikanjawabanyangbenar,komputerdibiarkanmenemukansendiripoladalamdatamasukan
– Reinforcedlearning
Mesinmencobalangkah-langkahdanmendapatumpanbalikpositifataunegatifpadasetiaplangkahtersebut
Jenis Cara Kerja Machine-Learning
– NaiveBayesian
Metodesederhanauntukklasifikasidenganjumlahdatasedikit,bertumpupadastatistikaprobabilitas
– SVM(Supportvectormachines)
klasifikasidengandatabesar&kompleksitastinggi,denganbanyakparametermasukan.Carakerjanyapersamaanjalurpemisahmatematisantarkelompokdata,denganmargingarispemisahsebesarmungkin
– Neuralnetwork
Klasifikasiuntukhalyangrumit
Algoritma Machine-Learning
R Package SentimentTimothy Jurka
R- Package Sentiment (classify)
R menyediakan library sentiment dalam R package yang dibuat oleh Timothy Jurka. Dalam package sentiment iniberfungsi dua fungsi yaitu classify_emotion danclassify_polarity.• classify_emotion. Fungsi ini membantumengklasifikasikan emotion kedalam beberapa klasifikasiyaitu: anger, fear, joy, sadness and supprise.
• classify_polarity. Mengkasifikasikan kedalam responpositive, negative dan neutral.
teknik analisis sentimen dapat diklasifikasikan ke dalam dua kategori:
• Lexicon based: Teknik ini bergantung pada kamus kata yangdijelaskan dengan orientasi, digambarkan sebagai polaritaspositive, negative dan netral. Metode ini memberikan hasil presisitinggi selama leksikon digunakan memiliki cakupan yang baik darikata-kata yang dihadapi dalam teks yang dianalisis.
• Learning Based: Teknik ini memerlukan pelatihan classifier dengancontoh polaritas dikenal disajikan sebagai teks diklasifikasikan kedalam kelas yang positif, negatif dan netral.
Teknik Analisis Sentiment
R- Package Sentiment
Classify_polarity.RClassify_emotion.RSubjectivity.csv.gzEmotion.csv.gz
Sentimen Analisis Menggunakan Text Mining Social Media Twitter sebagai
Controling Pasar Pariwisata Indonesia
Goals:Audienceturut berpartisipasi aktifdalamStudi Kasus
Identifikasi Masalah
MenentukanTopik Pilihan
MenentukanKeyords
MenentukanSumber datauntuk sentimen
TwitterNaïvebayes
Visualisasi
Data social media twitter dengan filter 10destinasi wisata yang akan diprioritaskanyaitu:
1. Danau Toba,2. Tanjung Kelayang,3. Kepulauan Seribu,4. Tanjung Lesung,5. Borobudur6. Tamana Nasional Bromo-Tengger-
Semeru,7. Mandalika,8. Wakataobi,9. Labuan Bajo dan10.Pulau Morotai.
Ruang Lingkup Studi Kasus
1. API2. Autentification3. Akuisisi Data4. Sentiment
Kebutuhan
MengapaDigunakan R ??
– R adalah bahasa pemrograman dan perangkat lunak untukanalisis statistikadan grafik
– Kode sumbernya tersedia secara bebas di bawah Lisensi PublikUmum GNU, dan versi biner prekompilasinya tersedia untuk berbagaisistemoperasi
– R menggunakan antarmuka baris perintah,
– R menyediakan berbagai teknik statistika (permodelan linier dannonlinier, uji statistik klasik, analisis deret waktu, klasifikasi,klasterisasi, dan sebagainya)
Tool
https://cran.r-project.org/web/packages/twitteR/twitteR.pdf
https://cran.r-project.org/web/packages/Rfacebook/Rfacebook.pdf
Reference Page
https://cran.r-project.org/web/packages/Rlinkedin/Rlinkedin.pdf
http://kbroman.org/pkg_primer/pages/build.html
SELESAI