Penerapan Tf-Idf
-
Upload
jepriana-wayan -
Category
Documents
-
view
212 -
download
0
Transcript of Penerapan Tf-Idf
8/16/2019 Penerapan Tf-Idf
http://slidepdf.com/reader/full/penerapan-tf-idf 1/2
Examples
Solve a simple quadratic programming problem: find values of x that minimize
f ( x )=12 x 21+ x
22− x
1 x 2−2 x
1−6 x
2,
subject to
x 1 + x 2 ≤ 2
– x 1 + 2 x 2 ≤ 2
2 x 1 + x 2 ≤ 3
≤ x 1! ≤ x 2"
#n matri$ notation this is
f ( x )=12 x
T Hx +f
T x ,
Terdapat dua fitru yang dapat dipilih dalam melakukan klasifikasi sentimen, yaitu term
frequency (laplace smoothing ) dan TF-IDF. Misalkan terdapat 3 buah teet yang terdapat
pada tabel berikut
!" Teet #ersih $elas Frekuensi $emunculan
% &cer murah meriah '"sitif &cer(%), murah (%), meriah(%)
inyal telk"msel *elek *elek !egati
f
inyal(%), telk"msel(%), *elek()
3 &syik kup"n gratis belan*a '"sitif &syik(%), kup"n(%), gratis(%),
belan*a(%)
+ $up"n belan*a murah $up"n(%), belan*a(%), murah(%)
Dari kumpulan teet di atas akan terbentuk tweet term matrix berdasarkan kata unik yang
muncul dalam kumpulan teet. Tweet term matriks dapat dilihat pada tabel berikut
!".
Teet
&cer Murah inyal Telk"msel elek &syik $up"n ratis #elan*a
% % % %
% %
3 % % % %
+ % % %
/amgkah selan*utnya adalah membuat m"del klasifikasi dengan melakukan perhitungan
menggunakan fitur term frequency (laplace smoothing ) dan TF-IDF.
a. term frequency (laplace smoothing )
8/16/2019 Penerapan Tf-Idf
http://slidepdf.com/reader/full/penerapan-tf-idf 2/2
dari matriks tersebut kemudian dihitung dengan menggunakan persamaan (3.%)
sehingga setiap kemunculan kata dalam teet tersebut diubah men*adi nilai term
frequency (laplace smoothing ). #erikut adalah c"nt"h perhitungan term frequency
(laplace smoothing ) untuk kata 0*elek1 pada teet 2
*umlah kata unik ("cabulary) 4 %5, *umlah kata pada kelas p"sitif 4 6 dan *umlah
kata pada kelas negatif4+ pr"babilitas kata 0*elek1 pada kelas p"sitif 4 57%867%5 4 5,59:
pr"babilitas kata 0*elek1 pada kelas negatif 4 7%8+7%545,%+
apabila pr"ses perhitungan tersebut dilakukan pada semua teet dan semua term
maka akan diper"leh matriks perhitungan term frequency (laplace smoothing ) seperti
pada tabel
$elas '(c) '(t8c)
&cer Murah Meriah inyal Telk"msel elek &syik $up"
n
ratis belan*a
'"sitif 83 5,%%; 5,%%; 5,%%; 5,59: 5,59: 5,59: 5,%%; 5,%%; 5,%%; 5,%%;
!egatif %83 5,56% 5,56% 5,56% 5,%+3 5,%+3 5,%+ 5,56% 5,56% 5,56% 5,56%
etelah pembatan m"del klasifikasi selesai dilakukan, langkah terakhir yang
dilakukan adalah penentuan kelas untuk teet + menggunakan persamaan (3.;).
' (p"sitif8teet +) 4 83 < (5,%%;) < (5,%%;) < (5,%%;) 4 5,55%5:9
' (negatif8teet +) 4 %83 < (5,56%) < (5,56%) < (5,56%) 4 5,555%%;
Teet + diklasifikasikan dalam sentimen kelas p"sitif.
b. TF-IDF
=ntuk b"b"t k"ndisi"nal menggunakan TF-IDF, maka akan digunakan persamaan
(3.%+). berikut adalah c"nt"h perhitungan TF-IDF untuk kata 0*elek1 pada teet 2
*umlah kata pada kelas negatif 4 +
#"b"t kata 0*elek1 pada kelas p"sitif 4 l"g 57%867%5 4 l"g 5,59: 4 -%,:
#"b"t kata 0*elek1 pada kelas negatif 4 l"g 7%8+7%5 4 l"g 5,%+ 4 -5,>6
&pabila pr"ses perhitungan tersebut dilakukan pada semua teet dan semua term
maka akan diper"leh matriks perhitungan TF-IDF seperti tabel
$elas 'ri"r '(t8c)
&cer Murah Meriah inyal Telk"msel elek &syik $up"
n
ratis belan*a
'"sitif -5,%6> -5,:; -5,:; -5,:; -%,: -%,: -%,: -5,:; 5,:; 5,:; 5,:;
!egatif -5,+66 -%,%+: %,%+: %,%+: -5,;+9 -5,;+9 -5,>6 -%,%+: %,%+: %,%+: %,%+:
etelah pembuatan m"del pada tabel tersebut maka langkah terakhir dilakukan penentuan kelas untuk teet + menggunakan persamaan (3.:)
#"b"t teet + dalam kelas p"sitif 4 (-5,%6>) 7 ((-5,:;) 7 (-5,:;) 7 (-5,:;)) 4
-,:>5
#"b"t teet + dalam kelas negatif 4 (-5,+66) 7 ((-%,%+:) 7 (-%,%+:) (-%,%+:)) 4 -3,:+
Teet + diklasifikasikan dalam sentimen kelas p"sitif.