Penerapan Tf-Idf

2
8/16/2019 Penerapan Tf-Idf http://slidepdf.com/reader/full/penerapan-tf-idf 1/2 Examples Solve a simple quadratic programming problem: find values of x that minimize (  x )= 12  x 21 +  x 22  x 1  x 2 −2  x 1 −6  x 2 , subject to  x 1 +  x 2 ≤ 2  –  x 1 + 2  x 2 ≤ 2 2  x 1 +  x 2 ≤ 3  x 1! ≤  x 2" #n matri$ notation this is (  x )= 12  x Hx + x , Terdapat dua fitru yang dapat dipilih dalam melakukan klasifikasi sentimen, yaitu term  frequency (laplace  smoothing ) dan TF-IDF. Misalkan terdapat 3 buah teet yang terdapat  pada tabel berikut  !" Teet #ersih $elas Frekuensi $emunculan % &cer murah meriah '"sitif &cer(%), murah (%), meriah(%) inyal telk"msel *elek *elek !egati inyal(%), telk"msel(%), *elek() 3 &syik kup"n gratis belan*a '"sitif &syik(%), kup"n(%), gratis(%),  belan*a(%) + $up"n belan*a murah $up"n(%), belan*a(%), murah(%) Dari kumpulan teet di atas akan terbentuk tweet term matrix  berdasarkan kata unik yang muncul dalam kumpulan teet. Tweet term matriks dapat dilihat pada tabel berikut  !". Teet &cer Murah inyal Telk"msel elek &syik $up"n ratis #elan*a % % % % % % 3 % % % % + % % % /amgkah selan*utnya adalah membuat m"del klasifikasi dengan melakukan perhitungan menggunakan fitur term frequency (laplace smoothing ) dan TF-IDF. a. term frequency (laplace smoothing )

Transcript of Penerapan Tf-Idf

Page 1: Penerapan Tf-Idf

8/16/2019 Penerapan Tf-Idf

http://slidepdf.com/reader/full/penerapan-tf-idf 1/2

Examples

Solve a simple quadratic programming problem: find values of x that minimize

f ( x )=12 x 21+ x 

22− x 

1 x 2−2 x 

1−6 x 

2,

subject to

 x 1 +  x 2 ≤ 2

 – x 1 + 2 x 2 ≤ 2

2 x 1 +  x 2 ≤ 3

≤  x 1! ≤  x 2"

#n matri$ notation this is

f ( x )=12 x 

T Hx +f 

T  x ,

Terdapat dua fitru yang dapat dipilih dalam melakukan klasifikasi sentimen, yaitu term

 frequency (laplace  smoothing ) dan TF-IDF. Misalkan terdapat 3 buah teet yang terdapat

 pada tabel berikut

 !" Teet #ersih $elas Frekuensi $emunculan

% &cer murah meriah '"sitif &cer(%), murah (%), meriah(%)

inyal telk"msel *elek *elek !egati

inyal(%), telk"msel(%), *elek()

3 &syik kup"n gratis belan*a '"sitif &syik(%), kup"n(%), gratis(%),

 belan*a(%)

+ $up"n belan*a murah $up"n(%), belan*a(%), murah(%)

Dari kumpulan teet di atas akan terbentuk tweet term matrix  berdasarkan kata unik yang

muncul dalam kumpulan teet. Tweet term matriks dapat dilihat pada tabel berikut

 !".

Teet

&cer Murah inyal Telk"msel elek &syik $up"n ratis #elan*a

% % % %

% %

3 % % % %

+ % % %

/amgkah selan*utnya adalah membuat m"del klasifikasi dengan melakukan perhitungan

menggunakan fitur term frequency (laplace smoothing ) dan TF-IDF.

a. term frequency (laplace smoothing )

Page 2: Penerapan Tf-Idf

8/16/2019 Penerapan Tf-Idf

http://slidepdf.com/reader/full/penerapan-tf-idf 2/2

dari matriks tersebut kemudian dihitung dengan menggunakan persamaan (3.%)

sehingga setiap kemunculan kata dalam teet tersebut diubah men*adi nilai term

 frequency (laplace  smoothing ). #erikut adalah c"nt"h perhitungan term frequency

(laplace smoothing ) untuk kata 0*elek1 pada teet 2

 *umlah kata unik ("cabulary) 4 %5, *umlah kata pada kelas p"sitif 4 6 dan *umlah

kata pada kelas negatif4+ pr"babilitas kata 0*elek1 pada kelas p"sitif 4 57%867%5 4 5,59:

 pr"babilitas kata 0*elek1 pada kelas negatif 4 7%8+7%545,%+

apabila pr"ses perhitungan tersebut dilakukan pada semua teet dan semua term

maka akan diper"leh matriks perhitungan term frequency (laplace smoothing ) seperti

 pada tabel

$elas '(c) '(t8c)

&cer Murah Meriah inyal Telk"msel elek &syik $up"

n

ratis belan*a

'"sitif 83 5,%%; 5,%%; 5,%%; 5,59: 5,59: 5,59: 5,%%; 5,%%; 5,%%; 5,%%;

 !egatif %83 5,56% 5,56% 5,56% 5,%+3 5,%+3 5,%+ 5,56% 5,56% 5,56% 5,56%

etelah pembatan m"del klasifikasi selesai dilakukan, langkah terakhir yang

dilakukan adalah penentuan kelas untuk teet + menggunakan persamaan (3.;).

' (p"sitif8teet +) 4 83 < (5,%%;) < (5,%%;) < (5,%%;) 4 5,55%5:9

' (negatif8teet +) 4 %83 < (5,56%) < (5,56%) < (5,56%) 4 5,555%%;

Teet + diklasifikasikan dalam sentimen kelas p"sitif.

 b. TF-IDF

=ntuk b"b"t k"ndisi"nal menggunakan TF-IDF, maka akan digunakan persamaan

(3.%+). berikut adalah c"nt"h perhitungan TF-IDF untuk kata 0*elek1 pada teet 2

 *umlah kata pada kelas negatif 4 +

#"b"t kata 0*elek1 pada kelas p"sitif 4 l"g 57%867%5 4 l"g 5,59: 4 -%,:

#"b"t kata 0*elek1 pada kelas negatif 4 l"g 7%8+7%5 4 l"g 5,%+ 4 -5,>6

&pabila pr"ses perhitungan tersebut dilakukan pada semua teet dan semua term

maka akan diper"leh matriks perhitungan TF-IDF seperti tabel

$elas 'ri"r '(t8c)

&cer Murah Meriah inyal Telk"msel elek &syik $up"

n

ratis belan*a

'"sitif -5,%6> -5,:; -5,:; -5,:; -%,: -%,: -%,: -5,:; 5,:; 5,:; 5,:;

 !egatif -5,+66 -%,%+: %,%+: %,%+: -5,;+9 -5,;+9 -5,>6 -%,%+: %,%+: %,%+: %,%+:

etelah pembuatan m"del pada tabel tersebut maka langkah terakhir dilakukan penentuan kelas untuk teet + menggunakan persamaan (3.:)

#"b"t teet + dalam kelas p"sitif 4 (-5,%6>) 7 ((-5,:;) 7 (-5,:;) 7 (-5,:;)) 4

-,:>5

#"b"t teet + dalam kelas negatif 4 (-5,+66) 7 ((-%,%+:) 7 (-%,%+:) (-%,%+:)) 4 -3,:+

Teet + diklasifikasikan dalam sentimen kelas p"sitif.