Relevant data expansion for learning concept drift from sparsely labeled data

30
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING Relevant Data Expansion for Learning Concept Drift from Sparsely Labeled Data ! "#"$% &’ () * $) $ ) ) +, $ -, -,+. +%/0! -$% 1& ABSTRACT ! " #! "$% !" & ’! ( #& !($ % ( % !" 23.,’.

Transcript of Relevant data expansion for learning concept drift from sparsely labeled data

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

��

Relevant Data Expansion for Learning Concept Drift

from Sparsely Labeled Data ��

������������ ����

����� ��� ������������ ������������������� � � ������������������

���������� !��"�#"�$�%�

��&���� '������

�(�)��*���

$�)�������������� ����$��������������)�������)��+�����,�����$ � ��-��,���� �

-��,���� �+���.�+%��/0�!�-�$�%��

1��&�� ���������

ABSTRACT

�������� ���� �� �������� ��������� ��� � ����� ���� ��� �� �� ����� �� �� �����������

�������� ���� ������������������������������������������������������������������

����� �� �� ���������������������������� ������������ ����� ������������������

� ���� �������� ��������� � ������������������ �� ������ ���������� ���� ���� ���������

������ � � � ���� ����� ���� �������� � ���� � ������ ��� ���� �� � � ����������

��� ������� ������ !�� "��� � #��� !"$%� ������ �������� ���� ��������� �� ���������

�� ������� ��������� ����������� � � ����������������� ����������� ����� ��� ����

������ ������ ���� � ��� � � ���� ���� � ���� ������ � ����������� ��������� ���� ���������

��������� ��������������������� ������� ������������ !"����������������� ��� ���

���� ��� ������ �� � & �������� ����'!������ � (��������� �� #& �!($� �� ����%�

( ���� � �� ���� � ��� ���� �'����� � ������ ����� ������� �� ������ ����� �������

� � � � ������� ������� ��� ����%� ����� ������� � � ����� ��� ������ ���� ��� ������

��� !"���

���������2�����3�������� ���������.�����,��������'���.�������� ������� �������

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

!�

����"�4#�-5��#"�

�������'��� �������� )����� ���6 �6� ��������� ���� ������������ ������ �����'�������� �����)����

����� �������,�����������,�� �������� ���� �������� ������-������� ������� �������)� �����

��������� ���� ����������� ���� )� ������'�������,����'�������)�����)��������� �������,�����

�����)�,������������������'�� � )��������� �������������������������� �������� ��������������

)������.���� )���'��� � ���� ��� ������ ����� )�� �)������������� �� ���� ���,��� �����������

,� ��������������)����� ����

��������� )���,��� ������������ �� ���� �� ��������'������� �������������� ���� ������������)��

��1��� �����7�� ���������� ���� ���������������� )��� ���������8����������������'��������'����

� �� ��� ����� �� ��)��,�� ������������� � � �� ����� ��� ��,���9� ��� )���� ������ )��� ���������

������� )���,����'��� �������)���'����� ��:!�;:!�;:!!;:!<;: !;: ;: �;: =;��%� )���)�����'����

� �� ���� ����� �,����'��� ��� )�� ������� ���6��� ������ �����.� ��8������� ��'���� � �� ��� )���

������ ��� ����� � ���� ,��� ���)�'� �,��� >��� �7�����.� ������� ������ ��� �� '�� ���������� ��

���,��� )������,��������'��������� ����'��� )��� ��:�0;��� ������ �8��� ����'��� )� ����������

������ ���� ����������8���������������'����� ���������������� �� ����'������

��� )������������������ )���'�,�������.��)��)��������� �� )���������������� ��'� ��������

�����'������,���� ��>��?�$.�������� � ���������������������7 �������������� ����'����

�� ��� ���� ��#������� ������ ����� )�������������'����� ��� ���� .�������� ��)�,����� �������

���'��������'����� �.� )� ��������������'�� )������ � ���������� ���� ����������� ������� ���

������� ��� ���� � )� �)���'�����7���������������,�� �����'����� ����)���7�� ���������� �

��� � �������� )��� ������� ����� )�� ���� � �� � ���� � �� )��� )��� )�� ��������� � ������ �����.�

>��?�$� �������� �7 ���� )�� ����'��� � ��� �7�� ���� ������ � ��� � ��������� ������ )��� '�

�������� )�������� ��� )�� ��������������� ���� )�������� )������� )���'�����������'����

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

� �.� >��?�$� ��� �'��� �� �����,�� )�� ������������ ��� �7�� ���� ������ )��� ��� ����� ����,�� �

����'����� ��'�������,����'�������� )������ �� ���� ���

�)����� ���� )������������������@��������������$�� ��������������������'�� )��'������������

)�� �������� � �,������ �7�� ���������� ���� ���������������� )��.� ������ �,����"�7 � ���$�� ����

�A.���������� ������������)� �������� )�����������'����� ��������������������� ���� ��#���

�������)���� )����,���� �����$�� ����A�� �>�����.�������,���������������������� �����������

$�� ����A�.���������'����������������$�� ����A����

����>#-"�%��#"�

����������� ����������� �����������������

5����� ���������� ��� ������������� ���������� ���������6,����� ���� ���� ������� �� ���� ���� � ���

�� �� ��7�������:!/;.�����.��3���→�B�.��C��)��������� )������ ����������� )��������� ���6��� ������

�����.� )������ ������������ ������ )���� �� ���� )�������� �����,�����D�� )�������������

��������E��5��,�� ������D� �'��E������� ������������������ )� � )�� ���� ����� �������� � ��.� )� �

��.� )������,�����,������������������� ���� )� )������� ������� ��������� )���������)��,������

��� ���� � ���� ���� ���� �� ��� �������� �� ��� )�� � �� D������ E� ��'����� �)�� ���� � ��� �� �� �

�7������� ��)�����������'���������������������

5����� ���� ��������������������� ��������������)��)� )�� ���� ����� �����)�������,��� �����

>����7�����.� )������,�������������� ����� )������� ������� �����������)���������� ���� ��

���� '������� �� ����� ���� �)����� )��F)��� �� ���� �� �����.� )�� ���� � ���� ���� ��� ������ � ��� �

��������.������� ��� � �����,�� ������������ ���������.���������� ���� )������������� )������ �

����� �� ��7��������G�,������ ���� ����������������� ������ �� ��7������.� )�� ������������� �

��� ������������� ���� �� �����8��������� ���� ����� ������)�������)� ���� ����� ������������� �

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

��

��������������� ���@�� )��� ����,���'����������

�)�� ������ ���� ��� ������ � ��� � ��������� ��� ��� )�� ���'�'��� � )� � ��� ��������,�� ���� �

������ �� �������� ��� �� ������� ����� �7������ :�;.� ����.� 1( )t tf f −≠Prob �� �� �� �,��.� ������

��� � �� ��� ���������� �� ��������� ����� � �� � ������ �)���� ���� � ������ �� �)����� �����

���8��� �� D����� ��'���� � �� ���� �,����'��� ���� ��������� )�� ����� ���� � ���� ���� '������ � �

�)�����E.� ��� ,���� ,������ �)�������.� �)��� )�� ���'��� ��� � �� ���� ��������� )�� ����� ���� �

���� ������������.� )����� ��� �����������.���� )��������������'����'������������������� ��

������� ������������������������������������� ������

������� ���6��� ���������'������� ����,��,��� �7 ������� ����� )������������� ���%��������

�������� � ��������� �7 ������� ����'������� )��,�� ������������������)��)��� �7 ������� �

��� �����'�� '� �� ��� ���� ,�� ��� ����6����������� ������: H;�� ?� � �� '�� �� �7 � ������ .� )���

{ }),(,),,(),,( 2211 nn wtwtwt � � ��� )����� ����,�� ��� D��������� ��E�������)������ ����� ��� �D���E�

)� ��������������������� )������) ���� ��� �����

���� �����) ���� ��� ����������� )� )�� ��������� ���� �� ,����� ���� ���� )� � �������� �� )��

������ ��� ����� ����� ��� )�� ��� � ��� �� ������ �� � ���� � ��8����I!�,����� ������� �

��8�����D��"���E���� )����� ������� ��������) ������)������ ����'������� )�������� ���� )� �

����� )� � ������ ��� ������ ������ �� ���� '� ��� ������ ��� ����� ?� � ���� '�� )�� ���8����� ���

�������������� ��� ��������������� ��.������ �����'�� )�����'������������ �� ���)��)� )�� ����

������� D )��������������������� � ���8����E���)�� ����� ������������ �.� ��� ��'���.� ���

�7������������������: �;3�

logii

j ij

tf Nw

tf df� �

= � �� ��

D�E�

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

=�

�)����#� ��� )�����'������������ �� ��� )�������� ������� jjtf� � ��� )������ )���������� ��

�)�� ������ � ���� )� ��� ���� �� �������@�� ��� � ���8����� ��� ����� �� �,��� ��,������ �����

������ ���,����)�� ������� ����

%������� ���� ����� ������������������ )�������� ���)��)��������� ��� �)���������������

��� ����,�� �����)����� ������������������ ������������ )��,�� ����������������� )�� �����

��������: �;�� � � ������� ��� )������������ )��������'� ����� ��� ��� ����,�� ���.� �������� �,�����

)�������� )���)����� ����� �'� ����� )����� ����,�� ������� ��������� ���������$���������� ��

)����������������������,���'3�

sim( , ) cos ( , ) i ji j i j

i j

d dd d d d

d dθ

⋅= =

%��� ���������� ������������������,�� � ���� ������� �������� )������������ ����� ���� )�� ���

���,�� ����������������� � �������)��)�D������� �����E����

������J�$��"G�5#"5�+���4�>��?�%4"�"G�%?G#4���K $�

��� )��� ��� ������������'�� )���� �������� � �,�������7�� ���������� ���� ���������������� )����

%��� ������ )��� ���� �� � ��� �� ����� ��� ��� �������� ��� �� ���� �� )��� )�� ������� ���6��� ������

��������)������ ���� )���������� )����������'������� �������.���.��)��)�������������������� ���

���� ������,��������'��������

����� %�������� � ��� &��������%���

#����������,������ �� �����,�� )��8���� ���� �� ���,��� ����� ��'������� ����,����� ���'���.�

4���)��� ������ )�� �������� �� �� ���������� �������)� ���� ��������� ����� �� ���� ��� G�,��� �� �� � ���

����,�� ���� ������,�� ������� �.�������8���� ��� ��������� �� ����� )��8����������������

D!E�

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

/�

�� ���,�����8��� ��?� � { }1 1 2 2( , ), ( , ), , ( , )t n nQ t w t w t w= � '����8����� ����� ��� ��������)������,�����

���'���� �������� )��� ������ ��� )�� ���� 8���� ���� )�� ��7 � �� ���,��� � ��� ����

{ }1 1 1 2 2( , ), ( , ), , ( , )t n nQ t w t w t w+ ′ ′ ′= � ��� )��� ��������) �� iw′ ���

�)��������������� )��������������� ���� )��4���)��������� )��:!<;3�

1

1 1t t i i

pos negpos neg

Q Q d dn n

β γ−= + −� �

�)���� 1β γ+ = .� ����� ��� )�� ���'��� ��� ����,�� � ������ �.� ��� ����� ��� )�� ���'��� ��� ���6

����,�� ������� ����)���������������� ����������� ��� ������� )������� �����������������

����,�� ������� ������ �,�� ��������,�� ������� �����8����������� ������

%� )���)������������������ ������������'� �)��������.� )��4���)��������� )������'��������

��� ����������������)�������������� ���� ������������� ����� ������)�������� )����� )����� ����

����������� ������ .� �� )��� ����,�� � ������ ������ ��� ���6����,�� � ������ � ����� � � �� ���.�

���� �������� ���� 1pos negn n= = � ��� )��4���)��������� )����)�� ��� ����� ���� �������� ��� )�

)������8����D�)��)������������� ��������L���� ���� E����������� �������� )�� ��������������� �

�'�,����)��4���)����������� � ���������)���� ����� �'������� ����������������� ���� ������� ��%��

�����'�������'���)�� �.� )��������� )������������� ��������������������6 ��� ��� ���� ���� )��

K ��4������� )���

���'�����������%���

K��4� ������ )�� ��� ���� ������ � ��� � ��������� ������ )�� )� � )��� '���� ������� �� �����

��� ����� ���� � ������� >���� �� �������@��� )�� K ��4� ������ )�� D���� : =;� ���� ����� � ����

���������� ��� � �� �� �,� ���.� �)���� ���� ���� ��� )�� ������ )�� ������ ���E�� �)�� ������ )��

���� ����� { }mTDRTDRTDRMTDR ,,, 21 �= � �������� � �����)�������)����� D�)���6������� ���

D E�

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

H�

�������� � ���E�������� ��� ��� ���� ��� ����������� ���)�������� ���'���� )�������� )������ ��

)�����'�������� ����������� )� �����'�������� ���������� ����� )���6������ ����������

%�� �� ���� � �� ���������� D���E� ��� �������� �� '� ������6 ��� � ��� �� �)�� 6 ��� � �� ���� �

������� �)������6 ��� � �� ���� � ��������� '� ������6 ��� ������� ��� ���.��)��)� ������ ��

������ )����������������������������� ������� )��4���)��������� )�3��

1 (1 )t t pos negLTD LTD d dβ β−= + − −

�)���� � 10 ≤≤ β �� ��)���)�� 6 ������ ���� ����������'����������������� ���� ( , )PosD NegD �

�)����(������������������� ������������������� ���� )���� ������������� ��� ���� .����#��������

������� �� ������� ���� �������� ���� ��������� ��'1�� � �� ���� �� ���� �� �)����� ����� )������ �,��

������ ��������������� �������� �,�����'���������� ������������������ �����������3�

D�E�

MTDR Algorithm (�d, fb: a relevance feedback document) Let TDR j be the jth interest category model of MTDR (see its description in text), M be the maximum number of TDRs maintained in MTDR, and θ is the decision threshold constant (0,1) for creating a new interest category model. /* find the most similar interest category model */ Let s = sim(d, TDRi) such that sim(d, TDRi) = maxj{sim(d, LTDj), sim(d, PosDj), sim(d, NegDj)} where LTDj, PosDj and NegDj are the three descriptors of TDRj ∈ MTDR. If (s < θ ) /* d is different enough from all existing models */ If (||MTDR|| < M) Create a new category TDR k using �d, fb. Else Update the long-term and short-term interest models of TDRi using �d, fb. Else /* update all models similar to d */ For ∀m sim(d, TDRm) ≥ θ Update the long-term and short-term interest models of TDRm using �d, fb.

Fig. 1. K��4������� )� .

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

0�

1(1 )t t posPosD PosD dα α−= − +

�)���� α� M� D�.�E� ��� )�� ��������� �� ��� %� �������� ����� � ���� ��� ������ ���� ��������� ����� ��

���� �,�� ���'���� ������ � '� �7�)������� (���� ��� #���� � �)�� ��� ����� � '� ����� ��

������ ��� ������ �� ���� � �� ��������� �����'�������� �7 ������� �� ���� �� ��������� �� )��

����6 ��� �����)�� 6 ��� ������.�������'�

( )sim( , ) 0.5 sim( , ) sim( , ) sim( , )d TDR d LTD d PosD d NegD= + −

>�����.� )����� ����� �'� ������������� ����������,���'��������' ���������� )����7�����

��� ����� � ������������������'������)� ���.��

��������������������������������������������������� sim( , ) max {sim( , )}i id MTDR d TDR= �

��) �����"��������������������%����

�����6'���������� )������� ������������ ���� ������������ )�� )� ���� �� �������� ���� �

'� ������� �� ������ �,��� ����� � �7������� ��� ����������� �� ���� � ������ � ����� �7�������

�� )��� )��������:!�;:!�:!!;: !;: ;��>����!��������@��� )��������� )���� ������� ����� ��������

�������� �� ��������7�� �������������������������)������ ��������� ����������� ����� ������ ��

��� D�E� ��������� ������ �� ��� D!E� )�� �� ������ ��� ����� ���� )�� ����,����� ��� ���������

������ ��D )��������'�������������������������� �������� ����)���,�������E����)��������

�������� � ��������� )�� �� ���� ���������� >��� �������� .� ���� � ������ �� ���� �������� ��

������������� ���������������������� ��'����������������� ������ ����'���������� ��������

)�� ������ ��@�� � ������� '� )�� *�) �������+DE� ���� ����� � �)�� ����������� ��DE�

���� ����������� ���� ������� �������������� ��7�������������������� ��'���������������

�)��*�) �������+DE������ ������������ �������� �,�������6�1�� ��� �)����� �����������

)����� ����:!�;:!!;: !;��1�� � )����������@���'������� )���)��������� )���� ��L������� �,��

D=E�

D/E�

DHE�

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

<�

������������� ��)����������@�� ��� ����������)��� )������� �,�������������� �����,������ ���

� �'��.� ��� ���8���������������)����'���,������ ���������������������� � �)��� ��������

)����)����� ����������������������6������ ��>���� ������'��� )��)����� ����������� �����

)��������.��)��)�)��� )������������������6'������� � ����������������� )������� )���7�� ����

)����� ����'� �)���'������� ���@�� ����� ������7������� ��� ������)������� �,�����������������

������� ������� )���� ��������� ������ ������ ��������

��� )��� ������ ��� �7������� � �� )� ��� ����� ���� '���� ��������3� �� %��� ��� &� "����� �

"���)'���D2""E������������� ���� )������������� ��DE����� ���.�������� ��� �������

� ���� � ������ )��.� ������ �,���� ��� )�����64���)��� ������ )�.� )������ �,�� ��� ���� �,��

�7������� �����!��.� �)��)� ��� ����� )�� �� ��� � ����� � �7������.� ���� �8���������)�� ��� )��

����������������� ��� )��4���)��������� )���������������������8�����?� ���� %���'�� )�������� �

Window-based Algorithm (�d, fb: a relevance feedback document) Initialization: S = �∅, a list of relevance feedback documents in order of arrival. C = null, target concept. P = �∅, a list of prediction results for performance monitoring. On observing a feedback document d with relevance value fb: Concatenate d at the end of S. If ( C null≠ ) Let p = 1 if Prediction(d) equals fb (i.e., correctly predict the relevance of d) or let p = 0 otherwise. Concatenate p at the end of P. Target Concept Learning: n = GetWindowSize(P). DLIST = Get the most recent n documents from S. C = LearnTargetConcept(DLIST).

>����!�������6'���������� ���� ���������������� )� ���

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

���

������ ��'� )��4���)��������� )���+���� ���������������'���������������'� )���)������ )��

��� ����� � '� ����� �� ������ � �� ��� )�� 4���)��� ������ ������ %���� �����.� )�� (��� ����DE�

���� ����D����>����!E���� )�����64���)��������� )�����������'�

1 if sim( , )

( )0 otherwise

Rocchio RRocchio

d DPrediction d

θ≥= ��

�)�������� )���������� )���)������� )��4���)�����������������

�)�����62""��� )��������� '� ������ � ������ ���� �7������� ��� ��!���� � ?� ��,##� '�� )�� &�

������ �������!��� )� �������� ��������� �������������� ���� ��)������������� ��������.��� )�

������ � �� )��� ���������� �.����'������� )������������7�����������,##� )� ���7���@��� )����

���������� ����� ���� ��������������3��

D0E�

>���� �������6�1�� ��� �)����� ��������� )���

Window-Adjustment-Heuristic Algorithm (P: {1|0}*, a sequence of prediction results) Initialization: Accuracy0 = 0. #PastPred = 10, the number of past predictions for performance assessment. WindowSize0 = #PastPred. If (||P|| > #PasPred)

| | | |

| | || # 1

#L e t

P

ii P P a s tP r e dt

PA c c u r a c y

P a s tP r e d= − +=

� If (Accuracyt > Accuracyt-1) /* if predictive performance is increasing */ WindowSizet = WindowSizet-1 + r. /* increase the window to include unaccounted r new examples */ Else If (Accuracyt < Accuracyt-1) /* if predictive performance is decreasing */ /* reduce the window size proportionally to current performance */ WindowSizet = max {2, Accuracyt ⋅ WindowSizet-1} Else /* predictive performance is stable */ If (Accuracyt ≥ 0.5) /* stable at a higher accuracy */ WindowSizet = WindowSizet-1 + 1 /* increase the window size by one */ Else /* reduce the window size when stable at a lower accuracy */ WindowSizet = max {2, Accuracyt ⋅ WindowSizet-1}

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

���

{0,1}( ) arg max sim( , ) ( , ( ))

i KNN

KNN i iv d D

Prediction d d d v fb dδ∈ ∈

= ⋅�

�)���� ( , ( )) 1iv fb dδ = ���� ( )iv fb d= .���� ( , ( )) 0iv fb dδ = �� )��������

�A���J��"��"G��"5#K+?����?%��?����%�%�$�4�%K �

"������������ �>��?�$3������������ � ���������������������7 �������������� ����'����

�� ��� ���� � ��� ������ � ��� � ���������� >��?�$� ��� �� ���� �� �7 ��� �7�� ���� ������ )��� ����

��������������� ���� ��������� ��� ���� ��� )���������'����� ���������� �������� )���7�� ����

)���� ������������ )� ��� �,� ��������������).���� )��������'�� )��� �������� )�������� )���

����%���� ���-����������

� � )��� '���� �)���� :�;:�=;� )� � �������� )�� ������� ��@�� ��� � �'��� ������ � ��������� �����

������ � )�����������'��� � �������7��� �� ���� ������� �����)�������������� )������������ ����

������� � �)�� ���'���� ��� �7����'� �� ��� ������ � ��� � ��������� '������� )�� ���� ����� ��,��,���

��� � ���� �������'��������� ���� .��)��)���� ��������7���� ������� )����,����7����������)��

���������� )���� ����� �'���,� ���� � ��� �� �� 1�� ��� �)� ��������� ������ � ��� � ����� �� ����

��'����� ��������'���� ��.��)��������) ���� ���������� ������

����'������?�������,��� )���� �����'�������� )��������'������ � �� ��� )� ������� ���

��� �'��� ��� )�������������� ���� ������������:�=;3�

)/1ln(

2

εε

dc≤∆

�)���� �>��.�∆� ��� )������������D����$�� ������E.������ ��� )��.����&"%�����&�����������������

������ F)�� )�����:<;��%���������� ���$�� ������.���������������� ���� ����������� ��)�,������

D��E�

D<E�

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

�!�

���������8�����������'����� ���� )� )������� ���� ������� .����,����,�������������� ������

,���������� ���� �� .� )��'����� ����� )� � )�� �����������'���� ��������������� � D���������

)��)��� ������ �� ��E� ��� ��������� �� )� ������ ��'���� ��� ������ ���� ���� � ������ � D)��)��� ��� �

�� ��E�� � 4������� )�� �� �� ��� ��� � ��������� �� �8�� ��� ��� ������� �� )�� ���� �� ���� ����

�����,���� )������������������������� ���� ����������>��?�$� ����� )������������������)��

���-��������������� %�

��������'� )������������� ��)��8���� )� ����'������'�����������'����� ������ �'��������� �

���������:H;:0;:�!;.������ ����� ��)��8�������,������������������������� ���� ��>��?�$���������� �

��� ����,�� � ����'���� � �� �� �������� �� ���� )�� ����� ��� ��'���� � �.� '� � ���� ���������

��������� �)������� ������ ��� +��,��� )� � )�� ����,�� � ����'���� � �� �7�� � ��� ���� '��

������ �� ��� ����.� ��������� ���� )���� ����'���� � �� ��� �8��,���� � �� �������� )�� �� �� ���

������ ���� .��)��)��������������� )�� ������������������

�)�� �� �� � ���� .� ������� ��� ������ ������ � ��� � ��������� �� ���.� ��� �� � ���� �������� ���

��'����� ���� �������'����� �����#��� �� ���� ��� �����L���'���� �������� �,����'��� �� )��

�������� �)���� )�� ��1��� � ��� ����'���� � �� ���� ������,�� �� � ?� � { }nxx ,,1 �=S � '�� �� �� � ���

��� ������ ���������� )������ �� ��������)� )� � ULS ∪= ���� φ=∩ UL ���)����'���,���������

������ ���� ���������������)������,��� ������� )� ��������� )����'������� ��������������'�����

������� ����,�� � � � ���� ��� ������)��� �������� )�� �,��� ������������ �� ���� �.� ���� �7�����.� ��

���'���������� ����,���������������,�� ������'������������,�� ��)������� ������'����

������ � ��� )�� ����� ����� �� ����� ��� 1���� ������,�� �� �)�� ���7� ��� ���� �������)� ��� ��

��� ��� )���� ������'����� �� LL ⊆R )� ������ ���� ��������,�� .���� ���7�����,������ �����

��� L R � �� )� ����,�� � ����'���� � ��� $����������.� ���� ���)� Rix L∈ .� �� � UU ⊆i '�� )��

���������������'�� ��������'����� ���� )� )���������������������� ���� )� ��������� � )���

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

� �

����� )���� � }|{' Riii xx LUS ∈∪= � �������� ��������� �����������′′′′������������ )����'������

���)�����'������� ����� ijx U∈ �� )� ix L����'����

��� ������ )�� �� ���� ����,�� ���'���� ��� ������ L R � ��8����������������'�� � )�� ������ �

'�)������)���� ���������������,��.� )�������� �D ������� ����E� )� ��������������,������ �����

D���'���������� E���� ��������������� �� )���� �� ��������� �'�������������'�������

�������������� �����7������������������ )������'���.�>��?�$���������������� �)������)�����

���,����� �� ������ �� ������� �� ��� ��� ����� �� )� � �� ������ � �� ������ �)�� ���������� ��� ����

�����'��� )������������� ���� �������

�� /!������ %�� ����

>���� �� ���� �� )�� ���)� �� ���� ��� >��?�$�� � � ������ �� ��� )���� ����� �� � ���3� D�E� �� ������ �

����� ������ �� .�D!E��������� �)������).����D E��������� ���� � ��������%������� ������ ����

�� �� � D5>$E� �������� ���� ���� ��� �� )�� ������ � )������)� '�������@���� )�� ���� � � �����

�� ������ ���)������)��������� )� )��������������������� ���������� )��������������������.� )��

������ �)������)������������������� )���� �� ������,��������� ������� )��� ���� ����

�)�������� ���� � �������D5��E��������� ������,���������)��������'��������� ���� �

���������� � ������������ ���)������)���������� �������� ���� ������'�����7��������.����������

Concept Formation

System (CFS)

Concept Hierarchy

Concept Drift Tracker

(CDT)

A stream of labeled and unlabeled data

Stream-S Stream-L

Stream-S′′′′ Existing

Concept Drift Learner

>�������>��?�$����)� �� �����

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

���

����������� �'�� � ′S � )� .� ��� �����'�� �'�,�.� ��� ����� )�� �7����� ����,�� � � ��� �)���

�������� ��� �� ��������� �����������′′′′�'�������������������� ��������� ′S ��������� �� )��

��� ���������,��� ������%�D���,�� �����E������� ���� ���������������� )�����)���� )���������'��

���$�� ���� ���� ���� )���'������ ���������� )������� ���� ��>����=�� �������@��� )�� �� ���� �����

������ )������������ �����

01�!����� "�� ��������2����� �������3���)�������� �)������)���� )��>��?�$����)� �� ���������

����� ��� ������ )� )�������������)���� ���� ���3�D�E����������������������� ���� ������D����.� �7 �

������ �E.� ��� D!E� ���� �� ������ ����� �������� � ������ � ����� )� � ��������@�� )����

������� ��� ?� � �� '�� )�� ��� ����� ������ ��� � '�� )�� ������ � ���� ������� �)�� ����������

������� ������� ����������'� )��5����������� ������ ���@���� )�������� �)������)3��

• δ�3���→���>��������� �������∈��.��� ����M�B �.�N .� �C�∪����������)� ��∈��'�� )���� ���������

� ������� �����)���� ������L������� .� �6����� �L������� ���� ����� )����� ��G�,����.�δD�E��� �������

>����=���)������������>��?�$L���������)���

Input: a stream of documents Stream-S. Initialization: Stream-L = �∅, the sequence of labeled instances. H = ∅, the concept hierarchy. Incremental Learning: For each instance x observed from the stream Stream-S Apply the CFS system to incorporate x�into H incrementally. If the label q of instance x is available, Concatenate �(x, q) at the end of Stream-L. Target Concept Induction (only when needed): Apply the CDT component to identify a new expanded set ′S based on the current values of Stream-L and H and then generate a new stream Stream-S′′′′ arranged by the arrival time of data in ′S . Apply a selected (conventional) concept drift learner to relearn Stream-S′′′′.

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

�=�

������ ����� �∈���� )� �'�� ��������� �� )�������� ��� ������������

• ε 3��→��3����)������� ������ ������������ ������ )� �'������ ���������� ����� ∈�.� )� ���.�

�������������� )� ������������ ������������������� ���� )������ ������� ����� ��

�)��δ���ε ����� ���������'������ ��� )��� ����� �������,�� �� �.������7�����.� ( ( ))xδε ���

�)���� ε ����� ����) ������.�δ������ ����)��δ����� ����� ������8���������� )����������� ���� )��

��� � ��������� �� ������ � ���� ����� )�� ������ � )������)�� �)��� �������� )� � )�� ����� ��

������ ����� ������ )��� ���������� D����.� �������� ������ )�������� ����E����� ���� �� ��� � D����.� ��

������� ���� )�������� ����E��#,�����������@� ���.��� )���)��������������� )����,���������

������ �� ��'���� ��� �����.� ����� ����� ��� ������ ������� ���� ���� ������ � �� �������.�

�� ����������������������� �,��������������� �,����� �������$���� ���� �������������������� ����.�

��� )��� )���)��.���������� )��5����������� � ��� ���������� ���� ��������������� )��

��,������ ��� ������ �� ��'���� ��� ������� ��� ������� )� � �� ������ � ���� )� � �� ��� �,���

��� � �������� ��������� )��'�� ������ �����

��� )��� �������� ������ �� ����� �� �,������ ������ � ����� ���� ������ )��: /;� D�� )���)�

� )������ �'��������� )������������'��������.��������� )� �: /;���������� )�� ����'� ������

�7 � �����E�� #������ )�� ������ � ���������� ���� ��� )�� ������ �)������)� ��� )�� �� ��� D���

�����E������2.��)��)����������� ������� )���,�������� ����� �� )�������� �����)'��������� )��

�)����������)�������� ����� ���� )��)������)� ���� ����������� �)��)��6��,����������

��� ��� ����� ��� � ������ ������'� )���)������ )�������� ����� � ������� �����)����

�� 6���� ���� � ��� ����������� � ������� ����� �� ,���� ���� �� �� �)�� �� )�� ��� ��� ����� �� )��

�������������������2������������ ���� )� ���� ���������� ������� )������ ���)������)����������

������� ����� ���,����:�H;��>��� .��������� �)������)������������ ����'��� ��������� ���� ����� ��

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

�/�

��� )�� ,���� ���� �� �� �������� )�� �� ����������� ���� ��� ������ ���������� ��� )�� ,���� ���� �� .�

�� ��� ������� ����������'�������� ����������@������� )�������� �)������)���)�� )���)���

��� )���������� ������� )���,���������� ���� )������ ��� ������� ��������

K ���������������.��� �4�'�� )�������� � D���� ��E�)������)������� �� ����� )��,���� ������ �

��� ������� �� �� � ��� ������ � �� ����������� ?� � tc H∈ � '�� �� ������ � ���� ��� )��)������)� )� �

����������� �������� ��� ������∈�����)�������� ����� ������� ����������4�'3��

( ) ' { } ( )

arg m ax ( , ) ( , ')tc H x c t T t x c

c m x t m x tε ε∈ ∈ ∈ − ∈

� �= −� �� �� �� � �

�)�����3���×��→� B�.�C� � ��� �� '������� �)���� ���� ���� ���)� )� � ��D�5�E�M� �� ��� � ( )x tε∈ .������

� )�������� �����.� �� ��7���@��� )�� ���������� '� ����� )�� ���'���� ��� ��� ������ )� � ����

���'���������������6�������� ��� ��������� �"����� �µ �'�� )���,�������� ����� �� )�������� �

����)'��� ������ �L�� �)��� ����9� µ� �������� �� )�� ������ � ���� � ��� )�� ������ � )������)��

�)��.���)��)���µ �D )���,�������� ����E�,���������������� ���������6���� ������� .����,����

,������?� �µ L������� �'�� )������ ���� L������� ���������µ ���� )�� )���)�������� )�����������,��6

�� ���� �� �� ��� ������� ������ � �� ����� �)���� ����� ���� µ L�� ����� � ��� ������ ��� ����������� ��

'������� � � ����� ��,���� )�� ��� ������ ��� � )��� ������ � �� �������� D����.� �,��6��������@� ���E�� ���

�,��� )�������'����.���� ����� � �� )���)���,�����'� �����µ � ���µ L�� ����� .� �,�������,��� ����

������ ��� �������3��

( ){ }'

1m ax ,k t t t s p a ren t t

t T

kT

θ µ µ µ µ∈

= + ⋅ −�

�)���� 10 ≤≤ k ����� �� � 5.0=k '������ .��)��)���7���@��� )���������� '� ������,��6�� ����

����,��6��������@� �������

%����� �������� ��� ������� ����� ��� ������� )���������������� ����3�

D��E�

D�!E�

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

�H�

�E p kµ θ< ����� 'p c∀ ∈ ��������� �.�����

'E 'c k c s parentµ θ µ≤ ≤ .����� ����� �������� L����'������������� ��� ������� ��

�)�������� �����,�� ������� � )�������� �)������)��� �����6�,���������������� ���������)�

��� �)��)� �������� �� )�� ������ � �� ����� ��� � �� ������� � ����� ����.� �������� ���� )�� δ�

���� �����'�,���

61��� ������������ &�3���)�������5��� ������� ������������'�� ������'������� ������ )� ������ ����

��������,�� �D����.��4E���� )����7���� )����'�� ��� )�����,�� �����'����� ���>�������� .����

����� ����� �� �� )�� �������� �� )��� )�� ������� ���6��� ������ ������ �)���� ���� � �����2� D����.�

������ � ����E� ����� '������ �� ��� �� )�� ������ � �� ����� )� � ���� '�� ������� ���� )� ���

��� �����D����.������� E���?� ��������M��D��.$�E.�….�D��.$�E�'��� )��� ���� ���������� ������� )�

� ������,�����1����� �$���%������� �� � )����� ���������,�������������)������,�����1����� ����

�� )�����D�������E������D������E��������������� �� )��� ����'��������'������������

�)��5����������� ������������ ������ ���������� ������������ )������ �� ��.�� � ���������� )��

���'���� ��� �������� ��� ����� ����� �� �������� �� �� ��,����� ��'6���'����� ��� �������� �� �������

������� ������$����������.�������������� � ������� ����,����.��)�� �����8���������������� ��

)������� �7 ��D����.����������� ����� )���������� � ����'������ �� )������� ������� ����E����)��

���� �,������������������� ����� )������������ ���� ������������� �����������)���� � ������

/������ 0�� ?� � ������� M� �D��.�E.D�!.�E.D� .�E.D��.�E.D�=.�E.D�/.�E.D�H.�E.D�0.�E�� $������� )� � )��

�� ��B�!.�/C.B��.��.�=C.�B� .�H.�0C�'������ �� ������ �.� !���� .������� �,�����)� ���.�δD�!EMδD�/EM �����

)������ ��� .������������)��.�������������� � ������� ����������M��D�!.�E.D�/.�E.���������M�

�D��.�E.D��.�E.D�=.�E������������M��D� .�E.D�H.�E.D�0.�E��

�)��������� ����������@��� ��8��������� � ������$��������)���� � ���������� ��'� )�� ���� �

� ������ ����������� ����� )������� ����.� ������������������ �,�������� ���� )� )�������

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

�0�

����,����� ,����� ���� � � �� �� ��������� � 5����� � � ��� ������� ��� ���)� �� �������� '�

����� ������������������� ��)���� 1����� � ��� )���������� )� ���������� � ����������

���� ����� )����8��������

/������6��-����� )������� �������/������0.��!������'���������������������'�������� ��

��'��8��� ������� .��/.�)��� )�����������,�����1����� ��$�������.������� ���������H�����

���������,�������������������������.������� �,������)���������@����8��������� � �����

������ ������������′�M�D�/.�E.�������′�M�D��.�E.D�=.�E����������′�M�D� .�E.�D�0.�E��

�)�� )��� � ��� ������� )�� ����,����� ��� ���)� ������ ��� ��� � )�� ������� � ����������� ���

�������� ���������� ��������� � )������������ � �)�� ������ ���� � � ��� )� ������ �� ��� � '�������

����� ��������� ���� )������� )��� ��� )����� �������� ��:� ;��5����8��� �.� )������,����������

������� ���������'��������������������� )������,�����,�������,���'� )����� ������� � ���

)�� �������@�� ��8������ ��� � ���� ������ �� '� )�� ������ � ���� ��� )�� ������� ���6��� ������

������ )� � ���������������������� )�����,�� ������� �.�����8��������� ��������� �����

)������� ���������'����������� )���� �� ������� ������ �����,�� ����������������� ��� )� )��

����,�����,����������������������� �D����.��D��.�E.D�1.�EE���

/������7��>����/������6.� ����� �.������������ ��'�������′�.����������,�� ��)���� ����� �

�������,�� ��������′��������������� )���'�,����������

�)�� ��� � � ��� �� ���,��� ��� ������ ����� ������ � )������).� ������ )�ε ���� ���.� )� � ����

����,�� � �� )������������ ������� ���������%������ ���� �������′���� )��������� ������� )��

�� ���,����� ������������������'� )����� ���������,��� ���������)���� ����L������,�����,�����

���������′������� � �� )� ����� �� ������� �������

/������ 8�� ?� � B�!.�/.�<.���CMεD �EMεDδD�/EE� ��� B� .�H.�0.���.��!CMεD EMεDδD�0EE� '�� )�� �� �� ���

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

�<�

������ ������,�� � �� ������ ����� ������/������ ���)����� �� �������������� ��������� �����

������′�M�D�!.�E.D� .�E.D�/.�E.D�H.�E.D�0.�E.D�<.�E.D���.�E.D���.�E.D��!.�E���

A���J+�4�K �"�$�

�������������� �������� �����

��� ���� �7������� �� ��� ���� �� ��'�� � ��� )�� 4�� ���6!�=H0� ���� ������� :/;.� ����� �� ������

������ ����� )��'���������� �:!;� )� �)�,��'��������������������� ������� �������)�� �� ��� �

��� ����� !=0�� ������ �� ������ ���� ��� =<� �����.� ��� ���� ���� �� �������� )�� ����O��

����������)����� ���� )�� ���������� ���� )��'���������� .��)��)���� �����/�=!������� �.�����

��� )��� �,��� �� �� �������� �� � D/ =!� ������ �E� ��� ,���� ���� �� � D���� ������ �E�� �)��

���������� ��������� �������� ��� ��� ��������)��,���� ������ �����������������7������� ��

���� �� �� )���,���� ������,��,����>��?�$���

%��������� ����������6���������'�����,����� �������.�� ������� )����������������.�

��� ������ '������� D����.� �� ��8������ ��� ��� � ���������E� ��� ���� ���� ��� � ���8��������

: H;���)�������� � ���������� )�������)����������� �� )����"������ )��D�����8���E���

���/��������(�� ����

�)�����������7������� �� ��� ���'���,�� )���� �� ���������������� ���� ������� ��D����.� ������ �

���������� ���� �E��)���������� ���� �� �����%��������.� )���� �� ���������� ���� )���� �����

��������� �� ����������8��� ����.����� ����������������������������������7�� �� ��� ��� )�

������ � �������� � ���� ������� ��� ����������� ��,������ ����������������������� �,�������� ���

%� ������ ��� �������� ��� ��������� ��� )�� �6������ � ��8������ ��� �� �� � ������������

���������� � ��� )��� ������ �� ��� &���� 2 ��� >���� /� �����'��� )�� ��������� ������� ��� )��

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

!��

�7������� ���������� )�� ��� ����@� ����� ���.� � � ������������������ ��� )�� )���)�������� ����

�����@���� )����� �������������@� �������� �������>��?�$����

����������� )������������� )�� �� �� .�������� )��� ����� � ���"�� ���������&"��� ������

:!=;.���,������ ��)��)���������������8���� ���������� ��)���� �� ������������������� ������� )��

������ ���� ��� ���� � �� � ������ �� ������ �� )��� )�� ��� �� ������ �� D�)���� �� ��� �� � ��

��7��������'������ �� ������� �� ����������� �������������� )�������� � ������������E��

?� �(�'�� )�����'������������ ��������� �,�� ������ )� ����������� )�� ����������� ��������

'����������)������������� )�������� ��� ��������������������,���������������

100%t

PAccuracy

n= ×

�)��������� ��� 2�,��������������� ��'��,�������� )���� �� �������������� )������ � ��������

���� �� )��������

Input: a data stream Stream-S generated from the training set. Initialization: 1. Let Stream-L = �∅, i.e., the sequence of labeled instances. 2. H = ∅, the concept hierarchy. 3. Determine the density threshold of distinct concepts from the validation set. Experiment Procedure: For each tracking cycle i = {1 … K} 1. Process incrementally the ith m-instance sequence from Stream-S. For each instance x from the m-instance sequence Update H to incorporate x using incremental concept formation system. If the label q of x is available, Concatenate �(x, q) to the tail of Stream-L. 2. Execute the Concept Drift Tracker (CDT) algorithm to generate the new stream Stream-S′′′′ from current values of Stream-L and H. 3. Run a selected concept drift learner (e.g., one of the four algorithms described in Section III) to learn Stream-S′′′′ and measure the accuracy of the learned concepts on the test set.

>����/���)���������������7������� �����>��?�$��,���� ���.

D� E�

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

!��

����� &�������&���

�)��� �� � ��������,��� ���� �������������� ����������� ���� �������� ���.������������ )� �

�����'��� )���,��� ������� ���������� ���� ���,��� ������)���)��������� ���������� ���� ���,��� ����

���������� ��'��� ���� ������������ ���� ���������.����.����.����������� 9� ��������)����

��,�� �������������������������� ��D �� ���E��)������@������ )�� �� ��� �����H=.�!!.��!�.�!=����/</.�

������ �,���� ��'��� �� ���,���� )���� �������� ����� ���� ��� ���� �7������� ��� ��������� ���� ��

������ ��� )���,��� ���������������� ���� ������� ����������� �����!���� ������� ������ )����

���� � ������ �.� ������ �,�������)�������� ��� )�� �'��������'��� )�����'������ )�� ��������

������ ����� )���6������ ���8������ )� �������������� ����)� �������������D��M�����������

�������� ����E�� ��� �������� ���� �.� ���� �7�����.� �������� ������ !�−��� �������� ��6������ �

��8������� ���)�����)��)� ��� �������������� ������ .��������� ������ .� ��� ���) �� )���

D���"���������� E������� �.������������� ������� )�� ���������� ��������������������

)����8�������������� ���� )�PQR����P−R�������������� ���'����� �.���� )��� ����'��������

�����,����'��� �� )���� �� ������ ������� ����������������)��� )��������� ��D�� )�� �PQR�

TABLE1

The description of tracking tasks and the evolution of target concepts over twenty-tracking-cycle periods.

Tracking Cycles

1 − 20 21 − 40 41 − 60 61 − 80 81 − 100

Tracking Task 1

(Trade, +) & 9 others

(Trade, −) (Coffee, +) & 8 others

(Coffee, −) (Crude, +) & 8 others

(Crude, −) (Sugar, +) & 8 others

(Sugar, −) (Acq, +)

& 8 others

Tracking Task 2

(Trade, +) (Coffee, +) & 8 others

(Trade, −) (Coffee, +) (Crude, +) & 7 others

(Coffee, −) (Crude, +) (Sugar, +) & 7 others

(Crude, −) (Sugar, +) (Acq, +)

& 7 others

Tracking Task 3

(Trade, +) (Coffee, +) (Crude, +) & 7 others

(Trade, −) (Coffee, +) (Crude, +) (Sugar, +) & 6 others

(Coffee, −) (Crude, +) (Sugar, +) (Acq, +)

& 6 others

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

!!�

���P6PE��������� �����'����� ����)��� )����'���������'����� �������� ���,��� �� )���� ��.�

)����� ������� )���� ��L������ ����,�����������������������������'��������)� �������������

������������� �������,������������������� �����

>��� �������� .� ���� � ������ �� ���� ���� � �'��� ���� ������� ��� ��� � �������� ��������

>��'���������� ��� �� )� ������ )��'�������������)�������� ���� ������� ��������,���� � )��

���� � �������������������� )�� ��� 6 �������������������.� )� ���.�� � ���������������.�!�.����

��� ��� ���� ������� �� )� ���� �,�� DQE� ��'���� ����� �� ������ � ���� � ������ �� � � )�� ������ �,��

����������������� ���� )����� �,����'��������� ������,�� ������� ������������� ���� �'���)�

���� D��� ���)���@�� )�� �7�� ���E� ���� � ������ ��� � �)�� ���� �,�� ��'���� ��� �� ���,������

�� �'���)�� ���� ������� ���>����7�����.������� �,������������� ���� �������� �����������,���

������ )�� ���� � �������� ����� �� �� �'���)� �� ���� �� ���� � ��� ����� ������ �)�� ������ � �� �

���,��������� )��!�� � ���������������� ������������� �,������������ ������������ �,��

����������� .��)������� )�� ���� ������� ����������� ��������

���/�������������

>���������� ���� ���������.� ��������'�� ���$�� ���� ���.� ���� ��������� ������������� )��� �����

������′′′′������� ��'�>��?�$3�D�E�K ��4������� )�.�D!E�4���)��������� )�.�D E����62"".����

D�E����64���)���� � �)������� ������� >��?�$� ��� �� �7 ��� ��� �7�� ���� ������ � ��� ��������� ����

��������� )���������'����� ����)�������.� )���������������������7�� ���������� ���� ���������

��� �7��� �� �� �����,�� '���������� ������′′′′��,��� )�� ������������ ��� )���� )� ������� ����

�������D����.� )�������������'����� ��� ����E���)��������,���������������� )����'�,�������

'������ ��������� � )����7��� � �����

��������7������� ������� �θ�M����H=.�'�M�0.�β�M��������α�M��� ���� )��K ��4������� )��: =;.�

�������� �β�M�������� )��4���)��������� )��: =;������,�������� �������6�� ����������� �������

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

! �

)�����64���)��������� )�.����,��� )�� )���)���� ��� � ��(��� ����DE� ���� ������������!=� ��

�� =�� ����!=��� ��,���.�������� )��'�� ������ ������������������������������$�� �����.���������

,��� )��&�,�������� )��2""�'�����������������!� ��!����� )�����62""������� )����

>��?�$��������'������������=S���� )����'����� ���,����'��� �� )���� �� ��$����������.����

���,���� ����'��������� � )������ � �������������������� )�� ��� 6 �������6�����������9� )��

���������������������� ���� ������������ )�� �������>��?�$������� ��7��� �� ���)������� ���

)�� ��7 � ��� � �������� ���������� ����� ���� ������ � ��� ������������ )�� � >��?�$� )� � ����

���,����������D���SE���'����� ���� ��������� ������)��������>��?�$�D�� )�����=S���'����

� �E���������,��� )����������������

/���������

>����H−<��������@�� )���� ����������7������� ����� �������� ������− .������� �,�����)�����S6

?����=S6?������������������� �������������������� ���� ������������ )�� �>��?�$� )� �������

��������S����=S���'����� �.������� �,�����)��=6S?����������������������,����� )��'���������

�)���� )�����S6?�����'��,�������� )�����������������6'������)��>��?�$������������������

������ ������� )�������� ������ )� �������� )��=6S?�������������.��7��� � )� �>��?�$������

� ���@��� )������������������'����� �.��)��)������ � )���������� )��=6S?��� ������������� ��������

����.� )��=6S?�������S6?��� ����������������� )������'����� �����

%���7��� �.� )�����S6?��� ������ ������� � )��� )���������� )������ ���������,����������� �

�����'����� ����%��������� )������=S6?��� ������,�����������������'��������'��� ������ ����

)����������������)��������� ���� )�� ���������'����� ����)������������'� ��������S6?����

=S6?� ������������� �������� �� �� ����� ���� �����,���� .� )�� �7 �� � �� �)��)� )�� =S6?�

������������ ���� '�� �����,�� '� >��?�$�� %�� �)���� ��� )�� �������.� >��?�$� ���� ����� �,���

�����,�� )�������������������7�� ���������� ���� ���������������� )���D=S6?��� ���E��7��� �

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

!��

)�����������������>��?�$�D=SE�������������64���)�������������� �������� ��������� ������� )�

�� ���� )� ����� )���������������������� )��������,�� )�������������′′′′�� �����,��� �������������

��� �������� ����� �)�������.� )�� �������� ��� )�� ���64���)��� �������� ���� �����,���� � ��

����������������'�,������������������� �� )�����'������ )��� )�������� )��� �������

>����������� ������7����������������������,��� �������,���'� )��K ��4������� )�����

�������� ���� ���7��� ���� )����� � ��� � ���������������)���� ���� � ��������,��,��� 9.���� �

43

48

53

58

63

68

73

78

MTDR Rocchio Win-KNN Win-Rocchio

Ave

rage

Acc

urac

y (%

)100%-L 5%-L FEILDS (5%)

�������

35

40

45

50

55

60

65

70

75

MTDR Rocchio Win-KNN Win-Rocchio

Ave

rage

Acc

urac

y (%

)

100%-L 5%-L FEILDS (5%)

��������������>����H��+�������������� �������� ���������������������������>�����0��+�������������� �������� ����!��

40

45

50

55

60

65

70

MTDR Rocchio Win-KNN Win-Rocchio

Ave

rage

Acc

urac

y (%

)

100%-L 5%-L FEILDS (5%)

�������

35

40

45

50

55

60

65

70

75

80

1 21 41Tracking Cycle

Acc

urac

y (%

)

100%-L5%-LFEILDS (5%)

��������������>����<��+�������������� �������� ���� �������������������>��������+������������,��� ������� )��K ��4�������������������������������������������������������������������������������������������������������������������������� )����� �������� ���� ��

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

!=�

��� )�������������������� ��)��,��'�>��?�$��,��� )��'��������������������� ���� ���������� .�

����������������������,���'� ��� )��� )���������������������S6?��� ������ 9��������� �� )��

��� � ������� � ����� �� ������� "��� )�����.� )�� ��� � )� � >��?�$� ��� � ���� �'��� �� �����,�� � ��

������������� �� ��� �����.� �� )���)� �� )��� ������.� �� )� )�� ����������� �,����'��� � ��� � 9�

������ ����� )��'�)�,�����7��� ������� )���� �� ���

�)��8���� ���� )�������� �D���� ��E�)������)���� )������������� )����� �������������@� ����

�� )�� ����� ����� � )�� 8���� ���� )�� �� ��L�� �� �� �� %� )���)� >��?�$� ��� �'��� �� �� ���,��

����� ����,�� � ����'���� � �� D����.� '� �1�� ���� )�� ������ ��� ��� )�� ��� ����� ��������@� ����

�� )�9����������)��� )����)�� �E.��������� )������'����� ���� ���,�������'��������,�� ����

�������� ����'����� � � ��������� )� � )������������,�� �� )�����������������>��?�$������'�����

'� ��� )��� )� ���� )�����S6?��� �� ��

�)�� ����� �7������� � ����� �� �'�,�� ���� ������� '� �� ���� )�� )���)��� ���� ��� �����

��������@� ���� �� � �� ����� � ,����� D����.� &M��=�����=� ����8�� �!E�� �7����� ��� �7������� �������

��� )�������� �� ���'���,�� )������� �,� ���� )�� )���)���,���������D�E� )��8���� ���� )���� �

��������� ��'� )��5����������� .����D!E� )���������L����������������������������������′′′′���

�)�� 8���� � ��� ��� ��� �������� ��� ����� ��� ����� ��� ������� �)�� ����� ��� )�� ������ ���� ���

��� ������ ��� ��� )� � ���� �������� �� ��'���.� �)���� )�� ������ ��� )�� ������ ���� ��� ������ ��

��'���� ��� ������ �������,��� ���� ���� � ��� ������ ��� )�� ������ �)������)���)�� ������� ���� ����

������� ���� )���� ��������������������� �,������� ������� )������ � �������� ���� �� )�����

D����.������ �� )���� ��"��������� ��)��8��E.��,�������,��� ��� ����������

>���� ��� ��� �!� ���,��� )�� ����� �� ��� )��� �7������� �� >��� ����'��� .� �� )���)��� ��� ���

0

tfθθ

= � ��� �� ������ �� �����'�� �� ���� �,�� )���)����� )� ������ � � 0θ �� � ��� )��� ������ .� )��

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

!/�

)���)������ ������� )������� ��� ����.���� ��'�J���� )���������.�������� )��D���.����=E���������

>������������� �� ����������� �� )� �������� � )���7��� � ���������������������%�)��)��� )���)���

���������� )����,�����������������)��)��� )���)���D 1.1tf > E�������� �������)��)������� �������

��������)������� ��� ��������,��������� �������'� ������������������)��)���,���������

>���� �!� �������@��� )�� ������������� ��� )�� K ��4� ������ )�� ����� ��������� )�� � �����

������′′′′��,���,������� )���)���,�������� ��)���� )� � )������� ��� ������������� �,���� �'���

������������� � � )��)� �,������ ������������ $������� )���)���� �� �� � )���� �����,�� )��

������ )�L�� ������������.� ���,������� �� )�� '�������� �,������ ������������ ���)��� )���)���

��� ���� D 1.1tf > E� ���� ������ �� �� � ����� ��� ����� � )� � ������� )�� ������ )�L�� �,������

������������,������)������� )��� )������� )��'�������������

0

10

20

30

40

50

60

70

80

90

100

0.80 0.90 0.95 1.00 X 1.05 1.10 1.20threshold factor (tf)

Noi

se o

r Cov

erag

e (%

)

Noise Coverage

��������

10

20

30

40

50

60

70

80

0.8 0.9 0.95 1.0 X 1.05 1.1 1.2

threshold factor (tf)

Ave

rage

Acc

urac

y (%

)

Tracking Task 1Tracking Task 2Tracking Task 3

��������>���������)��8���� ����$L��,��� )���)�������������������������>�����!���)�����������������K ��4������� )��������������������������� ������ �������� ���� ��������������������������������������������������,��� )���)������ ����

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

!H�

A�����$5-$$�#"�#>�4�?%�����#42$�

-������ ���� ���������)���'��������� �,���������)��������� )��������� ����4� ���,���:�;:�/;: 0;.�

�� ������� � %��� �� : ;:=;:��;.� ��� K ��)���� ?�������� :!�;� ������� ���.� �� ����� �� �����

4������)���� ������ )�� ���'���� ��� �)������� ����� �� ���� �� '� �������� ����� �� ���� �� ���

������� ����� ��� ����6 ��� � ��� �)�� 6 ��� � �� ���� �� :=;: �;.� ����������� �7������� ��� ����� �

������:!�;:!�;:!!;.��� ��� ������������� )������� ����������������'����:�;: ;:��;.����'�

�������������,��� ������������ )��:!0;���)���� ���������� ����������� ���� ����������������

�� �'���)� '����� ��� )�� ��� � �� �� ��� )�� ������� ������7� � '� ������� �����������

������ �����'�� � )������������ � )� �����������:�;:�=;��+��� ����� ��)��8������� � �������� �

��� �'��������������� �����) � )���)������: �;.���� �,����1�� ���� )����������@��: !;.�

����7����� ��� �� ����)������� �7 �� )����)��� �6���������: ;�������6��������������:��;����

%� )���)��� ������������������ �'��������� ��D� � ���������� ���� �E.� )����)���'������������

���'������������ )��� )� � �7���� �����'����� �� ��� )�������������� �������� ����'����� ���

�)���� ������� )�� �7��� � ���� K �7���@� ���� :�!;.� 5�6 �������� :0;� ��� G���)� K ��6�� � :H;�

������ )����%���,��� ������������ )��)���'��������� ����������� �� ��� ��� �,����1�� � )��

���������'���)����������'����� ��:! ;������������ ����4� ���,��.��� ��� ���8�����7��������

�� ����7���� ������'����� ������� )�� ��������������� ��:!H;����

������� �,�� $AK � D�$AK E� ��� ������� ��� )�� '���� �������� ��� )�������6'���� ������ �

��� ���������������� )��:�<;.���������� )���� �� � ����������� ������'����� �� ��� )�� �� ��� �

������ )�� ��������� ��������� ����,��.� )��� �������)� )��� ��,��� '���� �,���� �� ������ ������

��'���� � �.� ������� )�� ����� �,������ ��� )��� �� )�� �������� ��������� � ������.� )�� ���� ���

�$AK ������������� ������������������ ��,�������)���� )��,���� ������������ �� ��� ���������������

���� �,�����������.���� )�������'��� ������7���@������������������: <;��

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

!0�

A����5#"5?-$�#"$�

��� )�,�� �����'�� ��� �,���� �� �� ���� �� )�� ���� �������� �7 ������ )�� ����'��� � ���

�7�� ���� ������ � ��� � ��������� ������ )��� ���� ��������� �� )� �������� ��'���� � ��� �)��

�7������� � ����� �� �)��� )� � >��?�$� ��� �'��� �� �� ��� ������ �����,�� )�� ������������� ���

�7�� ���� ������ )��� �,��� ���� ��� ����� ����,�� � ����'���� � �� '������ �,����'���� �)�� �����

���,�� ������������������)���� )� �� �������� ��������7 �������� � ��������� ��'�������� �)���

������������������ ���� ��,��� ����� ������ ��)��������� )������������� ��������� )������

� ���� � ��������� �)�� ��)���,���������������������>��?�$���������������� ����� �����1���

��� ���3� D�E� )�� 8���� � ��� � �� ������ � )������)� ��� D!E� )�� �'��� � �� ������ �� �������@�� )��

�� ����������� ��� ����� ����� )�������� �)������)���)��� ������ �� )� ����� ��� � �� �����,��

)�� ������ � �������)� ��� �� ����� � � �� � )��� ������� ���� ������� ���� '�� ������� ��� )�� ��6

������������ ��� ��,�� ���� �� ���� �� )�� )� � ����� �����,�� )���� ��� ��� ����� �)��� ��� )��

��'1�� ���������� ����������

REFERENCES

:�; %����.�(��D�<</E�� �������� ���4���,�����>��'�������� ������� ����>�� ������� ���(�� ����� �%�0:�%�!������������������������ %�����������������!������������������.����!H�6!H0��

:!; %� T�.�5�.��������.�>����������.�$��K ��D�<<�E��%� ��� ���?��������������������4�����������7 �5� �����@� ������'������� ���������!������������2����.��!�D E3�! I!=���

: ; ����'���,���.�K ��D�<<HE��%��%�� �,����'�+����4�������� ����$��,���������(�� ������%�0���!������������������������������������.����� H06 0=��

:�; ��� �� .� +�?�.� ��,�.� $���� ��� 2�������.� $�4�� D�<</E�� ?�������� 5)������� 5����� �� '��7���� ���� )��$ ��� �������5)����������������������������%��2.������ �6� <��

:=; �������.� ��� ��� +�@@���.� K �� D�<<<E�� %� +�������� "���� %��� � )� � �����.� ?������ ����7�����������(�� ������%�7���!�������������������������������������.�����!/06!H=���

:/; �����.� 5�� ��� K ��@.� 5�� D�<<0E�� -5�� 4����� ��� ��� K ��)���� ?�������� �� �'������) �3FF��������������FU������FK?4����� ���) ��.� -��,���� � ��� 5���������.� ��,���.������ ��� ����������� �������5���� ���$���������

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

!<�

:H; ����.�%�����5)����.�$��D!���E��?�������������?�'�������-���'������ ��������G���)�K ���� ������(�� ������%�0;�%�!��������������������'� %����������.������<6!/��

:0; ����.� %�� ��� K � �)���.� ��� D�<<0E�� 5��'������ ?�'���� ��� -���'���� �� �� �� )� 5�6�������������(�� ������%�00�%��������������������������������������%��2.�����<!6�����

:<; �������.�%���)�������) .�%�.���������.������������ ).�K ��D�<0<E��?�����'��� ���� )��A�����65)��,�������������������<�����������%��'.� /�D�E3<!<6</=��

:��; 5)��.�5��5�.�5)��.�K ��5�����$��.�*��D!��!E��+A%3�%�$���6%�� �,��+��������A����%��� ������ $������� ������ ��� %� ��� �� ��7 � 5� �����@� ���.� <������� ��� !��������� !������������2����.��0D!6 E3�H 6�<���

:��; 5)��.�?�����$����.�2��D�<<0E����'K � �3�+��������%��� �����������������$����)��������(�� ������%�6���!������������������������������������.������ !6� <��

:�!; ����� ��.� %�+�.� ?���.� "�K �� ��� 4�'��.� ��� ��� D�<HHE�� K �7����� ?�����)��� ������������� ���� �� ,��� )�� �K �%����� )����<������� ��� �%���2��� �������� ��� �� ��2.� $��������.� <D�E3��6 0��

:� ; G�''�.� ��K .�������.� 5�� (�� ��� 4�'�����.� (�%�� D�<<=E�����'������� ?����� ���%� ���������� �������������?�����+����������3�A������� �����������������4����������"���*���3�#7����-��,���� �+������

:��; �������.� K ���.� $���� .� 5�� ��� ����.� 2�� D�<<0E�� �7 ��� ���� ����� 5�� �7 �� '� %����������.� !D!E3����6�!0��

:�=; ����'��.� ��+�� ��� ?���.� +�K �� D�<<�E�� ��������� ���� ���� 5����� �� '� K �����@��������������� ���'� %����������.���D�E3�!H6�=��

:�/; ����.� ��� %�� D�<<0E�� �)�� �4�56H� >�� ������ �����3� ������� ���� ��� %�������� ��� ��� K ��A���)����������2���������D��E.�"�$��$�������+�'���� ����=��6!�!3��%�=�%������������������>��/"=15����� 6=/��

:�H; (���.�%�2�� �����'��.�4�5�� D�<00E���������%��� ������������������� ���������5�����.�"�(�3�+��� ����������

:�0; (�����.����(�.�$����.�%�����$�����,��.���� D!���E��4����?���.�4����-��������4����"���3�%�$ �����%����������-�����V���������� )����'��!�����������(�� ����������'�������.� /D!E3�!�H6!!H��

:�<; 2������'���.�4��D!���E��-�����?�'�������-���'������ �� ��?��������� ����5����� ������!<�!"?0� ) ��&�%��� ��� �������� ����� �������� ���� �������� ������ ) �3FF���6���������6�� �����F�#2-K�"��F�������'���U!���������

:!�; 2������'���.� 4�� ��� (���)���.� ��� D!���E�� �� �� ���� 5����� � ���� � �� )� $����� � A�� ���K ��)��������(�� ������%�0=�%�!��������������������'� %����������.������0H6�<���

:!�; 2������'���.� 4�� D�<<<E�� ?������������ ����5����� ���� )�+�� ����-���� >��'���������@��+������������*!" � %������0�0�7�'�� %�����������> *'�"::1.�+�����.�+� ������>���.�A�������D��E��

:!!; 2������'���.� 4�� ��� 4��@.� ��� D�<<0E�� %�� �,�� ������� ���� >�� �����3� ?�������� ��� )��+�����������5����� ����� ���������!�) ��&�%����������������������������+�����.����� 6����

:! ; 2� )���.�4�����(���.�A��D!��!E��?�������������?�'�������-���'������ ������(�� ������%�6??6�!������������<�������������#�����#����&�.�����!0� 6!0�0����

TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING

��

:!�; ?���.�2�� D�<<=E��"���������3�?�������� ��>�� ���"����� ���(�� �� ��� �%�06�%� !��������������������'� %����������.����� �6 <��

:!=; ?����.���������4����� �.�K ��D�<<�E��%�5�����������������?��������%����� )���������7 �5� �����@� ��������(�� ������%�7�����������2������������� ���������2��������!������������������.�����0�6< ��

:!/; K � �)���.���K ��D�<<HE��'� %������������"���*����3�K �G���6������

:!H; K � ��.�K �.�$���)��.�%�����������.�5��D�<<0E�������,����%� ��� ���V�����7������������(�� ������%�60��������������� %�����������������!������������������.�����!�/�6�!����

:!0; K�����.�%�����W��)����.�G��D�<<HE���,��,������K�� �6���� �������� ����>�� ������$��� �������%K%?���%�����(�� ������%�0���!������������������������������������.����� <�6�� ��

:!<; 4���)��.�(�(��D�<H�E��4���,�����>��'�������������� ����4� ���,�������G��$�� ��.��%��'�������������2���A�/�������������������� ��� �����(�� �����.����� � 6 ! ���

: �; $�� ��.�G�� ���K �G���.�K �(�� D�<0 E�� !������ ����� ���'����� !��������������������K �G���6�����+�'���)����5�������

: �; $�)������.� (�5�� ��� G������.� 4���� D�<0/E�� ����� �������� ��� +���������3� ���������5����� ����� �����(�� ������%�B�%�#���������������������� ����!������� .�����=�!6=�H��

: !; �����.�G�����2�'� .�K ��D�<</E��?����������� )��+�����������5����� ����� ���������5�� �7 ���'� %����������.�! �D�E3�/<6�����

: ; �����.�G��D�<<HE�����������5�� �7 �5)������ )����)�K � �6?���������'� %����������.� 3!=<6!0/��

: �; ���� ���.�����.� �������.���4�����*��.�(�� D�<<<E��%��%�� �,��%����� )������?��������5)���������-������ ���� ������(�� ������%�;�%�!��������������������!���������������,�������'�������.�������=6��!��

: =; ���� ���.�����.��������.���4�����*��.�(��D!���E��?��������-������ ���� ����������� )����)���6������� ��� 4������� � ����� <������� ��� �%� ���� ��� �� ��2� ���� !����������� � �� .�=!D E3!�!6!!=��

: /; ���� ���.�����.��������.���4�����*��.�(��D!��!E��%���������� ���%������)� ������������5��� ����������)�����(�� ������%�6���!///�!�������������������������'�����.�����H�=6H�0��

: H; �� ��.�����.�K ���� �%������������5��D�<<�E��'��������*����2��A���������������!��������� ����������!������"���*���.�"*3�A���"�� ����4���)����

: 0; *���.� *�.� 5��'�����.� (���.� �����.� 4���.� +�����.� ��.� %��)�'��.� ����� ��� ?��.J�� D�<<<E��?��������%������)��� ������ �� ����������������"�����,�� ��� !///� !����������2����A��� ����!������������ ����������!���������!������������������.���D�E3 !6� ��

[39] W)���.�������#����.�>�(��D!���E���%�+��'�'��� �%���������� )��A��������-���'������ ������5��������� ���� +��'������ ��� (�� �� ��� �%� 0=�%� !������������ ����� ��� '� %��� �������.� ������<�6��<0�