Relevant data expansion for learning concept drift from sparsely labeled data
Transcript of Relevant data expansion for learning concept drift from sparsely labeled data
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
��
Relevant Data Expansion for Learning Concept Drift
from Sparsely Labeled Data ��
������������ ����
����� ��� ������������ ������������������� � � ������������������
���������� !��"�#"�$�%�
��&���� '������
�(�)��*���
$�)�������������� ����$��������������)�������)��+�����,�����$ � ��-��,���� �
-��,���� �+���.�+%��/0�!�-�$�%��
1��&�� ���������
�
ABSTRACT
�������� ���� �� �������� ��������� ��� � ����� ���� ��� �� �� ����� �� �� �����������
�������� ���� ������������������������������������������������������������������
����� �� �� ���������������������������� ������������ ����� ������������������
� ���� �������� ��������� � ������������������ �� ������ ���������� ���� ���� ���������
������ � � � ���� ����� ���� �������� � ���� � ������ ��� ���� �� � � ����������
��� ������� ������ !�� "��� � #��� !"$%� ������ �������� ���� ��������� �� ���������
�� ������� ��������� ����������� � � ����������������� ����������� ����� ��� ����
������ ������ ���� � ��� � � ���� ���� � ���� ������ � ����������� ��������� ���� ���������
��������� ��������������������� ������� ������������ !"����������������� ��� ���
���� ��� ������ �� � & �������� ����'!������ � (��������� �� #& �!($� �� ����%�
( ���� � �� ���� � ��� ���� �'����� � ������ ����� ������� �� ������ ����� �������
� � � � ������� ������� ��� ����%� ����� ������� � � ����� ��� ������ ���� ��� ������
��� !"���
���������2�����3�������� ���������.�����,��������'���.�������� ������� �������
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
!�
����"�4#�-5��#"�
�������'��� �������� )����� ���6 �6� ��������� ���� ������������ ������ �����'�������� �����)����
����� �������,�����������,�� �������� ���� �������� ������-������� ������� �������)� �����
��������� ���� ����������� ���� )� ������'�������,����'�������)�����)��������� �������,�����
�����)�,������������������'�� � )��������� �������������������������� �������� ��������������
)������.���� )���'��� � ���� ��� ������ ����� )�� �)������������� �� ���� ���,��� �����������
,� ��������������)����� ����
��������� )���,��� ������������ �� ���� �� ��������'������� �������������� ���� ������������)��
��1��� �����7�� ���������� ���� ���������������� )��� ���������8����������������'��������'����
� �� ��� ����� �� ��)��,�� ������������� � � �� ����� ��� ��,���9� ��� )���� ������ )��� ���������
������� )���,����'��� �������)���'����� ��:!�;:!�;:!!;:!<;: !;: ;: �;: =;��%� )���)�����'����
� �� ���� ����� �,����'��� ��� )�� ������� ���6��� ������ �����.� ��8������� ��'���� � �� ��� )���
������ ��� ����� � ���� ,��� ���)�'� �,��� >��� �7�����.� ������� ������ ��� �� '�� ���������� ��
���,��� )������,��������'��������� ����'��� )��� ��:�0;��� ������ �8��� ����'��� )� ����������
������ ���� ����������8���������������'����� ���������������� �� ����'������
��� )������������������ )���'�,�������.��)��)��������� �� )���������������� ��'� ��������
�����'������,���� ��>��?�$.�������� � ���������������������7 �������������� ����'����
�� ��� ���� ��#������� ������ ����� )�������������'����� ��� ���� .�������� ��)�,����� �������
���'��������'����� �.� )� ��������������'�� )������ � ���������� ���� ����������� ������� ���
������� ��� ���� � )� �)���'�����7���������������,�� �����'����� ����)���7�� ���������� �
��� � �������� )��� ������� ����� )�� ���� � �� � ���� � �� )��� )��� )�� ��������� � ������ �����.�
>��?�$� �������� �7 ���� )�� ����'��� � ��� �7�� ���� ������ � ��� � ��������� ������ )��� '�
�������� )�������� ��� )�� ��������������� ���� )�������� )������� )���'�����������'����
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
�
� �.� >��?�$� ��� �'��� �� �����,�� )�� ������������ ��� �7�� ���� ������ )��� ��� ����� ����,�� �
����'����� ��'�������,����'�������� )������ �� ���� ���
�)����� ���� )������������������@��������������$�� ��������������������'�� )��'������������
)�� �������� � �,������ �7�� ���������� ���� ���������������� )��.� ������ �,����"�7 � ���$�� ����
�A.���������� ������������)� �������� )�����������'����� ��������������������� ���� ��#���
�������)���� )����,���� �����$�� ����A�� �>�����.�������,���������������������� �����������
$�� ����A�.���������'����������������$�� ����A����
�
����>#-"�%��#"�
����������� ����������� �����������������
5����� ���������� ��� ������������� ���������� ���������6,����� ���� ���� ������� �� ���� ���� � ���
�� �� ��7�������:!/;.�����.��3���→�B�.��C��)��������� )������ ����������� )��������� ���6��� ������
�����.� )������ ������������ ������ )���� �� ���� )�������� �����,�����D�� )�������������
��������E��5��,�� ������D� �'��E������� ������������������ )� � )�� ���� ����� �������� � ��.� )� �
��.� )������,�����,������������������� ���� )� )������� ������� ��������� )���������)��,������
��� ���� � ���� ���� ���� �� ��� �������� �� ��� )�� � �� D������ E� ��'����� �)�� ���� � ��� �� �� �
�7������� ��)�����������'���������������������
5����� ���� ��������������������� ��������������)��)� )�� ���� ����� �����)�������,��� �����
>����7�����.� )������,�������������� ����� )������� ������� �����������)���������� ���� ��
���� '������� �� ����� ���� �)����� )��F)��� �� ���� �� �����.� )�� ���� � ���� ���� ��� ������ � ��� �
��������.������� ��� � �����,�� ������������ ���������.���������� ���� )������������� )������ �
����� �� ��7��������G�,������ ���� ����������������� ������ �� ��7������.� )�� ������������� �
��� ������������� ���� �� �����8��������� ���� ����� ������)�������)� ���� ����� ������������� �
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
��
��������������� ���@�� )��� ����,���'����������
�)�� ������ ���� ��� ������ � ��� � ��������� ��� ��� )�� ���'�'��� � )� � ��� ��������,�� ���� �
������ �� �������� ��� �� ������� ����� �7������ :�;.� ����.� 1( )t tf f −≠Prob �� �� �� �,��.� ������
��� � �� ��� ���������� �� ��������� ����� � �� � ������ �)���� ���� � ������ �� �)����� �����
���8��� �� D����� ��'���� � �� ���� �,����'��� ���� ��������� )�� ����� ���� � ���� ���� '������ � �
�)�����E.� ��� ,���� ,������ �)�������.� �)��� )�� ���'��� ��� � �� ���� ��������� )�� ����� ���� �
���� ������������.� )����� ��� �����������.���� )��������������'����'������������������� ��
������� ������������������������������������� ������
������� ���6��� ���������'������� ����,��,��� �7 ������� ����� )������������� ���%��������
�������� � ��������� �7 ������� ����'������� )��,�� ������������������)��)��� �7 ������� �
��� �����'�� '� �� ��� ���� ,�� ��� ����6����������� ������: H;�� ?� � �� '�� �� �7 � ������ .� )���
{ }),(,),,(),,( 2211 nn wtwtwt � � ��� )����� ����,�� ��� D��������� ��E�������)������ ����� ��� �D���E�
)� ��������������������� )������) ���� ��� �����
���� �����) ���� ��� ����������� )� )�� ��������� ���� �� ,����� ���� ���� )� � �������� �� )��
������ ��� ����� ����� ��� )�� ��� � ��� �� ������ �� � ���� � ��8����I!�,����� ������� �
��8�����D��"���E���� )����� ������� ��������) ������)������ ����'������� )�������� ���� )� �
����� )� � ������ ��� ������ ������ �� ���� '� ��� ������ ��� ����� ?� � ���� '�� )�� ���8����� ���
�������������� ��� ��������������� ��.������ �����'�� )�����'������������ �� ���)��)� )�� ����
������� D )��������������������� � ���8����E���)�� ����� ������������ �.� ��� ��'���.� ���
�7������������������: �;3�
logii
j ij
tf Nw
tf df� �
= � �� ��
D�E�
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
=�
�)����#� ��� )�����'������������ �� ��� )�������� ������� jjtf� � ��� )������ )���������� ��
�)�� ������ � ���� )� ��� ���� �� �������@�� ��� � ���8����� ��� ����� �� �,��� ��,������ �����
������ ���,����)�� ������� ����
%������� ���� ����� ������������������ )�������� ���)��)��������� ��� �)���������������
��� ����,�� �����)����� ������������������ ������������ )��,�� ����������������� )�� �����
��������: �;�� � � ������� ��� )������������ )��������'� ����� ��� ��� ����,�� ���.� �������� �,�����
)�������� )���)����� ����� �'� ����� )����� ����,�� ������� ��������� ���������$���������� ��
)����������������������,���'3�
sim( , ) cos ( , ) i ji j i j
i j
d dd d d d
d dθ
⋅= =
%��� ���������� ������������������,�� � ���� ������� �������� )������������ ����� ���� )�� ���
���,�� ����������������� � �������)��)�D������� �����E����
�
������J�$��"G�5#"5�+���4�>��?�%4"�"G�%?G#4���K $�
��� )��� ��� ������������'�� )���� �������� � �,�������7�� ���������� ���� ���������������� )����
%��� ������ )��� ���� �� � ��� �� ����� ��� ��� �������� ��� �� ���� �� )��� )�� ������� ���6��� ������
��������)������ ���� )���������� )����������'������� �������.���.��)��)�������������������� ���
���� ������,��������'��������
����� %�������� � ��� &��������%���
#����������,������ �� �����,�� )��8���� ���� �� ���,��� ����� ��'������� ����,����� ���'���.�
4���)��� ������ )�� �������� �� �� ���������� �������)� ���� ��������� ����� �� ���� ��� G�,��� �� �� � ���
����,�� ���� ������,�� ������� �.�������8���� ��� ��������� �� ����� )��8����������������
D!E�
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
/�
�� ���,�����8��� ��?� � { }1 1 2 2( , ), ( , ), , ( , )t n nQ t w t w t w= � '����8����� ����� ��� ��������)������,�����
���'���� �������� )��� ������ ��� )�� ���� 8���� ���� )�� ��7 � �� ���,��� � ��� ����
{ }1 1 1 2 2( , ), ( , ), , ( , )t n nQ t w t w t w+ ′ ′ ′= � ��� )��� ��������) �� iw′ ���
�)��������������� )��������������� ���� )��4���)��������� )��:!<;3�
1
1 1t t i i
pos negpos neg
Q Q d dn n
β γ−= + −� �
�
�)���� 1β γ+ = .� ����� ��� )�� ���'��� ��� ����,�� � ������ �.� ��� ����� ��� )�� ���'��� ��� ���6
����,�� ������� ����)���������������� ����������� ��� ������� )������� �����������������
����,�� ������� ������ �,�� ��������,�� ������� �����8����������� ������
%� )���)������������������ ������������'� �)��������.� )��4���)��������� )������'��������
��� ����������������)�������������� ���� ������������� ����� ������)�������� )����� )����� ����
����������� ������ .� �� )��� ����,�� � ������ ������ ��� ���6����,�� � ������ � ����� � � �� ���.�
���� �������� ���� 1pos negn n= = � ��� )��4���)��������� )����)�� ��� ����� ���� �������� ��� )�
)������8����D�)��)������������� ��������L���� ���� E����������� �������� )�� ��������������� �
�'�,����)��4���)����������� � ���������)���� ����� �'������� ����������������� ���� ������� ��%��
�����'�������'���)�� �.� )��������� )������������� ��������������������6 ��� ��� ���� ���� )��
K ��4������� )���
���'�����������%���
K��4� ������ )�� ��� ���� ������ � ��� � ��������� ������ )�� )� � )��� '���� ������� �� �����
��� ����� ���� � ������� >���� �� �������@��� )�� K ��4� ������ )�� D���� : =;� ���� ����� � ����
���������� ��� � �� �� �,� ���.� �)���� ���� ���� ��� )�� ������ )�� ������ ���E�� �)�� ������ )��
���� ����� { }mTDRTDRTDRMTDR ,,, 21 �= � �������� � �����)�������)����� D�)���6������� ���
D E�
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
H�
�������� � ���E�������� ��� ��� ���� ��� ����������� ���)�������� ���'���� )�������� )������ ��
)�����'�������� ����������� )� �����'�������� ���������� ����� )���6������ ����������
%�� �� ���� � �� ���������� D���E� ��� �������� �� '� ������6 ��� � ��� �� �)�� 6 ��� � �� ���� �
������� �)������6 ��� � �� ���� � ��������� '� ������6 ��� ������� ��� ���.��)��)� ������ ��
������ )����������������������������� ������� )��4���)��������� )�3��
1 (1 )t t pos negLTD LTD d dβ β−= + − −
�
�)���� � 10 ≤≤ β �� ��)���)�� 6 ������ ���� ����������'����������������� ���� ( , )PosD NegD �
�)����(������������������� ������������������� ���� )���� ������������� ��� ���� .����#��������
������� �� ������� ���� �������� ���� ��������� ��'1�� � �� ���� �� ���� �� �)����� ����� )������ �,��
������ ��������������� �������� �,�����'���������� ������������������ �����������3�
D�E�
MTDR Algorithm (�d, fb: a relevance feedback document) Let TDR j be the jth interest category model of MTDR (see its description in text), M be the maximum number of TDRs maintained in MTDR, and θ is the decision threshold constant (0,1) for creating a new interest category model. /* find the most similar interest category model */ Let s = sim(d, TDRi) such that sim(d, TDRi) = maxj{sim(d, LTDj), sim(d, PosDj), sim(d, NegDj)} where LTDj, PosDj and NegDj are the three descriptors of TDRj ∈ MTDR. If (s < θ ) /* d is different enough from all existing models */ If (||MTDR|| < M) Create a new category TDR k using �d, fb. Else Update the long-term and short-term interest models of TDRi using �d, fb. Else /* update all models similar to d */ For ∀m sim(d, TDRm) ≥ θ Update the long-term and short-term interest models of TDRm using �d, fb.
�
Fig. 1. K��4������� )� .
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
0�
1(1 )t t posPosD PosD dα α−= − +
�
�)���� α� M� D�.�E� ��� )�� ��������� �� ��� %� �������� ����� � ���� ��� ������ ���� ��������� ����� ��
���� �,�� ���'���� ������ � '� �7�)������� (���� ��� #���� � �)�� ��� ����� � '� ����� ��
������ ��� ������ �� ���� � �� ��������� �����'�������� �7 ������� �� ���� �� ��������� �� )��
����6 ��� �����)�� 6 ��� ������.�������'�
( )sim( , ) 0.5 sim( , ) sim( , ) sim( , )d TDR d LTD d PosD d NegD= + −
�
>�����.� )����� ����� �'� ������������� ����������,���'��������' ���������� )����7�����
��� ����� � ������������������'������)� ���.��
��������������������������������������������������� sim( , ) max {sim( , )}i id MTDR d TDR= �
��) �����"��������������������%����
�����6'���������� )������� ������������ ���� ������������ )�� )� ���� �� �������� ���� �
'� ������� �� ������ �,��� ����� � �7������� ��� ����������� �� ���� � ������ � ����� �7�������
�� )��� )��������:!�;:!�:!!;: !;: ;��>����!��������@��� )��������� )���� ������� ����� ��������
�������� �� ��������7�� �������������������������)������ ��������� ����������� ����� ������ ��
��� D�E� ��������� ������ �� ��� D!E� )�� �� ������ ��� ����� ���� )�� ����,����� ��� ���������
������ ��D )��������'�������������������������� �������� ����)���,�������E����)��������
�������� � ��������� )�� �� ���� ���������� >��� �������� .� ���� � ������ �� ���� �������� ��
������������� ���������������������� ��'����������������� ������ ����'���������� ��������
)�� ������ ��@�� � ������� '� )�� *�) �������+DE� ���� ����� � �)�� ����������� ��DE�
���� ����������� ���� ������� �������������� ��7�������������������� ��'���������������
�)��*�) �������+DE������ ������������ �������� �,�������6�1�� ��� �)����� �����������
)����� ����:!�;:!!;: !;��1�� � )����������@���'������� )���)��������� )���� ��L������� �,��
D=E�
D/E�
DHE�
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
<�
������������� ��)����������@�� ��� ����������)��� )������� �,�������������� �����,������ ���
� �'��.� ��� ���8���������������)����'���,������ ���������������������� � �)��� ��������
)����)����� ����������������������6������ ��>���� ������'��� )��)����� ����������� �����
)��������.��)��)�)��� )������������������6'������� � ����������������� )������� )���7�� ����
)����� ����'� �)���'������� ���@�� ����� ������7������� ��� ������)������� �,�����������������
������� ������� )���� ��������� ������ ������ ��������
��� )��� ������ ��� �7������� � �� )� ��� ����� ���� '���� ��������3� �� %��� ��� &� "����� �
"���)'���D2""E������������� ���� )������������� ��DE����� ���.�������� ��� �������
� ���� � ������ )��.� ������ �,���� ��� )�����64���)��� ������ )�.� )������ �,�� ��� ���� �,��
�7������� �����!��.� �)��)� ��� ����� )�� �� ��� � ����� � �7������.� ���� �8���������)�� ��� )��
����������������� ��� )��4���)��������� )���������������������8�����?� ���� %���'�� )�������� �
Window-based Algorithm (�d, fb: a relevance feedback document) Initialization: S = �∅, a list of relevance feedback documents in order of arrival. C = null, target concept. P = �∅, a list of prediction results for performance monitoring. On observing a feedback document d with relevance value fb: Concatenate d at the end of S. If ( C null≠ ) Let p = 1 if Prediction(d) equals fb (i.e., correctly predict the relevance of d) or let p = 0 otherwise. Concatenate p at the end of P. Target Concept Learning: n = GetWindowSize(P). DLIST = Get the most recent n documents from S. C = LearnTargetConcept(DLIST).
>����!�������6'���������� ���� ���������������� )� ���
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
���
������ ��'� )��4���)��������� )���+���� ���������������'���������������'� )���)������ )��
��� ����� � '� ����� �� ������ � �� ��� )�� 4���)��� ������ ������ %���� �����.� )�� (��� ����DE�
���� ����D����>����!E���� )�����64���)��������� )�����������'�
1 if sim( , )
( )0 otherwise
Rocchio RRocchio
d DPrediction d
θ≥= ��
�)�������� )���������� )���)������� )��4���)�����������������
�)�����62""��� )��������� '� ������ � ������ ���� �7������� ��� ��!���� � ?� ��,##� '�� )�� &�
������ �������!��� )� �������� ��������� �������������� ���� ��)������������� ��������.��� )�
������ � �� )��� ���������� �.����'������� )������������7�����������,##� )� ���7���@��� )����
���������� ����� ���� ��������������3��
D0E�
>���� �������6�1�� ��� �)����� ��������� )���
Window-Adjustment-Heuristic Algorithm (P: {1|0}*, a sequence of prediction results) Initialization: Accuracy0 = 0. #PastPred = 10, the number of past predictions for performance assessment. WindowSize0 = #PastPred. If (||P|| > #PasPred)
| | | |
| | || # 1
#L e t
P
ii P P a s tP r e dt
PA c c u r a c y
P a s tP r e d= − +=
� If (Accuracyt > Accuracyt-1) /* if predictive performance is increasing */ WindowSizet = WindowSizet-1 + r. /* increase the window to include unaccounted r new examples */ Else If (Accuracyt < Accuracyt-1) /* if predictive performance is decreasing */ /* reduce the window size proportionally to current performance */ WindowSizet = max {2, Accuracyt ⋅ WindowSizet-1} Else /* predictive performance is stable */ If (Accuracyt ≥ 0.5) /* stable at a higher accuracy */ WindowSizet = WindowSizet-1 + 1 /* increase the window size by one */ Else /* reduce the window size when stable at a lower accuracy */ WindowSizet = max {2, Accuracyt ⋅ WindowSizet-1}
�
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
���
{0,1}( ) arg max sim( , ) ( , ( ))
i KNN
KNN i iv d D
Prediction d d d v fb dδ∈ ∈
= ⋅�
�
�)���� ( , ( )) 1iv fb dδ = ���� ( )iv fb d= .���� ( , ( )) 0iv fb dδ = �� )��������
�
�A���J��"��"G��"5#K+?����?%��?����%�%�$�4�%K �
"������������ �>��?�$3������������ � ���������������������7 �������������� ����'����
�� ��� ���� � ��� ������ � ��� � ���������� >��?�$� ��� �� ���� �� �7 ��� �7�� ���� ������ )��� ����
��������������� ���� ��������� ��� ���� ��� )���������'����� ���������� �������� )���7�� ����
)���� ������������ )� ��� �,� ��������������).���� )��������'�� )��� �������� )�������� )���
����%���� ���-����������
� � )��� '���� �)���� :�;:�=;� )� � �������� )�� ������� ��@�� ��� � �'��� ������ � ��������� �����
������ � )�����������'��� � �������7��� �� ���� ������� �����)�������������� )������������ ����
������� � �)�� ���'���� ��� �7����'� �� ��� ������ � ��� � ��������� '������� )�� ���� ����� ��,��,���
��� � ���� �������'��������� ���� .��)��)���� ��������7���� ������� )����,����7����������)��
���������� )���� ����� �'���,� ���� � ��� �� �� 1�� ��� �)� ��������� ������ � ��� � ����� �� ����
��'����� ��������'���� ��.��)��������) ���� ���������� ������
����'������?�������,��� )���� �����'�������� )��������'������ � �� ��� )� ������� ���
��� �'��� ��� )�������������� ���� ������������:�=;3�
)/1ln(
2
εε
dc≤∆
�
�)���� �>��.�∆� ��� )������������D����$�� ������E.������ ��� )��.����&"%�����&�����������������
������ F)�� )�����:<;��%���������� ���$�� ������.���������������� ���� ����������� ��)�,������
D��E�
D<E�
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
�!�
���������8�����������'����� ���� )� )������� ���� ������� .����,����,�������������� ������
,���������� ���� �� .� )��'����� ����� )� � )�� �����������'���� ��������������� � D���������
)��)��� ������ �� ��E� ��� ��������� �� )� ������ ��'���� ��� ������ ���� ���� � ������ � D)��)��� ��� �
�� ��E�� � 4������� )�� �� �� ��� ��� � ��������� �� �8�� ��� ��� ������� �� )�� ���� �� ���� ����
�����,���� )������������������������� ���� ����������>��?�$� ����� )������������������)��
���-��������������� %�
��������'� )������������� ��)��8���� )� ����'������'�����������'����� ������ �'��������� �
���������:H;:0;:�!;.������ ����� ��)��8�������,������������������������� ���� ��>��?�$���������� �
��� ����,�� � ����'���� � �� �� �������� �� ���� )�� ����� ��� ��'���� � �.� '� � ���� ���������
��������� �)������� ������ ��� +��,��� )� � )�� ����,�� � ����'���� � �� �7�� � ��� ���� '��
������ �� ��� ����.� ��������� ���� )���� ����'���� � �� ��� �8��,���� � �� �������� )�� �� �� ���
������ ���� .��)��)��������������� )�� ������������������
�)�� �� �� � ���� .� ������� ��� ������ ������ � ��� � ��������� �� ���.� ��� �� � ���� �������� ���
��'����� ���� �������'����� �����#��� �� ���� ��� �����L���'���� �������� �,����'��� �� )��
�������� �)���� )�� ��1��� � ��� ����'���� � �� ���� ������,�� �� � ?� � { }nxx ,,1 �=S � '�� �� �� � ���
��� ������ ���������� )������ �� ��������)� )� � ULS ∪= ���� φ=∩ UL ���)����'���,���������
������ ���� ���������������)������,��� ������� )� ��������� )����'������� ��������������'�����
������� ����,�� � � � ���� ��� ������)��� �������� )�� �,��� ������������ �� ���� �.� ���� �7�����.� ��
���'���������� ����,���������������,�� ������'������������,�� ��)������� ������'����
������ � ��� )�� ����� ����� �� ����� ��� 1���� ������,�� �� �)�� ���7� ��� ���� �������)� ��� ��
��� ��� )���� ������'����� �� LL ⊆R )� ������ ���� ��������,�� .���� ���7�����,������ �����
��� L R � �� )� ����,�� � ����'���� � ��� $����������.� ���� ���)� Rix L∈ .� �� � UU ⊆i '�� )��
���������������'�� ��������'����� ���� )� )���������������������� ���� )� ��������� � )���
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
� �
����� )���� � }|{' Riii xx LUS ∈∪= � �������� ��������� �����������′′′′������������ )����'������
���)�����'������� ����� ijx U∈ �� )� ix L����'����
��� ������ )�� �� ���� ����,�� ���'���� ��� ������ L R � ��8����������������'�� � )�� ������ �
'�)������)���� ���������������,��.� )�������� �D ������� ����E� )� ��������������,������ �����
D���'���������� E���� ��������������� �� )���� �� ��������� �'�������������'�������
�������������� �����7������������������ )������'���.�>��?�$���������������� �)������)�����
���,����� �� ������ �� ������� �� ��� ��� ����� �� )� � �� ������ � �� ������ �)�� ���������� ��� ����
�����'��� )������������� ���� �������
�� /!������ %�� ����
>���� �� ���� �� )�� ���)� �� ���� ��� >��?�$�� � � ������ �� ��� )���� ����� �� � ���3� D�E� �� ������ �
����� ������ �� .�D!E��������� �)������).����D E��������� ���� � ��������%������� ������ ����
�� �� � D5>$E� �������� ���� ���� ��� �� )�� ������ � )������)� '�������@���� )�� ���� � � �����
�� ������ ���)������)��������� )� )��������������������� ���������� )��������������������.� )��
������ �)������)������������������� )���� �� ������,��������� ������� )��� ���� ����
�)�������� ���� � �������D5��E��������� ������,���������)��������'��������� ���� �
���������� � ������������ ���)������)���������� �������� ���� ������'�����7��������.����������
Concept Formation
System (CFS)
Concept Hierarchy
Concept Drift Tracker
(CDT)
A stream of labeled and unlabeled data
Stream-S Stream-L
Stream-S′′′′ Existing
Concept Drift Learner
>�������>��?�$����)� �� �����
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
���
����������� �'�� � ′S � )� .� ��� �����'�� �'�,�.� ��� ����� )�� �7����� ����,�� � � ��� �)���
�������� ��� �� ��������� �����������′′′′�'�������������������� ��������� ′S ��������� �� )��
��� ���������,��� ������%�D���,�� �����E������� ���� ���������������� )�����)���� )���������'��
���$�� ���� ���� ���� )���'������ ���������� )������� ���� ��>����=�� �������@��� )�� �� ���� �����
������ )������������ �����
01�!����� "�� ��������2����� �������3���)�������� �)������)���� )��>��?�$����)� �� ���������
����� ��� ������ )� )�������������)���� ���� ���3�D�E����������������������� ���� ������D����.� �7 �
������ �E.� ��� D!E� ���� �� ������ ����� �������� � ������ � ����� )� � ��������@�� )����
������� ��� ?� � �� '�� )�� ��� ����� ������ ��� � '�� )�� ������ � ���� ������� �)�� ����������
������� ������� ����������'� )��5����������� ������ ���@���� )�������� �)������)3��
• δ�3���→���>��������� �������∈��.��� ����M�B �.�N .� �C�∪����������)� ��∈��'�� )���� ���������
� ������� �����)���� ������L������� .� �6����� �L������� ���� ����� )����� ��G�,����.�δD�E��� �������
>����=���)������������>��?�$L���������)���
Input: a stream of documents Stream-S. Initialization: Stream-L = �∅, the sequence of labeled instances. H = ∅, the concept hierarchy. Incremental Learning: For each instance x observed from the stream Stream-S Apply the CFS system to incorporate x�into H incrementally. If the label q of instance x is available, Concatenate �(x, q) at the end of Stream-L. Target Concept Induction (only when needed): Apply the CDT component to identify a new expanded set ′S based on the current values of Stream-L and H and then generate a new stream Stream-S′′′′ arranged by the arrival time of data in ′S . Apply a selected (conventional) concept drift learner to relearn Stream-S′′′′.
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
�=�
������ ����� �∈���� )� �'�� ��������� �� )�������� ��� ������������
• ε 3��→��3����)������� ������ ������������ ������ )� �'������ ���������� ����� ∈�.� )� ���.�
�������������� )� ������������ ������������������� ���� )������ ������� ����� ��
�)��δ���ε ����� ���������'������ ��� )��� ����� �������,�� �� �.������7�����.� ( ( ))xδε ���
�)���� ε ����� ����) ������.�δ������ ����)��δ����� ����� ������8���������� )����������� ���� )��
��� � ��������� �� ������ � ���� ����� )�� ������ � )������)�� �)��� �������� )� � )�� ����� ��
������ ����� ������ )��� ���������� D����.� �������� ������ )�������� ����E����� ���� �� ��� � D����.� ��
������� ���� )�������� ����E��#,�����������@� ���.��� )���)��������������� )����,���������
������ �� ��'���� ��� �����.� ����� ����� ��� ������ ������� ���� ���� ������ � �� �������.�
�� ����������������������� �,��������������� �,����� �������$���� ���� �������������������� ����.�
��� )��� )���)��.���������� )��5����������� � ��� ���������� ���� ��������������� )��
��,������ ��� ������ �� ��'���� ��� ������� ��� ������� )� � �� ������ � ���� )� � �� ��� �,���
��� � �������� ��������� )��'�� ������ �����
��� )��� �������� ������ �� ����� �� �,������ ������ � ����� ���� ������ )��: /;� D�� )���)�
� )������ �'��������� )������������'��������.��������� )� �: /;���������� )�� ����'� ������
�7 � �����E�� #������ )�� ������ � ���������� ���� ��� )�� ������ �)������)� ��� )�� �� ��� D���
�����E������2.��)��)����������� ������� )���,�������� ����� �� )�������� �����)'��������� )��
�)����������)�������� ����� ���� )��)������)� ���� ����������� �)��)��6��,����������
��� ��� ����� ��� � ������ ������'� )���)������ )�������� ����� � ������� �����)����
�� 6���� ���� � ��� ����������� � ������� ����� �� ,���� ���� �� �� �)�� �� )�� ��� ��� ����� �� )��
�������������������2������������ ���� )� ���� ���������� ������� )������ ���)������)����������
������� ����� ���,����:�H;��>��� .��������� �)������)������������ ����'��� ��������� ���� ����� ��
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
�/�
��� )�� ,���� ���� �� �� �������� )�� �� ����������� ���� ��� ������ ���������� ��� )�� ,���� ���� �� .�
�� ��� ������� ����������'�������� ����������@������� )�������� �)������)���)�� )���)���
��� )���������� ������� )���,���������� ���� )������ ��� ������� ��������
K ���������������.��� �4�'�� )�������� � D���� ��E�)������)������� �� ����� )��,���� ������ �
��� ������� �� �� � ��� ������ � �� ����������� ?� � tc H∈ � '�� �� ������ � ���� ��� )��)������)� )� �
����������� �������� ��� ������∈�����)�������� ����� ������� ����������4�'3��
( ) ' { } ( )
arg m ax ( , ) ( , ')tc H x c t T t x c
c m x t m x tε ε∈ ∈ ∈ − ∈
� �= −� �� �� �� � �
�
�)�����3���×��→� B�.�C� � ��� �� '������� �)���� ���� ���� ���)� )� � ��D�5�E�M� �� ��� � ( )x tε∈ .������
� )�������� �����.� �� ��7���@��� )�� ���������� '� ����� )�� ���'���� ��� ��� ������ )� � ����
���'���������������6�������� ��� ��������� �"����� �µ �'�� )���,�������� ����� �� )�������� �
����)'��� ������ �L�� �)��� ����9� µ� �������� �� )�� ������ � ���� � ��� )�� ������ � )������)��
�)��.���)��)���µ �D )���,�������� ����E�,���������������� ���������6���� ������� .����,����
,������?� �µ L������� �'�� )������ ���� L������� ���������µ ���� )�� )���)�������� )�����������,��6
�� ���� �� �� ��� ������� ������ � �� ����� �)���� ����� ���� µ L�� ����� � ��� ������ ��� ����������� ��
'������� � � ����� ��,���� )�� ��� ������ ��� � )��� ������ � �� �������� D����.� �,��6��������@� ���E�� ���
�,��� )�������'����.���� ����� � �� )���)���,�����'� �����µ � ���µ L�� ����� .� �,�������,��� ����
������ ��� �������3��
( ){ }'
1m ax ,k t t t s p a ren t t
t T
kT
θ µ µ µ µ∈
= + ⋅ −�
�
�)���� 10 ≤≤ k ����� �� � 5.0=k '������ .��)��)���7���@��� )���������� '� ������,��6�� ����
����,��6��������@� �������
%����� �������� ��� ������� ����� ��� ������� )���������������� ����3�
D��E�
D�!E�
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
�H�
�E p kµ θ< ����� 'p c∀ ∈ ��������� �.�����
'E 'c k c s parentµ θ µ≤ ≤ .����� ����� �������� L����'������������� ��� ������� ��
�)�������� �����,�� ������� � )�������� �)������)��� �����6�,���������������� ���������)�
��� �)��)� �������� �� )�� ������ � �� ����� ��� � �� ������� � ����� ����.� �������� ���� )�� δ�
���� �����'�,���
61��� ������������ &�3���)�������5��� ������� ������������'�� ������'������� ������ )� ������ ����
��������,�� �D����.��4E���� )����7���� )����'�� ��� )�����,�� �����'����� ���>�������� .����
����� ����� �� �� )�� �������� �� )��� )�� ������� ���6��� ������ ������ �)���� ���� � �����2� D����.�
������ � ����E� ����� '������ �� ��� �� )�� ������ � �� ����� )� � ���� '�� ������� ���� )� ���
��� �����D����.������� E���?� ��������M��D��.$�E.�….�D��.$�E�'��� )��� ���� ���������� ������� )�
� ������,�����1����� �$���%������� �� � )����� ���������,�������������)������,�����1����� ����
�� )�����D�������E������D������E��������������� �� )��� ����'��������'������������
�)��5����������� ������������ ������ ���������� ������������ )������ �� ��.�� � ���������� )��
���'���� ��� �������� ��� ����� ����� �� �������� �� �� ��,����� ��'6���'����� ��� �������� �� �������
������� ������$����������.�������������� � ������� ����,����.��)�� �����8���������������� ��
)������� �7 ��D����.����������� ����� )���������� � ����'������ �� )������� ������� ����E����)��
���� �,������������������� ����� )������������ ���� ������������� �����������)���� � ������
/������ 0�� ?� � ������� M� �D��.�E.D�!.�E.D� .�E.D��.�E.D�=.�E.D�/.�E.D�H.�E.D�0.�E�� $������� )� � )��
�� ��B�!.�/C.B��.��.�=C.�B� .�H.�0C�'������ �� ������ �.� !���� .������� �,�����)� ���.�δD�!EMδD�/EM �����
)������ ��� .������������)��.�������������� � ������� ����������M��D�!.�E.D�/.�E.���������M�
�D��.�E.D��.�E.D�=.�E������������M��D� .�E.D�H.�E.D�0.�E��
�)��������� ����������@��� ��8��������� � ������$��������)���� � ���������� ��'� )�� ���� �
� ������ ����������� ����� )������� ����.� ������������������ �,�������� ���� )� )�������
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
�0�
����,����� ,����� ���� � � �� �� ��������� � 5����� � � ��� ������� ��� ���)� �� �������� '�
����� ������������������� ��)���� 1����� � ��� )���������� )� ���������� � ����������
���� ����� )����8��������
/������6��-����� )������� �������/������0.��!������'���������������������'�������� ��
��'��8��� ������� .��/.�)��� )�����������,�����1����� ��$�������.������� ���������H�����
���������,�������������������������.������� �,������)���������@����8��������� � �����
������ ������������′�M�D�/.�E.�������′�M�D��.�E.D�=.�E����������′�M�D� .�E.�D�0.�E��
�)�� )��� � ��� ������� )�� ����,����� ��� ���)� ������ ��� ��� � )�� ������� � ����������� ���
�������� ���������� ��������� � )������������ � �)�� ������ ���� � � ��� )� ������ �� ��� � '�������
����� ��������� ���� )������� )��� ��� )����� �������� ��:� ;��5����8��� �.� )������,����������
������� ���������'��������������������� )������,�����,�������,���'� )����� ������� � ���
)�� �������@�� ��8������ ��� � ���� ������ �� '� )�� ������ � ���� ��� )�� ������� ���6��� ������
������ )� � ���������������������� )�����,�� ������� �.�����8��������� ��������� �����
)������� ���������'����������� )���� �� ������� ������ �����,�� ����������������� ��� )� )��
����,�����,����������������������� �D����.��D��.�E.D�1.�EE���
/������7��>����/������6.� ����� �.������������ ��'�������′�.����������,�� ��)���� ����� �
�������,�� ��������′��������������� )���'�,����������
�)�� ��� � � ��� �� ���,��� ��� ������ ����� ������ � )������).� ������ )�ε ���� ���.� )� � ����
����,�� � �� )������������ ������� ���������%������ ���� �������′���� )��������� ������� )��
�� ���,����� ������������������'� )����� ���������,��� ���������)���� ����L������,�����,�����
���������′������� � �� )� ����� �� ������� �������
/������ 8�� ?� � B�!.�/.�<.���CMεD �EMεDδD�/EE� ��� B� .�H.�0.���.��!CMεD EMεDδD�0EE� '�� )�� �� �� ���
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
�<�
������ ������,�� � �� ������ ����� ������/������ ���)����� �� �������������� ��������� �����
������′�M�D�!.�E.D� .�E.D�/.�E.D�H.�E.D�0.�E.D�<.�E.D���.�E.D���.�E.D��!.�E���
�
A���J+�4�K �"�$�
�������������� �������� �����
��� ���� �7������� �� ��� ���� �� ��'�� � ��� )�� 4�� ���6!�=H0� ���� ������� :/;.� ����� �� ������
������ ����� )��'���������� �:!;� )� �)�,��'��������������������� ������� �������)�� �� ��� �
��� ����� !=0�� ������ �� ������ ���� ��� =<� �����.� ��� ���� ���� �� �������� )�� ����O��
����������)����� ���� )�� ���������� ���� )��'���������� .��)��)���� �����/�=!������� �.�����
��� )��� �,��� �� �� �������� �� � D/ =!� ������ �E� ��� ,���� ���� �� � D���� ������ �E�� �)��
���������� ��������� �������� ��� ��� ��������)��,���� ������ �����������������7������� ��
���� �� �� )���,���� ������,��,����>��?�$���
%��������� ����������6���������'�����,����� �������.�� ������� )����������������.�
��� ������ '������� D����.� �� ��8������ ��� ��� � ���������E� ��� ���� ���� ��� � ���8��������
: H;���)�������� � ���������� )�������)����������� �� )����"������ )��D�����8���E���
���/��������(�� ����
�)�����������7������� �� ��� ���'���,�� )���� �� ���������������� ���� ������� ��D����.� ������ �
���������� ���� �E��)���������� ���� �� �����%��������.� )���� �� ���������� ���� )���� �����
��������� �� ����������8��� ����.����� ����������������������������������7�� �� ��� ��� )�
������ � �������� � ���� ������� ��� ����������� ��,������ ����������������������� �,�������� ���
%� ������ ��� �������� ��� ��������� ��� )�� �6������ � ��8������ ��� �� �� � ������������
���������� � ��� )��� ������ �� ��� &���� 2 ��� >���� /� �����'��� )�� ��������� ������� ��� )��
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
!��
�7������� ���������� )�� ��� ����@� ����� ���.� � � ������������������ ��� )�� )���)�������� ����
�����@���� )����� �������������@� �������� �������>��?�$����
����������� )������������� )�� �� �� .�������� )��� ����� � ���"�� ���������&"��� ������
:!=;.���,������ ��)��)���������������8���� ���������� ��)���� �� ������������������� ������� )��
������ ���� ��� ���� � �� � ������ �� ������ �� )��� )�� ��� �� ������ �� D�)���� �� ��� �� � ��
��7��������'������ �� ������� �� ����������� �������������� )�������� � ������������E��
?� �(�'�� )�����'������������ ��������� �,�� ������ )� ����������� )�� ����������� ��������
'����������)������������� )�������� ��� ��������������������,���������������
100%t
PAccuracy
n= ×
�
�)��������� ��� 2�,��������������� ��'��,�������� )���� �� �������������� )������ � ��������
���� �� )��������
Input: a data stream Stream-S generated from the training set. Initialization: 1. Let Stream-L = �∅, i.e., the sequence of labeled instances. 2. H = ∅, the concept hierarchy. 3. Determine the density threshold of distinct concepts from the validation set. Experiment Procedure: For each tracking cycle i = {1 … K} 1. Process incrementally the ith m-instance sequence from Stream-S. For each instance x from the m-instance sequence Update H to incorporate x using incremental concept formation system. If the label q of x is available, Concatenate �(x, q) to the tail of Stream-L. 2. Execute the Concept Drift Tracker (CDT) algorithm to generate the new stream Stream-S′′′′ from current values of Stream-L and H. 3. Run a selected concept drift learner (e.g., one of the four algorithms described in Section III) to learn Stream-S′′′′ and measure the accuracy of the learned concepts on the test set.
>����/���)���������������7������� �����>��?�$��,���� ���.
D� E�
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
!��
����� &�������&���
�)��� �� � ��������,��� ���� �������������� ����������� ���� �������� ���.������������ )� �
�����'��� )���,��� ������� ���������� ���� ���,��� ������)���)��������� ���������� ���� ���,��� ����
���������� ��'��� ���� ������������ ���� ���������.����.����.����������� 9� ��������)����
��,�� �������������������������� ��D �� ���E��)������@������ )�� �� ��� �����H=.�!!.��!�.�!=����/</.�
������ �,���� ��'��� �� ���,���� )���� �������� ����� ���� ��� ���� �7������� ��� ��������� ���� ��
������ ��� )���,��� ���������������� ���� ������� ����������� �����!���� ������� ������ )����
���� � ������ �.� ������ �,�������)�������� ��� )�� �'��������'��� )�����'������ )�� ��������
������ ����� )���6������ ���8������ )� �������������� ����)� �������������D��M�����������
�������� ����E�� ��� �������� ���� �.� ���� �7�����.� �������� ������ !�−��� �������� ��6������ �
��8������� ���)�����)��)� ��� �������������� ������ .��������� ������ .� ��� ���) �� )���
D���"���������� E������� �.������������� ������� )�� ���������� ��������������������
)����8�������������� ���� )�PQR����P−R�������������� ���'����� �.���� )��� ����'��������
�����,����'��� �� )���� �� ������ ������� ����������������)��� )��������� ��D�� )�� �PQR�
TABLE1
The description of tracking tasks and the evolution of target concepts over twenty-tracking-cycle periods.
Tracking Cycles
1 − 20 21 − 40 41 − 60 61 − 80 81 − 100
Tracking Task 1
(Trade, +) & 9 others
(Trade, −) (Coffee, +) & 8 others
(Coffee, −) (Crude, +) & 8 others
(Crude, −) (Sugar, +) & 8 others
(Sugar, −) (Acq, +)
& 8 others
Tracking Task 2
(Trade, +) (Coffee, +) & 8 others
(Trade, −) (Coffee, +) (Crude, +) & 7 others
(Coffee, −) (Crude, +) (Sugar, +) & 7 others
(Crude, −) (Sugar, +) (Acq, +)
& 7 others
Tracking Task 3
(Trade, +) (Coffee, +) (Crude, +) & 7 others
(Trade, −) (Coffee, +) (Crude, +) (Sugar, +) & 6 others
(Coffee, −) (Crude, +) (Sugar, +) (Acq, +)
& 6 others
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
!!�
���P6PE��������� �����'����� ����)��� )����'���������'����� �������� ���,��� �� )���� ��.�
)����� ������� )���� ��L������ ����,�����������������������������'��������)� �������������
������������� �������,������������������� �����
>��� �������� .� ���� � ������ �� ���� ���� � �'��� ���� ������� ��� ��� � �������� ��������
>��'���������� ��� �� )� ������ )��'�������������)�������� ���� ������� ��������,���� � )��
���� � �������������������� )�� ��� 6 �������������������.� )� ���.�� � ���������������.�!�.����
��� ��� ���� ������� �� )� ���� �,�� DQE� ��'���� ����� �� ������ � ���� � ������ �� � � )�� ������ �,��
����������������� ���� )����� �,����'��������� ������,�� ������� ������������� ���� �'���)�
���� D��� ���)���@�� )�� �7�� ���E� ���� � ������ ��� � �)�� ���� �,�� ��'���� ��� �� ���,������
�� �'���)�� ���� ������� ���>����7�����.������� �,������������� ���� �������� �����������,���
������ )�� ���� � �������� ����� �� �� �'���)� �� ���� �� ���� � ��� ����� ������ �)�� ������ � �� �
���,��������� )��!�� � ���������������� ������������� �,������������ ������������ �,��
����������� .��)������� )�� ���� ������� ����������� ��������
���/�������������
>���������� ���� ���������.� ��������'�� ���$�� ���� ���.� ���� ��������� ������������� )��� �����
������′′′′������� ��'�>��?�$3�D�E�K ��4������� )�.�D!E�4���)��������� )�.�D E����62"".����
D�E����64���)���� � �)������� ������� >��?�$� ��� �� �7 ��� ��� �7�� ���� ������ � ��� ��������� ����
��������� )���������'����� ����)�������.� )���������������������7�� ���������� ���� ���������
��� �7��� �� �� �����,�� '���������� ������′′′′��,��� )�� ������������ ��� )���� )� ������� ����
�������D����.� )�������������'����� ��� ����E���)��������,���������������� )����'�,�������
'������ ��������� � )����7��� � �����
��������7������� ������� �θ�M����H=.�'�M�0.�β�M��������α�M��� ���� )��K ��4������� )��: =;.�
�������� �β�M�������� )��4���)��������� )��: =;������,�������� �������6�� ����������� �������
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
! �
)�����64���)��������� )�.����,��� )�� )���)���� ��� � ��(��� ����DE� ���� ������������!=� ��
�� =�� ����!=��� ��,���.�������� )��'�� ������ ������������������������������$�� �����.���������
,��� )��&�,�������� )��2""�'�����������������!� ��!����� )�����62""������� )����
>��?�$��������'������������=S���� )����'����� ���,����'��� �� )���� �� ��$����������.����
���,���� ����'��������� � )������ � �������������������� )�� ��� 6 �������6�����������9� )��
���������������������� ���� ������������ )�� �������>��?�$������� ��7��� �� ���)������� ���
)�� ��7 � ��� � �������� ���������� ����� ���� ������ � ��� ������������ )�� � >��?�$� )� � ����
���,����������D���SE���'����� ���� ��������� ������)��������>��?�$�D�� )�����=S���'����
� �E���������,��� )����������������
/���������
>����H−<��������@�� )���� ����������7������� ����� �������� ������− .������� �,�����)�����S6
?����=S6?������������������� �������������������� ���� ������������ )�� �>��?�$� )� �������
��������S����=S���'����� �.������� �,�����)��=6S?����������������������,����� )��'���������
�)���� )�����S6?�����'��,�������� )�����������������6'������)��>��?�$������������������
������ ������� )�������� ������ )� �������� )��=6S?�������������.��7��� � )� �>��?�$������
� ���@��� )������������������'����� �.��)��)������ � )���������� )��=6S?��� ������������� ��������
����.� )��=6S?�������S6?��� ����������������� )������'����� �����
%���7��� �.� )�����S6?��� ������ ������� � )��� )���������� )������ ���������,����������� �
�����'����� ����%��������� )������=S6?��� ������,�����������������'��������'��� ������ ����
)����������������)��������� ���� )�� ���������'����� ����)������������'� ��������S6?����
=S6?� ������������� �������� �� �� ����� ���� �����,���� .� )�� �7 �� � �� �)��)� )�� =S6?�
������������ ���� '�� �����,�� '� >��?�$�� %�� �)���� ��� )�� �������.� >��?�$� ���� ����� �,���
�����,�� )�������������������7�� ���������� ���� ���������������� )���D=S6?��� ���E��7��� �
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
!��
)�����������������>��?�$�D=SE�������������64���)�������������� �������� ��������� ������� )�
�� ���� )� ����� )���������������������� )��������,�� )�������������′′′′�� �����,��� �������������
��� �������� ����� �)�������.� )�� �������� ��� )�� ���64���)��� �������� ���� �����,���� � ��
����������������'�,������������������� �� )�����'������ )��� )�������� )��� �������
>����������� ������7����������������������,��� �������,���'� )��K ��4������� )�����
�������� ���� ���7��� ���� )����� � ��� � ���������������)���� ���� � ��������,��,��� 9.���� �
43
48
53
58
63
68
73
78
MTDR Rocchio Win-KNN Win-Rocchio
Ave
rage
Acc
urac
y (%
)100%-L 5%-L FEILDS (5%)
�������
35
40
45
50
55
60
65
70
75
MTDR Rocchio Win-KNN Win-Rocchio
Ave
rage
Acc
urac
y (%
)
100%-L 5%-L FEILDS (5%)
��������������>����H��+�������������� �������� ���������������������������>�����0��+�������������� �������� ����!��
40
45
50
55
60
65
70
MTDR Rocchio Win-KNN Win-Rocchio
Ave
rage
Acc
urac
y (%
)
100%-L 5%-L FEILDS (5%)
�������
35
40
45
50
55
60
65
70
75
80
1 21 41Tracking Cycle
Acc
urac
y (%
)
100%-L5%-LFEILDS (5%)
��������������>����<��+�������������� �������� ���� �������������������>��������+������������,��� ������� )��K ��4�������������������������������������������������������������������������������������������������������������������������� )����� �������� ���� ��
�
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
!=�
��� )�������������������� ��)��,��'�>��?�$��,��� )��'��������������������� ���� ���������� .�
����������������������,���'� ��� )��� )���������������������S6?��� ������ 9��������� �� )��
��� � ������� � ����� �� ������� "��� )�����.� )�� ��� � )� � >��?�$� ��� � ���� �'��� �� �����,�� � ��
������������� �� ��� �����.� �� )���)� �� )��� ������.� �� )� )�� ����������� �,����'��� � ��� � 9�
������ ����� )��'�)�,�����7��� ������� )���� �� ���
�)��8���� ���� )�������� �D���� ��E�)������)���� )������������� )����� �������������@� ����
�� )�� ����� ����� � )�� 8���� ���� )�� �� ��L�� �� �� �� %� )���)� >��?�$� ��� �'��� �� �� ���,��
����� ����,�� � ����'���� � �� D����.� '� �1�� ���� )�� ������ ��� ��� )�� ��� ����� ��������@� ����
�� )�9����������)��� )����)�� �E.��������� )������'����� ���� ���,�������'��������,�� ����
�������� ����'����� � � ��������� )� � )������������,�� �� )�����������������>��?�$������'�����
'� ��� )��� )� ���� )�����S6?��� �� ��
�)�� ����� �7������� � ����� �� �'�,�� ���� ������� '� �� ���� )�� )���)��� ���� ��� �����
��������@� ���� �� � �� ����� � ,����� D����.� &M��=�����=� ����8�� �!E�� �7����� ��� �7������� �������
��� )�������� �� ���'���,�� )������� �,� ���� )�� )���)���,���������D�E� )��8���� ���� )���� �
��������� ��'� )��5����������� .����D!E� )���������L����������������������������������′′′′���
�)�� 8���� � ��� ��� ��� �������� ��� ����� ��� ����� ��� ������� �)�� ����� ��� )�� ������ ���� ���
��� ������ ��� ��� )� � ���� �������� �� ��'���.� �)���� )�� ������ ��� )�� ������ ���� ��� ������ ��
��'���� ��� ������ �������,��� ���� ���� � ��� ������ ��� )�� ������ �)������)���)�� ������� ���� ����
������� ���� )���� ��������������������� �,������� ������� )������ � �������� ���� �� )�����
D����.������ �� )���� ��"��������� ��)��8��E.��,�������,��� ��� ����������
>���� ��� ��� �!� ���,��� )�� ����� �� ��� )��� �7������� �� >��� ����'��� .� �� )���)��� ��� ���
0
tfθθ
= � ��� �� ������ �� �����'�� �� ���� �,�� )���)����� )� ������ � � 0θ �� � ��� )��� ������ .� )��
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
!/�
)���)������ ������� )������� ��� ����.���� ��'�J���� )���������.�������� )��D���.����=E���������
>������������� �� ����������� �� )� �������� � )���7��� � ���������������������%�)��)��� )���)���
���������� )����,�����������������)��)��� )���)���D 1.1tf > E�������� �������)��)������� �������
��������)������� ��� ��������,��������� �������'� ������������������)��)���,���������
>���� �!� �������@��� )�� ������������� ��� )�� K ��4� ������ )�� ����� ��������� )�� � �����
������′′′′��,���,������� )���)���,�������� ��)���� )� � )������� ��� ������������� �,���� �'���
������������� � � )��)� �,������ ������������ $������� )���)���� �� �� � )���� �����,�� )��
������ )�L�� ������������.� ���,������� �� )�� '�������� �,������ ������������ ���)��� )���)���
��� ���� D 1.1tf > E� ���� ������ �� �� � ����� ��� ����� � )� � ������� )�� ������ )�L�� �,������
������������,������)������� )��� )������� )��'�������������
�
�
0
10
20
30
40
50
60
70
80
90
100
0.80 0.90 0.95 1.00 X 1.05 1.10 1.20threshold factor (tf)
Noi
se o
r Cov
erag
e (%
)
Noise Coverage
��������
10
20
30
40
50
60
70
80
0.8 0.9 0.95 1.0 X 1.05 1.1 1.2
threshold factor (tf)
Ave
rage
Acc
urac
y (%
)
Tracking Task 1Tracking Task 2Tracking Task 3
��������>���������)��8���� ����$L��,��� )���)�������������������������>�����!���)�����������������K ��4������� )��������������������������� ������ �������� ���� ��������������������������������������������������,��� )���)������ ����
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
!H�
A�����$5-$$�#"�#>�4�?%�����#42$�
-������ ���� ���������)���'��������� �,���������)��������� )��������� ����4� ���,���:�;:�/;: 0;.�
�� ������� � %��� �� : ;:=;:��;.� ��� K ��)���� ?�������� :!�;� ������� ���.� �� ����� �� �����
4������)���� ������ )�� ���'���� ��� �)������� ����� �� ���� �� '� �������� ����� �� ���� �� ���
������� ����� ��� ����6 ��� � ��� �)�� 6 ��� � �� ���� �� :=;: �;.� ����������� �7������� ��� ����� �
������:!�;:!�;:!!;.��� ��� ������������� )������� ����������������'����:�;: ;:��;.����'�
�������������,��� ������������ )��:!0;���)���� ���������� ����������� ���� ����������������
�� �'���)� '����� ��� )�� ��� � �� �� ��� )�� ������� ������7� � '� ������� �����������
������ �����'�� � )������������ � )� �����������:�;:�=;��+��� ����� ��)��8������� � �������� �
��� �'��������������� �����) � )���)������: �;.���� �,����1�� ���� )����������@��: !;.�
����7����� ��� �� ����)������� �7 �� )����)��� �6���������: ;�������6��������������:��;����
%� )���)��� ������������������ �'��������� ��D� � ���������� ���� �E.� )����)���'������������
���'������������ )��� )� � �7���� �����'����� �� ��� )�������������� �������� ����'����� ���
�)���� ������� )�� �7��� � ���� K �7���@� ���� :�!;.� 5�6 �������� :0;� ��� G���)� K ��6�� � :H;�
������ )����%���,��� ������������ )��)���'��������� ����������� �� ��� ��� �,����1�� � )��
���������'���)����������'����� ��:! ;������������ ����4� ���,��.��� ��� ���8�����7��������
�� ����7���� ������'����� ������� )�� ��������������� ��:!H;����
������� �,�� $AK � D�$AK E� ��� ������� ��� )�� '���� �������� ��� )�������6'���� ������ �
��� ���������������� )��:�<;.���������� )���� �� � ����������� ������'����� �� ��� )�� �� ��� �
������ )�� ��������� ��������� ����,��.� )��� �������)� )��� ��,��� '���� �,���� �� ������ ������
��'���� � �.� ������� )�� ����� �,������ ��� )��� �� )�� �������� ��������� � ������.� )�� ���� ���
�$AK ������������� ������������������ ��,�������)���� )��,���� ������������ �� ��� ���������������
���� �,�����������.���� )�������'��� ������7���@������������������: <;��
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
!0�
A����5#"5?-$�#"$�
��� )�,�� �����'�� ��� �,���� �� �� ���� �� )�� ���� �������� �7 ������ )�� ����'��� � ���
�7�� ���� ������ � ��� � ��������� ������ )��� ���� ��������� �� )� �������� ��'���� � ��� �)��
�7������� � ����� �� �)��� )� � >��?�$� ��� �'��� �� �� ��� ������ �����,�� )�� ������������� ���
�7�� ���� ������ )��� �,��� ���� ��� ����� ����,�� � ����'���� � �� '������ �,����'���� �)�� �����
���,�� ������������������)���� )� �� �������� ��������7 �������� � ��������� ��'�������� �)���
������������������ ���� ��,��� ����� ������ ��)��������� )������������� ��������� )������
� ���� � ��������� �)�� ��)���,���������������������>��?�$���������������� ����� �����1���
��� ���3� D�E� )�� 8���� � ��� � �� ������ � )������)� ��� D!E� )�� �'��� � �� ������ �� �������@�� )��
�� ����������� ��� ����� ����� )�������� �)������)���)��� ������ �� )� ����� ��� � �� �����,��
)�� ������ � �������)� ��� �� ����� � � �� � )��� ������� ���� ������� ���� '�� ������� ��� )�� ��6
������������ ��� ��,�� ���� �� ���� �� )�� )� � ����� �����,�� )���� ��� ��� ����� �)��� ��� )��
��'1�� ���������� ����������
�
REFERENCES
:�; %����.�(��D�<</E�� �������� ���4���,�����>��'�������� ������� ����>�� ������� ���(�� ����� �%�0:�%�!������������������������ %�����������������!������������������.����!H�6!H0��
:!; %� T�.�5�.��������.�>����������.�$��K ��D�<<�E��%� ��� ���?��������������������4�����������7 �5� �����@� ������'������� ���������!������������2����.��!�D E3�! I!=���
: ; ����'���,���.�K ��D�<<HE��%��%�� �,����'�+����4�������� ����$��,���������(�� ������%�0���!������������������������������������.����� H06 0=��
:�; ��� �� .� +�?�.� ��,�.� $���� ��� 2�������.� $�4�� D�<</E�� ?�������� 5)������� 5����� �� '��7���� ���� )��$ ��� �������5)����������������������������%��2.������ �6� <��
:=; �������.� ��� ��� +�@@���.� K �� D�<<<E�� %� +�������� "���� %��� � )� � �����.� ?������ ����7�����������(�� ������%�7���!�������������������������������������.�����!/06!H=���
:/; �����.� 5�� ��� K ��@.� 5�� D�<<0E�� -5�� 4����� ��� ��� K ��)���� ?�������� �� �'������) �3FF��������������FU������FK?4����� ���) ��.� -��,���� � ��� 5���������.� ��,���.������ ��� ����������� �������5���� ���$���������
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
!<�
:H; ����.�%�����5)����.�$��D!���E��?�������������?�'�������-���'������ ��������G���)�K ���� ������(�� ������%�0;�%�!��������������������'� %����������.������<6!/��
:0; ����.� %�� ��� K � �)���.� ��� D�<<0E�� 5��'������ ?�'���� ��� -���'���� �� �� �� )� 5�6�������������(�� ������%�00�%��������������������������������������%��2.�����<!6�����
:<; �������.�%���)�������) .�%�.���������.������������ ).�K ��D�<0<E��?�����'��� ���� )��A�����65)��,�������������������<�����������%��'.� /�D�E3<!<6</=��
:��; 5)��.�5��5�.�5)��.�K ��5�����$��.�*��D!��!E��+A%3�%�$���6%�� �,��+��������A����%��� ������ $������� ������ ��� %� ��� �� ��7 � 5� �����@� ���.� <������� ��� !��������� !������������2����.��0D!6 E3�H 6�<���
:��; 5)��.�?�����$����.�2��D�<<0E����'K � �3�+��������%��� �����������������$����)��������(�� ������%�6���!������������������������������������.������ !6� <��
:�!; ����� ��.� %�+�.� ?���.� "�K �� ��� 4�'��.� ��� ��� D�<HHE�� K �7����� ?�����)��� ������������� ���� �� ,��� )�� �K �%����� )����<������� ��� �%���2��� �������� ��� �� ��2.� $��������.� <D�E3��6 0��
:� ; G�''�.� ��K .�������.� 5�� (�� ��� 4�'�����.� (�%�� D�<<=E�����'������� ?����� ���%� ���������� �������������?�����+����������3�A������� �����������������4����������"���*���3�#7����-��,���� �+������
:��; �������.� K ���.� $���� .� 5�� ��� ����.� 2�� D�<<0E�� �7 ��� ���� ����� 5�� �7 �� '� %����������.� !D!E3����6�!0��
:�=; ����'��.� ��+�� ��� ?���.� +�K �� D�<<�E�� ��������� ���� ���� 5����� �� '� K �����@��������������� ���'� %����������.���D�E3�!H6�=��
:�/; ����.� ��� %�� D�<<0E�� �)�� �4�56H� >�� ������ �����3� ������� ���� ��� %�������� ��� ��� K ��A���)����������2���������D��E.�"�$��$�������+�'���� ����=��6!�!3��%�=�%������������������>��/"=15����� 6=/��
:�H; (���.�%�2�� �����'��.�4�5�� D�<00E���������%��� ������������������� ���������5�����.�"�(�3�+��� ����������
:�0; (�����.����(�.�$����.�%�����$�����,��.���� D!���E��4����?���.�4����-��������4����"���3�%�$ �����%����������-�����V���������� )����'��!�����������(�� ����������'�������.� /D!E3�!�H6!!H��
:�<; 2������'���.�4��D!���E��-�����?�'�������-���'������ �� ��?��������� ����5����� ������!<�!"?0� ) ��&�%��� ��� �������� ����� �������� ���� �������� ������ ) �3FF���6���������6�� �����F�#2-K�"��F�������'���U!���������
:!�; 2������'���.� 4�� ��� (���)���.� ��� D!���E�� �� �� ���� 5����� � ���� � �� )� $����� � A�� ���K ��)��������(�� ������%�0=�%�!��������������������'� %����������.������0H6�<���
:!�; 2������'���.� 4�� D�<<<E�� ?������������ ����5����� ���� )�+�� ����-���� >��'���������@��+������������*!" � %������0�0�7�'�� %�����������> *'�"::1.�+�����.�+� ������>���.�A�������D��E��
:!!; 2������'���.� 4�� ��� 4��@.� ��� D�<<0E�� %�� �,�� ������� ���� >�� �����3� ?�������� ��� )��+�����������5����� ����� ���������!�) ��&�%����������������������������+�����.����� 6����
:! ; 2� )���.�4�����(���.�A��D!��!E��?�������������?�'�������-���'������ ������(�� ������%�6??6�!������������<�������������#�����#����&�.�����!0� 6!0�0����
TO APPEAR IN IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING
��
:!�; ?���.�2�� D�<<=E��"���������3�?�������� ��>�� ���"����� ���(�� �� ��� �%�06�%� !��������������������'� %����������.����� �6 <��
:!=; ?����.���������4����� �.�K ��D�<<�E��%�5�����������������?��������%����� )���������7 �5� �����@� ��������(�� ������%�7�����������2������������� ���������2��������!������������������.�����0�6< ��
:!/; K � �)���.���K ��D�<<HE��'� %������������"���*����3�K �G���6������
:!H; K � ��.�K �.�$���)��.�%�����������.�5��D�<<0E�������,����%� ��� ���V�����7������������(�� ������%�60��������������� %�����������������!������������������.�����!�/�6�!����
:!0; K�����.�%�����W��)����.�G��D�<<HE���,��,������K�� �6���� �������� ����>�� ������$��� �������%K%?���%�����(�� ������%�0���!������������������������������������.����� <�6�� ��
:!<; 4���)��.�(�(��D�<H�E��4���,�����>��'�������������� ����4� ���,�������G��$�� ��.��%��'�������������2���A�/�������������������� ��� �����(�� �����.����� � 6 ! ���
: �; $�� ��.�G�� ���K �G���.�K �(�� D�<0 E�� !������ ����� ���'����� !��������������������K �G���6�����+�'���)����5�������
: �; $�)������.� (�5�� ��� G������.� 4���� D�<0/E�� ����� �������� ��� +���������3� ���������5����� ����� �����(�� ������%�B�%�#���������������������� ����!������� .�����=�!6=�H��
: !; �����.�G�����2�'� .�K ��D�<</E��?����������� )��+�����������5����� ����� ���������5�� �7 ���'� %����������.�! �D�E3�/<6�����
: ; �����.�G��D�<<HE�����������5�� �7 �5)������ )����)�K � �6?���������'� %����������.� 3!=<6!0/��
: �; ���� ���.�����.� �������.���4�����*��.�(�� D�<<<E��%��%�� �,��%����� )������?��������5)���������-������ ���� ������(�� ������%�;�%�!��������������������!���������������,�������'�������.�������=6��!��
: =; ���� ���.�����.��������.���4�����*��.�(��D!���E��?��������-������ ���� ����������� )����)���6������� ��� 4������� � ����� <������� ��� �%� ���� ��� �� ��2� ���� !����������� � �� .�=!D E3!�!6!!=��
: /; ���� ���.�����.��������.���4�����*��.�(��D!��!E��%���������� ���%������)� ������������5��� ����������)�����(�� ������%�6���!///�!�������������������������'�����.�����H�=6H�0��
: H; �� ��.�����.�K ���� �%������������5��D�<<�E��'��������*����2��A���������������!��������� ����������!������"���*���.�"*3�A���"�� ����4���)����
: 0; *���.� *�.� 5��'�����.� (���.� �����.� 4���.� +�����.� ��.� %��)�'��.� ����� ��� ?��.J�� D�<<<E��?��������%������)��� ������ �� ����������������"�����,�� ��� !///� !����������2����A��� ����!������������ ����������!���������!������������������.���D�E3 !6� ��
[39] W)���.�������#����.�>�(��D!���E���%�+��'�'��� �%���������� )��A��������-���'������ ������5��������� ���� +��'������ ��� (�� �� ��� �%� 0=�%� !������������ ����� ��� '� %��� �������.� ������<�6��<0�