數位典藏的知識組織系統之模式建構與應用研究: 以故宮中國節慶詞彙為例...

28
數位典藏的知識組織系統之 模式建構與應用研究 ── 以故宮中國節慶詞彙為例 陳淑君 1 *、郭巧蓁 2 ** 本文旨在探討如何為我國數位典藏系統建立一套完整語意關係的多語索引典, 以改善數位藏品的檢索結果之精確性。目前數位典藏系統大多使用不同標準的控制 詞彙來描述藏品物件,導致使用者的檢索效能受限,為解決使用者進行跨系統、跨 資源、跨學科與跨語言搜尋的問題,建立語意互通的數位典藏系統,是當今重要的 研究議題。 有鑑於全球現今尚無專門屬於數位典藏與中國藝術領域的索引典,本研究將 藉由目前許多美加地區的博物館所採用「建築與藝術索引典」(Art & Architecture esaurusAAT)的知識架構與多語言特色,結合故宮博物院的控制詞彙與藏品, 為故宮「中國節慶」藏品建構多語言的知識組織系統,產生藏品與藏品、語意之間 的脈絡連結。由於 AAT 係以西方觀點為基礎建構藝術詞彙,為彌補可能的視野與 文化落差性,本研究採取藏品保證原理、文獻保證原理、滾雪球取樣、對應分析 mapping analysis)等不同方法,對詞彙的概念進行內容分析,並採用索引典的三 類語意關係(等同關係、層級關係、聯想關係)和 Pustejovsky 的屬性結構(qualia structure)作為分析的理論基礎,找出中西藝術知識架構的差異並修正歧異點,補齊 中國節慶資料及數位典藏重要知識概念的版圖,以為未來的中國藝術數位典藏提供 一套實用的知識體系。 * 中央研究院臺灣史研究所助研究員暨數位文化中心執行祕書。 ** 中央研究院臺灣史研究所研究助理。

Transcript of 數位典藏的知識組織系統之模式建構與應用研究: 以故宮中國節慶詞彙為例...

數位典藏的知識組織系統之 模式建構與應用研究 ── 以故宮中國節慶詞彙為例

陳淑君 1*、郭巧蓁 2**

摘 要

本文旨在探討如何為我國數位典藏系統建立一套完整語意關係的多語索引典,

以改善數位藏品的檢索結果之精確性。目前數位典藏系統大多使用不同標準的控制

詞彙來描述藏品物件,導致使用者的檢索效能受限,為解決使用者進行跨系統、跨

資源、跨學科與跨語言搜尋的問題,建立語意互通的數位典藏系統,是當今重要的

研究議題。

有鑑於全球現今尚無專門屬於數位典藏與中國藝術領域的索引典,本研究將

藉由目前許多美加地區的博物館所採用「建築與藝術索引典」(Art & Architecture

�esaurus,AAT)的知識架構與多語言特色,結合故宮博物院的控制詞彙與藏品,

為故宮「中國節慶」藏品建構多語言的知識組織系統,產生藏品與藏品、語意之間

的脈絡連結。由於 AAT 係以西方觀點為基礎建構藝術詞彙,為彌補可能的視野與

文化落差性,本研究採取藏品保證原理、文獻保證原理、滾雪球取樣、對應分析

(mapping analysis)等不同方法,對詞彙的概念進行內容分析,並採用索引典的三

類語意關係(等同關係、層級關係、聯想關係)和 Pustejovsky 的屬性結構(qualia

structure)作為分析的理論基礎,找出中西藝術知識架構的差異並修正歧異點,補齊

中國節慶資料及數位典藏重要知識概念的版圖,以為未來的中國藝術數位典藏提供

一套實用的知識體系。

* 中央研究院臺灣史研究所助研究員暨數位文化中心執行祕書。** 中央研究院臺灣史研究所研究助理。

040 數位人文研究與技藝

A Study of Knowledge Organization System for Digital Archives in the

National Palace Museum Collections of “Chinese Festivals”

Shu-jiun Chen1*, Chiao-chen Kuo2**

Abstract

To improve the search accuracy in digital collections, this paper aims to explore how

to establish a multilingual semantic thesaurus for the national digital archives in Taiwan.

Inconsistent controlled-vocabularies standards that are used to describe the collections in

current digital archives impair the retrieval e�ciency. It is an important issue that we have to

solve the problems involved with cross-system, cross-resource, cross-disciplinary, and cross-

lingual search for users.

In view of the fact that so far there are no Chinese art-related thesauri in the world, this

study attempts to construct a multilingual knowledge organization system for the National

Palace Museum (NPM) collections of “Chinese Festivals” by adopting the Art & Architecture

�esaurus (AAT) of the Getty Research Institute and incorporating the controlled vocabularies

and collections of the NPM. In order to bridge the cultural gaps derived from the Western-

oriented perspectives of art terms in AAT, the study draws on principles of collection warrant

and literary warrant, utilizing the snowball sampling and the mapping analysis to analyze the

concepts of terms. Based on three types of semantic (equivalent, hierarchical, and associative)

relationships and the theory of Putejovsky’s qualia structure, the study seeks to find out

the differences between the knowledge structures of Chinese and Western art, to adjust its

discrepancies, and to supplement the digital archives of Chinese art with a useful knowledge

organization system and the data of Chinese festivals.

* Assistant Research Fellow, Institute of Taiwan History, Academia Sinica. Executive Secretary, Academia Sinica Digital Center.

** Research Assistant, Institute of Taiwan History, Academia Sinica.

041 數位人文研究與技藝 數位典藏的知識組織系統之模式建構與應用研究──

以故宮中國節慶詞彙為例

一、前言

近三十年來網際網路的盛行,帶動全球文化資產資源數位化的風潮。1989 年

美國首度將圖書館的典藏書籍及資料以數位化的方式進行儲存(楊孟蒨,2001);

1994 年美國國家科學基金會贊助數位圖書館先導研究計畫(DLI)(�e National

Science Foundation, 2002; Mischo, 2004);同年,英國也啟動電子圖書館計畫(eLib)

(Whitelaw & Joy, 2000; Pin�eld, 2004);1997 年聯合國教科文組織推動「世界記憶

計畫」(Memory of the World Programme),針對人類社會檔案與文獻進行保存;這

些旗艦型數位圖書館計畫帶領世界各國後續的各種數位計畫。我國也於 1998 年推出

「數位博物館專案計畫」,並於 2002 年擴大規劃為「數位典藏國家型科技計畫」,

將國內數十萬珍貴的蒐藏與歷史文件數位化,過去十五年已建立五百餘萬件的數位

化藏品,涵蓋中華文化瑰寶與臺灣人文自然資訊。

就數位典藏應用而言,首先數位資料必須經過有系統地組織與整理,方能得到

有效的檢索結果,因而需要後設資料(metadata)系統作為藏品的搜尋基礎。以國內

博物館社群的後設資料為例,根據研究顯示,博物館的完整後設資料標準,需考量

資料結構、資料內容與資料值等三個層面。其中在資料結構層面,國內已建立相當

完善的規格,諸如採用 Dublin Core、Visual Resource Association 元素集或 Categories

for the Description of Works of Art(CDWA)等國際標準為基礎;然而在資料值層面,

由於臺灣在藏品的主題索引上,尚未建立具規模的知識組織系統(如分類法或索引

典),因此國內博物館典藏機構,只能各自採用自己建立的控制詞彙清單,作為數

位藏品的索引基礎(陳淑君、城菁汝,2004)。有鑑於國內博物館數位典藏尚缺乏

一套知識組織系統,無法建立藏品之間的關係架構,因此面臨建構數位典藏系統知

識化的問題。

另一方面,數位典藏係發展數位博物館的基礎工程,數位典藏透過展示、教育

活動更廣泛且有效地被大眾使用。目前數位博物館則因缺乏統整跨領域及跨部門間

之知識管理策略、方法及技術,導致知識內容分散建構及流失,無法累積跨領域資

源,難以發揮支援業務多元加值再利用效益與價值(徐典裕,2011)。自我國啟動「數

位典藏國家型科技計畫」,結合國立故宮博物院、國立歷史博物館、國立自然科學

博物館、國立臺灣大學與中央研究院等機構,將各機構珍貴的文書與藏品予以數位

化,各個典藏機構均擁有自己的數位典藏資料庫,並於後續又建立全國性數位典藏

資源的聯合檢索系統――「數位典藏與數位學習聯合目錄」。目前數位典藏系統大

多使用不同標準的控制詞彙來描述藏品物件,以致使用者的檢索效能受限,為解決

使用者進行跨系統、跨資源、跨學科與跨語言搜尋的問題,以及隨著資訊化社會的

來臨,網路普及應用的情況下,建立語意共通的數位典藏系統,成為當今重要的研

究議題。本研究將探討如何為臺灣數位典藏系統建立一套完整語意關係的多語索引

典,以改善數位藏品的檢索結果之檢全性。

042 數位人文研究與技藝

二、文獻探討

(一)知識組織系統在數位典藏的應用研究

「知識組織系統」 一詞,首次於 1998 年美國計算機學會數位圖書館年會由「網

路知識組織系統工作小組」 提出。意指各種對人類知識結構進行表達,及有組織的

闡述之語意工具的統稱,包括傳統圖書館建立在文獻單元基礎上的分類法、標題表、

權威檔、索引典,及更泛指的資訊檢索語言、索引語言,也包括網路環境中建立在

概念單元基礎上的概念地圖、語意網、知識本體等(Hjørland, n.d.)。根據 Hodge

(2000)的看法,知識組織系統使用於組織數位圖書館時,具備下述三項相當關鍵

的共同特色:首先,知識組織系統將一個特殊的世界觀融入一個合集與其內部的藏

品;其次,同樣的實體特色可以透過其所使用的知識組織系統,而有不同的界定方式;

最後,知識組織系統所表達的概念與其所指涉的實體世界物件之間應有足夠的共同

點,使得有知識的人可以運用這個具有合理可靠度的系統。同樣地,透過知識組織

系統尋求相關藏品的使用者,也應能夠將他們的概念與系統結合。

在圖書資訊學領域,知識組織系統的基本功能包括資訊檢索、書目記錄及排

序等功能,從百年前的傳統圖書館到近數十年發展的數位圖書館,一直扮演藏品

組織整理之關鍵角色(Broughton, Hansson, Hjørland & López-Huertas, 2005)。為滿

足使用者的需求,新一代知識組織系統必須大幅改進資訊組織及檢索,其中包括

形式化語意、知識表示達到內部結構一致性、清楚的語意使不同知識組織系統間

得以互通、更佳的資訊整合、概念導向的檢索等特點(Soergel, Lauser, Liang, Fisseha,

Keizer & Katz, 2004);而一個具有語意的數位圖書館,更是需要知識組織系統的支

援(Soergel, 2008)。在實證研究方面,Ge�ner, Agrawal, Abbadi & Smith(1999)認

為瀏覽資料的能力是數位圖書館不可或缺的本質,並以在美國擁有巨量地圖藏品資

訊的亞歷山大數位圖書館(Alexandria Digital Library)為研究對象,嘗試發展以諸

如美國的國會圖書館標題表(Library of Congress Subject Headings,LCSH)分類法

的階層架構為基礎的瀏覽功能。Gordon(2001)則強調瀏覽為基礎的查詢對圖像藏

品的重要性,並以美國國會圖書館繪圖資源索引典(Library of Congress �esaurus for

Graphic Materials,LCTGM)的其中 768 個詞彙代表為基礎,建構可以支援使用者根

據常識的活動(common-sense activities)來瀏覽照片藏品。Douyère, Soualmia, Névéol,

Rogozan, Dahamnal, Leroy, Thirion & Darmoni(2004)為醫學標題表(Medical Subject

Headings,MeSH)進行在地化延伸後,應用於法國線上醫療資源的檢索。Shiri 等人

以使用者為中心,評估多語視覺化界面結合英法雙語索引典的數位圖書館,該研究

以新的視覺化方式,讓數位圖書館的使用者介面整合索引典與瀏覽及查詢功能。研

究結果發現參與者認同該介面提供的功能有助於辨識檢索詞彙、建議偏好詞彙,並

043 數位人文研究與技藝 數位典藏的知識組織系統之模式建構與應用研究──

以故宮中國節慶詞彙為例

提供雙語檢索支援的價值(Shiri, Ruecker, Bouchard, Sta�ord, Mehta, Anvik & Rossello,

2011)。國內陳光華教授以《淡新檔案》索引典為案例,探討權威控制系統的設計(陳

光華,2000),並以索引典應用於資訊檢索的詞彙擴展,及同義詞建構為理論與實

證研究(陳光華、莊雅蓁,2001a;陳光華、莊雅蓁,2001b)。上述的相關研究顯示,

各類型的知識組織系統諸如索引典、標題表及權威檔等,在數位圖書館時代有其需

求與重要性,尤其是可以增強與改善系統的瀏覽、檢索及多語化功能。

王嵩山(1990)指出博物館蒐藏本是被抽離原生社會體系及文化脈絡的物件,

或是欠缺相關背景的詳實記載,因此博物館蒐藏及研究的基礎,仰賴的是館內研究

人員對蒐藏的分類,分類正是建構知識體系的起點。參照目前博物館數位典藏現狀,

尚仍停留於分類階段,而「數位典藏與數位學習聯合目錄」則是甫完成聯合目錄知

識化工程的最基礎環境,但數位藏品之間仍舊缺乏具語意的知識架構與脈絡。由於

國內並無像國外研發出一套完善的藝術類知識組織系統,諸如美國的「藝術與建築

索引典」(Art & Architecture �esaurus,AAT)、荷蘭的「藝術與圖像學分類系統」

(Iconclass),以致於相關博物館在描述藏品時無法有一致性的控制詞彙依循標準,

也無法進一步對藏品進行整合性與互通性工作。以臺北的國立故宮博物院為例,描

述藏品的語彙是由研究員經長年的研究所累積,對文物不同屬性的術語之統整,所

形成依附在藏品屬性項下的控制詞彙,如:該院對於器物藏品的「功能」屬性,建

立 30 個控制詞彙,其中包括「文具、文玩」;國立歷史博物館則也自行建立控制詞

彙清單,作為描述數位藏品的準則,該館對於器物藏品的「功能」屬性,建立 12 個

控制詞彙,其中包括「文房用具」。事實上,這三個詞彙存在語意很相近的關聯性,

然而由於不同博物館強調藏品的不同特性,及描述的粒度性(granularity)不同,而

產生以不同的控制詞彙描述數位藏品的相近概念,甚至是相同概念。

相近概念的不同詞彙若未能加以聚合並進而建立語意關係,則使用者在搜尋整

合性的數位典藏系統時,將面臨檢準率(precision ratio)與檢全率(recall ratio)的檢

索問題。以我國「數位典藏與數位學習聯合目錄」為例,其收錄豐富的中華藝術數

位藏品與後設資料,但目前仍未有健全且發展成熟的索引典機制,因而檢索結果呈

現不完全精準的情形。在檢全率效能方面,由於數位典藏項下各計畫使用不同詞彙

的同義詞,或以不同精準度的詞彙描述相同的概念,常讓使用者無法以最有效率方

式,找到所有相同概念的數位藏品,例如使用者欲在「數位典藏與數位學習聯合目

錄」查詢有關中國年節主題的作品,並以「年節」為關鍵字進行查詢,搜尋筆數雖

高達千筆,但是卻無法含括諸如「新春」或「New Year」等中英文同義詞的藏品,

甚至會因此遺漏清朝重要宮廷畫家郎世寧的《畫錦春圖》作品。另外,目前系統的

分類方式,主要是以資料類別進行區分諸如檔案、器物、書畫和新聞等,相對地較

無法直觀地表現一個以詞彙為代表的概念之完整知識架構,此將可能造成使用者無

044 數位人文研究與技藝

法在短時間內一目了然「年節」與其他中國節慶控制詞彙的關係。最後,在系統的

相關搜尋功能中,由於系統的中文斷詞問題,可能會將毫無關係的詞彙視為「年節」

的關聯詞彙,諸如「青年節」、「半年節」和「金水」等,並推薦給使用者,而非

是與「年節」較具直接語意關聯的「爆竹」和「舞獅」,這也顯示出目前系統無法

呈現更精準語意關係的藏品。

(二)藝術與建築索引典的多語化與在地化發展

藝術與建築索引典係由美國蓋堤研究中心(Getty Research Institute,GRI)歷經

三十年研發與出版的多語索引典,除美式與英式英文外,尚包括西班牙文,及部分

法文、義大利文、荷蘭文,目前正進行中文與德文的多語化研究與發展。AAT 所

涵蓋的主題範圍包括描述藝術、建築、裝置藝術、物質文化和檔案素材。時間範疇

從古至今,地域範圍先是以西方為主,再不斷擴編以涵蓋全世界各地所有的文化。

蓋堤研究中心為一個國際性的文化與非營利組織,致力於保存和研究有關視覺藝

術所有領域的藝術遺產,本身發展多套國際性的藝術領域相關標準與資料庫,AAT

是其中一個,為目前全球藝術領域最大、最完整的學術詞彙資料庫。其他相關資

料庫與標準包括:地名索引典(Getty �esaurus of Geographic Names,TGN)、藝

術家人名權威檔(Getty Union List of Artist Names,ULAN)、文化物件名稱權威檔

(Cultural Objects Name Authority,CONA),及藝術作品描述類目(Categories for

the Description of Works of Art,CDWA)。

在結構方面,AAT 以 ISO 索引典標準為基礎建構,具有等同關係、層級關係及

聯想關係等三種類型的詞彙語意關係。目前為止共包含約 35,000 個概念,由七個層

面與三十三個層級架構所組成,七大層面共分為關聯概念層面(Associated Concepts

Facet)、物理特質層面(Physical Attributes Facet)、風格與時代層面(Styles and

Periods Facet)、代理者層面(Agents Facet)、活動層面(Activities Facet)、材料層

面(Materials Facet)和物件層面(Objects Facet)。以概念的同質性分類,歸於同一

層面中的詞彙具有相同之特性,並依此與其他層面收錄的詞彙加以區別。例如:大

理石指的是用來創作藝術和建築的一種質材,因此可以在材料層面中發現。印象主

義者代表一種藝術中獨特的視覺風格,所以可以在風格和時代層面中找到。AAT 只

蒐集概念類型的詞彙,並不包括專有名稱類型的詞彙。概念類型的詞彙可以包含關

聯概念(例如:美麗)、物理屬性(例如:滾邊)、風格和時期(例如:法式)、

代理者(例如:景觀建築師)、活動(例如:考古)、材料(例如:黏土)和物件(例

如:雙耳細頸瓶)。因此,特定著名的建築物、個人、團體和歷史事件等,都不在

藝術與建築索引典的範圍。換言之,所有 AAT 的詞彙都可以指向多數的個案(一般

事物),而不是單一個案(特定事物)。

045 數位人文研究與技藝 數位典藏的知識組織系統之模式建構與應用研究──

以故宮中國節慶詞彙為例

參與 AAT 多語化的成員國家之研究機構與學者,包括美國(英文)、臺灣(中

文)、荷蘭(荷蘭文)、智利(西班牙文)、德國(德文)以及紐西蘭、義大利、

巴西。目前 AAT 多語化的進度,以西班牙文最為快速,已完成將近 32,000 筆詞彙

的西語化工作,由於西語的所屬語系與英語較為接近,早期智利係直接採用機器翻

譯,後來因效果不盡理想,因此改為人工翻譯(Nagel, 2010)。荷蘭文的進度則居

於次位,主要是由專職譯者進行翻譯,並且借重學者專家進一步翻譯與確認,甚至

於 2008 年研發新的編輯介面,嘗試開放外部使用者編輯權限,但是並未有太多使

用者參與此項工作,因此這項功能並未真正發揮(Weda & Zelfde, 2011)。臺灣團隊

(AAT-Taiwan)針對中文化研發一套方法論,共分為翻譯、校訂、消歧義、專家審訂、

加值應用和貢獻等六大模組。考量翻譯最大問題在於詞彙,特將校訂模組細分為範

圍註校訂與詞彙校訂,以文獻保證原理為基礎,針對詞彙進行再查證工作,尋找文

獻來源並確立詞彙的準確性。目前已完成九成以上的中文化翻譯進度,並於 2012

年底貢獻 8,000 多筆中文詞彙(Chen, Lin, Kuo, Yang & Lee, 2011; Chen, Kuo & Yang,

2013)。其中,由於德國較晚參與 AAT 多語化計畫,因此進度較為緩慢,同時也尚

未有既定好的多語化方法(Hagedom-Saupe & Ermert, 2011)。以智利與荷蘭兩國來

說,目前兩國已將近完成 AAT 多語化進度,也開始進行在地化的研究工作,智利已

著手進行有關前哥倫比亞時期物件的詞彙與範圍註,並建置其知識層級脈絡;而荷

蘭也開始新增荷蘭語概念詞彙與範圍註。AAT 除了透過各國的多語化研究工作,同

時更在原本七大層面中,新增「品牌名稱層面」(Brand Name Facet),該層面尚在

初步建構階段;在詞彙更新部分,蓋堤研究中心增加有關非西方藝術、當代藝術、

裝飾藝術與其他藝術風格、作品類型和質材的相關詞彙,使 AAT 這套索引典在多語

化方面更為齊全。另一方面,各國所進行的在地研究,將使原為英語知識架構的索

引典,可含括各國以及各文化的控制詞彙與其知識層級架構。

蓋堤研究中心的 AAT 與故宮博物院的控制詞彙來源,皆以藝術領域為主。故宮

博物院是以中文為主,側重於中國藝術領域;AAT 則是以英文為主,並以西方藝術

為本發展的全球藝術領域範圍。故宮博物院收藏全世界最多且最精美的中華瑰寶,

並為世界五大博物館之一(桂雅文,2001),每年超過二百五十萬人次實地參訪,

吸引大量外國旅客;數位典藏資料庫每年則超過一百萬人次造訪。提供藏品的線上

多語瀏覽與檢索應是必然的需求與趨勢,而其所彙集重要的中國藝術領域之學術詞

彙,對於海外地區的亞洲藝術博物館在藏品的編目專業及學術研究,具有一定的重

要性。AAT 則是目前北美地區博物館編目專業的重要參考工具,也是結構完整與編

輯嚴謹的索引典。

綜合上述,本研究期望經由知識組織系統的建構,彌補目前故宮博物院數位典

藏資源所缺乏的多語檢索與脈絡化表達之機制。基於建立一套具語意關係的知識組

046 數位人文研究與技藝

織系統,需要耗費龐大的資源與經費,綜觀國內外的相關研究與經驗,研究團隊往

往是立於既有資料庫的基礎上,建構出符合在地需求的系統,為節省建構的資源成

本,研究者將以 2008 年起與美國蓋堤研究中心建立國際合作之 AAT-Taiwan 成果為

基礎,透過 AAT 的知識架構及多語言特色,對應、整合與統一典藏計畫的重要詞彙,

成為一個具豐富語意連結性的知識組織系統。本文將藉由 AAT 的知識架構與多語言

特色,結合故宮博物院的控制詞彙與藏品,以故宮「中國節慶」藏品建構多語言的

知識組織系統為樣例,探討建立一套可供中英文使用者檢索中華文化藝術資源的多

語索引典之實作方法架構。

三、研究方法

本研究採用內容分析研究方法,建立中國節慶的詞彙與概念架構。在詞彙的

概念分析上,本研究採取藏品保證原理、文獻保證原理、滾雪球取樣、對應分析

(mapping analysis)等不同方法,並採用索引典的三類語意關係(等同關係、層級

關係、聯想關係)和 Pustejovsky(1991)的屬性結構(qualia structure)作為分析的

理論基礎,找出中西藝術知識架構的差異並修正歧異點,補齊中國節慶資料及數位

典藏重要知識概念的版圖。所謂對應分析法,在索引典的情境下,係指識別出詞

彙、概念及層級關係的等同性之過程(Doerr, 2001)。此方法是多套知識組織系統

建立互通時的核心方法之一,特別是在索引典的整合。衍生詞彙理論法(generative

lexicon theory),是由Pustejovsky(1990)所發展,本研究以該理論對名詞所設定的(經

驗架構)屬性結構,作為詞彙屬性分析的基礎理論架構,包括形式(formal)、構成

(constitutive)、動因(agentive)及目的(telic)等四項要素。

在程序上,本研究的分析工作可分為四個階段,第一階段的目的是以故宮博物

院的中國節慶控制詞彙為基礎,進一步蒐集並判別出完整而重要的詞彙組;第二階

段的目的是分析詞彙本身概念;第三階段的目標為立基於詞彙概念的分析研究之上,

與 AAT 進行對應分析研究;第四階段則是建構起中國節慶詞彙的知識組織系統。以

下,逐步說明此四階段的資料分析步驟與方法。

(一)中國節慶詞彙組的識別

本研究先以故宮博物院七個中國節慶的中文控制詞彙為基礎,由於故宮的詞彙

均已作為該院數位藏品的索引詞條,因此具有作品保證原理。為避免這些詞彙清單

是以特定機構的藏品描述需求而建立,可能有失完整之慮,本研究再輔以相關文獻

的蒐集與分析,進一步確認中國節慶的完整、常用及符合作品保證原理的控制詞彙

清單。

047 數位人文研究與技藝 數位典藏的知識組織系統之模式建構與應用研究──

以故宮中國節慶詞彙為例

(二)詞彙概念的分析

本階段的研究,主要採用文獻保證原理和滾雪球取樣等方法為基礎,進行詞彙

的概念分析研究。主要步驟包括:1. 確認中文詞彙本身的概念;2. 利用屬性結構理

論進行詞彙概念分析。

1.確認中文詞彙本身的概念

為了確認詞彙的概念,每個詞彙的定義皆須有三個以上的權威性文獻來源(詳

表 1)。由於考量研究對象的控制詞彙本身屬於特定中國節慶的專門用語,因此,

參考工具書係中國節慶/節令相關的專書(如:《中國節令詩歌選》、《中國年節》)

為主,再輔以一般性辭典(如:臺灣大百科全書、教育部國語辭典)。從專書文獻中,

不僅可確定詞彙的定義,更可從中更深入了解該節慶的來源、演變和衍生出來的節

慶活動,增加該詞彙的文化和歷史脈絡,以俾之後有效的詞彙對應分析。

表 1 確認中文詞彙的定義之範例

中秋定義 參考文獻來源

中國民間節日。農曆 8 月是秋收的季節,15日中秋節,是民間重要節慶。這個節日的由

來是漢人自古即以農業為生,農事和季節的

關係密切,在收成時,祭祀「土地神」以謝

豐收,稱為「秋報」,中秋節祭土地公便是

「秋報」的遺俗。

林美容,【中秋節】,大英百科全書/線上

繁體中文版,智慧藏百科網,上網日期:

2012 年 10 月 29 日。網址: http://daying.wordpedia.com/Content.aspx?id=084266&sword=%E4%B8%AD%E7%A7%8B%E7%AF%80

關於中秋節的源起,這是一個典型的先民在

四季莊稼活動中創造出來的節日。我國以農

立國,農事和季節習習相關,到了秋收之

時,要向「土地公」報告豐收並且向「土地

公」謝恩,這就是古老的「春祈秋報」。八

月十五日,恰好是稻子接近成熟的時候,這

一天,家家拜的也是「土地公」,所以中秋

節有可能就是「秋報」的遺俗。

陳正之,1997,《台灣歲時記:二十四節氣

與常民文化》,臺中:臺灣省政府新聞處,

頁 150。

農曆 8 月 15 日是中秋節,或稱「八月半」,

傳說上古天子祭月的禮儀就是中秋節的起

源。中秋賞月由來已久,到宋朝正式定名為

中秋節。

施美敏、王勇霞、陳貞曦,2002,《歲時節

慶――親子共學知節氣》,臺北:國立歷史

博物館,頁 104。

資料來源:本研究整理。

048 數位人文研究與技藝

2.利用屬性結構理論進行詞彙概念分析

本研究採用 Pustejovsky(1991)的屬性結構理論為詞彙進行結構分析,藉此事

物存在必須具備的四大要素:形式、構成、動因及目的,進一步探討每個詞彙不同

面向的內涵。本研究立基於所蒐集具權威性文獻來源的三種定義資訊,進行概念的

語意屬性類型分析,以「中秋」為例(林美容,2012;陳正之,1997;施美敏、王

勇霞、陳貞曦,2002):

● 構成:農業(秋報)。

● �功能:功能(秋報、祭祀、慶團圓、娛樂)、目的(報告豐收、拜土地公、

拜太陰星君、拜月、家人團聚賞月、吃月餅、飲桂花酒、賞桂、觀潮、民間

戲曲演出)。

● 主事:起源(報告豐收並向土地公謝恩)、加工(神話故事)、產物(嫦娥

奔月、白兔搗藥、吳剛伐桂)。

● � 關係:同義詞(仲秋、中秋節、八月節、八月會、秋節、團圓節)、組合關係-

水平(在一年的生產週期中,中秋與元宵遙遙相對,分別是春祈與秋報的時

間點)。

● 時間:北宋。

● 族群:漢、壯、布依、侗、朝鮮、仡佬、畬、京。

● 應節食品:桂花酒、月餅、柚子。

一個詞彙係包含多重概念,經由上述的分析,可以觀察到當詞彙被分解為更細

緻的語意後,原先所附屬的概念結構即可以被解構,可以更有系統地了解詞彙概念

的形成起因、內容和目的性,同時也可以更細部了解兩個概念詞彙之間,在不同屬

性方面的異同性或者重疊程度,為將來建立詞彙的三種語意關係(等同關係、層級

關係、聯想關係)重要的資訊來源,例如,透過屬性分析,可以確定「中秋」聯想

關係。

(三)詞彙與 AAT知識組織結構的對應分析此部分包括:1. 確定英譯詞彙;2. 判斷與確認此詞彙在 AAT 可能的等同概念之

詞彙;3. 賦予中國節慶詞彙與 AAT 詞彙等同關係的匹配類型。

1.確定英譯詞彙

鑑於中國節慶主題的專書皆由全中文寫成,甚少提及英譯同義詞,因此權威性

百科全書和辭典是英譯同義詞的最佳來源,如《漢英大辭典》、大英百科全書/線

上繁體中文版,此外國外博物館的線上蒐藏資料也是英譯詞彙的另一重要來源,例

如美國大都會博物館(http://www.metmuseum.org/collections/search-the-collections)和

049 數位人文研究與技藝 數位典藏的知識組織系統之模式建構與應用研究──

以故宮中國節慶詞彙為例

波士頓美術館(http://www.mfa.org/search/collections)。研究者首先從權威性一般百

科全書與藝術領域的辭典查找英譯詞彙,並以該詞彙在國外博物館的線上典藏資料

庫進一步檢索相關藏品,從中驗證該英譯詞彙的正確性,以及可知曉西方使用者所

使用的慣用詞彙,並可獲得西方博物館藏品的保證。

2.判斷與確認此詞彙在 AAT可能的等同概念之詞彙

在判斷與 AAT 等同概念的方法中,本研究採取「概念為本」,而非「詞彙為本」

對應分析法,也就是在為每個詞彙進行中英等同對應時,需以該詞彙所代表的意義

為主軸考量,研究者並從 AAT 中判斷與確認可能的等同概念詞彙。由於詞彙本身常

都是多義詞,換言之,一個詞彙有兩個或兩個以上的意義,或者具有複合概念,因

此在對應時需要加以分析,並以單一概念為單位。本研究分析包含四項分析步驟:

一是該詞彙的英譯詞;二是由故宮詞彙來源判斷該詞彙所代表之概念的語境脈絡;

三是依據研究者所蒐集該詞彙的三種定義;四是以上述為基礎,並在 AAT 概念結構

內找出與確認所屬層面、層級及詞彙。以「年節」為例,此詞彙包含「新年的第一天」

和「春節的前後天」等兩個概念,無論其定義、概念的語境和英譯詞,皆與 AAT 的

「New Year’s Day」概念相近,因此「New Year’s Day」乃是與「年節」為近似等同概

念詞彙(詳表 2)。

表 2 確認詞彙在 AAT可能的等同概念

故宮詞彙 詞彙定義代表概念

的語境→AAT近似或等同概念詞彙 AAT詞彙定義

年節

Chinese

New Year

新 年 的 節

日。 或 指

春 節 前 後

的數日。

中國節令

> 年節

詞彙:New Year’s Day

層級:Holidays

層面:Activities Facet

備註:New Year’s Day

(national holidays, holidays, events, Activities Facet)

Holidays celebrating the

year about to begin or just

beginning; many cultures

celebrate the new year,

usually according to their

own calendars.

資料來源:本研究整理。

3.賦予中國節慶詞彙與 AAT詞彙等同關係的匹配類型

由於 AAT 係以西方觀點為基礎建構亞洲藝術詞彙,屬於西方知識組織系統,與

屬於中國特有文化的中國節慶控制詞彙,知識組織系統上產生很大的差異,而研究

者採取對應分析法進行中西方知識組織系統之間詞彙連結時,將會面臨詞彙的匹配

050 數位人文研究與技藝

類型之對應,本研究乃以 ISO 標準的七種對應類型作為基礎(詳表 3),共分為精

準等同、近似等同、交集等同、聯集等同、狹廣對應、廣狹對應和關聯對應等七種

類型,用此判定中西不同詞彙系統、不同語言之間和詞彙等同關係的匹配類型,讓

故宮中國節慶詞彙皆可以不同語意程度對應到 AAT 詞彙,為故宮中國節慶詞彙與

AAT 詞彙之間建立應用的連結關係。

表 3 七種詞彙對應類型表

對應代碼 對應類型 適用情況

=EQ精準等同 【=】

Exact, simple equivalence兩組詞彙之間的概念完全相同。

~EQ近似等同 【> <】

Inexact simple equivalence

兩組詞彙之間的概念並非精準相同,這些概念在某些

脈絡中是相等的,但在其他脈絡中則否;或這些概念

在範圍上可能有重疊,或在內涵上有些微差異。

EQ+交集等同 【一對多】

Intersecting compound equivalence

兩組詞彙之間的概念可以兩個或更多個交集的集合

理論來表示。

EQ |聯集等同 【一對多】

Cumulative compound equivalence

一組詞彙的概念,等同於另一組詞彙的兩個或更多概

念的總和。

BM狹廣對應 【<】

Hierarchical mapping (narrower to broader)

兩組詞彙之間的概念,從較狹義到較廣義概念的層級

對應關係。

NM廣狹對應 【>】

Hierarchical mapping (broader to narrower)

兩組詞彙之間的概念,從較廣義到較狹義概念的上下

位層級對應關係。

RM關聯對應

Associative mapping

兩組詞彙之間的概念,未達到等同或廣狹等層級對應

的條件,但在語意上具有一定的關聯程度。

資料來源:本研究整理自 ISO/CD 25964-2(ISO, 2011)。

(四)建構中國節慶詞彙的微型知識組織系統

此部分包括:1. 確定詞彙的等同關係;2. 建立詞彙的層級關係;3. 確定詞彙的

聯想關係。本研究以 AAT 的三類語意關係(等同關係、層級關係、聯想關係)為基

礎,在正式進行三種語意關係建置工作之前,本研究已針對每個詞彙,查找蒐集三

051 數位人文研究與技藝 數位典藏的知識組織系統之模式建構與應用研究──

以故宮中國節慶詞彙為例

份以上的文獻來源之定義,進行詞彙的概念分析,以確定該詞彙的概念意涵,並進

行 AAT 匹配類型對應分析,試圖作為三種語意關係建立的基礎研究資料。以確定詞

彙的等同關係為例,本研究先從詞彙概念分析所使用的三種定義與其參考文獻著手。

首先,先從該定義與其參考文獻查找其中文同義詞,以「年節」為例,其一定義為「謂

陰曆正月初一。今稱春節。」,從該定義可確認「春節」為「年節」的同義詞。若

無法從定義中蒐集相關同義詞,將會進一步瀏覽專書,以蒐集具等同關係的同義詞,

並可從中確認中文同義詞的來源。

四、研究結果與討論

本研究主要以故宮博物院七個中國節慶藏品的中文控制詞彙為基礎,另外,參

考《中國節令史》、《中國節令詩歌選》、《中國年節》、《中國傳統節日》、《中

國古代節日風俗》等五本中國節令專書所列舉的中國節慶,並且對照出每個中國節

慶在「數位典藏與數位學習聯合目錄」的藏品筆數,整理出具代表性的中國節慶(詳

表 4)。

表 4 中國節慶控制詞彙項目表元旦立春人日元宵節

中和節

春龍節

驚蟄花朝節

社日上已寒食清明浴佛節

端午節

黃梅夏至扶日立秋七夕節

中元節

中秋節

白露重陽節

冬至節

臘日除夕

《中國節令史》 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●

《中國節令詩歌選》 ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ● ●

《中國年節》 ● ● ● ● ● ● ● ● ● ●

《中國傳統節日》 ● ● ● ● ● ● ●

《中國古代節日風俗》 ● ● ● ● ● ● ● ●

聯合目錄筆數 66 126 2929 628 3 1 43 3 1051 714 146 1187 37 434 814 175 11 88 430 222 503 160 600 448 5 563

註: 當使用者在「聯合目錄」檢索時,常常會出現斷詞因素所造成的筆數錯誤情形,例如「人日」在聯

合目錄的檢索結果會混雜盲人或阿美人日常生活的相關數位藏品。為避免此一情形,若中國節慶候

選詞彙在聯合目錄檢索過程中出現非常態性的筆數,即代表該控制詞彙在檢準率方面可能會有誤導

情形,因此本研究以雙刪除線的方式來表示已刪除有以上情形的候選詞彙。

資料來源:本研究整理。

從上表顯示,每項文獻的中國節慶列表,必含括元旦、元宵節、清明節、端午節、

七夕節、中秋節、重陽節等七個節慶。由於除夕和元旦為年節的概念,因此採用故

宮中國節慶控制詞彙的「年節」統一稱呼,而元宵節、端午節、七夕節、中秋節和

重陽節為元宵、端午、七夕、中秋和重陽的同義詞,顯示每本專書皆包含有年節、

元宵、清明、端午、七夕、中秋、重陽等七個中國節慶。在藏品筆數方面,考量斷

詞所造成的筆數錯誤問題,人日、社日和黃梅等中國節慶詞彙不予以納入中國節慶

控制詞彙。藉由文獻保證原理以及藏品保證原理,除了年節、清明和春社等七個故

宮控制詞彙,歸納出「元宵」為重要的中國節慶之一,以及專書多將「元宵」列入

052 數位人文研究與技藝

中國節慶,且「數位典藏與數位學習聯合目錄」共有高達 628 筆的「元宵」藏品紀錄,

因而將該詞條納入中國節慶的控制詞彙。透過以上資料蒐集和故宮中國節慶控制詞

彙為基礎,整理出年節(S1)、元宵(S2)、春社(S3)、清明(S4)、端午(S5)、

七夕(S6)、中秋(S7)和重陽(S8)等八個中文控制詞彙。

(一)中國節慶詞彙與 AAT知識組織結構的對應分析本研究以八個中國節慶的控制詞彙對應至 AAT,結果如表 5 所示,顯示兩種主

要的對應類型,分別是交集等同及狹廣等同類型。此結果呈現出目前以 AAT 為主的

知識架構,雖然已有節慶的分類,但仍未進一步依特定文化再予細分,只能暫時對

應到「Festivals」(節慶)項下。此外,對於「年節」(S1)是歸屬於節慶(festivals)

或節日(holidays),似乎在此也突顯其觀點的歧異性。

表 5 中國節慶詞彙對應類型表

中國節慶詞彙 對應關係類型 Art & Architecture �esaurus (AAT)S1 年節 交集等同(EQ+) New Year’s Day + FestivalsS2 元宵 狹廣等同(BM) FestivalsS3 春社 狹廣等同(BM) FestivalsS4 清明 狹廣等同(BM) FestivalsS5 端午 狹廣等同(BM) FestivalsS6 七夕 狹廣等同(BM) FestivalsS7 中秋 狹廣等同(BM) FestivalsS8 重陽 狹廣等同(BM) Festivals

以中國節慶詞彙而言,根據故宮中國節慶詞彙與 AAT 詞彙的對應匹配結果顯

示(請詳圖 1),僅有「年節」一控制詞彙屬於交集等同關係,AAT 的「New Year’s Day」乃指「慶祝一年開始的假日,許多文明常依據自己的曆法來慶祝新年」,其

項下包括有排燈節〔印度教節日,Divali (Hindu holiday)〕、排燈節〔印度耆那

教,Diwali(Jain holiday)〕和歲首節(Rosh Hashana)等不同文化下的新年詞彙,

故宮詞彙「年節」屬於中國曆法新年概念,依據「New Year’s Day」的定義與上下位

關係,「年節」屬於一對多的交集等同類型;而元宵、春社和清明等詞彙屬於中國

節慶概念,AAT 並無任一詞彙與之精準等同,僅與專屬不同社群慶祝的歡慶活動概

念的「Festival」具有狹廣等同關係。研究者經過詞彙本身概念分析與匹配類型研究,

發現中國節慶乃是依照中國陰曆法與農事所演變而來的慶祝節日,該節慶僅流行於

受中華文化影響的地區,並非普及各地,而屬於西方知識組織系統的 AAT 目前並無

收錄任一中國節慶詞彙,此外中國節慶與因習俗或法律規定而暫停商業活動的節日

053 數位人文研究與技藝 數位典藏的知識組織系統之模式建構與應用研究──

以故宮中國節慶詞彙為例

概念之「Holidays」,乃有本質上的不同;從以上研究,可粗略知曉中西兩者知識組

織系統之間的歧異點。

有關詞彙對應的基礎與問題,當兩套不同詞彙系統進行對應時,若為相同語言,

通常可以自動化方式找出相同的詞彙作為匹配。本研究的個案是以中文對應至英文,

為不同語言之間的對應,需要處理的研究程序更為複雜,例如一對多、多對一或多

對多的對應問題。由於中國節慶詞彙屬於中國特有文化的產物,研究者需反覆查核

不同工具書與線上資料庫,以確認可能的英譯詞彙。以年節(S1)為例,研究者依

據參考文獻共查得五種英譯詞,再將這些英譯詞作為關鍵字搜尋「數位典藏與數位

學習聯合目錄」的藏品紀錄。經書面和網路資料查證,大部分地區的華人皆習慣口

語稱「年節(S1)」為「Chinese New Year」,包括美國全境、新加坡或馬來西亞等地,

例如紐約中國城的官方網站(http://www.chinatown-online.com),除了使用「Chinese

New Year」,華人也會使用「年節(S1)」其他的英譯詞諸如「Chinese Lunar New

Year」及「Chinese New Year’s Day」。其中,「Chinese Lunar New Year」主要是翻譯為「中

國農曆年」,一般華人仍習慣使用「Chinese New Year」。

本研究發現「年節(S1)」英譯詞組中,以「Spring Festival」英譯詞具有最豐

富的文獻來源,主要中譯為「春節」,同時美國大都會博物館和波士頓美術館皆

以「Spring Festival」作為控制詞彙,而在數位典藏聯合目錄藏品中,共可搜尋到五

筆以「Spring Festival」為索引的藏品。從美國大都會與波士頓兩間美術館的控制詞

圖 1 中國節慶詞彙與 AAT詞彙的對應示意圖

054 數位人文研究與技藝

彙,可推測國外美術館常用「Spring Festival」作為中華藝術藏品的控制詞彙。根據

以上分析,「年節(S1)」的常用英譯詞主要分別有「Chinese New Year」和「Spring

Festival」兩種。研究資料顯示「Chinese New Year」為現代華人的口說語言,而「Spring

Festival」比較偏向正式的書寫語言。為提升未來系統之檢全率,本研究採用藏品保

證原理和文獻保證原理,盡可能收錄常用的中國節慶英譯詞彙,並再根據國內外博

物館的常用英譯控制詞彙,選定英譯偏好詞,因而在本研究中,選定擁有最多文獻

來源的「Spring Festival」作為優先英譯詞(詳表 6)。

表 6 英譯詞彙之範例

語系 詞彙聯合目

錄筆數參考文獻來源

英文

�e Lunar New

Year Festival5

張芳杰主編,1992,《遠東英漢大辭典:Far East

Chinese - English Dictionary》,臺北:遠東出版社,頁

379。

�e Spring Festival

Holidays0

吳光華主編,2010,《漢英大辭典》下卷,上海:

上海譯文出版社。

Spring Festival 5

Latsch, M.-L. (1985). Traditional Chinese Festivals. Beijing:

New World Press, 24.

Wei L.-M. (2010). Chinese Festivals. Cambridge; New

York: Cambridge University Press, 14.

臺灣大百科全書,上網日期:2012 年 10 月 16 日。

網址:http://taiwanpedia.culture.tw/web/content?ID=20

26&Keyword=%E6%98%A5%E7%AF%80

波士頓美術館線上典藏資料庫,上網日期:2012

年 8 月 30 日。網址:http://www.mfa.org/collections/

object/spring-festival-along-the-river-24377

大都會博物館線上典藏資料庫,上網日期:2012 年

10 月 16 日。網址:http://www.metmuseum.org/search-

results?ft=%22spring+festival%22

維基百科,上網日期:2012 年 6 月 25 日。網址:

http://en.wikipedia.org/wiki/Chinese_New_Year

055 數位人文研究與技藝 數位典藏的知識組織系統之模式建構與應用研究──

以故宮中國節慶詞彙為例

語系 詞彙聯合目

錄筆數參考文獻來源

英文

Chinese New Year 43

Lo, D. & Comber, L. (1958). Chinese Festivals in Malaya.

Singapore: Malaya Publishing House, 11.

維基百科,上網日期:2012 年 6 月 25 日。網址:

http://en.wikipedia.org/wiki/Chinese_New_Year

YourSingapore. Retrieved December 7, 2012, from http://

www.yoursingapore.com/content/traveller/en/browse/

whats-on/festivals-and-events/chinese-new-year.html

紐約中國城,上網日期:2012 年 12 月 7 日。網址:

http://www.chinatown-online.com/year/year.shtml

Chinese Lunar

New Year7

Latsch, M.-L. (1985). Traditional Chinese Festivals. Beijing:

New World Press, 24.

Chinese New Year’s

Day0

Lo, D. & Comber, L. (1958). Chinese Festivals in Malaya.

Singapore: Malaya Publishing House, 12.

Chinese Lunar

New Year’s Day0

Timeanddate.com. Retrieved December 7, 2012, form

http://www.timeanddate.com/holidays/malaysia/chinese-

new-year-day

Lunar New Year 27

Timeanddate.com. Retrieved December 7, 2012, from

http://www.timeanddate.com/holidays/malaysia/chinese-

new-year-day

(二)中國節慶的微型知識組織系統

本研究基於三類語意關係,嘗試為中國節慶建立微型知識組織系統,以呈現概

念之間的脈絡關係。以年節(S1)為例,從圖 2 可以觀察到年節(S1)與其他七個

控制詞彙是為一組子類,之間具有兄弟姐妹的同屬關係。年節(S1)本身的同義關

係方面,可以再區分為不同子類型,諸如同義詞、漢語拼音、英文等類型。在年節

(S1)的階層關係方面,則隸屬一個上位概念「中國節慶」,該詞彙概念又隸屬一

個更上位概念「依節日區分的節日」,並依此類推隸屬「節慶」層級及「活動」層

面。在年節(S1)的聯想關係方面,可以再區分為「造成的事物為」及「活動與材料」

兩個子類型。以下就此三大類語意關係為本所建構的知識組織系統,分別進行討論。

續表 6

056 數位人文研究與技藝

圖 2 中國節慶「年節(S1)」的知識組織架構建置圖

1.中國節慶詞彙的等同關係

本研究分別為中國節慶的每個詞彙確認具等同關係的同義詞,以「年節(S1)」

為例,共得十三個中文同義詞(詳表 7)及八個英文同義詞(詳表 6)。由於中國節

慶有著悠久的文化歷史背景,因而產生中國節慶詞彙在不同時期有不同的名稱,例

如秦朝時期,人們使用「正月」一詞稱呼「年節」,隋唐宋元明時期,名稱轉為「元

日」,辛亥革命以後,「年節」於是也就改為「春節」。基於系統搜尋需求的考量,

本研究恐無法收錄所有不同時期或地區的節慶稱呼,本研究主要係依據藏品保證原

理,收錄詞彙的同義詞,證明使用者透過該詞彙可以搜尋到相關藏品。另外,考量

中文使用者常常習慣將「年節」口語稱為「過年」,因此也將「年節」的俗稱――「過

年」收錄進同義詞組。

研究者採取藏品保證原理的方法,將每個中文同義詞作為關鍵詞,進入「數位

典藏與數位學習聯合目錄」搜尋該詞彙的藏品紀錄,證實使用者可藉由該同義詞搜

尋到相關藏品,並且透過同義詞群組,建立該詞彙的同義詞環,可提升該控制詞彙

057 數位人文研究與技藝 數位典藏的知識組織系統之模式建構與應用研究──

以故宮中國節慶詞彙為例

的搜尋檢全率,例如「年節(S1)」的其一中文同義詞「春節」在「數位典藏與數

位學習聯合目錄」共有 1,788 筆藏品紀錄,其中包括清代中期重要的宮廷畫家蔣廷

錫的花卉畫《歲朝圖》以及與郎世寧齊名的清朝宮廷畫家丁觀鵬的年景畫《太平春

市圖》等作品;若是無建立年節的中文同義詞組,使用者將無法廣泛搜尋到年節相

關藏品,更可能因此錯失重要作品。建立詞彙的等同關係,不僅可建立完整的語意

關係,從使用者的角度,更可以提升使用者搜尋的檢全率,因此須確認和蒐集該控

制詞彙的中文同義詞,建立詞彙的等同關係。

表 7 確定中文同義詞之範例

語系 詞彙聯合目錄

筆數參考文獻來源

中文

春節 1788羅竹風主編,1991,《漢語大詞典》,上海:漢語大詞典

出版社,頁 4689。

新正 112 臺灣大百科全書,上網日期:2012 年 10 月 16 日。網址:

http://taiwanpedia.culture.tw/web/content?ID=2026&Keyword=

%E6%96%B0%E6%AD%A3新春 1012

新年 1674邵愈強、王友乾,1990,《中國節令詩歌選》,上海:學

林出版社,頁 1。

新歲 72陳正之,1997,《台灣歲時記:二十四節氣與常民文化》。

臺中:臺灣省政府新聞處,頁 26。

農曆新年 44 維基百科,上網日期:2012 年 6 月 25 日。網址:http://

zh.wikipedia.org/wiki/%E6%98%A5%E7%AF%80農曆年 225

舊曆新年 6

舊曆年 67

征月 23 廖漢臣,1973,《臺灣的年節》,臺中:臺灣省文獻委員會,

頁 1。正月 4806

元日 215查 字 典, 上 網 日 期:2013 年 1 月 30 日。 網 址:http://

www.chazidian.com/shicizhishi55/

過年 1013中國網,上網日期:2012 年 12 月 7 日。網址:http://

big5.china.com.cn/aboutchina/zhuanti/cjxs/node_7041057.htm

058 數位人文研究與技藝

2.中國節慶詞彙的層級關係

中國節慶詞彙與 AAT 知識組織結構的對應分析研究顯示,AAT 並無任一詞彙與

中國節慶的中文詞彙有精準等同的關係,目前尚缺乏中國節慶的知識組織系統和相

關控制詞彙。中國節慶的中文控制詞彙來源為故宮博物院後設資料,而故宮博物院

的後設資料乃將年節、元宵和春社等詞彙全部歸類於「節令」範疇,依教育部國語

辭典定義,「節令」具有節日概念,同理可證,「節令」等同於「節慶」,因此年

節等詞彙的概念領域係屬於「中國節慶」,然而目前 AAT 並無「中國節慶」層級,

僅具有「Festival」概念,為了建立中國節慶詞彙的層級架構,研究者遵照《藝術與

建築索引典編輯指引》的新增先導詞的規則,先導詞必須符合「依形式」、「依功

能」和「依地點或脈絡」等三種類型,並依據中國節慶詞彙的對應分析研究資料,

中國節慶係具節日概念,該組詞彙與 AAT 的「Festival」具狹廣等同關係,因此特在

「Festival」項下新增先導詞,考慮「Festival」項下多為「狂歡節(大齋期前節慶)」

和「豐收節慶」等詞彙,單獨增加<中國節慶>先導詞恐有突兀之感,並且為蓋堤

將來可以新增各地區文化的節慶,在「Festival」項下新增<依區域區分之節日>先

導詞,並在該先導詞項下再新增<中國節慶>,以含括所有相關的控制詞彙(詳

圖 3)。

圖 3 新建中國節慶層級架構圖

另外,中國節慶詞彙「元宵(S2)」雖僅與「Festival」具狹廣等同關係,但其

英文偏好詞「Lantern Festival」乃與 AAT 本身詞彙「燈節(Lantern Festival)」相同,

然而 AAT 的「燈節(Lantern Festival)」的概念為「非洲國家賽拉利昂、非洲境內的

塞內岡比亞(Senegambia)地區與加勒比海沿岸國家中的海地等地舉行的非宗教性

059 數位人文研究與技藝 數位典藏的知識組織系統之模式建構與應用研究──

以故宮中國節慶詞彙為例

圖 4 「年節」在 AAT建置層級架構圖

節日。通常藉天主教或伊斯蘭教的宗教節日舉行,其特色為帶著大型木支架紙糊燈

籠遊行的隊伍;燈以蠟燭點亮。」AAT 的「燈節(Lantern Festival)」是專指非洲國

家因政治因素而產生的非宗教節日,乃與中國節慶的「元宵」概念上完全不等同。

鑑於 AAT 系統並無法容納兩個有相同英文名稱的概念,經過專家學者審定後,建議

為中國節慶的「元宵(S2)」概念另建立「Chinese Lantern Festival」英文偏好詞,與

AAT 的「燈節(Lantern Festival)」作為區分;另外可將多增加「s」複數的「Lantern

Festivals」作為「元宵」的非偏好詞,如此,仍是能將「元宵」與其英文同義詞放入

<中國節慶>先導詞項下,且使用者仍可以「Lantern Festivals」搜尋到「元宵」,而

非只是 AAT 原有的「燈節(Lantern Festival)」。

中國節慶詞彙中只有一個詞彙與 AAT 的「New Year’s Day」具交集等同關係,即

為「年節(S1)」,而「年節(S1)」僅為「New Year’s Day」的其一概念。「New

Year’s Day」項下共有其他三種不同曆法慶祝新年的概念,包括「排燈節(印度教

節日)〔Divali(Hindu holiday)〕」、「排燈節(印度耆那教)〔Diwali(Hindu

holiday)〕」、「歲首節(Rosh Hashana)」,而「New Year’s Day」係以上三種節日

的非偏好父節點,由於以上三種概念屬於宗教節日概念,因此其主要父節點則為

<宗教節日>。有鑑於此,特在「New Year’s Day」項下新增「年節(S1)」,與「排

燈節(印度教節日)〔Divali(Hindu holiday)〕」等詞彙為平行層級關係,並將其

設為非偏好父節點(詳圖 4),考量<中國節慶>是屬於中國文化所特有的節日活

動,「年節(S1)」在<中國節慶>層級之下,該層級可以最具體地定義出詞彙的

知識脈絡與特性,因此將此列為主要偏好父節點。

060 數位人文研究與技藝

3.中國節慶詞彙的聯想關係

建立詞彙的聯想關係,係確認詞彙的相關詞彙,藉此維繫或連接概念彼此之間

的關係,並可建立完整的語意關係。本研究採用 AAT 已建立的三十七種聯想關係的

子類型為基礎,基於中國節慶詞彙隸屬於活動層面,項下的詞彙可能具有<人和活

動>、<活動和成品>、<活動和工具>、<因活動而產生的事物>和<活動和材

料>等五種聯想關係類型。本研究立基於中國節慶詞彙的語意和屬性分析結果,將

屬性分析資料與活動層面項下詞彙所具有的五種聯想關係進行比對,歸納出可行的

聯想關係類型,主要有<因活動而產生的事物>一類,並依此建立中國節慶詞彙的

聯想關係詞彙,之後再將該聯想關係詞彙作為關鍵字,進入「數位典藏與數位學習

聯合目錄」搜尋藏品筆數,獲得藏品保證,以「端午(S5)」為例(詳圖 5),共

列有「龍舟」、「粽子」、「艾草」和「香包」等詞彙,依據「數位典藏與數位學

習聯合目錄」藏品筆數,選取前三高的詞彙,並將該詞彙與 AAT 進行比對,若 AAT

已有該詞彙,即為兩者詞彙建立聯想關係;若 AAT 無該聯想詞彙,則進入 AAT 尋

找適當的階層,例如「端午(S5)」的聯想關係詞彙「龍舟」,「龍舟」係是用於

端午節龍舟大賽所使用的競賽船,因此在 AAT 的「競賽船(competition craft)」項

下新增「龍舟」詞彙,並將「端午(S5)」和「龍舟」建立聯想關係,以顯示此兩

個詞彙之間更具體的關係。

圖 5 「端午(S5)」的聯想關係詞彙,與其聯想關係詞彙在 AAT知識組織架構建置圖

061 數位人文研究與技藝 數位典藏的知識組織系統之模式建構與應用研究──

以故宮中國節慶詞彙為例

五、結論

本研究以故宮博物院和蓋堤研究中心的 AAT 為研究案例,主要係立基於西方藝

術為本的 AAT 索引典,藉由 AAT 的知識組織架構與多語言特色,結合故宮博物院

的控制詞彙,初步發展一套方法論架構,為「中國節慶」的控制詞彙進行知識組織

系統建置工作,使國內「中國節慶」藏品產生藏品與藏品、語意之間的脈絡連結,

以俾未來使用者可以獲得滿意的檢索結果。

在研究結果中,首先針對詞彙概念進行屬性分析,再將詞彙與 AAT 進行對應分

析,最後透過三種語意關係建置知識組織系統。在研究過程中,顯示中國節慶是依

照中國陰曆法與農事所演變而來的慶祝節日,屬於西方知識組織系統的 AAT 目前並

無收錄任一中國節慶詞彙,從中可見,由於文化演進不同的因素,AAT 並無收錄中

華藝術的控制詞彙,但是故宮的中國節慶詞彙仍可以不同語意程度地對應到 AAT 詞

彙,為故宮中國節慶詞彙與 AAT 詞彙之間建立應用的連結關係。此外透過建立控制

詞彙的等同關係、層級關係和聯想關係等三種語意關係,完整建構出中國節慶的知

識組織系統。根據這次的研究結果,足以讓我們看到建置出一套中華藝術知識組織

系統的可能性,而透過此研究經驗,將會再以中華藝術中的各個子領域接續完成知

識組織建構工程。

062 數位人文研究與技藝

參考文獻

大英百科全書/線上繁體中文版,上網日期:2012 年 10 月 29 日。網址:http://

daying.wordpedia.com/default.aspx

大都會博物館線上典藏資料庫,上網日期:2012 年 10 月 16 日。網址:http://www.

metmuseum.org/search-results?ft=%22spring+festival%22

中國網,上網日期:2012 年 12 月 7 日。網址:http://big5.china.com.cn/aboutchina/

zhuanti/cjxs/node_7041057.htm

王嵩山,1990,〈博物館的研究角色與功能〉,社教雙月刊,第 35 期,頁 18-19。

外研社辭書部,2001,《現代漢英辭典》,北京:外語教學與研究出版社。

吳光華主編,2010,《漢英大辭典》下卷,上海:上海譯文出版社。

林美容,【中秋節】,大英百科全書/線上繁體中文版,智慧藏百科網,上網日期:

2012 年 10 月 29 日。網址:http://daying.wordpedia.com/Content.aspx?id=084

266&sword=%E4%B8%AD%E7%A7%8B%E7%AF%80

波士頓美術館線上典藏資料庫,上網日期:2012 年 8 月 30 日。網址:http://www.

mfa.org/collections/object/spring-festival-along-the-river-24377

邵愈強、王友乾,1990,《中國節令詩歌選》,上海:學林出版社。

施美敏、王勇霞、陳貞曦,2002,《歲時節慶――親子共學知節氣》,臺北:國立

歷史博物館。

查字典,上網日期:2013 年 1 月 30 日。網址:http://www.chazidian.com/shicizhishi55/

徐典裕,2011,〈博物館跨領域知識管理模式――統整式知識內容建構管理、分享

加值與應用推廣〉,《博物館學季刊》,第 25 卷 1 期,頁 67-82。

桂雅文,2001,《愛上博物館》,臺北:幼獅文化。

紐約中國城,上網日期:2012 年 12 月 7 日。網址:http://www.chinatown-online.com/

year/year.shtml

張芳杰主編,1992,《遠東英漢大辭典:Far East Chinese - English Dictionary》,臺北:

遠東出版社。

陳正之,1997,《台灣歲時記:二十四節氣與常民文化》,臺中:臺灣省政府新聞處。

陳光華,2000,〈數位圖書館中權威控制系統的設計〉,《圖書與資訊學刊》,第

34 期,頁 51-71。

063 數位人文研究與技藝 數位典藏的知識組織系統之模式建構與應用研究──

以故宮中國節慶詞彙為例

陳光華、莊雅蓁,2001a,〈資訊檢索之中文詞彙擴展〉,《資訊傳播與圖書館學》,

第 8 卷 1 期,頁 59-75。

陳光華、莊雅蓁,2001b,〈應用於資訊檢索的中文同義詞之建構〉,《中國圖書館

學會會報》,第 67 期,頁 93-108。

陳淑君、城菁汝,2004,〈博物館社群後設資料發展與數位典藏應用之分析〉,《後

設資料在數位典藏之研究發展:回顧與前瞻研討會論文集》,上網日期:

2012 年 9 月 26 日。 網 址:http://metadata.teldap.tw/bibliography/proceeding/

cp041220-2.pdf

楊孟蒨,2001,《臺灣博物館資訊管理》,臺中:捷太出版社。

維基百科,上網日期:2012 年 6 月 25 日。網址:http://en.wikipedia.org/wiki/Chinese_

New_Year

廖漢臣,1973,《臺灣的年節》,臺中:臺灣省文獻委員會。

臺灣大百科全書,上網日期:2012 年 10 月 16 日。網址:http://taiwanpedia.culture.

tw/web/content?ID=2026&Keyword=%E6%98%A5%E7%AF%80

羅竹風主編,1991,《漢語大詞典》,上海:漢語大詞典出版社。

Broughton, V., Hansson, J., Hjørland, B. & López-Huertas, M. J. (2005). [Chapter 7:]

Knowledge Organization. In L. Kajberg & L. Lørring (Eds.), European Curriculum

Reflections on Library and Information Science Education, Copenhagen: Royal School

of Library and Information Science, 133-148. [Report of working group on LIS-

education in Europe. Working seminar held in Copenhagen 11-12 August 2005 at

the Royal School of Library and Information Science.] Retrieved from: http://biblis.

db.dk/uhtbin/hyperion.exe/db.leikaj05 (Chapter 7 alone: Chapter 7.pdf )

Chen, S.-J., Lin, S., Kuo, C.-C., Yang, Y.-P. & Lee, D.-T. (2011, November 6-10). Chinese

AAT Update. Paper presented at International Terminology Working Group (ITWG)

Meeting, Getty Research Institute, LA., US.

Chen, S.-J., Kuo, C.-C. & Yang, Y.-P. (2013, January 7-10). Making Chinese Art Accessible

to Western Users: A Brief Report from AAT-Taiwan Project. Paper presented at

International Terminology Working Group (ITWG) Meeting, Getty Research

Institute, LA., US.

064 數位人文研究與技藝

Doerr, M. (2001). Semantic Problems of Thesaurus Mapping. Journal of Digital Infor-

mation, 1(8). Retrieved August 16, 2012 from: http://journals.tdl.org/jodi/article/

view/31/32

Douyère, M., Soualmia, L. F., Névéol, A., Rogozan, A., Dahamnal, B., Leroy, J., �irion, B. &

Darmoni, S. J. (2004). Enhancing the MeSH �esaurus to Retrieve French Online

Health Resources in a Quality-Controlled Gateway. Health Information & Libraries

Journal, 21(4), 253-261.

ISO. (2011). ISO/CD 25964-2, Information and Documentation — Thesauri and In-

Teroperability with Other Vocabularies — Part 2: Interoperability with Other

Vocab-Ularies. [Draft, Under development] ISO/TC 46 / SC 9 ISO 25964

Working Group.

Lo, D. & Comber, L. (1958). Chinese Festivals in Malaya. Singapore: Malaya Publishing

House.

Frey, B. S. (1998). Superstar Museums: An Economic Analysis. Journal of Cultural Economics, 22, 113-125.

Ge�ner, S., Agrawal, D., Abbadi, A. E. & Smith, T. R. (1999). Browsing Large Digital Library

Collections Using Classification Hierarchies. Proceedings of 1999 Conference on

Information and Knowledge Management. Kansas City, MO., 195-201.

Gordon, A. S. (2001). Browsing Image Collections with Representations of Common-Sense

Activities. Journal of the American Society for Information Science and Technology, 52(11), 925-929.

Hagedom-Saupe, M. & Ermert, A. (2011, November 7-11). AAT in German. Paper presented

at International Terminology Working Group Meeting, Getty Research Institute,

CA.

Hjørland, B. (Ed.) (n.d.). Lifeboat for Knowledge Organization. Retrieved August 16, 2012

from: http://www.db.dk/bh/lifeboat_ko/home.htm

Hodge, G. (2000). Systems of Knowledge Organization for Digital Libraries. Beyond

Traditional Authority Files. Washington, DC: the Council on Library and

Information Resources. Retrieved August 16, 2012 from: http://www.clir.org/pubs/

reports/pub91/contents.html

Latsch, M.-L. (1985). Traditional Chinese Festivals. Beijing: New World Press.

065 數位人文研究與技藝 數位典藏的知識組織系統之模式建構與應用研究──

以故宮中國節慶詞彙為例

Lynch, C. A. & Lippincott, J. K. (2005). Institutional Repository Deployment in the United

States as of Early 2005. D-Lib Magazine, 11, 9. Retrieved September 26, 2012,

from: http://webdoc.sub.gwdg.de/edoc/aw/d-lib/dlib/september05/lynch/09lynch.

html

Mischo, W. H. (2004). United Sates Federal Support for Digital Library Research and Its

Implications for Digital Library Development. In J. Andrews & D. Law (Ed.),

Digital Libraries: Policy, Planning and Practice. England: Ashgate Publishing, 5-17.

Nagel, N. (2010, August 23-26). �e Spanish-Language Version of the AAT: Tesauro de Arte

& Arquitectura. Paper presented at Multilingual Vocabulary Project Workshop,

Getty Research Institute, CA.

Pin�eld, S. (2004). eLib in Retrospect: A National Strategy for Digital Library Development

in the 1990s. In J. Andrews & D. Law (Ed.), Digital Libraries: Policy, Planning and

Practice. England: Ashgate Publishing, 19-34.

Pustejovsky, J. (1991). �e Generative Lexicon. Computational Linguistics, 17(4), 409-441.

Shiri, A., Ruecker, S., Bouchard, M., Sta�ord, A., Mehta, P., Anvik, K. & Rossello, X. (2011).

User Evaluation of Searchling: A Visual Interface for Bilingual Digital Libraries. Electronic Library, 29(1), 71-89.

Soergel, D. (2008). Digital Libraries and Knowledge Organization. In Semantics in

Greenstone. In S. R. Kruk & B. McDaniel (Eds.), Semantic Digital Libraries. Berlin,

German: Springer, 9-39.

Soergel, D., Lauser, B., Liang, A., Fisseha, F., Keizer, J. & Katz, S. (2004). Reenginnering

Thesauri for New Application: The AGROVOC Example. Journal of Digital

Information, 4(4). Retrieved August 16, 2012 from: http://www.fao.org/docrep/008/

af234e/af234e00.htm

�e National Science Foundation. (2002). Digital Libraries, Fact Sheet. Retrieved August 16,

2012 from: http://www.nsf.gov/news/news_summ.jsp?cntn_id=103048

Timeanddate.com. Chinese Lunar New Year’s Day in Malaysia. Retrieved December 7, 2012

from: http://www.timeanddate.com/holidays/malaysia/chinese-new-year-day

YourSingapore. Chinese New Year. Retrieved December 7, 2012 from: http://www.

yoursingapore.com/content/traveller/en/browse/whats-on/festivals-and-events/

chinese-new-year.html

066 數位人文研究與技藝

Weda, R. & Zelfde, R. (2011, November 7-11). �e Dutch AAT-Updating and the Approach

to Dutch AAT Contributions. Paper presented at International Terminology

Working Group Meeting, Getty Research Institute, CA.

Wei, L.-M. (2010). Chinese Festivals. Cambridge; New York: Cambridge University Press.

Whitelaw, A. & Joy, G. (2000). Summative Evaluation of Phases 1 and 2 of the eLib Initiative:

Final Report. U. K.: Esys Limited. Retrieved August 16, 2012 from http://www.

ukoln.ac.uk/services/elib/info-projects/phase-1-and-2-evaluation/elib-fr-v1-2.pdf