佛教圖書館館刊 第五十三期 100年12月

知識組織系統(KOS)及其相關標準概介

陳和琴 淡江大學資訊與圖書館學系兼任副教授


【摘要】知識組織系統(Knowledge Organization Systems,簡稱KOS)亦稱知識組織工具。傳統的知識組織工具包括圖書分類表、地名詞典、標題表及索引典等。近年來,網路資源急劇增長,傳統的知識組織工具愈來愈難以滿足需求,許多新型工具應運而生,例如知識分類表(Taxonomies)、知識本體(Ontologies)、主題地圖(Topic Maps)及語意網路(Semantic Networks)等。新型KOS以網路為基礎,將某一領域的語意結構加以模式化,是能夠方便使用者資源發現及檢索的重要語意工具。對於數位時代的圖書館員及其他資訊服務而言,除了如何有效組織豐富而龐雜的知識或資訊外,如何更進一步善用作為標引、瀏覽及檢索的知識組織系統,將日趨重要。筆者試蒐集相關文獻擬探討知識組織系統的定義、類型、功能、特徵及其相關標準的最新發展,或可作為參考。

關鍵詞:知識組織系統(Knowledge Organization Systems);索引典(Thesaurus);知識本體(Ontologies);國際標準化(KOS Standards)


前言

  知識組織(Knowledge Organization,簡稱KO)是指將無序或分散的特定知識,根據一定的原則與方法,使之有序、集中、定址,以方便知識的提供、利用和傳播,(註1)是任何資訊系統的發展、運作及發揮功能之關鍵性組成部分。知識組織系統(Knowledge Organization Systems,簡稱KOS)亦稱知識組織工具。傳統的知識組織工具包括圖書分類表、地名詞典、標題表及索引典等。近年來,網路資源急劇增長,傳統的知識組織工具愈來愈難以滿足需求,許多新型工具應運而生,例如知識分類表(Taxonomies)、知識本體(Ontologies)、主題地圖(Topic Maps)及語意網路(Semantic Networks)等。新型KOS以網路為基礎,將某一領域的語意結構加以模式化,是能夠方便使用者資源發現及檢索的重要語意工具。知識組織系統是組織資訊的機制,不可否認的,一向是圖書館、博物館及檔案館的核心業務,未來也是。對於數位時代的圖書館員及其他資訊服務而言,除了如何有效組織豐富而龐雜的知識或資訊外,如何更進一步善用作為標引、瀏覽及檢索的知識組織系統,將日趨重要。由於知識組織系統類型及數量的日漸增加,其有效創建及維護、易於執行與應用,即成為KOS領域關切的議題,而相關標準的建立與發展更扮演重要角色。鑑於此,筆者試蒐集相關文獻擬探討知識組織系統的定義、類型、功能、特徵及其相關標準的最新發展,或可作為參考。

一、知識組織系統的定義

  1929年,「知識組織」一詞最早出現於英國分類學家Henry E. Bliss所出版的圖書之中。(註2)1989年,國際知識組織學會(International Society for Knowledge Organization,簡稱ISKO)成立,同年,創刊於1974年的期刊International Classification成為ISKO的官方刊物。1993年International Classification刊名改為Knowledge Organization。ISKO最主要的工作目標在於促進“Knowledge Organization Systems”(知識組織系統,簡稱KOS)的研究、發展及應用。自1997年開始,網路知識組織系統研究小組(Networked Knowledge Organization System/Service Working Group,簡稱NKOS)每年召開一次NKOS研習會。NKOS(http://nkos.slis.kent.edu/)是一非正式網路,其一般性目的在於讓KOS能作為網路資訊服務,支援網際網路資訊資源的描述及檢索。KOS這個術語被用來統稱各種對人類知識結構進行表達及組織化闡述的語意工具,例如分類系統、地名詞表、詞彙資料庫、知識本體、知識分類表及索引典等,企圖將某一領域的基礎語意結構加以模式化以利檢索。傳統上KOS把焦點放在印刷式資源,而今日複雜的網路環境,許多新興的KOS也的確將面臨許多挑戰。

  Gail Hodge指出知識組織系統涵蓋所有類型組織資訊及推動知識管理的系統。知識組織系統包括分類表、主題標目表及名稱權威檔。也包含高度結構化的索引典、語意網路及知識本體(Ontologies)。Hodge並且指出知識組織系統用來組織館藏資料以達檢索及管理的目的,它在館藏資料與使用者資訊需求之間搭起一座橋樑。(註3)

  2006年曾蕾進一步指出,知識組織系統是用來定義並組織表述真實世界物體的術語和符號的系統。在具體應用中泛指為語意工具。(註4)

  Birger Hjørland 指出知識組織就狹義而言,關及知識組織的系統(KOS),例如書目紀錄、分類系統(亦即DDC、LCC及UDC)、索引典、語意網路;並且關及知識組織的過程(Knowledge Organizing Processes,簡稱KOP),例如分類、文件描述、記述編目、索引法及主題分析等。KOS可以涵蓋所有知識,也可能僅限於某一領域或某種文件類型。比較言之,Birger Hjørland所指的「知識組織系統」涵蓋面較廣,除了包含狹義的語意工具外,擴及廣義的圖書館記述編目所建立的書目紀錄、百科全書及學科領域等。

  本文所討論的知識組織系統,僅以語意工具為主要範圍;換言之,本文中所指的知識組織系統即為傳統和現代新型知識組織工具的統稱。(註5)

二、知識組織系統的類型

  知識組織系統有哪些類型?Gail Hodge、曾蕾及Birger Hjørland各有不同的說法:

(一)Gail Hodge

  Gail Hodge將KOS的類型分成三大類:詞單(Term Lists)、分類(Classifications and Categories)及關係清單(Relationship Lists)。第一大類的詞單進一步細分為權威檔(Authority Files)、詞彙表(Glossaries)、字典(Dictionaries)及地名詞表(Gazetteers)。第二大類的分類再細分為主題標目表(Subject Headings)及分類表(Classification Schemes, Taxonomies, and Categorization Schemes)。第三大類的關係清單包括索引典(Thesauri)、語意網路(Semantic Networks)及知識本體(Ontologies)。各種類型的KOS各有其複雜性、結構及功能。

(二)曾蕾

  曾蕾參考Hodge的分類將KOS的類型也分為三大類:詞單(Term Lists)、分類與大致分類(Classification & Categorization)及關係組織(Relation Groups)。第一大類的詞單進一步細分為可選清單(Pick List)、地名詞表(Gazetteers)、詞彙表(Glossaries)、字典(Dictionaries)、權威檔(Authority Files)、同義詞環(Synonym Rings)。第二大類的分類與大致分類(Classification & Categorization)包括主題標目表(Subject Headings)、大致歸類類表(Categorization Schemes)、知識分類表(Taxonomies)及圖書分類表(Classification Schemes)。第三大類的關係組織(Relation Groups)包括敘詞表/索引典(Thesauri)、概念圖(Concept Maps)、語意網路(Semantic Networks)及實用分類法或知識本體(Ontologies)。

(三)Birger Hjørland

  Birger Hjørland等人認為Gail Hodge的KOS類型不夠全面性,將狹義的KOS(於圖書資訊界)的類型列於下:(註6)

1. 列舉式分類系統(例如Dewey、UDC及LCC)。
2. 分面分析系統(例如Bliss 2nd ed.)。
3. 主題標目表(例如LCSH)。
4. 以全文查尋為基礎的系統。
5. 以索引典為基礎的系統。
6. 書目計量地圖(Bibliometric Maps)。
7. 搜尋引擎之算法(Algorithms)。
8. 檔案系統(以來源原則為基礎)。
9. 本體或實用分類法(Ontologies)。
10. 語意網路(Semantic Networks)。
11. 主題地圖(Topic Maps)。

  就廣義而言,Birger Hjørland等人將KOS的類型包括知識在社會中組織的方式,意即大學的組織結構、高等教育及研究學術機構、科學學科領域的結構及勞工的社會分工等等。同時認為百科全書及圖書館也是KOS廣義的範例,而UNISIST模式更是KOS的重要模式,因為它既是狹義的KOS也是廣義的KOS。

  和KOS的定義一樣,由於範圍的廣狹大小而有不同的KOS類型。不同類型的KOS各有不同的功能或目的。

三、知識組織系統的功能

  由於對知識組織系統的定義及分類有不同的看法,對KOS應有的功能,各人亦有不同的詮釋。

(一)Hill、曾蕾、Koch及Tudhope等人

  指出KOS系統對某一領域的基礎語意結構加以模式化,並且經由為概念下標籤、定義、決定屬性及關係,以提供語意、導航及翻譯等。(註7)

(二)曾蕾

  曾蕾視KOS為語意工具,其作用在於標引、瀏覽及檢索,並指出KOS的基本方法有四,包括:(註8)

1. 詞義消歧,包括同形異義、一詞多義、詞義含糊的詞彙控制。
2. 對同義詞及近義詞的控制。
3. 對概念之間的關係進行顯示。
4. 表達概念之間的關係及概念的特徵。

  各種KOS各有不同程度的詞彙控制。KOS的使用並非互相隔離。KOS可以用於組織、標引、編目、查尋,以及學習、知識模式化、推理等。以網路為基礎的KOS服務可以被一再使用,可以改變用途。網路化KOS必須是機器可以處理、機器可以理解的。

(三)Dagobert Soergel

  Soergel指出KOS作為概念化架構有許多的功能,(註9)包括:

1. 支援思考、建構意義、知識整合、發現新知識、及人與電腦程式之間的差距。支援設計及決策。
2. 為個人或增進相互了解,提供語意道路地圖,增進溝通,支援協作。
3. 支援學習及吸收資訊、支援數位學習及寫作。
4. 支援優良研究及實務、支援數位科學(E-science)。
  協助研究人員及實務人員澄清難題。資料收集、統計彙編的一致性。

5. 提供為行動及為社會及政治目的的分類。
  例如:疾病診斷的分類、醫療程序計費的分類、商品關稅的分類。

6. 支援發現/資訊檢索、分析、過濾/過程;支援電子商務物品及服務的檢索。
  支援查尋,特別是以知識庫支援終端使用者的查尋,協助澄清查尋論題;自動的相似詞擴展及階級式擴展。支援索引法,特別是以使用者為中心的索引法。方便於多資料庫的組合或統一取用。支援有意義的結構良好的資訊顯示。支援文件檢索後的處理。

7. 在資訊檢索及學習中,支援資訊有意義而結構良好的顯示。
8. 支援資訊在檢索之後的處理。
9. 為知識庫系統提供概念化基礎;人工智慧(AI)。
10. 支援資料模式化。
11. 支援語法及語意的互操性,以及跨時間的意義典藏。
12. 對讀者、作家及翻譯者,提供用詞及概念的資訊,以協助理解文本及找尋適當的用詞。
13. 支援自然語言處理(NLP)。

  比較言之,曾蕾與Soergel對KOS的功能說法有著非常明顯的差異。

四、知識組織系統的特徵

  知識組織系統的特徵可依KOS的共同性特徵、各種類型KOS個別特徵及新一代KOS三方面的特徵,分別討論於下:

(一)共同性特徵

  Gail Hodge指出KOS所具有的共同特徵,包括:(註10)

1. KOS對某一館藏及其單件有特別的見解。
2. 同一實體視所使用的KOS以不同的方式表達特點。
3. 表達於KOS的概念及其所指的真實世界物件之間必須有足夠的共同性,有知識的人可以應用具有合理可靠性的KOS。此外,應用KOS尋找相關資料的使用者,其概念必須能夠與系統中的表徵相連結。

(二)各類型KOS的特徵

  各種KOS類型各有其特徵,試依Hodge及曾蕾的分類說明如下:

1. 詞單(Term Lists)

(1) 可選清單(Pick List)

  清單(Lists)也稱為可選清單(Pick List),是NISO Z39.19 Standard內的一種控制詞彙類型。清單是一種簡單有效詞義消歧的方法,用於描述有限數量的內容物件或實體。一個詞單應該屬於同一集合,例如同一個地理區域(國家、州、市等)、國家語言(英語、法語……)及格式(文本、影像、聲音……)等。清單能有效使用於瀏覽及查尋。用於瀏覽時,用詞清單在列出並提供選用其中一個用詞時,可直接取用代表某一概念的單件。用於查尋時,清單可用於單詞查尋以取用內容物件。清單的用詞依某種順序(包括年代、字順、大小)或其他邏輯順序編排,在意義上互不重複,有著同等的特定性或專指度。清單通常應用於顯示小數用詞,有相當狹義目的之使用,例如網頁上拉下的清單可供選擇。

(2) 地名詞表(Gazetteers)

  地名詞表(Gazetteers)是地名的清單。傳統的地名詞表以書籍出版或出現於地圖集的索引。每一款目可能依地理特徵類型,例如河流、城市等編排。地名詞表的範例有U.S. Code of Geographic Names。地名通常使用分類表或學科類目加以組織。

(3) 詞彙表(Glossaries)

  詞彙表(Glossaries)是用詞的清單,通常附有定義。用詞來自特定學科領域或來自特定作品。用詞定義於特定環境,很少包含各種意義。範例包括Environmental Protection Agency (EPA) Terms of the Environment。

(4) 字典(Dictionaries)

  字典(Dictionaries)為字的字順清單,附有字的各種解釋。字典比詞彙表在範圍上更一般性。字典也可能提供字的起源、拼法、字形及各種意義。雖然字典也可能提供相似詞及相關詞,但是沒有階層結構,或依概念加以組織。

(5) 權威檔(Authority Files)

  權威檔是用詞清單,用來控制某一實體的各種不同名稱、或掌握某一特定領域的值,例如人名、團體名或國名。非選用詞可連結於選用詞。此種KOS類型通常並未具有深入的組織或複雜的結構。其呈現或依字順編排,或以粗淺的分類表加以組織。權威檔層級有限,可應用於簡單的資源導航。權威檔例如Library of Congress Name Authority FileGetty Geographic Authority File

(6) 同義詞環(Synonym Rings)

  同義詞環(Synonym Rings)也是在NISO Z39.19 Standard內的一種控制詞彙類型,相對而言,它是一種較新的KOS結構。原理上,同義詞環中所包含的語詞,在檢索上是等值的用詞。同義詞環是一套同等定義以為檢索的相連詞單,使用於擴展查尋內容物件。若使用者鍵入這些用詞的任何一個作為系統的查尋,包含此一詞環任一用詞的全部單件就可以檢索出來。系統中同義詞環以其非結構化自然語言的格式。透過同義詞環的界面,詞彙得以控制。同義詞環通常與搜尋引擎一起使用,幫助擴充檢索。同義詞環在詮釋資料的關鍵詞項也十分常見。同義詞環與其他KOS類型不同之處在於不強求某一用詞是正式詞(或選用詞),每一個用詞都是正式詞。同義詞環可以一組一組逐步建立,可以只給整個詞彙中10%或20%的詞彙建立同義詞環,量力而分期完成,可隨著檢索環境和網站內所能容納的變化而隨時增加新的同義詞環。曾蕾指出它的投資小、效益高及實用性強。(註11)

2. 分類與大致分類(Classification & Categorization)

(1) 主題標目表(Subject Headings)

  主題標目表(Subject Headings)提供一套控制用詞以代表館藏單件的主題。主題標目表可以涵蓋廣泛主題範圍,不過通常結構不深,階級結構十分有限。在使用中,主題標目表傾向於納入規則,包括標目的建立及其特定性的選擇。主題標目表的範例包括Medical Subject Headings (MeSH)及Library of Congress Subject Headings (LCSH)。

(2) 大致歸類類表(Categorization Schemes)、知識分類表(Taxonomies)及圖書分類表(Classification Schemes)

  這些KOS類型用詞通常交換使用。之間或許有稍有不同,有的以數字或字母代表主題提供階級式的編排,有的可能並未遵循ANSI NISO Thesaurus Standard (Z39.19)所要求的階級規則,並且缺乏索引典所呈現的關係。圖書分類表的範例包括Library of Congress ClassificationDewey Decimal ClassificationUniversal Decimal Classification

  知識分類表(Taxonomies)最早有生物分類學嚴格的分類體系(門、綱、目、科、屬、種)。在網站、資料庫及資訊中心,應用知識分類表的原理對概念及主題進行層層細分,展現其間的等級結構。知識分類表是一種幫助找到更合適、更專指的概念之有效結構。愈來愈多的知識分類表使用於物件導向設計及知識管理系統,以指出以某一特徵為基礎的物件群組。

3. 關係組織(Relation Groups)

(1) 索引典(Thesauri)

  索引典以概念為基礎,並且顯示用詞之間的關係。索引典中的關係通常表達於階級、等同及聯想。這些關係所代表的標記包括BT(廣義用詞)、NT(狹義用詞)、SY(相似詞)及RT(聯想或相關詞)。聯想關係在某些索引典可能較為詳細,例如出自National Library of Medicine的Unified Medical Language System (UMLS)有多於40種關係,其中許多是聯想關係。索引典的選用詞可供標引及檢索。檢索用詞或非選用詞指向選用詞。在所有詞彙控制的結構中,索引典提供最豐富的結構和相互參照的環境。索引典的範圍可以是很專門、很狹窄的領域,也有應用於不同內容較廣泛的領域。

  有一些標準作為發展索引典之用,單語索引典標準包括(NISO 1998; ISO 1986),多語索引典包括(ISO 1985)。在這些標準內,索引典的定義相當狹窄,設定標準的關係,辨識選用詞及關係建立的規則。在這些標準中,索引典的定義與傳統所稱的索引典通常有點差異。許多索引典並未遵循標準中全部的規則。另一種類型的索引典例如Roget’s Thesaurus(附加類目),僅代表等同關係。

  許多索引典很大型,可能包括多到50,000個用詞。大部分為特定學科領域或特定產品或產品家族。索引典範例包括Food and Agricultural Organization (FAO)的Aquatic Sciences and Fisheries Thesaurus及National Aeronautic and Space Administration (NASA) Thesaurus

(2) 語意網路(Semantic Networks)

  隨著自然語言處理的來臨,語意網路有重要的發展。語意網路呈現概念的關係及屬性。此種KOS結構概念及用詞的呈現非為階級式,而是多變關係類型的網路狀。概念被想為節點(Nodes),並且關係從節點分支出來。關係通常超越標準的BT、NT及RT。關係通常包含特定的整部(Whole-part)、因果(Cause-effect)或父母子女(Parent-child)關係。語意網路的範例包括是現使用於各種搜尋引擎、Princeton University的WordNet,以及Unified Medical Language System (UMLS) Semantic Network。

(3) 知識本體或實用分類法(Ontologies)

  Ontology知識本體,曾蕾譯為實用分類法,是加於知識組織系統的最新標籤之一。知識管理界正發展知識本體(Ontologies)作為特定的概念模式。知識本體可能代表物件間複雜的關係,並且包含語意網路所失去的規則及公理。於特定範圍所描述的知識本體通常與資料探勘及知識管理的系統相連結。知識本體的範例包括the Gene Ontology(http://www.geneontology.org/)。

  上述知識組織系統的範例在複雜性、結構上及功能上各有其差異性。就複雜性而言,索引典比知識分類表、同義詞環、可選清單複雜。第一大類的可選清單算是一維的結構模型,第二大類的分類及大致分類算是二維的結構類型,而第三大類的關係組織則是三維以上的結構組織。(註12)

(三)新一代KOS的特徵

  Douglas Tudhope及Traugott Koch指出新一代KOS朝向網路化服務及應用發展。(註13)

  曾蕾指出新一代KOS向強結構的語意工具發展,其特點在於吸取不同KOS的特長,集中起來優化使用以提高檢索效率。包括:

1. 知識分類表與詮釋資料特徵的結合。
2. KOS、詮釋資料與專用標記語言的結合。
3. 綜合利用多種KOS原理和方法,例如多個KOS結構在學習科學概念中的結合使用。
4. 對電腦可讀性的強調:多種編碼(Encoding)系統的應用。
5. 可視性(Visualization)與傳統形式的結合使用。
6. 受控與非受控方式的結合,例如分眾分類法folksonomy的應用。(註14)

  曾蕾並指出以KOS設計瀏覽與檢索介面從第一代已發展到第四代。第一代檢索介面為查尋。第二代為查尋加上瀏覽;1996年10月Yahoo最早採用分類的方法提供瀏覽服務;到1998年幾乎所有檢索網站都加上了分類瀏覽。網際網路上許多圖書館建立主題指南和虛擬圖書館都採用分類瀏覽的方式。第三代發展為分面、多維,其特徵包括:1. 分面的思路(面向可能包括物體、部件、過程、時間等);2. 多維的檢索、瀏覽、開拓(同時提供多種的瀏覽及開拓的可能途徑,並非僅提供一個框架、一個道路);3. 以作品、物件為核心(讓部門劃分、體裁劃分、語種劃分退居第二線,為FRBR原則的體現);4. 顯示的是資訊,而不是資料結構。第四代進展到加入屬性、特徵;事物、概念不僅有分類,還有屬性特徵。在實際工作中有多種利用KOS原理的方法,包括:1. 在分面結構中採用可選清單;2. 從分眾分類法中採集詞彙;3. 在搜尋引擎中引進同義詞環;4. 很多採用等級結構;5. 用索引典幫助使用者建立檢索提問、控制檢索範圍;6. 使用概念地圖;7. 實用分類法與知識庫的有機結合;8. 多種KOS原理和方法的綜合利用。(註15)

  此外,王忠紅也指出新的KOS結合或增強知識分類和控制詞彙的手段,並結合網路技術的發展。新環境下KOS的發展呈現出下列特徵:(註16)

1. 組織對象用戶需求化。
2. 控制手段多元化。
3. 知識結構透明化。
4. 計算機可操作化。
5. 用途多元化。
6. 跨學科化。

五、知識組織系統相關標準

  KOS的設計及應用其關鍵動力在於資訊檢索,而資訊檢索也是大部分KOS相關標準的驅動者。標準是「一種文件,由公認機構核准通過,針對相關內涵而提供規則、指引、活動或成果的特徵,以為一般及重複使用。」(註17)

(一)KOS標準化的理由

  Dextre Clarke指出KOS的發展及使用符合標準化有下列潛在優勢,包括:

1. 最佳實務指引可加速KOS的發展過程。
2. 創建及維護KOS的現成軟體可以取得。
3. KOS的精明使用者將可以理解用於格式及顯示的常規。
4. 系統管理者及發展者可發現易於執行KOS於應用,例如搜尋引擎、編目及內容管理。
5. 若所應用的索引語言相同,跨系統、網路及資源的查尋將更容易。

(二)KOS標準的發展

  在各類型KOS之中,索引典標準的發展尤其受到國際標準界的重視。

1. 二十世紀的索引典標準

  索引典的原始發展受刺激於第二次世界大戰,當時文件資源成長快速,社會上(特別是科學及商業界)在資訊儲存及檢索方面出現迫切的需求。Aitchison及Dextre Clarke指出1967年Thesaurus of Engineering and Scientific Terms (TEST)在當時完全操作性的索引典中最有影響力,成為第一個美國及國際索引典標準的基礎。(註18)但是在“official”標準刊布之前,資訊管理研究界出版了數個其他的指引。Krooks及Lancaster指出這些包含(註19):

(1) 1967年,美國科學技術委員會(Committee on Scientific and Technical Information, COSATI)的發展資訊檢索索引典指引(Guidelines for the Development of Information Retrieval Thesauri)。
(2) 1969年美國教育部教育資源資訊中心(Educational Resources Information Center of the US Department of Education, ERIC)的索引典編製規則(Rules for Thesaurus Preparation)。
(3) 1970年聯合國文教組織(United Nations Educational, Scientific and Cultural Organization, UNESCO)的單語科技索引典指引(Guidelines for the Establishment and Development of Monolingual Scientific and Technical Thesauri for Information Retrieval),1971年修訂。

  早期標準看不到多語索引典方面的指引。直至70年代之後,國家及國際標準才先後問世。1974年,國際標準ISO 2788 Documentation—Guidelines for the Establishment and Development of Monolingual Thesauri及美國標準ANSI Z39.19 American National Standard Guidelines for Thesaurus Structure, Construction and Use分別出版。英國標準BS 5723亦以ISO 2788為基礎,出版於1979年。直到1985年,ISO 5964 Documentation—Guidelines for the Establishment and Development of Multilingual Thesauri發布,這是第一個跨語言的索引典標準。同年英國標準BS6723:1985推出,相同於ISO5964-1985。1986年,ISO 2788-1974更新。1987年,英國標準BS5723亦隨之更新。BS5723:1987相同於ISO 2788 -1986。美國標準ANSI Z39.19:1974先後於1993年及1998年更新。

2. 二十世紀其他KOS類型的標準

(1) 圖書分類表

  首次出版於1876年的Dewey Decimal Classification (DDC)可能是今日使用最廣的分類法。目前英語印刷最新的版本為第23版、節縮版第14版,譯成許多其他語言,又有正規的電子版定期更新。世界各地的圖書館為其特有館藏、往往對DDC有無數的地方性改寫。儘管DDC先後各版類目之間存在著不一致或衝突,在其使用界,DDC通常它還是被視為標準。此外Universal Decimal Classification (UDC)Library of Congress Classification (LCC)至今也有悠久的歷史及多樣化的版本。過去曾經擁有的夢想,亦即期望分類法可以國際化而應用於每一圖書館,現在看來,這種夢想似乎永遠無法實現。儘管分面原則非常優越,但是大量以舊版分類的館藏檢索變得愈來愈繁瑣,讓這些傳統分類法(例如DDCUDC)的使用者面臨是否重新分類的兩難。

(2) 主題標目表

  使用很廣的Library of Congress Subject Headings (LCSH),本身也可說是一種標準。雖然世界各地有很多圖書館說是使用LCSH,但是很少是全套使用,而且也並非十分嚴謹地應用其前組合標目規則。LCSH在近年來有一些改變,例如應用索引典的顯示樣式(也有BT/NT/RT),但本質上還是主題標目表。國內新發展的主題詞表並未應用LCSH的前組合標目規則,也沒有索引典完整的詞間關係,是介於索引典及主題標目表之間的特殊權威控制模式。

(3) 名稱權威檔

  有些權威清單的應用範圍如此廣大,雖非國家或國際標準,但是本身即成為標準,不需要外在標準團體的認可,例如德國國家圖書館German National Library的Personnamendatei (PND)、國際圖書館協會聯盟IFLA的Guidelines for Authority Records and References (GARR),以及為檔案人員的國際檔案學會ICA/CDS International Standard Archival Authority Record for Corporate Bodies, Persons, and Families及英國NCA Rules for the Construction of Personal, Place, and Corporate Names等等。後者也為檔案人員而定,不過擴及地名。

3. 二十一世紀的標準

  1990年代桌上型電腦的到臨,曝露出舊有標準的弱點。Internet的出現,更引出詞彙之間、詞彙與其應用之間需要互操性的階段性改變。一些為資料交換而發展的新興KOS標準於是應運而生。例如:

  ADL Thesaurus Protocol
  Zthes ANSI/NISO Z39.19-2005
  SKOS (Simple Knowledge Organization Systems)

  而現有KOS標準也有新的演變。包括:

  IFLA Guidelines for Multilingual Thesauri
  ANSI/NISO Z39.19-2005
  BS 8723: Structured Vocabularies for Information Retrieval
  ISO 25964: Thesauri and Interoperability with Other Vocabularies

(三)為資料交換而發展的KOS標準

1. ADL Thesaurus Protocol

  Alexandria Digital Library (ADL)是第一個接受挑戰、發展協定書以支援線上索引典導航及查詢的方案。ADL Thesaurus Protocol是一種輕量級的協定書,為取用以ANSI/NISO Z39.19為基礎發展的單語索引典而設。協定書以XML及為World Wide Web基本傳輸機制的Hypertext Transport Protocol (HTTP)為基礎。它以全部、簡短及較完整等三種用詞格式定義了描述索引典的XML結構。

2. Zthes

  Zthes原本發展為Z39.50 Application Service Definition and Protocol Specification的應用規範,能使索引典資料得以交換。在其核心是一代表索引典作為相通用詞資料庫的模型。索引典中每一用詞,不管是選用詞或非選用詞,都代表資料庫中的一筆紀錄。從一用詞導航至另一用詞的基本方法是查尋第一用詞相關用詞的唯一識別語。Zthes抽象模式能以XML代表。Zthes模式及規格的發展多依賴於有興趣的組織及個人,背後沒有標準權威作為後盾。其輸出於網路免費可得。(註20)

3. SKOS

  簡單知識組織系統(Simple Knowledge Organization System,SKOS)是目前正在發展的一種描述語言,使用Resource Description Framework (RDF)展現與分享控制詞彙,提供機器可理解的方式表達詞彙結構與概念,以供交換和再使用,是網路上表達控制詞彙的一種標準。SKOS代表性的例子包括AGROVOC、EuroVoc、GEMET及STW。SKOS發展規格書及標準,以支援KOS使用於語意網路架構之內。SKOS意圖工作於廣大的KOS範圍,包括索引典、分類表、主題標目表、及知識分類表等。它不涉及其結構,只涉及資料分享及交換。為適用於語意網路,SKOS規格書建立於RDF,而RDF是XML的應用。目前SKOS的發展有W3C作為後盾,已出版的SKOS規格書及文件可免費得於網路(http://www.w3.org/2004/02/skos/specs)。

(四)現有KOS標準的演化

1. IFLA Guidelines for Multilingual Thesauri

  2002年,國際圖書館協會聯盟(IFLA)成立多語索引典工作小組,以更新及增強ISO 5964-1985的內容。2005年4月,Guidelines for Multilingual Thesauri草案報告於網站提出並徵求全世界意見。多語索引典指引中舉出大量的多語言範例以為補充。2009年,Guidelines for Multilingual Thesauri正式出版,公布為IFLA Professional Reports, No. 115。

2. ANSI/NISO Z39.19-2005

  1999 年11月,National Information Standards Organization(NISO)組織研討會以探討調查「發展電子索引典標準的必要性及可行性」。結論是應該發展新標準。2005年版的Z39.19 Guidelines for the construction, format, and management of monolingual controlled vocabularies於是誕生,取代舊有的標準。新標準的範圍由索引典擴及可選清單、同義詞環、知識分類表及索引典。雖然原始意願指明對互操性的關切,然而修訂版卻停止著手於跨資料庫查尋議題、多語情況或資料交換格式及協定書。(註21)

3. BS 8723: Structured Vocabularies for Information Retrieval

  2000年,ISO 2788及ISO5964開始進行五年期評論。由於BS5723:1987相同於ISO 2788 -1986,BS6723:1985相同於ISO5964-1985,於是少數英國委員成立BSI草案委員會,首先進行英國標準(British Standards)的更新,期望後來再提交國際社群。更新的最主要動機在於索引典的互操性。BSI草案委員會開始工作於BS 8723,全盤翻修單語及多語標準,把兩者放在一起並且指明對互操性的需求。2005年至2008年間,BS 8723: Structured vocabularies for information retrieval—Guide分期出版,標準分成五個部分。

  Part 1: Definitions, symbols, and abbreviations (2005)
  Part 2: Thesauri (2005)
  Part 3: Vocabularies other than thesauri (2007)
  Part 4: Interoperability between vocabularies (2007)
  Part 5: Exchange formats and protocols for inter- operability (2008)

4. ISO 25964: Thesauri and interoperability with other vocabularies

  BS 8723出版之後,為發展為國際標準,名為ISO NP 25964的方案中成立工作小組ISO TC46/SC9/WG8,在Stella Dextre Clarke領導之下,標準團體來自13個會員國家。期望由BS 8723開始發展,整合IFLA Guidelines,將完成的ISO 25964帶到國際界。ISO 25964: Thesauri and interoperability with other vocabularies(索引典及與其他詞表的互操性)擴展修訂並取代兩種標準ISO 2788及ISO 5964。(http://www.iso.org/iso/iso_catalogue/catalogue_ics/catalogue_detail_ics.htm?ics1=01&ics2=140&ics3=20&csnumber=53657

  ISO 2788:1986:Documentation--Guidelines for the establishment and development of monolingual thesauri(單語索引典建立及發展指引)

  ISO 5964:1985:Documentation – Guidelines for the establishment and development of multilingual thesauri(多語索引典建立及發展指引)

  ISO 25964標準包括兩部分:

  第1部分:為資訊檢索的索引典,出版於2011年8月,涵蓋單語及多語索引典。第2部分:與其他詞表的互操性,即將出版於2012年,涵蓋索引典及其他類型詞表之間的對照。

  ISO 25964從BS 8723演變而來,不過有許多改造。第1部分:除了保留及更新ISO 2788及ISO 5964單語及多語索引典指引外,另增加下列主題:

(1) 應用分面分析於索引典的指引。

(2) 管理索引典發展及維護的指引。

(3) 索引典管理軟體之功能需求。

(4) 索引典資料交換之資料模型及衍生XML綱要(Schema)。

  ISO 25964第1部分可支援互操性。由於語法及語意的標準化,特別在概念之間的關係,可增進索引典之間的互操性;多語特徵的執行可增進跨語言的互操性。ISO 25964資料模式廣泛相容於SKOS,能出版於語意網路。待SKOS擴展至接受複合等同用詞、陣列(Arrays)、節點標籤及概念群組(Concept Groups),ISO 25964資料模式將更多相容於SKOS。

  ISO 25964第2部分包含對照的模式及指引。對照指引涵蓋推薦對照的類型、如何掌握前組合,還有對照到索引典以外的其他詞彙,包括分類表、知識分類表、主題標目表、本體或實用分類法、同義詞環、術語表及名稱權威檔。第2部分亦有掌握對照資料的簡略指引。

  ISO 25964第2部分把焦點放在對照。把對照定義為:「一種詞彙與另一種詞彙之間概念建立關係的過程。」對照類型的建議以標準的內在關係類型為基礎。基本上亦即等同、階級及聯想關係。對照類型容許較大的差異,不過是選擇性的,以避免單純應用中產生複雜性。ISO 25964-2的對照類型舉例:

  基本對照類型:

  等同關係,例如Laptop Computers EQ Notebook Computers。
  階級關係,例如Roads NM Streets; Streets BM Roads。
  聯想關係,例如E-Learning RM Distance Education。
  精確等同,例如Aubergines =EQ Egg-plants。
  不精確等同,例如Horticulture ~EQ Gardening。

  基本對照類型中,等同關係分單純等同及複合等同兩種;而複合等同分相交複合等同及累積複合等同兩種。

  單純等同,例如Laptop Computers EQ Notebook Computers。
  複合等同中的相交複合等同,例如Women Executives EQ Women + Executives。
  複合等同中的累積複合等同,例如Inland Waterways EQ Rivers | Canals。

  精確等同或不精確等同僅應用於單純等同,而不應用於複合等同。目前ISO 25964-2的對照類型中,SKOS尚無複合等同之對照類型。

  有關KOS的標準,Dextre Clarke指出索引典比KOS其他任何類型在國家及國際標準團體的層次上,更吸引持續的關注。目前數種不同的國家及國際索引典標準同時存在,而沒有引起重要的相容性難題。在圖書分類表方面,所謂的標準大部分作用於其特別的分類表使用者群。由於圖書分類表持續更新,分類表所面臨的最主要挑戰是使用較早版本分類表分類的館藏資料、如何能夠排除檢索上的障礙。此外,Internet及其他網路的到來,多樣化的KOS類型及眾多的KOS,更凸顯出KOS標準不只在語意層次上,而且在資料交換層次上互操性的迫切需要。(註22)

結語

  傳統上KOS被用來等於分類系統,有關控制詞彙與非控制詞彙或人工索引法與自動索引法的相對優點或缺點的討論非常多。及至今日,全文檢索已十分流行,大家逐漸把注意力從兩者的相對優缺點的爭議移開。在網際網路的快速發展下,知識的新概念比以前廣,抽象層次也比過去高,在電腦與資訊科技應用於知識組織或資訊處理的過程中,許多新型的KOS一一出現,從分類系統發展到本體知識,在新的資訊檢索應用中,漸漸變成極為重要的工具,並且再一次被推到研究的第一線。例如2010年Dublin Core Metadata Initiative (DCMI)國際會議中,DCMI-NKOS Task Group成立,致力於發展為KOS的Dublin Core Application Profile (DCAP),以方便KOS在網路環境的使用。DCAP詳述使用於KOS應用的詮釋資料,包括KOS的功能需求、領域模型(例如DDC)、詮釋資料用詞及其用法。此外,在使用者導向的大環境下,為了達成異構網路資源一次性無縫檢索的理想實現,KOS標準的發展也將以互操性為研究重心,例如ISO 25964的新發展及KOS與鏈接資料(Linked Data)的整合研究,皆值得國人關注。參與KOS的不同學科領域很多而且彼此整合交織在一起,KOS類型的演變愈來愈多元化,相關標準也有著各種不同的發展。如何在資訊檢索應用上扮演重要角色,新型KOS將持續面臨著挑戰。

【附註】
註1:阮明淑,溫達茂,〈ontology應用於知識組織之初探〉,《佛教圖書館館訊》,32期(民91年12月),頁6。
註2:Henry Evelyn Bliss, The Organization of Knowledge and the System of the Sciences, (H. Holt and Company, 1929).
註3:Gail Hodge, "Systems of Knowledge Organization for Digital Libraries: Beyond Traditional Authority Files," April 2000, http://www.clir.org/pubs/reports/pub91/contents.html.
註4:曾蕾,〈用於標引、瀏覽及檢索的知識組織系統〉,「數位圖書館發展」國際研討會,臺灣大學,2006年8月10日至11日。
註5:薛春香,朱禮軍,喬曉東,〈知識組織系統的描述與評價淺析〉,《大學圖書館學報》,2010年3期。
註6:Vanda Broughton, Joacim Hansson, Birger Hjørland & Maria J. López-Huertas, "7 Knowledge Organization", (2008).
註7:Marcia Lei Zeng, "Introductory Review of Current Knowledge Organization Structures and Tools," https://helda.helsinki.fi/bitstream/handle/10250/56/zengintro-kostypes.pdf?sequence=3.
註8:同註4。
註9:Vanda Broughton, Joacim Hansson, Dagobert Soergel, "Knowledge Organization Systems. Overview," https://www.posccaesar.org/raw-attachment/wiki/.../SoergelKOS.pdf.
註10:同註3。
註11:同註4。
註12:同註4。
註13:Douglas Tudhope and Traugott Koch, special issue editors, "New Applications of Knowledge Organization Systems: Introduction to a Special Issue," Journal of Digital Information 4:4 (2004), http://journals.tdl.org/jodi/article/view/109/108.
註14:同註4。
註15:曾蕾,〈在瀏覽和檢索介面設計中利用知識組織系統(KOS)〉,http://www.libnet.sh.cn/upload/htmleditor/File/071213121516.pdf
註16:王忠紅,〈知識組織工具的發展和趨勢〉,《圖書情報知識》,2009年6期=總132期(2009年11月),頁97。
註17:British Standards Institution. BS 0., A Standard for Standards, (London: British Standards Institution, 2005), 2 vols.
註18:J. Aitchison, S.G. Dextre Clarke, "The Thesaurus: A Historical Viewpoint, with a Look to the Future. Catalog," Classif. Quart 37:3/4 (2004), pp. 5-21.
註19:Stella G. Dextre Clarke, "Knowledge Organization System Standards," In Encyclopedia of Library and Information Sciences, Third Edition.
註20:"The Zthes Specifications for Thesaurus Representation, Access and Navigation," 17th February 2006, http://zthes.z3950.org/.
註21:National Information Standards Organization. ANSI/ NISO Z39.19-2005 Guidelines for the Construction, Format and Management of Monolingual Controlled Vocabularies; NISO Press: Bethesda, MD, 2005, http://www.niso.org/standards/index.html.
註22:同註19。



[gaya首頁]   [圖書館服務]   [佛教圖書館館刊]   [館刊53期目次]