佛教圖書館館訊 第三十三期 92年3月

主題詞表的內涵
及在網路環境中所扮演的角色

淡江大學資訊與圖書館學系副教授 陳和琴


【摘要】:主題詞表為反映文獻內容的主題詞及其詞間關係組成的規範化詞典,是將文獻、索引人員或使用者的自然語言轉換成規範化語言的一種詞彙控制工具。中國大陸所指的主題詞表多半意指敘詞表,相當於我們圖書館界所指的索引典。本文試從資訊檢索語言的作用、主題檢索語言的種類,進而探討主題詞表的內涵及在網路環境中所扮演的角色。

關鍵詞:主題詞表;索引典;主題檢索語言

 

一、前言

  越來越多的人以為:只要是網路上找不到的資訊,就表示根本沒有這種資訊。這種過度依賴網路資源的情形,使得用來幫助尋找資訊、增進資訊檢索效能的研究議題自然而然的顯得十分熱門。主題詞表是資訊檢索語言的一種,凡以語詞控制主題檢索的語言工具即為主題詞表;然而,中國大陸所指的主題詞表多半意指敘詞表,相當於我們圖書館界所指的索引典。本文試從資訊檢索語言的作用、主題檢索語言的種類,進而探討主題詞表的內涵及在網路環境中所扮演的角色。

二、資訊檢索語言的作用

    資訊檢索語言簡稱檢索語言,是根據人類檢索資訊的需要而建制的人為語言,用來表達主題概念,應用於資訊檢索系統。

  資訊檢索過程實際上包括儲存與檢索兩方面。資訊儲存指檢索工具與檢索系統的建立,而資訊檢索則指這些檢索工具及檢索系統的利用;人類用以查尋所需的資訊,兩者關係極為密切。當儲存資訊時,編目人員(或文獻標引人員、索引人員)首先對各種文獻進行主題分析,把文獻所涉及的檢索範圍及主題概念確定下來,並將之轉換成檢索語 言的語詞。當檢索資訊時,檢索人員從檢索工具或檢索系統查尋以該語詞所標引的文獻而找到所需資訊。由此可見,檢索語言是資訊檢索的語言工具,是重要組成部分,而且是編目人員及檢索人員雙方的思想橋樑。若編目人員的標引用語和檢索人員的檢索用語不一致,資訊檢索就不可能、或不能順利達成。檢索效率講求的是全、準、快、便、省,亦即檢全率、檢準率、檢索速度、檢索方便性、檢索成本與效益。檢索效率的高低,極大部分取決於其檢索語言的質量及是否正確使用。

三、主題檢索語言的種類

  任何一種資訊檢索語言,就其實質而言,都是表達主題概念及其相互關係的標識系統。資訊檢索語言可分為自然語言及控制語言兩大類。其中增進主題檢索效率的主題檢索語言即為非自然的控制辭彙。主題檢索語言是人為的語言,針對特定檢索目的而設,人為語言是經過控制的、規範化的。主題語言是主題檢索語言的簡稱,有兩大類型:分類主題語言及字順主題語言。分類主題語言用分類標記表達各種主題概念,有體系分類法(或傳統之列舉式分類法及層屬式分類法)及組配分類法(或現代的分析組合式分類法)兩種,統稱為分類法系統;字順主題語言用語詞作為概念的表達,按筆畫字順排列,並用參照系統間接顯示概念之間的相互關係,包括標題型主題檢索語言(標題法)、單元詞型主題檢索語言(單元詞法)、敘詞型主題檢索語言(敘詞法)及關鍵詞型主題檢索語言(關鍵詞法),統稱主題法系統。其中標題法是主題法系統中最早出現的一種,可稱為傳統主題法。大陸地區常將敘詞稱為主題詞,敘詞法亦稱為主題詞法。

  分類法系統與主題法系統最大的不同在於前者使用標記,後者使用語詞;其次是各有其工具,前者使用分類表,後者使用標題表或索引典(主題詞表)。

(一)標題法

  用經過規範的標題詞標引主題概念,以參照系統連結相關主題,並用字順提供主題檢索途徑,主題分析時直接標引標題詞,是前組合的檢索語言。在文法結構上標題詞有單一名詞、名詞加形容詞、片語、名詞加限定詞等等,有複分標題。選定標題詞須遵守特定性、唯一性、通用性及準確性的原則。標題表是標題詞的彙編,是一部標題詞典。

(二)單元詞法

  單元詞法脫胎於標題法,是對標題法的一種改革。單元詞是指最小、最基本的辭彙單位,在概念上不能進一步分解,例如鐵路,不能分解為鐵+路。單元詞法的基本原理是任何複合主題概念都可分解為單元概念,每個單元概念只須由一個單詞表達。檢索時才組配單元詞,所以是一種後組合的檢索語言。標題法是直接地、精確地直接對文獻主題進行標引,選用較狹窄、較複雜的詞組;而單元詞法偏向於選用表達簡單、廣泛概念的單詞,對於複雜的主題概念則儘量以單一概念的單詞進行組配。

(三)敘詞法

  亦稱主題詞法。由於單元詞法可自由組配單詞,與檢索前預先組配好的標題法相比,確有其優點,所以它一出現,就吸引了許多的使用者。但是這些人使用之後,發現單元詞法嚴密性不足,經過不斷改進的結果,才形成了敘詞法。換言之,敘詞法是由單元詞發展而來。

  敘詞表或稱主題詞表,又稱索引典,乃收集足以表示知識概念的字或詞,並將之以特定的結構加以排列,這些字彙控制了同義字、區別了同形異義字,並顯現各相關詞彙間階層及語意互屬上的各種關係,以作為文獻標引人員或索引人員在分析處理資料及讀者在檢索資料時選用一致的、經過控制的詞彙。

  敘詞法綜合多種檢索語言的原理與方法,取各法之長、而捨各法之短。它保留了單元詞法的單詞組配,每一個詞彙可能為單字或片語,但只表示一個單一概念;採用組配分類法的概念組配來代替單元詞法的字面組配,並採用標題法預先組配的詞組,克服某些詞分拆後在組配時所產生意義失真的缺點。標題法多用於前組合索引,單元詞法僅用於後組合索引,而敘詞法用於前組合索引,也用於後組合索引。

(四)關鍵詞法

  所謂關鍵詞是指出現在文獻的篇章名、摘要等對表達主題內容具有實質意義的語詞,亦即對揭示和描述文獻主題內容極其重要、具關鍵性可作為檢索的語詞。關鍵詞法因應目錄索引編製自動化而產生,以自然語言的語詞表達主題概念,基本上是不做、或做很少的規範化處理,和標題法、單元詞法及敘詞法的規範化處理有所不同。

四、主題詞表的內涵

  綜合上述,主題詞表為反映文獻內容的主題詞及其詞間關係組成的規範化詞典,是將文獻、索引人員或使用者的自然語言轉換成規範化語言的一種詞彙控制工具。主題詞表在中國大陸的發展、其數量上十分可觀,例如中國中醫藥學主題詞表、中國檔案主題詞表、中國分類主題詞表、教育主題詞表、漢語主題詞表、大氣科學主題詞表、中醫文獻電腦庫主題詞表、廣州市人大公文主題詞表、電力主題詞表、煙草行業公文主題詞表、軍用主題詞表、國家漢語主題詞表、數學漢語主題詞表、物理學漢語主題詞表等等。其中漢語主題詞表Chinese Thesaurus為一部大型的綜合性中文敘詞表,它可說包括了人類知識的所有門類,分3卷10個分冊出版,共收敘詞11萬條。

  至於國內近年來發展的「中文主題詞表」,係由國家圖書館召集館內外圖書館同道、編目專家、各學科學者專家共同參與編訂。以「中文圖書標題表」(修訂版)為基礎大幅增加新詞目,詞目來源包括各種關鍵詞庫、專業詞典、主題詞表、索引典及各種專業參考工具書等,並採文獻保證原則。「中文主題詞表」與「中文圖書標題表」最大不同者在於取消各式複分與採用單一概念的詞彙。「中文主題詞表」旨在提供圖書館進行分類編目時進行圖書標引之用,標引對象主要在「圖書」,並非期刊論文,和一般綜合性的主題詞表或索引典不同。在詞彙間關係的建立上,索引典所收錄的詞彙間的參考關係有層屬的、相關的、同義的、同形異義的等,參照款目以BT、NT、RT、Use及Use For建立關係;而「中文主題詞表」簡化為相關的、同義的、同形異義的關係,以「用」、「不用」及「參見」建立關係。

五、主題詞表在網路環境所扮演的角色

  網路資源的主題檢索、目前最流行的方式仍然是關鍵字檢索。關鍵字為直接從網頁、網站資訊中擷取具有實質性的字詞,對查尋者而言,不必學習,非常方便。但是最大的難題是由於其同義詞、多義詞、名詞單複數皆未經規範化處理,雖檢索到的資訊量大,而其中卻多與查尋主題無關。為了提高檢全率及檢準率,主題詞表在網路資源檢索應該扮演重要的角色。但是由於網路資源發展實在太快了,若要達成有效控制的目標,主題詞表的建立與維護、如何節省人力成本,應該成為今後的研究重點。

【參考資料】

張琪玉。《情報語言學基礎》。增訂二版。武漢大學出版社,1997年。

蔡明月。《線上資訊檢索:理論與應用》。臺灣學生書局,民80年。

▲「佛教知識組織管理研討會」佛教主題詞表座談會由吳琉璃老師(中)、陳和琴老師(左二)、劉春銀主任(右二)、自正法師(右一)、郭忠生老師(左一)引言.(編輯組提供) 



[gaya首頁]   [圖書館服務]   [佛教圖書館館訊]   [館訊33期目次]