佛教圖書館館訊 第二期 84年 6月

略談外文佛書的電腦登錄

法光佛研所前任圖書館館長 李偉穎


  佛教典籍除了中文之外,尚有梵文、巴利文、藏文等的經典語文,以及近代翻譯成日文、英文等的國際語文。此外尚有屬於地區性的特殊語文,諸如泰文、蒙文、韓文佛書等。再者,由於大陸圖書的開放進口,因此佛教圖書館亦添購了不少中文簡體字的佛書。在圖書館自動化以前,所有書籍的登錄及分編作業,皆是採用手寫,或是以打字機打出之卡片。資料之查詢、檢索,全憑人工翻閱這些卡片。手寫書卡的最大優點為:當館員遇到一本用特殊語文寫的佛書時,可以依樣畫葫蘆地抄在書卡上,然後按應有的位置排入卡片櫃裡。在排卡片時,尤其是在排書名片或作者片時,若實在無法分辨該語文之字母順序,就只好排在某一特定位置,例如排在英文字的最後面。而中文簡體字,亦可依簡體字筆劃排卡。因此這些特殊語文書籍之登錄及排卡作業,對圖書館員而言,尚不致造成很大的困擾。

  然而隨著科技的進步,圖書館亦朝向自動化發展。圖書館的登錄作業,已逐漸採用電腦輸入。有些圖書館甚至已淘汰卡片式目錄,而完全採用電腦來查詢。如此,佛教圖書館勢必面臨兩大問題:一是電腦軟體設備方面,究竟要採用哪一種圖書軟體,來作登錄作業?此問題牽涉到經費的預算。通常由圖書館軟體設計公司所研發出來的圖書館作業軟體,其價格相當昂貴,僅購買必備的登錄軟體,亦須十多萬元新台幣。若要購買整套軟體,則將近百萬元。如此龐大的經費,不是一般佛教圖書館負擔得起或有意願購買,因此有許多佛教圖書館找信徒設計軟體、或是購買簡易式的圖書軟體。然而此種作法,於資料檢索、後續維修方面、以及前瞻性發展等,都會產生困擾。不過,這不是本文所要談的主題。本文所要討論的是圖書館電腦化的另一項問題,亦即在作電腦登錄時,所面臨的資料輸入問題。

  由於電腦登錄作業時,對於所輸入資料,要求其正確性、完整性、以及一致性。在此種前提要求下,登錄所遇到的最大困擾,就是梵、巴、藏等特殊外文典籍的登錄。因為一般電腦軟體所支援的字型檔,大多只有中、英、日文,而沒有梵、巴、藏、或是中文簡體字,甚至有些軟體亦不包括日文字型檔。圖書館員如何登錄這些書籍,各館的作法並不相同。以下是將筆者的經驗及所知道的狀況提出來,由於筆者並未專研於電腦,所以所用的電腦詞彙可能不太正確,故僅供大家參考,並就教於諸位。

  電腦機種大致可分為IBM系統及APPLE系統。這兩大系統的軟體,乃是各自發展,其軟體迄今尚不能互通。而台灣地區所使用的電腦,大部分是IBM系統,主要原因是由於市場占有率較大,故生產量大、成本降低,機器的售價較便宜,此是就電腦硬體而言。另外就電腦軟體而言,則由於使用者眾多,為了配合使用者的需求,故軟體發展相當迅速。因此市面上所常見的各種軟體,乃至於介紹軟體的圖書,幾乎都屬於此種系統。至於APPLE系統,亦即所謂「麥金塔」(MACINTOSH)系列的電腦,其價格較昂貴,在台灣的市場占有率不高,且其軟體通常須在APPLE電腦專賣店才買得到。但它最大的好處,在於它擁有強大的字型檔,能支援多種語文,包括梵文、藏文、中文簡體字,以及一些稀奇古怪的文字(此處所說的梵文是天成體,藏文亦為書本所見的藏文字,而非羅馬拼音字母)。唯一遺憾的是沒有巴利文字型,仍有待該電腦公司的開發。換句話說,若用APPLE電腦,只要購買所須的字型檔,於登錄佛書時,不會有上述特殊外文的登錄問題,反而是會遇到第一項問題。因為如前面所說,購買APPLE電腦及所須之字型檔,就須一筆經費,至於圖書館所使用的軟體,亦必須買套裝軟體,而不可能由信徒設計。因為一般人所設計的軟體,幾乎只能適用於IBM系統的電腦,很少人會用APPLE系統寫程式。所以本文要探討的,其實只限於IBM系統的電腦。

  筆者所使用的圖書軟體是簡易式的軟體,它能夠與倚天中文系統及PE2或PE3等文書處理環境相配合,因此筆者是採用修改英文字型檔的作法(亦即採用羅馬拼音方式輸入)。而倚天的英文造字檔,在新版裡已被刪除,它之所以被刪除的原因,筆者認為可能是由於英文字型為占用代碼頁(code page)或稱為ASCII碼。而ASCII碼的內容及空間,則有一定的限制。所以英文字型其實只能修改,而不是真正的「造字」,亦即修改ASCII碼的內容。

  修正方法是先把舊版(1.52版)裡的ETWORD.EXE的造字執行檔,拷貝到目前所用的倚天版本的子目下,以便修正ASCII碼的內容。然後在ET3的子目錄下,輸入ETWORD一字,並且按Enter鍵,則會出現「造、改字」,而英文只能改字。經修正的英文字(羅馬拼音字母),乃是存於倚天的ASCFONT.15及ASCFONT.24二檔中。不過必須注意的是,ASCII碼的內容,並非每一個字都可以隨意修改,事實上它有一部分是控制符號,不可以輕易修改,以免造成電腦的錯亂。所以可以改的部分,實際只有[Alt-127]以上的有限幾個符號。

  至於如何叫出該修正的羅馬拼音字母,有二方法:一是直接鍵入[Alt-該字號碼];另一法是事先在PE2.PRO或PE3.PRO加以定義,例如把[Shift-某一英文字]定義為梵、巴字母的大寫羅馬拼音;而把[Ctrl-某一英文字]定義為梵、巴字母的小寫羅馬拼音。

  不過,此種修正法也有其缺點:一方面各單位所修改的ASCII碼不一致,所以若想將對方電腦所建檔的資料,轉到自己的電腦上,資料會有些錯誤。再者,此種修改碼,亦受倚天版本的限制。目前倚天3.52版較不會有此問題,至於倚天3.1版則會有「吃字」的情況,亦即當某兩個拼音字母出現時,電腦會將它當作中文字來處理,而出現一個中文字,或是那兩個拼音字在螢幕上根本不出現,而空出二個字元位置。此外,亦須要在對列印指令加以定義,否則即使在螢幕上看到的是正確的羅馬拼音字型,但在印表時,印表機卻無視於這些修正的拼音字型的存在,而直接把下一個字印出。

  若是採用WINDOWS的作業環境,則美國的一家軟體公司Linguist's Software,Inc.(地址為.O. Box 580, Edmonds, WA 98020-0580, U.S.A.)已研發出梵文及藏文字型檔,稱之為LaserHINDI SANSKRIT for WINDOWS 以及LaserTIBETAN for WINDOWS。然而此字型檔與WINDOWS系統的中文字相衝突,故只能在英文環境下使用,亦即必須使用英文版的WINDOWS軟體。不過據說這是因為中文版WINDOWS的系統字為細明體,它不屬於true type字型,若是將WINDOWS系統內的細明體字型檔刪除,而以華康全真字或秀真字取代,則不會產生衝突。由於筆者沒有試過這方法,所以不知道結果如何,只能提出供大家參考。另外,泰國已有羅馬拼音的巴利文藏經光碟片出售,亦是在WINDOWS的環境下操作。這套羅馬拼音的巴利字型檔,是否能取出,用於資料的建檔,恐怕仍有待努力。不過,它可能會成為電腦業界統一羅馬拼音之巴利字型檔的依據。

  至於中文簡體字,雖然目前已有研發出中文簡體字型,不過筆者遇到所登錄的書本有簡體字乃至於日文的漢字時,通常仍採用中文繁體字輸入。或許有人認為這樣不夠正確、不符合原書著錄的情況,但對於用電腦檢索某一字詞時,不致因簡體字而遺漏。所以這是依各館的作業政策,以決定是否要依原書而作繁簡不同的輸入法。

  雖然佛教圖書館已逐漸步上電腦化作業,但其實各館目前大多仍是獨立作業,所建檔的資料並未上網路。因此各館想要怎樣修改其電腦軟體裡的外文字型,都無所謂。然而站在資源共享的立場,佛教圖書館勢必朝向網路發展,則統一這些外文字型碼,乃是不可避免的。



[回gaya首頁]   [佛教圖書館館訊]   [館訊2期目次]