佛教圖書館館訊 第十八/十九期 88年 9月

《印順法師佛學著作集》光碟版簡介

印順文教基金會 釋厚觀  福嚴佛學院 釋廣淨


壹、製作緣起與理念--宗教熱情和感召

  《印順法師佛學著作集》光碟版是由「財團法人印順文教基金會」所發行。內容收錄了印順法師佛學著作四十二冊,約七百萬字,並附有「學術版」及「普及版」兩種全文檢索軟體。

  此光碟製作之緣起,是因為九年多以前,常明法師考慮到未來是一個電腦網路盛行的時代,而佛教不能置身於這波電腦風潮之外,因此發心開始輸入《妙雲集》。後來再經嘉義妙雲蘭若、南投靈山寺等許多單位與大德們前仆後繼的投入,前後歷時八年,才把導師已出版六、七百萬字的佛學著作全部輸入完成。在這漫長的八年當中,有很多參與者雖然不甚瞭解第三波電腦網路時代的電子圖書應如何著作,甚或不十分明瞭佛書電子化的意義,但是在「現代刻經運動」熱情的趨動下,焚膏繼晷,克服了諸多困難,終於在一九九八年四月八日將光碟製作出來,以作為導師九三嵩壽的賀禮。

貳、困難與挑戰

一、輸入問題

  電子圖書的製作,首先要面對的就是資料「輸入」問題,因為沒有資料輸入,一切構想都是空想。佛教的圖書卷帙龐大,早期中文OCR的技術不成熟,中文輸入都要用人工一個字一個字輸入,所以《印順法師佛學著作集》約七百萬字的輸入工作,是第一項沉重的負擔。

  電子圖書製作的第二項困難是「校對」的問題。由於電子資料有所謂「易修性」、「緊密性」、「隱藏性」等電子資料特質,和傳統的圖書大相逕庭,處理的觀念和作法都和傳統圖書不同,造成輸入錯字率偏高,和校對的困難。

  除了輸入和校對之外,還有一項中文輸入的夢魘,就是「缺字處理」的問題。缺字在平面出版的時代還可以用造字來解決,但是各自造字的結果,在電子出版時會碰到字形無法顯示和衝碼等問題,所以也行不通。現行可能解決的方式有貼圖法、組字式、open98漢字庫、今昔文字鏡和dynadoc等方式,但是還沒有終極答案。或許有人會問:九年前他們所採取的是什麼對策和方案?老實說,當時他們所採取的是船到橋頭自然直的策略。所以database中的缺字,有的用組字式,有的用通用字,有的用代碼,有的就留空白,有的打一個黑點,光是代碼就有三種以上,還有的代碼是張冠李戴,五花八門不一而足。解決的方法請參閱《佛教圖書館館訊》第十四期,釋廣淨〈印順法師佛學著作光碟版出版親預記〉。

  另外和輸入有關比較minor的問題就是「表格輸入」的問題,這個問題看起來困難但是做起來簡單。我們的作法是將表格先用文字檔輸入(以便檢索),再將表格製成圖形檔(以便瀏覽)。

二、系統設計

  文字資料輸入、校對完畢,接下來是系統設計。本光碟在設計之初,因為有兩組熱心人士的參與,所以採兩組「同步方式」進行。兩套程式各有利弊,正好可以互相觀摹,互相吸收對方的優點。

  由於本光碟資料龐大,附加功能複雜,要在短期間內發現bug並立刻加以解決,說來也不是一件容易的事。但因為本光碟有兩套程式,正好可以互相比對,即早發現對方的bug,得以縮短測試和debug的時間。

  附帶一提,系統測試本來是一種專業的工作,除了要有電腦的專業之外,還要對資料內容(佛學)有深入的瞭解,否則還真不知從何測起呢!雖然如此,我們還有一些難以克服的問題,如為了缺字的顯示,我們必須利用微軟的IE,因此目前還無法跨平台。

三、加值與後續發展

  電子圖書的製作,並不只是把文字資料一古腦的輸入就了事,重要的必需把它「加值」。如何「加值」牽涉到電腦技術與對特殊學門的研究和應用問題,電子圖書在這方面才剛剛起步,現在我們所想到的和能做的只有全文檢索,我想如何將電子資料「加值」是電子製作的重要課題,而且還有無限的開發與創意空間。有關電子圖書的功能,請參閱《佛教圖書館館訊》第十五期,釋廣淨撰〈共同開發電子佛典共享軟體〉。

  電子製作的另一個課題是:這方面的開發非常曠日費時,而且運用到的都是很先進的電腦技術。可是,電腦方面的進步一日千里,可以說是一日三變,所以如果開發電子圖書,而沒注意到電腦技術方面的進展,可能我們的電子圖書開發出來時,技術已經過時或落伍了!(如教育部費時五年製作的漢語辭典光碟即是一例)因此,要時時注意電腦發展的動態,隨時維護、開發我們的系統,以防有系統落伍或不適用的情形發生。

參、光碟版檢索功能簡介

一、檢索功能

1. 自定檢索範圍

  在光碟所提供的著述中,可自行挑選全部、某幾類或某些著書作為檢索對象。

2. 全文檢索

  透過檢索字串,可加and、or、not等條件來查尋光碟資料庫的內容。字串的內容若為跨行或跨頁,也能夠檢索出來。

3. 萬用字元

  若碰到未定的字串,可使用萬用字元「*」來替代。如:鍵入「如*說」,可檢索到「如來所說」、「如經所說」……等詞。

4. 再檢索功能

  可使用「再檢索」進一步篩選內容。

二、梵、巴、藏語及漢文缺字處理

1. 梵、巴、藏語的羅馬拼音

  一般鍵盤即可輸入梵、巴、藏語的羅馬拼音來作全文檢索。對照表如「七、梵、巴、藏語羅馬拼音鍵盤對照表」。

2. 漢文闕字

  提供二百多個電腦缺字,且不會覆蓋使用者(user) 的造字檔。

三、顯示

1. 標示原書出處頁數行數

  檢索結果能顯示原書之頁碼和行數,便利使用者對照原書閱讀。

2. 關鍵字標色

  檢索字串以不同的顏色標示,便利讀者閱覽。

3. 漸層式調閱相關資料

  檢索所得先以「摘要」作初步瀏覽,如欲閱讀詳細內容,可以再進一步調閱原文。

4. 畫面設定

  「選項設定」可調整畫面字體大小、設定萬用字元檢索範圍,並能自由設定顯示的行數。(有些檢索只能顯示合乎檢索條件之該行,可是由於顯示的行數太少,不容易判斷此項內容是否合乎檢索者的需要。本軟體提供自由設定行數的功能,便於檢索者的需求。)

四、剪貼、列印等功能

1. 可指定範圍剪貼、列印。

2. 二種存檔格式

  檢索結果可存儲成二種檔案格式:瀏覽用的html檔及純文字的text檔。

五、操作範例(見下表)

參考畫面 操作指引
(一)主畫面

1. 選取「專書」類,再選取「分類全選」。

2. 檢索字串及條件:於〔含有〕欄內鍵入「緣起」,再配合布林邏輯〔或含有〕(or)「中道」、〔且含有〕(and)「假名」、〔但不含〕(not)「空」。

3. 按「開始查詢」,即進入「檢索所得」畫面。
(二)檢索所得

「檢索所得」包括:檢索字串及條件、檢索所得總筆數、書名、各書符合檢索的筆數。按「進入瀏覽」,進入「摘要瀏覽」畫面。
(三)摘要瀏覽

「摘要瀏覽」包括:書名、檢索字串及條件、筆數、原書頁行、原書內容摘要。點選「筆數」,即進入「原文調閱」畫面。
(四)原文調閱

「原文調閱」包括:書名、檢索字串及條件、頁行、內容。點選內容中的圖檔(.gif),即顯現表格的原貌。(如上圖);若點選註解,則即時調出註解內容。

若想改變畫面,可在「選項設定」中重新設定「每頁顯示行數」及「顯示字形大小」。


六、系統平台

  Microsoft Windows 95 、Microsoft Windows 98和NT(Traditional Chinese)。目前尚不適用於Macintosh電腦。系統需求:使用本軟體必須要安裝IE4.0以上的瀏覽器。

七、梵、巴、藏語羅馬拼音鍵盤對照表



八、勘誤表

  光碟資料雖經多次校對,但錯誤仍在所難免。如發現錯誤,請以E-mail或來函指正,本基金會將彙整成「勘誤表」,隨時公佈於本基金會之網站上,歡迎查閱。

  印順文教基金會網址:http://www.yinshun.org.tw
  會址:302新竹縣竹北市縣政9路28巷7號
  E-mail:yinshun@mail.kojet.com.tw
  電話:(886-3-)553-7841,551-2254
  郵政劃撥:19147201 財團法人印順文教基金會



[回gaya首頁]   [佛教圖書館館訊]   [館訊18/19期目次]