佛教圖書館館訊 第十五期 87年 9月

佛教資料電子化論壇


【編者按】:資訊科技的進步,帶動佛教資料電子化的發展,但數位化所產生的諸多問題,確實值得我們關注,因此本刊特別邀請佛教界、圖書館界、資訊界等領域之學者,共同探討「佛教資料電子化」的相關議題。

佛教資料數位化的重要性及發展重點

淡江大學教育科技學系副教授 施郁芬


  電腦科技所帶來的數位革命對人類的影響是全面性的。除了生活、工作的內容及形式外,人的學習及思考也深受資訊時代資料數位化後的豐富便捷所影響。過去皓首窮經的研究,在今日因為電腦、光碟資料庫的功能及便利,使得研究者可以將心力著重在研究命題及意義的探索上。對於經藏浩瀚如海的佛教而言,資料數位化應是深具時代使命、意義重大的工作;因此如何有系統、有計劃的進行,將是一個重要的前提。如何分工及整合並共享資源是資訊時代的資訊素養。依筆者淺見,佛教資料的數位化可以分為以下三個目的層面來談及進行:

一、保存及便利性

  數位化後以光碟儲存,在儲存容量(650MB)及持久性(300年),以及攜帶使用的便利性上都是基本優點。例如印度的內觀研究所(Vipassana Research Institute)所出版的CSCD(Chattha Sangayana CD-ROM)提供了180卷以上的巴利三藏(分別以七種語文儲存),英巴及泰巴的字典,以及許多查詢、比較、統計和編輯功能,在經藏保存及研讀使用上都有重大貢獻。

二、功能性

  數位化後的資料在使用上可以因應使用者需求提供各種功能設計,舉凡查詢、比較、統計、編輯、列印、傳送等均可由電腦瞬間完成。資料數位化後的附加功能使得出版、閱讀、使用及研究工作更加彈性與得心應手。

三、推廣傳播性

  基於前二項,佛教資料數位化後無論是以檔案、光碟或上網方式呈現,在推廣傳播上均更加方便,尤其網路的普及,使得資訊彈指可得。佛教資料上網,面對的是每小時增加一萬人的網路人口;而電子郵件、FTP的便利也使得檔案傳輸及資源分享無遠弗屆。甚至網路化教學的設計提供,均在佛法的弘傳上帶來了前所未有的普及可能。

  綜言之,佛教資料數位化可說是具時代意義的工作,其進行方式或可考慮就以上三個目的層面著手。就保存及便利性而言,有計劃的將三藏逐一數位化;就功能性而言,則可依使用研究的需求,設計提供許多附加功能,例如前文曾提到的CSCD,《佛光大辭典》CD版等均是佳例。而在推廣傳播性方面,則可針對日益增加的電腦及網路使用者提供資訊及活動,例如電子出版、建置討論群、網站及網路化教學等。


「觀前顧後」資料電子化的要訣之一

淡江大學覺生紀念圖書館館長 黃鴻珠


  數位化資料在其AAA(Anyone Anywhere Anytime)的魅力下,即任何人隨時隨地均可取閱資料,掀起各界邁進的熱潮,佛教資料電子化是順應時代的趨勢,無可避免。數位化資料除3A魅力外,常被提及的優點很多,諸如:

1. 節省空間,以利保存。
2. 展現新的資料型式,如超文件、超媒體,令人耳目一新。
3. 開發研究的新方向,如藉由數位化後詞頻的統計,可看出佛典用詞的概況,或易
  於歸納佛典的典章、事故等。
4. 易於複製、傳遞、傳播。

  這些優點確實具有致命的吸引力,無人可以抗拒,但如親身體驗,實際使用後,不難發現數位化文獻並非是絕對優勢的文獻型式,尤其是3A及保存的觀點。就3A的魅力,對佛教資料而言,意義不如預期的大,因在信徒的發心贊助下,佛教資料處處可得,隨手可閱;數位化後,若缺乏暢通的網路及電腦的硬體,則無從看起,況且,資料數位化後呈現隱形的狀態,就推廣的立場來看未必是優勢。

  其次就保存的角度來看,如採數位化為唯一的管道,則後果難料。資料數位化雖可節省大量的空間,但展讀時需配合適當的軟、硬體。而電腦軟、硬體善變、速變,及不同軟、硬體、不同時代間難以相容的事實卻是一大挑戰,在此情況下保存媒體不代表保存資料,這是數位化資料與紙本資料最大的差異。美國資料維護及取閱委員會(The Commission on Preservation and Access)及研究圖書館協會(The Research Libraries Group)於1996年出版「維護數位化資料(Preserving Digital Information)」的報告書中引述數則數位化的資料,歷經若干年後,因軟硬體變遷而無法閱讀的案例,因之,該書強烈呼籲發展數位化資料之前,需制訂可永續閱讀的政策,否則數位化的結果將淪為毀滅文化的元凶。此報告書目前已引起廣泛的注意,先進國家及著名的世界組織紛紛開始規劃數位化文獻的保存政策。

  基於前述,佛教資料數位化應掌握「觀前顧後」的原則,即順應時代的潮流積極發展,並同時兼顧多數人尚缺乏使用網路及電腦的事實,誠如今年(1998)諾貝爾經濟學得主Amartya Sen所稱"You cannot evaluate what's happening in an economy or a society without looking at people who are on the down side and not just those who are doing well and prospering"即凡評估經濟或社會狀況不能只顧少數成功者,需正視中下階層大多數人的實情。此話發人深省,頗適用於文獻數位化的發展,不僅要明察使用者的應用科技環境的現實差異,同時需有遠見,考慮未來資料的呈現,否則難逃資料消失於無影無蹤的浩劫。


制訂漢文電子佛典標準格式的重要性

政治大學資訊管理學系副教授兼電子計算機中心主任 劉文卿


  佛教資料電子化的重點工作是:以國際標準SGML為基礎,制訂漢文電子佛典的標準格式,此項工作能夠產生的好處包括:

1. 整合國內電子佛典的格式,使各單位容易協調分工,共享成果。
2. 方便各種資訊應用系統的獨立開發,系統開發人員僅須參考一項標準格式,即可
  確保開發的系統適用於所有的電子佛典,提高軟體業者投入的誘因。
3. 方便網路傳輸,SGML的相容語言XML可能於最近幾年內取代HTML成為WWW的傳
  輸語言,依據SGML所定義的電子佛典格式可以確保在網路上的傳輸能力。
4. 查詢索引功能,SGML容許自訂標記,電子佛典可訂定建立索引的格式,作為查詢
  索引的標準介面。
5. 長期穩定的環境,SGML早在十餘年前便制訂完成,是一與系統無關、全球一致的
  文件定義語言,彈性大,擴充空間大,在資訊界具有長期及廣泛的支持力。
6. 增加漢文電子佛典在國際流通的能力。

  制訂漢文電子佛典的標準格式應成立推動委員會,依據國際制訂標準的作法,在一定條件下,開放個人及團體參加。通過後應爭取成為國家標準與世界標準。


共同開發電子佛典共享軟體

福嚴佛學院教務主任 釋廣淨


  筆者有幾位留學日本的朋友,回國多年後,不管國內的硬體進步了幾代,都捨不得將日本帶回來的舊電腦拋棄。原以為是日本情結的關係,其實是因為日本電腦不像國產電腦只著重在硬體升級,更重視整體工作環境的整合,所以即使硬體已經老舊了,但仍能幫助user全面性的解決問題,這便是難以割捨的原因。

  以國內佛教界來說,有多所圖書館都為了圖書館電子化付出相當大的代價,但是功能又不見得符合佛教圖書館之理想;再以檢索工具來說,像印順文教基金會雖然花錢找人開發了檢索軟體,但限於程式設計師不願將軟體賣斷而無法和教界共享,因此我們萌生了由教界開發共享軟體的念頭。

  現在電子佛典正處於起步階段,如果教界能共同訂出電子佛書的規格,共同開發軟體,就可避免重蹈覆轍。因此筆者針對電子佛典的功能提出構想,希望各方人士不吝指正、補充,將之落實、改善,使其成為理想之軟體。

  電子圖書不只是將資料輸入,應就其電子化的特性,將它加值(value-added),筆者僅就個人之經驗,提出管見就教於諸位。

一、讀經器

1. BOOKMARK:讀經器能讓讀者設定書籤。
2. 字型放大縮小:能讓讀者設定字型的大小。
3. 劃線標色:能讓讀者在「書上」劃線、標色作標記(而不影響原文)。
4. 校勘欄:要附有原書之校勘欄。
5. 讀書校勘欄:提供讀者校勘之功能。
6. 讀者注記筆記眉批:能讓讀者(在本文之外)作筆記、注記或眉批。
7. 讀者斷句標點功能:由於原文(如《大正藏》等)的斷句、標點可能有錯,希望
  提供讀者再自行斷句、標點的功能。
8. 檢索功能。

二、進階功能

1. 線上佛學辭典。
2. 線上LEXICON:特殊佛典附有專有名詞解釋(以本經論解本經論)。
3. 串珠功能(HYPERLINK):將相關之書籍(比如說將俱舍論之玄奘譯本、真諦譯本
  、光記、寶疏等)加標記,以使相關之段落能互相參考。
4. 其他。


理想中的全文檢索軟體

福嚴佛學院教師 釋厚觀


  筆者在日本曾使用過一些不錯的檢索軟體,如edit 7(for MAC.)、ygrep(for PC)等,這些共享軟體公開之後,有些高手覺得某些功能還可以再增強,在改寫之後公開讓大家使用;也有人覺得某些缺點待改善,並將改進後的軟體無私地釋放出來。如此,使用的人非常多,軟體的功能也不斷地改善。

  筆者回台之後,一直期待著佛教界能有類似這樣的共享軟體。

  筆者不懂程式設計,僅以佛學研究者的觀點,提出心中理想的全文檢索功能,期盼它能早日實現。

一、檢索功能需求

1. 布林邏輯:檢索條件能做AND、OR、NOT等邏輯運算。
2. 隔行檢索:如果檢索的字串中夾有分行、分頁等字元也能檢出。
3. 萬用字元:提供萬用字元的檢索功能。
4. 再檢索:可從檢索所得再進一步檢索。
5. 缺字檢索:希望能檢索出13,000字以外的電腦缺字。
6. 2 bytes中文檢索引擎:以中文為檢索對象,避免衝碼問題,特別是單字檢索應避
  免亂碼出現。
7. FUZZY檢索:例如檢索「阿育王」時亦能檢出「阿輸迦王」、「阿恕迦王」;檢
  索「無表」時亦能檢索出「無作」、「無教」等。

二、顯示

1. 標示出處頁數行數:檢索結果要顯示原書之頁碼和行數。(或許有人覺得電子書
  不要太遷就原書的頁數行數,可是如果檢索所得數量龐大時,若能先將檢索所得
  列印出來,再慢慢與原書對照的話,會比較便利。)
2. 頻次統計:要能計算檢索條件出現的次數。
3. 關鍵字標色:顯示時要將關鍵詞(檢索條件)標色。
4. 存檔、列印及編輯功能:要有存檔、列印及剪貼等編輯的功能。

三、設定

1. 字型大小:能設定顯示字的大小。
2. 摘要檢索顯示行數:能自由設定顯示的行數。(一般的檢索只能顯示合乎檢索條
  件之該行,可是由於顯示的行數太少,不容易判斷此項內容是否合乎檢索者的需
  要。若能自由設定顯示的行數,將有助於檢索者的需求。)
3. 萬用字元檢索範圍:利用萬用字元設定檢索範圍。

四、注意事項

1. 《大正藏》經文間有時會有夾注(如「無生法忍」),希望檢索功能不要受夾
  注的影響。
2. 如有標記時,希望檢索功能不要受標記的影響。
3. 速度要快。


經典電子化之我見

中華電子佛典協會 周海文


對佛教資料電子化的看法

  資訊數位化的好處很多,「保存」、「重製」、「流通」是最常見的優點。而大量資料的檢索,則有助於學術上的研究,但對於像我一般的佛教徒,在適應電腦媒體時代的同時,若能將古人難得一見且數量龐大的經典,化為隨手可得的資訊,進而能在日常生活中交流應用,則是我個人認為比較有意義的事。

  第一次感受佛典電子化的重要性,是在網路BBS佛教版體會到的。看著諸多善知識藉著網路研討法義時,若能隨著討論附上相關經文,不但能有佐證之用,更能使大家對經文有更深入的研究,這實在是很好的一件事。相反的,若大家在暢所欲言之後,因為網路上沒有相關經文,許多網友又不是很方便取得所有資料,此時難免有人會萌生「經文是這樣寫的嗎?」的猜想,造成美中不足之憾。因此許多朋友就認為,若能有一套大藏經在網路上,於需要時能順手取得並加以利用,如此必能有助於佛法的傳播。

  而以上這些想法,正是後學目前從事佛典電子化的緣起。

佛教資料電子化的困難與問題

  以目前後學使用BIG5碼處理佛典電子化的過程中,第一個遇到的難關就是「系統缺字」的問題,不只是BIG5字集有此問題,其它字集也會遇到相同的困擾。

  平心而論,缺字的問題影響層面很廣,由「輸入」到「呈現」,由「檢索」到「交換」,若沒有一套完整的解決方案,則會造成許多困擾。但在使用者層面而言,這問題發生的機率並不高。為了這個偶爾遇到的「小問題」,真的不知讓多少專家傷透了腦筋,花了多少辛苦的功夫了。

  然而在許多人士的努力之下,目前已看到數個漸漸成熟的解決方案。我相信在不久之後,必定可以完全解決這個惱人已久的「小問題」了。



[回gaya首頁]   [佛教圖書館館訊]   [館訊15期目次]