佛教圖書館館訊 第十五期 87年 9月

數位化中文佛教大藏經

中華佛學研究所副研究員 維習安(Christian Wittern)


【摘要】:網路科技的發展,帶動佛教界人士投入佛典電子化的製作。本文將介紹韓國、日本、台灣等地製作電子佛典的最新發展概況,並期望以SGML為基礎,規範一套適合佛典的電子文件編碼,讓全世界的人可透過網路即時分享佛典資源。

關鍵詞:佛典電子化;標記(SGML);中華電子佛典學會(Chinese Buddhist Electronic
    Text Association)


  一千多年前,時值中國的五代和宋朝,佛教人士最早將新發明的印刷術運用於印刷佛經上,《開寶藏》於焉產生。時至今日,網路科技的發展,提供立即存取大量資訊,佛教界再次運用最新的資訊科技來處理佛教文獻資料。很多佛教徒希望將整部藏經輸入光碟中,或更進一步地將經文送上網際網路供更多人檢索。不僅如此,學者更希望透過資訊科技將辭典、現代註解、學術文章等參考資料整合。假若再配合圖片、錄影帶和聲音等加以整合成多媒體資源,使用者即可輕鬆按電腦滑鼠,獲取所需的資料。事實上,只要方法正確,我們一定可以看見這理想的實現——也許只是部份實現,也許會超出我們原來所期望的。

早期的開發

  過去幾年來,已有許多人在這方面做了各種的努力。其中以加州柏克萊大學Lewis R. Lancaster教授最早意識到它的發展潛力(potential),和在此領域中有關交換、合作和標準化的迫切需要。在1993年,他集合從事各種不同語文之佛教資料電子化的代表,並創辦了Electronic Buddhist Text Initiative(EBTI),作為資料交換和科技分享的論壇(forum)。EBTI繼而在1994年於韓國海印寺、1996年於台北佛光山、1997年於日本京都的大谷大學舉辦會議。下次會議訂於1999年1月在中央研究院舉行。

  當然,在擁有中文佛典傳承的國家裡也有很多謹慎又大膽之大、小規模的努力。其中較為重要的是日本江島惠教教授(Prof. Yasunori Ejima)幾年前曾集合不同的組織和人力協助他實現《大正新修大藏經》電子資料庫的理想。這個計劃已經成為印度學佛教學會的一個工作組織,並和出版《大正新修大藏經》的大藏出版社偶有密切的合作。雖已具備將整套藏經儲存於一片光碟的技術,但該合作計劃預計以一片光碟存取一冊藏經的方式,發行一系列《大正新修大藏經》的光碟片。由於一光碟片僅存一冊藏經,以及價格昂貴、不了解電子媒體特殊需求和特色等因素,使得此一計劃在出版四冊藏經的光碟後,即宣告停止了。近來,這些曾協助江島教授的組織又重新組合,並命名為SAT(參考下文)。

  京都花園大學的國際禪學研究所,Urs App在八○年代末期構想一個名為禪知識庫計劃(Zen-Knowledgebase project)的方案。目的是要將所有與禪學有關的資料如原典、註釋、翻譯、文獻書目、地圖、圖片、錄影帶等載入電腦資料庫中。這遠大的構想於1990年,首先進行十年的目標規劃。筆者於1992年加入該計劃,並參與投入其在1995年發行第一個廣為人知的產品──禪庫光碟1(ZenBase CD 1)的工作。這光碟可視為整個計劃的縮影(snapshot),其中除禪宗文獻外,還包括其他研究工具,幫助研究者對這些資料作最佳的運用。其主要目的在發掘電子媒體新穎且富想像力的使用方式,並鼓勵其他人士加入使用的行列。該光碟目前仍有流通,若您希望獲取此光碟,請至http://www.iijnet.or.jp/iriz/irizhtml/irizhome.htm有更詳細的資料說明。

  另外在韓國也有一個將中文藏經電子化的計劃正在進行。由於韓國擁有距今750年前的13世紀所完成的一套唯一僅存且最古老的木雕版中文大藏經,目前這木雕藏經被收藏於南韓中部的海印寺。也由於歐洲直到15世紀才由德國的Johannes Gutenberg開始運用印刷術,在時間上較韓國人慢了二百年,因此,受到這樣的鼓舞和為了延續這代表13世紀創新發明的木雕印刷技術的精神,而有以數位形式保存木雕藏經這珍貴寶藏的計劃產生。該計劃在EBTI會議後得到眾多的鼓勵與支持,並獲得韓國一間大公司的捐款贊助,使第一片光碟於1996年1月順利完成。此光碟片試著重現木雕印刷的原貌,包括垂直的排版及字行間字體較小的注解也都忠實呈現。更不可思議的是,木版印刷很多不同的字型都被輸入到電子資料中,該光碟約有5千萬字,卻已使用超過3萬個不同的字型,而內容為木雕藏經2倍的現代版《大正新修大藏經》卻僅使用約1萬個不同的字型。

  這種現象在佛典光碟的發行中反覆出現,因此值得探討印刷和電子化後佛典的根本不同處。Johannes Gutenberg應用印刷術的目的不是為了大量流通文獻,而是要表現當時作者所能創造的版面之美,所以他花費很大的心力去確保品質和制定了300種不同字型的字母集。後來人們也逐漸的發覺印刷這新媒介的優點,因而有報紙,圖書館、目錄、圖書館員、書局等陸續出現。同樣的,電子化文獻具有強大的功能,雖然第一代的電子文獻仍然無法超越紙本印刷版面的字型變化。但電子媒體可以在螢幕上表現靜態的字,也可像變魔術般地依讀者所要看的形式自由轉換呈現出來。它可以同時重現一個或多個既有版本的經文,也可以顯示現代的印刷形式,還可以使用簡單或傳統形式的字體表現。電子化的經文還能與使用者的電腦或透過網際網路的經文相互聯繫。如此,我們將逐漸了解電子化的所有潛力,不再受限於傳統印刷的刻板印象。

  台灣致力於佛典電子化的工作,但因技術問題且缺乏整合,所以即使在網路上有很多數位化的佛典,但品質不一,經文也侷限於某一範圍。目前中央研究院已經輸入相當多的經文,但大多數的經文並未開放一般使用者使用,僅提供該院成員使用。不過最近也有不少很好的檢索工具可以使用,如品質極佳的《佛光大辭典》光碟版已經發行,價錢相當合理,以及最近出版的《印順法師著作集》光碟版,具有強力的搜尋功能,而且是免費流通的。

最新的發展

  今年,中文大藏經的全文資料庫發展成果顯著。上文曾提及由日本大學和印度學佛教學會共同組成的SAT(代表者是東京大學的下田正弘),在年初時與大藏出版社簽約,並得到可以將《大正新修大藏經》電子資料庫,在網路上發行的權利,這計劃預定西元2006年完成。

  今年二月,由台大佛學研究中心恆清法師籌募經費發起成立中華電子佛典協會(Chinese Buddhist Electronic Texts Association,簡稱CBETA),希望整合國內各單位共同完成符合學術標準的電子化中文藏經。筆者在1998年2月參加草創會議並加入該協會。中華電子佛典協會並不打算重新輸入佛典,而著重在收集和校對已經由其它單位或個人輸入的電子化佛典,確保一定的高品質,並得到北美印順導師基金會的贊助,計畫在三至五年內連續發行以《大正藏》為底本之完整的佛教正典。

開放的標準和合作的重要

  佛典電子化實行的現況為何?該如何再繼續進行?其實已經非常明確,我們這一代的任務是要利用電子媒介為文化的傳承注入新生命,讓全世界的人可透過使用電腦網路即時分享資料。這也關係到經典的保存,我們知道海印寺的木雕佛典傳承至今已經超過700年的歷史了,因此最理想的狀況是電子佛典也能夠像海印寺的木雕佛典一樣,永永遠遠傳下去。但在瞬息萬變的電腦世界裡,沒有人敢保證我們的作品在十年後仍然有用,更不用說超過百年了。不過可以肯定的是:電子化佛典必須建構在開放的標準之上,另外也涉及到不同電子佛典來源的相互聯繫。同理,正如能從任一書中引用資料一樣,希望電子化佛典能夠連結不同來源的電子佛典、經文、辭典條目、地圖、傳記、歷史或註釋資料等。假如有些現代資料引用一部經典,要能夠回溯到原典及該經文的上下文等。如何能達到這種效果呢?只有一個方法:即電子化佛典的創造者必須使用共同的開放標準。

  但什麼是開放標準?開放標準就是定義任何電腦程式或資料格式都必須與任何電腦環境或製造者無關。因為開放標準,可以讓成千上萬不同的電腦在網路上運作,即使是七○年代的大型電腦主機,也能毫無困難地與最新的超級電腦和筆記型電腦連線並交換資料。

  現在我們需要什麼樣的標準?該由誰來定義它們呢?在建立新的標準之前,我們應該先檢視一下,是否已經有適合的標準了。國際標準協會(ISO)於1986年制定了一般性標記的標準語言-SGML(Standard Generalized Markup Language),規範了電子文獻交換的標準。此外,另有超過100位以上不同人文科學(Humanities)領域的學者所組成的TEI(Text Encoding Initiative),以SGML為基礎,制定出另一個標準。TEI在1994年發行了一本很詳細的「電子文件編碼指南」,全世界很多電子文獻計劃都遵照該指南。當然,該指南並未載錄有關佛典的特殊需求。EBTI正試著提出建議,針對佛典和佛教資料的特殊需求發展適用指南,此計劃還在進行之中。這些指南若要有意義,必須要能解決所有佛典電子化時可能面對的問題,因此,很顯然地,若有愈多從事佛典電子化的團體,能愈早參與該指南的制定,則該指南就更能發揮它的用途了。如前所述,EBTI將於1999年1月舉行會議,如想進一步了解,請向台大佛學研究中心或利用該中心的E-mail:cbs@ccbs.ntu.edu.tw詢問詳細情況。亦可洽中華佛學研究所網資室EBTI會議的聯絡電話:(02)2892-6111#64。

(編者按:本文作者以英文來稿,由編輯組中譯,再經作者審閱。)



《佛教圖書館館訊》稿約

  本館訊旨在發展佛教圖書館事業,提供佛教圖書館經營管理之理論及實務作
業資訊。歡迎關心佛教圖書館之先進不吝惠賜專論、研究心得與新知報導等文
章。

一、本刊各專欄內容如下:

  1. 專題論述:每期企畫專題,刊載相關之文章,歡迎配合主題來稿。第十
    六期主題「佛教圖書館行政管理」,出刊日期:十二月二十日。
  2. 經營管理:刊載圖書館學、資訊科學或佛教圖書館經營管理實務論述。
  3. 電子藏經閣:應用電腦科技處理佛教文獻的資訊、心得或技術。
  4. 書香.書鄉:適合佛教圖書館典藏之各類型資料導讀,好書、新書推薦
    或書評。
  5. 人物專訪:介紹耕耘於佛教圖書館及相關事業之園丁。
  6. 圖書館巡禮:介紹歷史悠久或具特色之佛教圖書館。
  7. 參與.分享:圖書館服務讀者之溝通、分享及資訊交流的題材。

二、來稿以原創性為主,一稿不能數投。稿件涉及版權部分(如圖片及較長之引
  文),請事先徵得原作者或出版者書面同意,本刊不負版權責任。

三、本刊對來稿有刪改權,如不願被刪改者,請預先註明。

四、來稿請具備下列項目:

  1. 中文篇名及真實姓名。
  2. 服務單位、職稱。
  3. 學術論著請附中文摘要(三百字以內)、關鍵詞(五個以內)。

五、來稿刊出後,致贈稿酬及當期本刊三冊,並將同時發行於全球資訊網
  (WWW)。

六、來稿請寄:604嘉義縣竹崎鄉內埔村溪州49之1號「佛教圖書館館訊雜誌編輯
  部收」。




[回gaya首頁]   [佛教圖書館館訊]   [館訊15期目次]