佛教圖書館館訊 第二十一/二十二期 89年 6月

佛教資訊電子化的思考

臺東師範學院語文教育學系教授 洪文瓊


  各位師父,各位關心佛教出版的朋友,其實我被邀請來發表,個人覺得蠻訝異的,因為最近幾年我比較沒有在佛教文化方面下功夫。在這之前,我與佛教出版結緣共有三次,一是早期我曾幫忙高雄開證法師的慈恩育幼基金會出版佛教兒童圖書,二是在臺南妙心寺,負責中華佛教百科文獻基金會籌編《中華佛教百科全書》兩年,三是前年大專圖書館會議在我所服務的臺東師院召開,主題是談古籍電子化,學校要我報告一個專題,我發表「建置心經資料庫光碟的經驗」。或許是因為如此的機緣才邀請我吧!

  由於最近幾年,我投入電子出版工作較多,所以我就以電子化來做思考的方向。基本上我要談的電子化不只侷限於圖書,還包括訊息,如:佛教圖書出版的訊息、師父弘法講經活動的訊息等,這些都可以納入電子化的範圍。現在我分別就四個部分說明我的看法,供大家一起思考:一、可電子化的資訊類型;二、電子化方向;三、電子化待克服的技術環節問題;四、對臺灣佛教資訊電子化的期待。

一、可電子化的資訊類型

  關於佛教圖書、佛教訊息的電子化,首先要思考的是哪些圖書和訊息可納入電子化?在此,我依訴求對象,把它區分三大類:第一是屬研究導向的專業資訊;第二是推廣導向的一般資訊,就像白話佛經,是以一般民眾為對象;第三是兒童資訊,其實我覺得對佛教出版來講,這也是一個很好的發展方向。

(一)研究導向的專業資訊

  在研究導向的專業資訊方面,它應該涵蓋哪些內容,是很值得我們認真思考的。譬如專業圖書,除了漢譯佛典(中研院已經做了相當多的部分),非漢譯的英譯佛典是否要納入?以及現在陸續發現沒有漢譯的佛典,如:巴利文或其他語文的佛典,這些非漢譯,甚至包括日本也有一些沒有漢譯的,如《國譯一切經》,是否都要納入?此外,工具書以及與研究最有關聯的學位論文、研究論著和期刊專文,當然都是專業資訊的範圍。而有關專業出版的書訊、論著評介的資料,研討會訊息,例如今天的出版座談會等資訊,若透過網站發佈,相信可讓更多人來參與,這些也都可以納入研究導向的專業資訊。

(二)推廣導向的一般資訊

  推廣導向的資訊是以一般民眾為對象,而不是專業人士。圖書資訊除了前面提到白話佛典外,視聽讀物如錄影帶、錄音帶可能有必要包括在內。另外,弘法的訊息活動等,也是屬於推廣導向的資訊。

(三)兒童資訊

  第三種類型是兒童資訊部分,像佛光山、法鼓山都做了不少兒童圖書,甚至漫畫書,我都覺得很不錯,也都可以電子化。就訴求對象來說,兒童是特殊的讀者群,我個人認為有必要為他們提供專屬的資訊,因此我特別把它另歸為一類。

二、電子化方向

  在電子化方向方面,不外兩個途徑:一是網路化,二是電子書化。譬如剛剛自正法師所提到的一些都是屬於網路化的部分。個人覺得目前網路上可查到的大概屬於ICP(Internet Content Provider,網路內容提供者)類型,也就是所謂「資訊供應網站」;但真正屬於資訊服務的入口網站,像蕃薯藤之類的ISP(Internet Service Provider,網路服務提供者),佛教界還沒有。我覺得佛教界最好能夠設置入口網站,如此就可隨時進入查找資料,不必再經由其他網站作為中介。

  至於電子書化,就是把它做成各類電子書,像一般的光碟,或英漢電子詞典,其實都可以。電子書化可將其分成兩種類型:一種是簡易的電子書,大體上偏重文字部分,它沒有多媒體的聲音、動畫;另外是多媒體電子書,有聲音、動畫、影像等等。如我個人規畫的心經資料庫,就是屬於多媒體電子書類型。我認為佛教兒童圖書,就很適合把它作成多媒體電子書。

三、電子化待克服的技術環節問題

  不論是網路化或電子書化,這些都不是很容易就能做到的,除了資金、人才以外,我想大概還有幾個問題有待克服。第一個是佛經上出現的罕用字,或異體字的問題。超出中文電腦現有的一萬多字或ISO的二萬多字,而在佛經中使用的字,這些就是我所稱的罕用字。罕用字在電腦裡沒有,要使用就需要造字。另外,因為朝代的關係,常常是同一個字卻使用不同的字體,這就是所謂異體字的問題。異體字在佛經中也有不少,它更是要加以彙總整理。異體字整理、罕用字造字的問題,都是佛教資訊電子化有待克服的。唯這個問題比起以下的問題來說,個人覺得還是小問題,因為造字無技術難度,異體字也只是資料整理的問題。

  第二是檢索排序的問題,有關工具書或期刊專文都有檢索排序的問題。檢索問題我想至少應該要滿足所謂布林邏輯的檢索功能。而檢索了以後,通常還有資料排序的問題,這個排序在英文裡面都非常單純,依照英文二十六個字母排,但漢字檢索出來以後的資料怎麼排序?一般說是依筆劃,可是同筆劃又要依何標準排序?如《中華佛教百科全書》後面的索引就看不出排序規則。最近覺風佛教藝術文化基金會出版的《中國佛教美術論文索引》一書,同樣也存在著漢字資料排序如何處理的問題,目前電腦是依漢字內碼解決,並沒有依循圖書館業界的規範。很遺憾的,目前圖書館業界連漢字排序軟體都沒有。去年我提出兒童文學資料庫規畫案時,這個問題就沒辦法解決,後來才麻煩928電腦公司完成可依注音排序、依筆劃排序、依四角號碼排序的軟體。其中甚至可以選擇依臺灣的點、橫、直、撇、勾、折排序,或依大陸的橫、豎、點、撇、勾、折排序。兩岸交流已不可避免,簡體字、繁體字不同,當然排序也不同,這在漢字資訊的處理上,更增加它的複雜性。

  總之,假設我們要建置研究導向學術類資訊,諸如期刊論文索引,研究論著、工具書等等,都必須要解決檢索和排序問題。我覺得檢索排序這是個大問題,至少現在電腦公司都還沒認真去思考漢字資料排序問題。

  再者,假設真正要做到供學術研究的話,在檢索方面,我想「索引典的建置」更是必須考慮的。這點是我所提的第三個問題,也是個大問題。它除了析理主題詞keyword外,最主要是進一步確立keyword之間有無關係;如果有,是上位概念或下位概念或同位概念的關係,如此keyword之間就形成所謂「索引典」的問題。這樣才能將同類型、同個範疇的資訊集中。所以「索引典」的建置不是個小問題,它必須結合各方的專家才能解決。

  第四個問題是多國語文的問題。多國語文的問題是指資料本身如果含有漢、英以外的他國語文,目前的電腦要加以處理並顯示,有它的困難性。如中文和日文要同時出現,就有問題了。日本現在也是世界研究佛學的重鎮,重要的日文佛教資料當然要收錄,而像佛教發源地的巴利文佛典、梵文佛典,不可避免的也要收錄。即佛教資訊電子化,多國語文是必然要考慮,也是必須面對的問題。非漢、英文的佛教資料,且不說資料的檢索處理,光是收錄的資料要輸入,輸入的介面就是一個問題。如臺灣現有的博、碩士論文資料庫,有很多研究日本的論文,題目如有日文,就顯示不出來,有些是用圖形掃描,則沒辦法檢索,這就是多國語文同步並存的困難問題。未來佛教資訊要電子化,此一多國語文問題,勢必也要費心克服的。

四、對臺灣佛教資訊電子化的期待

  佛教資訊電子化對臺灣來講,我是滿樂觀的。最近幾年我雖然沒有深入接觸,但是臺灣不論是經濟能力,或佛學,或是資訊方面的人才,都是讓人充滿希望。而且我個人深信,如果我們佛教資訊化做得完善,臺灣將來很有可能成為新的國際佛學研究重鎮,或國際佛教圖書資訊供應中心,甚至國際佛教多媒體生產暨供應中心,這是我比較樂觀期待的,盼望佛教界能朝此方面多作投資。




[回gaya首頁]   [佛教圖書館館訊]   [館訊21/22期目次]