佛教圖書館館訊 第十四期 87年 6月

漢字缺字處理與梵巴藏字母的輸入

中央研究院資訊科學研究所研究助理 莊德明


【摘要】:漢字由古至今,一直是一字多形。基本上,漢字的字形根本無法窮舉,所以現有的電腦交換碼一旦用來處理古籍或佛典,缺字問題即層出不窮。漢字的字形雖然無法窮舉,但是常用字卻不多,大概只有五千字左右。缺字的根本及務實的解決之道,還是應該在現有的編碼方法下,根據漢字的構形規則,針對這些為數眾多但又不常出現的漢字,提出一套有效的編碼方法。

  漢字的構形單位,我們稱作部件。字形可以利用橫連、直連與包含的方式拆分成部件,部件中無法再拆分的,稱為字根。一旦把字形拆分成字根後,再把這些字根按照書寫的順序排列,即是字根序。字根序幾乎可以用來代表一個字形,就好比身份證字號可以用來代表一個人似的。

  部件、順序及拆分方式可說是漢字組字規則的三大要素。漢字的組字式中,主要分成構字式、部件序及缺字序號三種,其中構字式包含拆分符號,不但最為常用,也最嚴謹;部件序不包含拆分符號,但是使用起來最有彈性,可補構字式之不足;至於缺字序號,使用的機會雖然不多,卻可讓組字式更加完備。除此之外,從缺符號及方便符號的使用可增加組字的彈性及便利。

  在視窗環境之下,最常見的缺字呈現方式為圖片及字型。由於目前的電腦系統內定的缺字處理方法為造字,所以在字根序尚未融入系統之前,所有的缺字呈現技術都難以令人滿意。這個階段比較務實的方法是缺字仍採用字根序編碼,但是呈現時保留圖片及字型的彈性,以供使用者選擇。

  梵巴藏字母和漢字缺字的處理雖然沒有直接的關聯,但是同樣的牽涉到表達及呈現的問題。在目前中文系統裡,梵巴藏字母的呈現依然要透過字型,但是在表達方面由於缺乏字母及修飾字符,很可能會有衝碼的情況產生。然而在我們漢字缺字解決方案中,組字式用到的拆分符號及部件都有明確的定義,不會和其他文字混淆,所以不管在任何一個環境下使用,都不會有衝碼的問題發生。

中央研究院資訊科學研究所文獻處理實驗室


關鍵詞:缺字;梵巴藏字母;部件;字根;組字式


壹、漢字的缺字問題及解決關鍵

  使用電腦處理佛典的人,都有這樣一個痛苦的經驗:每當碰到人名或是咒語,總會有些字在電腦裡找不到,這便是缺字,如「羅目簬J羅」、「阿門鬗H鞞佛」、「唵嘛呢叭口聸捩﹛v等,其中的「目簬J」(左目右侯)、「門鬗H」(門裡三個人)、「口聸情v(左口右彌)都是缺字。

  以往碰到缺字,最常見的解決辦法便是造字。以目前的個人電腦而言,最常用的內碼為五大碼(Big5);五大碼共可定義19,782個字碼,其中標準用字13,051個,使用者造字5,809個,其他的是符號。所謂造字,就是在造字區補上所缺的字形。造完字後,當然就可以輸入、顯示及列印。這一切看起來似乎很完美,但是很不幸的,一旦你把這些電子資料送給別人或放到網路時,別人卻看不到這些字。問題出在哪裡?原來造完字後,這些造字會存在造字檔中;若是要讓別人看到造字,對方也得安裝造字檔才行。

  即使安裝了造字檔,缺字問題也還沒解決。我曾經在電腦中安裝過三套軟體,分別是佛光大辭典,金剛經專集,國語辭典,每一套軟體都有自己的造字檔。這下子問題來了,因為目前的電腦系統在同一個時間內,只能使用一個造字檔,而且切換造字檔時還得重新啟動中文系統。這好比說在看金剛經時,一旦需要查佛光大辭典或國語辭典,你必須重新開機以切換造字檔,你受得了嗎?近年來,由於全球資訊網的日益普及,不少強調全文的網站,也都有自己的造字檔,因此造字分享的問題也更加被突顯出來:當瀏覽者滑鼠一點,網站即可切換,然而造字檔卻無法自動切換,而使得電腦螢幕前出現了一些亂碼。

  即使哪一天造字檔可以自動切換,缺字問題仍然還在。目前五大碼只能定義兩萬字,但是常用的大字典,如中文大辭典、漢語大字典等,它們收錄的字數都在五萬字上下,那麼多出來的三萬字要怎麼辦?即使我們現在有能力把這兩部字典的所有字形都收錄到電腦,缺字問題還是沒有解決。今年四月,印順法師的妙雲集光碟片出版了;妙雲集總字數約七百萬字,但是輸入電腦時,發現有276 個缺字,這些缺字,在查了漢語大字典之後,仍有 35個找不到。漢字的缺字問題實在是一個夢魘,但是也到了非解決不可的時候了!

  解決缺字問題的關鍵,首先要釐清的是「字」和「字形」間的關係。從一開始,我們就不斷的在提缺字,事實上電腦缺的不是「字」,而是「字形」。從古到今,漢字大都一字多形。遠古的甲骨文和金文即一字數形,公元150年左右的《說文解字》收錄9,335字中,含有1,163個重文。從時間來看,漢字字形的演進主要經歷了甲骨文、金文、篆文、隸書、楷書五種字體的嬗變,並產生了不少字形結構的差異。新生的字形賦予漢字當代的適應力與活力,而字形的兼容並蓄則延續了漢字的文化傳承。從空間來看,戰國時代,各國字形都有差異;即使到了今天,台灣、大陸、日本所使用的漢字也不盡相同。在漢語大字典的異體字表中,「靈」的異體字有26個。這些異體字不但電腦無法全收,即使是大字典也都無法收齊。

  其次,漢字的字形雖然多的收不完,但是常用字大概只有5,000字左右。以二十五史為例,二十五史的總字頻次為32,479,141,總字數為13,955,其中使用頻度最高的5,000字的總字頻次就佔了 99.57%。另外二十五史的缺字數為3,911個,但是五大碼中卻有3,007個字,二十五史一個也不曾用過。以往我們總覺得五大碼字太少了,所以才會有缺字問題,其實五大碼已經收得太多了,一半以上的字都很少在用,不但浪費字碼的空間,還讓這些難得用一次的字形佔用了不少電腦資源。

  由以上兩點看來,目前電腦採用的「一形一碼」並不適用於漢字,因為漢字的字形根本無法窮舉,根本及務實的解決之道,還是要在現有的編碼方法下,根據漢字的構形規則,針對這些為數眾多但又不常出現的漢字,提出一套有效的編碼方法,以下就來討論如何在電腦中表達漢字的字形。

貳、漢字在電腦中的表達

  漢字的構形單位,我們稱作部件。當一個形體用來構造其它的字,成為所構字的一部分時,我們稱之為所構字的部件,如「日」、「京」是「景」的部件,「景」、「頁」是「顥」的部件,「騿v及「顥」是「灝」的部件。

  由文字學上來看,部件是有層次的,如「灝」拆分成「騿v及「顥」,「顥」拆分成「景」與「頁」,「景」拆分成「日」、「京」。然而並不是每個字形都可作層次拆分,如「解」一次拆分成「角」、「刀」、「牛」。文字學雖可幫我們瞭解漢字的構字,然而文字學的構形原理主要是根據小篆而來,對於早已習慣楷體的使用者,有時反會覺得不便,如「穎」拆分成「頃」、「禾」,「東」拆分成「木」、「日」,「龠」拆分成「品」、「侖」,多少還可以想像;但是如「音」拆分成「言」、「一」,「夢」拆分成「瞢」、「夕」,「異」拆分成「畀」、「廾」,這就不是一般人所能理解。

  事實上,在電腦中表達漢字,我們可以很直覺的把漢字看成圖形,這些圖形最常用的拆分法為橫連(礡^、直連(鞢^與包含(鞳^,如『顥=景糬間z,『景=日顐吽z,『圍=囗颻部z。這時『異=田韘@』,而不拆分成「畀」、「廾」。

  在字形的拆分過程中,那些不再進一步拆分的字形稱為「字根」,如『礎=石繴﹛z,『楚=林韖唌z,『林=木礞魽z,其中「石」、「木」及「疋」不再拆分,即為字根。我們一旦把字形拆分成字根後,再把這些字根按照書寫的順序排列,即是「字根序」,如「礎」的字根序為「石木木疋」。在五大碼的13,051個字中,字根序為「石木木疋」的字就只有「礎」一個字,也就是說,字根序幾乎可以用來代表一個字形,就好比身份證字號可以用來代表一個人似的。

  但是對於使用者而言,字根序顯得太長而不方便,這時候可改用部件序,如以字根序「石木木疋」代表「礎」,同樣的也可用部件序「石林疋」或「石楚」代表「礎」,因為在字形資料庫中,已經記錄了「林」的字根序為「木木」,「楚」的字根序為「木木疋」,所以部件序「石林疋」、「石楚」和字根序「石木木疋」一樣,都可在電腦中代表「礎」。由於電腦用的是字根序,所以當使用者對於一個字形有不同的理解時,電腦仍能判別,如『霬=雨騍均z或『霬=雷韘@』,然而『異=田韘@』,『雷=雨韖苤z,所以不管是『雨騍均z或是『雷韘@』,都等於「雨韖韘@」,都可代表「霬」。

  字根序雖可用來代表一個字形,但是也有些反例,如五大碼中有26組字的字根序是相同的,但是它們的拆分方式並不相同,如「員」和「唄」的字根序皆為「口貝」,然而『員=口顐屆z,『唄=口簳屆z。為了要區分這些字,除了字根序外,還要依據拆分方式來判斷。這些字根序相同的字形如下:

  另(叻)、只(叭)、旭(旮)、岑(岒)、岌(岋)、旱(旰)、李(杍)、易(昒)、昌(昍)、炅(炚)、查(柦)、毗 (毘)、耑(峏)、咡(咠)、峗(峞)、峉(峈)、峇(峆)、砅 (泵)、員(唄)、烘(烡)、翌(翋)、景(晾)、棘(棗)、暉(暈)、鶘(鶦)、楙(楺)

  其實字根的順序並不是那麼重要,假使我們不管字根的順序,除了上述的26組字外,五大碼中也只有87組字的字根是相同的,這些字形如下:

  阮(邧)、阺(邸)、邴(陃)、譪(藹)、諅(諆)、輂(輁)、郫(陴)、娵(娶)、陬(郰)、垕(垢)、召(叨)、呰(呲)、藲(櫙)、唼(婄)、吥(否)、呅(吝)、咰(昫)、呆(杏)、勛(賀)、唯(售)、嗺(嶉)、啻(啼)、保(咻)、渮(菏)、招(拐)、哲(哳)、啦(掊)、部(陪)、隕(鄖)、含(吟)、坋(坌)、槷(槸)、窪(漥)、埡(堊)、塵(塶)、妃(妀)、姀(委)、帕(帛)、鄣(障)、塻(墓)、幕(幙)、暯(暮)、杳(杲)、昶(昹)、晏(宴)、陼(都)、脣(脤)、鄃(隃)、栥(栨)、朵(机)、棸(棷)、桵(婇)、蜥(蜤)、棼(椕)、柑(某)、櫑(櫐)、槼(槻)、椎(集)、棑(棐)、桉(案)、珀(皇)、礧(礨)、盲(盳)、眇(省)、篎(箵)、窵(鴥)、麋(麊)、蜄(蜃)、蠬(蠪)、訿(訾)、賌(賅)、鏖(鏕)、蜑(蜒)、阬(邟)、渻(渺)、衍(洐)、澫(蕅)、嶊(摧)、防(邡)、郁(陏)、邾(陎)、陜(郟)、陲(郵)、另(加、叻)、旭(旮、旯)、柺(架、枷)、翌(翊、翋)

  由上看來,除了少數字形以外,字根便可用來定義字形及當作中文的交換碼。這種編碼方式,最重要的便是字根,然而在字形的拆分過程中,最令我們感到困擾的也是字根。有些字根非常直覺,如「人」、「口」、「女」,然而「貝」是否要拆分成『貝=目韙K』?又如『杰=木O』,『島=韝s』,那麼「鳥」是否要拆分成『鳥=O』?為了要讓使用者對字根有個整體的概念,我們就做了一個基本假設:所有的康熙部首都是字根,如「月」、「穴」、「青」等,其他的字形假使無法用現用的字根以橫連、直連、包含方式拆分者,也視為字根,如「本」、「東」、「爽」、「乘」。

  在字根的收集上,我們先後拆分了五大字集及簡化字總表,並加上康熙部首、說文部首、中文字根孳乳表稿的形母及聲母、大陸的漢字基礎部件,目前的字根總數為801個,其中五大碼佔371個,其他的430個為外字,如「C」、「騿v等。至於非字根的部件,它們的功能只是輔助使用者的輸入,除了五大碼中現有的如「相」、「侖」等1,446個外;外字部分,我們只收錄比較常用的353個,如「均v、「z」等。根據上述討論,以下就提出我們的漢字組字規則。

參、漢字組字規則

  對使用者而言,部件遠比字根來得方便,另外部件的順序及拆分方式也有助於更嚴謹的定義字形,所以部件、順序及拆分方式可說是漢字組字規則的三大要素。漢字的組字式中,主要分成構字式、部件序及缺字序號三種,其中構字式包含拆分符號,不但最為常用,也最嚴謹;部件序不包含拆分符號,但是使用起來最有彈性,可補構字式之不足;至於缺字序號,使用的機會雖然不多,卻可讓組字式更加完備。除此之外,從缺符號及方便符號的使用可增加組字的彈性及便利。最後,我以二十五史的缺字為例,讓讀者瞭解組字的實際狀況。以下則分別說明。

一、組字符號

符號類別 中文意義 組字符號 使用說明 範例
拆分符號 直連 當部件的排列順序由上至下 含、義
橫連 當部件的排列順序由左至右 灝、順
包含 當部件的排列順序由外至內 圍、魁、連
方便符號   二個相同部件直連
  三個相同部件直連  
  二個相同部件橫連 朋、沝、孖
  三個相同部件橫連  
  三個相同部件呈三角狀排列 焱、聶、磊
  四個相同部件橫連  
  四個相同部件直連  
  四個相同部件呈四角狀排列
其他 起始標示 當拆分符號有二種以上時,代替拆分符
號,包夾在所有部件之前面及最後
片戶甫
終止標示
缺字標示 代替從缺的部件(字根)  


二、部件

  目前可用來組字的部件除了Big5的13,051個字外,本實驗室還提供了783個外字。簡單的說,只要使用者能夠在電腦中打出來的字,皆可作為部件。

三、構字式

  使用部件及一種拆分符號,如『含=今韙f』,『順=川糬間z,『圍=囗颻部z。雖然部件可為兩個以上,如『峚=山韙j韙g』,『粥=弓穧礞}』,但是絕大多數的情形都只使用兩個部件。構字式的使用情形如《金剛經.法會因由分第一》的部分經文:「爾時世尊食時,著衣持金禰說A入舍衛大城乞食,於其城中,次第乞已,還至本處。飯食訖,收衣金禰說A洗足已,敷座而坐。」經文中的「金禰說v即是構字式。

四、部件序

  部分字形由於缺乏適當的部件,而無法以構字式表達,如「牖」字的左邊為「片」, 右邊的「戶顙j」並不在五大字集中,字形組合的方式是『牖=片(戶顙j)』,其中同時用到兩個拆分符號, 所以無法採用構字式。其實部件「戶顙j」在我們系統中原是一個部件,然而因為使用度太低而被刪除。當缺乏適當的部件,如「牖」字,則可完全摒除拆分符號,直接用部件序來表示。此時,按照書寫的順序將部件打出,並在前後加上起始「」及終結「」標示,例如『牖=片戶甫』。由於構字式的組字訊息較部件序來得完整,如「金禰說v較「金本」多了一個拆分符號,所以一個字形若可用構字式表達時,就儘量採用構字式,而不用部件序。

五、從缺符號

  雖然藉著構字式及部件序,已經可以表達出絕大部分的漢字,然而仍然會有幾個冷僻的字根,我們尚未收錄或是使用者不知如何輸入,此時就可利用從缺符號「」。從缺符號可以用於構字式及部件序,例如構字式『斲=礞蝖z中,若是不知道如何輸入「蝖v,即可以「」代替,構字式改寫為『斲=礞蝖z。又部件序『塍=月土』中,若不知道「」如何輸入,也可以「」代替,部件序改寫為『塍=月土』。一個組字式中,可以出現一個以上的從缺符號。

六、方便符號

  為了方便輸入,我們另外還造了一些方便符號。方便符號需放在部件的前頭,如『兢=鶚J』、『戔=穭遄z、『轟=魒恣z、『燚=糷鶠z等。方便符號可用於構字式,以擴大構字式的適用範圍。原先只能用部件序表達的字,加上方便符號後即能改用構字式,如『瞿=鶗颸A』、『俎=穭H禰B』、『桑=鬗S韙魽z、『啜=口糷S』等。方便符號也可用於部件序中,讓組字更為方便及精確,例如『歠=糷S酉欠』中的「糷S」不但比「又又又又」來得方便,也更精確。方便符號也讓一些字的組字式既不需橫連、直連及包含符號,也不需起始及終結標示,例如「轟=魒恣v。

七、缺字序號

  會不會有些字,連一個部件都拆不出來?有的,在中文大辭典49,905個字中,約有上千個字像圖形,幾乎無法拆分,這時候就得利用缺字序號來識別他。缺字序號的型式如同部件序,需要用起始和終結標示,但是標示中的部件改為編號,如『5』表示這是第五個無法利用上述規則表達的缺字。

八、組字實務

  這套組字規則的實用性如何呢?以二十五史為例,二十五史的缺字數為3,911,缺字總頻次為 183,701。3,911個缺字中,可用構字式表達者有 3,385個,佔總缺字數的86.55%;字頻次為170,430 ,佔總缺字頻次的92.78%。其餘的缺字,可用部件序表達者有477個,佔總缺字數的12.20%;字頻次為13,078,佔總缺字頻次的7.12%。剩下的49個缺字,部分是缺乏字根,部分則是因避諱而少寫一筆,在此不多討論。由這個統計,我們可以看出構字式和部件序的使用情形約為13:1。以上統計如表一。

表一、構字式及部件序使用情形
  缺字數 百分比 缺字總頻次 百分比
未處理前 3,911 100.00% 183,701 100.00%
採用構字式 3,385 86.55% 170,430 92.78%
採用部件序 477 12.20% 13,078 7.12%
其他 49 1.25% 193 0.10%


  另外值得一提的是,二十五史的缺字中,有213個是高頻缺字,這213個缺字總字頻為153,354,佔缺字總頻次的83.48%;若以總字頻次來看,3,911個缺字佔0.57%,這213個缺字佔0.47%。假使收錄了這些高頻缺字,構字式和部件序的使用情形如表二。

表二、構字式及部件序使用情形(收錄高頻缺字)
  缺字數 百分比 缺字總頻次 百分比
未處理前 3,911 100.00% 183,701 100.00%
高頻缺字 213 5.45% 153,354 83.48%
採用構字式 3,194 81.67% 26,236 14.28%
採用部件序 455 11.63% 3,918 2.14%
其他 49 1.25% 193 0.10%


  這樣看來,最有效的處理缺字,除了在目前的造字檔中,收錄部件外字外,最好再加上高頻缺字,但是最後仍須再將高頻缺字轉換為組字式。在二十五史的例子中,可以看出在收錄高頻缺字後,缺字頻次約佔千分之一(0.57%-0.47%),意謂輸入 1,000個字才會出現一個缺字;出現的缺字中,構字式和部件序的使用比約為7:1。

肆、缺字呈現及字形資料庫使用介面

  上述的討論都集中在缺字的表達,但是終端使用者最關心的還是字形的原貌呈現,而不是組字式。由於字形呈現牽涉到電腦作業平台,以下討論的焦點集中在擁有圖形介面及能夠處理不同字型的視窗環境,如視窗3.1、95或NT。

  在視窗環境之下,最常見的缺字呈現方式為圖片及字型。以圖片來呈現缺字,這在瀏覽網站時常可見到;透過不同的字型來呈現缺字,則常見於文書處理軟體,如使用Microsoft Word加上<書法家簡體字>來呈現簡化字。使用圖片的好處是不須再安裝字型檔,但是圖片本身不是文字,無法和其他文字採取一致的處理方式,更無法將圖片轉回組字式。至於字型基本上還是屬於文字,也可以轉回組字式,但是必須先安裝字型檔,才能看到缺字字形;使用字型的另一個困擾是並不是所有軟體都有支援,例如把Word中一段利用<書法家簡體字>呈現的簡化字複製到<記事本>中,結果發現所有的簡化字都變為繁體字了。

  由於目前電腦系統內定的缺字處理方法為造字,所以在字根序尚未融入系統之前,所有的缺字呈現技術都難以令人滿意。這個階段比較務實的方式是缺字仍採用字根序編碼,但是呈現時保留圖片及字型的彈性,以供使用者選擇。

  除了字形的呈現外,為了讓組字式使用起來更方便,我們還提供了一個漢字字形資料庫的使用介面。早在八十二年底,我們即著手建立字形資料庫——將漢字依照橫連、直連及包含的方式拆分成部件、字根,目前已拆分完畢的有五大字集13,051個字,簡化字總表2,235個字;另外即將完成的有佛典缺字2,033個(還差17個),中研院缺字9,696個(還差427個),中文大辭典49,905個(還差1,731個);另外漢語大字典的54,000個字形,目前也拆分了35,000個。

  目前的漢字字形資料庫使用介面,除了可經由筆畫及首筆查詢字根及部件外,還可利用字根或部件查詢字形的組字式、部首、筆畫、注音、倉頡碼等屬性。目前的使用介面只能看到五大字集,其他字集正在加入中。利用這樣一個介面,往後即可免去查字典的辛苦,而由電腦告知該字在字典的頁次。

伍、梵巴藏字母的輸入

  梵巴藏字母和漢字缺字的處理雖然沒有直接的關聯,但是同樣的牽涉到表達及呈現的問題。梵巴藏字母大概要等到Unicode成熟後,才會有比較好的解決方案;然而即使用Unicode,仍然無法解決漢字的缺字問題,最後還是要利用字根序來表達缺字。在目前中文系統裡,梵巴藏字母的呈現依然要透過字型,但是在表達方面由於缺乏字母及修飾字符,很可能會有衝碼的情況產生。

  以下即以Macrostone Workshop補字小組提供的Chinese compatible Diacritical Mark Truetype font 為例來說明這一個問題。這套字型的使用方式是先輸入字母,再輸入修飾字符,如A^表示A上面有一橫,r^!表示r上面有一橫,下面有一點(梵字第八母音)。修飾字符共有十個,如表三。

表三、梵巴藏字母
修飾 ASCII 功能
~ 126 字母上加一∼
` 096 字母上加一\
! 033 字母下加一點
# 035 字母下加一,
$ 036 字母上加一︿
% 037 字母上加一點
^ 094 字母上加一橫
| 166 字母上加二點
/ 047 字母上加一/
= 061 字母上加一﹀


  由於這套字型的修飾字符全都是目前電腦已有的符號,如用'!'表示字母下加一點,在這種情況下,只要英文字母後頭出現'!',即可能被電腦誤判為修飾字符。所以這套字型可以同漢字一起出現,但是不適合和英文字母合用。然而在我們漢字缺字解決方案中,所有組字式用到的拆分符號及部件都有明確定義,不會和其他文字混淆,所以不管在任何一個環境下使用,都不會有衝碼的問題發生。

陸、結語

  由於漢字的字形無法窮舉,目前電腦採用的「一形一碼」並不適用於漢字,本文針對漢字構形所提的字根序編碼方法,著眼在徹底解決漢字的缺字問題。然而要為這些難得出現一次的缺字而完全改變電腦內部的編碼方法,成本實在太高。所以務實的解決之道,仍然是在現有的編碼方法下,引入字根序來解決缺字的表達問題。本文雖然以五大碼為例,事實上字根序的編碼方法可適用於其他的中文內碼。因為我們把漢字看作圖形來處理,所以這個方法也可適用於大陸、日本、韓國、越南等其他使用漢字的地區。

  由於字形的拆分工作仍然繼續進行著,所以收錄的部件數還會再增加,但是這些新增的部件使用機會並不多,目前所提的部件集已經相當夠用了。


誌謝

  本實驗室從八十二年底,即在謝清俊教授的指導下,著手建立字形資料庫。這個工作若沒有張翠玲、許婉蓉、高孝玖、許永成、邱台鳳等同仁的協助,就沒有今天的成果,在此一併致謝。

參考資料

1. 謝清俊,《漢字的字形與編碼》,中央研究院資訊所,1996。
2. 蘇培成,《漢字簡繁體字對照字典》,台灣珠海出版有限公司,1994。
3. 周何,《中文字根孳乳表稿》,國字整理小組。
4. 大陸國家語言文字工作委員會,《漢字部件規範》,1998。



[回gaya首頁]   [佛教圖書館館訊]   [館訊14期目次]