打开主菜单
 取碼原則 倉頡輸入法
例外字
特別注意 

95%以上的中文字,都可依據前述原則取碼,其餘約5%的字,若按同樣規則取碼,本來亦無不可,但顧及使用方便,特將一些字形做例外處理,這些字稱做「例外字」,包括:[1]

  1. 複合字首:做字首或次字首時,視爲一整體,只取頭、尾兩碼。
  2. 複合字:一律視爲一整體,只取頭、尾兩碼。
  3. 難字:可用「難」碼代替難取的部份。
  4. 特殊字:被其他部件橫貫時,先取特殊字,再取重疊於上的部件,並且可與骨幹的中豎重複。

注意以下例外字均已舉全,不可憑個人主觀自訂例外字,否則會取不到正確字碼。[2]

目录

複合字首编辑

「複合字首」(或稱「特別字首」)在做「字首」或「次字首」時,視爲一整體,只取頭、尾兩碼[3][4]

複合字首列表
版本 複合字首 圖解 取碼 字例 補充說明
三五     人弓 人弓.火木)、人戈.人弓
三五     尸一 尸一.中)、尸一.木竹水
三五     戈金 戈金.女戈)、戈金.一口 按台灣標準字形,「」等字的字首應爲「戈金」而非「戈木」,但微軟倉頡採後者編碼,詳參〈特別注意〉一節。
三五     戈木 戈木.竹戈)、戈木.一口
三五     一大 一大.土)、一大.一田中
三五     一女 一女.中一戈)、一女.木戈
三五     一火 一火.心 五代手冊未列此複合字首。[4]
三五     一人 一人.竹日火 五代手冊未列此複合字首。[4]
三      一木 一木.卜中一)、一木.山戈戈 五代:一.木木.一)、一.木木.戈
三      一木 一木.卜中一)、一木.日 五代:一.竹木.一)、一.竹木.日
三      一火 一火.月山金 五代:一.人火.金
三      一土 一土.月山金 五代:一.人土.金
三      戈土 戈土.心)、戈土.竹日火 五代:戈.人土.心)、戈.人土.火
三      戈戈 戈戈.人月人)、戈戈.火 五代:戈.人戈.月)、戈.人戈.火
 五     人口 人口.手)、人口.月廿 三代:人.一.口手)、人.一.口廿
 五     廿十 廿十.弓木)、廿十.口卜人 三代:廿.竹十.木)、廿.竹十.人

複合字首單獨使用,或用做「字身」、「次字身」時,則依一般方式取碼。例如:

戈.十金.金),廿.戈.十金),女.戈.十金);
一.日月.大),心.一.日大),手.一.日大);
一.一.一女),十.一.一女),女.一.一女);
人.一.弓),水.人.一弓),廿.人.一弓);
尸一.尸戈一),十水.尸一.一),竹尸.尸一.一)。
戈.人.木戈),人.戈.人戈),月.戈.人戈);
人.一.口),水.人.一口),竹.人.一口);
廿.竹口.十),𡤏女.廿.竹十),𨇨口一.廿.竹十)。

許多複合字首在書寫時會視爲整體形塊。例如「愿」、「壓」、「辱」等字,有時作撇筆一撇到底,包住下方部件,有時則較短,使兩字能上下切開,把它們定義作複合字首可避免字首應該取「厂」或取「原」、「厭」、「辰」的疑惑

另一些複合字首是為了減少重碼。例如若不把「麻」定義作複合字首,「麻」部字得取「戈.十金.(尾碼)」或「戈.木木.(尾碼)」,許多字形只靠一個尾碼便難以區分,會產生大量重碼。同理「羽」、「气」、「薛」、「合」等皆有此作用。

複合字编辑

「複合字」不論是單獨使用或與其他字形組合使用,一律只取其頭、尾兩碼[5]

複合字列表
版本 複合字 圖解 取碼 字例 補充說明
三五     日弓 日弓.口)、人.日弓
三五     中弓 中弓.卜中月)、中弓.竹難山
三五     弓中 弓中.人一木)、弓廿.弓中
三五     人土 大戈.人土)、女火.人土 當中可以被其他成份夾雜,比如)。
三五     女戈 女戈)、女戈竹戈 」從「𢆶」從「戍」,因此下方亦按「戍」字取碼,尾部份取「竹戈」不取「人」。
三五     卜心 卜心.竹山)、卜心.尸一
三      竹戈 土.竹戈)、廿.竹戈)、竹戈.十木 五代:竹山.戈)、土.竹山.戈)、廿.竹山.戈)、竹戈.十木
三      卜口 卜口.月.月弓)、卜口.月.廿弓
 五     中尸 中尸.日)、人.中尸 1987年版五代加入,1999年版移除。
無定義時:中戈尸)、人.中戈尸)。
 五     卜弓 卜弓.月山金)、卜弓.廿手

難字编辑

有些字的部份形狀過於瑣碎,導致拆碼繁瑣。爲了方便取碼,特別規定了一些「難字」,以「難(X)」碼代替難取部份。以下是難字列表:

  • 1.「頭、難、尾」類:頭、尾碼好取,其餘難取。
難字列表
難字 圖解 取碼 字例
    竹難竹 弓火.竹難竹)、金.竹難竹
    戈難水 木.戈難水)、廿手.戈難水
    戈難火 廿.戈難火)、廿十.戈難火
    戈難心 木木.戈難心)、戈心.土
    中難竹 女.中難竹)、竹.中難竹
    中難中 水.中難中)、女.中難中
    廿難金 月金.廿難金)、廿.廿難金
    口難山 女火.口難山)、土大.口難山
    弓難山 中弓.弓難山)、竹木.弓難山
    竹難山 竹難山)、𤒅火.竹難山
  • 2.「頭、難」類:僅有頭碼好取
難字列表
難字 圖解 取碼 字例
    竹難 竹難竹山)、人.竹難山)、竹難人
    竹難 竹難中水)、竹難.月廿
    竹難 竹月.弓木)、竹月.一金.竹
    竹難 竹難卜金)、竹難月金)、輿竹難十金
    中難 廿.中難)、金.中難
    弓難
    女難
    卜難 水.卜難)、卜難火

特殊字编辑

有部件重疊在以下幾種字形的中間時,規定先取特殊字,再取重疊於上的部件,並且可與骨幹的中豎重複。[6]

特殊字列表
版本 特殊字 字例
三五   木十)、木月)、木中)、木人人)、木田)、木田火)、竹木中)、竹木中心
三五    火金.月)、火手.手
三五   戈大.口.一)、金.戈手)、线女一.戈十
三五   大大大大)、大一日日)、大弓)、大人人
三五    心山[6]

注意特殊字的一些特性:

  • 重疊在特殊字上的字形可以計入中豎,且計入中豎的取碼方式通常更符合字形特徵原則而優先採用。例如「」字視爲「」重疊在「」上,而非「」或「」重疊在「」上。
  • 特殊字只在內部允許重疊。例如若「」取碼作「大月」(  ),則並非使用特殊字,而是試圖跨越取碼(但實際上此字不符合跨越取碼的條件,而取碼作「中月大」),因為「 」不是在「 」的內部。
  • 特殊字無絕對優先權,具體取碼仍須考量字形特徵、精簡、先繁後簡等其他原則。例如「」取碼作「十木」而非「木十」(使用特殊字),而「」取碼作「木十」(使用特殊字)而非「十木」,因如此取碼更能彰顯字形特徵。其他例子如「」取碼作「手大日」而非「大手日」(使用特殊字)、「」取碼作「十手大」而非「十大手」(使用特殊字);「」取碼作「戈手」(使用特殊字)而非「戈手十心」;「」取碼作「手人」而非「大十」(使用特殊字)。

註釋编辑

  1. 五代手冊原文將「例外字」分為「複合字」、「難字」、「特殊字」、「重複字」,「複合字」下又分「複合字首」、「複合字」。可見五代手冊之「複合字」有廣義與狹義之別。三代手冊有「複合字」一詞,但由於三代未直接定義「複合字首」,其實質內容相當於五代的狹義複合字。由於廣義和狹義的「複合字」並存容易混淆,且廣義的「複合字」極其罕用——五代手冊除標題外未提及廣義的「複合字」;一般使用者談及「複合字」時也都是指三代或狹義的「複合字」——因此本教科書稍微調整架構,省去廣義的「複合字」,以避免歧義。「重複字」主要用於倉頡系統,但目前主流系統一般改以選字處理重碼字,本教科書遂將此部分移至〈進階知識〉一節。
  2. 就使用者角度而言,例外字不得新增。若站在輸入法或編碼表開發者的角度,則可考慮比照原開發者的精神,適當創造新例外字,以便為罕用字、造字編碼。
  3. 三代手冊未直接談及「複合字首」,但於第二章第一節介紹字首時提及「3.戈、戊、𢦏、㦰、产、麻、厭、厤、鴈、雁、辰、厥、羽、府、鹿、君等,為便於取碼,亦視為字首。」此觀念與五代之複合字首相類,本教科書將其中可歸於漢字分割原則之字形歸至該處,其餘可能影響取碼者視為三代定義之複合字首。
  4. 4.0 4.1 4.2 《第五代倉頡輸入法手冊》(1999年版五代)附錄六〈第五代倉頡字碼表〉列出「愿」(字形為「⿸原心」)編碼為「一火心」、「鷢」(字形為「⿸厥鳥」)編碼為「一人竹日火」,附錄一〈第三代、第五代改碼字字碼對照表〉亦未提及相關改碼字,可見五代「原」、「厥」與三代一樣為複合字首。然而,五代手冊於介紹複合字首時未將「原」、「厥」列入,與前者不一致,對此有兩種解釋:一是五代手冊漏列此二複合字首;二是五代取消了此二複合字首,但將相關字之取碼字形由「⿸原*」、「⿸厥*」改為「⿱原*」、「⿱厥*」以致取碼未變,手冊字形則是印刷錯誤。 又查漢文庫典「愿」、「鷢」之六代編碼分別為「一竹日心」、「一廿人片」,可見取碼所據字形為「⿸原心」、「⿸厥鳥」(若所據字形為「⿱原心」、「⿱厥鳥」,則應取碼「一火.心」、「一人.的片」;圖為「⿱原心」、「⿱厥鳥」應屬錯誤)。漢文庫典五、六代共用圖片,取碼所據字形亦同,故知五代取碼所據字形為「⿸原心」、「⿸厥鳥」,再次反駁了解釋二。 總上所述,解釋一顯較解釋二合理,五代倉頡應仍比照三代承認「原」、「厥」為複合字首;五代手冊未將「原」、「厥」列入複合字首應屬疏漏。
  5. 朱邦復於《第三代倉頡輸手法手冊》曾提及將「目」定為複合字取「月山」以免取「月一」時與「且」重碼;然而其《第五代倉頡輸手法手冊》主張「目」取「月一」不符合完整原則。本教材採五代之說,不將「目」視為複合字。
  6. 6.0 6.1 《第五代倉頡輸入法手冊》將「 」列為特殊字,並於附表描述「屯」之取碼是採用輔助字形「七凵」,可知是比照類似「朿」的原則取碼。有論以為此特殊字只有「屯」一個應用實例,且不將「 」視為特殊字也能按〈跨越分則〉解釋「屯」的取碼,甚至加入此特殊字會導致「毛」、「尧」等字取碼有爭議,而主張此字形不應納入特殊字[1]。該說可參,惟其所稱爭議並非無法圓說——「夫」(手人)未因「大」為特殊字而取「大十」,故「 」為特殊字也不足以導致「毛」必須取碼「竹心十」;「尧」上為「 」非「 」而不適用此特殊字——又考慮不將「 」視為特殊字的跨越取碼方式與〈跨越分則〉的典型實例較不似,且無法排除未來處理更大字集遇到更多應用實例之可能,此從原說將「 」定為特殊字。


 取碼原則 倉頡輸入法
例外字
特別注意