打开主菜单
 基本取碼 倉頡輸入法
取碼原則
例外字 

一個漢字有時會有兩種或以上取碼方式,因此倉頡輸入法製訂了一些取碼原則,以決定「正確且唯一」的編碼。如下:[1]

  1. 完整原則:取碼應反映字形特徵且盡量精簡。
    1. 精簡原則:選擇碼數最少的取碼方式。
    2. 先繁後簡原則:碼數已最少時,先取大字根,後取小字根。
    3. 字形特徵原則:取碼時必須盡量保留字形特徵,包括——
      1. 區塊分則:取碼時優先以「區塊」的方式,在字根的相接處分割。
      2. 轉角分則:碼數已最少時,優先選擇能保留筆畫轉角的字根。
      3. 跨越分則:為減少碼數及反映字形特徵,在某些情況下,可允許字根相互跨越。
  2. 省略原則:漢字分割後,各部分取碼時皆不得超出應取碼數的限制。
    1. 局部省略:先假定全取,再略去超出限定碼數的字碼。
    2. 包含省略:碼數過多無法盡取時,省略被「外框」包住的部分。[2]

目录

完整原則编辑

完整原則要求:取碼時應儘量保留字形特徵且避免增加碼數。

此原則較抽象,可分爲以下細則:

精簡原則编辑

精簡原則是指,當一個字有多種取碼方式時,選擇碼數最少的取法。此原則之用意在於,有覆蓋面較大的字根,避免細分成更小字根,以提高打字效率,及避免把字形分解得太零碎。

例如「」字,取碼「十十十」(   )不如「手十」(  )精簡,故應取後者。

   

又如「」字,取碼「卜竹女人」(    )不如「卜竹女」(   ),故應取後者。

   

以下為更多例字:

例字 圖解 正確取碼 錯誤取碼
     十一   
  日(   一竹日(   
  山(    一竹山(    
  一(    十弓一(    
  廿十(    金一十(    
  口(   竹尸口(   
  月一(    戈月月一(    
  土(   戈一土(   
  廿金(   廿一金(   
  卜人(    十一卜人(    

注意:套用精簡原則時,不可跨越字首與字身或次字首與次字身的分界。例如「」字,「 」是字首,「 」是字身,取碼「廿.一廿十」( .   )。若把字首連同字身的第一筆一起取「 」而作「廿廿十」(   ),就不正確。

先繁後簡原則编辑

先繁後簡原則是指,當一個字有多種取碼方式碼數相等時,先取較繁複、涵蓋面較大的字根,再取較簡單、涵蓋面較小的字根

例如「」字,取「手十」(  )或取「十手」(  )都符合精簡原則,但根據本原則,應先取涵蓋面大的「 」,故應取前者。

   

又如「」字,取「戈一女」(   )或取「卜竹女」(   )都符合精簡原則,但根據本原則,應先取涵蓋面大的「 」,故應取後者。

   

以下為更多例字:

例字 圖解 正確取碼 錯誤取碼
  手一月(    十土月(   
  廿中手一     廿中十土    
  卜女   戈尸  
  手山    十心   
  一尸竹人(     一心竹人(    
  土竹山(     十一山(    
  卜竹尸(    戈一尸(   
  廿十    廿手   
  竹十廿一     竹十廿土    
    廿中手人     廿中十大    

字形特徵原則编辑

字形特徵原則是指,取碼時必須盡量保留字形特徵。因為保留字形特徵較符合視覺辨識的原理,且更能區別形似漢字。

此原則的具體細節大致可歸納為以下幾項:

區塊分則编辑

一、取碼時,優先以「區塊」的方式,在字根的相接處分割

例如「」字,有些人會依筆順取「人大」(  ),但這麼做會遺失「「 」與「 」交叉點的訊息,變得無法與「矢」字區分。按此分則,正確的取碼方式是在相接處分割作「竹手人」(   )。

如果還覺得難以理解,一個簡單的理解方式是「剪刀原則」:想像用剪刀剪字,剪下一個字根時,不能把其他字根剪斷。[3]例如「人大」(  )的取法會在試圖剪下「人」( )時把「大」( )剪斷,「竹手人」(   )的取法則否,因而後者才符合區塊分則。

   

此分則優先權極高,先於前述之精簡原則及先繁後簡原則。例如「失」取碼「人大」比取碼「竹手人」更符合精簡原則,但由於前者不符合此分則的要求,因而取後者。

以下是更多例子:

例字          
正確取碼 口山(   口女心(    月山(   竹手山(    戈十水(   
錯誤取碼 尸山(   尸女心(    月一(   竹心一(   
例字          
正確取碼 火木(   火手(   一火十(    竹火木(    人十山(   
錯誤取碼 木金(   手金(   一十金(    竹木金(    人山一(   
例字          
正確取碼 心木(   心廿(   十山(   木大(   中月大(   
錯誤取碼 木山(   心山(   山一(   大弓(   大月(  
例字          
正確取碼 十大日(    十大(   卜人弓大(     心大大(    竹田大大(    
錯誤取碼 土竹日(    大人(   卜人弓人(     心竹竹戈(     竹田大竹(    
例字          
正確取碼 中田(   田中(   中田中(    十田十(    中田心(   
錯誤取碼 十田(   日中(   中一(   手日(   心日(  
例字          
正確取碼 一中田大(     大中田山(     十中大(    十中中弓(     中田中女(    [4]
錯誤取碼 一大日(    大山日(    大口人(    木口尸一(    
例字          
正確取碼 竹水(   竹尸(   竹月口(    竹手(   竹手一(   
錯誤取碼 弓人(   竹尸(  [5] 人尸口(    人十(   人土(  

有些字根會埋在其他字根的凹陷位置,如「」字在「」的凹陷處有「」;「」字在「」的凹陷處有「」;「」字在「 」的凹陷處有「 」字根;甚至像「」、「」、「」這類外框更專門在內部收藏其他字根。這些「土」、「工」、「 」等形狀都可以剪出或切出而不破壞其他字根,因而都符合區塊分則。

轉角分則编辑

二、當一個字有多種取碼方式碼數相等時,優先選擇能保留筆畫轉角的字根

例如「」字,可以取碼「大山」(  )或「大弓」(  ),由於後者保留了筆畫轉角,故應取後者。

為什麼要保留轉角?同樣是收到原字形的碎片,如果是「 」和「 」,我們可以推測原字形是把第一個字形向右的橫筆和第二個字形向左的橫筆相連而成;如果是收到「 」和「 」,則難以得知原字形是何處與何處相連。所以說保留筆畫轉角留下了較多字形特徵的信息。

以下為更多例字:

例字        
正確取碼 戈弓水(    戈弓人(    戈弓火(    弓大(  
錯誤取碼 戈一水(    卜竹人(   [6] 卜竹火(   [7] 一大(  
例字        
正確取碼 大尸(   大弓(   戈大弓火(     竹弓(  
錯誤取碼 大弓(   大山(   戈大竹火(     竹一山(   
例字        
正確取碼 口女弓大(     一女大山(     一女木竹(     一一女尸(    
錯誤取碼 口中弓大(    
口女中大(    
一中大山(     一中木竹(     一一中尸(    

轉角分則是優先權較低的原則。以上各例在套用轉角分則時並未造成取碼數增加;而如果保留筆畫轉角勢必增加取碼數,便不須遵守。如以下各字:

例字        
正確取碼 卜尸火(    卜尸一(    手弓戈(    大木(  
並不需要 卜女尸火(     卜女尸一(     手女弓戈(     大女木(   

跨越分則编辑

三、為減少碼數及反映字形特徵,在某些情況下,可允許字根相互跨越。

如前「區塊分則」所述,原則上應避免讓字根的筆畫互相交錯。然而對於一些封閉類字形,如:          ……等,書寫時常會有筆畫穿過,若要求其他字根不得跨越這些字形,只能切出大量瑣碎且無法反映字形特徵的筆畫,如此便違反了「完整原則」的本意。故此時允許其他字根跨越這些字形。如以下例字:

例字          
正確取碼 十月(   月十月(    戈十月(    十戈月戈(     戈中月(   
錯誤取碼 十月中(    月十月中(     戈十月手(     戈中月手(    
例字          
正確取碼 中月(   中月山(    人月土(    中中弓(    金弓中竹(    
例字          
正確取碼 人月(   人月人(    一人月(    土月(   一土月(   
例字          
正確取碼 一中月人(     一中月卜(     一金田(    一人人月(     一山月(   
例字          
正確取碼 月尸木(    尸大口(    月卜(   竹月卜戈(     田卜戈(   
例字          
正確取碼 廿田(   廿月金(    田廿十(    卜戈廿木(     廿一廿十(    

注意:「 」、「 」、「 」、「 」、「 」、「 」等字形由於內部已有筆畫,因此不視為封閉類字形,其它字根不能跨越這些字形取碼,只能按區塊分則於周邊切斷(〈特殊字〉一節提及的「例外字」除外),詳見區塊分則中「」等字例。這些字形由於確實反映了外框及內部字形特徵,取碼時一般應優先選擇。

除上述封閉類字形以外,一個罕見允許字根跨越的情況是把「乂」取碼作「竹人」(  ),這主要是因為輔助字形單獨使用時必須分割取碼所致。(此例為六代取碼,三代及五代仍取「大」)

請記得完整規則的本意是兼顧字形特徵及取碼精簡,若無法達到這些效果,便不應套用此原則。

各細則的優先權编辑

由於有些細則需要其他細則的觀念,以上介紹安排了一定順序,但統整而言,若細則彼此衝突,其優先順序是:跨越分則 > 區塊分則 > 精簡原則 > 轉角分則 > 先繁後簡原則。

省略原則编辑

如〈基本取碼〉一章所述,漢字分割後各部分皆規範了應取碼數,當碼數超出限制,就要根據此原則省略其中幾碼。

部分省略编辑

若漢字的某部份碼數過多超出取碼限制,應按原則省略其中幾碼,這就是「部分省略」(或稱「局部省略」)。

例如:鰉 → 魚.白.王 → 弓田火.竹日.一土 → 限取2.2.1碼 → 弓火.竹日.土

「鰉」字的「魚」是字首,「皇」是字身,字身還可再分成次字首「白」和次字身「王」。字首「魚」全碼爲「弓田火」,但字首限取2碼,故只取第1碼「弓」及尾碼「火」。次字首「白」全碼爲「竹日」,次字身「王」全碼爲「一土」。因次字首為2碼以上,按規則次字首取第1碼「竹」及尾碼「日」,次字身取尾碼「土」。總此「鰉」最終取碼爲「弓火.竹日.土」。

部分省略尚有一關鍵在於:先假定完整取碼,而後按規則省去中間的編碼;而非直接跳到字形的尾部取碼。因此根據「先繁後簡原則」,前面應取涵蓋較廣的字根,而尾碼應取涵蓋較少的字根(可用「後簡原則」的方式記憶)。

如以下諸例。取碼中的紅字,是初學者容易忘記「後簡」原則而取錯的碼:

例字 圖解 取碼 說明
  廿.大尸 (  .  ) 不作「土」,因字首「堇」爲「廿中手」(    ) 。
  人.廿中 ( .   ) 不作「土」,因字身「堇」爲「廿中手」(    ) 。
  廿.日女 (  .  ) 不作「大」,因字首「 」爲「廿中手」(    ) 。
  水.廿中 ( .   ) 不作「大」,因字身「 」爲「廿中手」(    ) 。
  .弓中 (  .  ) 不作「土」,因字首「垂」爲「竹十廿」(    ) 。
  月山.竹十 (  .   ) 不作「土」,因字身「垂」爲「竹十廿」(    ) 。
  月.日.竹 ( . .  ) 不作「土」,因次字身「生」爲「竹手」(   ) 。
  .尸一.心 (  .  . ) 不作「手」,因字首爲「手十手」(    ) 。
  .一口廿 (  .   ) 不作「手」,因字首爲「山手十」(    )。
  卜.竹水. ( .  . ) 不作「手」,因次字身「丰」爲「手」(  ) 。

包含省略编辑

一些三面或四面的「外框」,如:                          等等,內部常包含瑣碎的筆畫,為求易於辨識,特規定碼數過多無法盡取時,優先省略被「外框」包住的部分。這就是「包含省略」原則。[2]

以下是幾個與包含省略有關的例子:

例字 圖解 取碼說明
  酒 → 水.一金田一( .    ) → 限取2.3碼 → 水.一金(字身「一金田一」優先省略被「 」包含的「一」,而後按部分省略取第1碼「一」、第2碼「金」、尾碼「田」)
  敏 → 人田卜戈.人大(    .  ) → 限取2.3碼 → 人.人大(字首「人田卜戈」優先省略被「 」包含的「 」(戈),而後按部分省略取第1碼「人」、尾碼「卜」;注意「 」(卜)貫穿了「 」,故非包含、也不省略)
謔 → 卜一一口.卜心.尸一 → 限取2.2.1碼 → 卜口.卜心.(次字身的「 」(一)突出「 」,不適用包含省略,按部分省略取尾碼「一」)
爴 → 田戈口一.竹中人 → 限取2.3碼 → 田一.竹中人(字首「田戈口一」若省略被「囗」包含的「或」(戈口一)將只剩1碼「田」而無法取足2碼,故取消包含省略,而後按部分省略取第1碼「田」、尾碼「一」)

以下為更多例子:

例字          
正確取碼 手.卜金 ( .   ) 月.女女. ( .  . ) .一女尸 (  .   ) 廿.日弓. ( .  . ) .月山山 (  .   )
錯誤取碼 手.卜金口 ( .   ) 月.女女.大 ( .  . ) 竹木.一女尸 (  .   ) 廿.日弓.火 ( .  . ) 尸中.月山山 (  .   )
例字          
正確取碼 .尸一.一 (  .  . ) 手.山.人 ( .  . ) 弓中.一.口 (  . .  ) 手.弓.大 ( .  . ) .山 (  . )
錯誤取碼 竹廿.尸一.一 (  .  . ) 手.山.人口 ( .  . ) 弓中.一.口中 (  . .  ) 手.弓金.大 ( .  . ) 月水.山 (  . )
例字          
正確取碼 水.廿中 ( .   ) 一一.月.心 (  .  . ) .尸竹.手 (  .  . ) .心口 (  .  ) .心日 (  .  )
錯誤取碼 水.廿中人 ( .   ) 一一.月戈.心 (  .  . ) 弓土.尸竹.手 (  .  . ) 弓戈.心口 (  .  ) 一戈.心日 (  .  )
例字          
正確取碼 .一.一戈 (  . .  ) 廿.田中 ( .   ) .日女 (  .  ) 廿.戈一. ( .  . ) 月金.戈一. (  .  . )
錯誤取碼 一卜.一.一戈 (  . .  ) 廿.田中戈 ( .   ) 卜人.日女 (  .  ) 廿.戈一. ( .  . ) 月金.戈一. (  .  . )

複雜的外框例字编辑

例字          
正確取碼 .戈口 (  .  ) 廿廿.一女 (  .   ) 水.日.心 ( . .  ) .月廿 (  .  ) 廿.日 (  . )
錯誤取碼 竹戈.戈口 (  .  ) 廿廿.一女戈 (  .   ) 水.日.心人 ( . .  ) 弓水.月廿 (  .  ) 廿廿.日 (  . )
例字          
正確取碼 .人.田 (  . .  ) 廿.人.田 ( . .  ) .人.田 (  . .  ) .金口 (  .  ) 水.竹月 ( .   )

「工、土、王」等鑲嵌形空框例字编辑

對於「   」等形塊,三代倉頡把鑲嵌在左右兩邊空框上的部件視爲被包含。五代倉頡則取消了本規則。

例字
(三代)
         
三代取碼 .口口. (  .  . ) 火.一. ( .  . ) 火火.月.一 (  . .  ) 水.火火. ( .  . ) 水.金大 ( .  . )
例字
(五代)
         
五代取碼 .口口. (  .  . ) 火.一. ( .  . ) 火火.月.一 (  . .  ) 水.火火. ( .  . ) 水.金大 ( .  . )

不適用包含省略的字形编辑

例字 取碼 說明
竹田.尸一. (  .  . ) 「羽」部件的「 」不視作三面包圍着的「外框」。
.卜土 (  .  ) 「馬」部件的「 」不視作三面包圍着的「外框」。
.竹弓 (  .  ) 「鳥」部件的「 」不視作三面包圍着的「外框」。
火.田中. ( .  . ) 「蜀」部件的「 」不視作三面包圍着的「外框」。
廿.人大 (  .  ) 「茍」部件的「 」不視作三面包圍着的「外框」。
.月廿 (  .  ) 「成」部件的「 」不視作三面包圍着的「外框」。
.心 (  . ) 「咸」部件的「 」不視作三面包圍着的「外框」。
.心 (  . ) 「戚」部件的「 」不視作三面包圍着的「外框」。
.火 (  . ) 「丸」部件拆碼「大弓戈」,其「 」視作在撇筆的左邊,故不算包含。
.人大 (  .  )  」及底部爲「 」之部件,皆不視作「外框」,與「 」不同。[8]

附註编辑

  1. 發明人朱邦復在《第五代倉頡輸入法手冊》只提到「完整原則」、「省略原則」、「部分省略」、「包含省略」,且就「完整原則」許多細節並未詳述;並於「完整原則」提到「若有兩個或兩個以上的符號都合於所需形狀時,應該取形狀較完整,能保留字形特徵的一個」、「要注意到不可破壞字形的特徵或增加取數碼」。《第二代倉頡輸入法手冊》及《第三代倉頡輸入法手冊》則提到「精簡原則」、「完整原則」(但內容與五代手冊不同,相當於本教科書的「先簡後繁原則」)、「字形特徵原則」、「省略原則」、「部分省略」、「包含省略」。由於五代的「完整原則」內容較模糊,而三代的「完整原則」不如坊間倉頡書籍常用之「字形特徵原則」清楚,本教科書定為「精簡原則」、「先繁後簡原則」、「字形特徵原則」。「字形特徵原則」下之分則,則參考字例、編碼表及坊間其他教學總結而成。
  2. 2.0 2.1 《第五代倉頡輸入法手冊》原說法是「選取字首、次字首或字身的最後一碼時,若遇到『外框』字形,則省略包含在內的筆畫」。此說稍嫌複雜,且於細微之處易令人混淆(「爴」不取「田.竹中人」),故稍作調整。
  3. 因字例圖片並非動態圖檔,難以顯示「剪下」的動態效果,我們在一些要着重的字根上打圈作示意,讓讀者注意,但實際上可以剪下的字根不限於畫圈。此外,剪字根是發明人歸納出倉頡字根的過程,直接想像成剪下字根,比畫圈符合原意。
  4. 此爲三代倉頡取碼,五代改爲據分體字的字形,取「中中.女」,詳見三代與五代編碼差異的說明。
  5. 雖然所取的碼與正確取碼恰巧一樣,但這取碼方式仍是錯誤的。
  6. 「之」亦不可取碼作「卜人」(  ),因「人」的輔助字形「 」是用在如「豕」的末二筆,不適用於「之去亠」。
  7. 「⺭」亦不可取碼作「卜火」(  ),因「 」的撇與豎起筆在同一位置,但「⺭」的撇長超過豎。
  8. 「⻗」的「 」能視作包含外框,因爲它不單以「 」形作底部,其中豎與「 」形相交的地方,剛好完整包含左、右的兩點。但如「冥」、「旁」、「安」等字,「 」形明顯無法包含下方部件,故不適用包含省略原則。


 基本取碼 倉頡輸入法
取碼原則
例外字