仓颉输入法/例外字
< 倉頡輸入法
取码原则 | ◄ | 仓颉输入法 例外字 |
► | 特别注意 |
95%以上中文字都可依据前述原则取码,其余约5%的字,若按同样规则取码,本来亦无不可,但顾及使用方便,特别处理一些例外字形,这些字称做“例外字”,包括:[1]
- 复合字首:做字首或次字首时视为一整体,只取头、尾两码。
- 复合字:一律视为一整体,只取头、尾两码。
- 难字:难取部分以“难”码代替。
- 特殊字:被其他部件横贯时,先取特殊字,再取重叠于上的部件,并且可与骨干的中竖重复。
注意以下例外字均已举全,不可凭个人主观自订例外字,否则会取不到正确字码。[2]
复合字首
“复合字首”(或称“特别字首”)在做“字首”或“次字首”时,视为一整体,只取头、尾两码。[3][4]
版本 | 复合字首 | 图解 | 取码 | 字例 | 补充说明 |
---|---|---|---|---|---|
三五 | 人弓 | 氣(人弓・火木)、餼(人戈・人弓木) | |||
三五 | 尸一 | 翀(尸一・中)、翍(尸一・木竹水) | |||
三五 | 戈金 | 麼(戈金・女戈)、磨(戈金・一口) | 按台湾标准字形,“魔、磨、摩、麼”等字的字首应为“戈金”而非“戈木”,但微软仓颉采后者编码,详参〈特别注意〉一节。 | ||
三五 | 戈木 | 麽(戈木・竹戈)、磨(戈木・一口) | |||
三五 | 一大 | 壓(一大・土)、靨(一大・一田中) | |||
三五 | 一女 | 蜃(一女・中一戈)、辱(一女・木戈) | |||
三五 | 一人 | 鷢(一人・竹日火) | 五代手册未列此复合字首。[5] | ||
三 | 一木 | 歴(一木・卜中一)、厯(一木・山戈戈) | 五代:歴(一・木木・一)、厯(一・木木・戈) | ||
三 | 一木 | 歷(一木・卜中一)、曆(一木・日) | 五代:歷(一・竹木・一)、曆(一・竹木・日) | ||
三 | 一火 | 贗(一火・月山金) | 五代:贗(一・人火・金) | ||
三 | 一土 | 贋(一土・月山金) | 五代:贋(一・人土・金) | ||
三 | 戈土 | 應(戈土・心)、鷹(戈土・竹日火) | 五代:應(戈・人土・心)、鷹(戈・人土・火) | ||
三 | 戈戈 | 腐(戈戈・人月人)、焤(戈戈・火) | 五代:腐(戈・人戈・月)、焤(戈・人戈・火) | ||
三 | 亥 | 亥 | 卜人 | 賌(卜人・月山金) | 五代:賌(卜・女人・金)[6] |
五 | 人口 | 拿(人口・手)、盒(人口・月廿) | 三代:拿(人・一・口手)、盒(人・一・口廿) | ||
五 | 廿十 | 孽(廿十・弓木)、躠(廿十・口卜人) | 三代:孽(廿・竹十・木)、躠(廿・竹十・人) |
复合字首单独使用,或用做“字身”、“次字身”时,则依一般方式取码。例如:
- 麻(戈・十金・金),蔴(廿・戈・十金),嫲(女・戈・十金);
- 厭(一・日月・大),懨(心・一・日大),擫(手・一・日大);
- 辰(一・一・一女),宸(十・一・一女),娠(女・一・一女);
- 气(人・一・弓),汽(水・人・一弓),芞(廿・人・一弓);
- 羽(尸一・尸戈一),翅(十水・尸一・一),扇(竹尸・尸一・一)。
- 府(戈・人・木戈),俯(人・戈・人戈),腑(月・戈・人戈);
- 合(人・一・口),洽(水・人・一口),答(竹・人・一口);
- 薛(廿・竹口・十),𡤏(女・廿・竹十),𨇨(口一・廿・竹十)。
许多复合字首在书写时会视为整体形块。例如“愿”、“壓”、“辱”等字,有时作撇笔一撇到底,包住下方部件,有时则较短,使两字能上下切开,把它们定义作复合字首可避免字首应该取“厂”或取“原”、“厭”、“辰”的疑惑。
另一些复合字首是为了减少重码。例如若不把“麻”定义作复合字首,“麻”部字得取“戈・十金・(尾码)”或“戈・木木・(尾码)”,许多字形只靠一个尾码便难以区分,会产生大量重码。同理“羽”、“气”、“薛”、“合”等皆有此作用。
复合字
“复合字”不论是单独使用或与其他字形组合使用,一律只取其头、尾两码。[7]
难字
有些字的部分形状过于琐碎,拆码繁琐。为了方便取码,特别规定了一些“难字”,以“难(X)”码代替难取部分。以下是难字列表:
一、“首、难、尾”型:首、尾码好取,其余难取。
二、“首、难”型:仅有首码好取
难字 | 图解 | 取码 | 字例 |
---|---|---|---|
竹难 | 兒(竹難竹山)、倪(人・竹難山)、臾(竹難人) | ||
竹难 | 叟(竹難中水)、盥(竹難・月廿) | ||
竹难 | 學(竹月・弓木)、釁(竹月・一金・竹) | ||
竹难 | 與(竹難卜金)、興(竹難月金)、輿(竹難十金) | ||
中难 | 蕭(廿・中難)、鏽(金・中難) | ||
弓难 | |||
女难 | |||
卜难 | 濟(水・卜難)、齋(卜難火) |
特殊字
有部件重叠在以下几种字形的中间时,可先取特殊字,再取重叠于上的部件。[8]
版本 | 特殊字 | 字例 |
---|---|---|
三五 | 末(木十)、朿(木月)、束(木中)、來(木人人)、東(木田)、柬(木田火)、秉(竹木中)、乘(竹木中心) | |
三五 | 脊(火金・月)、拳(火手・手) | |
三五 | 彧(戈大・口・一)、銭(金・戈手)、线(女一・戈十) | |
三五 | 爽(大大大大)、奭(大一日日)、夷(大弓)、夾(大人人) | |
三五 | 屯(心山)[8] |
注意特殊字的一些特性:
- 重叠在特殊字上的字形可以计入中竖,且计入中竖的取码方式通常优先采用。例如“東”字视为“田”重叠在“木”上,取码“木田”;而非“日”或“曰”重叠在“木”上,取码“木日”。
- 只有在特殊字内部重叠字形时适用特殊字的规则。例如若“央”取码作“大月”( ),则并非使用特殊字规则(因为“ ”不是在“ ”的内部),而是试图跨越取码(但此字不符合跨越取码的条件,因而实际取码是按区块取码作“中月大”)。
- 特殊字无绝对优先权,具体取码仍须考量精简、字形特征、先繁后简等其他原则。其中,特殊字会优先(但非必定)选择让横笔对应原字最长、最突出的横,以彰显字形特征。例如:
- “未”取码作“十木”而非“木十”(使用特殊字),而“末”取码作“木十”(使用特殊字)而非“十木”,因如此取码更能彰显字形特征(“木”横笔对应原字最长横)。
- “春”取码作“手大日”而非“大手日”(使用特殊字)、“実”取码作“十手大”而非“十大手”(使用特殊字),因前者更符合字形特征原则(若取“大手日”则“大”横笔并非对应原字最长横)与先繁后简原则。
- “夫”取码作“手人”而非“大十”(使用特殊字),因前者更符合字形特征原则(若取“大十”则“大”横笔并非对应原字最长横)与先繁后简原则。
- “毛”取码作“竹手山”而非“竹心十”(使用特殊字),因前者更符合字形特征原则(若取“竹心十”则“七”横笔并非对应原字最长横)与先繁后简原则。
- “尧”取码作“十心・一山”而非“心十・一山”(使用特殊字),因前者较符合字形特征原则(区块分割优先)。
- “戋”取码作“戈十”(使用特殊字)而非“戈手心”、“㦮”取码作“戈手”(使用特殊字)而非“戈手十心”,因前者较符合精简原则与先繁后简原则。
注释
- ↑ 五代手册原文将“例外字”分为“复合字”、“难字”、“特殊字”、“重复字”,“复合字”下又分“复合字首”、“复合字”。可见五代手册之“复合字”有广义与狭义之别。三代手册有“复合字”一词,但由于三代未直接定义“复合字首”,其实质内容相当于五代的狭义复合字。由于广义和狭义的“复合字”并存容易混淆,且广义的“复合字”极其罕用——五代手册除标题外未提及广义的“复合字”;一般使用者谈及“复合字”时也都是指三代或狭义的“复合字”——因此本教科书稍微调整架构,省去广义的“复合字”,以避免歧义。“重复字”主要用于仓颉系统,但目前主流系统一般改以选字处理重码字,本教科书遂将此部分移至〈进阶知识〉一节。
- ↑ 就使用者角度而言,例外字不得新增。若站在输入法或编码表开发者的角度,则可考虑比照原开发者的精神,适当创造新例外字,以便为罕用字、造字编码。
- ↑ 1994年版三代手册未谈及“复合字首”,但于第三章第三节介绍字首时提及“3.戊、戈、𢦏、㦰、产、麻、䧹、厭、厤、鴈、辰、厥、羽、府、鹿、亥、老、包、君‥等字,虽不能作上下或左右一次分离,然为了取码方便,一律定义之为字首。”(1984年版之同一节字例尚有“雁”字),观念与五代之复合字首相当。本教科书将其中可直接以汉字分割原则解释者省略或于〈汉字分割〉一节讨论,其余则视为三代定义之复合字首。
- ↑ 五代仓颉实际上有哪些复合字首有争议,官方五代手册影印版和电子版列出的“复合字首”不一致,后者将“春”、“登”列为复合字首。因两者在〈第三代、第五代改码字〉皆把“蠢”、“凳”等相关字列为“五、取码原则不一致者,使其统一”而非“三、增加复合字首或改变原复合字的取码,以避免重复字者”,本教科书主要采影印版之说。其余细节可参见〈争议编码〉一节。
- ↑ 《第五代仓颉输入法手册》(1999年版五代)附录六〈第五代仓颉字码表〉列出“鷢”(字形为“⿸厥鳥”)编码为“一人竹日火”,附录一〈第三代、第五代改码字字码对照表〉亦未提及相关改码字,可见五代“厥”与三代一样为复合字首。然而,五代手册于介绍复合字首时未将“厥”列入,与前者不一致,对此有两种解释:一是五代手册漏列此复合字首;二是五代取消了此二复合字首,唯将相关字之取码字形由“⿸厥*”改为“⿱厥*”以致取码未变,手册字形则是印刷错误。解释二需要较多巧合同时成立,可能性较低。 查汉文库典“鷢”、“憠”、“橛”、“蟨”之六代编码分别为“一廿人片”、“一廿人心”、“一廿人木”、“一廿人戈”,可见取码所据字形为“⿸厥鳥”、“⿸厥心”、“⿸厥木”、“⿸厥虫”(若所据字形为“⿱厥鳥”、“⿱厥心”、“⿱厥木”、“⿱厥虫”,则应取码“一廿山片”、“一廿山心”、“一廿山木”、“一廿山戈”),汉文库典字形图片显示“⿱厥*”应属错误。汉文库典为五、六代共用系统,取码所据字形相同,又汉文库典与五代手册皆属五代仓颉,绝大部分取码所据字形相同,因此五代仓颉之取码所据字形当为“⿸厥*”,再次反驳了解释二。 总上所述,解释一显较解释二合理,五代仓颉应仍比照三代承认“厥”为复合字首;五代手册未将“厥”列入复合字首应属疏漏。
- ↑ 1994年版三代于字首一节有谈及“亥”字特别定义为字首,并有例字“⿱亥月”。五代手册于复合字首一节未提及此字形,改码字一节未谈及相关改码,亦无相关字例。查汉文库典(2003年版五代)将“賌”编码为“卜女人金”,可见五代不将此字型认定为复合字首。
- ↑ 朱邦复于《第三代仓颉输手法手册》曾提及将“目”定为复合字取“月山”以免取“月一”时与“且”重码;然而其《第五代仓颉输手法手册》主张“目”取“月一”不符合完整原则。本教材采五代之说,不将“目”视为复合字。
- ↑ 8.0 8.1 《第五代仓颉输入法手册》将“ ”列为特殊字,并于附表描述“屯”之取码是采用辅助字形“七凵”,可知是比照类似“朿”的原则取码(但有论以为视为“七屮”更佳)。有论以为此特殊字只有“屯”一个应用实例,不将“ ”视为特殊字也能按〈跨越分则〉解释“屯”的取码,且加入此特殊字会导致“毛”、“尧”等字取码有争议,而主张此字形不应纳入特殊字[1]。该说可参,惟其所称争议并非不能用其他原则解释,又考虑不将“ ”视为特殊字的跨越取码方式与〈跨越分则〉的典型实例较不似,且无法排除未来处理更大字集遇到更多应用实例之可能,此仍从原说将“ ”列为特殊字。
取码原则 | ◄ | 仓颉输入法 例外字 |
► | 特别注意 |