第七章汉字的编码规则与输入
通过前面几章的学习,大家对汉字有了一个结构上的认识,并且对于标准西文键盘与汉字之间的联系也有了一些了解,可以说是“水到渠成”,但是要进一步深入水底,还须学习汉字的编码规则。
一、汉字编码的一般原则
五笔字型汉字输入法是一种拼形输入法,当录入人员看到一个汉字时,很快地就能根据汉字的各部分字根写出一个汉字编码,如“树”字的编码为“木S、又C和寸F”。为了提高汉字输入速度,必须减少汉字输入的重码率以及单个汉字输入的
击键数。在对汉字进行编码时还必须遵守一定的规则,这些规则是根据书写汉字时所熟悉的汉字输入必须遵循的如下一些原则制定的。
(1)按书写顺序从左到右,从上到下,从外到内取码;
例如:“树”的取码顺序为木S、又C、寸F;“会”的取码顺序是人W、二F、厶C。
(2)以基本字根为单位取码;
例如:“社”的取码为、丶、土,而不是礻、土,因为礻不是基本字根。
(3)按一、二、三、末4个字根,最多只取4码;
例如:“微”由彳T、山M、一G、几M、攵T等5个字根组成,只取第一、二、三及最末一个字根,
即:彳T、山M、一G、攵T。
(4)单体字拆分,取大优先;
例如:“未”应拆成二、小,而不能拆成一、木。
(5)字根数不满4个时,再取末笔字型交叉识别码。
例如:“村”由木S、寸F两个字根组成,其信息量不够,需加末笔字型交叉识别码51Y。
在汉字五笔字型输入法中,根据汉字的结构特点、使用频率和字根结构,把汉字分为键面字(包括键名字根、成字字根和单笔画字根)和键外字(又称合体字),其编码方案有所不同。
二、键面字的编码规则与输入
五笔字型编码方案中,利用标准键盘上的A~Y共二十五个键上的每一个键位,设置一个中文键名字,即各个键上的第一个字根,也就是“助记词”中打头的那个字根,我们称之为“键名字根”,简称为“键名”。其特征是组字频度高,而形体上又有一定代表性的字根;除X键位的“纟”以外,它们本身就是一个汉字。这个作为“键名”的汉字,其编码规则或输入方法是:把所在的键连打四下(不再打空格键)。
键名字中有的是一级简码或二级简码,例如:工A、人W、大DD、水II、立UU、之PP、子BB,击键一次或二次就能输入;有的是三级简码,如:王GGG、田LLL、山MMM、禾TTT、白RRR、月EEE、言YYY、火OOO、女VVV、,只需击键3 次,加空格键。
值得注意的是,不少人对于键名汉字不能下意识地反应,常常被一些键名字的输入所困惑,输不进类似“禾”、“金”、“山”等一类键名汉字。
在五笔字型字根键盘的每个键位上除了键名汉字以外,还有一些本身也是汉字的字根,我们称这些字根为“成字字根”,简称“成字根”。除键名外,成字字根一共有102个(其中包括在国标字符集中被视为汉字的“氵、亻、勹、刂”等),如表7-1所示。
成字字根的编码规则与输入方法是:
先打一下该字根本身所在的键(称之为报户口),再根据“字根拆成单笔画”原则,按书写该成字字根的单笔画顺序,依次打它的第一个单笔画、第二个单笔画以及最后一个单笔画,不足4码时,再加打一次空格键(注意:成字根不足四码者不再加识别码,而以空格键结束输入)。现举例如下:
例字报户口第一单笔第二单笔最末单笔
文文丶一
41 41 11 41
Y Y G Y
厂厂一丿空格键
13 11 31 空格键
D Y T 空格键
这样的输入方法,我们可以把它写成一个公式:
键名代码(报户口) + 首笔代码+ 次笔代码+ 末笔代码
成字字根的编码方法,体现了汉字分解的一个基本规则:遇到字根,报完户口,就拆成单笔画。
为了便于学忆,我们把常用的56个成字字根分为二级成字字根、三级成字字根、四级成字字根(见下表)。
(1)二级成字字根有23个(输入规则:报户口+ 第一单笔):
(2)三级成字字根有15个(输入规则:报户口+ 第一单笔+ 第二单笔):
(3)四级成字字根有18个(输入规则:报户口+ 第一单笔+ 第二单笔+ 最后一单笔):
许多人不太注意,其实5种单笔画“一、丨、丿、
第七章 汉字的编码规则与输入 来自淘豆网www.taodocs.com转载请标明出处.