郑码输入法的排码规则?
郑码》是一种繁体字输入法,也是一种生僻字输入法,当然它也是一种常规输入法。郑码可以打出国标扩充字库(原来叫GBK字库,后来发展为GB18030字库)里的2万多个汉字,极大满足了人们在日常生活、工作中使用汉字的需求。
在常规情况下,《郑码》输入法可以打出GBK字库里的20902个汉字。比普通《五笔字型》能打出的6763个汉字要多打出14139个汉字。正因为这个原因Windows没有预装《五笔》,而是预装了《郑码》输入法。
基 根 位 码 的 确 定
每一根区里都有几个基根,它们的区码都相同,在它们单独成字
或与其它基根组合成字时,会产生许多重码字。为解决这一问题,
《郑码》规定:第一...全部
郑码》是一种繁体字输入法,也是一种生僻字输入法,当然它也是一种常规输入法。郑码可以打出国标扩充字库(原来叫GBK字库,后来发展为GB18030字库)里的2万多个汉字,极大满足了人们在日常生活、工作中使用汉字的需求。
在常规情况下,《郑码》输入法可以打出GBK字库里的20902个汉字。比普通《五笔字型》能打出的6763个汉字要多打出14139个汉字。正因为这个原因Windows没有预装《五笔》,而是预装了《郑码》输入法。
基 根 位 码 的 确 定
每一根区里都有几个基根,它们的区码都相同,在它们单独成字
或与其它基根组合成字时,会产生许多重码字。为解决这一问题,
《郑码》规定:第一主根的代码用区码的 1个字母表示,第二主根和
副根的代码都要用“区码+位码” 2个字母表示,即在区码后面扩充
一个位码,这种安排使得每个基根都有了独立的代码,从而解决了重
码问题。
就象每个人有姓有名才不会有太多的重名一样。
《郑码》的编码规则
第一条:要按照《郑码》的基本字根总表上所列出的基根(包括形
近根),把汉字分解成基本字根才能编码。如果没有合适
的基根,就要进一步分解成笔画。
例如:
补--衤卜 恳--艮 心 滤--氵虍 心 书--?^ 丨丶
第二条:汉字分解后,基根和笔画排列的顺序叫做“根序”。根序
的确定有三种情况:
l。 左右字、上下字以及由单笔画组成的字,根序与规范的书写
顺序一致(见上例中的“补、恳、滤、书”四个字的分解)
2。
具有相接、交叉和相嵌结构的字,第一笔先写的基根或笔画
排列在前。例如:( [ ]方括号内是例字)
相接结构的字:夭--丿大 [沃 笑];
疋--?^止 [蛋 疏];
交叉结构的字: 束--木口 [整 辣];
夷--大弓 [姨];
屯--七凵 [纯 钝 吨];
相嵌结构的字: 亘--二曰 [桓 恒];
佥--人二(横三点) [检 验]
渊--氵(撇-竖)米;
肃--肀(撇-竖)八 [萧 箫]
复合结构的字: 决--冫?^ 大 [缺 炔] (又有相接又有
相交) ;
3。
对于包围字和包孕字,要将第一笔先写的基根排在第一位。
因为是以基根为单位排列根序。例如:
困—囗木 闻—门耳 函—?^?燠?式—弋工
载—车 库—广车 匦—匚车九 赵—走?V
但是,为了检索的快捷和归纳的划一,对于有“辶、廴”的
字,确定根序时,要将“辶、廴”排列在第一位。
例如:“达—辶大”、“延—廴丿止”。
总之,给单字或词语编码,就是按照编码规则依次取基根的代码
组成字词的编码。根序搞错编码也随之而错。因此,正确认识单字的
根序十分重要。
第三条:单字和词语的编码不能超过 4 个字母, 因此要根据单字
或词语中基根数的多少决定基根代码的取舍,这种取舍代
码的方法叫取码方法(详见以下说明)。
单字的取码方法
术语:“1 码根”是指第一主根,因它的代码只用区码 1个字母。
“2 码根”是指第二主根和副根,因为它们的代码要用区位
码的 2 个字母。
“取1 码”的意思是只取该基根的区码。
一、单字编码的取码原则
1。 单字首根(即第一个基根)的代码要按照实际码数取,不能有所
省略。
就是说,首根是 1码根就取 1码;首根是 2码根就取 2码(区
码和位码都要取)。
2。 为保证单字编码不超过 4 个字母,首根之后的其余基根代码要
根据不同情况决定取舍。一般是先舍位码,只取区码的 1码。
例如: 樱 -- 木F 贝LO 贝LO 女ZM -- FLLZ
醒 -- 酉FD 曰K 生MC -- FDKM
但是,对于四基根和多基根字,还要将中间一些基根的代码全部
舍弃,只取前两码和最末2个基根各 1码。
就是说,取两头舍中间。
例如: 缩 -- 纟Z 宀WD (亻) 一A 白NK -- ZWAN
糖 -- 米UF (广) 肀XB 口J -- UFXJ。收起