目录

[整理] 五笔基础

概述

“五笔” 原意是也指五种基本笔画:横、竖、撇、捺(点)、折,任何一个汉字,也都是由这五种基本笔画及其衍生字根组成,通过使用一定的映射规则,至多只需要 4 个字母,即可完成一个汉字或词组的输入。

字根

/media/wubizigenbiao.gif

在五笔字型输入编码方案中,把由基本笔画组成的相对不变的结构(偏旁、部首)称字根。五笔字型精选了 130 多个常用字根为基本字根,它们是组成汉字的基本单位,它们在键盘上分 5 个区,每个区按 “横,竖,撇,捺,折 “ 顺序以 1、2、3、4、5 作为区号,五区共占 25 个位,区号为首笔,位号为次笔 。

理解字根:字根大部分是新华字典上的偏傍部首,也有一些不同,五笔输入法的原理就是:每个汉字由字根组成,例如 “好” 字由字根 “女” 和字根 “子” 组成;“们” 由字根 “亻” 和字根 “门” 组成,所以我们如果能记住每个字根分布在哪个字母键上,那么打汉字便是很容易的事了!

字根的分布规律:按字根的第一笔划(一,丨,丿,丶,乙 因此叫五笔输入法),将字根分成五大区(用数字划分),分别是键盘上的(G-11、F-12、D-13、S-14、A-15),(H-21、J-22、K-23、L-24、M-25),(T-31、R-32、E3-3、W-34、Q-35)(Y-41、U-42、I-43、O-44、P-45),(N-51、B-52、V-53、C-54、X-55)。

理解口诀:口诀就是将每个键上的主要字根串联成一句话,只要你记熟这句口诀,那么这个键上的主要字根你便能够想起来。例如口诀 “日早两竖与虫依” 就是字根 “日”、“早”、“刂”、“虫” 等在 22 键,即 J 键上。其它类似(对照口诀和键盘图便可理解)。

五笔单字编码规则

五笔字型最直观,依照笔顺把码编; 键名汉字打四下,基本字根请照搬; 一二三末取四码,顺序拆分大优先; 不足四码要注意,交叉识别补后边。

从这歌诀就可以看出五笔字型编码规则的大致面貌,同时口诀也概括了五笔字型拆字取码的五项原则:

  1. 从形取其顺序按书写规则,即从左到右、从上到下、从外到内;
  2. 以 130 多个字根为基本单位;
  3. 对于字根数超过四个的汉字,按一二三末字根的顺序,最多只取四码;
  4. 单体结构拆分取大优先;
  5. 末笔与字型交叉识别。

键名汉字

五笔字型中规定的 键名汉字 共有 25 个,王土大木工目日口田山禾白月人金言立水火之已子女又纟 25 个键名汉字与 25 个字母键相应,这些字的编码相当简单,它们的编码就是 4 个所在字母键字母,如:“言” 字的编码为 ”YYYY“,”纟“ 字的编码为 ”XXXX“,等等。输入键名汉字时,只要连续击四次该字所在的字母键即可。

成字字根

在五笔字型字根键盘的每个字母键上,除了一个键名字根外,还有一些其它类型的字根。有些字根其本身就是一个汉字,这样的字根称为成字字根。成字字根的编码是按下面公式进行的:

键名码 + 首笔码 + 次笔码 + 末笔码

当成字字根仅为两笔时,编码只有三码,公式为:

键名码 + 首笔码 + 末笔码

例如:“石”,字根所在的键为 D,第一笔划为 “横” 的编码是 G,第二笔为 “撇” 的编码是 T 键,末笔 “横” 的编码也是 G 键,所以这个字的五笔编码就是 DGTG。再比如 “虫” 字,这个字根是在 J 键,第一笔是竖 H,第二笔是折 N,最末一笔是捺 (在五笔里 “点” 做为 “捺”)Y,所以 “虫” 的五笔编码就是 JHNY。

键外字的编码规则

国标 GB2312-80 中,上述的键名和成字字根这样的键面字总共才有一百多个,绝大部分汉字都不是成字字根,这些才是我们在使用当中用得最多的。

五笔字型汉字编码主要是键外字的编码,编码可以分为两类,纯字根码和识别码。如果一个汉字的字根是四个或超过四个,就用前三后一总共四个字根码组成编码。不足四个字根的汉字需补一个字型结构识别码,以增加区分汉字的信息量。

  1. 字根码

每个字根都分派在一个字母键上,其所在键上的英文就是该字根的 “字根码”。 凡含四个或超过四个字根的汉字,取其第一、二、三、末四个字根码组成键外字的输入编码。

第一字根编码 + 第二字根编码 + 第三字根编码 + 最末一个字根编码

这里一、二、三、末应按正常书写顺序,先左后右,先上后下,先外后内。

  1. 交叉识别码

一个字的字根不足四个时,依次击入字根码后,最后需要补一个识别码。为什么需要这个识别码呢,这里可以举例说明:如 “沐” 和 “汀” 字,这两个字都是由两个字根组成的,且这两个字的字根码都是 IS 。虽然也可以让输入者选择的方式来确定到底需要输入哪一个字,但这对汉字输入速度极为不利,重码率要越低越好,所以五笔编码中才引入了识别码这个概念来对这类汉字进行区分。 识别码是用该汉字最后一个笔画和字型结构信息来确定的,具体规则如下表:

左右结构 (第 1 位) 上下结构 (第 2 位) 杂合结构 (第 3 位)
末笔是 “横”,在一区 G F D
末笔是 “竖”,在二区 H J K
末笔是 “撇”,在三区 T R E
末笔是 “捺”,在四区 Y U I
末笔是 “折”,在五区 N B V

从上表可以看出,识别码的确定分两个步骤,第一步根据最后一笔确定是在哪个区,第二步再以该汉字的字型结构来确定在哪一位,然后就能得到具体识码了。

例:“旮” 字,这个字同旭一样字根只有两个,字根码为 VJ,但字型不同,可以通过识别码来区分,“旮” 最末笔是横,在一区,是上下结构,所以是在第二位,即 F,所以 “旮” 的五笔编码就是 VJF。

再如 “汀” 字,最末一笔是左竖钩,在五笔里为竖,在第二区,这个字是左右型结构,所以在第一位,即 H,所以 “汀” 的五笔编码就是 ISH。

加识别码后仍不足四码时,击空格键结束。单笔与字根相连的字型为杂合型,见前面所述。 关于末笔画还有如下规定,这些规定使取码更为简单,明确。

(1)、末字根为 “力”、“刀”、“九”、“七” 等时,一律认为末笔画为折。
(2)、“进”、“逞”、“选” 等字,不以 “走之” 的末笔为末笔(书写时确实是末笔,但这样末笔都一样,减少了识别信息量,约定以去掉 “走之” 部分后的末笔整个字的末笔来构造识别码。进、逞、远的识别码应分别为:23,K;13,D;53,V。当以 “走之” 末笔为末笔时,则识别码都相同,为 43,I。没有得到识别信息。
(3)、“我”、“戋”,成等字的末笔取 “丿”。

输入法推荐

  • Windows10 : 微软五笔(系统),极点五笔
  • MacOS : Rime,百度五笔