什么是辅码?

Last updated 5 months ago

辅码的全称是辅助筛选码,这个东西由来很有意思。

辅码又可以根据使用方法分为“直接辅码”和“间接辅码”。

笔者最早接触辅码,是来自于全拼输入法中的间接辅助筛选码,那时候全拼的重码率很高,大家打字都靠的是智能词频,后来有些输入法就“别出新裁”,弄了个筛选功能,比如在打人名等生僻字词的时候,可以在候选时按 tab 键进入筛选模式,然后就可以输入hspdz(对应 横竖撇点(捺)折) 来对字进行笔画筛选。

但实际上早在智能ABC输入法时代,就已经有了直接辅助码,它用数字作为特定笔画和偏旁部首的定义,在你输入拼音的同时,也输入数字,就可以连字带筛选都完成了。

落格输入法使用的辅码就是直接辅码。所以接下来我们着重讨论直接辅码。

直接辅码

辅码其实也是一个码表,只不过这个码表比较特殊,它全部都是由单字组成的。

设计分类

为了跟双拼(拼音)进行区分,辅码的设计一般是用类似五笔一样的“字形”为原则的,但这依旧是一个很大的范围,随着时间流逝最终有两大类辅码设计标准被大众认可,一类是比较好学但重码率相对要高一点的音托辅码,另一类是学起来稍微难一些但重码率相对比较低的形托辅码

音托辅码

上文已经提到,辅码实际上都是从字形出发的,这样才可以与拼音本身加以区别,用一套与拼音完全不同的编码方式进行额外处理,这样才能起到相辅相成的作用。这里所谓的音托,实际上是取字形中的偏旁部首的发音,这里边比较典型的就是“自然码”双拼的辅码,比如“诗”这个字,拆成“言”和“寺”,那么它的辅码就是ys

当然,不同的音托辅码有不同的拆字法,这样也就有了不同的编码方式,但归根结底,它们都是把一个复杂的字按照一定的规则,拆分成可读可认的小字,然后在根据这些小字的发音确定编码。

形托辅码

要说形托,那肯定就是和发音没关系了,举个最典型的例子:五笔型输入法。 五笔就是形托——码表。总之,五笔的编码规则与具体字词的发音无关,与字的形状组合相关,这就是形托。

实际上,真的有人以前是用五笔打字的,后来转用双拼了,于是就把五笔的简码拿出来单独作为辅码使用。

用比较常见的大牛双拼的辅码来举例(小牛形码),还是“诗”这个字,同样拆成“言”和“寺”,但根据大牛的规则,则辅码是iy,它和发音无关,是大牛自己的编码规则设计。

音托 和 形托

大致了解了音托和形托辅码,那么这两者该怎么选择呢?音托归根结底还是和发音有关,另外为了能够让拆出来的小字能够实现发音,所以重码率并不会很低,太低的重码率就会导致有很多“无理”拆,反而导致编码难以学习和使用。但它的优点也是因为拆字容易,且符合拼音习惯(毕竟实际上还是发音对吧?)上手就很快;

另一方面形托则重码率就大大降低了,但这是得益于字形与发音无关的优势,同样的,缺点也就是拆字有各自的规则,不一定就给你拆出个小字来(比如五笔),所以学习起来需要一定的时间(没那么长但也不短)。另外由于形托辅码与发音无关,所以一个形托辅码的码表其实是可以与任意双拼配合使用的(音托也可以的,但对于 zh ch sh 部分的处理一般需要考虑兼容问题——虽然问题不大)。

辅码和码表

得益于双拼天生是两两成对,所以正好再加上两位辅码,可以构成特殊的码表——双拼码表就这样诞生了。再配合类似五笔的规则,那么一些高级用户就可以用双拼+双辅(双形)打出超越五笔的效率。

当然,这需要刻苦的练习。对于普通用户来说,虽然不至于去学习一个双拼码表,但用双拼,还是要加上一个辅码才能体会到双拼全部的乐趣。