博客首页|TW首页| 同事录|业界社区

最早在电脑上输入的七个汉字到万“码”奔腾

现在用电脑处理汉字已经成了人们上网的必备技能,手机录入汉字也早已不稀奇。但第一次在电脑上打出汉字却相当不易。据说,最早在电脑上打出的汉字是“冶金部自动化所”,是通过用程序控制图形打印机实现,而这个最早的打字人是王辑志。

王辑志为何成了搜狗的粉丝 - 米晓彬 - 米晓彬的IT博客

王辑志近照

王辑志是中国汉字输入史上值得一提的人物,他是曾经赫赫有名的“四通打字机”的发明人。当年,四通在86年推出中英文电子打字机后高速成长。四通打字机售价2万,最热卖几年里,四通年净利润一度高达四亿元,比当时的联想还有钱。而那款四通打字机的原型机,就是王辑志最早打出7个汉字的电脑。

电脑输入汉字的序幕从此拉开。四通打字机之后,是汉卡。一台装有汉卡的电脑可以轻松实现打字机的所有功能,却更便宜。汉卡成就了两家企业:一个是联想。八九十年代间,联想首任总工程师倪光南首创在汉字输入中应用联想功能,让装有联想汉字系统系列微型机热卖。另一个是史玉柱,据说当年巨人集团凭借汉卡收入差点盖成了巨人大厦。

汉字和文档处理也成就了一批软件企业,文字处理领域的金山WPS,王码五笔是打字复印社的必备软件。

早期的输入法呈现出“万码奔腾”的局面,拼音、形码、音形码各成一派,王码、郑码各领风骚。但大部分输入法由于规则复杂,重码率高遭遇淘汰,王码虽然重码率极低占据不少份额,但繁复的编码规则让王码的门槛太高,很多初学者不得不望而却步。

智能网络输入法为何走红

已经退休的王辑志打字速度仍快的让年轻人吃惊,他用的是一款互联网输入法——搜狗拼音输入法。在搜狗五周年大会的高峰论坛上,这位第一个用电脑打出汉字,四通打字机之父的王辑志毫不掩饰自己是“搜狗输入法”和“搜狗浏览器”的超级粉丝。而见证汉字输入演变的倪光南也坦言自己是搜狗输入法的忠实用户。

搜狗输入法输入速度快而广受青睐原因是,它是把搜索引擎的数据、网民每天输入的行为,用搜索引擎技术进行分析和排序,更加符合用户需要,大大提升了汉字的输入速度现在,搜狗输入法成为中国前三大客户端之一,它使搜狐从一个传统媒体门户到占领了桌面,已经成为了搜狐的战略产品。

2010年清华大学联合实验室通过调研分析,在汉字在汉字输入市场竞争里面,搜狗输入法以83.6%的用户渗透率,遥遥领先位居第一名,远远超过第二名的QQ输入法24.6%以及紫光输入法、谷歌输入法等。

一个值得注意现象是,输入法市场的前四名,如搜狗、QQ拼音和谷歌输入法都是基于网络词库的智能网络输入法,而紫光输入法,乃至微软自带的多款输入法,尽管有操作系统内置的优势,但活跃用户却不多,很多用户购买完新电脑后,第一件事儿就是卸载Windows自带的输入法,装上搜狗等网络输入法。

为什么网络输入法才成为网民的最爱?输入法在网络时代又会有什么趋势?

其一是准确率

网络输入法一般准确率较高,市面上常见的几种网络输入法的准确率一般在80%左右,最低也在60%-70%之间。而搜索输入法在之前的5.2版中已经达到了94.85%的准确率,这意味着每100个字可能大错5个字,而在五周年会上发布的6.0版,搜狗把错误比例降低了30%,这意味着使用搜狗打100字,平均出错率不超过4个。

其二是智能纠错

作家王朔经常发表惊人言论,最近他在《新狂人日记》里说,“搜狗输入法法太烦人,我想好的字还没来得及打出来,它就自己家蹦出来”。这句批评式的调侃,也是对搜狗智能性的一种解读。

搜狗的最近几个版本中增加了“猜测”和“纠错”功能能。譬如,用户输入了一个错误的拼音,搜狗会猜测这个错误背后可能的正确拼法,并且根据可能性进行排序。这样,即便是敲错了字母,但输入法还是给你可能正确的提示。这个智能纠错的功能让搜狗的准确率遥遥领先。

其三是交互性和开放界面

用户输入中文时有着各种需求,有时是处理文档,有的为了获取信息。譬如输入某个上市企业名称时,他也许需要看股票的业绩;输入某个日期,是想知道休假和安排。搜狗法在新版本中增加了输入词语的实时结果——搜狗技术总监杨洪涛称,这样让信息路径更短,用户获取信息的效率更高。

搜狗6新版中新增了5万种优质的皮肤,其中不少是Flash动画皮肤,譬如星座皮肤。这些皮肤并非全部是搜狗开发,而是由搜狗的粉丝和开发者共同完成的,在众多互联网大佬开放之际,搜狗也搭上开放的列车。据说某合作伙伴开发的皮肤,使用用户高达1.5亿,搜狗平台的3亿用户,为开发者提供了足够大的舞台。

由此我们不难得出结论:传统输入法之所以被网络智能输入法所取代,关键在于他们是让用户去适应输入法,而非让输入法使用用户。而搜狗输入法能够通过纠错而降低出错率,更说明网络化个性化的输入法更容易被众多网民接受。

电脑技术传承汉字文化

王辑志为何成了搜狗的粉丝 - 米晓彬 - 米晓彬的IT博客

在搜狗五周年发布会上,倪光南和清华大学计算机系党委书记孙茂松回忆当年中文输入法面临的窘境时不免几分感慨。

在中国引入计算机的最初几年,通过电脑输入汉字一度是个大难题。因为,电脑芯片都是国外制造,他们没有为汉字输入准备现成的方案。语言学领域的一个论调是,中国应该取消汉字,用拼音代替汉字就可以无缝与国外的电脑接轨。而牺牲的代价是,在电脑上中国人再也看不到方块汉字。

我庆幸有一代代的IT人为了汉字的传承而努力,而汉字输入在PC时代经受住一次次考验:王辑志的四通打字机、倪光南的联想汉卡、以及王小川带领团队研发的搜狗输入法一次次将普通网民的中文录入速度和准确率推向新的巅峰。

搜狐五周年庆祝大会的主题是“慧聚五千年”,我认为并不夸张。汉字是世界上最优秀的文字,在联合国大会上,各个国家翻译的文本中,只有汉字是最薄的。汉字也是最源远流长的文字。拉丁文是字母文字的代表,但最早的拉丁文献已经没有几个人能看懂,而汉字哪怕是甲骨文,刚刚进入一年级的小学生也能轻松认识几十个。中国文化的传承恰恰来自汉字的传承。

我一直认为汉字是中国祖先留给我们最宝贵的财富。在其他语系中,大多为字母文字,但只有汉字代表了一种字文化。上帝只留给他们子民26个字母,而我们的祖先给我们留下数千乃至数万汉字,汉字就是中国人的字母,这个表声、表意还有声调的符号,即便是两三个汉字的组合也会是天文数字(百亿量级)。我想,正因为汉字的博大精深,才能承载中国文化的博大精深。


上一篇: 反思传统电子杂志因何走入困境
下一篇:开放是腾讯的生死抉择

评论

Good.Be the first to comment on this entry.

发表评论

You must 登录 to post comment.