个性化输入 Google拼音随心定制
2014-04-29ASL
ASL
1 初识拼音输入法
输入法是什么?这个大家似乎都比较熟悉了,其实输入法是一种将各种符号输入计算机或其他设备的编码方法。汉字输入的编码方法,基本上都是采用将音、形、义与特定的键相联系,再根据不同汉字进行组合来完成汉字的输入方式。
拼音输入是众多输入法其中的一种,是按照拼音规定来进行输入汉字的,不需要特殊记忆,符合人的思维习惯,只要会拼音就可以输入汉字。目前主流拼音是立足于义务教育的拼音知识、汉字知识和普通话水平之上,所以对使用者的普通话和识字及拼音水平的提高有促进作用。
拼音输入法最大的缺点是重码率太高,经常需用户选择,这就加大了用户敲击键盘的次数,浪费了用户的时间。为了解决同音严重的现象,不同输入法采取了各种技术来提高输入速度和整体性能。目前比较流行的技术有:压缩编码长度、以词为单位输入、拼音串可编辑和汉字串可编辑、混合输入、模糊输入、机器学习、特殊处理、自动转化等,尤其是语句级输入技术的引入。
2 最适宜个性化定制的输入法
自谷歌拼音输入法于2007年4月发布以来,经过多次版本更新,目前已经基本拥有了拼音输入的各种基本功能,并且还实现了跨平台(PC端和Android平台)、跨语言和跨键盘的输入(语音输入),为用户提供了无缝的输入体验。
如今主流的拼音输入法基本都具有了中英混输、常用符号输入、英文联想、模糊音设置、长句联想、繁体输入、表情输入、错音提示、拆分输入等功能,这些基本功能谷歌输入法自然也全都具备。
而凭借全球的平台和技术优势,谷歌输入法还加入了一些更具特色更实用的功能。
语音输入
利用在语音识别领域的研究成果,谷歌为手机(Android平台)输入法和PC端的输入法均提供了语音输入的功能,为中文用户提供语音输入功能。用户通过下载最新版本的Google输入法,在输入状态下点击麦克风标志,对准麦克风说话,即可实现输入。这省却了用户键盘输入的困难和繁琐,为用户的输入带来了极大的便利。
多语种输入
依托Google在世界各国语言上的庞大数据以及处理优势,Google输入法提供英文写作助手功能,把英文输入的常用功能结合到输入法当中,为用户提供拼写纠错、单词及短语的补全、同义词推荐、中英翻译等功能。
随着中国越来越融入到国际化浪潮中,英文办公已成为趋势。很多用户为每日的英文邮件回复、文档撰写而苦恼,甚至每个单词和句子都依靠翻译工具来完成。Google输入法的英文写作助手功能,则可以免去用户这一繁琐的流程,直接在输入中展现英文风采。比如它可以根据读音和拼写,智能地为用户提供拼写补全和正确拼写的建议,减少写作中的拼写错误;它还提供多种英文同义词,解决用户词汇量不足、不断重复使用同一词的老大难问题,为用户的写作增色,同时,它还通过Google 翻译向用户提供在线的翻译结果,让用户不仅能够输入英文得到英文建议,还能输入中文得到英文建议,更快更好地进行英文写作。
另外,Google输入法的云输入功能目前已经支持包含中文在内的24种语言以及100多种语言的虚拟键盘输入,用户可以在线实现多种语言的输入。
IME扩展
支持扩展是谷歌输入法最适宜个性化定制的地方。谷歌拼音输入法提供了以Lua脚本编程语言为基础的输入法扩展API,可以让开发者在谷歌拼音输入法的基本输入功能基础上开发和定义更丰富的扩展输入功能,并将脚本分享给谷歌拼音输入法的用户安装、使用。
谷歌拼音输入法扩展API提供了三种扩展拼音输入法的方式:命令扩展、整合扩展与转换器扩展。
命令扩展:将脚本程序中的某个入口函数关联到一个两字母长的自定义命令。当用户先键入i然后键入该命令时,输入法即激活该扩展函数,然后在候选项列表中显示扩展函数返回的候选项结果。
命令扩展适用于那些用户明确希望在特定场景下使用特定输入功能,且候选项较多或较复杂的情况。
整合扩展:将脚本程序中的某个入口函数关联到特定的键盘输入串或特定的中英文候选项。当用户使用拼音输入法时,一旦用户通过键盘输入的字符串与整合扩展关联的特定字符串(可包含通配符)匹配,或拼音输入法解析出的某个候选项与整合扩展关联的特定字符串(可包含通配符)匹配,输入法即激活该扩展函数。
整合扩展适用于那些在不妨碍用户正常输入的情况下,根据当前输入或候选内容,插入少数相关候选项的情况。
转换器扩展:将脚本程序中的某个入口函数注册为一个特定的转换器。当用户通过输入法的用户界面(如功能菜单)开启该转换器时,输入法产生的每个候选项被依次当做参数送入该转换器函数,进行运算后,函数返回的结果将会替换掉原候选项的内容,显示在相应位置。
转换器扩展必须由用户主动开启,适用于为所有候选项增加装饰、特效或者对所有候选项按规则进行变换的情形。
词典导入
词典导入是谷歌拼音输入法的另一个极具定制性的功能。它支持用户通过该接口批量导入词汇到谷歌拼音输入法的用户词典中,或导出谷歌拼音输入法的用户词典到文本文件中。
待导入的用户词典是一个文本文件,每一行包含一个词相关的信息。一行由三部分组成,分别为词语、词频(记录该词被用户重复输入的次数)、词语的完整拼音串。三部分之间由一个tab字符分隔。行与行之间由Windows或者Unix的回车符号分隔。若一个拼音串包含多于一个拼音时,拼音之间用空格分隔。
依托于谷歌在搜索领域的技术优势以及在世界各国语言上的庞大数据处理优势,谷歌输入法借助其数量庞大的开发者们为用户们开发了大量实用的输入扩展(登录Chrome Web Store即可搜索下载)。