基于终端输入法的智能感知技术研究
2010-06-11杨少龙钟伟彬李慧云魏颖琪
杨少龙,钟伟彬,李慧云,魏颖琪
(中国电信股份有限公司广东研究院 广州 510630)
1 手机界面设计的现状
手机产业的发展,引导着人机界面正在由以前单一的硬件控制发展至多样化的服务阶段。iPhone进入市场,激发了手机与互联网相结合的新趋势,手机人机界面的发展方向已经转变为以硬件、软件和增值服务为基础的综合性服务窗口。为应对发展趋势,Google联合其他几十家与手机产业相关的厂商创建了“开放手机联盟”,以Android手机操作系统为核心,为用户提供综合服务。作为决定手机可用性关键因素的人机界面,已经成为联盟中所有参与者的战略重点。
当前的手机界面根据交互的形式可以分为触摸屏手机与键盘手机。两者在交互和界面设计上存在较大的差异。苹果公司于2007年推出的iPhone手机引领了这几年的触摸屏手机市场,当前各大公司推出的手机大多在追逐或者延伸iPhone的触摸交互设计方案。从当前的市场反馈信息可以清晰地看出,iPhone在智能手机领域掀起了巨大的风浪,其模仿者不计其数,都朝着iPhone指引的交互道路上前进。
虽然很多优秀的公司都推出了许多别具特色的手机,如Blackberry系列、OPhone手机等,但所有的手机都是在现有的交互范式内完成所有的功能,即使是既带键盘又有触摸屏的手机也只不过是两种普通交互范式的整合,没有跳出现有的设计思路。
这种传统的设计思路存在以下几个问题。
(1)快速定位号码
对于手机来说,最基本的功能是打电话和发短信。能否快速定位号码是手机等便携终端使用是否方便的重要指标,传统的设计是通过在联系人界面输入联系人名字来定位的。对于手机来说,显然输入联系人名字需要用户一系列的操作才能完成,便捷性大打折扣。有些带键盘的非智能机在这方面做得好一点,可以通过拼音首字母来定位,但是也仅仅能够用首字母,并且没有一种技术可以保证各种手机都可以快速定位号码。
(2)快速定位想要使用的软件
随着智能手机的发展,手机软件越来越多,怎么找到用户想要使用的软件,越来越成为困扰UI设计者的一个问题。就算是同一个操作系统,不同的OEM或者同一个OEM的不同系列产品,所提供的软件放置位置都有不同。对于用户来说,没办法快速定位想要使用的软件,这也是影响手机特别是智能手机使用感受的重要方面。
(3)搜索技术
在手机上进行互联网搜索是3G应用的一个亮点,但是目前互联网搜索仍旧是以手机浏览器为起点,以Google等搜索引擎为核心实现。由于手机操作的特殊性,采用原来基于PC的搜索技术和UI界面,同样有很大的限制,用户使用起来感觉很不方便。
为了解决这些问题,本文介绍一种新的以用户操作意图智能感知技术为核心的新型人机交互界面技术,提出以输入法引擎为基础的可以在手机、移动互联网终端等各种移动终端使用的设计思路。
2 基于终端输入法的用户操作意图智能感知技术
这是基于输入法的快速号码定位、业务导航技术,是通过输入法结合关键字语义分析实现对手机终端的号码簿、本地应用和互联网服务的联想搜索和显示的新型人机交互技术。
2.1 整体技术架构
现有手机方案的设计,要求用户的操作过程必须是二维的:先选择功能,再输入交互信息。这种操作的弊端是显而易见的:一是用户必须记住每个功能所在的子文件夹;二是用户的按键次数大为增加。用户操作意图智能感知技术将功能与内容有机集成,变用户的二维操作为一维操作,用户操作手机不需要进入任何菜单,在手机待机界面下直接输入自然语言或其对应的代码(代码可以是汉语拼音或其他语言的缩写),即可随心所欲地调用各种功能而不需要进入任何菜单,从而以最简单的方式实现操作层面的人工智能,做到所思即所得。整体技术架构如图1所示。
技术架构包含了两个方面的内容:一是意图感知功能,把手机的输入引擎跟语义识别引擎紧紧结合在一起,智能感知用户的输入意图;二是快速定位功能,包含电话号码、本地软件的快速定位以及网络搜索结果的快速显示。
智能操作意图感知技术是在终端系统平台上提供的一整套解决方案,按照自下而上的层次结构,可以把智能操作意图感知技术分为5个层面,如图2所示。
本地信息源位于最底层,以数据库的方式存在,包括智能搜索数据库以及本地用户信息。本地用户信息包含用户地址本信息、即时通信用户信息、日程信息等。智能搜索数据库记录应用检索的关键字。
第二层是核心搜索模块即智能搜索引擎通过本地信息源,可根据关键字快速检索到一个或者多个应用,并通过第三层的UI/UX管理器(用户界面/用户操作管理器),生成相关菜单提供用户选择,用户可以一键进入应用,避免多层菜单的递进。智能搜索引擎支持T9输入、虚拟键盘和手写输入,可快速搜索本地用户信息,例如用户地址本信息。用户可选定信息,并可触发电话、短信、彩信、邮件、即时通信等多种操作。
第三层是系统服务辅助智能搜索引擎进行应用和服务的定位,并生成相应的桌面界面,调用指定的应用或服务。通过应用搜索接口可向搜索引擎注册应用的关键字,并可启动、唤醒、前置应用。通过服务搜索接口可以与系统中其他搜索工具配合,可以连接网络云计算,使用各类云计算服务,例如通过中国电信的号码百事通服务可连接中国电信号码百事通的生活搜索,对“衣食住行”进行查找,进而实现订餐、订/购票等业务,也可以直接进行网络搜索引入相关的搜索页面。
第四层是应用服务层,系统各应用和服务通过第三层的两大接口与智能搜索引擎互动。
第五层是系统用户界面/用户操作,通过UI/UX管理器,可动态显示相关菜单,快速定位应用和服务。
2.2 智能感知功能
智能感知功能指的是用户可通过一个动作(按键或某个手势),启动智能感知和搜索,通过用户输入,预测用户的未来操作,用户输入包括画屏取字和键盘(物理键盘和虚拟键盘),支持T9布局,支持包括数字以及数字键对应的拼音汉字的内容搜索。智能感知包含划指感应技术和关键词感应两方面的内容。
(1)划指感应技术
划指感应技术将文本感应技术与现有触屏技术有机结合起来。与现有的触屏技术不同,用户调用各项应用功能不再需要通过点触菜单或图标来实现,而只需要用手指在屏幕上划写简单的字母、图形或符号,即可实现各项功能的调用。比如设定闹钟,只需要在屏幕上划写汉字“钟”或闹钟的拼音缩写“NZ”或英文单词“Clock”;划写“X”可以关闭程序等。用户自然地将现实世界中的知识迁移到手机操作中。
(2)关键词感应
关键词功能感应技术是通过自然语言操作,以最便捷的方式实现互联网与移动通信增值服务的直接接入。在待机界面下,用户可任意输入自然语言的任何词语,关键词语义识别技术可智能感知用户输入的内容,根据用户的输入预测其下一步的操作意图,从而直接自动调用相关的网络功能,尽量免除用户多余的功能选择按键。比如输入“机票”、“航班”以及其他相关的词,即可上网订购机票;输入“请客”、“餐馆”以及其他相关的词,即可上网预定餐厅。
关键词感应包含一个关键词数据库和一个关键词功能数据库。关键词功能包括固定功能和动态功能。固定功能是每个关键词都会有的,如搜索功能,无论用户输入内容,系统都能以该输入内容为关键词直接指向预置的搜索引擎进入无线互联网进行相关搜索。动态功能是某类关键词特有的功能,比如购物功能,输入任何商品类关键词都能指向该功能进入购物网站。关键词数据库与关键词功能数据库形成映射。输入任何一个关键词,系统首先激活语义分析引擎,分析该词的语义,根据其语义类型自动将不同的功能映射到该关键词中,显示不同的功能按键,并将其最可能的功能按键排在最前面。这些功能按键是通往后台不同网络服务的通道。
关键词合并和关键词分解是关键词感应的两大实现要点。关键词合并把一系列相关的词汇合并到同一个关键词中,如生病、疾病、看医生、医疗等都可以合并到关键词“医疗服务”中。关键词分解是通过对用户输入文本的分析,引导到不同的应用。图3和图4详细说明了关键词合并和关键词分解的应用。
2.3 快速定位功能
快速定位的对象包括本地用户信息、应用以及应用的内容,并延伸到网络的云计算信息,提供便捷的信息查询、应用定位和加载。通过预置、系统软件安装等方式获取应用的关键字,通过本地用户信息获取多个应用的内容,包括电话号码本、邮件、日程以及即时通信的信息。定位的结果根据号码、联系人、本地应用、网络服务等进行分类,通过UI/UX管理器动态生成桌面或菜单,可根据用户的使用频率进行排列,将最常用的放在用户最易操作的位置。
(1)快速号码和软件定位
用户手写、虚拟键盘点击或者物理键盘输入后,通过语义识别引擎分析后,感知用户的操作意图,仅仅2~3次点击操作就可以快速定位号码和软件。如按9、3,就有93、WE、YE、YD几种可能的组合,界面就会显示包含“文、叶、预订”等字眼的名字和业务,如图5所示。
(2)业务导航
在任何输入界面的文本感知,比如在短信界面上输入“羽绒服”,就会出现“购买羽绒服”的导航。如果关键字库中包含了羽绒服厂商的广告链接,用户就可以直接进入该网站进行选购了,如图6所示。
3 结束语
本文介绍了“用户意图智能感知技术”,该技术基于手机行业人机界面(UI/UX)的技术积累和对用户关于人机界面的市场研究,并以输入法引擎为核心,建立新型人性化界面风格和交互操作体系,通过改善用户体验到业务关联定位、文本感知,再到网络搜索的方式给用户全新的UI体验,以一致、方便、快捷的方式向用户提供本地和网络信息与服务。该技术可以使用在各种移动终端,包括智能手机、非智能手机、移动互联网设备上。
1 http://www.openhandsetalliance.com
2 http://www.guobi.com
3 http://www.apple.com.cn/iphone
4 http://zh.wikipedia.org/zh-cn