面向客户服务的信息过滤代理的研究
2011-08-14余以胜
余以胜
(广东女子职业技术学院,广东 广州 511450)
随着技术的进步,当今移动设备要求提供互联网服务的需求有不断增长的趋势。当服务提供商和产品供应商在互联网上提供市场和核心业务服务的同时,还提供客户服务。参考文献[1]提出了基于人工智能技术(即称为最优-第一搜索)的构架,讨论了能拥有建立其中的搜索技术的代理程序。本文提出有全文搜索能力的独立应用构架,可以在计算机、移动电话上通过Web浏览,或通过固定电话语音交互,该构架称为交互式客户服务代理ICSA(Interactive Customer Service Agent)。
1技术基础
1.1 集成Web、WAP和Voice的体系结构
WWW运行在HTTP协议上,它是客户/服务器体系结构,服务器位于一端且给体系结构另一端的客户提供Web页服务。图1所示为集成的体系结构,包含Web、WAP和Voice网络。PC机对HTTP请求/响应直接解释;移动设备使用称为WAP的轻量级协议,以编译的或二进制格式表现信息。语音交互使用的语音网关可以由电信服务器、ASR服务器、TTS(Text To Speech)服务器和VoiceXML解释器组成。
在Web体系结构中,浏览器位于客户端且用来解释由服务器传送来的HTML代码。移动设备要访问互联网,需要包交换网络,随着GPRS(General Packet Radio Service)、EDGE(Enhanced Data for GSM Environment)和很多其他技术的出现,条件现已具备。对这样一个包交换网络,则要求通过WAP网关接入现有互联网。WAP网关也连接到BTS(Base Transceiver Station),它为客户端的移动设备提供无线连接。
在Voice体系结构中,由自动话语识别器ASR(Automatic Speech Recognition)服务器执行语音识别,由文本-话语 (TTS)服务器执行文本到话语的转换。一个VoiceXML解释器根据VoiceXML规格[2]执行应用程序。实现语音交互的常用方法有直接对话和混合交互语音响应(IVR)两种。其中直接对话较为流行,用户与给出语音格式指令集的系统或应用进行交互。IVR应用是基于程序设计语言,如VXML(VoiceExtensibleMark-up Language)和 SALT(Speech Application Language Tags)。
图1 Web、WAP和Voice集成的体系结构
1.2多通道多模态应用
一个多通道应用系统将其内容展示给终端用户,是基于用户代理实现的。在多通道访问中,企业数据和应用系统可通过多个通道进行访问。与多通道访问方式不同,多模态访问将多个通道组合形成同一个交互活动或会话。X+V(XML+VXML)和SALT是开发多模态应用[3]的常用工具。基于单一著作模式(Single Authoring)[4]的多模态应用能够使用SALT开发,而基于多著作模式(Multiple Authoring)的多模态应用要求使用X+V。
多通道应用也可以是单一著作模式或多著作模式。单一著作模式多通道应用使用程序语言或标注语言开发,该语言能够为各种接口或设备重新生成具有可读性的输出。多著作模式多通道应用将要求不止一种的程序语言或标注语言为各种接口或设备产生可读性输出。XML(Extensible Mark-up Language)是一种标注语言,可以使用XSLT(Extensible Stylesheet Language Translation)开发单一著作模式多通道应用。多著作模式多通道应用将共享一个或多个部件,通常是数据库的Web、WAP和Voice应用的集成。
1.3全文搜索技术
全文搜索技术在通用企业数据库引擎中均有很好的支持。 Oracle、MySQL、Sybase、SQL Server和 PostgreSQL等是支持FTS(Full-Text Search)的主要数据库引擎。FTS是一种索引搜索方法,它对数据库表中的词建立了索引,索引创建在由4个或更多个字符组成的词上[5]。全文搜索的SQL实现随着选用的数据库引擎的不同而不同。
2设计和实现技术
开发单一著作模式的多通道应用系统要求语言转换。转换最好与过滤代理(即FTS)执行的其他进程相分离,因此在应用设计中,使用五层体系结构的模型。另外,应用系统独立于数据库引擎,也是五层模型优于三层模型之处。
2.1 XML/XSL转换
XML是元标注语言,是一个为数据描述创建语义标签的规则集合,而HTML用来指定Web页的布局。XSL(Extensible Stylesheet Language)是基于XML的语言,用来操作、分类和过滤XML数据。XSLT样式表定义一个规则或模板的集合。当模板与源文档中的节点相匹配时,它在新文档中存储按模板产生的输出结构。多通道应用给基于其连接设备的终端用户表现其内容,并且XSL是一个将内容与表现分离的理想工具。通过取决于连接设备或用户代理的XSLT处理器将XML/XSL转换成 HTML、WML和 VXML,如图 2所示。
2.2 N-层模型
N-层模型指全部数据包或应用系统能够划分的分类层数,也指层数N≥2的客户-服务器模型。
如果使用五层模型开发,不用传统的三层模型,Web应用的执行性能会更好。应用5层模型的重要优势在于,处理未来流量的伸缩性和性能需求的适应性、良好的结构化设计、灵活的以销售商为中心的应用及其易维护性。
3 ICSA构架
本文提出的ICSA多通道应用构架基于一个五层模型,如图3所示。
图2XML/XSL转换为HTML、WML和VXML
图3 ICSA构架
3.1数据层
数据层指数据库服务器的内容。在此情况下,数据库服务器包含带索引的关键词,这些关键词来自预设的已知问题和回答、与用户提出的问题类似的问题以及给出的可能回答。
3.2数据访问层
数据访问层包括服务器端(SSI)文件或连接到数据库的脚本。它建立一个连接到数据库并为提供查询目的的连接标识符。将完全的数据库转换成XML文件的应用程序接口(API)也在该层上操作。
3.3应用层
应用层负责系统执行的算术和逻辑操作,包括查找关键词,在没有回答提供时存储新的问题集合。用全文搜索技术来查询数据库。其XML文件表示数据库,XPATH可用来定位XML文件中的回答。此外,也可用第三方API来执行查找XML文件。然后,服务器端脚本产生XML文件,并存储查询结果。
3.4表现层
表现层包含扩展样式表文件,取决于设备或访问系统的浏览器,它能够将中间文档格式化转成WML、HTML和VXML文件。具体的格式可以由检查浏览器发出的HTTP请求来确定。此处可选的是,如HAWXY等第三程序可以充当代理,检查用户的连接设备或浏览器,并给其传递合适的信息。
3.5用户接口层
用户接口层以不同的浏览器或不同的连接设备为特征。当使用固定电话或移动电话时,应用系统在TTS服务器协助下将消息转换成语音;当使用电话上网时,浏览器传入WML文件;当使用Web浏览时,PC机传入HTML文件,并可以选择由CSS将其格式化。
本文提出的ICSA(Interactive Customer Service Agent)构架的处理流程如图3下方所示。当客户通过拨电话号码或键入URL连接到应用系统时,Web服务器上索引文件被传递。在执行期间,客户端或连接设备的头部请求决定使用哪个XSL文件将选择出的XML文件转换成HTML表单、WML表单或Voice对话。在提交过程中,脚本查询数据库,并产生一个XML中间文档,该XML文档由一个XSL文件转换,在Web浏览器下、将响应表现给客户之前,可选用CSS文件将其格式化。
ICSA构架需要很少量的XML文件,需要与Web、WAP和Voice表现相关的独立XSL文件,需要求执行转换用的服务器端脚本或应用文件;并以其内容管理的简易性提供健壮的Web应用。另外,ICSA使用XSL文件极易操作XML文件。为了增加新特征或扩展功能,该构架在伸缩性方面留有很大的空间。
图4所示为用例图,明确地指出回答ICSA查询涉及的五个步骤。在问题提交过程中,代理程序过滤关键词,查询数据库,为客户列举类似问题,从而让客户选择出与其问题最为类似的问题,进而提交关键词(称为水平域排序的过程)。一个确认消息等待客户发出,这要么通过客户点击超链接(即最为类似的问题)实现,要么通过语音响应[7]实现。然后再执行一个完全搜索(称为垂直域排序),最后给出最适合的回答。如果在数据库中不存在回答,将问题存储起来需要由人响应。
图4 应用程序的用例图
所提出的构架的性能将基于它对使用大量的移动电话和模拟器的可访问性。对人们而言,它的可用性也应考虑到。可访问性指的是用户使用URL从事Web和WAP浏览的能力和通过用移动电话、固定电话和软件拨电话号码语音上网的能力。它的可用性决定于在代理上是否有信息可获取,以及它在检索信息时是否有效。可用性要考虑的因素,包括每一段时间内日志(或向前)查询和回答查询的频度。
本文提出的ICSA是一个以销售商为中心的、与平台无关的和基于五层模型的应用构架,有很大的伸缩性。它是使用XML的单一著作模式程序,并能通过支持XSLT服务器端的任何Web语言编写程序代码实现。其内容管理变得更容易,能够像在模拟电话网上的DTMF应用或在基于取决于编码的IP的电话网上的IVR应用一样操作。实质上,对要求24/7/365通过前述三种通道提供其重要客户服务的任何行业或公司,它都将有助于改进客户关系管理(CRM)。
[1]ADEYEYE O M,ATAYERO A A.A multi-channel application framework for customer care services using bestfirst search technique[C].Proceedings of Third Generation(3G)GSM and Mobile Computing(3GSMc2007)–Intermational Conference and Workshop, Covenant University, Nigeria,2007.
[2]ATAYERO A A, OLUGBARA O O, AYO C K, et al.Design, developmentand deploymentofan automated speech-controlled customer care service system [C].Proceedings of the GSPx 2004-The International Embedded Solutions Event,Santa Clara, CA, 2004.
[3]CHANG S E.The design ofa secure and pervasive multimodal Web system[C].19th International Conference on Advanced Information Networking and Applications,2005,2:683-688.
[4]http://www.metc.pku.edu.cn/keie/courses//ucsweb2004-old/pdf/chapt04-1.pdf,2008-08.
[5] http://dev.mysql.com/doc/refman/5.0/en/fulltextsearch. html,2008-10.
[6]HONG O O.VoiceXML application development life cycle:Building usable voice user interface [EB/OL]. http://devresource.hp.com/drc/resources/vxusability/vx_devlifecycle.pdf,2008-5.
[7]庾锡昌,刘伟平,武晋,等.基于 VoiceXML的语音交互平台的设计与实现[J].计算机工程与设计,2007,28(8).