个性化搜索引擎在信息服务业的应用研究
2013-03-05谢海英
谢海英
摘要:在全球化和信息化浪潮汹涌的当今世界,我国的信息产业取得了快速的发展,信息已成为社会发展的重要战略资源并将迎来自己的黄金发展时期,但是,我国信息服务业还存在着一些问题。将个性化搜索引擎技术应用到信息服务业正是解决问题的方法之一。该文阐述了我国信息服务业的发展现状及存在的问题,分析传统搜索引擎技术在信息服务业的应用及不足,最后对个性化搜索引擎在信息服务业应用提出了建议。
关键词:信息服务业;个性化搜索引擎;搜索引擎
中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2012)36-8653-03
1 我国信息服务业现状及存在的问题
1.1 我国信息服务业现状
工信部5月31日发布《中国软件和信息服务业发展报告(2012)》(以下简称《报告》)。数据显示,2011年中国软件和信息服务业创投活跃度猛增,投资案例数、已披露投资金额案例数、已披露投资金额、平均每期投资案例金额等均同比大幅增长。产业规模扩大,发展迅速,共实现软件业务收入超过1.84万亿元,同比增长32.4%,超过“十一五”期间平均增速4.4个百分点,并超过同期电子信息制造业增速10个百分点以上。软件业务收入占GDP的比重达3.9%,占电子信息产业的比重首次突破20%,在国民经济中的作用进一步增。?2011年,我国手机网民规模达3.56亿(包含WAP用户),同比增长17.5%,与前两年相比,增长速度开始放缓。毫无疑问已成为全球最大的互联网、移动互联网市场。
1.2 我国信息服务业存在的问题
1)地区差异明显
根据“软件和信息服务业城市竞争力评价指标体系”,从排名来看,2012年19个城市依然呈现三个阵营排列:第一梯队为北京、深圳,第二梯队为上海、成都、南京、广州、杭州、济南、大连、青岛,相较2011年竞争力格局变化不大,广州、杭州分别下滑1位和3位;青岛大力发展软件和信息服务外包产业成绩显著,本年度超过武汉跃升至第二梯队;厦门、宁波等软件出口导向型城市受国际经济气候影响,下滑幅度较大;
2)大部分企业规模偏小,缺乏竞争力
我国信息服务企业的数量虽多,但大多数企业规模比较小,资金的短缺使其只能开发一些投入较少的短期项目,而无法进一步开发风险和收益高但投入也大的大型软件和服务项目。而且,在信息服务业全球化的发展趋势下,这种小规模的资金、人员的投入和经营尤其突显出。
3)人才相对匮乏,缺乏高素质人才
现代信息服务业具有高人力资本含量、高技术含量和高附加值的特点,其发展需要拥有高素质的人才。我国现代信息服务业的人才积累较少,尤其是与现代信息服务业发展密切相关的专业人才严重匮乏,高层次服务人才短缺、外流的现象比较严重,制约了现代信息服务业的发展。
4)政策法规体系不健全
中国信息服务业相关法律、法规不健全,导致了信息市场运作的不规范,严重影响了信息服务业的全面发展,目前中国针对信息服务业发展中出现的新技术、新业务和新问题存在政策缺位。对于因信息技术广泛应用和融合到其他领域而引发的一些新问题,例如虚拟财产、个人隐私、数字化信息内容的评估定价等,还缺乏明确的政策指引和法律规范,阻碍了新兴业务发展。
2 搜索引擎技术在信息服务业中应用
信息服务业主要分为三大类:即 信息传输服务业;IT服务业(信息技术服务业);信息资源产业(主要指信息内容产业)。不同行业和对象所提供的服务不同,所以使用搜索引擎技术时信息需求也不同,因此具有不同特点。
2.1不同行业和对象的信息需求
政府的信息需求是通过共享信息改善工作效率和提高政府内人员综合能力;构建电子化的虚拟机关,将政府可公开的信息直接归纳,准备面向社会、企业和公众发布,并使政府的服务工作网络化;构建统一、高效、廉洁和规范的"虚拟电子政府",树立各级政府各部门在网络上的形象,提高政府工作的透明度和勤政、廉政建设。
企业的信息需求就是信息集成,打破“信息孤岛”“应用孤岛”的挑战,数据平台的建设和数据的深度挖掘是其核心要素,信息和资源共享,同时找到自己的潜在客户,支撑企业的决策系统,降低库存、提高生产质量、快速应变,增强企业的市场竞争力。
媒体的信息需求是实时跟踪、采集与网站相关的信息来源,数据要准确、安全、可靠。强大查询功能,方便用户浏览网站的所有信息,系统最大限度地实现易维护性和易操作性,实现互联网信息内容采集、浏览、编辑、管理、发布的一体化。
2.2传统搜索引擎的弊端
搜索引擎主要使用自动跟踪索引软件,通过自动的方式分析网页的超链接,依靠超链接和HTML代码分析获取网页信息内容,并采用自动搜索、自动标引等事先设计好的规则和方式来建立和维护其索引数据库,以Web形式提供给用户一个检索界面,供用户输入检索关键词、词组或逻辑组配的检索式,搜索引擎根据这些关键词在数据库中进行匹配,然后返回相关网址。在这种情况下会存在下列弊端:
1)命中率低: 是爆炸式的互联网信息,让歧义信息、垃圾信息越来越多,而“不通人情”的算法排序模式,很难理解用户真正的需求,这使得用户往往需要多次反复搜索才能找到正确的答案,搜索效率越来越低。
2)信息的时效性差
由于网上的信息量巨大,传统搜索引擎的数据更新周期短则十几天,长则几个月,而垂直搜索引擎的数据更新可以以秒为单位。
3)信息描述不全面
传统搜索引擎提供的信息是网页链接包括标题、描述、url链接三个部分, 它们是当前URL链接上的网页整体内容的介绍,而不是针对用户检索的特定信息的介绍,其匹配原则是网页描述与关键词的相关度;
4)排序方式单一
传统搜索引擎是按照系统设定的排序算法,自动根据相关性将网页排列,用户只能被动的接受搜索引擎的排列顺序。用户不能自主的选择的多种方式进行排序。
3 个性化搜索引擎术在信息服务业中的应用
个性化搜索引擎指的是搜索引擎依靠用户搜索的关键词、点击情况、访问路径,收藏记录等历史记录,来返回更适合这个用户的搜索结果。需要对用户兴趣进行收集; 用户描述信息确定、分类;资源信息特征选取、分类; 建立用户和兴趣的关联,兴趣和资源的关联; 利用资源和用户兴趣的关系,计算出搜索结果中的每个文档和用户兴趣的相似度,并对相似度进行排序; 用户对搜索结果进行评分(或记录用户行为),更新该类用户的兴趣规则等几个步骤。当今社会高度信息化,面对全球电子商务大潮的冲击,信息服务业正处于一个争空前激烈的境地,各种咨询机构和网络供应商的出现,将对信息服务业构成极大的威胁。因此要引入个性化搜索引擎来提高信息服务的质量,满足用户需求,必须做到以下几点:
1)加强互动
加强与用户的沟通可以了解用户的意见和建议,用户之间可以在论坛发表自己的意见,交流体验。用户要想发表意见,必须通过注册自己的信息,如年龄性别,个人收入以及联系方式等。因此能获得了丰富的用户资料,对用户的生活风格、消费风格、兴趣爱好、主要的技能、职业以及大体的收入水平等有了相当的了解。还可以在直接进行在线调查,可以主动、热情地邀请访问者或会员参与调查,可以是进行市场调查,也可是对某些热点问题的探讨等。
2)用户至上
网站要提高用户体验,那么必须从内容入手,因为内容才是用户最终的浏览目标,是用户寻找所需信息的源头。对于内容的好坏则可是用户体验的决定因素。按照用户或用户群的特点组织信息资源,创建个性化的信息环境, 设计用户所期望的个性化信息服务模式, 为用户提供多样化的信息服务, 使用户得到便利。
3)服务多样化
对搜集到的信息进行整理、加工、评价、研究和选择之后,通过报刊、广播、电视、网络等通信方式予以主动发布,以满足用户的信息需求。
4)重视推送服务
为了使信息资源得到充分利用,实现最大范围的共享,采用上门,电话,邮件等方式,主动介绍,宣传,推广信息产品的服务方式。主动发现用户的潜在需求和深层次需求, 为各行各业的用户提供有针对性的信息。
4 结束语
随着网络发展和普及, 搜索引擎已成为用户信息检索的主要工具。但通用搜索引擎针对不同用户的查询请求都提供相同的检索结果,体现不出用户的个性化需求。个性化搜索引擎在信息服务业的应用可以帮助用户在最短的时间内找到最适合自己的信息,不仅提高了信息的查准率和用户满意度, 同时也增强了用户的个性化使用体验和感受, 能够在为用户提供有效信息的同时更加契合用户对个性化检索的需求。
参考文献:
[1] 王苏舰.个性化搜索引擎应用于信息服务业初探[J].现代情报,2010,30(4).
[2] 张瑞藜.个性化搜索引擎中用户兴趣提取技术的研究[J].科技信息,2011(24).
[3] 张璇.用户兴趣模型在个性化搜索引擎中的应用研究[J].微计算机信息,2010(26).
[4] 廖绍雯.个性化搜索引擎关键技术及应用[J].软件导刊,2011(8).
[5] 黄羿.用户兴趣模型在个性化搜索引擎中的应用[J].重庆文理学院学报:自然科学版,2008(10).