基于云计算环境下的信息检索及智能融合的研究
2018-03-13袁敏段景辉黄梦醒
袁敏+段景辉+黄梦醒
摘 要: 针对传统的信息检索及智能融合方法虽然开辟了信息检索的新思路,但是一直存在检索不完整、融合效率低、可利用性差的问题,提出基于云计算环境下的信息检索及智能融合的方法。通过逻辑结构及加密过程的设计,搭建云计算的电子环境;通过ASP与ADO相结合完成信息检索,改进TF?IDF算法完成信息的智能融合,实现基于云计算环境下的信息检索及智能融合的研究。实验结果表明,采用改进方法可有效提高信息检索效率,信息融合准确度高,具有一定的实用性。
关键词: 云计算; 电子环境; 信息检索; 智能融合; 逻辑结构; 检索效率
中图分类号: TN911.23?34; TP301.6 文献标识码: A 文章编号: 1004?373X(2018)06?0162?03
Abstract: In allusion to the problem that though the traditional information retrieval and intelligent fusion method opens up a new way for information retrieval, there still exist problems of incomplete search, low fusion efficiency, and poor adoptability, an information retrieval and intelligent fusion method based on cloud computing environment is proposed. The electronic environment of cloud computing is established by means of the design of logical structure and encryption process. Information retrieval is accomplished by combining ASP with ADO. Intelligent fusion of information is accomplished by the improvement of TF?IDF algorithm so as to realize the research on information retrieval and intelligent fusion based on cloud computing environment. The experimental results show that the improved method can effectively improve the information retrieval efficiency with high information fusion accuracy, and has certain practicality.
Keywords: cloud computing; electronic environment; information retrieval; intelligent fusion; logical structure; retrieval efficiency
0 引 言
信息檢索主要应用于数字化平台,是一种以关键词匹配为主要搜索形式的智能化挖掘形式。现有信息检索方式,主要是在基于Tim Berners?Lee提出“语义网”的基础上,通过与人工智能的结合,对知识进行传播与表达。这种信息检索形式开辟了信息检索的新思路,奠定了智能化信息检索与融合的发展方向[1]。但这种信息检索及智能融合方式,并不能完全适应与各个环境进行优化研究,对此,提出基于云计算环境下的信息检索及智能融合方法。
1 云计算环境的搭建
云计算环境的搭建涉及到终端层、应用层、基础设施层等多个方面[2],其具体搭建过程,可从逻辑结构的设计和加密过程设计此两方面进行研究。
1.1 逻辑结构的设计
在云计算环境下,信息检索与融合的逻辑结构是:用户向终端服务器提出获取计算等请求时,终端服务器必须对用户身份信息进行验证,待确认该用户为已注册后,才可保证该用户提出的请求能顺利取得请求获取证书[3]。若该用户完成登录,云计算环境便会将该用户身份认证,转交给安全认证服务器,以保证用户在后续过程中,可直接使用云环境中的其他功能。其具体工作原理流程如图1所示。
1.2 加密过程设计
用户对终端服务器提出的每一个问题都可以成为一个应用示例[4]。通常情况下,这些应用示例应该与普通数据包相同,具有服务ID、算法ID、服务对象等相关属性[5]。但这些具体属性中,服务ID作为请求流水号,与其他服务请求不同,需要现在满足服务类型条件的前提下,进行加密处理,再将加密明文传输至服务对象的中心主机[6]。对于管理云系统来说,可以根据请求包中服务类型和属性的不同,选择最合适的服务器,对请求包中数据进行加密。其具体加密过程如图2所示。
2 信息检索及智能融合优化处理
2.1 信息检索
ASP与ADO相结合的形式,可以保证应用WWW数据库的管理功能顺利实现[6]。当用户在浏览器中检索相应信息时,浏览器中显示的检索结果为与关键词相关联的所有信息,这种检索方式也被称为模糊检索。如果将应用ASP与ADO技术搭建而成的数据库比作字典[7],在用户输入一个关键字或关键词之后,字典首先会对该字或词进行解释,并根据解释将其转换为相应的编码组织,再由中心计算机根据编码组织[8],对后台信息数据库中的所有信息进行检索,找出与该解释相关的所有信息,并将其进行整理,最终显示出来。该过程与搜索引擎的检索方式类似,具体操作流程如图3所示。endprint
2.2 改进TF?IDF算法的信息智能融合处理
原有TF?IDF算法中[8],[r]表示待查询关键词在后台数据库中所占的权重,[q]代表该关键词的重要程度,[λ]为与重要程度相关的重要变量,其自身的取值范围为0~1,且[q]值越大,则[λ]值也就越趋近于1。其具体计算公式如下:
[r=λ?ln(GH(li,t)+1)?ln nCH(li)li2] (1)
式中:[li]代表输入关键词与后台数据库中,某个准确关键词之间的关联程度;[t]为数据库中准确关键词的随机出现频率;[n]代表与输入关键词相关联准确关键词的个数;[GH(li,t)]与[CH(li)]则为满足整体运算过程,而自行设定运算规则[9]。
原有TF?IDF算法,虽然可以计算出待查询关键词在后台数据库中所占的权重,但并未对计算所得结果进行规划、分析,因此,易导致结果的真实性出现较大偏差[10]。为了有效改善此问题,建立存储本体概念与查询关键词之间的映射关系如下:
[r=λ?ln(GH(li,t)+1)?ln nCH(li)li2]
[c=GH(li,t)?CH(li)GH(li,t)?CH(li)Wrc=λ?rc] (2)
式中:[c]代表存储本体概念;[GH(li,t)?CH(li)]代表待查询关键词与数据库中准确关键词重合部分的交集;[GH(li,t)?CH(li)]代表待查询关键词与数据库中准确关键词所有组成成分并集;[Wrc]为存储本体概念与查询关键词之间的映射关系。
3 实验结果与分析
为了验证云计算环境下信息检索及智能融合模型的实用性价值,以2台配置相同的计算机作为实验对象。在实验正式开始之前,将2台计算机随机分为实验组和对照组,并对它们进行相关参数设置。
3.1 试验参数设置
实验参数设置表如表1所示。
表1中:CBW代表信道带宽,该项参数单位为MB;IFF为信息流量,该项参数单位为MB,且其自身与103成正比;MIF与MAF分别代表最小流量与最大流量,这两数值的单位均为MB,且数值本身与105成正比;CTR代表接通率,该项参数为百分数。为了保证实验的真实性,实验组与对照組的各项参数均保持一致。
3.2 交互准确率对比
在完成实验参数设置之后,应用云计算环境下信息检索及智能融合优化模型,对实验组计算机进行控制,对对照组计算机不进行任何控制,让2台计算机同时开始对相同的关键词进行检索,并对它们在与使用者进行信息交互时的准确率进行记录,结果如图4所示。
图4中:x轴代表带检索关键词;y轴代表交互准确率;点实线代表实验组准确率曲线;虚线代表对照组准确率曲线。根据图4中各条曲线走向,可以发现,无论待检索关键词怎样变化,实验组的准确率曲线始终位于对照组上方。这也意味着,应用云计算环境下信息检索及智能融合优化模型对关键词进行检索,可以得到更高的信息交互准确率。
4 结 语
研究云计算的工作原理以及应用实例,完成云环境的搭建;应用ASP与ADO结合的形式,完成网络信息检索,改进原有TF?IDF算法,完成数据智能融合。通过实验证明,应用这种方式建立的云计算环境下信息检索及智能融合优化,可有效提高信息检索效率,信息融合准确度高,具有一定的实用性。
参考文献
[1] 吴晓璇,倪志伟,倪丽萍.云计算环境下基于分形的聚类融合算法研究[J].计算机工程与应用,2015, 51(14):1?6.
WU Xiaoxuan, NI Zhiwei, NI Liping. Research on fractal clustering ensemble algorithm based on cloud computing environment [J]. Computer engineering and applications, 2015, 51(14): 1?6.
[2] 秦振伟,周雪松,高志强,等.云计算技术在用户侧智能变电站系统中的应用研究[J].天津科技,2016,43(9):67?70.
QIN Zhenwei, ZHOU Xuesong, GAO Zhiqiang, et al. Applied research of cloud computing technology in the user side intelligent substation system [J]. Tianjin science & technology, 2016, 43(9): 67?70.
[3] 王元平,吕宗磊,祝辰.基于物联网的城市环境风险监测预警技术的研究[J].科技资讯,2016,14(11):168.
WANG Yuanping, L? Zonglei, ZHU Chen. Research of the urban environmental risk monitoring and early warning based on Internet of Things [J]. Science & technology information, 2016, 14(11): 168.
[4] 陈卫平,刁文凯,徐渊红.基于物联网技术的居民健康信息智能管理应用研究[J].中国数字医学,2015,10(1):35?36.
CHEN Weiping, DIAO Wenkai, XU Yuanhong. Research on the intelligent management application of resident health information based on the technology of Internet of Things [J]. China digital medicine, 2015, 10(1): 35?36.endprint
[5] 龙虎,张小梅,唐林海.大数据背景下智慧教育云平台的构建研究[J].电脑知识与技术,2015,11(20):109?111.
LONG Hu, ZHANG Xiaomei, TANG Linhai. Research on the construction of cloud platform for intelligent education under large data background [J]. Computer knowledge and technology, 2015, 11(20): 109?111.
[6] 包晓安,林辉,周建平,等.基于智能家居的一致性模型融合技术研究[J].浙江理工大学学报,2015,33(1):109?114.
BAO Xiaoan, LIN Hui, ZHOU Jianping, et al. Research on consistency model fusion technology based on smart home [J]. Journal of Zhejiang University of Technology, 2015,33(1): 109?114.
[7] 董胜,袁朝辉,谷超,等.基于多学科技术融合的智能农机控制平台研究综述[J].农业工程学报,2017,33(8):1?11.
DONG Sheng, YUAN Zhaohui, GU Chao, et al. Research on intelligent agricultural machinery control platform based on multi?discipline technology integration [J]. Journal of agricultural engineering, 2017, 33(8): 1?11.
[8] 刘昕桐,骆春晖,侯亮,等.基于多传感器融合的楼宇智能安全预警系统的研究[J].无线互联科技,2015,22(6):130?131.
LIU Xintong, LUO Chunhui, HOU Liang, et al. Study on intelligent building safety early warning system based on multi?sensor fusion [J]. Wireless Internet technology, 2015, 22(6): 130?131.
[9] 刘珊,赵保亚,刘健.基于数据融合算法的危险品仓库智能实时监测系统研究[J].北华航天工业学院学报,2016,26(1):12?13.
LIU Shan, ZHAO Baoya, LIU Jian. A study of intelligent real?time monitoring system of dangerous goods warehouse based on data fusion algorithm [J]. Journal of North China Institute of Aerospace Engineering, 2016, 26(1): 12?13.
[10] 王雁雄,李彦生.基于模型中心与云计算的智能配电网应用系统研究[J].自动化与仪器仪表,2017(7):150?151.
WANG Yanxiong, LI Yansheng. Research on application system of intelligent distribution network based on model center and cloud computing [J]. Automation and instrumentation, 2017(7): 150?151.endprint