基于词汇树检索的图书馆书目智能查询系统设计
2019-04-28周洪宾
摘要:传统查询系统未在语义相似度上进行探讨,已不能满足图书馆智能化发展需求。为此,设计一种基于词汇树检索的图书馆书目智能查询系统,用户在用户管理模块登录自己账号进入图书馆主页,在图书馆主页进到提问式书目查询界面,选取分类查询途径输入分类号,用户上传分类号之后书目数据库通过基于词汇树的书目查询方法,判断查询书目与书目数据库中书目的相似度,完成书目智能查询,最后用户在查询结果界面可查看查询结果。经验证,所设计系统可高效率地区性完成高精度的图书馆书目智能查询任务,且查询操作简单易行,查询性能显著优于同类查询系统。
关键词:图书馆书目;智能查询;词汇树检索;系统设计;书目数据库;对比分析
中图分类号:TN915-34; TP391
文献标识码:A
文章编号:1004-373X( 2019)24-0180-03
0 引 言
伴随信息化社会的发展脚步,提取与共享信息成为人们工作生活的重要组成部分[1]。在这信息繁杂的生活背景下,人們怎样高效与快速地获取信息是目前科研人员关注的热点问题[2]。
现图书馆信息查询系统存在查询效率低的缺点,为进一步提升查询效率,本文设计一种基于词汇树检索的图书馆书目智能查询系统,以期实现高精度、高效率且操作简单的图书馆书目智能查询[3]。
1 图书馆书目智能查询系统设计
1.1 系统硬件设计
本文设计的查询系统由用户管理模块、书目分类导航模块以及数据库构成[4]。用户进到提问式书目查询界面,输入分类号,在查询结果界面即可查看结果。系统整体结构图如图1所示。
1)用户管理模块
此模块用于管理用户信息,为其修改密码,建立档案[5]。用户管理模块的整体结构图见图2。
2)书目分类导航模块
书目分类导航模块整体结构图如图3所示。
为了确保书目分类导航模块完成五项基本功能,构建《中国图书馆分类法》。用户进入提问式书目查询界面,选取分类号,之后通过书目对数据库查询。用户通过超链接进到三级类目导航界面后进到查询程序,向书目数据库传输查询申请[6-8]。
3)数据库
因为图书馆数据库中存在的数据量较大,本文使用Access数据库构建数据库ztf.mdb,当中包含《中国图书馆分类法》表ztf.dbf与分类统计表fltj.dbf,详情见表1和表2。
1.2 系统软件设计
系统软件部分使用基于词汇树的方法。向SIFT特征训练库实行分层K-means聚类,获取层数有分支因子依次是A与B的词汇树,标记成C(A,B)。此词汇树里的各个节点都描述一个书目单词ur,其中,上标Z描述此节点在词汇里所处的层数,上标ht描述此节点在此层数节点里的索引[9]。
基于式(6)获取的相似度便可完成书目库中与用户查询书目相关信息的查询[10]。
2 实验分析
将本文系统应用在某高校图书馆中,设定科技、数学、动物、军事、医学、天文、地理7种类型,使用本文系统进行书目查询的准确率高达99.99%。结果表明本文系统可有效完成图书馆书目的智能查询。
采用本文系统、图书智能检索系统、基于RFID的图书查询系统进行对比实验。
2.1 查准率与查全率
使用查准率与查全率进行性能对比,查准率与查全率分别为:
查准率=查询获取的有关书目×100% (7)
查询获取的全部书目
查全率=查询获取的有关书目×100% (8)
全部书目
由实验数据得知,本文系统的查准率与查全率均大于95%,图书智能检索系统与基于RFID均低于本文系统,本文查询性能优势显著。
2.2 查询效率
采用系统响应耗时与用户查询耗时作为三种系统的对比指标,三种系统的响应耗时与查询耗时对比结果如表3所示。
分析表3数据可知,本文系统的综合查询效率平均值为0.10 ms;传统方法效率平均值依次为2.64 ms、7.14 ms,本文系统综合查询效率最高。
2.3 复杂度
设定10次书目查询实验,对比三种系统的查询复杂度,对比结果见图4。
分析图4数据可知,本文系统的查询复杂度未大于0.1,且始终低于图书智能检索系统与基于RFID的图书查询系统,表明本文系统的查询操作较为简单,易于掌握。
3 结论
本文的查询系统应用于某高校图书馆后,经验证明,本文系统对7种类型的查询准确率高达99.99%;与传统方法对比,本文系统的查准率、查全率以及查询效率均更好,且查询复杂度最低,查询性能显著。
参考文献
[1]陈莹,郭佳宇,利用位置信息加权词汇树的图像检索[J].系统仿真学报,2017,29(10):2353-2359.
CHEN Ying, GUO Jiayu. Image retrieval using weighted vocab-ularv tree with location information [J]. Journal of system simu-Iation, 2017, 29(10): 2353-2359.
[2]郭佳宇,陈莹.融合颜色特征与词汇树的图像检索[Jl小型微型计算机系统,2017,38(7):1653-1657.
GUO Jiayu, CHEN Ying. Image retrieval using the fusion ofcolor feature and vocabulary tree[J]. Journal of Chinese com-puter systems. 2017, 38(7): 1653-1657.
[3]王睿,杨舒卉,张丽.基于潜在语义分析的电子文献检索方法及實验分析[J]海军T程大学学报(综合版),2017 .14(1):88-92.
WANG Rui. YANG Shuhui, ZHANG Li.Electronic docu-ments retrieval methods and experiment analvsis based on la-tent semantic analysis [J]. Journal of Naval University of Engi-neering. 2017, 14(1): 88-92.
[4]刘作国,陈笑蓉.面向文本聚类的实体:动作关联模型研究[J]中文信息学报,2018,32(5):22-30.
LIU Zuoguo, CHEN Xiaorong.A entity-action relationship mod-el for text clustering[J]. Journal of Chinese information process-ing, 2018, 32(5): 22-30.
[5] FENG Q D,XU M, ZHANG X.RETRACTED ARTICLE: Themodel for improving big data suh-image retrieval performanceusing scalable vocabulary tree based on predictive clustering[J]. Cluster computing, 2016. 19(2): 699-708.
[6]张兴旺.以信息推荐为例探讨图书馆人工智能体系的基本运作模式[J].情报理论与实践,2017 .40( 12):69-74.
ZHANG Xingwang. Study on the basic operation mode of artifi-cial intelligence system of library based on information recom-mendation [J]. Information studies: theorv & application,2017. 40(12):69-74.
[7] WALLHEIM H.From complex realitY to formal description:bibliographic relationships and problems of operationalizationin RDA [J]. Cataloging&classification quarterly, 2016. 54(7): 1-21.
[8]周晓政,王正兴.信息一知识一智能转换视野下图书馆信息素养教育的目标功能定位[J].现代情报,2016.36(1):26-29.
ZHOU Xiaozheng, WANG Zhengxing. Information - knowledge -intelligence conversion perspective on functional objectives oflibrary information literacy education [J]. Modern information,2016. 36(1):26-29.
[9] AGRAS H, FERRAGUT C, ABRALDES J A.Match analysisin futsal:a svstematic review[J].International journal of perfor-mance analysis in sport, 2016. 16(2): 652-686.
[10]冯璐.图书馆阅读需求资源利用率优化管理仿真[J]计算机仿真,2018,35(3):271-274.
FENG Lu. Simulation of optimal management of librarv read-ing demand resource utilization [J]. Computer simulation,2018. 35(3):271-274.
作者简介:周洪宾(1975-),女,山东聊城人,图书馆馆员,研究方向为电子图书档案管理、计算机应用。