APP下载

基于知识图谱的高校智慧图书馆建设研究

2021-11-02李湘丽刘双印徐龙琴郑建华

无线互联科技 2021年17期
关键词:图谱实体智慧

曹 亮,李湘丽*,刘双印,徐龙琴,尹 航,郑建华

(1.仲恺农业工程学院,广东 广州 510225;2.广东省高校智慧农业工程技术研究中心/广州市农产品质量安全溯源信息技术重点实验室,广东 广州 510225)

0 引言

高校图书馆是学校文献信息资源中心,是师生教学、科研和创新的“动力池”,具有组织、存储和传递教学科研文献资源的重要作用,是校园与社会的文化枢纽,是推动图书馆全民阅读推广工作的有效手段。随着信息技术快速发展,图书馆经历了从传统手工操作方式→数字化分布式信息系统→信息流与物质流并存复合图书馆→智慧图书馆模式[1]。然而,融合了现代信息技术和物联网技术的智慧图书馆,虽然馆藏信息资源量日益剧增,积累了大量的、形式复杂多样的信息数据,但读者和数据之间、不同类型数据之间的关联也存在着模糊地带,海量的信息数据与用户需求之间存在不确定性,延缓了智慧图书馆的建设进度。

知识图谱是一种知识管理技术,能让海量的信息数据有效组合和应用,可根据用户需求提供个性化服务,与现代高校图书馆建设需求不谋而合。因此,将知识图谱技术运用到图书馆建设中,不仅可以满足用户个性化、多元化和主动性的信息服务需求,而且能让读者快速、有效从海量的文献资源中搜索到高质量的信息,快速提升图书馆的服务及管理水平。

1 知识图谱

知识图谱是一种辐射状的图形,揭示各领域实体之间关系的网络图形。知识图谱有四大特征:知识抽取、知识表示、知识融合和知识推理。其中,知识抽取是对大规模的结构化、半结构化和非结构化数据进行实体抽取、数据关系抽取和数据属性抽取[2];知识表示是把知识客体中的知识因子和知识通过各种模型关联起来,如距离模型、矩阵分解模型、复杂关系模型等;知识融合是把来自于不同知识源的知识通过整合、去歧、关联、验证、更新等达到与人的思维相融合的特需型知识库;知识推理就是在原有知识库中挖掘类似于人类思维的知识对象之间的层次关系。

2 高校智慧图书馆主要特点

高校智慧图书馆是伴随智慧城市、智慧农业和智慧校园等发展起来的,具有多样性特征,最主要特点是全面感知[3],即感知知识、感知需求和感知存在。其中,感知知识表示知识的广度和宽度,感知到知识的存在并让知识有机的汇聚起来;感知需求表示知识的需求与被需求之间可以通过某种方式快速建立链接,进而达到各方需求;感知存在就是通过微博、微信、移动图书馆等大数据让你感知图书馆无处不在。高校智慧图书馆的“三感”特点,正契合了知识图谱的技术优势:挖掘用户行为数据间潜在关联,主动推荐高价值信息,为读者提供精准服务。

3 知识图谱在高校智慧图书馆中的应用

3.1 高校智慧图书馆中的知识抽取

高校智慧图书馆知识抽取包括信息实体抽取、关系抽取和属性抽取(见图1)。(1)信息实体抽取即结构化数据实体抽取,主要是对图书馆文献中的文献名、姓名、地名、机构名、时间、关键词等信息实体进行抽取,采用迭代方式对实体进行聚类算法,抽取新的命名实体。(2)关系抽取即把实体间存在的显式和隐式关系进行抽取,再组织、定义。在高校智慧图书馆馆藏资源中,文献名和作者之间就是显式关系,同一作者的文献名之间的关系就是隐式关系,关系抽取采用马尔可夫逻辑网联合推理关系抽取方法。(3)属性抽取即把实体本身的属性、实体属性与属性之间、开放域数据集中属性进行提取,形成属性对应关系,再进行抽取。

图1 高校智慧图书馆知识抽取关系

基于知识图谱的智慧图书馆就是从不同来源、不同结构的数据中进行抽取,形成数据知识存入到知识图谱库中[4]。

3.2 高校智慧图书馆中的知识表示

知识表示有分布式表示、三元组表示、复杂关系表示。通常是以三元组方式进行知识表示,可以直接表示实体、关系和其之间的复杂语义关联。高校智慧图书馆中,实体之间的关系、关系之间的关系存在着复杂的交叉关系,例如:作者之间、读者之间、文章之间、作者和文章之间、读者和文章之间的关系等,都存在着交叉关系。

通过知识图谱的知识表示,就可有效把高校智慧图书馆多源信息表示出来,给人以清晰和明确的认识和理解。

3.3 高校智慧图书馆中的知识融合

知识图谱中的知识融合可让高校智慧图书馆中多样性、多源性和重复性的知识数据有效聚合。通过在同一规范下进行实体对齐、实体链接和关系推演等操作,把不同来源的知识进行融合。高校智慧图书馆知识融合技术流程如图2所示。

图2 高校智慧图书馆知识融合技术流程

首先,对目标读者和所需数据进行预处理,剔除无用信息后用Hash函数进行分块处理;其次,把原数据信息和目标数据信息相对应,根据对应的复杂度确定是否进行四层负载均衡处理;再次,把原数据信息和目标数据信息进行属性相似度和实体相似度计算,并给出相对应链接;最后,对知识融合的结果进行反馈评估参数校正,最终输出正确结果或反馈原因。

通过知识图谱的知识融合将智慧图书馆中数量庞大、种类繁多和关系复杂的资源数据进行深度融合处理,揭示馆藏资源的潜在知识关联规律,为研究数据价值提供参考。

3.4 高校智慧图书馆中的知识推理

高校智慧图书馆中的知识推理就是将馆藏资源实体知识经过推理,挖掘出隐含的关联信息和知识点。其中,实体知识包括实体及其属性,已知或是推理出的实体间关系可以再次作为新实体知识被推理,如此循环可反复挖掘出有价值信息。知识推理方法主要有基于逻辑的推理和基于图的推理,逻辑推理最基本的架构为:A通过关系a推出B,B通过关系a推出C,由此可推理出A通过关系a推出C。基于图的推理相对复杂些,一般用图来表示,可以方便地表示结点与结点间多重关系路径,体现出关系的多样性,得到更多信息,推理的范围更加广泛。

高校智慧图书馆海量的、复杂的馆藏资源,采用知识推理可以有效挖掘和推理出潜在的关系信息,通过提供接近“专、精、深”的搜索查询功能,为用户提供“懂需求”的智能服务,达到精准推送。

4 结语

知识图谱在高校智慧图书馆建设中提供精准的上传下达服务,为知识的大数据化合理利用提供优质路径,为读者与高校智慧图书馆之间建立起了网络纽带。预期在不久将来,基于知识图谱的高校智慧图书馆结合人工智能技术,将会把书、人、时间和空间有效融合为一个知识生态有机体,通过对读者各种行为数据分析,主动推荐图书、推送资源,构建“会猜想、懂(你)心思”的现代智慧图书馆,实现无障碍、横跨时空的资源共享,资源利用的最大化,为读者带来便捷、生动、有趣和智能的阅读体会。

猜你喜欢

图谱实体智慧
绘一张成长图谱
前海自贸区:金融服务实体
实体的可感部分与实体——兼论亚里士多德分析实体的两种模式
补肾强身片UPLC指纹图谱
两会进行时:紧扣实体经济“钉钉子”
振兴实体经济地方如何“钉钉子”
有智慧的羊
智慧派
杂草图谱
智慧决定成败