基于知识体系建设创建数字图书馆
——以河北大学图书馆APP为例
2017-09-15
(河北大学管理学院 河北 保定 071000)
基于知识体系建设创建数字图书馆
——以河北大学图书馆APP为例
刘晓晓韩秀静
(河北大学管理学院河北保定071000)
伴随着信息技术的迅速发展,将事物的透明性、智能性和便捷性表现在大众的视野下,进而也为数字图书馆的发展带来了机遇和挑战,并指引着数字图书馆的发展方向,进一步向智能化迈进。笔者通过文献调查法和实地调查法,同时借鉴知识体系建设的理论,借助提取知识元、对知识元进行标引以及语义识别技术等的知识点,构建河北大学数字图书馆一个可以多窗口阅读和方便查阅资料的APP,以此增加河北大学图书馆的智能服务。
数字图书馆;知识服务;知识体系构建
一、前言
笔者认为,数字图书馆(Digital Library)是借助数字技术处理存储各种文献的图书馆,即将不同载体、不同地理位置的信息资源用数字存储技术存储到一起,进而方便世界各地的读者进行阅读和使用。数字图书馆就是虚拟的、没有围墙的图书馆,是在网络环境中拥有共享功能的知识网络系统,是一个规模巨大、便于使用、没有时间空间限制的智能检索中心。
据国家统计信息中心的研究表明:我国在信息技术和设备方面在亚洲国家中占有靠前的位置,但是在信息资源的开发和利用方面还是较低的。我国数字图书馆对网上资源认识不够,利用率低,不能通过技术整理未被挖掘的信息,为读者所用。数字图书馆建设的最终目的是为读者和用户提供知识服务,同时为图书馆员等知识服务人员提供卓有成效的知识服务平台[1]。
二、数字图书馆
数字图书馆(Digital Library,以下简称DL)理论研究与实际应用始于20世纪90年代的美国。在我国DL的建设已经开始进入资源整合与面向用户的数字化服务阶段,是评价一个国家现代信息基础设施水平的重要标志[2]。
迄今为止,国内外学者对于DL的定义各抒己见,还没有达成统一的认识。比较有代表性的观点有以下几种:徐文伯[3]认为:DL就是对有高度价值的图像、文本、语音、音响、影视、软件和科学数据等多媒体信息进行收集、组织规范性加工,进行高质量保存和管理,实施知识增值,并提供在广域网上高速横向跨库链接的电子存取服务。同时还包括知识产权、存取权限、数字安全管理范畴;朱复成[4]认为:DL是传统图书馆在信息社会中的逻辑延伸和扩展;王军[5]认为:DL是网络环境+信息集合+信息管理工具;刘峰[6]认为:DL是一个全球性的分布式的大型知识库,即以分布式海量数据库群为支撑,基于智能技术的大型、开放、分布式信息库;谭祥金[7]认为:DL实际上就是通过互联网连接起来的数字资源库群,实行分布式管理的知识共享的计算机系统;陈源蒸[8]认为:数字图书馆与传统图书馆有着质的区别,数字图书馆非图书馆,把图书馆数字资源建设的局部行为当作数字图书馆的整体开发项目是一大误解,数字图书馆是全社会的共同责任。
虽然诸位学者对DL的认识虽然不同,但综上可得出:DL仍然具有收集、整理、加工、保存、传递和服务的基本功能;并且借助计算机技术对信息资源进行处理、保存;同时具有全球性、共享性、便捷性,为全球用户提供服务;DL是作为传统图书馆的补充和扩展而出现的,是传统图书馆收纳信息资源方面、服务方面、便捷方面的补充与深化,两者之间不存在对立关系,DL是传统图书馆在服务行业的继承和进一步的发展而存在的。
三、知识体系构建和Web技术
(一)知识体系构建
知识体系构建是由知识元不断累积构成。知识元是一种不可分割、逻辑完整、语义连接、相互关联的新知识。
图1 知识元关联图
由图1可知,很多知识元聚集在一起,会形成新的知识点;将新的知识点通过知识点之间的关联构成新的知识链;各个知识链相交构成知识网;知识网交叉形成知识库,构建知识体系,进而为人类提供知识服务。
(二)Web定义
语义Web技术主要应用于“以计算机形式可处理的表示信息的语言”,从而使得机器和信息资源之间建立起语义联系;本体的对象则是获取、描述相关领域的知识,将该领域对特定知识的认知统一规划,确定该领域内共同认可的词汇,并从不同层次上给出词汇和词汇之间相互关系的定义。准确来说,语义Web技术在数字图书馆的知识体系构建和知识服务方面有着非常重要的作用[9]。
1.知识组织工具
语义Web技术的出现,使得数字图书馆知识组织工具不只是之前的分类法、主题词法,而且出现了新的知识组织工具——知识地图、语义网络、以本体为核心的语义Web技术和语义网格等。其中,知识地图和语义网络可以将知识结构化,表现出知识之间的关联性,而语义网格通过语义互操作能力来提高信息共享能力。
2.知识组织方法
语义Web技术的出现,改善了知识构建对技术的需求,为其提供了新的知识组织方法,基于语义Web技术的知识构建方法主要体现在利用本体表示语言对信息资源进行标引:为本体构建知识元模型、为自然语言转化为机器语言提供标引,用机器标引的语言可以直接被计算机存储、加工、利用,或在不同的系统之间进行互操作。对本体进行标注后,其语义特征才能被知识组织系统所识别,并利用知识库中的知识搜索引擎对语义内容进行重构,形成某个特定领域的知识网络,进而向广大读者传递的语用服务更易于理解。
3.知识组织体系
语义对知识体系构建有着重要的影响。语义Web将自然语言转化为计算机语言,被计算机识别,进而来进行语言的设计,使得独立的数据库融合为一个整体。
在语义Web技术的带动下,数字图书馆的知识服务从物理层次的文献单元上升到认知层次的知识单元,为数字图书馆的知识体系构建提供了很好的知识服务的环境。
四、数字图书馆APP
借助知识体系构建理论,以河北大学图书馆为例,构建河北大学数字图书馆APP产品。河北大学数字图书馆APP产品面向学生、教师及培训人员,以河北大学图书馆资源为基础,通过知识体系的建设和知识化加工形成知识化资源,并通过专用的功能展示和体现资源内容的知识体系和知识化资源的应用,为用户提供知识服务。
为达到以上目的,该系统应包含以下两个部分:1)运营管理平台:用户行为分析、广告管理、用户管理和管理员管理;2)客户端:分别设有知识导航、知识地图、专题知识和知识元检索等知识模块,条目阅读模块设有多窗口阅读、深度阅读、收藏、目录、上/下、亮度控制等属性,个人中心模块设有阅读历史、消息中心、我的收藏、个人信息等属性;
笔者希望通过构建河北大学数字图书馆APP产品,为广大河大师生提供有效的学习方法和提高知识节能,进而可以为数字图书馆的发展做出贡献。总之,此款产品具有以下特点:1)知识分类较多,可满足不用用户的需求;2)多窗口阅读模式,可满足用户对比和参考阅读需求;3)按照用户搜索热度推荐知识元,反映用户搜索行为;4)以知识元为单位,进行知识标引,满足用户碎片化学习需求,同时也具有系统化的黑钻提阅读,满足用户系统化学习需求。
(一)知识资源加工
知识资源加工包括三方面任务:结构化加工、知识体系建设和知识化加工。三者关系如下图2所示:
图2 知识资源加工结构
如上图2所示:结构化加工指将图书PDF和排版文件转化为epub格式的结构化资源,为知识体系和知识化加工提供数据基础。
知识体系建设则需要根据10本核心资源进行抽词和构建关联关系,形成知识元及关联关系的有机整体,作为知识导航、知识地图等功能的数据基础。知识化加工的主要任务是通过程序和人工辅助的方法将知识体系的标签标引到结构化资源中,形成知识化资源,作为知识标签和深度阅读功能的数据基础。
(二)资源内容抽词
从人的角度来看,给出一段话或一篇文章之后,从中找出存在的词语并不是很难得一件事情,因为对于人类,语言是存在和交流的根本,具有明显的特征;而计算机处理、识别语言的能力并不像人类那么简单,对于计算机语言来说具有两个特征:字符和字符串频数[10]。
统计抽词的所有具体方法是以这两种语言为基础,进行资源内容的基本抽词。其中比较有代表性的是基于统计词频、互信息判断、信息熵判断、寻找最长字共现、后缀数组等方法,这些方法基本都属于基于统计量的抽词方法。借助计算机技术和语言对信息资源内容进行抽词,完成资源内容的分类,进而方便进一步的知识标引,为计算机系统识别知识资源内容增加便利之处,同时也方便广大读者进行深度阅读,享受知识服务带来的便利。
(三)资源内容标引
在对信息资源内容进行标引之前,首先必须要提到“编目”,资源内容标引是编目的重要环节,一般是先对整个资源进行整体内容的标引,然后根据不同类型的广大读者的内容需求灵活选择进行标引,进而方便用户准确、及时的查找到自己需要的内容[11]。
总之,内容标引是对所需要标引的内容资源进行高度概括,最后作
为知识标签进行引导,区别资源之间的不同,为资源之间的相同之处做指引,方便资源内容的归类整理,实现对资源内容的有效管理;内容标引可以认为是最资源内容的描述,是为广大读者提供一种便捷并且准确的搜索到所需要的内容的一种方法。
五、总结
互联网时代的发展,数字图书馆要想更好地服务于广大用户,是离不开强大的数据库和先进的信息技术。笔者希望以河北大学图书馆APP为例,数字图书馆的发展可以大量普及运用知识体系构建理论、知识元的抽取、分类标引,和web技术等,进而给读者提供一个泛在知识环境下的以用户需求为中心的服务,最大限度地满足知识经济发展的需求,促进知识社会可持续发展。
[1]张会田.泛在知识环境下的数字图书馆发展研究[D].西北师范大学,2008,11(1)
[2]江涛.我国数字图书馆研究综述[J].现代情报,2007,5(25)
[3]徐文伯.建设中国数字图书馆意义重大[N].光明日报,2000,3(8)
[4]朱复成.DigitalLibrary涵义及有关问题[J].图书馆情报工作,2000,(3)
[5]王军等.数字图书馆的研究内容和方向[J].中国图书馆学报,2001,(6)
[6]刘峰.国家计划中国数字图书馆发展对策及研究动态[J].情报资料工作,2001,(2)
[7]谭祥金.面对数字图书馆浪潮的思考[J].中国图书馆学报,2002,(1)
[8]陈源蒸.数字图书馆非图书馆[J].大学图书馆学报,2005,(4)
[9]姜永常.基于知识构建的数字图书馆知识服务研究[J].黑龙江大学,2007(5)
[10]刘洋.基于字边界特征的中文抽词模型研究[D].湖南大学.2013.5(23)
[11]毛晴寒.基于互朕网应用的涉农视频资源内容标引研究[D].华中师范大学.2016.5
刘晓晓,河北大学2015级在读硕士研究生,研究方向:信息政策;韩秀静,河北大学2016级在读研究生,研究方向:信息资源管理。