可视化技术在数字图书馆资源揭示中的应用
2018-11-12魏炼
魏炼
摘 要 “互联网+”时代,数字图书馆大数据发展的总体趋势是异构的庞杂数据呈级数迅猛增长。可视化技术在数字图书馆资源揭示中多层面的应用可以提高资源的分辨度和可理解性,大幅提升数字图书馆知识服务的水平。国内数字图书馆资源揭示中,可视化技术应用主要聚焦于馆藏资源的可视化,信息检索的可视化,学科导航的可视化,用户界面的可视化这四个方面。江汉大学图书馆在运用可视化技术揭示馆藏资源的实践和探索中,取得了可观进展,也遇到一些问题。
关键词 可视化 数字图书馆 资源揭示
中图分类号:G250.7 文献标识码:A DOI:10.16400/j.cnki.kjdkz.2018.07.085
Application of Visualization Technologies in Digital Library Resources Reveal:Based on the Practice of Jianghan University Library
WEI Lian
(Jianghan University Library, Wuhan, Hubei 430056)
Abstract In the era of "Internet plus", the overall trend for the development of Big Data of digital libraries is that heterogeneous massive data shows exponential increases. The multi-dimensional utilization of visualization technologies in revealing digital library resources is aimed at improving the legibility and intelligibility of resources, so as to boost the knowledge service of digital libraries to a new level. The domestic application of visualization technologies in revealing digital Library resources falls into four categories: collections visualization, information retrieval visualization, the visualization of subject navigation, and UI (user interface) visualization. In practice, Jianghan University library has made strides, despite some hurdles to overcome.
Keywords visualization; digital library; resources reveal
“互聯网+”时代的数字图书馆纷纷以积极姿态融入互联网生态系统,而数据环境日益呈现出海量(Volume)、多样(Variety)、高速(Velocity)、准确(Veracity)和低价值密度(Value)的5V特征。[1]结构化、非结构化、半结构化的多样数据,且呈级数迅猛增长是目前校图书馆大数据发展的总体趋势,由此带来数据清洗难题和可理解性下降问题,严重影响了大数据价值的挖掘应用。海量异构数据间关联性、交互性关系的可视化,以及虚拟环境下图书馆知识服务的实时动态可视化成为了大势所趋。[2]CNKI检索近年的相关文献中,有学者总结出可视化技术在数字图书馆资源揭示中发挥的三大关键性作用:一是降低用户信息搜寻的成本,二是优化馆藏资源的用户界面,三是扩展资源揭示的深度与广度。简言之,即显著提高数字图书馆知识服务水平。[3]当北美高校图书馆已将大数据智能可视化技术广泛应用于数字人文研究、 服务数据挖掘、 图书馆服务评估时,[4]国内数字图书馆资源揭示中的应用进展则可归结为以下几个热点主题:馆藏资源的可视化,信息检索的可视化,学科导航的可视化,用户界面的可视化。本文试图从以上四个方面阐述江汉大学图书馆在运用可视化技术揭示馆藏资源的实践和探索。
1 馆藏资源的可视化
1.1 3D地图的位置导航
目前,位置导航技术已经相对成熟,无论是移动端实时更新的百度地图和高德地图,或是广泛应用于汽车驾驶中的内嵌可视导航仪。对于规模较大的图书馆,利用位置导航系统来弥补参考咨询人员不足,在技术层面上完全可行。读者在图书馆内利用查询机或移动设备登录图书馆主页,进入“位置导航”界面,图书馆每层楼的3D布局就可清晰呈现在读者面前。确认目标阅览室或书库后,通过点击确认操作可导航出读者与目标地点之间的最短线路。目前,江汉大学图书馆循环播放的入馆宣传短片中,有全馆各个楼层的三维可视矢量图(见图1)。以此为蓝本制作更具实用价值的小规模导航系统,此次升级将是面向“智慧图书馆”迈进的大步提升。
1.2 RFID定位技术的应用
RFID(Radio Frequency identification)无线射频识别技术是一种准确采集信息,迅速处理数据的物联网技术。早在十年前的国外和港澳地区图书馆,该项技术就运用到纸本资源的检索定位上。国内,自深圳大学图书馆首先试水使用RFID定位技术之后,上海交大图书馆紧跟其后推进了该项技术的规范使用,一批高校图书馆纷纷参与到这项定位技术人性化和智能化的革新中。中国地质大学(武汉)图书馆在摸索实践中,通过RFID智能文献检索系统与图书馆OPAC系统的无缝对接实现了自助借换、馆藏清点和图书定位三大功能。[5]
RFID定位技术的关键技术在于将图书中安装RFID芯片,在书架上安装RFID标层,同时采用索书号首书定位方式,实现对某本图书的三维定位。此项改造升级工程需要图书馆采编部投入大量人力物力。由于RFID定位技术的国内研发替代了最初的技术产品进口,一枚RFID芯片的成本已经降低至最初的十分之一。在江汉大学图书馆的实验性借鉴中,可以考虑在图书馆编目业务外包时,要求书商直接完成上架新书的RFID芯片内置;对于已有的旧书馆藏,则实行分批分次的书标和磁针的更换升级;而借阅率持续很低的图书,则可直接剔旧,纳入密集书库。“3D地图位置导航”结合“RFID定位技术”可以有效完成纸本馆藏资源的可视化,让纸本资源的唾手可得,如同电子资源的一站式检索般便利迅捷。
2 信息检索的可视化
2.1 借阅关系可视化
传统的图书馆OPAC(馆藏书目查询系统)检索,只能看到图书的名称及相关信息,读者无法浏览到图书封皮及图书目录,较难判断图书对个人的有效价值;OPAC系统升级为多元书目扩展系统后,通过链接图书封皮、目录全文以及豆瓣书评论等关联内容,给予读者很好的荐读体验,进而催生借阅行为,体现了图书馆学五律中“为人找书,为书找人”的服务理念。升级后的OPAC多元书目扩展系统可自动生成借阅关系图,推测读者群的阅读模式,有利于引导读者的衍生阅读。以热门小说《明朝那些事儿》在OPAC系统中的图书借阅关系图为例(见图2):除了直接链接的同类别通俗类读物,比如武侠、鬼怪和传奇类小说,此图显示借阅这套丛书的读者有一部分是学习C语言和数控的理工科学生,推测这个读者群是将此类通俗类文学类阅读作为专业学习之余的调剂。
2.2 搜索日志分析
搜索日志分析,即用“脚印”(Footprint)、“踪迹”(Track)和“路线”(Trail)来描述用户访问网站的浏览记录,对用户行为大数据的进行搜集和深度分析,目前已被广泛应用于网络搜索中,图书馆OPAC系统也不例外。[6]脚印记载了用户的每次点击,脚印的集合连成踪迹,而相似踪迹的聚类产生了路线——基于这种浏览操作历史记载,可以推测用户个人的行为趋势。该理论框架下的实践推广早期主要运用于eBay, Amazon, 淘宝, 京东等国内外在线购物网站,以满足用户关联性的购买需求。当延伸至信息资源检索领域,则能前瞻性地满足用户的信息需求。“您可能感兴趣的图书”的阅读推荐条目,已然出现在江汉大学图书馆升级后的OPAC系统检索结果的页尾。当读者检索《明朝那些事儿》丛书时,延伸的图书推荐中就有《明史简述》、《细说明代十六朝》、《大明王朝之谜》等明史图书,无形中拓展了借阅者的阅读深度和广度,为如火如荼的全民阅读推广活动助力。
3 学科导航的可视化
3.1 机构知识库图谱分析
数字图书馆在信息搜集中运用爬虫技术,在知识发现领域利用“神经元网络” 决策树等数据挖掘技術,将异构数据转化为可视化信息——利用图形、曲线、表格等直观方式表达线型关联和网络图谱,方便用户更直观了解动态反馈结果。[7]
江汉大学图书馆近年采购了“智立方知识资源服务平台”,为图书馆、科研处、师生用户提供高效检索、分面聚类、知识关联图谱、研究趋势分析等服务。该平台整合了期刊、学位论文、会议论文、专利、科技报告等十种类型文献的2亿余条元数据,文献覆盖近20年来国内学术产出中文资源的95%。通过在“智立方”查找机构导航检索框中输入“江汉大学”,并限定2008年-2017年的时间区间,可导出江汉大学最近十年中文学术成果产出及被引变化趋势(见图3)。显而易见,这十年发文量稳中有升,但被引量却持续走低,整体科研发文有着重量不重质的弊端。“智立方”系统中数据集成的各学院下属实验室发文量对比图(见图4),可促使图书馆的学科知识服务更有的放矢,有利于集中有限学科馆员力量侧重于商学院、化学与环境工程学院、医学与生命科学学院的嵌入式课题跟踪服务,以确保优势学科的长足发展。
华中科技大学和数据库商重庆维普合作开发的“机构知识库平台”更具量身定制的功能优势:该平台首页中不仅有华中科技大学近十年发文图谱,清晰列举了重点专家学者和院系科研统计结果——个人和机构的发文量、被引量和研究主题一目了然。该平台还兼具提交科研成果并审核的功能,相当于集合了自建机构科研成果特色数据库的功能。华中科技大学机构知识库不仅能自动生成个人和学院的科研产出分析报告,还可导出下属学院的个人科研成果申报汇总表,为图书馆和科研处的年度统计工作节省了大量人力物力。[8]
3.2 “智立方”的标签云运用
标签云可视化技术,直接抽取文本中的关键词并将其按照一定的顺序和规律整齐美观地呈现在屏幕上。关键词在文献中的分布差异、频率高低,可以利用字体或图标的大小和颜色的醒目度来反映文献中各个关键字的差异,用连线的长短标识两者间关联的紧密亲疏。[9]将聚类标签运用到可视化知识导航,将根据语义相关的标签将检索结果进行分面聚类,便于读者获取主题相同或者相近的知识信息,并进一步发现隐性知识。[10]
“智立方知识资源服务平台”的学科导航运用了标签云技术,可清晰显示研究领域的“高频主题共现知识图谱”以及“学者关联图谱”:在此以“化学工程”研究领域为例,高频主题共现知识图谱清晰表明了最近十年化学工程涉及的重点热门领域分别为催化、丙烯、纳米等相关子领域(见图5)。继续点击最醒目的绿色图标“催化”可以显示多层次的360巴缤迹≡瘛爸幌允救宋铩钡姆置婢劾啵上允靖昧煊蚰壳白钪匾肝谎芯空叩墓亓纾?):其中华东理工大学的卢冠忠H指数高达23,福州大学的付贤智H指数高达21,罗盂飞、郑小明和李小年三位浙江高校的学者之间存在合作关系。点击人名可以继续了解这些学者的具体科研关注点,通过这种循环往复的关联过程,使得以“作者”和“研究领域”为中心的知识网络层叠铺开,扩大了检索的范畴,知识的关联性也得以强化。[11]
4 用户界面的可视化
4.1 虚拟现实
2016年也被一众媒体称为“虚拟现实技术元年”。美国新媒体联盟《地平线报告》是全球历时最长的探索前沿技术,预测发展趋势和开拓教育应用的报告。《新媒体联盟地平线报告》(图书馆版)在图书馆界具有广泛影响力,2014-2016连续三期报告中均涉及了虚拟现实和增强现实技术的紧密结合应用,让学生在更身临其境的体验中建构更深层次的广泛认知。[12]传统图书馆馆藏珍贵文献很少向公众开放借阅,读者大多只是听闻,而止步于远观,而不能实现零距离阅读古籍,触碰大师手稿。人工智能技术在数字图书馆领域中能实现更人性化的人机交互。大英图书馆最早开展的利用虚拟现实显示设备提供馆藏珍贵文献的翻阅,中国国家图书馆随后尝试开办了“虚拟现实读者站” 。[13]
江汉大学图书馆六楼的古籍阅览室内,有古籍图书18423册,线装本12263册,影印本5847册,善本313册,师生和社会读者可查阅到远至明朝时期的医学古籍,用于研究学习。馆藏三本珍贵的明清时期善本乃该馆“镇馆之宝”,很少对外借阅。如若能引入高科技的虚拟现实技术,利用三维建模功能将馆藏的古籍善本进行三维数字化处理,并通过数字手套等可穿戴设备实现读者与珍藏古籍善本的零距离接触,将使得尘封的“镇馆之宝”重见天日。
4.2 创客空间
高校图书馆作为教辅部门,创客空间的开拓将是投身于“大众创业、万众创新”信息浪潮中最切实可行的渠道之一。早在2012年,《经济学人》杂志就曾撰文预测“第三次工业革命”中3D打印机势必成为未来制造业的核心。近年, 国外很多数字图书馆成立创客空间, 向读者提供3D打印、3D建模等工具、材料和专业知识,便于读者将创意、科研成果迅速转化为实用技术和产品。[14]世界上第一个拥有创客空间的是美国费耶维特尔公共图书馆,而国内首个设立公共图书馆创客空间是上海图书馆,上海交通大学图书馆则开拓了校企合作创办创客空间的模式。[15]这些成功案例对江汉大学图书馆创客空间的设立都颇具借鉴价值。
江汉大学化学与环境工程学院的高分子材料与工程系,是拥该校有硕士点的重点一级学科。江汉大学图书馆可以和光电化学材料与器件教育部重点实验室,柔性显示材料与技术湖北省协同创新中心这两个省部级平台充分合作,利用创客空间的3D打印设备,提高学生动手能力,提升团队科研实力和合作能力,最大化材料学这个王牌专业的品牌效应。江汉大学图书馆创客空间的设立筹备中,除了涉及物理空间布局的适度改造外,建议首先引进3D打印机和扫描仪以及设计软件,并合理利用原有的投影仪和幕布电视机等会议设备。以3D打印为核心技术的创客空间也有望延伸拓展“江大-东风”校企合作、资源共享的深度及广度。
5 问题和展望
目前,数字图书馆的资源揭示可视化实践中存在以下几个问题:(1)地质大学(武汉)图书馆在RFID定位系统的显示模块是基于FLASH语言开发,而在移动端的运用中,苹果的IOS系统和安卓系统开发的App均不支持FLASH动画播放,只能退而求其次使用图片显示定位。[16] (2)国内高校图书馆OPAC系统的单一搜索框并不能有效整合纸本资源和电子资源,实现所有馆藏的一站式检索,包括清华大学、北京大学、华中科技大学、北京大学这些985高校图书馆的主页在内; 而国外如斯坦福大学和哈佛大学的高校图书馆主页上的单一检索框整合了所有馆藏资源,可实现傻瓜式一站检索,然后通过对检索结果文献类型的选择,实现分面聚合。后者更符合“互联网+”时代用户对一站式通用搜索引擎(如Google、百度)的使用习惯。[17] (3)由于经费短缺,江汉大学图书馆目前没有购买Web of Science TM核心合集这类权威英文数据库。该数据库的统计数据若结合CiteSpace、HistCite等可视化工具,并利用共词分析和共引分析的原理,能绘制信度和效度颇高的科研产出和领域热点方面的知识图谱,让图书馆知识服务的整体水平大幅攀升。武汉大学图书馆学科服務部每年发布的《ESI与学科服务动态》报告就是基于Web of Science TM核心合集的统计数据和知识图谱。这些数字图书馆在实践和探索中遇到的问题并不妨碍可视化技术在数字图书馆资源揭示领域中持续开疆扩土、大放异彩。
可视化技术在数字图书馆资源揭示中的应用不局限于馆藏资源的可视化,信息检索的可视化,学科导航的可视化,用户界面的可视化这四个方面。各种推陈出新、日新月异的可视化技术终将整合为数字图书馆知识服务的可视化。平面的可视化技术揭示了隐性知识脉络,为深度学习搭建认知框架,为管理决策提供实时参考;而立体的可视化技术实现了纸本资源的精确定位,珍稀馆藏的触手可及,以及从设计理念到产品模型的直线转换。可视化的概念外延从简单的线型关联扩展交织为多维度的知识网络,开拓提升为三维立体、身临其境的深度学习。人工智能技术将模糊实体馆藏和虚拟馆藏的边界,创造更生动多样的人机交互界面。
基金项目:江汉大学武汉研究院2017年开放性课题 “武汉高校图书馆开展学科知识服务的创新模式研究”(IWHS20172016)
参考文献
[1] Mayer-Schonberger V. 大数据时代[M].盛杨燕,周涛,译.杭州:浙江人民出版社,2013:193-232.
[2] 张宸,吴廷照,戴平,Ralph B.Gabbard,刘倩.大数据智能可视化在北美高校图书馆的应用研究[J].图书馆建设,2017(8):69-70.
[3] 邱均平,余厚强,吕红,李小涛.国外馆藏资源可视化研究综述[J].情报资料工作,2014(1):12-17..
[4] 孙倩.浅谈信息可视化在国内外数字图书馆资源揭示中的应用进展[J].图书馆界,2017(2):53-57.
[5] 李琪,曹国宏.RFID定位技术在图书馆的应用探析——以中国地质大学图书馆RFID时间项目为例[J].高校情报论坛,2017(2):44-47.
[6] Sen A, Dacin P A, Pattichis C. Current trends in web data analysis [J].Communications of the Acm,2006.49(11):85-91.
[7] 叶莉,凌征强.基于数据挖掘的高校图书馆信息服务[J].图书馆工作与研究,2017(5):73.
[8] 华中科技大学机构知识库[EB/OL]. [2018-01-24].http://www.irtree. cn/996/ aspx
[9] 标签云(Tag Cloud)[EB/OL]. [2015-05-24].http://en.wikipedia.org/wiki/Tag_cloud
[10] 倪娟.论标签云在高校图书馆学科知识服务中的应用[J].图书馆,2013(6):19.
[11] 赵晓黎,孙济庆,李楠.中外文献数据库资源与知识服务探析[J].现代情报,2016(8):5-6.
[12] 《新媒体联盟地平线报告》(图书馆版)[EB/OL].[2016-03-20].http://library.wiki.nmc.org
[13] 陆颖隽.虚拟现实技术在数字图书馆的应用研究[D].武汉:武汉大学,2013.
[14] 张媛.图书虚拟现实技术应用研究演进的可视化分析[J].国家图书馆学刊,2017(4):65-71.
[15] 乔峤.美国图书馆创客空间建设及其借鉴研究[D].武汉:华中师范大学,2016.
[16] 李琪,曹国宏.RFID定位技术在图书馆的应用探析——以中国地质大学图书馆RFID时间项目为例[J].高校情报论坛,2017(2):48.
[17] 姜婷婷,陈舜昌,高慧琴.大学图书馆OPAC系统搜寻路径的可视化分析[J].大学图书馆学报,2017(1):68.