基于高校知识机构库建设中的大数据分析和利用
2018-06-25沈华根韦志辉
沈华根 韦志辉
摘 要:在当前的大数据爆棚的背景下,人们越来越多地感受到了信息资源给生活所带来的便利。但就现状来看,高校中建设的信息资源平台较少,已经建成的又难以保证数量和质量都可以持续性地增加,不能满足师生的大数据检索要求。文章阐述将大数据进行有效的收集和整理,整合建设可持续发展的知识机构庫平台的合理性。探讨既可以避免重复建设,减少成本,又可以满足不断发展变化的高校教学科研环境,达到提高资源使用率和学科创新服务效果的途径。
关键词:高校信息化;知识机构库;大数据
1 通过用户的大数据分析合理管理文献资源
大数据的分析对于当前高校数据管理来说是一项很重要的工作。面对海量数据,前期合理的分析可以将读者感兴趣的信息资源等浏览对象的记录进行统计和管理,用来确定现有的数字资源存在的价值、依据,以及未来可能需要继续增强的方面。海量数据中的每一项数据条目的浏览、下载量的记录看似微不足道,但将同一类数据记录与其他关联的、涉及的不同类型的数据记录通过软件进行合理的相互关联,通过大数据的结构化统计,把与浏览者关注的知识文献相关的共性与差异阅读信息的关键线索进行对比分析,对数据中的有效信息进行有序解读,实现对隐藏于数据中的知识结构与线索的归纳与推理[1],就可以得出该数据体系的在某一范围研究领域内的认同感和存在的价值。
在以往的信息资源使用率统计上,大多高校都是基于单个的文献数据库的统计。而用大数据技术进行分析,则可以通过获取到的数据浏览总量,如某一类学科数据库的点击量、某一篇文献的浏览量和下载量、推送新闻稿的阅览和转发量等,从中发现数据之间存在的组织和关联性、关键词、高频词等,把握住师生的使用习惯,对数据中出现的有效信息进行合理解读,从而对高校信息资源整体的被利用的程度进行客观的、可视化的评价。
所以将大数据分析技术用于建立高校的机构知识库平台,不仅将已有的科研成果进行数字化存储,还能为高校的学术研究提供数据的检索及下载使用、指定时间段的数据使用率分析、用户之间的学术交流、重点难点问题的解决等大数据分析服务。同时通过对学科优质资源的重新整合和利用,让许多学科在资源利用上有交叉有联合的部分可以借助平台优势进行优势互补和利用。好中选优,将有限的资金用于高校师生最需要的方面,避免重复建设,减少成本,提高利用效率。
2 建设一站式信息共享资源平台
高校作为国家科研力量的重要组成部分,其所任职的学者在各项科研活动中积累了大量的学术信息资源,如科研数据、论文专著、实体作品等,且每年学生的毕业论文、毕业作品,学校每年所发生的各项重大事件的记载等各项数据量都相当大。如果能够有效地将这些学术资源进行收集,在学校范围内或于一定范围内的高校一起构建一站式信息共享资源平台,则可以避免重复建设,提高知识成果的利用率,形成学术交流圈,共同挖掘、共享科研数据,共同促进知识的传播与再利用[2]。
从目前国内建设的实际情况来看,机构知识库平台的建设内容主要包含以下几个方面:首先是对本校内所有已经形成实际成果的历届师生科研成果进行收集,为这些科研成果进行数字化加工并按类别设立统一格式,购置大量的存储服务器用于存储这些数据。同时购置专用服务器并安装发布平台,为所收集到的资源进行一站式信息资源共享做好准备。其次,在构建一站式信息资源共享平台时,要注意其信息检索所覆盖的范围不仅仅局限于本校的科研成果,还应实现主流数据库、高校自建数据库、一定区域内高校之间的信息共享,实现跨机构、跨数据库、跨校区、跨区域的信息共享[3]。只要搜索想要查询的关键词,就应该能从各个数据库中查找到跟此关键词相关的信息,而不再需要到每个数据库中去单独查找。以达到更快更全面地为用户提供所要查阅的检索信息的需求。
3 建设知识机构库平台的主要特色需求
3.1操作界面简洁实用、人性化
在购买或自建服务平台时,都应当遵循一条原则,即平台需具备简洁实用、人性化、以用户的实际操作需求为目的。之所以平台必须遵循上述原则,是因为平台不是单纯的程序,如果不从用户的角度出发,则有可能导致不被用户欢迎。更何况使用平台的用户大多没有受过系统的计算机教育,对平台的使用不熟悉,即使遇到简单的问题也不知如何解决。所以该学科服务平台应当以最为简单有效的方式让用户知道使用的方法,用“傻瓜式”的输入搜索就可以轻松找到自己想获取的知识信息,搜索到的信息可以根据用户需求呈现出条目式或图表式的结构,并提供多样化的下载方式。
3.2发展符合用户需求的信息服务系统
目前国内还缺少较为成熟的知识机构库平台,很多数字化资源被单独购买了之后因各自元数据标准的不同等因素只能提供单个简易的浏览和检索,还无法做到在一个平台上的整合和服务。所以平台底层一般采用半结构化和非结构化元数据仓库,主要是实现对文档、表格、图片、视频、音频等非结构化数据资源的集中存储。同时要为存储的数据制定统一的数据标准,满足后期建设中统一管理运用的需求,为未来有可能的其他数据库的数据加入提供标准上的统一化建设管理。
3.3平台技术的特色性、兼容性和可发展性
在平台建设过程中,应充分结合本校的实际情况,尤其是对本校的特色学科、重点学科着重分析整理。接下来针对学校专业结构与特色,制定符合本校专业特色的平台的详细需求,并和参与建设的软件公司合作,联合搭建定制的平台功能模块。由于各种学科资源所呈现出来的特性越来越多元化,应当将可以数字化的本校资源,包括非结构化数据,例如教师专著、专利、科研成果、硕博论文等;文献以外的各种媒体资源,例如图片、音视频、空间实体物品等,都要进行数字化处理,再统一建成一个可以汇集各种优质资源的学科平台,实现对本校学科资源的整合、管理和共享。
另外知识机构库平台的一项重要功能就是它的综合检索发现能力。现在的资源平台不应当局限于一所学校单独建设的层面上,还应当整合进其他已经购买的资源或其他学校的科研成果。系统的检索发现能力则体现在,不仅可以以学校原来已经收录的文献的全文进行检索,还可以通过数据索引功能、检索结果联想功能、数据仓储管理等技术对使用者所要检索的关键词进行有可能的检索结果优化推荐。另外在兼容性方面要开放标准服务接口,允许其他的数据平台的数据通过数据清单的形式进行自动对接,方便更多的资源在该平台中被一次性检索到,提高所建资源的利用率。
4 高校应拟定知识机构库平台的建设管理办法
要搭建一个功能完善、使用方便的知识机构库平台,并不是一件容易的事。在面对当前信息技术不断进步的大背景下,如何去选择一款真正适合高校自身学科发展的平台,使其发挥最大的作用,同时在技术上保持先进性和可靠性,是一项较为专业和艰巨的任务。同时平台搭建需要学校层面的统一决策和规划,首先要认识到平台的搭建确实能为学校的学科建设带来好的、积极的一面,愿意拨款或设立专项资金来保证项目的开展。并且在建设过程中需要涉及各个二级学院对于本学院相关已有学科、专业的科研成果的收集整理,为确保能够顺利完成还需要学校层面对这项工作进行推进。
在平台建设中期,应当鼓励全校师生,尤其是教学和科研一线的教职工共同参与资源的建设、开发与利用,拓展数字资源的采集渠道,实现师生对自己科研信息的管理、发布和共享。在为一线师生提供学科服务的同时,也为学校在学科信息大数据的建设提供支持。如果可以延续这样的建设模式,则有助于为学校建设出具有本校专业特色、拥有自主知识产权的数据库资源。当平台构建区域成熟后,还可以在此基础之上建设移动门户管理和应用系统集成等,为高校科研成果的积累做强有力的数据和服务保障。
在平臺建设完成后,并不意味着工作的完成,而是一项长期工作的开始。平台的日常维护需要专人管理,每年都需投入相应的精力和资金对平台进行维护更新,保证平台始终可以不断发展。这就需要在建设初期就制定一系列管理办法,例如建设的目标设立、资源的标准化管理、每年所投入的专项资金的设立和来源办法、平台建成后的培训推广计划等,都需尽早落实并在后期彻底贯彻下去。同时,资源平台的内容持续性建设、平台使用的促进机制也是需要考虑到的。平台搭建出来,如果无法获得持续的内容更新,或者无法应用到高校师生日常的实际需求中,就有可能被遗忘。对于平台的推广和使用方法也要落实到每个学院分管领导、专业系主任、骨干教师、学生会主要成员中,达到推广宣传的作用,避免高校师生对于知识机构库平台这种新兴技术理解不足,减小平台的使用难度。
5结语
总的来说,高校要建设具有本校专业特色和独立知识产权的知识机构库平台,必须首先有大数据时代高校知识资源数字化建设的意识,和这样的投入和建设给未来高校学科建设带来的帮助。在建设中除了充分利用现代化计算机技术、购置知名设备品牌外,还应当构建人性化、智能化、兼容性强的平台,同时借此对学校已有的科研信息进行整理收集,提高学校工作人员的专业技能,为创造更好的科研环境打下良好的基础。
[参考文献]
[1]张颖.大数据时代高校图书馆信息资源管理的创新与发展[J]武汉理工大学学报(社会科学版),2015 (3):449-452
[2]孙骁骁,韩海涛.大数据时代图书馆服务创新研究[J]图书情报工作,2015 (12):28-30
[3]叶莉,凌征强.基于数据挖掘的高校图书馆信息服务[J]图书馆工作与研究,2017(5):70-74.