数字人文时代图书馆地方文献大数据分析平台建设研究
2020-10-15崔阳兵
崔阳兵
摘 要:文章分析了数字人文时代图书馆地方文献的特征,并从地方文献数据源、地方文献大数据采集与分析、文献过滤与价值提取、地方文献大数据分析结果可视化表达等角度阐述了图书馆地方文献大数据分析流程,最后提出了地方文献大数据分析平台构建策略,以期为相关研究提供参考。
中图分类号:G250文献标识码:A文章编号:1003-1588(2020)09-0112-02
关键词:数字人文时代;图书馆;地方文献;大数据
在信息技术的带动下,数字人文应运而生,数字人文是指用计算机技术处理和分析传统的人文研究资料,并将人文学科方法论与计算工具相结合进行人文研究[1]。图书馆作为重要的知识服务机构,在地方文献资源的搜集、存储、使用方面发挥着重要作用。使用大数据技术对海量的地方文献资源進行处理,从中挖掘出有价值的数据资源供用户使用,可以有效提升地方文献的使用效率,更有效地发挥出地方文献的学术价值、历史价值[2]。同时,数字技术与人文社科研究的有机结合使图书馆的地方文献资源存储方式由传统的纸质存储向数字化转变,大数据技术分析平台的建立也为图书馆地方文献的量化分析和智能处理奠定了基础,使图书馆可以为用户提供更高质量的服务。
1 数字人文时代图书馆地方文献的特征
数字人文时代的一个重要特征就是将数字技术与人文研究结合在一起,使地方文献成为重要的数字化资源。大数据环境下,图书馆地方文献的特征体现在分析对象向数字化方向转变以及分析方法向智能化和多样化方向转变两个方面。
1.1 地方文献向数字化方向转变
图书馆传统的地方文献分析首先需要搜集原始资料,为了将纸质载体的地方文献搜集起来,图书馆员要耗费大量的时间和精力。面对数量庞大、浩如烟海的地方文献资源,图书馆很难搜集完整,并且传统的文献分析方法效率低下、手段落后,很难从地方文献中挖掘出有价值的资源[3],同时也很难验证文献的真实性,从而导致后期用户在使用地方文献过程中出现问题。数字人文时代,大数据技术的出现在很大程度上解决了图书馆在地方文献分析方面存在的问题。依托大数据分析平台对地方文献资源进行搜集、分析、挖掘,将传统的文献处理方式转化为大数据数字化分析方式,可以促进分析对象向数字化方向转变,使分析结果更具真实性、客观性、可靠性。
1.2 分析方法向数字化和智能化方向转变
在数字人文时代,地方文献资源逐步实现了数字化,图书馆对于地方文献资源的分析方法也逐步向数字化和智能化方向过渡。传统模式下,图书馆对地方文献资源的分类对比、逻辑分析主要通过人力完成[4],而地方文献大数据分析平台主要通过大数据技术对地方文献进行分析与挖掘,对挖掘出来的知识资源进行加工和重组,从而发现地方文献资源背后潜在的规律。数字人文时代,图书馆只有改变原有的地方文献资源分析理念,才能拓宽研究范围,为用户提供更有效的服务。
2 数字人文时代图书馆地方文献大数据分析的要求
2.1 结合地方文献的特点进行分析
不同种类的地方文献资源对数据处理效率、数据处理精准度有不同的要求[5],因此,图书馆在利用大数据分析地方文献的过程中,需要结合其特点、种类,采用适当的分析方法与分析策略。
2.2 掌握用户的实际需求
在对地方文献进行大数据分析的过程中,图书馆只有根据地方文献的特点制定合理的大数据分析策略,才能提高地方文献采集、利用、管理的效率和有效性,从而实现地方文献分析对象、分析策略和分析结果的有机统一;只有根据用户的实际需求选择适合的大数据技术标准并构建合理的数据处理机制,才能保障地方文献资源分析结果的质量[6]。
2.3 规避分析过程中可能出现的风险
大数据背景下,由地方文献组成的海量资源数据呈现出数据规模快速上涨、数据分散存储及不同结构种类数据协同融合的趋势,导致地方文献资源的管理、分析、存储、传输难度加大。同时,伴随地方文献资源规模的不断扩大和种类的增多,地方文献资源呈现出价值密度低以及无用数据比例上升的现象。此外,大数据分析平台的结构、大数据分析人员的技能、数据预测分析软件的可用性以及用户满意度都成为影响图书馆地方文献大数据分析效率和风险控制的重要因素。
3 数字人文时代图书馆地方文献大数据分析流程
数字人文时代,图书馆地方文献大数据分析流程主要由地方文献数据源、地方文献大数据采集与存储、文献过滤与价值提取、知识发现、地方文献数据分析结果呈现五部分组成,详见图1。
地方文献数据源主要由图书馆馆藏资源、地方文献数据库、地方知识文化网站等组成。大数据背景下,图书馆主要通过云计算、云存储、数据集成等技术对地方文献数据源进行采集与存储,在这个过程中要尽可能提高价值密度,降低大数据分析平台的负荷,同时要对提取的文献数据资源进行深度挖掘并根据用户需求进行精准匹配。此外,图书馆还需要将数据资源转化为可供用户使用的形式并推送至用户。
4 数字人文时代图书馆地方文献大数据分析平台构建策略
4.1 增强图书馆对地方文献资源的分析能力
在对地方文献资源进行分析的过程中,增强图书馆的分析能力是为用户提供科学高效知识服务的前提和基础。首先,图书馆要使用大数据技术对用户使用地方文献资源的需求、内容、方法、模式进行分析、预测、判断;其次,图书馆要确保大数据分析平台在分析地方文献资源过程中的安全、有效、可控;再次,图书馆应选择科学高效的算法工具提取地方文献资源中有价值的部分;最后,图书馆地方文献大数据分析平台要具备实时分析能力和可视化分析能力。
4.2 提高大数据平台的分析、存储及处理能力
数字人文时代,地方文献资源的来源具有多样性,因此,首先,图书馆地方文献大数据分析平台应具备良好的智能化管理功能,能对海量地方文献资源进行采集、存储、挖掘、运算、分析以及配置;其次,随着图书馆地方文献资源总量的快速增长,图书馆应构建满足大数据平台实时分析和即时传输需求的网络,保障大数据资源存储管理的高效、便捷、安全;再次,图书馆要重视提升地方文献大数据分析平台的分析能力,在保障大数据资源安全可靠及快速传输的前提下,优化大数据分析平台的结构,使地方文献大数据分析平台的运算能力得到有效提升。
4.3 提高地方文献资源的科学性
数字人文时代,图书馆只有保障地方文献资源具有较高的可靠性和科学性,才能实现对地方文献有效的分析,从而使大数据分析结果更加全面和科学。首先,图书馆既要对地方文献资源进行采集,又要对其进行有效存储。其次,图书馆应建立科学的地方文献资源储存和分析流程,保障地方文献大数据资源存储的可靠性和分析的可行性。再次,图书馆应对大数据资源进行有效过滤和深度价值挖掘,构建符合图书馆地方文献服务需求的大数据资源分析流程。最后,地方文献资源大数据分析结果应具备可靠性和可用性。可靠性是指保障地方文献大数据的来源与大数据分析结果是可靠的,在地方文献大数据分析过程中应避免出现经验主义的现象[7];可用性是指地方文献大数据分析平台提供的分析结果是可用的,能满足图书馆的服务需求。
5 结语
數字人文时代,用户对图书馆地方文献服务的质量、内容和模式都提出了更高的要求。在此背景下,图书馆只有了解用户需求并对地方文献资源进行深度挖掘与分析,才能为其提供更有价值的服务。
参考文献:
[1] 陈红彦.古籍文本数据格式化比较研究[M].上海:上海远东出版社,2017:93-96.
[2] 徐俊.论大数据环境下公共图书馆地方文献数据服务体系的构建[J].图书馆研究与工作,2017(5):60-63.
[3] 王娟.云计算环境下地方高校图书馆区域特色文献保障体系建设与服务模式探讨[J].农业图书情报学刊,2014(10):24-28.
[4] 王亮亮,齐月.大数据环境下黑龙江地方文献资源的开发与保障体系研究[J].图书馆学刊,2016(6):42-44.
[5] 孙军.大数据时代县级公共图书馆数字化创新发展研究:以阜宁县图书馆地方文献数字化建设为例[J].文教资料,2015(20):56-57.
[6] 侯勇,王护宁,徐俊.大数据背景下公共图书馆馆藏地方文献利用的探讨:以安徽地方戏曲文献为例[J].大学图书情报学刊,2016(3):84-87.
[7] 刘海燕.大数据环境下地方特色数据库的建设:武汉城市文化文献数据库建设探析[J].科技通报,2018(7):280-283.
(编校:周雪芹)