基于数据耕耘理论的公共档案馆信息咨询服务模式探讨
2021-04-20何玉
何玉
一、理论研究背景
(一)理论研究
为验证选题的创新性与新颖性,本文采用文献计量学方法,选择中国知网为检索数据库,以“主题”为检索项,分别以“公共档案馆+信息咨询”、“公共档案馆+信息服务”作为检索词进行检索,以便从宏观上把握该选题的国内研究现状。截止到 2020 年12月3日,经过筛选,排除重复和关联性弱的文献后,最终得到51篇中文文献。通过对文献题名进行聚类分析,发现可将其研究内容划分为五类:网络环境下公共档案馆信息服务研究;深化公共档案馆信息服务宏观层面研究;公共档案馆信息服务均等化研究;公共档案馆信息服务绩效测评研究;其他相关研究。其中,结合相关理论模型探讨公共档案馆信息咨询服务的文章屈指可数,仅有3篇:闫晓玉[1]深入探讨了公共档案馆信息服务引入SNS(Social Networking Services,即社会性网络服务)的具体的应用模式及相关注意事项;雷晓庆、刘荣芳等[2]通过发放并分析公共档案馆网络信息服务Kano调查问卷和重要度调查问卷,提出相关管理策略;刘荣芳[3]利用Kano模型,更加深入的分析了公共档案馆网络信息服务要素。另外,经整理,国内以公共档案馆为研究对象,且内容涉及到信息服务的著作有三部:《我国档案馆公共服务研究》[4]和《公共档案馆管理研究》[5]主要探究了信息服务现状和提升服务能力的策略;《档案馆的现在与未来》[6]看似在展望档案馆未来发展趋势,实则探讨了信息服务目标。
(二)实践进展
本世纪以来,我国各级公共档案馆都在不同程度上实现了档案信息的开放服务,不再局限于到馆咨询和依靠利用者提出咨询问题进行服务的形式,而是逐渐转变为利用互联网技术建设网站、利用移动社交媒体平台等为用户提供更高层次的咨询服务。例如,天津市档案馆、北京市档案馆等开通了微信公众号;浙江省档案馆、南昌市档案馆和海口市档案馆等注册有新浪微博官方账号;山西省档案馆、河南省档案馆、石家庄市档案馆等建设有官方网站。从总体上来看,档案信息咨询服务虽取得一定进展,但绝大多数中西部地区的公共档案馆依然面临着个性化服务难、被动咨询为主、咨询问题回复时间长、咨询结果用户满意度低等问题,咨询内容“由提供档案文献向提供知识信息产品转化,由提供事实答案向指导和培训利用者转化,从随机咨询服务向调研性方向转化”[7]难以实现。
综上所述,国内学者关于公共档案馆信息咨询服务的研究成果不够丰富,特别是结合相关理论模型开展的研究较少。各级各类公共档案馆的档案信息咨询服务能力虽在发现问题、寻找思路和解决问题的过程中不断提升,但诸多现实难题仍未寻找到较好的解决方案。因此,注重引入其它学科领域的理论模型,并对其适用性展开相关探讨,既是理论完善的需要,也是实践发展的要求。
二、公共档案馆信息咨询服务引入数据耕耘理论的可行性
(一)数据耕耘理论
基于充分利用日益丰富的计算机技术资源优化军事战略分析这一出发点,Alfred G. Brandstein博士和Gary E. Horn博士于1998年正式提出“Project Albert”(艾伯特计划)的核心技术——“Data Farming”。国内学者于2007年引入这一概念,虽对其内涵的阐释趋向统一,但针对其中文释义,尚未达成一致,曾提出过“数据耕种”、“数据耕耘”、“数据耕作”等多种说法。笔者将采用“数据耕耘”这一说法展开相关探讨。
“数据耕耘是利用大型计算能力运行仿真模型寻找到以前不存在的信息和没想到的选择。”[8]从广义上讲,数据耕耘理论是一套系统且完整的方法论,包括播种(sowing)、施肥(Fertilizing)、耕作(Cultivating)、栽培(Planting)、收获(Harvesting)这一系列循环过程以及相应模型建立、数据可视化分析工具等。其中,数据播种是指寻找种子,即作战指挥员提出当前最需要解决的问题;数据施肥是指军事领域专家依据自身储备的理论知识和实践经验,收集解决种子问题所需的相关数据和应考虑到的关键影响因素;数据耕作是指军事领域专家在对士气、天气状况等诸多不确定因素进行充分考量,建立想定空间;数据栽培是指将影响因素转化为变量空间,并在这一空间中创建、运行模型,探索多种可能性结果;数据收获是指收集模型运行过程中所产生的数据,并加以分析,从而获得最优解决方案。从狭义上讲,“数据耕耘是一种确定后续数据分析所需要的数据集合的过程和方法,其目标是为了找出复杂问题的规律。”[9]
(二)应用可行性分析
1.数据耕耘理论已被引入档案学相关学科研究中
2013年,马费成教授結合当时的环境形势以及学科发展现状,提出了情报学发展的九大主要前沿性课题,其中之一就是“数据耕耘与知识成长”。而后,张兴旺[10]深入总结了数据耕耘理论的国内研究现状,并从大数据知识服务视角对该理论进行了解读;刘宝瑞等[11]将数据耕耘技术理念应用于图书馆信息咨询流程中,为咨询服务的研究和实践提供了新思路;胥伟岚等[12]在深刻剖析跨学科协同信息咨询服务实践问题的基础上,对应用数据耕耘理论构建崭新服务模式展开探讨;王晓燕[13]在数据耕耘理论启示下,提出了图书馆信息咨询服务的创新策略;唐晓波等[14]将数据耕耘理念应用于智能咨询服务模式的构建过程中,并从人机接口、咨询处理和知识管理三大模块加以分析。档案学、图书馆学和情报学在研究思想、研究内容、研究方法和研究成果等方面,都存在着一定的联系,可以相互借鉴和参考。三者在信息咨询服务的理论研究和实践进展方面存在着一定的共通性,因此,将数据耕耘理论引入档案学领域的研究中也是可行的。
2.数据耕耘理论与档案信息咨询服务的追求目标相一致
加拿大档案学者T·库克在第十三届国际档案大会报告中首次提出“档案后保管范式”,该思想的突出贡献在于提出“由原来的档案存取服务转为档案实体背后的知识服务”[15]的观点。知识服务是档案信息咨询服务的高级阶段,其核心理念在于坚持以用户为中心,以需求为导向,深入挖掘开发馆藏档案信息资源,并结合咨询服务人员具有的经验、洞察力等隐性知识,利用先进技术生成各种知识产品。但在优化公共档案馆信息咨询服务的进展中,我国仍以传统信息咨询服务为主,咨询者一般只能获得固定答案,即“是什么”。因此,将同样以知识服务为目标的数据耕耘理论引入崭新的咨询服务模式构建过程中,有助于进一步实现咨询过程与咨询结果可视化的服务目标,更重要的是可以为咨询者提供建设性的咨询意见,即“应该是什么”,真正做到“以人为本”。
3.数据耕耘理论与档案信息咨询服务过程的本质相契合
受学历背景、表达能力、环境氛围等因素的影响,绝大多数咨询者不能明确提出真正的咨询问题;同样地,受自身经验知识、理解能力等因素的影响,咨询服务人员以及相关专家在多数情况中也不能准确接收咨询问题。双方之间存在着严重的信息不对称问题,这在某种程度上决定了档案信息咨询问题具有较强的复杂性。公共档案馆的档案信息咨询服务是一个传递文献信息资源,转移知识信息的过程,该过程实质上就是对咨询用户所提出的复杂问题进行系统地鉴别、分析、处理、传递与反馈,最终为档案利用者提供优质有效的解答。另外,从本质上看,数据耕耘理论就是在播种、施肥、耕作、栽培和收获等过程的循环中,对可能会影响结果的各种不确定性、非线性因素进行反复计算、建模、仿真实验和数据分析,从而在整体上把握复杂问题,寻找到最优解决方案。由此看来,该理论与档案信息咨询过程的实质在一定程度上相契合。
三、数据耕耘理论下公共档案馆信息咨询服务模式的构建
(一)准备工作
基于数据耕耘理论构建崭新的档案信息咨询服务模式,公共档案馆需要先完成两项准备工作:一是建立健全数字化档案信息咨询方案库,即由档案信息咨询服务人员整理、优化、归类近二十年来本馆咨询问题的解答方案,并将其进行数字化存储;二是建立并完善数字化档案信息资源数据库。大数据库的建立是一项庞大又严谨的系统工程,应从以下四个方面着手进行:首先,组织人员对馆藏档案资源进行逐卷逐页或逐盘摸底,及时修复破损内容,统计应进行数字化的档案材料,并将其按照技术难易程度分类;其次,选择熟悉馆藏情况和熟练掌握互联网技术、云端计算技术等数字化技术的工作人员,组建成档案材料数字化工作小组,依据国家关于档案数字化的各项法律法规,统筹安排各项任务;再次,由本馆档案工作者完成技术含量低、可批量处理的档案材料数字化任务,将技术含量高、须逐一进行数字化处理的档案外包给优质档案服务公司,并派专门人员监督和指导该工作的进行;最后,在基本完成本馆档案资源数字化工作的基础上,与政府部门、其他档案馆等机构建立合作关系,充分融合其档案资源,建成真正意义上的“大数据库”。
(二)实施过程
1.数据播种——挑选咨询种子
数据播种是数据耕耘过程的第一步,即挑选合适的咨询种子。首先,咨询者通过指定邮箱、网站留言板、亲自到馆或其他方式提出咨询请求,档案信息咨询服务人员以及专家将接收到的咨询问题详细记录下来;其次,咨询服务者和专家组要充分利用实践经验和领域知识,在熟悉馆藏特色档案资源、总结本档案馆近十年来的咨询热点问题和关注档案学界学术研究前沿动态的基础上,罗列出档案利用者可能会提出的咨询问题;最后,整合咨询问题清单,建立“问题域”,并采用问题认知图、因果分析法等多种问题分析方法,对这些问题进行深层次客观分析,提炼出真正急需解决的咨询问题,进行播种。
2.数据施肥——解析咨询问题
数据施肥是数据耕耘过程的第二步,即解析咨询问题。档案信息咨询服务人员以及专家组成员在获得咨询种子后,应将其与数字化档案信息咨询方案库进行匹配,提出咨询方案。若该方案能够达到咨询者的预期结果,则将其传递给用户,咨询过程完成;若该解答方案不能满足咨詢者的需求,则需对种子进行施肥。其具体的执行方式为:服务主体需进一步解析咨询问题,将该问题所含信息与数字化档案信息资源数据库进行匹配,同时,应用矩阵图法、雷达图等多种分析法收集解答该问题所需的各种相关数据,并提炼出影响该问题解答的各种不确定因素、不可控因素,如服务能力、咨询双方的实时情绪、用户行为偏好等。
3.数据耕作——建立想定空间
数据耕作是数据耕耘过程的第三步,即建立想定空间。作为服务主体,档案信息咨询服务人员和专家通过运用开环法、蒸馏法、闭环法等多种定性分析方法和定量分析方法,对数据施肥环节中所提炼出来的可能会影响咨询结果的各种不确定因素和不可控因素予以充分考量,慎重筛选出需要重点关注的影响因素,从而建立想定空间。需要注意的是,想定空间建立后并非固定化,咨询专家与服务人员可随时根据用户需求对其进行多次创建与调整。
4.数据栽培——进行仿真实验
数据栽培是数据耕耘过程的第四步,即进行仿真模拟实验。在想定空间建立后,就需要对其进行深入探索分析。具体的执行步骤为:首先,档案信息咨询服务人员及各位专家将若干关键性不确定因素转化为变量空间,引入咨询种子之中;然后,设计并建立模型,采用Agent技术和云计算计算技术等数据耕耘关键技术方法执行仿真模拟实验,探究每一因素对档案信息咨询过程的整体影响,重点分析实验结果的异常值;最后,服务主体在综合考虑仿真模型执行结果的基础上,可选择是否结束模拟实验。若选择是,则在本次循环探索中直接获得咨询方案;若选择否,则需返回耕作步骤,继续调整优化想定空间,不断增强模型精细度,循环进行验证。
5.数据收获——获得结果空间
数据收获是数据耕耘过程的第五步,即获得仿真结果空间。将再次编辑调整的想定空间中所包含的各个不确定和不可控影响要素进行循环仿真模拟验证后,采用可视化、数据统计分析等先进技术,从模型中获得解答咨询问题的可行方案、近似最优方案、最优方案以及各个方案的适用条件。直至这些方案能够在很大程度上满足咨询者需求时,咨询过程结束,得到结果空间。服务主体要及时将这些指导性方案集整理收录至数字化档案信息咨询方案库中,供下一次的档案信息咨询服务参考借鉴。
四、结语
需要注意的是,播种、施肥、耕作、栽培、收获这五个步骤并不是相对独立的,而是相互联系、相互作用的关系,它们共同构成了数据耕耘的完整过程。这一系统分析方法强调循环仿真、协同合作,将其应用于公共档案馆的信息咨询服务流程中,有助于改善当前咨询服务的不足。但本文未对该流程中涉及到的相关技术进行深入分析,在后续研究中需要加强对这些技术的关注与了解,进一步提高论文研究质量。
参考文献:
[1]闫晓玉.SNS在公共档案馆信息服务中的应用初探[J].云南档案,2013(07):35-37.
[2]雷晓庆,刘荣芳,景娴.基于Kano模型的公共档案馆网络信息服务要素分类研究[J].档案学研究,2018(05):112-118.
[3]刘荣芳. 基于Kano模型的公共档案馆网络信息服务要素分类研究[D].山西大学,2018.
[4]张林华著.我国档案馆公共服务研究[M].上海:上海世界图书出版公司, 2019.
[5]周林兴著.公共档案馆管理研究[M].上海:世界图书上海出版公司, 2012.
[6]赵屹著.档案馆的现在与未来[M].世界图书上海出版公司, 2015.
[7]郭莉.探索档案信息咨询服务[J].山西档案,2009(5).
[8]林岩峰,包卫东,黄金才.数据耕耘方法[J].火力与指挥控制,2009,34(01):4-7.
[9]胡晓峰,杨镜宇,胡润涛.数据耕耘:一种基于协同的探索性仿真分析方法[J].系统仿真学报,2007(07):1651-1655.
[10]张兴旺.数据耕耘理论及其大数据知识服务视角解读[J].情报资料工作,2015(03):53-57.
[11]刘宝瑞,郭红晓.基于数据耕耘理念的信息咨询流程再造[J].图书情报工作,2015,59(24):33-38.
[12]胥偉岚,夏南强,陆俊.数据耕耘理论下跨学科协同信息咨询服务模式研究[J].图书馆学研究,2016(22):64-68.
[13]王晓燕.基于数据耕耘理论的图书馆信息咨询服务模式探讨[J].中国中医药图书情报杂志,2017,41(06):1-4.
[14]唐晓波,王蕊.基于数据耕耘的智能咨询服务模型构建研究[J].图书馆学研究,2019(09):67-73.
[15]齐虹,石慧敏.知识服务及其在档案管理中的实现[J].北京档案,2002(08):20-22.
[16]鞠儒生. 基于数据耕种与数据挖掘的系统效能评估方法研究[D].国防科学技术大学,2006.
[17]Gary E. Home, Theodore E. Meyer.Data farming. 2005, :1082-1087.
[18]马费成.情报学发展的历史回顾及前沿课题[J].图书情报知识,2013(02):4-12.
[19]周毅.知识服务:档案管理部门的新目标[J].中国档案,2002(05):48-50.
作者单位:辽宁大学历史学院