数字人文视角下人文研究者利用档案馆藏的行为与激励研究*
2020-07-17
(吉林大学管理学院 长春 130022)
0 引言
数字技术的成熟为人文与社会科学研究领域带来新的机遇。在数字人文热潮下,档案馆藏作为文献存储与记忆的手段受到重大影响[1],并产生了连锁反应。数字人文作为一种新的理念模式和方法,对档案学研究和管理实践产生了深刻的影响。数字人文不仅为档案资源的组织与服务提供了新的方法体系和组织范式,还为档案机构和研究者之间构建了新型的合作关系。但是与此同时,人文研究者与信息提供者在对数字人文的认识上仍存在一定的偏差。[2]在对于数字人文的态度上,信息管理学科和人文学科出现了迥异的状态。人文学者对于数字人文的态度大多持谨慎的态度,需要包括档案馆在内的馆藏机构加强与人文研究者的沟通,缩小认识层面的鸿沟,加速信息和认知对称的过程,促进用户与信息机构之间的融合进程。所以加强对利用档案馆藏进行人文研究者的研究,不仅有利于档案工作者进一步明确人文研究者的需求,识别影响用户利用馆藏资源的关键影响要素;还有利于档案机构为研究者提供更加精准性、个性化的定制服务。因此,本文试图通过已有的行为理论模型,及实地访谈和问卷调查,对收集到的文本、数据进行分析,确定行为影响因素模型,并最终根据模型提出改善人文学者利用数字化档案行为的对策,为能有效激励广大人文学者利用档案馆藏资源提供夯实的理论基础,同时也为更多数字人文背景下档案馆的用户培育与服务工作提供实践依据。
1 相关文献研究
1.1 数字人文相关研究
笔者以 TS=digital humanity* AND TS=(volunt* OR crowds* OR public NEAR/0 participation)为检索语句在 Web of Science 核心合集检索,限制研究领域后共得出文献 94篇。通过VOSviewer软件绘制领域共现图,如图1所示。国外与数字人文有关的研究更倾向于应用,理论研究内容相对偏少。
图1 国外数字人文领域关键词共现图
笔者在中国知网等中文数据库以“SU= ('数字人文'+'数字人文相关' )”为检索语句并以2015-2020作为时间范围检索,剔除不相关文献后,得到文献共411篇。将文献列表导出并通过VOSviewer软件对主题词汇进行可视化分析,如图1.2所示。通过演化再现功能,笔者发现近五年数字人文研究者的发文主题发生显著性改变:从2015年的“数据库系统”、“数字存储”和“资源建设”到2017、2018年的“数字图书馆”、“社会网络分析”、“知识图谱”等,又演变为数字人文研究者近两年对“开放数据”、“智慧图书馆”、“人文学者”等热点主题的研究。
图2 国内数字人文研究共现图
近年来,对数字人文的研究和各项实践活动进行的如火如荼,取得了引人注目的成绩。尤其是2004年以来,数字人文作为一种“流派”或者工具应用,在国内发展迅速。复旦大学历史地理研究中心与美国哈佛大学东亚系等机构合作建立了中国人口地理信息系统[3],武汉大学的历史学院与武汉大学国家遥感工程重点实验室展开了紧密的有关考古勘测的技术合作[4],北京大学中文系开发了全唐诗电子检索系统[5],中国国家数字图书馆工程建设了包括馆藏甲骨实物与拓片数字化资源库[6]和敦煌遗珍数字化资源库等多个数字人文资料数据库[7]。武汉大学、清华大学、南京大学、台湾大学等众多高校也建立了数字人文研究机构,中国社会科学情报学会也成立了数字人文专业委员会[8]。另一方面,对数字人文质疑的声音似乎亦从未停止。在第九届上海国际图书馆论坛—数字学术与人文研究会议上王雪茅先生曾提出传统的人文学者对待数字人文的不接受态度[9];上海图书馆夏翠娟在数字人文的浪潮下提出了对数字人文发展的质疑和冷思考[10];美国佛罗里达国际大学法学专业教授斯坦利·菲西认为数字人文的发展可能会增加传统人文学科被淘汰的风险[11]。另外,还有一些学者对其持保留的态度。林施望认为人文学科还是应该继续作为数字人文的落脚点[12],而部分计算机网络技术应当依附于人文学科;黄水清也坚决主张人文计算的终极目标是解决人文科学方面的问题[13],而计算机软件技术则是解决问题的手段,而提升技术的目的是为了提升问题解决的效率,而不应该作为向人文研究群体炫耀技术的资本;我国著名历史学专家黄兴涛则是站在历史学科的角度上,表示了现今的历史研究者应当在保持历史学科优良传统的同时顺应数字人文的发展[14],以求学科的稳健发展。
由上述的研究可知,人文研究者对数字人文的态度和行为倾向,是影响数字人文发展的重要因素。研究人文学者的态度和行为,就是对“用户-资源-服务”范式中用户的深入探讨,只有对用户的行为进行深入的分析,才能准确识别将哪些类别的资源进行组织和加工,或以什么样的形式提供给用户进行利用。因此,研究者的行为研究,是数字人文研究中重要的一环。
1.2 档案用户行为研究
“档案用户”一直以来都是档案界研究的热点,档案学界围绕档案利用原理、档案利用方式和档案用户需求这三大方面展开了一系列的研究。根据图3近十年来的热点趋势走向,我们不难发现,近年来档案研究围绕“档案用户行为”衍生出来的研究重点不胜枚举,其中包括“用户需求”、“档案服务”和“信息不对称”等多个方面。档案用户研究是一个集合概念,涵盖了多样化的研究对象和研究主题,不同的研究者从不同的侧面对这一研究主题进行揭示。既包括用户心理、有涵盖用户感知体验、还包括了对用户本身的结构区分等。
图3 以档案用户行为为主题的研究热点趋势图
如在2011年王运彬在《档案学通讯》梳理了从2000年到当时的档案用户需求的变化[15]。吴琼以《档案用户利用心理研究》作为毕业论文课题,结合现阶段国内的档案用户对档案的利用现状[16],详细剖析了档案用户对档案资源的利用心理,并探究了档案机构及档案的利用环境对档案用户利用馆藏行为心理的影响。再如2017年杨乐乐基于档案用户群体的行为对档案公共服务质量进行了分析[17]。本文将在众多档案学者的研究基础上,将档案用户需求、用户行为以及档案利用心理联系起来,分析人文学术群体对数字化档案馆藏资源的利用行为,并研究针对此利用行为,档案机构的有效激励措施。
1.3 研究评述
档案学界对于用户的研究大多基于定性的描述,而相对系统的调查研究和实证研究较为少见。这可能与档案用户的广泛性、多元性特点相关,比较难以获得有针对性的数据。基于此,因此本文从人文研究者角度出发,尝试采用定性与定量相结合的方式,先利用扎根理论方法选取人文研究者作为访谈对象,通过编码得到行为模型的主要影响因子,再通过问卷调查和数据分析等定量研究的方法进行影响因子的合理性检验和修正,得到最终的档案馆藏利用行为模型,以便能够准确勘定用户的行为,从而采用有针对性的激励措施。
2 人文研究者利用数字档案馆藏行为的S-O-R模型构建
2.1 对人文研究者的访谈设计
在研究对象选择方面,本研究选择对数字化档案馆藏有实际利用需求的人文研究者作为调研对象。为确保研究样本的访谈资料能够全面客观地反映研究问题,此次研究的样本选择必须严格遵循以下的三个原则:
(1)本次研究选取的受访者必须是典型的,从事人文学科工作的研究者,并对数字人文产品有一定的了解;
(2)受访人员的性别、年龄、学历、从事研究年限、职业和地域分布上需按照合适的比例随机设置,以便消除受访对象群体单一化对研究结果带来的影响;
(3)受访人员在受访前必须对本研究小组成员提供的数字人文产品示例(本研究以北京大学信息管理王军老师及其团队开发的宋代学术师承关系数字平台)[18]进行试用。
在访谈方式方面,本研究采用线下与线上相结合的方式进行。线下访谈,即在现场进行面对面访谈,该方式有利于对受访者进行更细致地观察,便于根据现场实际情况问题对访谈问题做更进一步的延伸,以此获取更深层次的访谈内容;线上访谈主要是借助网络交流工具(微信、QQ 语音或电话方式)进行在线访谈,该访谈方式的优势在于能给受访对象留出更充裕的思考余地和回答时间,除此之外还能根据不同的受访者对访谈问题进行不同程度的发散和丰富。
根据扎根理论对样本选取的要求,鉴于笔者在研究过程中受限于地理条件、人脉关系等因素,本研究的研究访谈对象包括了来自:吉林大学文学院、吉林大学考古学院、东北师范大学历史文化学院、南开大学历史学院、天津师范大学历史文化学院、陕西师范大学历史文化学院等高校的从事历史人文研究的学者。其中包括教授、副教授、讲师、博士研究生、硕士研究生,年龄覆盖20-55岁。本研究采用了一对一的访谈形式对所选取的人文学者进行开放式访谈。访谈数据收集的起止时间分别为2019年12月和2020年2月,历时近三个月。访谈活动后期由于受全国新冠病毒疫情的影响,最终对10人进行线下访谈,对8人进行微信/QQ语音访谈,访谈时间10到20分钟不等。
笔者将记录访谈过程的录音材料转换成文本资料,并利用Word等办公软件对文本内容进行标引和初始分析,再将由初始分析所得结果利用NVivo软件进行抽象化分析编码,最终生成初始理论模型。笔者通过对这18名受访者的访谈内容进行整理和筛选,并对其中表达无效、表述模糊和偏离主题等无效内容进行剔除,最终获得了4.5万余字的文字记录。这18名受访者的个人基本信息统计如表1所示。
根据受访者的个人基本信息与科研领域、接触过数字人文的频次、使用数字人文工具的体验、对数字人文的态度和看法以及对数字人文未来发展的期望等重要元素,设计访谈提纲,具体如下:
第一部分为关于受访者基本信息的调查,其中包括对受访的人文研究者年龄、研究方向、研究身份(包括教授、讲师、研究员、学生)和最高学历(包括博士、硕士、本科)的调研。
第二部分是受访者对数字人文认知度的访谈,具体问题如下:
(1)您在日常开展人文研究工作时是如何利用档案馆藏资源的,会借助一些数字技术手段吗?若有,则有哪些?
(2)在您以往或正在进行的研究中,您是否有和计算机软件专业或从事其他理工学科工作的工作者合作的经历或想法?
(3)您对数字人文有着怎样的认识和看法?
第三部分是人文研究者对数字人文的体验满意度(在笔者研究小组向受访者展示相关数字人文产品后提问)调查,具体问题如下所示:
(1)您是否愿意使用更多的如访谈小组所示的数字人文产品?
(2)您通过此类数字人文产品收获和获得的价值是什么?
(3)您认为数字人文产品对您的研究产生怎样的影响?
(4)如果请您为该数字人文产品的服务方面提出一些改进意见,您的想法是什么?
(5)请您对以上的访谈内容谈谈自己对数字人文的理解和态度,也可以和访谈提问者谈一谈未来数字人文可能会对人文学科产生哪些影响。
表1 受访者信息统计表
2.2 质性分析
2.2.1 开放性编码
开放性编码作为扎根理论方法的首个步骤,需要以尽可能详细的原始资料为基础[19],对所获取的原始资料中对关键字句赋予概念,进而通过对初始概念的比较和筛选,在含义相近或相同的初始概念中提炼出更具有概括性的范畴,实现对原始资料的概念化和范畴化[20]。本研究采用了扎根工具NVivo11软件就访谈记录的原始语句进行开放性编码,生成初始概念。在对初始概念的提取后,笔者将含义高度重叠的概念合并,并剔除其中出现次数少于两次的初始概念,最终获得了102个初始概念。进一步整合这些初始概念得到47个范畴。初始概念和范畴的具体内容如表2所示:
表2 开放性编码初始结果表
3 技能手段 a16 得益于信息检索的多样性; b21 个人技术有限4 教学传播 j30 日常教学不多; d11 教师介绍少5 研究需求导向 e25 研究需要时会自学; m13 学科需要; d9 导师要求6 个人兴趣导向 h23 对技术感兴趣; r24 研究兴趣到技术乐趣的转移7 主观激励作用 e19 便于研究; f28 困难不影响作为; a25 便于对动态发展的窥探8 工具可用性(主观表述) i13 信息检索重要性; m31 工具性9 产品功能(主观叙述) r16 可视化; f17 有助于对理论的细化10 软件操作难易度 h27 较熟练应用; f20 易用11 研究偏差 c19 内容争议的部分模糊; k11 史料误读现象12 信息准确度 b39 内容大多可靠; g33 机械化错误常见13 量化分析程度(主观表述)a26 有大数据成分; f20 历史演化直观性; d24 宏观动态14 技术支持角度 j21 目前尚未成熟; k35 文理对接的实现指日可待15 视角多元化 g17 提供更多学科视角; n15转换形式的产生; o27 有助于对其他领域的了解16 学科交叉程度 a23 跨学科合作; d20 软件学科的协助; o10 综合性学科17 资源广泛程度 q27 扩张信息来源; h15 单一方面资源丰富18 文献数字化 e20 便于阅读和查询; c32 电子文献19 人性化服务 i19 配备专业人员; r29 平台更新维护20 工具必要性(主观表述) a29 有必要应用; c27 未来研究的必需品21 被动认知 b33 数字人文潮流驱使; e30 研究群体必要工具22 主动认知 f26 对数字人文感兴趣; r7 关注多23 研究团体激励 a34 鼓励学习; h31 愿意推广24 政策扶持 k24 学院定期培训; n30 无具体措施25 信息资源激励 p20 文献史料来源广泛; l17 数据的类型多26 软件局限性 q28 各个软件存在问题不同; r33 检全率不高27 资源制约 k26 众多付费数据库; o20 资源不足; m15 资源不公开28 学习条件制约 i29 相关培训机构稀缺; n33 学习不深入
29 专业条件限制 q8 无计算机软件专业背景; a36 考古学科应用较多30 积极性削减 d29 计算机技术不过硬; g34 无系统激励31 效率评价 a17 便利但不准确; e21 效率较高32 学习时间成本 b17 省时; d22 部分软件操作繁琐耗时33 未满足研究需求 g39 无法机械化识别; a21 无法满足更深层次研究34 产品需求 j30 自身需求; r28 学科需求35 产品实用性 e12 门槛低且实用性强; h25 服务性质36 提倡科技黑箱 a40 扬长避短; f22“傻瓜式”平台37 使用认同感 p28 认可数字人文; m17 支持数字人文技术38 热点趋势 a41 大势所趋; i32 发展壁垒将降低39 模范效应 f26 帮助他人; b38 鼓励他人40 研究群体支持 c29 无人排斥; e31 收益大41 普及度 l27 普及度不高; o37 数字人文产品需要大家的分享42 经验借鉴 f29 互相学习; q34 学科经验分享43 过程期待 f37 期待产出结果更好; n35 期待平台更全面44 自主解决 c13 倾向自搜; f11 大多自学45 技能驱动 h28 培训价值; o38 技能学习; q35必备技能考察46 成果信服度 a43 结论权威性; d41 认可度高47 研究过程支持 i30 方便我做出成果; l14 能使我研究过程更加简便
2.2.2 主轴编码
笔者挖掘以上的各个范畴含义的潜在联系,围绕着轴心概念对上述47个初始概念进行整理和分析,进一步得到了人文研究者的个人属性、数字人文传播途径、数字技术使用动机和数字人文产品体验等主轴编码共16个。各初始范畴(即开放性编码所得范畴)与通过主轴编码得到的主范畴之间的关系(并附访谈中各编码的代表性语句)如表3所示。
表3 主轴编码过程结果表
教学传播 老师在本科期间给我们讲课,介绍的不是很多,不过也列举过。需求导向性传播你看当我们做考古的调研时,就会觉得你的人物迁徙视图的平台很有参考价值。我们会看,但不会以此作为决断。个人兴趣导向 王军老师的这个平台我也试用过,虽然内容不多,但是做得很好,我甚至想把它继续扩充。主观激励作用这种数字人文产品对于我们来说虽然已经不算新鲜了,但是我个人是很倾向于接触更多的且有更多种功能的小软件的。工具可用性 当然可以提升我们研究效率,毋庸置疑。产品功能 功能设置还是很有针对性的,既有家族关系选项,也有师承关系。你给我们的这个产品,你看这个就是英文的界面,对于一些英语基础相对薄弱的学者用起来可能相对吃力,但是基本功能可以很快上手。研究偏差 有时候研究分析得出的结果,并没能达成我的预期效果。软件操作难易度信息准确度 不能抱有百分之百的信任去过分依赖这个数据,也有可能有纰漏。量化分析程度 数字很精准,个人认为这也可能是数字人文产品一大优势吧,量化效果很清晰直观,不模糊。技术支持角度对于文献考古类的研究者,可能你们的数据库就不那么准确充实了,往往都是越有经验就越能精准地解读其中的文字内容。视角多元化我要夸它这个平台的第二个方面,就是它能给我们呈现出多元的、更广阔的宏观视角来审视一段历史的动态发展过程。学科交叉程度 像我们考古学本身就是一个很综合的学科啊,地理、土木、语言,哪怕是美术,甚至音乐,都有涉猎。资源广泛程度 现在的这些平台的资料远远不够我们的需求,未来是一定要有专人去做扩充完善的。文献数字化我猜你所提到的文献数字化,一定是近代文献,古籍就很难了,图像也很难识别的,只能是我们的古籍工作者一点点弄。人性化服务什么时候操作可以更便利了,资料更全了,功能更多了,什么时候这个平台对于我来说就算人性化了。2 传播途径3 使用动机4 产品体验5 多学科集成
工具必要性(主观表述)我认为数字人文产品在植根于数字人文理念的同时也在推进这种理念的发展,所以是这种产品能让我们实实在在体会到更好的前景。被动认知 很多都是校图书馆开讲座,其中又有很多是有强制性,我们才去听的。主动认知 觉得学会这种技能会很“高大上”,还可以提升自己的科研能力。研究团体激励 我们是没有这种奖励的,当然如果你自己创造一个就另当别论了。政策扶持希望咱们国家的社科基金委、教育部基金委还有其他教育部门,能专门设立专门的数字人文专项来给予这一方面的促进。信息资源激励 其实这种数字人文产品我有专门去搜寻过,有但是不多,不过质量真的都不错。软件局限性我觉得我们还是应该学习一下怎么去接手或者扩充这些平台的数据库吧,否则恐怕这个平台很难为历史学大众所接受和使用。资源制约据我所知明清史的数字人文专项有做的很不错的,但是之前,尤其是隋唐之前我知道的文献保留就不是很好,更何况是这个范围的数字人文程度呢?学习条件制约 技术上的层面吧,我们还是不怎么懂,类似行业壁垒。专业条件限制因为我们这个学科群体计算机基础普遍薄弱些,所以想做出些技术上的突破,只能寻求其他行业朋友们的帮助。积极性削减 像这种学又不好学,只能用一用现成的,很打消我想继续改进、探索的积极性的。学习时间成本 学习功能的时间不会很长,感觉还可以。效率评价 学习技术的时间很可能大于我在自己领域做研究的时间,感觉有点本末倒置,影响我的进程。未满足研究需求 有一次我作图的结果就不理想。产品需求 关键是一个现成的数字人文产品未必能满足我的研究需求啊。产品实用性我需要用的时候才会去接触,以前会可能掌握一些软件的使用方法,但是只有在需要的时候才会去主动学习这些详细功能的使用,如果说我没有用这个平台的话,那么可能它对于我的研究没有意义。提倡科技黑箱 根据我的研究课题,我可能只青睐于那些易操作、数据全的平台。6 认知模式7 外界激励8 外界制约条件9 内在制约条件1 0 投入产出比 1 1 研究需求
使用认同感我经常鼓励我的学生们去多多接触有关数字人文的东西,我也会跟同事们经常相互分享一些产品,像C B D B已经是业内公开的数据平台了。热点趋势 数字人文技术兴起必是大势所趋,因为它能把技术和情怀有机结合。模范效应如果有一位学者因为用了这类平台做出了好的研究,或是开发出了更为学术界轰动的数字人文产品,那么一定会有人以你为榜样向你学习。研究群体支持 不仅仅是无人排斥,还需要大家公开使用并认可才可以。1 2 学科因素驱动1 3 社会参照驱动普及度 对于青年学者来说,这种产品的普及度还是很高的。经验借鉴 希望去和其他同领域对这方面有建树的同仁们分享经验。1 4 期望收获过程期待第一步通常都是针对文本的分析,这样可以对收集得来的史料有很大作用。第二步就是针对史料的分析,这样能通过计算机平台帮助其他人看到,只不过这些人往往看不到那些内容和过程,他们都是对这些呈现出来的内容抱有很大的兴趣。自主性解决1 5 使用困难克服首先我会找到与研究相关的史料,通过大量阅读来找出我想要的内容,如果这种平台非常成熟的话,当我们遇到困难时,我们很有可能对我们的工作流程做出改变。技能驱动 你说的和我们有一门计量史学课程有很多相似点的,这些技能有一部分是必修的。成果信服度 如果给我们一个量化的图表,我们更倾向于相信这种研究的可靠性。1 6 成果激励研究过程支持 这个迁徙图真的很漂亮,但可惜只是宏观呈现,对于具体某项研究过程作用不大。
2.2.3 选择性编码
选择性编码是以主轴编码的结果作为基础,以进一步确定各主范畴之间的关联方式为目的,从而在众多主轴编码中反复推敲、对比后总结出具有高度凝练性质的概念即核心范畴[21]。通过分析核心范畴与其他范畴的关系,可进一步挖掘出构建理论的基本要素,从而使核心范畴达到饱和。笔者将对以上的由主轴编码得到的16个主范畴进行更进一步的选择性编码,目的不仅是为了将上述编码做更为精炼的单一性整合工作,而是赋予众多主范畴“逻辑关联”,从而呈现受访者利用数字人文的研究行为形成机理的所有关系条件和关系结构,便于理论模型的建立。
基于人文学者接受数字人文技术过程这一核心范畴,笔者将人文研究者接受数字人文技术的过程分解为三部分,即①受到数字人文刺激并产生接受意愿的有机体,即人文学者;②为人文学者提供的外界刺激,指数字人文产品;③人文学者对外界刺激做出的反应,即对数字人文接受的意愿程度。
笔者通过对访谈过程中原始文字内容的分析,挖掘各主范畴之间的“逻辑关联”。为了使即将构建的模型具有更直观、更清晰的结构,笔者将各个主范畴之间的关系结构归为直接影响和间接影响两大类。同时也按照各主范畴的逻辑关联将主范畴做进一步整合,例如人文研究者的个人因素包括了研究者属性、研究需求、认知模式、使用动机和内在制约条件等主范畴。具体分类情况如表4所示。
表4 各主范畴的关联结构表
2.2.4理论饱和度检验
笔者通过反复地查阅访谈材料,和研究小组成员不断讨论和取舍,并根据大量相关文献的调研,最终确定了以上研究抽取得到的16个主范畴已基本囊括了历史人文研究者利用数字人文档案馆藏资源行为的全部影响因素。此外,为了使该研究的科学性、严谨性和规范性得到保障,笔者将访谈获得的文本资料内容重新打乱,随机抽取获得三份等量的文本内容,并对其中三分之二的内容进行三级编码,剩余的三分之一内容作为对照内容,没有发现新的范畴。这印证了编码内容相对完整且合理,且理论已经达到了饱和状态,可以终止采样。
2.3 基于扎根理论的行为影响因素模型构建
笔者通过对扎根访谈内容文本进行了开放性编码和主轴编码,分别得到了47个范畴以及16个主范畴,并按照各主范畴之间的逻辑关联将这16个主范畴做进一步整合,归为5个层次包括:个人因素(Personality)、产品技术因素(Technology)、环境因素(Environment)、参与方式因素(Participation)、和数字人文学科属性(Feature)。这五大因素会通过对彼此的相互作用,来影响历史人文研究群体对数字人文的采纳意愿。根据以上结论,笔者又参照已有的SOR(刺激-机体-反应)模型,构建出数字人文对人文学者刺激过程的影响因素初始模型,如图4所示。
图4 数字人文对人文学者刺激过程的影响因素初始模型图
3 人文研究者利用数字档案馆藏行为模型的检验和优化
3.1 提出研究假设
在上文模型的基础上,本篇文章提出了以下的假设:
H1:人文研究者的性别对人文研究者的数字人文采纳行为有显著影响。
H2:人文研究者的年龄对人文研究者的数字人文采纳行为有显著影响。
H3:人文研究者对人文学科领域从事研究年限对人文研究者的数字人文采纳行为有显著影响。
H4:多学科的集成程度对人文学者的数字人文采纳行为有显著影响。
H5:产品技术因素对人文研究者的数字人文采纳行为有显著影响。
H6:参与方式因素对人文研究者的数字人文采纳行为存在显著影响。
H7:环境因素对人文学者的数字人文采纳行为有显著影响。
H8:个人因素对数字人文的学科属性存在显著影响。
3.2 问卷设计与数据收集
笔者通过问卷星平台制作了本次的预调查问卷,并在微信平台上进行发放。此次预调查问卷在三天内发放了96份,最终共回收89份有效问卷。并计算出六个变量的信度分别为0.813、0.618、0.792、0.836、0.875和0.901,其中只有“从事研究年限”的限度为0.618,低于0.7。“从事研究年限”这一项数据由于信度较低,并且部分丢失,因此在正式的调查中“从事研究年限”题项将不再作为正式问卷题目。同时,89分样本中并无调查对象提供变量上的补充。但依据相关人员的意见,笔者对问卷的题项顺序做了调整,正式问卷共计26题。本次问卷调查于2020年3月25日开始,至2020年3月30日结束,共5天。本次调查问卷通过QQ和微信等社交平台进行发布,调查范围较为广泛。最终共收回问卷288份,为了保证此次调查的有效性和真实性,剔除了无效问卷,最终所得到有效的调查问卷为260份,有效率为90%以上,能够满足有效问卷和满足投放问卷1:10的原则,可以对这些问卷进行下一步的数据分析。
3.3 影响因素模型的有效性检验
3.3.1 信度分析
正式的调查问卷所获得的数据同样要进行信度分析,并判断数据的真实和稳定性,从而能够更好的进行数据分析和模型的使用。笔者选择了SPSS软件计算Cronbach's Alpha系数值,Cronbach's Alpha系数如表5所示。
表5 调查问卷信度表
数字人文对人文学者刺激模型测量体系的总体信度为 0.767,各变量信度分别为0.871、0.776、0.802、0.853和0.795,所有 Cronbach's Alpha 都在0.75以上,因此此次调查问卷所获得的数据的信度达到要求。
3.3.2 效度分析
(1)KMO和Bartlett球形度检验:
由于KMO值能够衡量各变量之间的共同因素,数值越大,共同因素越多。本研究 KMO 值为0.805满足因子分析要求。又因为Bartlett 球形度检验系数同样在标准之间,因此可以通过提取最少的数据来解释大部分的公因子。
表6 KMO和Bartlett球形度检验结果表
(2)验证性因子分析:
验证性因子分析是是通过结构方程来进行模拟的,通过对拟合效度、收敛效度及区别效度来形成建构效度。具体的验证性因子分析指标见表7。
验证性因子分析中C.R.值能够判断观测变量是否能够对潜在变量进行很好的检测,C.R.的绝对值为1.96以上则被视明显。标准化因素载荷量数值需要在0.6以上才能够说明能真实的反应观测变量。通过具体的测试可以得到,观测变量的C.R.绝对值都能满足要求,大于1.96,检验水平明显。S.E.值大于0测量量变量没有共线问题。最终得出结果,本次调查问卷的数据具有较高的效度。
表7 验证性因子分析指标表
3.3.3 假设检验分析
为了将初始模型进一步验证分析,本文采用结构方程模型工具AMOS软件分析数据经并进行验证,并能够得到每条路径的标准化回归系数,数字人文对人文学者刺激过程的影响因素的路径关系图,以及各变量间的复杂关系。最终得到数字人文产品对人文学者刺激过程的影响因素假设模型变量间路径系数如表8所示。
表8 假设模型路径相关系数表
可以看出“个人因素—→数字人文学科属性”各项数据表明不能满足和预假设的负相关关系,也就达不到显著性的标准。其它变量的P值均可以达到要求,其值都小于0.05。因此,个人因素、环境因素对公众参与人文学者参与数字人文的方式均有直接影响,环境因素对数字人文属性、学者参与方式和产品技术要素都有很重要的意义。而人文研究者的个人因素对数字人文学科属性即学科集成度有显著影响的假设不成立,于是需要对模型进行修正。
3.4 模型的修正与优化
根据数字人文对人文学者刺激过程假设模型修正指标的建议,笔者剔除了从“个人因素”到“数字人文学科属性”的路径关系,将其调整为“个人因素”到“产品技术因素”的路径作为尝试,并提出修正后的新假设:
H8’:个人因素对产品技术因素存在显著影响。
笔者再次利用AMOS工具进行数据分析,得到修正后的数字人文对人文学者刺激过程模型路径系数见下表:
表9 修正后模型路径系数表
从上表可知,因为所有路径的P值都达到小于0.05的标准,所以每条路径的假设都能够成立。
本文将性别和年龄作为调节变量以此来检验数字人文对工作者刺激过程模型的效果。先利用SPSS软件对独立样本Kruaskal-Wallis 检验,以此来判断性别和年龄在多群组分析中的作用,见表10。
表10 性别和年龄的 Kruaskal-Wallis 检验表
期望收获 0.491 不显著 0.412 不显著使用困难克服 0.129 不显著 0.366 不显著成果激励 0.283 不显著 0.029 显著参与方式因素传播途径 0.861 不显著 0.357 不显著外界激励 0.263 不显著 0.028 显著外界制约条件 0.377 不显著 0.156 不显著学科驱动因素 0.694 不显著 0.045 显著社会参照驱动 0.352 不显著 0.043 显著环境因素
以上结果表明:
H1:人文研究者的性别对数字人文采纳行为有显著影响。
H2:人文研究者的年龄对数字人文采纳行为有显著影响。
基于上述所有数据调研和分析,最终假设见表11。
表11 最终假设检验表
完善修正后的数字人文对人文学者刺激过程模型如图5:
图5 数字人文对人文学者刺激过程的影响因素模型图
4 人文研究者数字档案馆藏利用行为激励
4.1 个人因素激励策略
个人因素在本研究中指的是描述历史人文研究个体的自身因素,是笔者以参与主体角度,对学者自身条件以及主体的感知,也是影响数字人文对人文研究刺激作用的重要因素。能够影响人文研究者是否愿意接受数字人文技术,还能够通过人文研究群体的参与方式来间接影响数字人文对人文研究过程的刺激作用。其中个人因素包括研究者属性、研究者的使用动机、人文研究需求、内在制约条件和认知模式6个主范畴。这6个主范畴的内在层次联系如图6所示。
图6 个人因素内在关系图
对此笔者给出的对策建议是:数字人文的工作团体,应当从人文学者对数字人文的认知模式出发,通过对这一学术群体研究需求的观察,制定相应的调整方案。例如对传统的人文学科研究者开设对数字人文宣传普及的讲座并简单介绍其中的功能和基本的系统原理,以此来改变这些传统人文研究者对数字人文技术的认知模式,消除因其主观因素而存在的“技术壁垒”认知,为人文学科群体学习数字人文工具,利用数字人文方法提供一个坚实的思想后盾。
4.2 数字人文学科属性激励策略
数字人文学科属性主要指主轴编码中的多学科集成(程度),数字人文的多学科集成度也会在环境因素的参与下对人文研究者对数字人文的接受意愿起到调节作用。数字人文虽然是基于人文背景并服务于人文学科工作的,但是他同时也是针对计算与人文学科之间的交叉领域学习、研究以及创新的系统性学科,在数字人文的研究过程中还是以软件技术作为重点对象进行开发研究,具有较强的专业性质同时也依靠理工技术背景。
数字人文学科应建立更为完善的理论基础与知识体系。“数字人文”虽然作为新兴学科,但在我国已经有了已经得到了一定的发展,其中一些核心关键技术以及未来的方向已经比较明确。因此图书馆科学和档案管理应该把握住这次机会,更好的与数字人文技术相结合,夯实更加完备的数字人文学科基础,创造该学科发展的新起点。
4.3 产品技术因素激励策略
数字人文学科的技术特性是主要的产品技术因素。数字人文学科的飞速发展和完善一方面促进更多数字人文产品的产出,另一方面也不断的开拓出新的研究方法,这能够为人文学科的研究提供更大的助力。通过利用文献文本识别技术,建立人文数据资料库,文字信息数据可视化,静态历史节点动态化等等。通过这些技术手段为历史人文学科呈现了的更多种类的史料资源,也大大提高了人文学科研究成果的丰富性、科学性和直观性。产品技术因素同上述的数字人文学科属性一样,作为一个中间变量,也会受到环境因素的种种调节并综合作用于人文学者对数字人文产品的接受意愿。其内在成分如图7所示。
图7 产品技术因素内在成分图
在产品技术因素内在成分的分析过程中,笔者发现对于人文研究者而言投入产出比和产品体验是存在相互作用关系的。产品体验越好对产出投入比中的效率评价就越高,同时也会降低学习时间成本,更易满足人文学者的研究需求。同时投入产出比的严重失衡也会对用户的产品体验中的量化分析程度起到负向影响的效果,此外,还有极大的可能造成研究偏差的产生。因此对于产品技术因素而言,最简单有效的激励手段在于简化产品界面、优化工具性能、填补软件程序漏洞来提升数字人文工具的可用性,从技术支持角度上使得数字人文产品的功能得到有效简化而非简陋,这样才能降低软件的学习时间成本,提升研究者的研究效率。
4.4 参与方式因素激励策略
工作者对于数字人文使用过程中的一种自主性表现在对于使用困难的客服。这也是参与方式因素的决定条件之一,也是数字人文技术受接受意愿的重要指标。通过成果激励可以让学者在研究的过程中更多的使用数字人文,能够提升人们对于数字人文技术的使用意愿。因此要想提升学者对于数字人文技术的使用需要在成果激励和使用困难克服方面努力,这也可以让人文研究者深刻体会到这一范式的优越性,以此促进人文学者对数字人文的接受和参与意愿。以下则为人文学者的参与方式因素外界激励图。
4.5 环境因素激励策略
人文工作者所在的学习、学习资源和社交环境,统称环境因素。环境因素是对人文研究者利用数字人文行为的外在影响因素,涉及到的因素种类较多,并会调节数字人文的学科属性、影响参与方式因素和产品技术因素。如图9所示。
图9 环境因素内在关系图
而对于环境因素的唯一激励途径就是外界激励。外界激励包含研究团体激励、政策扶持和信息资源激励三个方面。其中研究团体激励可作用于学科因素驱动过程,政策扶持作用于社会参照驱动,信息资源激励作用于外界制约条件中的资源制约因素,对环境因素进行全方位的激励。因此,数字人文学界应鼓励进行跨学科的交流和讨论,以促进数字人文技术的推广。并且通过这种讨论和沟通也能够使得数字人文技术在实践中能够发挥更好的作用。
6 结语
数字人文对人文学者刺激过程的影响因素主要包括个人因素、数字人文学科属性、产品技术因素、参与方式因素和环境因素。其中个人因素和数字人文学科属性是内在因素,产品技术因素、参与方式因素和环境因素是外在因素。此外,人文研究者的性别和年龄对人文研究者利用数字人文过程也有重要影响。为了充分调动数字背景下人文学者利用数字化档案馆藏资源的行为,基于人文研究者对数字人文刺激的反应框架模型的激励体系必须被建立。本文构建的激励体系从模型中三个维度入手(外在因素)辅以两个内在因素作为参考依据,得到三种对应的激励措施。①建立更为完善的理论基础与知识体系是吸引人文研究者参与数字人文的必要条件;②加强对人文研究者的数字人文工具软件操作的实训是推动数字人文研究过程的重要力量;③组织跨学科学术研讨与交流是促进数字人文学术交流的前提保障。数字背景下人文学者利用数字化档案馆藏的行为激励体系既可以有效提高人文学者的研究效率,激发他们的科研潜能,又可以加强各学科对数字人文系统的黏合度,使档案馆藏数字人文建设持续发展,是数字人文档案机制发展不容错失的宝贵机遇。而至于对不同学科研究者对数字人文认同程度以及如何针对数字人文进行具体跨学科交流等研究将在后续进一步展开。