企业档案部门对大语言模型的使用意愿影响因素研究*
2024-01-02张婷婷
张婷婷
(山西省儿童医院 太原 030009)
0 引言
档案是人类社会发展到一定阶段的产物,档案具有珍贵的史料价值。档案工作是维护党和国家历史真实面貌、保障人民群众根本利益的重要事业[1]。档案工作并非一成不变,其发展与社会需要、时代背景、经济水平、技术发展等方面有着紧密的联系[2]。目前,相当一部分的企业档案部门没有充分意识到信息化在档案管理中的作用[3]。企业档案工作作为国家档案事业重要的组成部分,随着以ChatGPT为代表的生成式AI 的兴起,如何有效地将这一技术应用到企业档案工作成为业界关注的焦点。本研究利用扎根理论,采用深度访谈,探讨影响企业档案部门对大语言模型的使用意愿的关键因素。以TAM 模型为基础,结合访谈内容,构建企业档案部门对大语言模型使用意愿影响因素理论模型,为档案部门提高数字化能力提供决策支持。
1 文献回顾
1.1 大语言模型
大语言模型是指基于深度学习技术构建的能够生成自然语言文本的模型。它通常由多层神经网络组成,具有大量的参数和复杂的结构。大语言模型通过学习大规模的文本数据集,能够理解语言的语法、语义和上下文,并生成具有连贯性和合理性的文本。大语言模型能凭借强大的自然语言处理能力,在档案资源开发利用过程中持续赋能,挖掘和分析更多档案知识内容,并自动将其归类到相应的主题或类别中,还能提供多样式、智能化的档案服务,方便用户查找与利用[4]。
1.2 技术接受模型
技术接受模型(Technology Acceptance Model,简称TAM)是由Davis等学者基于理性行为理论(TRA),提出的一种用来识别和解释用户对于新技术接受程度的理论模型。TAM 包含5 个变量,各个变量之间的作用关系如图1所示。TAM 模型将用户对新技术的接受程度转化为其使用新技术的行为意图,而行为意图由用户的感知有用性和感知易用性共同决定。感知有用性指用户使用某种新技术后,对该技术感受到对个人或特定目标的价值和收益的评估。感知易用性指用户使用某种新技术所需要花费的成本。
2 研究设计与数据分析
2.1 研究设计
本文基于扎根理论的研究方法,选取符合研究情境对象进行深度访谈,将访谈资料利用NVivo 12软件构建数据编码,提取影响企业档案部门对大语言模型使用意愿的关键因素。
2.2 数据收集
本研究通过随机抽样的方法,从档案工作处于国内领先地位的长三角地区的5 家企业的档案部门确定了10 位访谈对象,基本信息:编号1,男,35 岁,本科学历,访谈时间32 分钟;编号2,男,24 岁,本科学历,访谈时间26 分钟;编号3,女,27 岁,硕士学历,访谈时间21 分钟;编号4,女,29 岁,硕士学历,访谈时间20 分钟;编号5,女,24 岁,本科学历,访谈时间28 分钟;编号6,男,26 岁,本科学历,访谈时间30 分钟;编号7,女,25 岁,本科学历,访谈时间32 分钟;编号8,女,23 岁,本科学历,访谈时间33 分钟;编号9,男,37 岁,硕士学历,访谈时间25 分钟;编号10,男,39 岁,本科学历,访谈时间29 分钟。选取访谈对象标准如下,(1)在现公司的档案部门的工作时间满一年;(2)对大语言模型有一定了解;(3)同一家公司选取的对象不超过2 人;(4)有主动参与本研究的意愿。
在访谈进行前,告知所有访谈对象本次访谈的目的,并将访谈提纲提前发送给访谈对象。访谈过程中以录音的方式记录访谈内容,访谈时间以30 分钟为期望。访谈的提纲主要包括:您是如何看待大语言模型的?您所在的部门有在使用大语言模型吗?如果在使用,大语言模型对您的日常工作什么帮助?如果不在使用,您认为原因是什么?请回忆并描述关于大语言模型印象深刻的事件等。在实际访谈过程中,笔者主要采用访谈提纲对受访样本进行提问,并确保掌握整体访谈方向。根据受访对象的回答情况,随时调整提问方式和措辞,并通过追问的方式挖掘更深层次的内容。
2.3 数据分析
2.3.1 开放式编码分析
开放式编码是指在研究初期对收集到的资料进行分解、比较、概念化和范畴化的过程。为了确保资料分析的有效性,本研究运用了Nvivo12 软件的自由编码功能进行编码。我们对那些只出现1-2 次且与研究内容无关的概念进行了删除处理,以减少噪音和保持焦点。而对于出现频次大于3 次的初始概念,我们运用因果关系等方法进行概念聚类,最终形成了32 个初始改变和19 个副范畴,具体结果详见表1。
2.3.2 主轴式编码分析
主轴式编码是在开放式编码的基础上,通过对形成的概念与范畴进行推敲、反复比较的过程。通过主轴编码,本研究归纳出5 个主范畴,分别模型特性、社会影响、自我效能、感知有用性、感知易用性。主轴编码具体结果详见表3。
2.3.3 选择式编码分析
选择式编码是将主轴编码过程形成的主范畴进一步进行逻辑关联的过程。通过分析不同主范畴之间的层次关系并不断比较、挖掘和编码,最终得出的主范畴结构关系见表4。
表4 选择式编码情况
2.3.4 理论饱和度检验
为了确保扎根理论模型的饱和度较好,我们重新邀请了5 位符合访谈要求的用户进行深度访谈,以验证理论饱和度。通过对数据的分析,我们发现所提取的概念仍然属于已有的范畴,没有出现新的相关关系。这说明在本次扎根理论研究中,我们所得到的范畴已经具备了足够的丰富性,并通过了饱和度检验。
2.3.4 理论饱和度检验
为了确保扎根理论模型的饱和度较好,我们重新邀请了5 位符合访谈要求的用户进行深度访谈,以验证理论饱和度。通过对数据的分析,我们发现所提取的概念仍然属于已有的范畴,没有出现新的相关关系。这说明在本次扎根理论研究中,我们所得到的范畴已经具备了足够的丰富性,并通过了饱和度检验。
2.3.5 模型构建
基于技术接受模型和扎根理论结果确定了企业档案部门对大语言模型的使用意愿影响因素,分别为模型特性、社会影响、自我效能、感知有用性、感知易用性。结合技术接受模型,对以上变量之间的影响关系进行梳理,提出如图2 研究理论模型。
图2 企业档案部门对大语言模型的使用意愿影响理论模型
3 结论和建议
3.1 提高信息素养能力,借助大语言模型的推力
将大语言模型与档案工作场景的融合,可以显著提升档案部门的工作效率和服务质量。为了增加档案部门员工对大语言模型的使用意愿,以下三点可以作为出发点。第一,为档案部门的员工提供专门针对大语言模型的培训和支持计划。该计划应包括详细的模型特性和使用技巧的解释,并提供如何在实际工作中应用模型的指导;第二,展示其他企业档案部门中已经成功应用大语言模型的案例,并强调模型的积极社会影响。这些案例可以涵盖提高工作效率、提供更准确的信息检索和分析能力,以及促进知识共享和合作等方面的好处;第三,确保大语言模型在实际应用中具有高度可用性和实用性,以满足档案部门的需求。为此,提供用户友好的界面和工具,简化模型的操作流程,并确保模型的输出结果准确可靠。同时,与档案部门员工保持密切的沟通和反馈渠道,及时解决他们在使用过程中遇到的问题和困惑。
3.2 推动数字化战略实施,确定技术的角色和价值
档案数字化建设离不开数字工具或平台的有力支撑[5],但新技术的出现和推广往往伴随着众多问题和考验,因此档案部门在引用大语言模型等新型信息技术时,应重点考虑以下两点:第一,确立明确的数字化目标。在引入新技术之前,档案部门应该明确数字化目标,并确定所需的改进方向。例如,提高档案管理的效率、减少纸质档案的依赖、提升搜索和检索能力、保障档案的安全性等。明确的数字化目标有助于指导技术选择,减少风险,并提高资源利用效率。选择适合目标的技术解决方案可以更好地满足档案部门的需求。第二,评估不同的技术解决方案。档案部门应该评估不同的技术解决方案,包括电子档案管理系统、数据存储和云计算、信息安全技术等。评估过程应考虑组织的具体需求,并选择适合的技术解决方案。重要的是确保选择的技术能够支持档案管理的全生命周期,从数字化创建到长期保存和访问。此外,选择的技术解决方案应该易于集成和使用,以便档案部门能够有效地应用这些技术。