图书馆人工智能准备度影响因素研究
2022-05-27郭维嘉
郭维嘉
(河南省图书馆,郑州 450052)
1 引言
人工智能(Artificial Intelligence,AI)是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学[1]。人工智能对图书馆的影响是全方位的,包括图书馆的信息资源建设、服务、馆员、图书馆建筑与环境、管理等各个方面[2]。图书馆既可以直接应用现有的人工智能系统,也可以在自然语言检索、内容智能分析等方面开展人工智能研究[3]。
杨子帅等[4]对96 所图书馆进行了人工智能技术应用调查,发现超过1/3 的图书馆应用了人工智能技术,但仍有61%的图书馆尚未采用人工智能技术,说明很多图书馆在部署和应用人工智能系统时仍存在一定困难,准备度不够。准备度是衡量图书馆是否可以应用人工智能技术的指标;图书馆在准备部署人工智能系统之前,应制定相应的准备度评估指标,对其在技术、馆员心理、组织等各个方面的准备度进行评估;只有当各个方面都做好了应用人工智能技术的准备时,才可以进行实际部署。理论层面上看,应从哪些方面来衡量图书馆人工智能准备度、如何设计准备度评估指标、确定哪些因素会影响准备度、如何提高准备度等,都是需要研究的问题。对图书馆人工智能准备度及其影响因素进行研究,有助于尚未准备好使用人工智能技术的图书馆有针对性地改善各种相关条件,以便做好初次使用人工智能技术的准备;也有助于已经使用人工智能技术的图书馆进一步完善现有条件,以便做好升级或全面应用人工智能技术的准备。
2 相关研究
通过文献调研发现,对人工智能准备度及其影响因素的研究主要围绕3 个层面展开。
2.1 国家层面
以国家为单位,讨论其人工智能准备度的评估方法及其影响因素,如TINHOLT 等[5]提出了人工智能准备度概念,其含义是指一个国家及其机构和企业在多大程度上有能力获得人工智能的好处,可从机构环境、技术成熟度、技能提升3 个方面进行测度。此外,国际咨询机构Oxford Insights[6]近年来一直致力于各个国家人工智能准备度指数的研究,综合考虑政府部门、技术领域、数据和基础设施,设计了一个包含42 个指标的AI 准备度评价体系,每年发布一次准备度指数。
2.2 组织层面
针对政府、企事业单位等各类组织的人工智能准备度及其影响因素进行讨论,如刘思佳[7]对河南10 所高校图书馆人工智能准备度情况进行了调查分析,并根据调查结果提出了相应建议;LOEB[8]提出可根据数字进化指数、数字政府得分、电子参与、开发数据指数、人力资本、人工智能出版物的H 指数、ICT 相关法律等指标来度量政府人工智能准备度;FETISOV[9]提出一种基于技术接受度模型TAM 的人工智能准备度评估模型,通过问卷调查方法对俄罗斯和瑞士机械和工业工程公司的人工智能准备度进行计算,并对准备度的影响因素进行分析;ALSHEIBANI 等[10]提出了基于TOE框架的企业人工智能准备度模型,包含相对优势、兼容性、顶层管理支持、组织规模、资源、竞争压力等7项评价指标;KHALEEL[11]对教育组织采用人工智能技术时管理层和领导层的准备度影响因素进行了分析;VUONG 等[12]提出可从技术专长、财政可持续性、心理与文化环境等方面评估医疗保健部门人工智能准备度,并以越南医疗保健部门为例,阐明其消极和积极的影响因素。
2.3 用户层面
从用户角度讨论人工智能准备度的影响因素,如LAZANYI[13]提出,信任是影响人工智能准备度的主要因素,应满足人们在工作场所和周围接受人工智能的心理和情感需求;AMBATI 等[14]从员工的角度对组织采用人工智能技术的影响因素进行了研究,认为员工的失业风险、对采用人工智能的抵制等因素都会影响组织采用人工智能技术。
整体上看,讨论企业、政府等类型组织人工智能准备度及其影响因素的成果较多,探讨图书馆人工智能准备度及其影响因素的文献非常少。
3 理论模型构建
如上所述,探讨图书馆人工智能准备度影响因素的文献极少,可供本文直接借鉴的研究成果非常有限,因此,有必要在参考企业、政府人工智能准备度影响因素研究成果的基础上,结合图书馆的特点,采用探索性研究方法来分析、归纳图书馆人工智能准备度的影响因素。考虑到深度访谈和扎根理论都属于探索性的定性研究方法,前者可用来采集资料,后者可从资料中提升理论,二者相配合,可解决理论模型的构建问题。鉴于此,本文利用深度访谈和扎根理论来构建图书馆人工智能准备度影响因素理论模型。基本过程为:对主要概念进行界定→设计深度访谈提纲→通过深度访谈获取原始资料→对原始资源进行开放式编码,形成一系列初始概念并聚类成范畴→对范畴进行主轴编码,形成若干个主范畴→对主范畴进行选择性编码,形成一个核心范畴→建立范畴、主范畴、核心范畴之间的联系,形成图书馆人工智能准备度影响因素理论模型。
3.1 概念界定
图书馆人工智能准备度是指图书馆部署、应用人工智能并能从中受益的准备程度。图书馆人工智能准备度的主体既可以是整个图书馆业界,也可以是某类图书馆(如高校图书馆),还可以是某个具体的图书馆。对于上述任意一个主体,其人工智能准备度都是一个动态值:当主体没有部署任何人工智能系统时,随着与人工智能应用相关的各种内部条件和外部条件的不断改善,准备度值会逐渐增大;当主体已经在某一个或几个部门成功部署了人工智能系统,并已取得一定的人工智能应用经验时,可能会在原有的基础上进一步升级或全面部署人工智能,准备度值将会进一步增大。
图书馆人工智能准备度影响因素是指影响图书馆人工智能准备度的内部因素和外部因素的总和。决策层可以对图书馆人工智能准备度进行评估,当准备度值较高时,可以做出部署人工智能系统的决策;当准备度值较低时,可以从图书馆人工智能准备度的影响因素入手,通过改善与影响因素相关的各种条件,不断地提高图书馆人工智能准备度值,直至达到可以成功部署人工智能系统的程度。
3.2 深度访谈
(1)访谈对象的选择。为了取得较为理想的访谈效果,对访谈对象的条件做了如下限定:对计算机理论与应用比较熟悉、对人工智能有一定的了解、对图书馆业务工作比较熟悉、具有较强的科研能力。通过咨询和走访,最终从郑州大学图书馆、郑州大学信息管理学院、河南大学图书馆、河南大学网络中心各选取2 名具有副高级以上职称的人员作为访谈对象。随机抽取其中的6 位对象编为第一组,编号分别为E1~E6;另外2 位对象编为第二组。
(2)访谈提纲的设计。笔者认为,了解图书馆哪些部门和岗位可以采用人工智能技术、图书馆可以采用哪些人工智能技术、图书馆应用人工智能技术应具备什么条件等基本问题,有助于讨论图书馆人工智能准备度及其影响因素。为此,笔者将访谈主题设置为3项:个人基本信息、对图书馆采用人工智能技术的认识、对图书馆人工智能准备度影响因素的认识,具体如表1 所示。
(3)访谈材料的记录。访谈采用面对面方式,并将上述访谈提纲事先告知访谈对象。访谈时,由助手记录访谈内容,并在征得访谈对象同意的前提下进行录音。访谈结束后,对纸质记录和录音记录进行整理,形成正式的原始资料。
3.3 资料编码与模型生成
扎根理论是一种定性研究方法,其基本思想是在经验资料的基础上,通过开放式编码、主轴编码、核心编码等步骤建立理论模型,其中经验资料可以是上述通过深度访谈所获得的原始资料。
3.3.1 开放式编码
开放式编码是指对每个访谈对象的每一句话都进行处理,从中识别关键短语并形成初始概念和范畴[15]。将8 位访谈对象的原始资料分为两组,其中第一组6位对象的资料用于开放式编码,第二组2 位对象的资料用于饱和度检验。在开放式编码过程中,对6 位访谈对象的原始资料进行分析,删除没有意义的语句,合并句法和语义几乎完全相同的语句,共得到158 个相互独立的语句。对这些语句进行概念化处理,共得到38 个初始概念;对这些初始概念进一步分组、概括,共得到10 个范畴,如表2 所示。
利用第二组2 位访谈对象的原始资料对上述开放式编码结果进行饱和度检验,共新增了5 个初始概念,但这些新增概念都可归属到已生成的10 个范畴中,说明饱和度尚可。此外,在对初始概念进行范畴化时,除了考虑初始概念的名称及相互联系外,还参考了相关文献中的评价指标(表2)。
表2 开放式编码所形成的范畴Table 2 Categories formed by open coding
3.3.2 主轴编码
主轴编码是指在范畴之间建立连接,在开放式编码的基础上以新的方式将数据重新组织起来,具体来说就是通过聚类分析,将范畴进一步分组,形成包容性更强的主范畴。通过分析上述10 个范畴的内涵及相互关系,将其归纳为4 个主范畴。在参考现有的技术接受度模型TAM[20]和信息系统适用度框架TOE[21]的基础上,将4 个主范畴分别命名为心理准备度、技术准备度、组织准备度、环境准备度,如表3 所示。
表3 主轴编码所形成的主范畴Table 3 Main category formed by axial coding
3.3.3 核心编码
核心编码是指通过分析主范畴、范畴之间的相关关系并从中挖掘出核心范畴的过程。心理准备度、技术准备度、组织准备度3 个主范畴用于描述图书馆部署和应用人工智能系统的内部条件准备程度,环境准备度用于描述外部条件的准备程度。可在上述4 个主范畴的基础上抽象出一个核心范畴——图书馆人工智能准备度。
3.3.4 理论模型及假设
在开放式编码、主轴编码、核心编码的基础上进一步确定核心范畴、主范畴、范畴之间的相关关系,其中心理准备度、技术准备度、组织准备度、环境准备度4 个主范畴是核心范畴的一级影响因素,AI 认知度、AI 接受度等10 个范畴是核心范畴的二级影响因素。心理准备度、技术准备度、组织准备度及其下的8个范畴都属于内部影响因素,环境准备度及其下的2个范畴都属于外部影响因素。在上述3 类范畴及其相关关系的基础上所形成的图书馆人工智能准备度影响因素理论模型如图1 所示。
图1 图书馆人工智能准备度影响因素理论模型Fig.1 Theoretical model of influencing factors of library artificial intelligence readiness
在此基础上,本文提出如下10 个假设:AI 认知度、AI 接受度、AI 价值感知、AI 应用经验、数据规模、领导重视、创新氛围、管理机制、竞争压力、隐私保护对图书馆人工智能准备度的影响都是正向的。第4 部分将对上述理论模型及10 个假设进行验证。
4 问卷设计与数据分析
上述理论模型是笔者在8 位访谈对象所提供信息的基础上构建的,只反映了模型中范畴、主范畴、核心范畴之间的定性关系,且这些关系的归纳与形成都具有一定的主观性。该模型是否能得到相关领域内更多专家学者和从业人员的认可、不同的范畴对核心范畴的影响是否不同等问题尚需进一步研究。为此,本文采用问卷调查方法和结构方程模型方法,通过定量的方式进一步验证上文提出的图书馆人工智能准备度影响因素理论模型及假设。
4.1 问卷设计
问卷包括两个部分:一是调查对象的基本情况,包括工作单位、部门、职位、职称、学历、专业六项内容,采集到的数据主要用于调查者掌握样本的总体情况,并不参与结构方程的计算;二是调查对象针对所在图书馆的人工智能准备度所给出的总体评分,以及各个影响因素的评分,采集到的数据直接作为结构方程模型的输入数据。
如3.3 节所述,AI 认知度、AI 接受度等10 个范畴是核心范畴(即图书馆人工智能准备度)的影响因素。可将10 个范畴和1 个核心范畴设置为调查项目,根据深度访谈的结果和有关参考文献,为每个调查项目设置2~3 个可量化的调查点,并为每个调查点定义一个数值型的调查变量(表4)。总体评分和各个影响因素的评分由调查对象对V1~V24 等24 个调查变量的赋值来获得,具体通过李克特10 级量表来完成。
表4 调查问卷中主要调查项目的设置及依据Table 4 Main survey items setting in the questionnaire
4.2 数据分析
4.2.1 数据的筛选
为了保证问卷质量,调查对象限定为图书馆工作人员、高校图书情报与档案管理类专业教师。共选取了国内22 个图书馆和2 所高校的信息管理学院发放问卷,其中包括20 个高校图书馆和2 个公共图书馆。共回收问卷374 份,按单位统计,最多32 份,最少8份,平均每个单位15 份。从调查对象人员结构上看,馆级领导5 人,部门主任和副主任15 人;高级职称人员58 人,中级职称人员261 人;计算机类专业背景人员31 人,图书情报类专业背景人员87 人。删除没有填写工作单位和部门,或者第二部分有缺项(没有完整填写24 个调查变量的数值)的问卷,有效问卷共有369 份。
4.2.2 数据的信度分析
本文利用IBM SPSS 19.0 的可靠性分析(Reliability Analysis)功能来计算上述369 份数据的Cronbach's Alpha 系数,结果为0.831,表明数据的内部一致性较强,信度较高。
4.2.3 结构方程建模
结构方程建模通过两个软件工具IBM SPSS 19.0和AMOS 24.0 来实现。按照AMOS 的建模要求,将表4 中的11 个调查项目设置为潜变量,将表4 中的24 个调查变量(V1~V24)按照表4 中的隶属关系设置为各个潜变量的观测变量。此外,V1~V24 和图书馆人工智能准备度都属于内生变量,按照AMOS 的要求,需要分别为每个内生变量设置一个残差变量。AI 认知度、AI 接受度等其它10 个潜变量都属于外生变量,原则上可以不设残差变量;但本文为了降低模型的复杂度,忽略了上述10 个外生变量之间的相关关系,按照AMOS 的要求,需要为每个外生变量也设置一个残差变量。因此,所构建的结构方程模型共包含11 个潜变量、24 个观测变量(V1~V24)、35 个残差变量(e1~e24、z1~z11)。建模结果如图2 所示(图中的未标准化路径系数和残差值是建模结果运行后才显示的)。
4.2.4 结果分析
在AMOS 系统中导入问卷数据后,采用最大似然法对已构建的结构方程模型进行估算,带有未标准化路径系数和残差值的输出路径图如图2 所示,各个路径的未标注化系数、标准差SE、临界比率CR、P 值、标准化系数如表5 所示。模型与问卷数据之间的拟合结果如表6 所示。
表5 系数估计结果Table 5 Coefficient estimation results
表6 拟合指数计算结果Table 6 Calculation results of fit index
图2 带有未标准化路径系数和残差值的结构方程模型Fig.2 Structural equation model with non-standardized path coefficient and residual value
表5 显示,除了隐私保护的影响效果不显著之外,其它9 个影响因素在0.01 水平上对图书馆人工智能准备度的影响效果都比较显著,其中领导重视、AI 应用经验的影响较大,标准化路径系数分别为0.725、0.611,这一结果与深度访谈环节中8 位专家的意见基本一致,即如果图书馆领导重视人工智能且图书馆已经具有AI 应用经验,图书馆进一步部署并成功应用新AI 系统的可能性较大,准备度会随之提高。此外,竞争压力的影响很小,标准化路径系数只有0.169,加之隐私保护的P 值高达0.105,由此可见,图书馆人并不认为隐私保护、竞争压力等外部因素对图书馆人工智能准备度有太大的影响。
表6 显示,卡方值与自由度的比值为2.7,相对比较合理;CFI 指数与GFI 指数虽然达不到0.9,但模型与实验数据之间的拟合度都超过0.8,也算比较理想。比较而言,AIC 指数的值偏高。
3.3 节已假设10 个范畴(影响因素)对核心范畴(图书馆人工智能准备度)的影响都是正向的,通过表5 可以看出,除了“隐私保护对图书馆人工智能准备度的影响是正向的”这一假设不成立之外,其他9 个假设都成立。从模型优化的角度看,可据此对图1 所示的理论模型进行修正,删除隐私保护这一外部因素。
5 结论
通过深度访谈发现,图书馆人工智能准备度既受心理、技术、组织等多方面内部因素的影响,也受竞争压力、隐私保护等外部因素的影响。通过扎根理论和深度访谈构建图书馆人工智能准备度影响因素理论模型,并假设AI 认知度、AI 接受度等10 个因素对图书馆人工智能准备度的影响是正向的。通过问卷调查方法和结构方程模型方法对上述理论模型和10 个假设进行验证,发现9 个假设成立,其中领导重视的正向影响最大,竞争压力的正向影响最小;1 个假设不成立,从而导致理论模型需要调整,应该删除模型中的隐私保护因素。
研究还发现,领导重视、AI 应用经验、AI 接受度、AI 认知度、创新氛围是图书馆人工智能准备度的主要影响因素。为此,笔者建议:①图书馆领导(尤其是主要领导)应积极了解图书馆领域的最新技术进展,组织人员定期地评估本馆的人工智能准备度,及时部署人工智能系统;②图书馆应对员工进行必要的AI 知识培训,帮助其提高对AI 的接受度和认知度,为图书馆部署人工智能系统提供知识基础;③图书馆应营造浓厚的创新氛围,激发员工的创新积极性,鼓励员工通过各种途径探索将人工智能技术与所在岗位任务进行融合的可能性,为图书馆部署人工智能系统提供创新环境。
本文在构建理论模型时,忽略了10 个影响因素(范畴)之间的相关关系;在构建结构方程模型时,没有将4 个主范畴作为独立的潜变量纳入到模型中;当同一个潜变量下不同残差变量之间的MI 值较大时,也没有在相应的残差变量之间增加相关路径,从而进一步优化模型。下一步将围绕这些不足之处展开研究,同时进一步增大问卷调查的范围和数量。