APP下载

从ChetGPT看生成式AU对情报学研究与实践的影响

2023-03-29曹树金曹茹烨

现代情报 2023年4期

曹树金 曹茹烨

关键词: ChatGPT; 生成式AI; 情报学研究; 情报实践

DOI:10.3969/j.issn.1008-0821.2023.04.001

〔中图分类号〕G250.2 〔文献标识码〕A 〔文章编号〕1008-0821 (2023) 04-0003-08

人工智能(Artificial Intelligence, AI)技术的迅速演进, 不斷重塑着人们的思维与认知, 变革着传统的产业形态。2022 年11 月, OpenAI 发布了对话式大型语言模型ChatGPT, 引燃了新一轮的AI 革命, 引领决策式AI 向生成式AI 的范式转变。当ChatGPT 对搜索引擎、内容创作以及数实共生助力产业升级等领域产生冲击的同时, 无疑也为思考人工智能对情报学的影响提供了极好的条件。近年来,情报学与人工智能深度融合、互联互动, 人工智能尤其是决策式AI 为情报需求感知与识别、情报分析、情报预测、信息组织、知识发现等各类任务注入了智慧动能[1-3] 。人工智能的各子领域(如自然语言处理、人机交互、专家系统等)都以研究方法或技术手段的形式助力情报学研究范式的演进[4-5] ,丰富情报学研究内容。可以预见, 生成式AI 的发展将会给情报学研究与实践带来更大的变革, 实现从辅助判别决策到情报自动生成, 驱动情报学的学科理论、情报机构的业务模式发生极大变化。

根据Gartner[6] 的定义, 生成式AI 是指利用各种机器学习方法, 从数据中学习对象的特征, 从而生成全新的、完全原创的并且与原始数据相似的产品、任务或内容。相较于侧重分析、判断的决策式AI, 生成式AI 强调学习后的演绎创造, 以生成全新的内容。ChatGPT 是生成式AI 的典型代表, 能够实现文本和代码等内容生成、问答系统、对话代理、机器翻译等多种功能。有专家指出, ChatGPT在某种程度上标志着人工智能向认知智能的迈进[7] , 使机器具备语言理解、推理、自我学习的能力, 拥有人类的智慧。而情报学的目标任务则是促进人类认知过程从数据到智慧的转化[8] 。从这一层面来看, 人工智能的发展进程与情报学的目标任务具有较高的一致性。因此, 情报学也不可避免地会卷入AI 变革的浪潮中, 而以ChatGPT 为代表的生成式AI 的爆发, 势必会影响情报学的研究理路、理论要素、技术方法等。

在此背景下, 深入探讨生成式AI驱动下的情报学研究与实践走向, 重新审视情报学与新一代人工智能的交叉融合, 对情报学的持续发展具有重要意义。

1 人工智能视域下的情报学发展相关研究

近年来, 随着人工智能技术的快速变革, 情报学学科发展问题受到学界的广泛关注和讨论。陆伟等[4] 提出, 人工智能改变了DIKW(数据—信息—知识—智慧)信息链逐级升华的情报产生模式, 可以对信息链中的任一环节进行深度分析挖掘情报,数智时代情报学要构建信息资源数据化、方法智能化、创新服务工程化的发展架构。刘永君等[9] 提出, 人工智能的不确定性科学方法论对情报学具有很好的解释力, 可将其引入情报学领域, 构建统一的情报概念, 推动情报学科整合, 并借助人工智能发展情报技术。丁波涛[10] 从情报交流理论的视角,分析了人工智能对情报学学科发展以及对情报工作的影响, 提出在人工智能环境下, 情报内容呈现多元化, 情报交流主体虚拟化, 在此背景下, 情报工作要注重情报分析的回归、情报工程化, 以及提升开源情报的重要性。也有学者从人工智能与情报学的互动角度, 展望情报学未来发展。比如, 胡昌平等[11] 认为, 大数据智能技术可应用于情报服务与信息组织中, 而情报学关于知识结构的描述、用户认知空间的构建也是智能识别中不可或缺的, 情报学与人工智能的深度融合是必要的。曹文振等[1]从本体论、感知论、方法论和服务论4 个视角对人工智能时代情报学的发展走向进行了讨论, 指出情报学发展要紧抓人工智能带来的机遇, 重视跨学科融合和跨领域应用, 但让技术为己所用的同时不能忽视人的逻辑思辨与价值判断。

从人工智能对情报实践与情报工作的影响来看, 司湘云等[12] 表示, 人工智能技术会使得情报研判、预测的工作重点由描述转向预测, 由对显性结果的分析转向潜在知识关联的挖掘。栗琳等[13]认为, 数智技术会改变情报流程中从情报收集、分析到分发的所有环节, 而人工智能在数据到决策的转化中会发挥重要作用。许鑫等[14] 认为, 在人工智能技术的支持下, 情报服务不再局限于浅层次的信息整合, 而是转向基于知识和智慧的决策预判。

关于人工智能对情报学研究的影响, 邱均平等[15] 从网络计量学研究方面进行了讨论, 表示以人工智能为标志的高密集数据处理将会成为网络计量学的新研究范式, 且AI 技术会带动网络信息资源评价指标向智能化和自动化演进。耿国桐等[16]针对如何实现人工智能技术与科技情报研究的深度融合展开了讨论, 具体从科技情报研究的数据源、研究流程及多类型科技情报研究任务的智能化路径进行了分析。范昊等[17] 回顾了人工智能领域的机器学习算法在情报学研究中的应用, 发现其主要分布在信息分析、知识服务、信息计量等子领域, 并指出机器学习的应用与情报学研究的发展历程紧密相连。可见, 人工智能正在不断革新情报学研究方法, 拓展情报学研究范畴。

现有研究深入讨论了人工智能对情报学各方面的影响, 然而人工智能的发展具有阶段性, 技术跃迁对专业领域的影响程度、影响范围是不断变化的。已有研究更多地聚焦于人工智能在情报分析、判别、预测、决策中发挥的作用, 而目前由Chat?GPT 引发的生成式AI 是一种新的人工智能范式,这又会对情报学产生何种影响, 它如何融入情报学的研究与实践, 以及情报学在新一代人工智能的冲击下如何发挥学科优势, 保持学科的独立地位, 值得进一步深思。

2生成式AI对情报学研究的影响

情报实践中应该很快就会应用生成式AI,应用的范围和推进的速度既取决于生成式AI 的发展,也受情报学相关研究的影响。如果不想理论落后于实践, 情报学研究人员就需要及时作出响应, 思考此类AI 技术变革可能给情报学带来的变化, 以及未来情报学研究的侧重问题。目前, 学者们已广泛讨论了大数据、人工智能等信息技术对情报学研究的影响, 讨论视角呈现多元化, 比如从研究问题、数据来源、研究范式、方法与工具、研究过程等不同角度切入进行思考[18-20] 。结合现有研究视角与生成式AI 的特点及其可能对情报学产生影响的范围, 本文主要从研究问题、数据源、研究范式3 个维度进行讨论。

2.1研究问题的转移

问题是科学研究的灵魂。梁战平[21] 曾提出,情报学的核心研究领域包括6 个方面: 理论方法、信息管理和服务、情报分析、信息检索、知识管理、信息技术应用。在每个领域下包含若干个研究问题, 这些问题随着社会发展、学科演进和技术的变迁不断延伸。以ChatGPT 为代表的生成式AI 会使情报学原有的一些研究问题发生转移, 衍生新的问题。从理论方法领域来看, 其一, ChatGPT 改变了知识的生产方式, 也将改变用户获取知识和情报的方式, 这预示着情报现象的变化, 如信息守门人问题更加突出; 其二, ChatGPT 可贯穿信息采集、组织、存储、分析、交互和服务的情报工作全流程, 从而影响情报过程; 其三, ChatGPT 会改变信息生态链的结构, 打破信息流转固有的链式依存关系, 同时也使得信息生态因子的内涵和外延更加丰富, 由此带来新的信息生态问题; 其四, 生成式AI 算法和回答依据的不透明性, 很有可能造成信息泄露、信息伦理、知识产权、信息虚假和错误等问题, 都需要进行新的理论探索。在信息管理和服务领域, 信息的收集、整理、分类、描述、标引等问题可由人工智能通过隐性的处理方式实现, 分类表、主题词表、知识图谱等都对用户不可见。并且, 相较于传统的仅基于学科、领域、主题、关键词等反映信息内容的少量特征进行信息组织的思路来看, 生成式AI 所依据的特征维度多很多, 从而使得多粒度(尤其是细粒度)和多关联的知识组织问题成为研究的重点。相对于ChatGPT等大型语言模型解决的通用领域知识组织问题, 情报学更应关注的是垂直领域信息资源的组织问题, 以及对AI 训练数据和生成内容的管理标准、规范和数据治理问题。对于更细分的领域, 需要具体问题具体分析, 比如目前多模态、跨模态信息资源的融合与重组是情报学研究关注的重点, 而人工智能自动生成内容领域(AIGC)采用的多模态技术可以实现文本、图像和音视频的关联, 同时也可以实现跨模态内容生成。情报学关于多模态信息资源组织问题的研究就不那么重要了, 但可以更多地聚焦于多模态资源的知识服务场景识别与应用中。基于生成式AI 的情报服务将可能成为最主要的甚至对一些用户来说是唯一的情报服务方式或端口, 如何实现相对综合的、依反馈调整、个性化的服务, 以及提升用户体验将成为情报学研究的重要问题。情报分析领域, 决策式AI 虽能凭借强大的分析、判别、预测功能, 为智能情报分析和服务提供助力, 但具体的分析策略、合适的算法模型等细节问题仍需要考虑。生成式AI 可直接生成创造性的情报分析初级产物, 由此引发的新研究问题则是如何对情报产品的价值评估与内容优化。在信息检索领域, ChatG?PT 以自然语言和多语言交互以及连续对话的方式实现从“模糊搜索” 到“精准推送” 的跨越, 使得跨语言检索、以提高查全率和查准率为目的的情报检索策略和保障研究不再是重点, 但ChatGPT无法绝对保证生成内容的准确、正确和真实, 并且难以溯源。因此, 将生成式AI 融入传统情报或知识检索系统以实现更高效、正确和情境化的搜索,以及情报溯源尤其是错误和虚假情报的溯源是未来研究的主要方向。此外, ChatGPT 直接给出答案而抛弃搜索列表对比的方式, 一方面会将情报相关性问题转移到更重要的情报可靠性和可信性问题上;另一方面从某种程度上来讲, 会导致更严重的信息茧房, 对此类现象造成的影响和破除策略问题也应成为情报学研究的重点。在知识管理领域, 生成式AI 将会改变知识产生的速率、知识组织的形式以及流转的方式, 能够对知识库、案例库等多来源知识的集成提供强有力的支撑。情报学后续研究应重点思考如何利用生成式AI 赋能知识重组、知识库构建、知识共享等问题。在信息技术应用领域, 如何对大型语言模型进行微调, 或调用ChatGPT 类的大型语言模型的API 接口, 使其应用于情报领域的各类任务场景中, 是生成式AI 与情报学融合发展需考虑的关键问题; 而将生成式AI 应用于各个专业领域时, 面临的首要问题便是训练语料的开发、选择和动态更新, 这也是情报学在情报资源开发与利用研究中应该着重考虑的方向。

2.2数据源的扩展

大数据时代, 数据成为情报学研究不可或缺的要素。同时, 随着情报工作在各个领域的渗透, 情报学研究对象也不断拓展。数据源不仅仅是科技文献资料, 还包括社交媒体数据、知识服务平台数据、政务数据、网络计量数据、商业数据及科技数据等,数据形式呈现为多模态。如今, 以ChatGPT 为代表的生成式AI 的发展, 使情报学研究在数据获取方式以及获取的数据类型方面发生了变化。从数据获取方式来看, 目前情报学在研究信息搜索或信息行为时, 多采用问卷调查、访谈、网络爬虫、API 接口等方式获取数据; 在计量学研究中, 多从引文数据库或新兴的替代计量网站中导出相关指标。而Chat?GPT 等生成式AI 可提供一种新的数据获取方式。比如, 在保证数据获取合规的前提下, 可將ChatGPT嵌入搜索引擎、知识库或社交媒体中, 研究者根据需求向ChatGPT 发出请求, 指定数据范围、字段类型等, ChatGPT 可自动采集、筛选并返回特定格式的数据, 如表格形式。从获取的数据类型来看, 除了科技文献、用户生成内容、计量指标等数据以外,ChatGPT 等生成式AI 催生了新型的人机行为模式,这些对话式人机交互数据能够为用户需求、信息行为、用户感知与认知因素分析提供新的来源。另外,网络中真实数据的质量良莠不齐、标准不统一, 会使数据的利用复杂化, 增加情报分析任务的难度。而基于生成式AI 的合成数据将会填补情报分析需求与数据可用性之间的差距, 可应用于情报研究的各类任务场景中。从另一角度来看, 无论是用户生成内容(UGC), 还是通过搜索引擎获取的信息, 大都属于原始数据。与之不同的是, ChatGPT 给出的不是资源, 而是答案, 是对海量资源进行整合、归纳总结的结果。从该层面来看, 随着生成式AI 的发展, 情报学研究收集的数据也可以是经过筛选、整合、分析处理后得到的增值数据, 对这些数据进一步深度挖掘, 或直接用于解决特定的问题, 从而减少数据处理任务的复杂度。除此以外, 如果跳出情报学研究所使用的数据源范围, 而从更广泛的角度来看, 相对于学术文献、专利文献、科技报告、政府信息资源等类型的资源, AI 生成内容可以说是一种可供情报学研究的新的信息资源类型。

2.3研究范式的升级

根据美国科学哲学家库恩[22] 的阐释, 范式是指在学术群体内共同接受的一组由理论框架、观点、研究方式等构成的范例。情报学经过长期发展, 已形成多元范式融合的研究局面, 比如信息论范式、学术交流范式、决策情报服务与社会信息服务范式[23] ; 基于Intelligence 的软科学范式、基于Information 的图书信息学范式、基于信息和知识管理框架的管理科学范式[24] 。根据王琳[25] 的梳理,文献理论、信息理论、知识理论分别是物理范式、认知范式、领域分析范式的主流理论, 如果按照DIKW 的逻辑, 情报学未来主流理论或许为智慧理论, 如此也必然推进智能驱动的科研范式升级。尤其是在大数据和生成式AI 技术的不断发展过程中,情报学研究将致力于更具创造性的任务中, 解决复杂性科学问题。在以科技文献为分析对象的知识挖掘与知识服务研究领域, 鉴于ChatGPT 强大的上下文理解与文本生成功能, 若将其整合至中国知网等知识发现平台, 便可集成专家智慧与机器智能,发挥其对海量文献关键信息提取与分析、相似文献推荐以及内容创作的优势, 使得从粗粒度的文献综述、主题发现, 到细粒度的知识元抽取任务轻松完成。如何在人机共生的科研环境下发掘更复杂的研究问题(即智慧知识) 成为一种新的思维。比如,如何结合情报学专家智慧与AI 技术自动生成新的技术要点或研究方案, 为科技创新提供直接的情报来源, 成为新的研究方向。在用户信息行为研究领域, ChatGPT 能够以更接近人类的思考方式有效捕捉用户意图与情感倾向, 学习数据产生的模式, 并创造新的内容。在用户情报需求挖掘与情报服务的研究中, 需要思考的是如何使情报思维与AI 深度融合, 实现情报服务策略的自动生成, 赋能情报生产能力。简言之, 情报学未来的研究范式将以智慧理论为主导, 以生成式AI 与情报学的融合研究为重点, 探索如何利用情报学专家智慧、情报思维、情报分析逻辑, 使生成式AI 更好地适应专业领域的复杂研究任务, 实现从智能情报分析到智能情报生成的过渡。

3生成式AI 对情报实践工作的影响

一般地, 情报学理论范式指导情报实践工作。有研究将情报学理论范式分为4 种, 并阐释了每种范式下的情报工作重点和发展趋向, 分别是: 泛信息论范式下的知识管理与综合性知识服务; 学术信息服务范式下的信息检索与服务; 决策情报服务范式下的战略情报支持; 社会信息服务范式下的企业竞争情报、社会情报、舆情传播等[23] 。鉴于这4种范式较为全面地覆盖了情报实践工作的内容, 因此本文将以此为视角, 分析生成式AI 将对情报实践产生的影响, 如图1所示。

3.1拓宽知识资源建设渠道, 打造知识服务新生态

知识服务是各类情报机构的一项重要职能, 而智慧型知识服务是人工智能时代的产物。生成式AI又将推进智慧型知识服务向高级阶段的进化。从知识生产层面, 传统的知识资源多出自出版社、数据库商以及情报机构的自建数据库和知识库。生成式AI 的出现将拓宽情报机构知识资源建设的渠道, AI 辅助用户内容创作、AI 自动生成内容成为新的知识生产模式。一方面, 每个用户可参与到知识生产过程中, 通过AI 辅助获取知识创作的灵感、素材, 由AI 生成文本、图像、代码、3D 模型等多模态知识, 实现内容续写、跨模态内容生成(文字合成图片或视频等), 可极大提升用户体验; 另一方面, 生成式AI 能够通过学习数据的底层模式再自动生成新内容。但就目前最先进的生成式AI 技术ChatGPT 而言, 一大特点就是无法保证生成内容的准确性, 这与知识的属性相斥。近期发表在Nature 上的文章《ChatGPT: 五大优先研究问题》中, 研究者指出, ChatGPT 被用于科学界, 必须要坚持人类审查的原则[26] 。这无疑对情报机构提出了新的挑战, 即缺少前端的专家审核, 情报机构需要承担对AI 生成知识内容的人工审核与质量把控的任务。从知识服务层面, 随着元宇宙概念的提出, 情报服务机构致力于构建结合AR、VR、人工智能等技术的超现实空间与现实空间融合的虚实共生的知识服务场景, 而生成式AI 技术也将为此贡献巨大力量, 比如利用AIGC 生成虚拟人或数字人, 利用“ChatGPT+虚拟人” 技术打造人机交互新入口, 为用户提供沉浸式、立体化知识体验, 有助于拓宽情报机构知识服务的范畴, 构建知识服务新生态。

3.2塑造学术信息检索新范式,优化学术信息服务模式

ChatGPT的出现对搜索引擎业务构成了较大威胁, 但百度指出生成式AI 并不能替代搜索引擎,两者是一种互补的关系, 并提出了融合两者功能的“生成式搜索” 概念, 这对情报领域的学术信息搜索发出了信号。一方面, 针对以Web of Science、中国知网、情报机构自建知识库等为代表的學术信息搜索平台, 如果借鉴ChatGPT 与WebGPT 的联动效应, 将生成式AI 整合至学术搜索平台中, 使其实时根据数据库内容更新, 生成的内容参考了某篇学术论文则注明其来源。用户关于某一研究主题得到的检索结果将不仅是文献列表, 也能呈现由生成式AI 筛选、整合、总结生成的文献综述, 又或是根据读者描述的研究思路, 基于对海量文献中图表、图像数据的学习, 生成技术路线图以供参考,甚至是针对某领域的研究成果, 利用生成式AI 抽取细粒度知识, 自动生成学术知识图谱, 把复杂的关联研究直观地呈现给读者, 以交互式问答方式回答读者的问题, 并通过连续对话提升读者体验; 另一方面, 对于学术科研互动社区, 生成式AI 在学习了科研用户海量的问答数据之后, 可针对用户搜索或提问生成答案。由此可以预测, 生成式AI 将会重塑学术信息检索新范式, 有助于优化信息服务模式,但其能力边界与训练时被投喂的数据数量、质量、丰富度有很大关系, 这将是情报实践工作中着重考虑的问题。此外, 最重要的是, 基于AI 的学术信息服务需在明确的使用规范前提下开展, 避免被错误和虚假信息误导而产生学术不端等后果, 这一问题正是当前学术圈讨论的热点。

3.3挑战决策情报服务体系, 驱动情报效能提升

决策支持服务是情报工作的一项重要内容, 主要面向国家科技战略、产业发展与产业结构政策、学科发展等战略决策型关键问题, 通过文本挖掘、科学计量等方法深度剖析科技发展态势、学科演化、政策布局, 形成战略咨询报告。ChatGPT 发布以后, 被尝试用于生成行业分析报告、市场调研报告等。其使用了来自人类反馈的强化学习方案, 具备良好的思维链能力, 能够针对特定问题自主生成解决方案。虽然从目前来看, 生成的报告内容仍然不够专业可信, 并不能直接用于指导决策, 但随着不断地反馈学习以及模型算法的优化, 性能会极大地提升。这对面向决策支持的情报服务产生了较大的冲击和挑战, 然而并不会完全取代情报人员的工作, 而是作为辅助工具加速推进决策支持服务的智能化, 驱动情报效能的提升。因为, 即便是在Zero-shot 设置下执行下游任务, 也需要向AI 输入提示。换言之, 在决策支持服务中, 最基本也是最重要的环节是情报分析对象、方向、预期的情报产物形式与内容(比如战略报告的框架)的确定, 生成式AI 仅作为辅助情报分析与内容生成的工具, 前提是情报人员向其输入合适的问题, 这意味着情报人员需要对用户需求有深刻的理解并承担情报产品的设计工作。从另一方面来看, 生成式AI 有助于将情报人员从琐碎的分析、撰写任务中解放出来,更多地投入创新性研究工作中。比如, 在利用科学计量学分析方法辅助制定科技发展战略规划时, AI可以依据已有的理论和方法, 针对特定问题基于数据挖掘生成分析报告, 但探索计量学新理论、新定律, 具体到更加科学有效的新的指标体系构建等创造性工作中, 仍然需要专业人员的深入研究和持续创新。

3.4增加社会信息服务压力, 凸显情报价值引领

在社会信息服务范式下, 情报工作在企业竞争情报服务、安全情报服务、舆情风险预警与治理、数据治理等领域发挥着重要作用。生成式AI 在赋能情报收集、处理与分析的同时, 也会带来一系列负面影响, 增加情报服务的压力。比如, 在社会安全和舆情治理方面, ChatGPT 可能会成为谣言制造者或舆论引导者的辅助工具, 在一些误导性、充斥阴谋论的提问下大量改编信息, 引导社会舆论向片面、极端的方向发展。这在一定程度上会加大风险的情报感知与情报预警的难度。在数据治理方面,近年来关于科研大数据治理、企业大数据治理、政府大数据治理等问题愈发重要, 治理的维度涉及数据安全、数据标准、数据质量等。伴随着ChatGPT等生成式AI 的快速发展, 海量AI 生成数据涌向经济、科研、政务等各个领域, 由此带来的数据治理压力是巨大的。从生成式AI 模型的工作原理来看,生成数据的质量取决于训练时被投喂的数据质量和输入提示的有效性。因此, 数据治理不仅涉及到AI 创造的内容, 同样涉及训练数据和提示数据。可以预见, 情报学在数据治理领域将面临较大挑战, 具体包括AI 生成数据的质量管理、标准化、数据归类、数据产权归属等各类问题。然而, 从另一个角度来看, 生成式AI 在增加社会情报服务压力的同时, 也更加凸显情报的价值和社会效用, 如何充分发挥情报在综合研判、监测预警、信息汇聚与治理等方面的作用, 更好地服务社会发展, 是情报工作在AI 冲击下保持优势地位的关键。

4生成式AI的局限性与情报学应用考量

从短期来看, 生成式AI 仍存在诸多不足, 以ChatGPT 为例, 亟待解决的问题主要有3 个方面:合规性问题、生成内容问题和技术性问题。情报学在借助ChatGPT 等生成式AI 从事研究与实践工作时需慎重考量。

1) 从合规性来看, ChatGPT 的训练数据与生成数据是否有相应的知识产权尚未明晰; 如果被用于学术研究, 有哪些使用边界尚未确定。情报学与信息科学、数据科学有着天然的联系。对情报学而言, ChatGPT 不仅是工具, 其生成内容也是情报学的研究对象。因此, 情报界在开展研究或从事实践工作时, 更应注意数据收集和利用的合规性, 以及对ChatGPT 的使用界限。

2) 从生成内容来看, 首先, 现阶段ChatGPT回答的内容没有进行实时信息关联, 对后期变动的问题无能为力, 并且ChatGPT 生成内容的正确率无法保证, 尤其是在专业性较强的领域, 容易造成虚假信息, 对用户产生误导。反观之下, 作为特殊的信息产品, 情报具备知识性、效用性, 决定了情报工作的严谨性、客观性与及时性。因此, 情报学在应用此类生成式AI 时需要考虑训练语料动态更新的问题, 并努力探索对AI 生成内容质量进行评估和审核的方法。

3) 从技术性来看, 由于专业领域没有足够的语料“喂食” ChatGPT, 如果直接用于情报学研究與情报实践, 无法生成适当的回答。鉴于ChatGPT 的底层原理不够明晰, 《ChatGPT: 五大优先研究问题》一文的研究者呼吁应优先考虑开源AI 算法的开发和应用[21] , 在此基础上还需要投入大量的算力支撑。由此可见, 生成式AI 与情报学相融合的研究与实践工作还需要突破诸多难题, 比如用于训练的海量专业数据的开发与标注、算力提升等。

针对目前生成式AI尚存的一些问题, 情报学也应致力于利用本学科知识, 为减少乃至突破局限做出贡献。比如, ChatGPT 所提供的答案, 是通过自主学习后生成的自我认为的最佳答案, 但是否真的是最佳(准确率问题以及没有唯一解的相关性问题)有待商榷, 情报学可探索关于AI 生成内容质量评估的相关理论, 为科学交流提供判据; 针对ChatGPT 可能带来的虚假信息、有害信息传播和信息安全等问题, 可通过危机预警情报服务限制其大范围传播; 信息资源的开发和利用是情报学传统的核心研究领域与工作范畴, 情报学的方法论在生成式AI 产生的信息资源管理和为生成式AI 提供信息资源上, 可以有更大的贡献。未来, ChatGPT 等生成式AI 在专业领域的应用首要解决的问题是训练语料的开发, AI 的训练效果很大程度上取决于语料的质量, 情报学可作为生成式AI 训练语料的提供者, 致力于语料库的开发与利用工作。

5结语

在生成式AI迅速崛起的时代背景下, 情报学研究与情报实践将会受到巨大的冲击。无论是情报学研究范式、研究问题, 还是情报服务模式, 都将发生极大变化, 可能波及信息组织(信息分类与标引、信息描述)、信息检索(多媒体检索、跨语言检索、检索策略、相关性判断)、知识管理(知识获取、知识抽取、知识推理)、情报咨询服务等各个子领域。这对情报学发展而言, 既是机遇也是挑战。情报学应积极拥抱AI 的优点, 探索汇聚生成式AI 的情报学研究与情报实践新格局, 但同时要保持审慎的态度, 对AI 应用的益处与风险有清醒、全面的认知。最重要的是, 注意挣脱技术和工具的束缚, 致力于探索更高层次、复杂性的科学问题,以丰富情报学理论、拓展情报服务为根本, 乘AI技术发展东风, 促进情报学的可持续发展。

本文从情报学研究与情报实践两个维度, 初步思考了以ChatGPT为代表的生成式AI 可能对情报学产生的影响, 一方面, 展望未来情报学研究和情报工作将会发生的变化, 为本领域科研人员和情报工作者应用生成式AI 提供参考; 另一方面, 为生成式AI 与情报学的交叉融合, 对情报学在面临新一代人工智能冲击时如何转向与应对试图抛砖引玉。未来人工智能技术将不断取得突破, 情报学应利用AI 赋能学科创新发展, 永保学科先进性。