APP下载

从GPT技术爆发到应用的文献综述

2025-02-13杨光

数字通信世界 2025年1期
关键词:生成式人工智能文献计量文献综述

摘要:GPT技术正在改变人类生产生活的方式,有必要对此类技术相关文献进行梳理,为未来深度议题聚焦提供方向参考和理论借鉴。本文采用文献计量法,通过对知网社会科学方向论文高频学科和主题词统计和聚类分析,聚焦生成内容应用场景、哲学伦理、教育、法律安全四个层面,对科研热门领域和主题进行情报分析。

关键词:GPT;生成式人工智能;情报分析;文献综述;文献计量

doi:10.3969/J.ISSN.1672-7274.2025.01.061

中图分类号:G 351;TP 18 文献标志码:A 文章编码:1672-7274(2025)01-0-03

A Literature Review on the Explosion and Application of GPT Technology

YANG Guang

(Fujian Agriculture and Forestry University Library, Fuzhou 350000, China)

Abstract: GPT technology is changing the way humans produce and live. It is necessary to review the relevant literature on this technology to provide direction and theoretical reference for future in-depth topics. This article adopts bibliometric method to conduct statistical and cluster analysis on high-frequency disciplines and keywords in the social science direction of CNKI, focusing on the application scenarios of generated content, philosophy and ethics, education, and legal security, and conducting intelligence analysis on hot research fields and themes.

Keywords: GPT; generative AI Intelligence analysis; journals reviewed; bibliometrics

GPT是基于Transformer架构的自然语言处理模型,该架构最初由Google提出。2018年,OpenAI发布了第一个GPT模型(GPT-1),2022年11月GPT-3.5(即ChatGPT)上线,不到一周的时间,用户量就超过了100万人,推出两个月便拥有上亿的活跃用户。GPT技术从此成为技术界甚至全球关注的焦点,也开始成为引领人工智能技术研究的新热点。最新版本GPT-4o可以处理文本、音频和图像任意组合作的输入内容,能听说会唱,还能带着情绪和人聊天[1]。OpenAI于2024年2月推出了类似技术的大模型Sora,用户只需提供简单的文本描述就能生成具有丰富细节和连贯性的视频。

各大厂商纷纷加大GPT类技术的研发投入,该类技术得到了飞速发展,应用场景不断落地,形成了如今“一超多强”的局面。谷歌无疑是追赶最紧的那个,2024年5月,谷歌对应GPT、Sora对自己的大模型Gemini发布了一系列更新产品,谷歌邮件可以利用该模型识别电子邮件,然后帮你总结出要点;可以把材料或会议记录输入,整合成科学讨论来帮助学生或教师等。微软因投资OpenAI公司使GPT技术在微软的商业化过程中得到了广泛应用。2024年2月,微软旗下GitHub宣布GitHub Copilot Enterprise正式全面发布,利用高质量数据和GPT模型,能够按要求获取、审核、扩展得到安全可靠的代码。Microsoft 365 Copilot也在颠覆着Office用户的工作方式,可通过文字对话,让Excel操作数据生成文笔一致的Word内容,让PPT自动排版,重新设计等。音乐科技领域的创新者Suno只需用户要提供文字,就能生成相关曲风、流派的音乐,大大降低了音乐制作的门槛。机器人公司Figure AI因为深度使用GPT技术,被业界誉为最有潜力的机器人公司之一。

截止到2023年5月,美国10亿级参数规模以上的GPT类大模型就已突破100个,中国10亿级参数的大模型数量如今也超100个[2],如字节跳动的豆包大模型、百度的文心大模型等。GPT类技术应用正在改变国内在各行各业的生态,有必要对此类技术相关文献进行梳理,为未来深度议题聚焦提供方向参考和理论借鉴。

1 研究设计

1.1 文献收集和筛选

本文按照系统性文献综述的标准展开文献收集、筛选、分析工作。第一,以中国知网作为检索平台,将已发表的社科方向学术论文作为研究对象进行统计;第二,将数据来源类别设为北大核心、SSCI、CSSCI;第三,使用“ChatGPT/GPT/LLM/大语言模型”作为主题词进行搜索,时间截止到2024年4月30日。总共检索出2 627篇学术论文,其中满足条件的1 203篇,人工进行核对和查重后得到1 195篇中文文献。

1.2 论文基本情况

表1展现了近5年中文社科方向相关研究文献发表数量的分布情况。从整体上看,在2023年之前,GPT类技术社科方向的研究论文几乎没有,从2023开始爆炸性增长,2024年与2023年环比持平。一方面,GPT技术从爆发到国内应用经历了至少两年时间,引发学者对国内社会变化的研究;另一方面说明GPT技术从诞生以来备受关注,其在社科方向研究领域具有持续的热度和巨大的发表潜力。

表2展示了最热门学科和主题词频次排序前十。热门学科常用于关键词影响较深的热门领域,而高频主题词常用于确定领域的热点方向。本文已经忽略人工智能、ChatGPT、大语言模型等共性且笼统的热门学科和主题。

经过聚类分析聚焦四个领域,分别是关于生成式人工智能生成内容与应用场景的探讨(#C1,#C3,#C4,#C5)与主题词(#T2,#T3,#T4,#T5)联系较为密切;哲理伦理学话题(#C8)与主题词(#T1,#T10)联系较为密切;而教育层面(#C2,#C7)与主题词(#T1,#T5,#T8)联系较为密切;法律与安全层面(#C6,#C9,#C10)与主题词(#T1,#T6,#T9)联系较为密切。

2 聚焦科研热门领域

2.1 生成内容与应用场景层面

(1)研究方法。GPT大模型技术是黑盒子,随着对GPT技术认识的加深,研究者从研究模型可解释性逐渐开始转向以类似脑科学的研究方法研究GPT技术作为新的尝试。如清华大学脑与智能实验室首席研究员刘嘉最新研究论文《从脑科学+人工智能角度讲透GPT-4》等。

(2)使用方法。如何引导GPT更高效地完成交代它的工作是近两年arXiv发表的论文热点之一。如中国学者吴娜等的论文《AIGC驱动古籍自动摘要研究:从自然语言理解到生成》,金源等的论文《基于ChatGPT的问答式财务知识库构建与应用》都在特定领域尝试通过更好的提示词组合,生成更理想更稳定的内容。

(3)评估方法。当今模型好坏通常通过参数多少、吞吐量大小、计算速度等维度进行比较。但随着应用在细分领域的不断落地,此评估方法太过粗犷,模型大小无法等同于体验好坏、模型能力大小,迫切需要建立新的模型评估体系。如研究者罗文、王厚峰研究的论文《大语言模型评测综述》中介绍了企在探寻大语言模型评测的新方法。

2.2 哲学层面

(1)技术伦理方向。GPT类技术应该是监管式的发展还是冒进式发展,发展过快是否对人类生存产生威胁?不少人有这样的担忧,甚至在GPT技术诞生的OpenAI公司内部也存在分歧。分歧产生了不同的科研方向和观点,一种观点对通用人工智能充满警惕,担忧AI会对人类的生存造成风险,研究者坚持用谨慎的态度来发展AI,如发起的“超级对齐”的项目。另一种持有者是有效加速主义者,认为人类目前面临的大多数问题,都能通过技术进步和不断增长来解决,在研究上更加激进、更商业化。

(2)意识方向。AI狂暴发展的劲头会让机器产生意识么?智能和意识是哲学领域研究的一大课题。一派论文作者认为智能和意识是无法分开,虽略有不同但连续成整体。训练大模型的数据是人类信息的载体,承载信息量密度最高的是文字,其次是图片、视频等。GPT承载了人类意识的一部分,它能够自主学习、自动规划、自动推理、判断并进行知识迁移等,应视为拥有某种形式的意识[3]。另一派论文作者则努力证明GPT技术只是一种信息的压缩技术,将人类信息存放在大数据里,机器快速地将需要的信息提取给人类。意识是更高的维度,两者是无法跨越的,不会产生意识甚至威胁人类。

2.3 教育层面

(1)学术不端的争议。有研究表明GPT已经在很多领域拥有知识专业度超越了普通研究者,而且具有强大的文献搜索、梳理和整合能力,生成物为学生在学术中“舞弊”成为可能,但此行为在学术界仍各执一词。一部分观点认为,生成物往往是有套路的,分析不够充分,未能达到学术论文的标准。做学术主要关注的是创新点,所以应该将GPT类生成物看成工具,不宜认定成学术不端[4]。但也有一些认为,完成论文体现的是学者动手能力和提出、分析和解决问题的能力。而随着GPT功能的强大,生成的内容越来越深入让人很难分辨是否有学者的参与,依赖GPT生成的作品类似于“代写”,属于学术不端的行为。

(2)人才培养的新模式。如何调整人才培养模式以适应GPT这种具备更大的容量、更快的速度和更强的知识分享能力的技术是教育研究者的另一个热门课题。有学者提出,大学需要对某些学科进行重构,将人工智能相关知识纳入各学科体系,甚至使其成为所有大学生必备的素养,这样有利于更好地利用该技术实现科研目标。同时,大学也需要加强人机伦理道德教育,培养辨识利与弊的能力,并据此引导人工智能向有益于社会的方向发展[5]。

2.4 法律与安全层面

(1)法律方向。GPT技术带来的改变,法律应该如何完善和调整是法律工作者相继研究的热门课题。首先,判定困难。GPT是生成式的预训练模型,大部分公司没有公布训练使用的数据,2023年12月,就有11名美国作家起诉OpenAI用他们的作品训练ChatGPT,直至今日,起诉的结果还未有定论[6]。其次,裁判责任时由开发者承担还是使用者承担存在争议。一部分论文中指出,人工智能司法责任承担必须以保护公共利益为优先,由使用者优先承担责任,更有利于此目标的实现。因为只有使用者与利益具有最紧密的关联性,如果不予问责或者逃避问责,会对公共利益产生最大程度的侵害[7]。而另一部分学者认为,GPT类生成式模型并非传统意义上的“辅助工具”,如果模型在训练中使用了侵权的数据进行训练学习,生成的内容便存在侵权风险。而使用者作为此事件的弱势群体往往不自知。让使用者承担主要责任,会使模型的生产者逃避法律责任,甚至为了追求利益造成更大规模的侵权事件。最后,GPT生成物著作权争议。传统观念著作权作者只能是自然人,有的学者认为,由算法、模板生成的结果,不能体现作者独特的个性,故难以构成著作权法意义上的作者。但也有知识产权界的教授指出,著作法只保护独创性而非创作过程,只要达到独创性标准,就能够视为作品[8]。

(2)安全方向。生成式人工智能技术正在迅速进步,原文上的篡改、音域上的模仿、视域上的捏造,这些虚假信息与生成式人工智能技术已经深度结合,导致虚假信息数量呈指数级增长[9]。同时在利用GPT类技术时,有上传数据信息泄露风险,也是摆在国家和治理者研究的课题之一。

3 结束语

如今看来,GPT类技术改变人类生产生活是大势所趋,无法阻挡,此类技术影响世界的发展进程,其技术特征与应用效果也日渐明朗。本文通过系统梳理知网关于GPT类技术社会科学方向较为核心的1 195篇文章,初步绘制出了国内科研的前沿知识热点地图。通过分析框架聚焦四个层面九个热门方向,并大致介绍了如今科研热点话题或研究现状,厘清了GPT类技术当前的研究脉络,可为未来深度议题聚焦提供方向参考和理论借鉴。

参考文献

[1] Hello GPT-4o[EB/OL]. (2024-05-13)[2024-05-13]. https://openai.com/index/ hello-gpt-4o/

[2] 腾讯网.2023AI大模型应用中美比较研究报告[EB/OL].(2023-09-26)[2024-03-25]. https://new.qq.com/rain/a/20230926A099R000

[3] 张俊.人工智能意识问题的哲学省思[J].山东社会科学,2024(2):48-58.

[4] 侯利阳,李兆轩.ChatGPT学术性使用中的法律挑战与制度因应[J].东北师大学报:哲学社会科学版,2023(4):29-39.

[5] 眭依凡,幸泰杞.人才培养模式创新:人工智能时代大学的紧迫课题[J].中国高教研究,2024(3):8-16,21.

[6] 新浪财经.因涉嫌侵犯版权,OpenAI和微软遭多位美国知名作家起诉[EB/OL].(2023-12-22)[2024-03-26].https://baijiahao.baidu.com/s?id=1785960763089159204

[7] 江必新,陈梦群.司法审判的根本遵循——习近平司法理论述要[J].法律适用,2022(5):3-12.

[8] 吴汉东.人工智能时代的制度安排与法律规制[J].法律科学(西北政法大学学报),2017,35(5):128-136.

[9] 鲍家琴.生成式人工智能视域下虚假信息的法律风险及规制[J].中国价格监管与反垄断,2024(3):90-93.

作者简介:杨 光(1990—),男,汉族,内蒙古乌海人,助理馆员,本科,研究方向是数据挖掘、机器学习、情报学等。

猜你喜欢

生成式人工智能文献计量文献综述
挑战·融合·变革:“ChatGPT与未来教育”会议综述
生成式人工智能重塑教育及教师应对之道
人机共生时代国际传播的理念升维与自主叙事体系构建
生成式人工智能的教育应用与展望
我国医学数字图书馆研究的文献计量分析
国内外智库研究态势知识图谱对比分析
国内外政府信息公开研究的脉络、流派与趋势
现金分红与掏空文献综述
基于文献计量分析我国生物科学素养研究状况(2001~2016年)
马克思创新思想研究综述