公众对ChatGPT关注的舆论焦点与情绪研究

2023-12-05孟伦杨博文

传媒 2023年22期

文/孟伦杨博文

ChatGPT是由OpenAI创造的生成式人工智能聊天机器人程序，能够帮助使用者开展文本生成、开放域问答、分类、摘要、编写等活动。OpenAI于2022年11月30日首次发布GPT模型，凭借着较低的操作门槛和便捷的接入方式，将人工智能“祛魅”，使其广泛地进入人们的生活。作为多维高拟真人工智能的代表，ChatGPT的兴起受到了公众的广泛关注并引发了热议，因此对公众的关注焦点议题及其情绪态度展开数据挖掘和分析梳理具有重要意义。

一、文献综述

在中文新闻传播学界，ChatGPT的兴起和应用引起了广泛关注，讨论话题主要围绕技术原理及其完善方向、技术产生的深远影响、采纳者特质及其采纳动因三个方面展开。在研究开展的早期阶段，对技术原理及其完善方向进行介绍的研究占据主流，如王建磊等人撰文指出ChatGPT具有超模拟传播特质和反延伸的传播逻辑。郭全中等人认为可迁移性提升、内生偏见和研发成本降低是ChatGPT的突破关键。方诗诗等人将ChatGPT的生成错误类型分成23类，并对其错误生成的内在机制进行解释。随着人们对技术原理和特性有了更多的了解，越来越多研究者注意到ChatGPT代表的技术革新对社会将产生深远的影响。郭全中指出ChatGPT的出现将带来通用人工智能（Artificial General Intelligence，AGI）领域的产业升级。喻国明等人进一步指出ChatGPT将在信息层面、个体层面、连接传播层面激发传播生态格局的变化，社会的治理逻辑也会随之改变。方兴东等人着重分析了智能传播时代与之前相比的革命性变革。除了对技术原理与技术引发的影响展开研究外，对技术采纳者的关注也是传播学研究的经典问题，这类研究中比较有代表性的是强月新等人运用扎根理论分析了ChatGPT使用者采纳新技术的社会动因和文化动因，对于新技术的革新、冲击和缺陷，采纳者采用了推崇、接受和包容的态度，新技术采纳既是知识阶层构建身份认同的原材料，也是认同表达的符号和象征。整体而言，目前国内对ChatGPT的研究方向主要集中在ChatGPT的技术特质、社会影响及采纳者特质，对更广泛的公众围绕ChatGPT关注的焦点议题与情绪变化趋势尚缺乏了解。而此类研究的开展，将为学界更好地探索ChatGPT提供参考。

二、研究方法

为了探究ChatGPT发布以来公众的舆论焦点与情绪态度，本研究以微博作为文本收集对象，以主题模型分析和情感分析作为研究方法展开分析。

1．主题模型分析。隐含迪利克雷分布（Latent Dirichlet Allocation）主题模型方法（简称LDA）是一种数据分析模型。这一方法已替代传统内容分析方法，成为提炼海量数据主题的主流方法，近两年已有中国学者将其应用于国内微博用户讨论话题的主题聚类研究，显著提高了海量数据处理效率和精准度。ChatGTP诞生之初亦有海外研究者运用该模型分析了推特用户对其讨论的主题分布。本研究以“ChatGPT”为关键词在新浪微博上收集了从2022年11月30日到2023年4月30日的82502条原创微博文本，经过分词、停用词处理、文本向量化、困惑度分析等步骤得出可视化图表。为了更好地呈现公众对ChatGPT的动态关注状况，本研究在LDA主题模型分析基础上引入了动态主题分析模型——DTM（Dynamic Topic Model），用以分析舆论主题的动态变化。

2．情感分析。情感分析（Sentiment Analysis）指利用自然语言处理技术对带有情感倾向的主观性文本进行分析，本研究对收集到的微博文本进行情感分析，其中情绪值大于0的表示文本显示积极态度（最大值为50），情绪值小于0的表示文本表达消极态度（最小值为-50），且数值越大所代表的相关情绪词数量越多（见表1）。

表1 ChatGPT微博文本情绪值示例

三、研究发现

通过主题模型分析和情感分析，本研究总结出了公众对ChatGPT的主要舆论焦点和具体的情绪态度状况。

1．公众关注ChatGPT的五个舆论主题。本研究利用代表性词语和其所对应的推文进行了LDA主题模型分析，得出公众对ChatGPT的关注方向主要聚焦于网络安全、股票、投资、科技、使用体验这五个方面（见表2）。

表2 公众关注ChatGPT的LDA主题内容

在“网络安全”主题中，关于“AI赋能网络安全”领域，公众认为人们在未来可以利用AI技术使网络环境更加安全，如微博某博文认为“云是安全的未来，AI/ML早就成为现代化网络安全的核心基础技术。微软安全其实卖的就是全球领先的AI/ML技术，以及无与伦比的安全情报和大数据。”但并不是所有用户都对此表示赞同。关于“AI造成安全问题”领域，公众认为AI技术可能会导致网络环境安全性下降。如有外国媒体报道了欧洲警察组织的警告：“像ChatGPT这样的大型语言模型（LLM）是危险的，因为它们使犯罪分子更容易采取行动。”关于“监管措施”领域，公众主要讨论了对人工智能的监管问题。如微博某博文引用新华社的报道：“政府和运营商都在加强相关管控趋势，建议将伦理道德融入人工智能全生命周期。”

在“股票”主题中，关于“股票资讯”领域，公众从理财方面关注其股票资讯，如“财经婉儿”发布文章：“世界著名的生命未来研究所，日前向全社会发出一封‘暂停大型人工智能研究’的公开信，呼吁所有人工智能研究室，立即暂停比ChatGPT更强大的人工智能系统的训练。”关于“股市评价及预测”领域，公众讨论了关于股票资讯的评价，以及未来股市的预测。如“ChatGPT概念股午后探底回升，多股涨超10%……而深证与创业板随着今天的冲高，个人认为，短期也应有一定的整理需求。”

在“投资”主题中，关于“投资方及看法”领域，主要包含马斯克、巴菲特、马云以及网上的公知等人对ChatGPT的投资前景的判断以及做法，如“马斯克领衔，1000多位硅谷企业家和科学家签名呼吁：立刻停下所有AI研究。这一突如其来的呼吁，主要是由于科学家们发现AI已经出现其无法解释的推理能力。”关于“投资风向及政策”领域，主要指对于投资人工智能领域的政策指向，如工信部近日的区块链与分布式计算征求意见稿：“如果允许公链及其token的发展，那国内的区块链技术将会有很大的提升。”

在“科技”主题中，关于“ChatGPT的简单发展过程和运作模式”领域，主要是简单介绍ChatGPT的发展过程和工作原理，例如，“GPT-3代表自然语言处理领域新的技术突破，直接给模型输入一些例子，通过这些例子改变模型的内部状态，生成所需要的答案。”关于“ChatGPT技术优缺点及其社会问题”领域，集中在对ChatGPT优缺点的讨论，如正面评价有“当通过国内大佬建立的镜像站，看到ChatGPT生成出的文字出现在我的电脑屏幕上，我就仿佛是第一次见到550c的图恒宇”。关于“ChatGPT的未来发展方向以及中国版ChatGPT可行性”领域，聚焦于对ChatGPT次生问题的担忧，“最近看了很多ChatGPT的话题和讨论，再结合三体里描述的场景，我对未来AI应用，甚至可能取代自己的职业产生了深深的焦虑”。

在“使用体验”主题中，关于“ChatGPT的使用方向”领域，主要讨论了ChatGPT平时的使用过程，如“我很早就注册了ChatGPT账号，除了尝鲜外，主要还是为了娃写毕业论文。玩过一段时间就没管了…… ”关于“对ChatGPT的使用感受”领域，主要讨论了对ChatGPT使用感受的评价，如“当你被别人欺负时，如果你哭着告诉你爸爸，他会很不耐烦地对你说，你有没有种啊，你还是不是我儿子？你去把他们揍一顿！但如果你告诉这个白左ChatGPT，它会告诉你欺负别人是不对的，报复别人也是不对的，然后你的性格会越来越懦弱。”

值得注意的是，国外学者Viriya曾做过相关研究，他收集了推特上的约23万条ChatGPT主题推文进行LDA主题分析，并将推文分为一般主题、功能领域和潜在影响三大主题，一般主题主要涵盖新闻、科技、反应三个分支主题；功能主题主要涵盖创意写作、论文写作、提示性写作、代码编写、回答问题五个分支主题；潜在影响主要下辖影响科技和影响人类两个分支主题。通过横向对比国外相关研究，对中外网民讨论的主题差异进行比较，可发现中国网民对ChatGPT应用引发的信息安全问题更加关注，同时也较多注意到其在股市和投资方面将产生怎样的影响；而国外网民关注的更多是ChatGPT在日常生活中可以有哪些应用这一较为微观的主题。

2．公众关注ChatGPT舆论主题的动态变化过程。本研究通过DTM模型分析，用以反映公众对ChatGPT舆论主题的动态变化过程并以桑基图（如图1）的方式加以呈现。

图1 ChatGPT微博主题流动桑基图

桑基图（Sankey Diagram）是流程图的一种，在金融、能源等领域中常用此图来对数据流量变化进行可视化分析，其中线条的宽窄代表特定数据的流量大小。本文的桑基图通过DataViz进行制作，图中线条的走向代表数据流走向，线条的宽度变化代表数据变化情况；图中的第一到第五阶段分别对应着2022年12月到2023年4月的数据。从图中我们不难看出，自12月到次年1月由于ChatGPT刚刚向公众开放不久，数据量较少，在2月到4月期间信息安全和使用体验主题的讨论度较高，科技创新主题整体的讨论度呈上升趋势，是讨论的重点和热点；投资话题的整体变化不大，对股票的关注度呈现先升后降的趋势。

通过详细分析各阶段关注主题的内容变化趋势可以发现，随着开放时间的推进，信息安全的讨论重心由AI可能造成哪些安全问题，演化为如何通过法制监管、伦理规范来避免AI危害信息安全等问题。使用体验主题的讨论内容，从初次使用时对这项技术表示震惊和赞叹演化为对使用中遇到问题的质疑。科技创新主题讨论最初主要对什么是AIGC技术进行科普和相关科技产品功能进行介绍，国内相关技术公司科技进展情况，能否及时赶上国外水平等话题，讨论中对国内AIGC技术与国外技术差距表达担忧。在此之后，科技创新的讨论主题主要演化为AI 技术可能引发的社会变革，包括技术革新引发的就业危机、政务危机、教育危机、产业变革、国防科技变革、演化为将ChatGPT的出现比作蒸汽机的发明，对中国错过智能革命的担忧，对技术是否会毁灭人类的讨论，面对科技进步个人应该做出何种改变，随着国内类似技术模型的发布，话题主要转换为对国内类似产品的对比和评测。随着时间的推移，投资话题的关注重点从对投资方的介绍和评价演化为对投资政策环境进行讨论。股票主题的关注重点从近期的股票介绍与投资建议演化为对远期将影响的股票进行评估。从演化趋势来看，未来国内将进一步关注信息安全体系的建设，以及AI技术对个人生活、产业变革方面的深远影响，以及在此基础上投资者需要如何作出判断，以及政府需要做出怎样的管理和规制。

3．公众对ChatGPT的情绪态度。通过对公众的情感分析，本研究发现：在公众对ChatGPT的网络情绪表达中，负面情绪占据了多数位置（41．1%），其中代表性的负面评价可以被分为“职业焦虑”和“使用不便”两类，如“光看B站上各种ChatGPT取代各种职业的焦虑向视频就已经觉得废物的人生已经没有什么过下去的必要了。”“ChatGPT真的废物，课堂测验搜题告诉我modelsim没有被西门子收购，果然错了。”

通过情绪分布图（如图2）我们可以看到情绪值大于20的微博数量要远超过情绪值小于-20的微博数量。情绪值越大其代表的文本相关情绪词含量越多，那么文本长度也就越长，从这一点上我们可以推测，除了一般网民在使用ChatGPT或与ChatGPT的相关信息接触的过程中会留下对ChatGPT的评价之外，也存在许多专门为ChatGPT或者其国内镜像网站的而写的报道和软文。其中，包括行业报告、某公司的业务介绍等，如“AI通过与各行各业结合，赋能各行各业。人工智能的技术创新和应用落地是行业智能化的推手。”当然还存在一些中性的微博，但此类大多为股票、投资等资讯类以及一些旁观视角的娱乐性质评论，如“ChatGPT相关板块早盘一度反弹，CPO、算力方向领涨”以及“已有企业在用ChatGPT取代员工建议代替微博审核员”。可见，在有关ChatGPT的微博舆论中仍然不乏质疑焦虑的情绪表达。

图2 公众在微博中对ChatGPT的情绪态度概况

四、结语

本研究发现当下人们对ChatGPT的舆论焦点主要包括网络安全、股票、投资、科技和使用体验五个方面。随着时间的推进，信息安全的讨论重心由具体的安全问题演化为如何通过法制监管、伦理规范来避免安全问题的讨论。使用体验主题的讨论内容从初次使用转化为对问题的质疑。科技创新主题讨论最初主要对什么是AIGC技术进行科普和相关科技产品功能进行介绍，演化关注AI 技术可能引发的社会变革，投资话题的关注重点从对投资方的介绍和评价演化为对投资政策环境进行讨论。股票主题的关注重点从近期的股票介绍与投资建议演化为对远期将影响的股票进行评估。在公众对ChatGPT的网络情绪表达中，负面情绪占据了多数，相对于积极正向的情绪态度，网民对ChatGPT更多地呈现出质疑焦虑的情绪表达。整体上，安全性和使用体验两大话题中网民的情绪波动更为明显，尤其是ChatGPT的应用对网络安全带来的新挑战备受关注并引发了激烈讨论。

我国网民已经开始看到生成式人工智能技术进步带来的机遇，以及它所带来的潜在风险。技术的高速更新与产品的短周期研发是智能化时代的鲜明特征，靠既有理论与规范一劳永逸地应对一切风险已无可能，因风险的存在而抵制新技术的做法更是因噎废食。风险社会的到来必然要求规范的不断扩容以实现对失范行为的精准规制。ChatGPT的出现既非奇迹，也非偶然，而是人类社会智能化的应然产物。