AIGC:引领传媒业变革与人机关系的重构
2023-09-06郭小平段琳杉
郭小平 段琳杉
人工智能普及应用的加速,正深刻改变着我们的社会形态与媒体生态。其中,生成式人工智能或智能生成内容(Artificial Intelligence Generated Content,简称AIGC)作为人工智能在传播行业中的代表,正逐渐贯穿于传媒传播产业的各个层面,带来了一系列重大的变革和挑战。
一、AIGC 引领传媒业变革
“技术就其本身而言,并未决定历史演变与社会变迁,技术(或缺少技术)却体现了社会自我转化的能力。”[1]智能技术的应用已经成为媒体产业的一大趋势,每一次的技术变革都将带来一次系统重构。自然语言处理技术(NLP)和人工智能技术(AI)的发展,为传媒产业带来了新的机遇和挑战。目前全球拥有生成式AI 初创技术的大型公司有六家,共持有23项生成式AI 模型,主要包括如下几个类别:文本生成图像、文本生成视频、文本生成音频、文本生成代码、文本生成3D、文本生成知识段、文本到语言的生成、图像生成文本等。[2]以ChatGPT 为代表的AIGC 正引领着传媒产业的变革,推动了内容制作、媒介形态等领域的深度创新和发展。
(一)重塑内容生产模式
内容制作是传媒产业的核心。AIGC 以自然语言处理技术和机器学习技术为基础,通过对海量数据的分析和学习,对传媒产业的生产模式进行了“格式化”再造。
AIGC 的发展经历了AI 辅助内容创作、AI 协助内容创作到AI 自主内容创作的演变。[3]就传媒内容生产而言,AIGC 技术在信息采集、内容产制与创新等环节发挥了“技术赋能”效应。首先,借助语音识别技术快速将语音转换成文字,提升新闻时效性。2022 年北京冬奥会期间,记者使用科大讯飞的智能录音笔,实现跨语种的语音转写和数分钟内发稿。其次,基于算法的自动化新闻生产,实现媒体内容生产更快速更准确。再次,智能视频剪辑提升视频采编的工作效率。自动生成字幕、视频锦集、视频拆条与超分、任务追踪等智能化剪辑工具,不仅节约成本,还最大化版权价值。北京冬奥会期间,央视运用“AI 智能内容生产剪辑系统”高效生产与发布冬奥项目的视频集锦。最后,虚拟主播、虚拟偶像、数字员工、虚拟恋人等数字人的诞生,创新了互联网产品形态。
1.提升新闻生产效率
早期的人工智能技术在介入新闻生产时,由于算法单一,语言学习水平低,只适用于特定题材的新闻写作,比如高度依靠数据分析、强调时效性的体育赛事、经济行情等简讯类的稿件。随着技术的更新迭代,以ChatGPT 为代表的AIGC 已经突破了简单的机器人写作,不再局限于财经、体育等特定领域的程序化写作,而是对新闻生产模式、生产效率的全方位提升。
AIGC 高效率表现在以下两方面:
一是文字编辑的高效性。AI 可自动搜集新闻事件的相关数据和叙述,补充“资料库”,随后套用模板生成结构化的文本内容。同时,AI 还可以发挥算力优势,帮助记者对网络信息追踪溯源,减少假新闻的出现。比如,路透社推出了监测社交媒体的工具Reuters News Tracer,可帮助记者和编辑监测社交媒体中出现的新闻信源,并给出信息的可信度数值。[4]
二是辅助记者提升素材搜集的能力。ChatGPT剔除了中介信息或冗余信息的干扰,剔除了人类选择判断的时间,提高了问题求解的效率,开创了无中介化媒介时代。在ChatGPT 中,用户通过对话、询问来获取答案。媒介不再作为连接信息发出者和接收者的中介,而是作为一个交流主体。ChatGPT 将算法模型的思维能力、决策能力、泛化能力内化为高速的机器处理过程, 为用户直接提供答案,以更为简单的逻辑直达用户与问题。与AI 对话获取信息的模式,不仅简化了搜索引擎时代记者获取信息的步骤,更是对新闻业态的改变,预示着“对话式新闻”时代的到来。[5]
2.生成全新写作风格
Web2.0 时代,实时、混杂、庞大的传播行为与正统的、秩序的以及有限的新闻操作相融合,新闻的各种载体形式、内容格式和分发渠道不断排列组合,新闻业的边界不断向外延伸。[6]新闻生产行动者群体的扩充使得新闻的写作风格迎来了新的生机。“人工智能正在从检索者、搬运者和呈现者成为创造者(Creator)或合作创造者(Co-creator)。”[7]随着生成式AI 使用门槛的降低,任何人都可以为媒介机构服务。那些没有经过新闻专业训练的人,表现出风格各异的关注点和表达风格,并通过AI 软件的持续性具身训练,最终呈现出五花八门的稿件写作风格,这将彻底颠覆新闻业的教科书模式。有研究者预言,“作为人工智能,ChatGPT 的强大功能基于大量的文本数据不断进行模型训练,它不是简单抄袭他人成果,其‘心智’在训练中不断成熟,未来终有一天它会生成风格迥异于人类的作品”[8]。
(二)重构媒介形态
在传媒领域,媒介形态的变化一直是人们议论的焦点。通过对内容素材的挖掘和智能分析,AIGC 技术可以为传媒提供更加丰富、多元和个性化的内容形态和表现形式。综合来讲,AIGC 的产品形态主要包括AI 写作、AI 剪辑、AI 配音、数字人以及聊天机器人等多种模态。
1.AI 写作
AI 写作目前被应用于在线媒体、广告公司、金融业、智能教育等领域,涉及自动摘要、文本分类和文章创作等多个场景。通过结合大量阅读文章和语言处理技术上的优势,AI 可以生成时长较短的简明清晰的文章摘要,让读者在更短的时间内获取文章的主要内容,提升阅读速度。此外,AI 可以分析和分类不同的文本,比如识别不同话题的新闻报道和文章摘要,并将它们分配到相应的类别,从而大大提高了媒体从业者的工作效率。
除了以上这些辅助性功能之外,当前的AI 技术已经能够实现完整且高质量的文章创作。通过与传感器等技术的结合,写作机器人可以突破人类记者的生理局限,快速生成各类低创新性的文字,从而使人类将更多精力用于更具创造性的工作。例如,2017 年8 月,九寨沟地震发生18 分钟后,国家地震台网的“地震信息播报机器人”仅用时25 秒便完成新闻稿写作。
2.AI 剪辑
随着“视觉时代”的到来,AI 在视频剪辑领域的应用也越发普遍。借助语音识别和自然语言处理技术,ChatGPT 可以自动解析录制视频中的内容,并结合用户所提出的修剪要求,从而实现视频的自动剪辑。除了自动化的优势,AI 剪辑还具有剪辑精度高和自适应能力强的特点。一方面,它可以通过语音与视频双向交互来深度分析视频内容,同时还可以区分出语音中的不同情感和语调,从而更好地抓住视频的重点,剪辑出优质的视频。另一方面,AI 对人类语言的理解和学习能力强大,使得用户可以根据个人需求对视频进行修剪,使视频具有个性化的特点。
AI 与视频的结合,不仅体现在辅助剪辑方面,AI 视频创作也已进入探索期。比如美国流行摇滚乐队Linkin Park 近期发布的新MV 作品Lost,就是通过AI 视频网站Kaiber 创作完成。此外,人工智能公司Runway,此前发布的视频生成产品Gen-1,宣称可以把视频转换成任意风格,后来发布的Gen-2 模型则可用文字生成类似电影预告片的短片。
3.AI 配音
AI 配音指的是使用语音合成技术,利用计算机模拟人类嗓音和自然语言生成语音来完成配音的过程。这种技术可以使音频制作更加自动化,提高生产效率和降低成本,同时也可以为某些没有能力发声的人提供语音服务,例如喉癌患者等。
近年来,随着技术的不断进步,AI 配音应用领域不断扩大,已经被广泛使用在广播电视、电子游戏、动画配音、电视广告等领域。AI 配音技术的出现在很大程度上可以替代传统配音的方式,缩短了音频制作周期,降低了费用,提高了音频制作效率。然而,AI 配音也存在音色较为单一、语音质量与人类相比还有差距的缺点。而且,一些技术专家和道德学者也对AI 配音作品未来是否会威胁艺术创作的正当地位提出了质疑。因此,AI 的推广和应用,需要更加注重技术安全、道德问题和用户体验的改进。
4.数字人
数字人是一种AIGC 产品,它是通过计算机生成的虚拟形象,具有逼真的人类特征和行为习惯,由计算机图形学、深度学习、语音合成等技术实现。当下,数字人被广泛应用于影视制作、虚拟演唱会、游戏等领域,可用于创建虚拟偶像(洛天依、柳夜熙等)、虚拟主播(央视网小C、新华社小诤、湖南卫视小漾等)、虚拟员工(百信银行AIYA、哈尔滨啤酒哈酱、OPPO 小布等)等。
数字人在媒体领域的广泛应用,充分释放了人力资源,通过腾讯智影等数字人制作平台,媒体仅需上传少量图文及音频素材,即可定制专属数字人形象,用于虚拟播报、虚拟主持、直播多种场景。随着算法升级,数字人早已不是简单地重现或替代真人,而是发挥其算力优势。全天候工作的数字人,不仅重塑内容生产流程,还可以为用户提供个性化定制的服务。以腾讯智影的文本配音功能为例,提供了上百种音色选择,一段1000 字的文稿,2 分钟内就能完成配音和发布,同时支持多情感和方言播报。
5.聊天机器人
聊天机器人是一种模拟与人类用户对话的计算机程序,其技术支持包括语音识别、自然语言处理等。按其设计目的划分,大体上可分为任务导向和关系导向两种,任务型聊天机器人一般就事实性问题,通过多轮交互帮助用户实现特定需求,比如语音助手;而关系导向的聊天机器人,比如微软小冰等,则面向发散领域,通过模仿人类交流方式,来满足用户的情感陪伴需求。从20 世纪Eliza 的出现,到2022 年OpenAI 公司发布的新一代聊天机器人ChatGPT,聊天机器人不断更新迭代,成为人机交往的新范式。
同其他人工智能聊天机器人相比,ChatGPT 呈现出变革性的优越特征:首先,具有“记忆”功能。ChatGPT 能够使用自然语言同用户就部分主题展开连续性对话,激发用户的表达欲,实现人机“意见互掷”模式。其次,较高的对话质量。ChatGPT 搭载了全球互联网数据,总体上掌握了人类语言表达习惯,能够更加精确地理解意图,并根据用户输入的语言特点贴近用户情感,实现高品质的聊天,使其明显区别于那些话语风格机械、生硬的聊天机器人。再次,强大的自我修正功能。根据用户的回复,ChatGPT 会对其疑问及不满进行标注,修改语言系统,为用户提供令其更满意的回答。[9]
(三)助力内容筛查和审核
传统的内容筛查和审核工作,人力和时间成本高,而且容易出现疏漏和误判的情况。而AIGC 技术能够快速准确地对海量内容进行筛查和审核,可以很好地解决这些问题。
一方面,AIGC 技术可以通过语音识别和语义理解,识别、标记和删除敏感词汇和暴力内容。比如在谣言识别和洞察方面,人工智能技术通过对信息源和写作者信息等的整理、分析,可以有效且快速地判断出其中内容是否为标题党、虚假信息或者谣言。一旦确认为谣言,人们便可利用AI 的溯源和拦截能力,对其进行彻底追踪、粉碎和防控。例如在新冠疫情期间,为对付满天飞的新冠谣言,Facebook 和全世界60 多个事实核查组织合作标记虚假新闻,当用户分享假新闻时,AI 就能检测到这些内容,截至2021 年4 月,大约有5000 万条与新冠疫情相关的虚假内容被打上了“警告”标签。另一方面,AIGC 技术通过图像和视频分析技术,监测、识别和过滤色情和暴力内容,维护了社会的公序良俗。[10]例如,谷歌母公司旗下的Jigsaw 与美国马里兰大学等科研机构合作,发布了一套基于人工智能技术的分析系统Assembler,帮助用户判断深度伪造内容,有力打击了网络技术造假。
总之,AIGC 技术在内容筛查和审核方面的应用,不断拓展着其技术和应用的领域,对于网络和信息安全的维护起到了至关重要的作用。
二、AIGC 的多重影响
技术是一把双刃剑。AIGC 被广泛应用于传媒业,促进了传媒业的更新迭代,但也带来了一些限制和问题。
(一)著作权制度框架遭遇冲击
1 the Road、《阳光失了玻璃窗》等AIGC 作品的出圈预示着创造性AIGC 的生产成为可能。传统的内容生产规律被改变,其暗含的知识产权争议将对现有的著作权制度框架产生冲击。
首先,在AI 协同创作作品中,自然人的创造性贡献问题有待厘清。键入简短的文字标签生成AIGC作品的过程蕴含了自然人的创作因素。这在一定程度上符合作品构成要件的要求,但是对于此类作品,能否进行赋权认定以及认定标准如何制定仍相对空白。另外,当人工智能技术发展至拥有自主意识的阶段,AIGC 从组合型内容创造转向探索型甚至变革型内容创造,其创作过程中的权益收益以及可能导致的侵权责任如何划分,目前也处于争论之中。[11]
(二)伦理失范风险加剧
在AIGC 的技术创新和应用过程中,存在着一系列的技术道德问题,如算法偏见、算法歧视等。一方面,算法设计师的主观因素会对算法结果产生影响。曾有人用1.35 亿条仇恨言论信息训练 GPT-4chan 语言模型,随后该AIGC 模型在不到24 小时内发布并传播了超过15000 条充满暴力内容的帖子,且最初没有人识别出这些内容来自AI。[12]另一方面,即使设计师提前对模型进行“非歧视”的技术处理,但在投入社会化使用后,算法模型仍然可能在用户的诱导下发布不当内容。在工程师的诱导下,ChatGPT 写出了毁灭人类的计划书,涉及侵入各国计算机系统、破坏通讯与交通系统、控制武器等。在算法黑箱的技术“封装”之下,AIGC 的伦理失范问题越发难以洞察,其影响力和破坏力也愈发复杂化和动态化,“数据和算法已经成为一种新的权利生产要素”[13]。乐观地认为ChatGPT“价值中立”的愿望,只是一个不切实际的幻想。如何实现AIGC 工具理性和价值理性的双重平衡,是当下人工智能发展亟待解决的难题。
(三)媒体人的具身化“在场”价值凸显
智能媒体时代,技术提升了用户的感知,使得用户可以通过远程在场和虚拟在场感知和体验新闻现场,即不通过记者的加工转述,也可以获得对新闻现场的理解,甚至在虚拟技术的可供性之下,用户还可获得“我在现场”的沉浸式体验。
然而,当前AIGC 技术的应用范围仍然局限于那些可以用数据分析和统计方法获得的信息。长期来看,记者缺席的新闻现场呈现容易产生真相遮蔽、公共性弱化、新闻现场的情感传播阻滞等问题,因此,记者仍需亲身抵达现场,回应公众的关切。[14]
首先,记者身体缺席新闻现场,技术、人、环境不能实现充分的连接,截取的事实容易片段化、碎片化。越是复杂的新闻事件,记者在现场的新闻线索识别和信息挖掘越是不可替代。其次,AIGC 多借由社交媒体等社会化渠道再造新闻现场,存在众声喧哗的问题。平台用户对于现场的表述多带有个人情感,并不具备公共性视角,甚至会存在观点偏颇、情绪极化的问题。再次,正如彼得斯所言,“身体是所有媒介中最基本、最富有意义的媒介”[15]。记者抵达新闻现场,能够与采访对象等建立有情感的联系,丰富感受,进而做出更具有人文关怀性的情感传播。
新闻需要记者的具身性在场,而不只是智能机器人基于数据库和分析的信息输出。智能传播取代重复性、程序化的工作,将进一步凸显隐性采访、调查报道、现场采访等需要媒体人具身化“在场”的工作价值。
三、AIGC 时代的人机关系反思
AIGC 技术在2022 年11 月实现技术突破,挑战传媒行业的内容生产、信息传播,不仅给人们带来“新工具、新现象、新体验”,还带来“信息冲击、体验碰撞与认知震荡”。[16]
(一)数据内容循环中的主体性反思
1.AIGC:向数据学习和以数据为中心
AIGC 的逻辑是“向数据学习”,涵盖“数据收集、数据预处理、模型训练、内容生成,以及评估和细化”几个主要步骤。[17]AIGC 的伦理困境“以数据为中心”的内容生产逻辑,核心是数据问题。数据多样性、代表性、公正性等缺陷,导致偏见、观点霸权、刻板印象、文化片面性等问题,同时,数据集的类型模糊,导致事实与想象不分并加剧错误或虚假信息的传播与扩散。[18]ChatGPT 在回答中国国家形象和发展问题时,延续了西方媒体既有的新闻框架或西方数据集,其非中立的观点主要源于数据来源局限、训练方法纠错有限和把关人的价值导向。[19]
2.人机对话,还是纯粹的数据流动?
AIGC 的基本原理是通过深度学习等技术,利用大量的数据集,生成文本、图像、音频等多种形式的内容,从而实现多种实际应用。其背后的逻辑是机器可以从数据和模式中学习,从而创建模仿人类行为和创造力的新内容。AIGC 的运作过程中存在着“数据—机器—内容—AI 内容—数据”的循环:生成式AI 通过收集、整理和分析数据,生成文本内容;生成的内容作为新的数据,被AI 纳入数据库,成为写作素材,即“数据回馈”;AI 不断地从数据中学习、优化,不断反馈新的内容,对数据的实时分析和学习,使得AIGC 越来越准确、高效。
在这个循环的过程中,人工智能的自动化写作始终依赖于语料喂养。与职业记者相比,AIGC 存在着诸多局限。首先,基于数据统计的AIGC 具有较为固定的写作模式,难以出现人类特有的推理和灵感,总体上内容较为单一,人类有能力理解复杂和抽象的概念,常常能够在看似无关的内容之间建立联系,展现出人类特有的“灵韵”。其次,人工智能缺乏原生创造力,只能基于统计学的方法从历史材料中学习文法规则,而无法应对突发状况,文稿的实时性较弱,而人类真正的知识来源是实践,通过广泛的感官体验,记者可以自主感知和识别信息,创作出更具针对性的原创内容。再次,智能机器学习的另一局限在于对语境理解迟钝,难以感知到人类情绪的细微差别,这使得它的应用场景进一步受限。[20]
AIGC 虽能根据现有数据产生“新”的内容,但它缺乏真正原创和创新思想的能力,生成式AI 数据的来源是从社交媒体、互联网词汇数据库中收集的各种文本,始终建立在人类的原始数据之上。另外,AI不是自我体系的存在,它需要人类提供数据的校验和补充,以确保AI 生成的内容符合人类的期望和需求。AI 本质上仍然是人体的延伸和人类思维的嫁接,其主体性目前尚存疑问。
如果说苏格拉底式的“对话”是在场者的思想的交流,那么,那些缺乏恰当的、有针对性指令的ChatGPT 则是循环在内部存储中的纯粹数据流动。[21]
(二)记者职业价值的丧失还是凸显?
AIGC 的出现改变了新闻生产方式,使得记者的传统工作方式受到冲击,提高了新闻生产效率,但也增加了记者职业不稳定性。
一方面,AIGC 能更快地处理大量的信息,并自动完成烦琐的报道任务,从而解放了记者的时间和精力。因此,记者可以将更多的时间和精力用于挖掘深层次的新闻背景和底层信息,并针对问题进行独特的深入分析和观察,提高报道的专业性和深度。
另一方面,AIGC 的出现也极大地削弱了记者职业价值,但也凸显了记者在场的价值。生成式AI 的写作依赖于互联网上的海量数据,虽在一定程度上具备勘误能力,但对于某些虚假信息尚不能达成完全分辨,大量“脏数据”进入AI 的写作库后,将对其生成新闻的真实性造成威胁。现在,社交媒体和搜索引擎是人们随时随地获取新闻信息的主要渠道之一,传统记者的意见领袖身份被取代,新闻的真实性也成为幻影。越发隐蔽化的AI 假新闻在社交媒体上经由用户的人际渠道不断传播扩散,新闻反转频频发生,公众对媒体的信任程度不断下降,记者职业进而遭遇危机。同时,介乎宣传文稿和新闻作品之间的具有固定格式的新闻内容写作,将被机器人大量替代。在某种意义上,“生成式 AI 将会对新闻报道中文牍主义、形式主义形成冲击,同时也对僵化的官僚主义、科层制管理模式形成冲击”[22]。然而,对于突发性的、重大的新闻而言,依赖数据喂养的AIGC 依然无法替代专业记者的在场报道。
在一个媒介化、数字化的现代社会,机器的出现不可避免。人工智能已经在传媒产业中扮演着越来越重要的角色,AIGC 更是引领着产业变革和人机关系重构的一个重要代表。今天的记者需要不断适应和学习新技术,发挥自己独特的专业优势,持续提升自己的思考深度和分析能力,从而更好地与AIGC 共同推动传媒行业的发展。作为一项颠覆性的技术,人工智能的应用也存在着很多潜在的风险和挑战。事实上,在经历快速的业绩增长与难以预测的抵制之后,OpenAI 在公司主页上将其使命从“形塑未来的技术”调整为“创建安全的、使全人类受益的人工智能”(Creating safe artificial intelligence that benefits all of humanity),兼顾了伦理意义上的“安全”与价值定位上的“使全人类受益”。[23]
2023 年4 月11 日,国家互联网信息办公室就《生成式人工智能服务管理办法(征求意见稿)》向社会公开征求意见,[24]相关政策和法规正逐步完善,这为人工智能技术的健康发展和社会应用提供了政策保障。在国家和产业各方的共同努力下,人工智能会发挥更大的作用,推动传媒产业创新发展和人机关系的持续演进。