APP下载

数字人进场的语言生活

2024-12-28王春辉

外语学刊 2024年6期
关键词:人工智能

提 要:数字人是人类前沿技术的集中地,也是当前学术研究的热点之一。数字人的语言能力涉及支撑它们的语言结构能力和它们使用语言的能力。在交互特征方面,数字人在自然流畅性、上下文意识、互动度、情感识别、多模态互动性、信息检索和知识整合能力等多个维度都具有很好的表现,相比传统聊天机器人更是有较大跃升。从医疗保健、教育培训到垂直领域口播视频、智能客服再到政务服务、新闻播报再到城市治理、安全领域,数字人的应用场景越来越广泛。作为一种新现象,数字人的进场在带来便捷和机遇的同时,也带来了一些问题和挑战,比如理解与响应的局限性、方言与口音的适应性问题、可能会影响人类的沟通能力、各类应用场景中的可能问题、法律的和伦理与隐私问题等。与此相对应的语言治理策略,则包括提升数字人的理解与响应能力、多方式提高方言与口音适应性、多路径促进人类沟通能力、增强适应各类应用场景、加强法律和伦理与隐私保护、整合多方参与的语言治理、进一步加强研究等。

关键词:数字人;人工智能;语言生活;语言治理

中图分类号:H0 """"文献标识码:A """"文章编号:1000-0100(2024)06-0041-10

DOI编码:10.16263/j.cnki.23-1071/h.2024.06.006

Language Life with the Emergence of" Digital Humans

Wang Chun-hui

(Language Governance Research Center, Capital Normal University, Beijing 100089, China)

Digital humans constitute a key site of cutting-edge human technologies and also one of the hot topics in current academic research. The language ability of digital humans includes both the language structure ability that supports them and their ability to use language. In terms of interactive features, digital humans perform well on many dimensions including natural fluency, contextual awareness, interactivity, emotion recognition, multimodal interactivity, information retrieval and knowledge integration capabilities, and" their performance has made a big leap compared to that of traditional chatbots. Digital humans have been widely used in various application scenarios from healthcare, educational training, oral video of vertical field, intelligent customer service, government services, news broadcasts, urban governance to security. While emerging as a new phenomenon by bringing convenience and opportunities, digital humans have brought some problems and challenges" such as their limitations in understanding and responding, adaptability issues of dialects and accents, possible impacts on human communication ability, possible problems in various application scenarios, legal, ethical and privacy issues, etc. The corresponding language governance strategies include improving the understanding and responding capabilities of digital humans, improving dialect and accent adaptability in multiple ways, promoting human communication capabilities through multiple paths, enhancing adaptability to various application scenarios, strengthening legal, ethical and privacy protection, integrating language governance of multiple parties, and strengthening interdisciplinary research.

Key words:digital humans; artificial intelligence; language life; language governance

1 引言

数字人(digital human/digital people)①,是指通过计算机图形学、语音合成技术、深度学习、类脑科技、计算机科学等聚合科技创设的,具有多重人类特征(如人的外观、行为,甚至思想或价值观)的虚拟形象。它具有3个重要特征:具有人的虚拟形象、具备独特的人设、具备互动的能力。(陈龙强" 张丽锦" 2022:6-7)数字人是虚拟存在的人格化数字实体,通常是通过计算机技术模拟出来的。数字人可以是虚拟世界中的虚拟角色,也可以是通过人工智能技术赋予了某种程度的智能和自主性的程序实体。数字人可以拥有自己的思维、情感和行为,但其存在是基于计算机系统和算法,不同于自然人的生物基础。(王春辉2024)数字人可以是真人的数字双胞胎(基于他们的解剖、物理和生物特征),也可以是虚构的角色(基于演员的外表或完全由计算机生成)。其背后涉及数字孪生、TTS(文字生成语音)、NLP(自然语言处理)、ASR(语音识别技术)、NMT(神经机器翻译)、知识图谱、大模型等AI技术构建等多种前沿科技。

正因如此,数字人似乎越来越成为学术研究的热点。以“数字人”为“主题”和“篇关摘”双重精准检索“中国知网”,可以搜到中文文献1478条,外文文献2369条。②中文文献最早大致出现于2002年,2022年在数量上是重要转折点;外文文献最早大致是2000年,2012年在数量上是重要转折点。两类的历时发展如下两图所示。

虽然数字人的研究热度日增,但是聚焦于数字人语言方面的研究一方面是还不多见,另一方面是近几年才刚刚兴起。“中国知网”的中文文献目前不到二十篇:严通(2023)分析了ChatGPT语言模型在虚拟数字人的语音交互场景中优化用户的体验和提高交互的效果;王妍(2023)考察了面向数字人交互的视觉跨模态学习问题;郭亚军等(2024)提出了ChatGPT赋能图书馆虚拟数字人的主要应用场景,基本上是语言使用问题;梁向东、梁楚怡(2023)认为人工智能和数字人技术可促进汉语课程的发展,需要进一步扩大应用范围和功能类型;彭冬雪(2023)发现为AI虚拟数字人进行前期语音和面部动作数据采集的发音人,在实际工作中为实验语音学的研究带来诸多思考,多方面共同参与到AI虚拟数字人与用户的关系建构中;韩家伟、朱妍(2024)提出了一个可以对孪生数字人的语言和行为进行授权的框架,并分析了其可能效果;魏小东、习鹏飞(2024)对大语言模型驱动下的虚拟数字人在第二语言教育中的应用进行了较为详细的阐述;王春辉(2024)指出地球似乎正在加速进入一个自然人、机器人、数字人“三人”共生的新时代,并简单分析了数字人与自然人互动的语言生活;郑璇(2024)针对手语数字人研发现状进行了思考,并提出一些对策和建议;刘鸿宇等(2024)呈现了手语数字人的相关技术及其智能应用;张裕岚(2024)考察了留守儿童父母数字人的交互设计及辅助养育APP应用设计;林一民、邓香莲(2024)对数字人有声阅读内容的生产技术机理与人机互动特征及其机制进行了考察。英文文献方面:Sung等(2022)的研究发现数字人讲故事是技术增强环境中有效的长期营销策略;Bates(2023)分析了数字人作为复杂会话式人工智能区别于上一代聊天机器人的几个特征,并展望了其在医疗行业中的应用前景;Clarke(2023)简单分析了多语机器人在几种商业场景中的应用;Newman和Gopalkrishnan(2023)通过比较探讨了公司使用数字人来发布公司公告的优势;Lazer(2023)呈现了数字人在医疗保健领域的应用;SolutionsHub(2024)呈现了数字人在商业中的多种应用场景,并分析了其优势与挑战;Ram(2024)简单勾勒了从聊天式机器人到对话式人工智能的数字人的发展历程;Konkel(2024)报道了数字人Emma在对话型城市建构中的独特作用;Kumar(2024)介绍了一种将数字人体作为教学助理的高级框架,利用了图像动画、神经渲染和语音克隆方面的最新技术;Chen等(2024)的研究显示了互动性增强的数字人在历史文化传播中发挥了积极作用,多样化的互动方式更有利于公众对历史文化内容的吸收;Zhou等(2024)探讨了数字人在人机协作教学系统框架内的应用,重点关注了其在英语口语教学和微课教学中提高互动性、参与度和个性化学习的潜力。

尽管如此,目前对于数字人进场之后宏观、中观和微观各维度的语言生活,仍然缺乏广泛而深入的研究。本文尝试勾勒数字人的语言能力和交互特征(第2部分),数字人进场人类语言生活的各类场景(第3部分),数字人进场后带来的各种问题以及相关治理策略(第4和第5部分)。

2 数字人的语言能力和交互特征

2.1 语言能力

数字人的语言能力涉及两个方面,一方面是支撑数字人的语言结构能力,比如自然语言处理、语音识别和语音合成、语音到文本翻译、语言识别和检测、上下文对话响应、上下文识别等;另一方面是数字人的语言使用能力,比如使用语种的数量和多语种能力、文本生成和会话管理、理解和说出多层推理的话语、上下文理解甚至语义理解的歧义和含混、语言翻译、命名和专业发音、语音交互中适当调整语调和语速、信息检索和知识整合等。

这些语言能力的综合,体现了数字人与用户之间的互动质量,对提升用户体验和满足不同场景的需求至关重要。

2.2 交互特征

交互能力是数字人的核心优势之一。它深度融合了自然语言处理、语音识别、图像识别、情感分析及神经网络等尖端技术,实现了全方位、多模态的沟通体验。随着人工智能的加持,数字人在与自然人或机器人交流时,呈现出一些新的交互特征。(任继福 2023,王春辉" 2024,王国庆等" 2024)自然人和数字人的互动,或将引发关于身份、自我认识和社会互动等方面的深刻哲学危机。(甘莅豪" 王豪" 2024)

2.2.1 一般性特征

从整体上来说,数字人的交互特征至少包括以下一些方面:(1)有较好的自然流畅性,能够进行连贯且自然的对话,模仿人类的交谈方式,使用适当的语气和表达;甚至能够适应非正式的语言风格,如使用俚语、缩写和表情符号;(2)有较好的上下文意识,能够在多轮对话中维持上下文,理解用户的问题和需求,也能根据对话场景的变化调整语言风格;(3)有较好的互动度,能够迅速响应用户的提问或请求,保持对话的活跃性和互动性,也能根据用户的个人喜好和历史交互记录提供定制化的回应,增强用户体验;(4)有较好的情感识别能力,能够识别用户的情感状态,并根据情感变化调整回答的内容和语气;(5)有较好的多模态互动性,在交互中能结合文字、语音、图像和视频等多种形式,提升信息传达的效果和用户参与感;能够在不同的平台(如聊天应用、语音助手、虚拟现实等)中进行交互,提供相对一致的用户体验;(6)有较好的信息检索和知识整合能力,数字人能够快速检索相关信息,并在对话中提供准确的答案或建议,并且能够及时获取并整合最新的信息和知识,以保持内容的时效性和准确性。

上述是数字人的一般交互特征,而它们在不同的场景中会呈现出一些各自的特征,比如Kumar(2024)对教育场景数字人的分析、Chen等(2024)对数字人在历史文化传播领域作用的分析等。随着数字人交互的不断发展,人们对数字化体验的期望发生深刻变化,更加重视人际交往过程中的情感表达和共鸣。(王泽亚" 2024)此外,数字人交互仍然缺乏许多对人类互动来说很重要的微妙社交线索,比如微表情——短暂、微妙和无意识的面部表情。(Tastemirova" et al. 2022)

2.2.2 比较性特征

与早期的聊天机器人相比,数字人至少具有以下比较优势:(1)它们能够理解口头和非口头形式的交流,因此数字人不仅会分析对方说了什么,还会分析对方说话的方式、脸部的表情和身体的位置等信息;(2)它们擅长理解上下文和词汇语义,比如对话式人工智能Amelia⑤就表现出很强的语境理解能力,能够正确解释信息的顺序或多重含义;(3)它们能够智能地对查询提供合理响应,目前市场上的商用数字人大都可以“即插即用”地处理地球上的几乎任何数据集;(4)数字人通常与数字“头像”配对,能够拥有照片般逼真的面孔,面对如此栩栩如生的对话者,人类往往会更加投入、信任和满意他们的数字互动。(Bates" 2023)

随着生成式人工智能的崛起,带来一种新的人机交互的范式,可称为“数字人智能对话系统”。根据其功能,整个系统大概由五大块组成:(1)自动语音识别(ASR),将用户的语音输入转换为文本;(2)大型语言模型(LLM),负责理解用户的输入并生成合适的回应;(3)文本到语音转换(TTS)/语音克隆 (Voice Clone),将系统生成的文本回应转换为语音;(4)数字人生成(TFG),结合语音特征与数字人技术生成数字人的形象和动作;(5)音视频流式服务(streaming),利用流式服务提高交互体验。(邓恺俊2024)比如智信数字人的互动过程就是:用户与数字人对话时通过识别用户提出的问题,然后问题被发送给数字人大脑获取相应的答案,再通过TTS技术⑥将答案转换成音频,经由音频驱动数字人的唇部和面部,形成数字人说话视频,从而实现真人与数字人的对话。⑦

3 数字人进入各种场景语言生活举隅

在大模型的加持下,作为为数不多能落地、被应用且可以看得到效果的AI应用,数字人的热度越来越高。从央视数字人主播到杭州亚运会数字人火炬手,从各种数字人员工入职政务大厅到已故著名人物的数字人复活,数字人技术越来越受到市场的追捧。数字人在垂直领域口播视频、IP打造、品牌宣传、智能客服、教育培训、政务服务、医疗健康、新闻播报、心理咨询、法律行业、文化旅游、金融保险、视频带货、直播销售、跨境电商和短视频出海等多样场景中都已实现了较丰富的应用。⑧下文略举几例。

(1)医疗保健领域。⑨数字人的加入,使得医生在遇到患者时,能够以患者自己的语言进行参与和互动,并在需要时呈现其所用语言的适当文化表示;患者的后续护理和跟进对于确保任何手术或治疗的成功结果至关重要,利用数字人随时随地与他们互动或提供支持会大大提高后续护理的合规性;数字人的使用可以为抑郁症患者或无人陪护的老人提供陪伴和交流。(Lazer 2023)数字人体建模在培训医护人员应用复杂、可滴定形式的医疗护理以及评估他们在这些领域的认知能力方面具有独特的潜力。(Hotchkiss" et al." 2015)此外,数字人在生成式人工智能的加持下,可以为患者提供个性化的健康建议和咨询;能够作为虚拟医生参与远程医疗,帮助患者进行初步诊断、解答健康问题或提供心理支持,这种方式打破了地理限制,提高了医疗资源的可及性;在心理健康领域,数字人可以提供情感支持,通过倾听和互动帮助缓解焦虑和抑郁情绪;也可以用于医生和护士的培训,模拟真实的患者互动情境,帮助医疗从业者提升沟通技巧和应对能力;数字人还可以较轻松地适应不同语言和文化背景的患者,提供更广泛的语言服务,减少语言障碍带来的医疗问题。

(2)教育培训领域。虚拟数字人的吸引力、拟人化特征通过用户对虚拟数字人的态度和学习满意度的链式中介作用积极影响在线学习效果,而准社会互动对学习满意度有积极影响。(赵一鸣等" 2024)由复杂的人工智能模型驱动的数字人提供了一个丰富口语学习体验的独特机会,从而为数字时代的创新教学方法提供了条件。(Zhou" et al." 2024)教育数字人可以根据学生的学习进度和兴趣,提供量身定制的学习内容和反馈,帮助学生以适合自己的节奏进行学习;它们可以与学生进行实时互动,解答问题、进行讨论,从而增强学习的参与感和趣味性;还可以充当虚拟教师或助教,提供24/7的学习支持,帮助学生随时获取知识,减轻教师的工作负担;在技能培训和职业教育中,数字人可以模拟真实场景,帮助学生进行实战演练,例如模拟面试或客户服务场景,提高实践能力;它们能够整合不同学科的知识,促进跨学科的学习,帮助学生建立全面的知识体系;也可以支持多种语言和文化背景,促进全球范围内的教育交流与合作,打破地理限制。虽然有这些便利和优势,但是教育数字人的技术支撑仍存在智能有限、交互性弱等特点,还面临算力保障不足、数字版权不明确、教育稀释或学习惰性潜在风险、伦理道德担忧等诸多挑战。(Zhai" et al. 2023)

(3)企业公司管理领域。许多公司越来越多地使用数字人技术来改善沟通参与度。有学者进行过一个3组的混合测试,以测验数字人在公司中的沟通效用:一组人亲自听取公司公告,第二组人通过电子邮件阅读同一份公告,最后一组人则听取由人工智能生成的数字人发出的消息。结果显示,公司可以开始使用数字人来发布公司公告,甚至最好使用交互式数字人。(Newman, Gopalkrishnan 2023)对于跨国企业来说,培训来自不同语言背景的新员工也会有挑战。借助多语数字人,可以有效提升对公司政策的一致理解,用当地员工最熟悉的语言讲述企业的传统和规章制度,是一种激励客户的有力工具。(Clarke" 2023)此外,数字人可以在招聘流程中参与初步筛选和面试,通过自动化的对话评估候选人,提高招聘效率;也可以提供心理健康服务,帮助员工管理压力和情绪,促进整体的工作幸福感。

(4)零售业服务领域。人们倾向于接受在线商店中使用数字人(Taglinger" et al. 2023),而且数字人讲故事是技术增强环境中有效的长期营销策略(Sung" et al. 2022)。数字人可以通过提供个性化互动来彻底改变零售业,而个性化互动曾经是高端面对面购物体验的专属领域。通过利用有关个人客户偏好、行为和过去互动的数据,由人工智能驱动的数字人可以推荐产品、建议替代方案甚至预测需求,让每次互动都感觉是为购物者量身定制的;数字人可以使用多种语言进行交流,使其成为希望扩大覆盖范围的全球零售商的宝贵资产,此功能可确保语言障碍不会妨碍购物体验,使品牌能够以相同水平的个性化服务迎合多样化的国际受众,比如拥有全球客户群的美容品牌可以雇用数字人类以各种语言提供化妆建议和产品推荐;数字人还可以理解并回应购物者的情绪和语气,从而有助于建立更深层次的情感联系。(Firework" 2024)数字人也可以作为顾客的购物向导,提供产品推荐、实时咨询和购买建议,提升顾客的购物体验;在社交平台上,数字人可以与顾客进行互动,回答问题、分享产品信息,提高品牌的曝光率和参与度。

(5)城市治理领域。数字人在助力城市和社区治理方面的作用也不容小觑,比如政务服务机器人就在信息丰富性、服务可供性和交互同步性等方面具有显著优势(韩啸等 2024)。它们可以作为虚拟助手,为市民提供实时的信息查询和问题解答,帮助居民了解政策、办理手续,提升服务效率;也可以搭建社区交流平台,促进居民间的互动和沟通,收集意见和建议,增强社区参与感;在突发事件中,数字人可以快速向市民发布重要信息、指导应急措施,提高公众的安全感和反应能力;甚至可以通过语音识别技术监控公共安全,提供交通流量信息,帮助市民规避拥堵和危险区域。比如美国德克萨斯州的阿马里洛市就开发了Emma这一在线数字助理。它使用生成式人工智能技术与该市二十多万居民进行语音交流。市政府官员希望数字助理能够使用60多种语言进行多语言交流、熟练地回答问题、检索信息,并在必要时将他们与合适的真人联系起来。Emma 的多语言能力至关重要,因为现代的阿马里洛是多语社区,近四分之一的阿马里洛居民不以英语为母语,阿马里洛的学校至少使用 62 种语言和方言。Emma 背后的理念是市民无需输入或搜索信息,只需用他说的语言与她交谈即可获得非紧急城市服务和信息。Emma 目前的迭代才刚刚开始,未来更先进的 Emma 可能会在阿马里洛公共图书馆帮助向居民教授英语或其他语言,或者用于总结市议会会议并向居民传达主要信息,也可能会根据居民之前的询问主动与他们互动,例如向询问相关内容的居民推荐可用的城市计划。最终,Emma将帮助城市治理者打造一个对话型城市。(Konkel 2024)

(6)安全领域。在安全领域,数字人可以通过语音广播系统快速传播紧急通知和安全指引,确保信息及时传达给公众,减少混乱;支持多种语言,使得不同语言背景的用户能够轻松获取安全信息,确保所有人都能理解和响应安全指示;也可以在社交平台上与用户进行实时互动,解答安全相关的问题,传播安全知识,增强社区的安全意识;甚至通过语音分析,数字人能够识别用户的情绪,从而提供适当的心理支持或安全建议。例如Guildhawk是一家生产多语言数字人的公司,有的采矿业企业使用他们的多语言数字人来提供安全培训计划的关键模块,不仅可以提高理解力,还可以让人类培训师有更多时间进行一对一培训;有家进行安全检查的全球公司为其中一位高级主管创建数字人类,用于以当地语言向检查员提供简报信息,客户就能够快速轻松地提供信息,并消除易混淆和误解的风险。(Clarke" 2023)

4 数字人进场语言生活产生的相关问题

数字人进入各种应用场景,给人们的生活带来各种便利和机遇,但与此同时也产生一些新问题和新挑战。

4.1 理解与响应的局限性

首先是语境理解不足。有时是因为语言的复杂性或多义性所致。数字人在理解语言时通常依赖于预设的模型和算法,而人类语言的复杂性和多义性使得这些模型在处理隐喻、俚语和双关语时常常显得力不从心。在面对面交流中,人类能够依赖非语言信号(如肢体语言、语音语调等)来理解对方的意图和情感。数字人在这一点上往往缺乏上下文的感知,特别是在长时间对话中,可能会失去对话的连贯性和逻辑性,从而导致响应不相关或不恰当。

其次是情感识别不足。一方面,它们的情感分析有局限,即尽管有些数字人通过自然语言处理和机器学习技术能够通过分析用户的语言来识别情感,但这种分析往往依赖于特定的关键词和语气。这意味着数字人可能错过更复杂的情感表达,比如讽刺或微妙的悲伤,导致反馈的情感不够准确。另一方面是它们缺乏真实的共情能力,即虽然数字人可以模仿情感响应,比如使用安慰性语言或积极的反馈,但它们并不具备真实的情感体验,因此无法提供真正的共情。这可能使得用户在面对情感问题时,可能感到孤独或无助,因为他们无法获得来自数字人的真正理解和共情。

4.2 方言与口音的适应性问题

数字人训练通常是基于标准语言模型,这就导致它们对地方方言和俚语的理解能力有限。例如,中国不同地区的方言(如粤方言、四川话)具有独特的表达方式和词汇,数字人可能无法准确理解这些方言的语境或情感。不同地区的用户在交流时可能会使用不同的口音,这使得数字人在语音识别上面临挑战。例如,英国口音与美国口音之间的差异可能导致数字人无法正确理解用户的意图,影响沟通效率。对于来自多样文化背景的用户,数字人的这种方言与口音的适应性缺乏可能使他们感到被排斥,进而影响了数字人作为交流工具的普遍适用性。

4.3 可能会影响人类的沟通能力

长期依赖数字人进行交流有可能使人们在面对面沟通时感到不适应。例如,年轻一代在与数字人交流时倾向于使用表情符号和缩写符号,但在实际社交场合中可能缺乏应对复杂对话的能力和技巧。这种依赖性还可能影响到人际交往能力,减弱他们的倾听和情感共鸣。例如在与朋友或同事交流时,缺乏面对面交流的经验可能导致对他人情绪和非语言信号的误解,从而影响人际关系的建立与维持。

4.4 各类应用场景中的可能问题

比如在直播带货领域,数字人主播回答消费者问题的时候会莫名其妙地说教,回复的内容有时候驴唇不对马嘴,道歉套用的是AI模板,给不了让人满意的解决措施。(李燕京 2024b)在客服和医疗场景中,可能存在交互时使用行业特定术语的情况,数字人可能无法准确理解或解释这些术语,导致用户感到不被理解或无法理解患者的症状描述并提供有效的建议。在教育和培训场景中,数字人可能无法根据学生的不同需求提供深入的语言指导,进而可能影响学习效果;学生在提问时通常希望得到个性化和互动性的回答,而数字人往往只能提供标准化的回复,无法满足学生的求知欲。在娱乐和游戏场景中,数字人可能无法准确模仿某个角色的语言风格或语气,影响沉浸感和游戏体验;玩家可能在游戏中使用快速、非正式的语言进行交流,而数字人可能无法及时做出反应,导致游戏节奏被打断。这些场景中的语言问题可能导致用户的体验下降、误解或沟通障碍。

4.5 法律、伦理和隐私问题

数字时代引发了语言伦理的一些新形态和新趋势。(王春辉" 2022)数字人在与用户互动时,通常会收集个人信息和交流数据,以改善其响应质量。这些数据可能包括用户的个人喜好、行为模式、甚至情感状态。例如,社交媒体平台的数字助手在用户提问时可能记录用户的兴趣和习惯,从而推荐内容或服务。(李燕京" 2024a)由于数据存储和传输过程中的安全隐患,用户可能担心自己的个人信息会被泄露或滥用。比如,某个在线客服数字人在与用户互动时不小心泄露了用户的个人信息,就可能会引发公众对该服务的信任危机。此外,一旦这些数据被黑客攻击或错误使用,用户的隐私可能面临严重风险。数字人的回答基于其训练数据,这些数据可能包含偏见或不准确的信息。例如,如果训练数据中包含性别或种族的偏见,数字人在回答相关问题时可能无意中强化这些偏见,从而误导用户。再比如在健康咨询场景中,数字人可能会基于不全面的数据提供不恰当的建议,这可能导致用户对健康问题产生错误的认识,甚至延误治疗。

此外值得注意的是,包括数字人在内的整个人工智能系统行业都卷入了全球社会政治权力等级制度,即“人工智能系统的建立是为了以主要使其服务的国家、机构和公司受益的方式观察和干预世界。从这个意义上说,人工智能系统是权力的表现,这种权力来自更广泛的经济和政治力量,其创建目的是增加利润,并将控制权集中到那些拥有这些权力的人身上”(Crawford" 2021:211)。

5 相应的治理对策

数字人及其参与的虚拟空间会丰富未来人类的生存状态与体验,这些虚拟中包含种种实在性,但人类还是需要防止对数字人和虚拟空间的过度依赖,防范虚拟空间本身秩序的恶化。(彭兰" 2024)面对数字人在语言沟通和使用中出现的各种问题,当下和未来需要多主体的融合协作,来提供相应的语言治理和语言规划。

5.1 提升数字人的理解与响应能力

持续改进自然语言处理技术,使数字人能够更好地理解复杂语境、隐喻和情感,提高响应的准确性和相关性。为了让数字人更好地理解复杂的语境,可以采用上下文记忆技术,让数字人在对话中“记住”先前的交流内容,帮助其更流畅地进行多轮对话。例如,在医疗场景中,用户可能在咨询过程中提到症状,数字人应该能够在后续的对话中引用这些信息,从而提供更精准的建议。通过分析用户的历史对话数据,数字人可以学习用户的沟通风格和偏好。例如,在教育场景中,若某学生倾向于提问某些具体问题,数字人应调整其回答方式,提供更具针对性的辅导,而不是泛泛而谈的标准化回复。

5.2 方言与口音适应性

在训练数字人时,应包括来自不同地区的语言样本和方言,增强其理解能力。例如,针对中国市场,数字人应接受来自粤方言、闽方言等多种方言的训练,从而在与地方用户互动时,能更自然地沟通。开发机器学习算法,使数字人能够在对话中不断学习和调整。当用户使用特定方言或口音时,数字人可以实时适应并逐步提高对该方言的理解和响应能力。

5.3 促进人类沟通能力

让用户了解与数字人互动的最佳实践,提醒他们使用清晰、准确的语言。在用户教育中强调面对面沟通的重要性,开展活动鼓励人们减少对数字人的依赖。例如,学校可以设立“人际交流日”,鼓励学生进行面对面的交流练习,从而增强社交技能。为用户提供关于如何与数字人有效沟通的建议,帮助他们在日常交流中保持语言能力。在学校和社区开展社交技能课程,教授如何进行有效的对话、倾听他人和识别非语言信号等。这些措施都可以帮助年轻人提高面对面交流的自信心和能力,避免长期依赖数字人而导致的沟通能力退化。

5.4 适应各类应用场景

针对特定领域,可以通过与行业专家合作构建包含行业专业术语的数据库,从而确保它们能够理解并正确使用这些术语。例如,在医疗领域,数字人应该能正确解释医学术语,而不是用模糊的语言混淆患者。在娱乐和游戏中,数字人可以通过使用多样的角色语气和风格,增强用户的沉浸感;也可以根据角色的背景和性格特点调整其对话风格,使其更具真实性。

5.5 加强法律、伦理与隐私保护

政府需加强法律法规的制定和出台。企业应制定和公开透明的数据使用政策,明确用户的数据如何被收集、存储和使用,并确保用户可以随时查看和删除其数据。引入数据加密、匿名化和安全传输协议,保护用户数据的安全。同时,定期进行安全审计,确保系统免受网络攻击,并及时修复潜在的漏洞。定期审查数字人的输出,检查是否存在性别、种族或其他偏见,并根据用户反馈不断优化训练数据和算法。制定明确的数据隐私政策,确保用户对数据的使用有知情权和选择权,增强用户信任。在数字人开发过程中,宜引入伦理审查机制,确保数字人不会传播偏见或误导性信息。

5.6 多方参与的语言治理

一方面是进行跨领域合作。语言学家、技术专家和用户的共同参与能够确保数字人语言治理的全面性与有效性。语言学家可以提供关于语言结构和使用的专业知识,帮助数字人更好地理解和生成自然语言;技术专家可以评估数字人系统的技术能力和限制,提出切实可行的解决方案;而用户的反馈则能提供实际使用中的问题和需求,确保治理措施贴近用户体验。另一方面可以建立一个多方参与的平台或论坛,让各方利益相关者定期交流意见和经验,讨论数字人在不同场景中的表现和问题。此外,通过多方协作,形成关于数字人语言使用的共同标准和最佳实践,确保不同类型的数字人在设计和应用过程中遵循相同的语言治理原则。

5.7 加强多维度研究

对数字人语言使用影响的学术研究应涵盖语言学、社会学、心理学和人机交互等多个领域。这种多维度的研究可以深入分析数字人对语言使用、沟通方式和社会交往的影响,提供更为全面的视角。研究应着眼于数字人对语言生活的长远影响,包括对传统语言使用的改变、沟通能力的演变以及社会互动模式的变化。例如,研究如何通过数字人影响年轻一代的语言表达和社交习惯,从而为政策制定者提供依据,以应对潜在的语言能力退化问题。通过定期收集和分析用户与数字人互动的数据,识别出语言使用中的趋势和问题,评估数字人对用户语言能力和沟通质量的具体影响。这些数据可以为未来的语言治理和技术改进提供重要参考。研究成果应与政策制定相结合,形成针对数字人语言治理的具体建议和指导方针。

上述治理和规划策略将有助于提升数字人的交流能力,提升其在各个应用场景中的有效性与用户体验,同时维护用户的隐私与权益。通过这些措施,可以更好地治理和规划数字人引发的语言问题,从而促进更健康的语言生活和更高效的语言沟通。

6 结束语

Gartner公司预测,到2035年数字人经济的规模将达到1250亿美元,并会持续增长。⑩iiMedia Research(艾媒咨询)数据显示,2022年中国虚拟人核心市场规模为120.8亿元,同比增长94.2%,预计2025年将达480.6亿元。在传统行业数字化转型及降本增效的需求推动下,中国AI数字人业务需求进一步释放,预计市场规模将持续增长。B11

从基于任务的聊天机器人到情境感知型对话式人工智能,再到情感智能的数字生物,技术创新不断重新定义碳基人类与世界的互动方式。数字人和人工智能等技术不仅是语言进化叙事中的旁观者,更是积极的参与者,塑造、影响、有时甚至挑战我们交流方式的本质。当我们站在更多人工智能突破的风口浪尖时,思考我们的语言下一步将走向何方,以及在一个与机器人和数字人紧密交织的世界中,它们将如何改变人类的语言,这是一个有意思更有意义的话题。人类智能和人工智能的共同努力,将决定地球语言生活的未来。

注释

①又称“虚拟人”(virtual human)或“虚拟数字人”(Virtual Digital Human)甚至“元宇宙人”(Metahuman)。有些学者对这些不同名目进行了区分,比如 Cui和Liu(2023)等,但鉴于目前的区分主要是技术上的而非社会功能上的,而且这种区分并不影响本文的讨论,所以本文用“数字人”来统称。对于“数字人”的不同界定,可以参看 Burden, Savin-Baden(2019)。关于数字人研究的历史以及相关应用场景,可以参看Magnenat-Thalmann, Thalmann(2005)、Cui, Liu(2023)、Rekik" et al.(2024)等。

②检索时间:2024年9月23日。需要说明的是,尤其对于外文文献来说,数字不一定精准,只是反映大致趋势。

③2021年还只有67篇,2022年猛增到252篇,之后继续攀升。

④之前每年文献产量低于50篇,2012年达到103篇,之后继续攀升。

⑤公司网址:https://amelia.ai/

⑥这项技术将文字转化为语音,让虚拟人能够“说话”。它不仅能发出清晰自然的声音,还能模仿多种语言和语调。

⑦“数字赋能专家”微信公众号:https://mp.weixin.qq.com/s/IGZKz6rLdxxwU5X_KqdfsQ(2024年9月5日)。

⑧“硬核AIGC”微信公众号:https://mp.weixin.qq.com/s/a_moqJHKDuqd0lqlFKET9g(2024年06月17日)。

⑨从“中国知网”的搜索来看,医疗医学领域应该是数字人最早进入的应用场景之一(2020年之前)。

⑩https://www.gartner.com/en/newsroom/press-releases/2022-09-14-gartner-highlights-seven-disruptions-cios-might-not-s.

B11艾媒网:《2023年中国AI数字人产业研究报告》(https://www.iimedia.cn/c400/96607.html)。

参考文献

陈龙强 张丽锦. 虚拟数字人3.0:人“人”共生的元宇宙大时代[M]. 北京:中译出版社, 2022.‖Chen, L.-Q., Zhang, L.-J. Virtual Digital Human 3.0: The Metaverse Era of Human and Human Symbiosis[M]. Beijing: Chinese Translation Publishing House, 2022.

邓恺俊. 深度剖析AI机会,数字人智能对话系统:未来的人机交互新范式[OL]. “Datawhale”微信公众号, 2024-06-09.‖Deng, K.-J. In-depth Analysis of AI Opportunities, Digital Human Intelligent Dialogue System: A New Paradigm for Human-computer Interaction in the Future[OL]. “Datawhale” WeChat Public Account, 2024-06-09.

甘莅豪 王 豪. 从情感投射到数码情感:数字景观中人机交往的情感嬗变[J]. 现代出版, 2024(3).‖Gan, L.-H., Wang, H. From Emotional Projection to Digital Emotion: The Emotional Transformation of" Human-computer Interaction in Digital Landscape[J]. Modern Publishing, 2024(3).

郭亚军 庞义伟 周家华 马慧芳. ChatGPT赋能图书馆虚拟数字人:技术优势、应用场景与实践路径[J]. 图书馆论坛, 2024(8).‖Guo, Y.-J.," Pang, Y.-W.," Zhou, J.-H.," Ma, H.-F. ChatGPT Empowers Digital Humans in Libraries:Technological Advantages,Application Scenarios,and Practical Pathways[J]. Library Tribune, 2024(8).

韩家伟 朱 妍." 孪生数字人的形象与语言授权框架研究[J]. 软件导刊, 2024(7).‖Han, J.-W., Zhu, Y. A Study on the Image and Language Empowerment Framework of Twin Digital People[J]. Software Guide, 2024(7).

韩 啸 李静怡 马 亮." 政务服务数字人:理论诠释、实践困境与因应路径[J/OL]. 电子科技大学学报(社科版) .‖Han, X., Li, J.-Y., Ma, L. Digital Humans for Government Service: Theoretical Interpretation, Practical Dilemmas and Corresponding Paths[J]. Journal of" University of" Electronic Science and Technology of China(Social Science Edition). DOI:10.14071/j.1008-8105(2024)-5010.

李燕京. 数字人变身虚拟社交弄潮儿[N]. 中国消费者报, 2024a-04-08.‖ Li, Y.-J. Digital People Become Virtual Social Trendsetters[N]. China Consumer News, 2024a-04-08.

李燕京. 数字人直播带货亟待规范[N]. 中国消费者报, 2024b-06-24.‖Li, Y.-J. Digital People Live Sreaming Sales Ugently Needs to Be Rgulated[N]. China Consumer News, 2024b-06-24.

梁向东 梁楚怡. 基于人工智能和数字人技术的对外汉语课程系统开发探索[J]. 互联网周刊, 2023(19).‖Liang, X.-D., Liang, C.-Y. Exploration on the Development of" Chinese as a Foreign Language Course System Based on Artificial Intelligence and Digital Human Technology[J]. China Internet Week, 2023(19).

林一民 邓香莲. 声起数字人:有声阅读中的人机互动、情感依恋与可能关切[J]. 数字出版研究, 2024(1).‖Lin, Y.-M., Deng, X.-L. Voice from Digital Human: Human-Machine Interaction, Emotional Attachment and Possible Concerns in Audio Reading[J]. Digital Publis-hing Research, 2024(1).

刘鸿宇 付继林 王珍珍. 手语数字人技术及智能应用研究[J]. 价值工程, 2024(2).‖Liu, H.-Y.," Fu, J.-L., Wang, Z.-Z. Sign Language Avatar Technology and Its AI Application[J]. Value Engineering, 2024(2).

彭冬雪. AI虚拟数字人与用户的关系建构——发音人的视角[J]. 中国传媒科技, 2023(12).‖Peng, D.-X. The Construction of" the Relationship Between AI Virtual Digital People and Users — The Perspective of the Speaker[J]. Media Science and Technology of China, 2023(12).

彭 兰. 与数字人共存将带来什么?[J/OL]. 新闻界, 2024, DOI:10.15897/j.cnki.cn51-1046/g2.20240808.001.‖Peng, L. The Impact of Coexistence With Digital Humans[J/OL]. Journalism and Mass Communication, 2024, DOI:10.15897/j.cnki.cn51-1046/g2.20240808.001.

任继福. 自然人、机器人与数字人的情感交互[J]. 高科技与产业化, 2023(5).‖Ren, J.-F. Emotional Interaction Between Natural People, Robots and Digital People[J]. High-Technology amp; Commercialization, 2023(5).

王春辉. 数字时代语言伦理的新形态和新表现[J]. 社会科学战线, 2022(12).‖Wang, C.-H. New Forms and Manifestations of" Language Ethics in the Digital Age[J]. Social Science Front, 2022(12).

王春辉. 自然人、机器人、数字人“三人”共生时代的语言生活[J]. 语言战略研究, 2024(3).‖Wang, C. -H. Language Life in the Era of “Natural Human-Robot-Di-gital Human Symbiosis”[J]. Chinese Journal of Language Policy and Planning, 2024(3).

王国庆 裴云强 杨 阳 徐 行 汪 政 申恒涛. 多模可信交互:从多模态信息融合到人—机器人—数字人三位一体式交互模型[J]. 中国科学:信息科学, 2024(4).‖Wang, G.-Q., Pei, Y.-Q., Yang, Y., Xu, X., Wang," Z., Shen, H.-T. Multimodal Trustworthy Interaction: From Multimodal Information Fusion to a Tri-nitarian Human-robot-digital Human Interaction Model[J]. Scientia Sinica (Informationis), 2024(4).

王 妍. 面向数字人交互的视觉跨模态学习研究[D]. 安徽大学硕士学位论文, 2023.‖Wang, Y. Research on Visual Cross-modal Learning for Digital Human Inte-raction[D]. Anhui University, 2023.

王泽亚. 社会表演学在数字人交互中的应用[J]. 文化产业, 2024(10).‖Wang, Z.-Y. Application of" Social Performance Studies in Digital Human Interaction[J]. Culture Industry, 2024(10).

魏小东 习鹏飞. 大语言模型驱动下的虚拟数字人第二语言教育应用研究[J]. 电化教育研究, 2024(5).‖Wei, X.-D., Xi, P.-F. A Study on Application of Virtual Digital Human for Second Language Education Dri-ven by Large Language Model[J]. e-Education Research, 2024(5).

严 通. 基于ChatGPT语言模型的虚拟数字人语音交互应用[J]. 电视技术, 2023(8).‖Yan, T. Virtual Digital Person Voice Interaction Application Based on ChatGPT Language Model[J]. Video Engineering, 2023(8).

张裕岚. 留守儿童父母数字人的交互设计及辅助养育APP应用设计[D]. 北京邮电大学硕士学位论文, 2024.‖Zheng. Y.-L. Interaction Design of" Digital Human for Parents of" Left-behind Children and Design of APP Application for Assisting Parenting[D]. Beijing University of Posts and Telecommunications, 2024.

赵一鸣 郑乔治 沈校亮. 虚拟数字人对用户在线学习效果的影响研究[J/OL]. 现代情报. https://link.cnki.net/urlid/22.1182.G3.20240611.0847.002.‖Zhao, Y.-M., Zheng, Q.-Z., Shen, X. -L. Research on the Influence of Virtual Digital Human on Users’Online Learning Performance[J/OL]. Journal of Modern Information. https://link.cnki.net/urlid/22.1182.G3.20240611.0847.002.

郑 璇. 手语数字人研发现状与思考[J]. 语言战略研究, 2024(3).‖Zheng, X. The Development of Signing Avatars: Current Situation and Reflections[J]. Chinese Journal of Language Policy and Planning, 2024(3).

Bates, Andrée. Using Digital Humans to Cut Costs, Provide Stronger Customer Experiences and Grow Faster[OL]. https://www.linkedin.com/pulse/using-digital-humans-cut-costs-provide-stronger-customer-bates, 2023.

Burden, D., Savin-Baden, M. Virtual Humans: Today and Tomorrow[M]. Boca Raton: CRC Press, 2019.

Chen, S., Zhang, D., Shi, W., Ding, X., Chang, L. Exploring the Efficacy of Interactive Digital Humans in Cultu-ral Communication[A]. In: Zhai, G., Zhou, J., Ye, L., Yang, H., An, P., Yang, X.(Eds.), Digital Multimedia Communications. IFTC 2023. Communications in Computer and Information Science, vol 2066[C]. Springer: Singapore, 2024.

Clarke, D. How Global Businesses Use Multilingual Digital Humans[OL]. https://www.guildhawk.com/blog/how-global-businesses-use-multilingual-digital-humans, 2023.

Crawford," K. Atlas of AI[M]. New Haven: Yale University Press, 2021.

Cui," L.-P., Liu, J.-R. Virtual Human: A Comprehensive Survey on Academic and Applications[J]. IEEE Access, 2023(11).

Firework.The" Five Areas Where Digital Humans Will Help Win Retail[OL]. https://firework.com/blog/what-is-a-digital-human/#The_Five_Areas_Where_Digital_Humans_Will_Help_Win_Retail, 2024.

Hotchkiss, J.R., Paladino, J.D., Brackney, C.W., Kaynar, A.M.,"" Crooke, P.S." The Language of Caring: Digital Human Modeling, Practice Patterns, and Performance Assessment[J]. Procedia Manufacturing, 2015(3).

Konkel, F. Meet Emma, Amarillo’s AI assistant and ‘Digital Human’[OL]. https://www.route-fifty.com/digital-government/2024/05/meet-emma-amarillos-ai-assistant-and-digital-human/396884/, 2024.

Kumar, S. Advancements in Real-time Interactive Digital Humans as TeachingAssistants[OL]. https://www.researchgate.net/profile/Sahil-Kumar-119/publication/382968818_Advancements_in_Real-time_Interactive_Digital_Humans_as_Teaching_Assistants/links/66b52d7151aa0775f274fb74/Advancements-in-Real-time-Interactive-Digital-Humans-as-Teaching-Assistants.pdf, 2024.

Lazer, S. Transforming Patient-Centric Healthcare with Digital Humans[OL]. https://www.healthcareittoday.com/2023/08/17/transforming-patient-centric-healthcare-with-digital-humans/, 2023.

Magnenat-Thalmann, N., Thalmann," D. Virtual Humans: Thirty Years of" Research, What Next?[J]. Visual Com-put, 2005(21).

Newman, S.A., Gopalkrishnan, S. The Prospect of" Digital Human Communication for Organizational Purposes[J]. Front. Commun, 2023(8).

Ram, M. From Chatbots to Digital Humans: The Evolution of" Conversational AI[OL]. https://overtdigitalmarketing.com.au/from-chatbots-to-digital-humans-the-evolution-of-conversational-ai/, 2024.

Rekik, R., Wuhrer," S., Hoyet, L., Zibrek, K.," Olivier, A.H. A Survey on Realistic Virtual Human Animations: Definitions, Features and Evaluations[J]. Computer Graphics Forum, 2024(2).

SolutionsHub. Digital Human in Business: The Potential and Challenges[OL]. https://solutionshub.epam.com/blog/post/digital-human, 2024.

Sung, E.C., Han, D.I.D., Bae, S.," Kwon, O. What Drives Technology-enhanced Storytelling Immersion? The Role of" Digital Humans[J]. Computers in Human Behavior, 2022.

Taglinger, M., Jordan, S., Kracklauer, A.H. Acceptance of Artificially Intelligent Digital Humans in Online Shops: A Modelling Approach[J]. Journal of Applied Interdisciplinary Research, 2023(1).

Tastemirova, A., Schneider, J., Kruse, L.C. et al. Mic-roexpressions in Digital Humans: Perceived Affect, Since-rity, and Trustworthiness[J]. Electron Markets, 2022(32).

Zhai, X.-S., Wu, T.-H., Li, C.-X., Chou, T.-T.," Li, Y. Digital Human in Educational Research: Evolution, Trends and Challenges[OL]. https://www.researchgate.net/publication/382869896_Digital_Human_in_Educational_Research_Evolution_Trends_and_Challenges, 2023.

Zhou, Y., Xu, K., Yin, B.," Liu, N. Research on the Application of" Digital Humans in English Oral Teaching Based on AI Models[R]. In" Proceedings of the 2024 9th International Conference on Distance Education and Lear-ning, 2024.

定稿日期:2024-10-10【责任编辑 孙 颖】

猜你喜欢

人工智能
我校新增“人工智能”本科专业
用“小AI”解决人工智能的“大”烦恼
当人工智能遇见再制造
2019:人工智能
AI人工智能解疑答问
人工智能与就业
基于人工智能的电力系统自动化控制
人工智能,来了
数读人工智能
人工智能来了