基于CiteSpace的人工智能虚拟数字人发展研究热点与趋势分析
2024-05-01谢明晰周祚山
谢明晰, 周祚山
(广西师范大学职业技术师范学院, 广西 桂林 541004)
随着科学技术的迅猛发展,虚拟数字人(virtual digital humans)作为一种新兴的技术应用,吸引了学术界和产业界的广泛关注[1]。与传统的计算机生成图像(computer generated imagery)相比,虚拟数字人更加注重模拟和表达人类的感知、思维和情感。
虚拟数字人的出现不仅给娱乐、影视等行业带来了巨大发展机遇,在医疗、教育、社交媒体和人机交互等领域也有广阔应用前景。例如,虚拟数字人可以作为电影、游戏和虚拟现实角色与观众进行互动,提供身临其境的娱乐体验[2]。在教育和培训领域,虚拟数字人可以作为教学助手,为学生提供个性化学习支持。此外,虚拟数字人还可以在社交媒体和人机交互等领域发挥重要作用。
在国家层面,一些国家已经开始关注和制定政策以推动虚拟数字人技术的发展。中国国家新闻出版署在2019年发布的《关于加强虚拟现实(VR)、增强现实(AR)内容和应用管理的通知》中明确提出了加强虚拟数字人技术的研发和应用,以促进文化创意产业的发展[3]。美国也在不久前发布了《虚拟人格权和伦理原则》以规范虚拟数字人的使用和保护人类隐私[4]。在欧洲主要发达国家,虚拟数字人技术也得到了广泛的关注,包括英国创业公司Soul Machines开发的“Digital Human”虚拟数字人,瑞典公司KRY开发的可远程问诊的医疗数字人“Avatar”等。
但是,目前虚拟数字人的发展也存在诸多的问题和挑战。包括虚拟人的外形、动作、声音等还不够逼真,“虚拟”的外在性还比较明显;其“智力”水平不够高,不能完全模仿并了解人的思维与情绪;在使用虚拟数字人过程中,还会涉及一些伦理和法律问题,如隐私保护、虚拟人格权等方面的探讨和规范还不成熟[5]。
基于此,本文以CNKI(中国知网)数据库中相关期刊文献作为研究样本,运用CiteSpace工具进行数据分析,旨在通过对虚拟数字人领域的学术研究进行关键词分析和知识图谱构建,揭示虚拟数字人技术研究热点和趋势。同时,结合有关国家政策和发展规划,探讨其在不同领域的应用前景与挑战,并提出相应解决方案。为进一步推动虚拟数字人技术发展和应用提供有价值的参考和指导。
1 数据来源和研究方法
1.1 数据来源
利用CNKI中国学术期刊网络出版总库的CSSCI(中文社会科学引文索引)期刊和中文核心期刊进行检索,文献检索时间为2023年7月25日,时间跨度设置为2000—2023年,检索式为:SU=(“虚拟数字人”+“元宇宙”)*(“人工智能”+“虚拟现实”),通过手工剔除无效文献,最终获得945篇有效文献作为本文的研究对象。
1.2 研究方法
2 研究现状
2.1 文献时间分析
发文量的时间变化是衡量该领域研究发展态势的重要指标[7]。根据发文量随时间的变化趋势可知(图1),2020年后,关于虚拟数字人的研究热度迅速攀升。究其原因:一方面2021年后,元宇宙概念盛行,由此被视为人类进入元宇宙媒介的虚拟数字人也备受资本追捧;另一方面,包括AIGC (人工智能生产内容)、语音识别、图像识别、动作捕捉等虚拟数字人相关的技术,能够模拟和还原人类的外貌、声音、动作等特征,使得虚拟数字人在外观和性能上更加逼真,技术上日臻成熟,并在舞台表演、代言、短视频等领域中得以“出圈”[8]。
图1 2000—2023年我国虚拟数字人研究发文量
2.2 发文作者分析
发文作者及其合作网络结构特征分析,可以反映该研究领域的核心作者群及其合作关系[9]。发文作者合作网络图谱(图2)显示:①目前我国研究虚拟数字人的学者较为稀缺,网络密度为0.002,发文量较多的作者间有相对固定合作对象。②作者集中度较高,从表1可以看出,发文量较多的作者中郭亚军和马慧芳合作发文17篇,李佳宁和温梦华合作发文16篇,他们之间在图谱中都显示出紧密合作关系。影响力较大的作者是喻国明,在图谱中圆形的突现点最为明显。③发文作者间的合作关系呈现出一个“小聚集,大分散”的特点,多数作者间都是两者或三者间的合作,没有形成一个合作网络的群体,不同的团队间缺乏合作,其原因可能是由于“元宇宙”概念较为新颖,国内近期学术研究较少,作者间交流不多。
表1 2000—2023年虚拟数字人研究的核心作者及其发文量
图2 2000—2023年发文作者合作网络图谱
2.3 发文机构分析
通过对研究机构发文量排名(表2)分析可以看出:①《每经》发文量最高,达到了96篇。该机构作为我国首个以公司新闻和理财信息为主,是一份对财经业界和投资者有参考价值的全国财经大报[10]。可见元宇宙数字人的话题在财经新闻界备受关注,其商业价值也在近几年高科技发展中不断上升,市场规模不断扩大。②从表2中可以看到,高等院校的管理学院和新闻传播学院是主要的发文机构。
表2 发文量排名前20的机构及发文量
武汉大学信息管理学院、北京大学信息管理系、华侨大学新闻与传播学院、中国政法大学光明新闻传播学院、南京大学信息管理学院、中国科学院复杂系统管理与控制国家重点实验室等都对虚拟数字人开展了不同主题的研究。由此可见,目前对于虚拟数字人的研究多从经济、信息管理及新闻传播的视角进行探讨。虚拟数字人在未来的应用领域不可估量,在经济学、教育学、医学、计算机等学科领域都有拓展交叉研究。
3 研究热点与趋势
3.1 研究热点
3.1.1 关键词共现图谱分析
对于关键词共现图谱的分析,选取时区为2000—2023年,时间切片设为1,设置TopN=50,选择Pathfinder 作为算法设计网络,最终得到关于虚拟数字人研究的关键词共现图谱(图3)。图3中,关键词节点为416,连线1 125条,密度为0.013。该图谱以年轮为节点样式,节点颜色代表关键词出现的时间,颜色越靠近红色表示时间越近,颜色越靠近灰色,代表时间越远[11]。
图3 2000—2023年虚拟数字人研究关键词共现图谱
关键词的词频反映出研究热点和动向,词频越高,节点就越大,也代表与主题的相关性越大。出现频次在前5的从大到小依次是:“ChatGPT”(296次)、“AIGC”(250次)、“元宇宙”(224次)、“虚拟数字人”(150次)、“虚拟现实”(144次)。出现频次高的都是研究热点,研究领域也比较广泛。从关键词之间的连线颜色可以看到,高频关键词之前的连线颜色是趋向红色的,说明关于虚拟数字人的研究在近几年热度较高。
在知识图谱的可视化分析中,中介中心性超过0.1的关键词对其他关键词有一定的辐射作用,被称为关键节点,中心性越高,关键词越重要[12]。
从宏观的角度分析,任何生产制造都是为了企业增值,因此有些学者将生产过程中的制造能力与企业产值或者效益进行关联,以此实现各种要素与目标实现的关系。从微观角度,制造能力体现的是企业在产品生产过程的综合能力,包括生产过程中各种资源的综合利用,如生产装配、生产工艺以及技术水平等。该过程也体现了从原材料到产品的增值过程。因此本文将制造能力(manumacturing capacity)描述为:在约束条件下,制造资源与制造活动互相作用,完成特定任务或要求的结果体现。
从表3可以看到,虚拟现实(0.87)、虚拟人(0.32)、数字人(0.3)、虚拟偶像(0.16)、元宇宙(0.15)的重要性较高,都超过了0.1。说明以上关键词在虚拟数字人研究领域的文献中占有较强的学术影响力。
表3 虚拟数字人研究中心性排名前24的关键词
3.1.2 关键词聚类图谱分析
为更深一步了解虚拟数字人相关研究热点的知识结构,以及关键词间的内容结构,使用CiteSpace的聚类功能“Clustering”,并运用对数似然算法(LLR)对高频关键词进行聚类,通过调整得出较为清晰可见的关键词聚类知识图谱(图4)。在CiteSpace中衡量聚类计算是否准确的重要指标主要为ModularityQ(聚类模块值)和Mean Silhouette(聚类平均轮廓值)。本文中的模块值ModularityQ=0.746 1>0.3,说明聚类合理可信,平均轮廓值MeanS=0.949 5>0.7,意味着聚类具有高信度。最终得到虚拟数字人、数字人、元宇宙、交互方式、人机交互、虚拟偶像、数字虚拟人、商业演出这八大聚类群组,反映出最近几年研究文献主要围绕这8个关键词展开。
图4 关键词聚类知识图谱
综合分析图3、图4、表3可知,目前虚拟数字人的研究热点包含以下4个方面。
(1)元宇宙。在研究分析中频率较高的关键词里,“元宇宙”“虚拟现实”都是高频关键词。在聚类分析中,许多研究也是围绕#2元宇宙展开研究的。虚拟数字人最终着陆的实现与虚拟现实、元宇宙是分不开的。如今,元宇宙概念持续发酵,并迅速成为科技与互联网行业的“新流量”,这也为虚拟数字人的发展带来了较大的创新空间与无限想象力。郭全中[3]认为虚拟数字人的真正未来取决于元宇宙的发展,随着元宇宙的不断发展深化,虚拟数字人产业会扩大用户群体和市场规模。谢新水[13]通过分析虚拟数字人发展在元宇宙中面临三重技术难题:元宇宙自身成长和治理的复杂性、元宇宙和虚拟数字人共同构建的复杂性及元宇宙算法控制的复杂性,阐述虚拟数字人作为“人造物”,在元宇宙中快速涌现是人的数字化及数字人进化的结果,其数字化成长既受元宇宙又受自然宇宙的影响。总的看,学界普遍认为虚拟数字人未来的发展离不开元宇宙,在元宇宙搭建的智慧图书馆、文物博物馆、大型剧本杀等虚拟现实中,都出现了虚拟数字人的身影[14]。未来元宇宙与虚拟数字人的结合将被应用到更多的领域,其语言处理、情感交互、形象仿真等技术在未来都将为元宇宙的搭建提供更多元化、真实化的服务。
(2)数字医疗教学。虚拟数字人关于数字医疗教学研究中的高频关键词包括数字医学、人体解剖学、三维重建、实验教学、图像分割。研究文献主要集中分布于#3交互方式、#4人机交互。研究内容主要是医疗教学中数字人提供的教学环境对教育教学的影响。其中,李建平等[15]认为虚拟数字人有利于提高学生学习效果,在整个人体解剖学教学过程中,基于虚拟数字人教学平台教学评价体系建立,有利于教师对培养学生整体能力与素质、提高人体解剖学教学效果和强化学生临床课程的学习能力。对于教学实践来说,罗明英和范艳[16]将“数字化虚拟人”软件教学应用到局部解剖学实验教学中,弥补了传统实验教学“缺少三维测量数据和立体图像”的缺陷,对传统解剖学的教学手段是一种丰富和补充,通过对照学习,优势互补,实现了教学手段的突破,也起到了为后期影像断层解剖学及临床手术等提供了最大还原人体结构本身效果的作用,进一步为“数字化虚拟人”的应用提供了更广阔的研究领域。可见,虚拟数字人未来在医疗教学,甚至是各类教育行业都有很大的应用前景,研究热点不断提高。
(3)数字媒体。虚拟数字人在数字媒体研究上的高频关键词主要是虚拟偶像、主持人、中国数字人等。研究文献主要分布于#5虚拟偶像、#7商业演出。研究内容涵盖虚拟数字人在游戏、传媒、影视等领域的广泛应用和其集中在虚拟偶像、品牌营销的B端业务。当前,虚拟数字人的技术已经逐渐成熟,产业链已初具规模。大量企业,特别是互联网巨头都在积极地布局,同时也有大量资本参与进来,它们在数字媒体行业中得到了广泛的应用。李亚铭和李阳[17]认为日臻成熟的人工智能技术、虚拟现实技术正以其仿真、沉浸、交互的优势渗透到各行业领域,综艺节目在此浪潮下实现了新的突破。郭全中[3]提出的虚拟偶像3.0时代中指出,随着图形渲染、图像识别、动作捕捉、深度学习等技术的成熟,虚拟数字人正在以虚拟客服、虚拟导购、虚拟学生、虚拟主持人、虚拟网红达人等形象不断渗透和参与到现实生活中。与其他研究热点不同,在直播电商和品牌营销高速发展的时代,面向众多消费者,吸引了大量企业纷纷投资[18]。由此可见,对虚拟数字人在数字媒体上应用拓展的研究分析具有可行性。
(4)ChatGPT赋能。ChatGPT一经问世便引起众多学者的广泛关注,其高频关键词主要是ChatGPT、AIGC、人工智能;主要文献研究分布在#4人机交互、#人工智能。研究内容涵盖数字图书馆应用、自然语言处理、人工智能生成内容等。ChatGPT赋能虚拟数字人的优势包括高效的智能模型计算、精准的信息资源服务和人性化的自然语言交互。郭亚军等[19]阐述了其在图书馆领域具有的重要价值和意义,是提升图书馆服务水平、优化服务效率及推动服务模式创新的必要选择,也是适应信息化时代发展趋势的重要举措。陈芳[20]认为作为虚拟人驱动的大脑之一,既是虚拟人能够在元宇宙中感知行为并做出反馈的核心要素,也是其学习并掌握技能的关键所在。据市场调研机构IDC(国际数据公司)数据,预计到2026年中国人工智能数字人市场规模将达到102.4亿元,市场将呈现高速增长态势,有观点表示,AI驱动的虚拟数字人将会是下一个技术风口[21],而ChatGPT的出现则给了由AI驱动的虚拟数字人更多想象空间。
3.2 研究趋势
在CiteSpace的分析中,关键词时间线图谱是一种从时间跨度上显示知识演进的视图,用来分析时间序列下某一领域的研究脉络和热点变迁[9]。2015—2023年虚拟数字人领域研究热点的演进脉络如图5所示。2015—2016年为兴起阶段,研究的总体聚焦于“虚拟数字人”“元宇宙”“人机交互”“虚拟现实”等热点,并且这些关键词持续被学者关注,维持着较高的研究热度。
图5 2015—2023年虚拟数字人领域研究热点的演进脉络
2021—2022年,虚拟数字人研究热度处于集中爆发阶段,呈现出两方面的研究热点。一是数字化转型方面,出现大量关于虚拟数字人的研究技术关键词,如 “多模态交互”“解剖学教学”“仿真系统”“深度合成技术”等,这些关键词的涌现和新冠肺炎疫情息息相关。新冠肺炎疫情出现后,由于疫情防控软件的使用及线上会议、线上购物、在线学习等网络生活发展,带来了“肉身人”向“数字人”的关键转化,形成了“数字人”和“数字生活”,在医疗康复及教育培训中都得到了广泛应用[13]。二是新媒体娱乐方面,虚拟数字人已经在游戏、传媒、影视等媒介中得到了广泛应用,众多企业尤其是互联网巨头积极布局,资本大量涌入。各大游戏厂商携带其强大游戏引擎“破圈”助力打造强大虚拟数字人[22],字节跳动也与乐华娱乐合作共同进军虚拟主播市场,新华社、人民网、央视网推出的虚拟新闻主持人纷纷亮相[23]。
2023年,研究热度则处于冷静期。由于虚拟数字人需要不断进步发展,但在技术上仍受到不少阻碍,其面临的挑战、问题及对策还有待进一步探讨研究。与此同时,文旅产业中虚拟数字人技术却得到了较多应用。随着文旅产业的大力发展,在“文旅元宇宙”的概念被提出后,博物馆、景区等文化旅游场所开始引入虚拟现实和增强现实技术,为游客提供“沉浸式+互动性”的旅游体验[24]。此外,一些旅游平台也开始推出文旅元宇宙产品,为用户提供虚拟旅游服务。
4 结论与建议
4.1 结论
以2000—2023年CSSCI期刊和中文核心期刊中与虚拟数字人相关的论文为数据基础,运用CiteSpace工具,对虚拟数字人的研究现状、研究热点与演进脉络进行分析,得到如下主要研究结论。
(1)通过对虚拟数字人研究现状分析发现:①文献的发表数量逐步攀升,当下研究处于热潮期。②发文作者中以郭亚军、马慧芳、陈义、彭思雨、温梦华、李佳宁、喻国明等为主要作者代表,作者间呈“小聚集,大分散”的特点,其合作关系还需要不断加强,研究作者需要扩大研究范围及增加不同学科之间交流。③ 高等院校和研究机构主要是管理类及新闻类居多。未来虚拟数字人的研究和应用领域不可估量,在经济学、教育学、医学、计算机等学科都会拓展交叉研究,所以各个学者和机构间都还需要交流合作。
(2)通过对虚拟数字人研究热点分析发现:①“ChatGPT、AIGC、元宇宙、虚拟数字人”是目前研究阶段出现频次最高的4个关键词,其中“元宇宙”和“虚拟数字人”的中心性大于0.1,具有较强的影响力。②从关键词聚类看虚拟数字人、元宇宙、交互方式为主要的研究主题,大多数研究都隶属于这些范畴。
(3)通过对虚拟数字人的演进脉络进行分析发现:该领域研究经历了兴起阶段(2015—2019年),研究热点为元宇宙、人机交互等,并且关注热度持续了很长一段时间;爆发阶段(2019—2022年),该时间段虚拟数字人在各个领域的应用不断扩张,特别是在医疗、教育、经济等领域的应用都在萌芽生长;深化时期(2022年至今),对虚拟数字人未来技术发展,其算法研究热度上升。“文旅元宇宙”等新型理念备受关注[25]。
4.2 建议
总的来看,当前有关虚拟数字人的研究还存在诸多问题和挑战。结合前文的研究分析,对虚拟数字人的未来研究方向、应用领域、理论框架等方面提出以下建议。
(1)明确研究方向,加强跨学科交流。为了推动虚拟数字人的发展,明确研究方向并加强跨学科交流是至关重要的。通过明确研究方向,可以更好地指导研究工作,并避免资源的浪费。总的来看“ChatGPT”和“AIGC”中,虚拟数字人应用有着较好发展前景,但现有研究较少。对此,研究人员可以多关注虚拟数字人在情感与交互方面的技术研究,探讨虚拟数字人在与用户交互时需要的准确可靠信息,及如何使虚拟数字人具有更高准确性和可信度。此外,虚拟数字人研究涉及多个学科领域,如自然语言处理、机器学习、心理学等。研究人员可以通过加强跨学科交流,共享不同领域知识和经验,从而加快虚拟数字人技术发展。例如,心理学领域专家可以提供关于用户心理需求和行为洞察,帮助改进虚拟数字人的交互体验。
(2)丰富人物功能,拓宽应用领域。丰富人物功能并拓宽应用领域是提高虚拟数字人价值和影响力的关键。虚拟数字人功能应不限于提供基本对话和信息查询服务,还应能理解、模拟和表达人类情感、行为和思维。首先,应继续加强对虚拟数字人智能化和学习能力的研究。通过引入最新自然语言处理和机器学习技术,提高虚拟数字人语义理解和回答能力,从而实现更高水平的个性化交互[26]。其次,要不断探索和发展虚拟数字人情感理解和表达能力。深入研究人类情感和情绪模拟,使虚拟数字人更具人性化,进一步加强与用户之间的情感连接,为情感支持、心理咨询等领域提供更广阔应用空间。除了已经涉及的教育、娱乐和创意产业,还可以进一步探索与医疗、金融、人机交互等领域的结合,为这些行业提供更多创新解决方案和应用场景[27]。最后,研究人员还可以与其他领域专家合作,探索虚拟数字人与其他先进技术的融合。例如,与虚拟现实、增强现实、物联网等技术相结合,可以创造出更具沉浸感和智能化的虚拟体验。
(3)完善理论框架,加速技术革新。虚拟数字人的发展需要更加完善的理论框架,以加速技术的发展和革新。建议在虚拟数字人相关研究中,注重理论推进和创新。包括深入研究虚拟数字人的认知模型、情感模型、行为模型等方面,以及对虚拟数字人与现实世界之间的交互、沟通和适应性研究。同时,建议加强对虚拟数字人技术的评估和标准化,以帮助推动技术的发展和应用。随着虚拟数字人技术不断发展,可能会涉及隐私、道德、伦理等方面问题,研究人员需要进一步深入研究虚拟数字人在社会伦理和法律风险的规范问题,以确保虚拟数字人的发展与应用能够符合法律和道德要求。