AI 技术在全真互联实现过程中的作用分析
2023-08-28蔡依萍华辰烨袁庆达
蔡依萍,华辰烨,袁庆达
(上海对外经贸大学,上海 201619)
全真互联是一种将多种终端和形式相结合的技术集合,旨在通过数实融合创新模式来实现对真实世界的全面感知、连接和交互[1]。它融合了网络通信、物联网、虚拟现实、区块链和人工智能等多种新技术集成数据、内容、应用场景和社交形式,使用户能够实时在线制作和编辑内容。其主要发展特征包括全真体验、无限连接、自由协同及数实融合,这些特征是全真互联不断发展的基石[2]。AI 还可以通过智能化的算法和模型来优化全真互联系统的性能,并不断进行学习和进化,以应对不断变化的环境和需求。因此,AI 在全真互联实现过程中的作用不可或缺,为全真互联的成功发展提供了强有力的支持。
1 全真互联所需的人工智能技术
1.1 机器学习(ML)
机器学习是指不需要直接指导,即可利用数据的数学模型来帮助计算机学习的过程。机器学习技术正朝着技术趋势方向与计算体系方向飞速发展,未来将朝向即兴学习、社会机器学习等技术层面演进。机器学习通过实现智能决策、个性化和自动化,在构建全真互联世界的过程中发挥关键作用。机器学习可帮助实现个性化,其可被训练来分析用户数据和行为,从而在全真互联内创造出高度个性化的体验。这可能包括对虚拟商品或服务的推荐、个性化的内容或定制的用户界面。也可帮助进行智能代理、进行预测性分析、实现自动化等等。
1.2 自然语言处理技术(NLP)
处理自然语言的关键是要让计算机“理解”自然语言,而自然语言指英语等人类语言,而不是指计算机语言的形式语言。NLP 框架被设计为有效地处理文本数据,使机器能够直接理解非结构化文本[3]。在全真互联世界里,人与人、人与物的交互大多通过自然语言的形式,而让计算机理解这些自然语言,并对这些语言做出相应的反应,需要自然语言处理技术。甚至可解决全真互联的一大问题即跨所有语言的即时翻译,对视觉障碍人士的图像识别、分解自然语言如英语,将其转换为机器可读的格式,从而可做到无差别对话,保障每个人享受全真互联的权益。
1.3 计算机视觉技术(CV)
计算机视觉技术又称为图像理解,是通过计算机进行人类视觉观察与分析图像的视觉过程,旨在使计算机和系统能够从数字图像、视频和其他视觉输入中获得高水平的理解[4]。全真互联需要三维世界的立体呈现,人工智能对图像的处理与呈现如今在二维层面已经可以完成,而三维立体的打造需要更高标准的计算机视觉技术。而计算机视觉框架的搭建在模拟城市建设、虚拟场景布置中有极大的作用。
1.4 数字孪生(DT)
作为数字化的现实世界实体,DT 能够同步经营性资产、流程和系统及常规操作(如监控、可视化、分析和预测)与现实世界。DT 位于现实世界和虚拟世界通过物联网连接的中心,因此现实世界中的任何变化都会被反映在数字表示中。由于这些独特的特性,DT 是虚拟世界的基本构建模块之一,并且通过创建现实世界的精确副本(包括结构和功能)作为用户进入和享受虚拟世界服务的入口。利用人工智能技术,DT 可以提高系统性能,简化流程,最大程度地降低维护成本并优化业务和生产。全真互联所需的人工智能技术如图1 所示。
图1 全真互联所需的人工智能技术
2 人工智能在全真互联中的应用
2.1 智慧城市
近年来,智慧城市成为新时代城市发展的一个标志,网络城市社区建设等为提高城市治理水平和城市服务质量有较大帮助,而一个城市是由多个系统在彼此交织并相互作用的,当加入“人”与“社会”等复杂变量之后,城市就成了一个巨大的社会物理信息系统,而全真互联可以为兼容并推广这些社会物理信息系统的下一代人工智能城市模式造势[5]。而全真互联智慧城市的建设需要借助数字孪生、通信、AI 这些基本能力,达到人-机-网-城全面一体化,这种城市系统的数字化转型,需提升城市系统的模拟计算能力,构建全新的数字城市接入模式,通过对人-机-网-城的全面互联,让市民和利益相关方以多方式参与到城市运行的决策过程中,用人的智慧弥补机器的智能,将人的智慧与人工智能结合,达成更好的城市建设。
在物理世界和全真互联中实现智慧城市的不同技术中,人工智能对于实现智能服务的自动化和智能化显示出巨大的意义。通过混合智能运输系统(ITS),一个可以控制和管理城市交通的物联网架构,来进行不同交通服务的实际数据处理和决策,可以为用户提供高质量的实时服务,并降低运营和维护成本。
可持续农业在智能绿色城市中也引起了更多的关注,而人工智能是重要的信息和通信(ICT)技术之一,它已被广泛应用于产量预测、质量评价、病虫害检测等精准农业系统。归功于人工智能的技术数据分析功能,在保证数据安全的前提下,通过收集来自多个认证来源的大数据,许多行政服务可以在全真互联中提供,包括所有的行政服务,如环境、教育、交通、文化和其他民事服务。
2.2 全真互联游戏
游戏一直是全真互联中的一个主要应用,其中机器学习和深度学习正在重新定义和革新游戏产业。在过去十年中,机器学习对视频游戏的开发方式产生了巨大影响。为了构建具有吸引力的挑战和独特故事的更真实的世界,视频游戏开发者和工作室已经越来越多地转向机器学习,作为一个强大的工具集,帮助系统和非玩家角色(NPC)动态地、合理地响应玩家的行动。在游戏中的决策和学习方面,一些主要的人工智能算法都被部署在不同的游戏开发任务中,可以为游戏建模、调整与定制游戏玩法、策略和控制NPC 行为提供依据。此外,许多基于学习的任务都是基于案例的推理系统完成的,通过对用户的游戏性和NPC 行为进行分类,识别用户行为,用以帮助用户根据个人经验调整游戏流程。
在实时战略游戏中,如《星际争霸》,贝叶斯模型已被用于对多尺度的不确定性和多层次的抽象水平进行建模。这些概率学习模型能够应对反应式单位控制,从战术数据中识别目标,并根据战略信息预测对手的游戏方式。为了达到类似人类的智能反应机制,一些游戏软件公司已经在设计和开发阶段的各种测试任务中应用了人工智能。在一些游戏设计中,设计者的目标已经不仅仅是让人工智能去控制NPC 的行为,而是让人工智能掌管整个游戏或者具备设计能力。随着游戏的进行,人工智能可以为玩家生成随机的地图、关卡。例如,在英伟达展示的一种游戏开发工具中,人工智能可以在千万段影片中学习辨别建筑物、道路等不同物体,再配合摄像头把拍摄到的汽车、建筑物等制作组成3D场景,从而减少游戏或VR 内容的开发时间和成本。
总而言之,人工智能与传统的机器学习和创新的深度学习算法在许多方面对游戏体验进行了前所未有的革命:提高了NPC 的智能性,对复杂系统进行建模,使游戏更加美观和合理,进行更真实的人与NPC 的互动,降低游戏世界创建的成本,并为开发移动游戏提供更多的机会。
2.3 数字虚拟人
数字虚拟人是指利用计算机图形学、动作捕捉、机器学习、色彩渲染和语言合成等信息技术创造出的,存在于非物理世界中的个体,其具有外形外貌、语言能力、交互能力等多重人类特征。
数字虚拟人在全真互联中属于拥有“生命”的存在,得益于人工智能技术的突破,虚拟人的制作得以简化、可交互性更强,从而更快地发展。数字虚拟人建立的第一步需要进行前期的形象设计及建模。2D 数字虚拟人需要原画等形象设计,而3D 数字虚拟人需要额外使用三维建模技术生成数字形象,信息维度增加,所需的计算量更大,无论是基于IP 或者真人设计,都需要进行面捕及身体的建模,这些在计算机视觉技术的不断发展下会不断提高,使得虚拟人的形象更为逼真美观。而数字虚拟人所需的人工智能中的自然语言处理技术,将交互技术充当虚拟人的“外在”,人工智能则凭借算法等处理能力,充当虚拟人“内在”,而NLP 交互技术影响了交互能力。数字虚拟人是否能够做到自然交流,主要受到语音合成TTS 技术(语音表述在韵律、情感、流畅度等方面是否符合真人发声习惯)、NLP技术(与使用者的语言交互是否顺畅、是否能够理解使用者需求)、语音识别ASR 技术(能否准确识别使用者需求)等AI 技术的共同影响。在全真互联的世界里,虚拟偶像、虚拟客服、虚拟助手等对于所有被投射在同一个云端网络中的人而言,可以成为向导,成为虚拟世界中的服务型人,是智能化趋势下的新一代人机交互平台。由此可见,全真互联的重要组成部分——数字虚拟人需要人工智能的帮助以更好地发挥其作用。
2.4 医疗服务
医疗服务方面也开始运用虚拟现实技术,以降低医疗服务的成本,并扩大医疗服务的范围。从二维环境到三维虚拟世界,全真互联允许用户以身临其境的方式学习、了解、分享病人的健康状况和医疗报告。通过VR 系统,人工智能在许多医疗保健和医疗领域发挥着重要作用,例如,在提供诊断方面实现更高的效率,提供更快和更准确的医疗决策,提供更好的实时医学成像,以及为医学生支持更方便的模拟环境进行教学指导。在许多用于医疗保健和健康应用和服务的可穿戴设备中,人工智能已被应用于自动识别复杂的感官数据模型,用以支持医生和健康专家在日常生活援助和早期健康风险意识方面做出决策[6]。此外,基于物联网的医疗服务提出了一个使用可穿戴设备的跌倒检测系统,其中开发了一个具有卷积神经网络(CNN)架构的分层深度学习框架,用于协作处理本地设备和云服务器的感官数据。由于能够与多种可穿戴设备协同工作,该系统不仅提高了检测的正确率还可以有效保护数据隐私。除了CNN,循环神经网络(RNN)和长短期记忆人工神经网络(LSTM)网络也被用于处理一些早期健康风险关注的可穿戴感官数据,如跌倒检测和心衰。
随着深度学习,特别是CNN 架构在图像处理和计算机视觉领域的巨大成功,近几年来,由于与自然图像分析相比,需要技术人员和医学专家提供更多的专业知识,因此,深度学习在解决医学图像分析的各种挑战性任务方面出现了巨大的发展。随着人工智能作为数据分析的核心技术的使用,医疗康复训练和医疗诊断的应用,如运动康复和磁共振成像神经反馈可以在VR 环境中开发。一些医疗保健和医疗服务也可以在全真互联中提供,医学生可以通过在虚拟世界中参加为医学教育而建立的互动练习课来提高手术技能,或者病人可以通过虚拟医疗中心和医院的虚拟助手找到一些医疗服务。
2.5 其他潜在应用
2.5.1 电子商务
对于使用价值较高的商品,如食品、日用品、服装等,全真互联时代带来的影响集中在销售渠道的变革。受限于渠道铺设成本高、市场教育不足、技术壁垒高等原因,新零售时代的多渠道融合主要集中在线上电商与线下门店的融合,在各个细分生活场景中的渠道铺设明显不足。但在全真互联时代,虚拟现实和增强现实技术将明显拓宽营销和销售渠道的应用场景。沃尔玛上线的VR 购物体验馆使消费者可通过VR 设备实现云购物,其具备的3D 效果可明显增强消费者的购物沉浸感;拉夫劳伦推出的3D 虚拟化身可解决线上购物试穿难的痛点,通过虚拟体验更好地满足现实需求。
2.5.2 岗位招聘
现在,许多大型科技公司创造性地在全真互联中举办招聘会以吸引年轻人才。潜在的申请者可以通过区块链辅助的认证账户登录到全真互联,然后控制代表自己的虚拟人与代表公司人力资源经理和项目负责人的其他化身自由讨论。对于招聘指导,申请人可以通过基于人工智能的NLP 向虚拟助手询问或接受帮助。在这类招聘活动中,目标是为招聘者和应聘者创造一个友好的环境,进行自由式的交流,应聘者可以主动发现更多关于工作岗位的信息,而不是被动地接受招聘者的提问。人工智能在全真互联中的应用如图2 所示。
图2 人工智能在全真互联中的应用
3 结束语
本文在人工智能四大技术的基础上,分析人工智能对全真互联的实现过程的作用,旨在支持人工智能技术在全真互联应用中的发展。全真互联作为当下对未来世界的展望,为很多现实难以研究的问题,如气候变化、农作物生长、老龄化等提供了一个平台,将现实问题建模为虚拟问题来研究解决,对人类的未来发展有极大的帮助。而人工智能在其中发挥着不可替代的作用。本文的创新点在于国内鲜有AI 技术与全真互联关系的研究,包括AI 技术在全真互联的实现过程的环节中突破的难题等。今后,希望我国人工智能技术可以更快地发展,为全真互联世界打下地基,更好地迎接未来。