增强现实出版物技术解决方案选择策略*
2019-01-02徐奇智刘雪琛周荣庭
□文│徐奇智 刘雪琛 周荣庭
增强现实技术(Augmented Reality,简称AR)是指借助计算机图形技术、可视化技术等技术将虚拟信息叠加集成在真实世界,使得真实世界和虚拟信息同时存在,从而达到超越现实的感官体验的一种技术。[1]这种技术的目标是在电子屏幕上(或目镜上),把虚拟世界加入现实世界影像上并进行互动。其基础技术包括跟踪定位技术、用户交互技术、虚拟融合技术和系统显示技术。
一般认为,波音公司的汤姆·考戴尔(Tom Caudell)在 1990年创造的“Augmented Reality”这个术语是首次提出增强现实的概念。考戴尔将之用于描述一种在现实世界影像之上叠加计算机虚拟图像的技术。[2]AR技术随着移动平台的兴起快速发展,逐渐应用到众多的数字内容中,形成了增强现实出版物。赵丹在2016年认为:“增强现实出版物 (Augmented Reality Publication, 简称 ARP),是在传统纸质出版物的基础上,利用增强现实技术中的三维注册和摄像头的图像识别等技术识别标识或图形,在屏幕上显示出虚拟的三维物体和场景,实现虚实结合、实时交互的立体出版物。”[3]这一定义的缺陷在于把增强现实出版物限制为传统印刷出版物的补充数字内容,虽然目前国内主要的AR出版机构还是传统的出版社,但游戏、广告、电视、报纸、玩具、教育甚至新媒体等行业的企业也开始越来越多地介入AR内容出版中。
除了内容创意,这些AR出版机构面临的最大挑战还在于技术解决方案的选择。大部分AR技术解决方案都掌握在信息技术供应商手中,出版机构只能将AR技术开发外包给IT供应商,限制了内容创意的发挥。对于AR技术缺乏了解,已经成为众多出版社在出版AR内容时的最大困扰,尽管很多出版机构并未意识到这一点。
在国内文献检索中,凡是涉及AR出版的论文,总体上对AR技术缺乏深入的了解,甚至给研究带来了诸多的限制与约束。而在计算机科学领域,涉及AR技术的内容,大多集中于3D技术、计算机视觉、识别与定位算法等底层领域,对AR出版者帮助甚少。在对一些技术社区的调查中,有一些AR技术社区总结了一些技术解决方案的优劣或特点,但是,我们未发现任何针对AR出版各环节提供的技术方案比较,也没有如何根据出版物需求和内容创意进行AR技术解决方案选择的指南。
本文尝试从出版机构的角度,根据其掌握的受众、创意、内容等信息,提供一份技术解决方案选择的指南。
一、需求的分析维度
在选择技术解决方案时,需要综合考虑各种因素,包括内容形式、受众、发行渠道、使用环境等维度,从而选择最适合的技术解决方案。
1.内容形式:AR图书、AR游戏、其他AR应用
AR图书是目前最常见的AR出版物,而且一般提起AR出版物都是指以实体印刷品为载体的AR应用。AR技术的作用主要是用作数字内容和印刷品之间桥梁,方便用户通过印刷品获得数字内容。但在实际应用中,很多AR出版物虽然使用了AR技术,其使用方法完全可以被成本更低的二维码解决方案取代。
AR游戏是以《精灵宝可梦GO》为代表的一种新的电子游戏形态。玩家可以在现实世界中与一些虚拟形象进行互动,从而完成任务以获得游戏体验。与传统电子游戏的区别就在于,这类AR游戏要求玩家在现实世界的空间中完成游戏过程。
除了AR图书与AR游戏,还有一些AR应用是属于工具类、资料类或教育类的应用,比如AR翻译、AR动植物识别、AR导览等。
2.受众:幼儿/儿童、中小学生、职业教育/专业培训受众、普通大众
目前AR出版物的主要受众是少年儿童,但幼儿与中小学生的应用还有一些区别。从操作能力来看,幼儿在把持移动设备或穿戴设备的能力上不足,而一般中小学生可以较为熟练地使用各种设备。从内容定位上,幼儿内容强调寓教于乐,娱乐性更强;中小学生的应用要么是单纯的游戏,要么是单纯的学习,娱乐与学习的融合较少。
在文献调查的过程中发现,职业教育与专业培训领域是被忽视的领域。AR有很大一部分应用领域是在具体技能培训中,比如修理汽车发动机、维修机柜排线等。此外,也有一些特定领域的AR出版物是为普通大众设计的,其中AR游戏是数量最多的,而AR广告、展览场馆的AR展品等常有出彩的表现,具有一定的吸睛效果。
3.发行渠道:传统发行渠道、应用发行渠道、教育/B2B渠道、社交网络
传统发行渠道即是指AR出版物中的印刷品通过传统图书发行渠道发行,而其配套的AR数字内容通过图书上提供的链接或二维码进行下载。目前也有部分产品先发行数字内容再通过数字内容发行平台购买配套图书,可以通过AR技术将图书和数字内容连接起来。
应用发行渠道通常是指包括苹果的应用商城、安卓的各种应用市场、STEAM(全球最大游戏发行平台,也是全球较大的综合性数字发行平台)等发行渠道。
教育/B2B渠道指教育行业中AR出版物由机构采购后分发给用户的模式,通常是AR出版机构面对学校和各类校外培训机构的商业模式。这是AR内容进入学校和各类展馆的主要渠道。
严格地说,社交网络并不是一个独立的发行渠道,更多时候是作为发行渠道配套的宣传推广平台使用。一般用户通过社交网络得到某个AR应用的信息,还需要转到传统发行渠道购买图书,或进入对应的应用发行渠道下载AR内容。但是,随着各大社交网络功能的逐渐强大,社交网络开放平台能够支持越来越多的应用形态,而且HTML5(超文本标记语言的第五次重大修改)技术能够支持更复杂的3D交互和硬件调用,有一些AR内容已经开始试验性地在社交网络上发行和直接使用,例如一些AR广告应用。
4.使用环境:移动环境、固定环境
移动环境是指在移动设备上使用AR内容的环境,也是目前AR内容的主要环境。因为移动设备集成有AR应用必须的摄像头,以及可以极大地扩展AR应用形态的各种传感器,所以目前的AR出版物主要都将移动环境作为主要环境。在未来应当特别关注的是,除了智能手机和平板电脑,类似微软的Hololens(微软2015年发布的头戴式显示设备,支持融合现实技术)、谷歌的Google Glass(谷歌2012年发布的“增强现实”眼镜)的穿戴式设备将有可能成为移动环境中使用的另一大类设备。
固定环境是AR应用的另外一个场景,通常是指在某个固定场地中使用不可移动的设备完成AR应用,比较流行的有基于微软Kinect的一些AR解决方案。另外配备有内置或外接摄像头的桌面电脑也可以当作AR的使用环境。在展览场馆的AR应用中,还可以看到一些比较大型的定制AR设备,主要由显示设备、主机再加上视频采集设备构成。
二、技术解决方案的组成部分
AR出版物的技术解决方案无非是“云”与“端”两个部分及两者之间的通信方案构成(参见图1)。“云”主要是指在服务器端为AR出版物提供支持的各种服务,“端”是指用户消费AR内容时所使用的硬件设备和软件,而“云”与“端”之间的通信主要是指两者之间完成APP(Application的缩写,目前特指智能移动设备上以桌面图标为入口的应用软件)下载、内容下载以及其他数据传输所需的通信过程。
图1 一般AR出版物技术解决方案组成结构简图
1.“云”的可选解决方案
通常“云”要解决的问题主要是APP下载、内容下载和用户管理的问题,因此一般会在云提供管理信息系统(Management Information System, MIS系统)和云存储。这部分不存在太多难以选择的解决方案,而且各种方案相对成熟。
但是在用户访谈中发现,绝大部分AR出版机构在使用公有云服务还是自建私有云服务的选择上还是存在误区。出版机构一般认为,自建私有云服务安全性更高、更可控,并因此倾向于自建私有云而非选择阿里云或腾讯云这样的公有云服务。笔者团队对各种云服务解决方案进行了比较(参见表1),在出版机构可承受的成本范围内,公有云服务从安全性、可靠性、访问速度、可扩展性等方面全面优于一般的私有云服务。此外,国内的阿里云和腾讯云还为开发者提供很多基础云服务或接入第三方云服务,如流媒体服务、文件存储服务、数据采集服务等,极大地降低了开发者的风险和成本。
2.“端”的可选解决方案
在AR出版物的技术解决方案中,因为用户几乎完全是通过“端”来消费AR内容,因此“端”是最复杂的部分。通过图1可以看出,“端”主要由硬件平台、操作系统、AR SDK和AR应用4个部分组成。
硬件平台的解决方案分为移动终端、桌面终端、游戏主机、穿戴式设备和其他定制终端等5个类别(参见表2)。移动终端主要是指各类智能手机和平板电脑;桌面终端包括台式计算机和笔记本电脑;游戏主机主要是PS4(索尼公司的游戏主机 Play Station 4)、Xbox(微软的游戏主机)等主机;目前支持AR应用的穿戴式设备主要是微软 Hololens、谷歌 Glass、索尼 SmartEyeGlass(索尼公司2014年发布的智能眼镜原型)等;定制终端主要是在各展览场馆、商业中心用于展示的AR设备。
表1 公有云与私有云比较
表2 硬件平台比较
操作系统主要分为桌面操作系统和移动操作系统两种。桌面操作系统中,Windows占据绝对多数用户,Mac和各版本Linux也有一些用户。移动操作系统中iOS(苹果公司的移动终端操作系统)和Android两分天下,Windows Phone(微软公司的移动终端操作系统)已逐渐消亡。游戏主机中的操作系统一般是游戏主机厂商深度定制的封闭操作系统,比如PS4采用的是FreeBSD 9.0(一种类Unix操作系统)的定制版,XBox One采用了Windows 8的精简版。穿戴式设备的体积较小,一般采用移动操作系统,而定制终端一般体积庞大,采用桌面操作系统的居多。
AR SDK是AR应用的核心,AR的各项功能和特性都依赖于AR SDK的支撑。目前国内大多数AR应用都是采用国外的AR SDK,而国内的AR SDK大部分都基于开源SDK进行改进。通常出版机构在选择技术供应商时,所遇到的声称拥有自主知识产权AR引擎的供应商,大多也还是在国外的AR SDK上加以定制和二次封装,进而提供一些快速编辑与发布的功能。
因为AR SDK繁多,几乎很少有研发机构能够接触到所有主流SDK。因此在国外Social Compare的网站上,通过社交媒体集合众多网友的经验,对目前市面能见到的主流SDK进行了综合的评估并制作了一张表格。该表格随时根据各SDK的发布情况进行更新,虽然依然比最新的信息略有滞后,但已经是目前最新、最全面的AR SDK综合比较了。现在将SDK技术特性的部分关键信息整理成表3。
表3 主流AR SDK比较
AR应用一般是在SDK基础上开发的具有人机界面的应用程序。目前主流AR应用包括移动APP、桌面软件、Web应用。如果按照功能类型划分,AR应用则可以划分为专有应用和通用应用。专有应用一般是针对本AR出版物发布的应用,如科普绘本《消失的世界》使用的“消失的世界”APP、配套教育卡片使用的“AR口袋动物园”APP。通用应用则指那些可以发行、下载、使用多套AR内容的平台,如中国科技大学新媒体研究院的“科学荟”APP。
3.“通信”的可选解决方案
在AR出版物应用中,主要功能都依赖于客户端,服务端仅为客户端提供必要的下载和数据支持,一般包括应用下载、内容下载、用户数据采集等部分。其中内容下载部分的解决方案一般可分为:与应用打包下载、使用前下载到本地、使用中实时下载。
三、对应需求维度的技术解决方案
杰西·加瑞特在2010年为网站设计提出了一个用户体验要素五层次模型。[4]该模型根据设计目标“基于任务”还是“基于信息”,将网站分为“软件界面”与“超文本系统” 两类,并按照“抽象-具体”程度和从概念到完成的顺序,将整个网站的用户体验设计过程进行了层次划分,分别提出不同类网站在各个环节应当进行的工作。按照从概念到完成的顺序,用户体验要素共分为“战略层”“范围层”“结构层”“框架层”和“表现层”。
如果将此模型应用于AR出版物,在战略层和范围层中,AR出版机构应当已经确定了本文第一部分所述需求分析中的所有维度,即用户体验要素中战略层的产品目标和用户需求、范围层中的功能规格。在结构层中,应当完成技术解决方案的选择工作。笔者为需求维度和技术解决方案之间建立了一种映射关系,并以此形成了4张表格,期望能够成为AR出版机构技术解决方案选择的指南。
内容形式维度对于技术解决方案的决策影响参见表4。其中,AR游戏的形式非常多样,可以基于各种硬件平台产生完全不同的体验,大部分时候游戏创意都是基于硬件平台产生的。
表4 内容形式对AR技术解决方案的影响
受众维度会从硬件形态上影响用户体验,因此硬件解决方案的选择成为基础(参见表5)。例如针对幼儿或儿童的应用,硬件平台首选移动终端,因为移动终端的普及率最高,方便内容到达最终用户。但是,仅仅是智能手机或平板电脑还不能完全满足幼儿的使用特点。以针对幼儿的AR绘本为例,幼儿会在翻书和拿手机扫描两个动作中来回切换,从而导致注意力分散降低使用兴趣。在焦点小组观察中,大部分幼儿会在短时间内要么专注于图书,要么专注于手机,要么注意力转移,很难做好两者的结合使用。在这一点上比较成功的是OSMO套件(参见图2)。这组套件通过一个支撑架将平板电脑支撑起来,再用反射镜将桌子表面的画面反射到前置摄像头中,完全让幼儿摆脱用手操作平板电脑的负担,可以集中注意力在桌面的其他组件和平板电脑显示器的画面反馈中。而在职业教育和技能培训中,因为可以承担相对较大的成本,且对交互要求更高,因此定制设备和穿戴式设备成为首选,例如直升机驾驶培训、通讯线路检修培训等。
表5 受众类型对AR技术解决方案的影响
图2 OSMO Genius Kit
发行渠道与内容形式有强关联,因此选择内容形式后,发行渠道也已经基本确定。如AR图书会通过传统发行渠道,AR游戏会通过应用发行渠道,其他AR应用可以通过应用发行渠道、教育/B2B渠道和社交媒体。发行渠道对技术方案选择的影响参见表6。
表6 发行渠道对技术解决方案的影响
使用环境对于技术方案选择的影响很大,在移动环境和固定环境下,几乎所有的技术环节都会选择完全不同的解决方案(参见表7)。
表7 使用环境对技术解决方案的影响
四、总结
本文将需求从受众、内容形式、发行渠道、使用环境4个维度进行解读,把技术解决方案分为了6个部分并提供了可行的选择项,旨在提供一套指南,能够根据需求解读抽取技术选项并组合成为合适的技术解决方案。这份指南可能的缺陷在于很难跟上技术发展的脚步,也许在其面世之时便已经存在过时之处。但其价值在于,我们将在未来形成一份相对易维护、易更新的电子指南放于互联网上供所有AR出版机构参考。