基于技术角度的全景视频关键技术分析

2018-06-07张灿

无线互联科技 2018年1期

张灿

摘要：在VR技术日益兴起下，全景视频受到了人们密切关注，并以一种新的方式出现在人们视野中。文章分析了基于技术角度的全景视频关键技术，希望可以为相关行业带来一定借鉴作用。

关键词：全景视频；技术角度；关键技术

全景视频由很多镜头360。环绕拍摄物体，支持多角度、多层面播放。用户可对观看视频的方向控制。观看全景视频的用户并不是以被动方式来观看内容，而是成了主体，积极、主动地探索观看内容。采集和制作全景视频利用的是拼接图像技术，是由很多角度来对重叠子图像进行拍摄[1]。因此，本文首先分析了全景拍摄对于VR内容采集的重要性，然后研究了用户沉浸体验中显示技术提高的必要性，最后浅谈了VR视频流畅中传输编码问题，以期可以提高我国全景视频制作技术，进而提高我国社会经济水平。

1 采集VR内容需要以全景拍摄为主

全景拍摄技术与3D图形制作进行对比后发现，全景拍摄技术能够为VR视频提供丰富的内容。而且其技术在提供内容过程中，具有操作便捷、内容采集快速等优点。在进行采集VR内容时，全景摄像机在整个采集过程中是一个非常关键的设备。从目前市面上较为主流的全景摄像机来进行分析，具有非常多类型的可选性。例如：业余便携设备、多运动摄像头组装而成的全景拍摄机。无论哪一种設备，都具备着画质清晰的优点。随着人们对VR内容采集要求越来越高，人们开始追求感官上的立体观。因此，在行业中出现360。3D全景摄像机。比如：Jump系列、Nokia也研发出了同类的产品。为了得到更加高清的画质，有的发烧友通过将多个专业级别的电影摄像机（Red dragon）进行了组合，然后让其成了能够进行全景摄像的专业级别设备。在进行内容采集过程中，相关专业人员还在全景摄像机中配备了4耳全景声采设备。

从当前全景摄像机的发展来进行分析，虽然已经取得了非常大的成果，但在其设备使用过程中，依然存在诸多问题。（l）相机分辨率中的问题。因为用户观看以前2D画面只是相当于全景画面的1/9，在观看VR内容时，想要观看到更清晰的效果，需要全景摄像机分辨率达到4K及以上分辨率。全景相机拍摄内容，主要是以固定式焦距为主，在这样的使用过程中，固定机位所拍摄的距离无法将其画面进行放大，从而需要超高分辨率才能让其拍摄内容更加清晰。而当前的显示屏、压缩以及存储等技术都很难达到这一要求。（2）I/O问题。全景相机需要对多个镜头的焦距以及快门同步控制，确保画面融合的一致性。如：Jump系列的全景相机在进行拍摄过程中，需要通过16张存储卡来实现视频记录。要完成其设备所拍摄内容的复制，需要花费相当长的时间。这样会对其全景视频的发布形成一定的影响。此外，当前互联网视频网站在进行内容发布过程的要求也相对较高，需要为其视频发布提供10接口。最为常见的就是利用SSD硬盘来进行多个数据信息的拷贝。在光纤、SDI以及HDMI等高速接口传入到视频切换台设备中直接录播处理。（3）对于全景摄像机而言，体积都是特别庞大的，在拼接压缩中会耗费很长时间。其视频需要操作人员对其采集内容进行拼接与编码计算，然后才能够实现集成到小型全景相机中，并对所编译完成后的全景视频进行输出，然后对其视频进行普通视频处理，方便后续的视频编辑处理。（4）全景摄像机进行VR直播过程中，必须要保证其拍摄过程具有稳定性，而且要确保其拍摄过程帧速达到25帧/秒。整个过程是一个非常漫长的过程，而且对其数据传输以及视频处理等方面都有着非常高的要求[2]。

2 VR视频质量是拼接编辑的重点

在利用全景摄像机多角度拍摄视频之后，应及时拼接以及校正，将很多个摄像机视频合成完整的视频，进而提供给广大用户。拼接及时需要对拼缝以及光照融合的问题，这就要求提供给用户视频内容质量较高。在拼接全景视频后，还需要进行调色、拼缝修复、字幕等后期制作。如在《撕人订制》这一综艺节目中，就需要在全景视频中加入动画特效以及对白字幕，替换擦除摄像机中的黑洞。在《中网网球赛》全景直播中，则在全景直播系统中叠加比分牌。通过调查发现，行业中有很多应用性较强的全景拼接软件，如Nuke，auto Pano等。其中Nuke具备很多功能，如生成三维点云、估计相机位置、修复拼接等。同时还有很多用在拼接全景、渲染的开源SDK中。如谷歌中的Oculus VR SDK，CardboardVR SDK等。谷歌中的Jump全景相继可以拍摄出更为立体化的全景，在排水中使用了8个左眼的摄像头、8个右眼的摄像头，可在使用Nuke软件生成左眼和右眼对应的全景图，进而得到视频不但有全景，而且立体感还很强，让用户有三维虚拟现实的体验。全景拼接编辑在使用图像处理技术后，其视频内容更加高质量，而想要实现这些，都需要便捷和强大的软件算法。

3 VR视频的流畅需要解决好传输编码的问题

在完成制作VR视频内容后，需利用媒体平台的网络发给广大用户，而当前全景视频技术面临最大的挑战就是网络传输与压缩码率。随着互联网技术的不断发展，在网络中的1 080 P视频资源播放相对较为流畅。但如果要对2 K/4 K全景视频进行播放时，必须要其网络速率达到4M左右，否则在观看全景视频时，会出现经常性卡顿的问题，对于视频欣赏体验有着非常大的影响。在对全景视频进行压缩编译过程中，通常情况下会使用rectangular球面全景图格式作为常规格式。在进行3D 360。全景图片处理时，通过是将左、右眼全景图片进行上下拼接，确保其长度与宽度比为1：1；对于3D180。全景图片，主要是利用左、右眼全景图进行左右拼接，确保其长度与宽度比为2：1。在南北极区域中，球面全景图有很多冗余像素情况，前些年，Facebook实现了全景多棱模型的构建，但在实际测试与应用过程中发现，其分辨率可以将用户不关注的画图进行分辨率降低处理。但当用户转换观看模式时，如何实现将低分辨率视角转换成为高分辨率视角，成了目前的一个技术难题。我国与其他国家很多企业也在对H.265压缩技术进行研究，这一技术可以对超高清视频中的码率有效降低，但H.265软件进行编解码中会浪费很长时间，客户端解码硬件水平还需要提高。另外，网络传输通过光纤到户，很多先进技术的应用，都会显著强化网络传输全景视频数据的流畅性、安全性。但从技术角度上来分析全景视频重点技术，其在视频制作中还有很多问题，这些问题的解决并不是一件简单的事情，需要很多相关工作人员积极研究，并记录好解决这些问题的方式，切实提高全景视频制作技术，从更大程度上提高全景视频制作技术，进而为用户提供更加高清、稳定的视觉盛宴[3]。

4 显示技术影响用户的沉浸体验

全景视频需要安全的、较为真实的显示技术呈现给广大用户，有很多显示方式，如：真三维显示、3D立体眼镜以及头盔显示器等方式。在VR中，头盔显示器是一种很典型的设备。HMD显示技术通常是对无眩晕、沉浸感等问题进行解决，这与分辨率、声音以及视场角等因素有着很大关系。如2015年暴风魔镜所研发的产品，其产品在进行视频观看时的视场角只能控制在60。左右，而且其产品外观与普通望远镜有一定的相，对于所观看画面有一定的区域限制。在观看时周边画面则显示为黑色，在一定程度上对沉浸感形成非常大的影响。据相关数据信息显示，人体眼睛可以完成120视场角，这也让VR研发团队开始着力于头盔式设备的研发，虽然已经通过实现110。视场角范围，但在进行使用过程中会出现非常明显的眩晕感，其主要原因有以下几个方面：（1）刷新率。当人们关观看视频内容时，一旦进行快速转头动作，渲染设备刷新速度无法与视角速度进行匹配，从而导致在使用过程中出现非常明显的迟滞感。要解决这个问题，需要其渲染设备刷新速度达到90 Hz以上。从目前市场中所出现的高端VR头盔来进行分析，ony PSVR头盔的渲染速度已经达到了110 Hz以上，在进行转头动作后，所看到的虚拟背景处于是静止状态，会产生一种非常逼真的视觉效果。（2）全景声。当前市场中较为出色的全景声技术产品以Dolbyatmos为最佳选择。要实现HMD全景声，可以采用HRTF技术来进行声音方向处理，可以实现虚拟景物与其声音的融合。（3）戴上HMD头盔后应对用户个体进行适配，这就好像我们换了一幅新眼镜，应对镜片中的色散、瞳距以及畸變等参数加以调整。

5结语

总而言之，在VR技术越发完善下，其为我们日常生活和工作带来了很多乐趣，但不能盲目乐观，VR技术还需要很大的发展空间。为了能够让VR技术得到更大的发展，需要研发出更加轻便的VR显示设备。让使用者能够在使用过程中，感受到其设备的舒适性。此外，为了能够让使用者更加流畅地观看VR视频，需要从网络建设方面入手，通过提高带宽的方式来实现最佳的视觉体验。对于手势交互方面的研发，应该从感知系统方面进行切入。要结合力学反馈、听觉、视觉以及身体姿态等多个方面的因素来进行考量。同时，在进行VR视频内容发布时，应该以多样化的形式来丰富其视频内容，而不只是简单地局限于视频与游戏中的应用。

[参考文献]

[1]朱云芳，叶秀清，顾伟康.视频序列的全景图拼接技术[J].中国图象图形学报，2011（8）：1150-1155.

[2]封靖波，苏志勋，刘秀平.一种基于相似曲线的全景图自动拼接算法[J]计算机学报，2003 （11）：1604-1608

[3]康彦肖，庞超实时视频图像拼接在视频中的应用[J].信号与信息处理，2008 （38）：26-28