留住瞬间
2017-07-20Lingxing
Lingxing
在两年前, 大疆精灵Phantom 3系列诞生的时候,宣传片里说道:“虽然我们已有很多角度观察这个世界,但是总有更多的角度等待我们去发掘。”而无人机也陪伴着摄影爱好者对大山、大湖的追逐,奔赴一个又一个的远方,它帮助我们“向外看”,在那些难以抵达之境,捕获自然的神奇。
然而与望出去相对的,是一种回视的目光。数字时代的生活者似乎对这样的景色更为熟悉:背对美景,45度角望向虚空,表情丰富灿烂。无论何时何地, “我”都是最重要的存在,记录“我”的生活,成为现代人一种难以回避的需要,或者就是我们的生活本身。
“要使无人机更贴近生活。”基于这样的概念,大疆研发团队从最简单的构思开始,Demo到量产,历时一年多时间。在今年5月底发布了这款具备独特交互体验的小型智能航拍机——大疆“晓”Spark。
一键大片
在Spark的演示视频中,一个身穿学士服的女生把自己的帽子抛向空中,旁边是见证毕业典礼的父母,镜头渐渐拉远,呈现出弧形的教学楼,再往后是一片海。这个大片感很强的画面来自Spark的“一键短片”功能。
这一功能对多数用户而言非常实用,意味着不需要为学会无人機的使用花费什么时间成本,在这个闭环里,只需轻轻一点,Spark立即以你为中心拍出一个高质量的10s航拍视频。功能发布后,有媒体做了一个街头实验,找到一个从未接触过无人机的人,在10分钟内教会他使用。最后得出结论,这是一款老奶奶都会用的无人机。
事实上,从精灵系列发布以来,可以看出“到手即飞”是DJI很长时间以来的一个研发思路,也是许多消费级航拍机的产品定位。但这一次的尝试更进一步,往“到手即出片”的方向突破,做到了把确定拍摄对象、进行拍摄、调色剪辑并分享的过程,简化到“一键即可出片”。
研发团队透露,他们先研究了大量用户使用飞行器自拍的视频,包括环游世界400天的那对日本夫妇,在分析这些素材和分享行为的动机后,得出要有特写、远景和音乐这三个元素。
要满足这三点,DJI的工程师对智能跟随的技术方案做了升级。飞行器会根据锁定的目标,自动执行特定飞行轨迹并录制一段视频。目前推出了冲天、渐远、环绕、螺旋四种模式,有更多模式正在验证当中。
在实现过程中,很困难的一个问题是确认环绕目标。“需要知道目标的具体坐标才能环绕,而通过图像算法得到的目标是一个2D平面上的坐标,如何通过2D平面坐标计算出目标在三维世界中的位置坐标也是一个比较麻烦的事情。”
在画面的构图上,《速度与激情》、《魔戒》这样的专业级电影大片也是研发设计师的参照对象。这四种飞行轨迹中不只是让人物处于画面中央,这一功能还考虑了地平线与人物构图的关系,使得镜头远离的时候还能出现1/3的黄金分割地平线。而在螺旋动作模式中,为了达到一个优美的拍摄曲线,也参考了斐波纳切数列。
想得到一部最佳的10s短片,在APP中把视频的中间部分进行抽帧压缩,让短片能达到从特写到远景的最佳过渡,其中10s的视频由3个3s构成,突出目标主体和大环境,中间的部分则会快进。此外,邀请了国内外几名新锐的作曲家为这个功能创作了大量10s原创音乐。
一键短片功能,融合了对用户需求的挖掘、理解与技术积累,让原来需要复杂操作才能完成的动作,变得没有门槛。
极限大小
Spark的另一类用户,通常使用Inspire进行专业影像的制作,已经具备很好的无人机操作能力,购买Spark看中的是它的“小”。
深圳卫视的记者乔舟在发布会当晚就预定了一台白色的Spark,他说要带出国旅行用。而在知乎上,清华大学电子工程系博士韩迪也表示自己已经收到这款产品,计划月底带去埃塞俄比亚的一个实践项目。
Spark是名副其实的一台“掌机”,且重量只有300g。但“麻雀虽小,五脏俱全”,机械增稳云台、高精度镜头,两组相机、3D 传感系统、红外测高模块、GPS/GLONASS双模卫星定位系统、高精度惯性测量单元以及 24核高性能计算单元。
“这是任何现有巴掌体积航拍机所能达到的极限。”研发团队为了功能性和体积的平衡上做了很大的努力。
小巧、灵活、稳定,保留什么,舍弃什么,每一项决定都经历了反复的测试。“哪怕小,也只有结合视觉悬停避障功能,具备了以GPS飞控系统为基础的自主飞行能力,才能具备电子围栏技术,才能在合法飞行区域中享受飞行与航拍的乐趣,才能确保最基本的安全稳定。”但这是现有市场上大部分小型机产品没有坚守的基本标准。而设计产品之初,Spark研发团队便坚定认为这是必须的一项。
而针对Spark没有三轴云台的问题,研发团队解释:“不做三轴主要是考虑机械结构的限制,Spark的前面空间有限,太过复杂的机械机构容纳不下。由于四轴飞行器的物理特性决定了飞机Yaw轴的控制比较难,不如Pitch 和 Roll控制来得快捷灵敏。所以能够很好地控制Yaw轴角度,也说明了我们飞控的实力很扎实。”
产品研发过程,从 0 到 1 、脑洞大开的过程困难并不大,问题的关键在于如何在有限时间内无数个可能性之间做出正确选择、在技术与艺术面前找到最恰到好处的答案、在错综复杂的技术架构中重构一个极简的工程、推进实现简单易用的用户体验。
手势控制
出人意料的是,Spark被传播最广的一个功能是“手势控制”。Spark全球发布会上,主讲人手势控制几十厘米以外的Spark,无人机跟着手势的方向移动,很像中国武功里的隔空取物。
从口袋拿出Spark,只需10s即可人脸扫描启动并从掌上起飞,使用手势控制飞行器移动,自动跟随与完成拍照等一系列动作并返回到掌心。因为通过手势控制无需依赖任何控制设备,媒体称之为“遥控设备的革命”。
强大的传感器是这一功能的支撑,简单而言,除了主要用于航拍的摄像头,Spark的额头还有一个小型深度相机(TOF),不断采集三维空间里的手势视觉信息。采集到的这些手势图像传输给飞行器 CPU 进行运算分析,完成后给飞行器发送特定的指令。在现有手势识别算法无法满足传感器要求的情况下,工程师为了确保飞行器能对近距离的用户手势进行快速、准确的响应,从最底层开始重写所有模块,算法上做了大量的优化,让Spark真正成为手臂的延伸。
研发团队称,他们从用户场景出发,认为交互一定首先得是人类本能的,一种自然而然的操控方式。用户不再需要理解任何“遥控器通道”、“杆量”、“飞行姿态”、“横滚俯仰油门”这些晦涩难懂的概念。手势是一种人与人之间最原始交流的方式,而通过传感器,在人机交互当中,用户能够和Spark直接沟通。做出一个手势,Spark即会点头并做出回应,有来有往,彼此形成一种默契。
团队间的碰撞持续到产品发布,“Spark不是一个玩具,而是具备感知、懂得思考的一个活着的智能生物。”