ITTC2019 |《基于深度学习的超分辨率重建算法及应用》华创高科掀起AI风暴
2019-07-02
5月23日,由中央广播电视总台主办的“2019年北京国际电视技术研讨会”(ITTC)正式开幕,会议以打造“5G+4K+AI”智能化新型媒体,建设自主可控、具有强大影响力的全媒体平台为主题,全方位解读5G网络的发展趋势、5G+4K云制作生产流程、5G+VR“浸入式”场景体验、人工智能助力媒体内容生产等当前科技热点。
中央广播电视总台副台长阎晓明、国家广播电视总局媒体融合发展司司长杨杰、工业和信息化部电子信息司司长乔跃山、中央广播电视总台央广总工程师钱岳林、中央广播电视总台国广总工程师王联、中国电影电视技术学会理事长、广播电视规划院副院长谢锦辉等领导出席会议并详细听取了报告。
本届研讨会,汇聚国内主流媒体技术权威、运营商所属技术研究机构、移动通信公司、互联网科技公司、国内外知名广电设备生产企业的众多业内专家。华创高科研发总监何海东先生应邀以《基于深度学习的超分辨率重建算法及应用》为题发表演讲。
何总首先通过人工智能的发展历程,介绍了深度学习的基本原理,指出深度学习使得人工智能获得了突破性进展,在数据、算法、算力三个深度学习基本要素中,尤其指出数据对深度学习的重要性。并进一步指出,随着深度学习算法的逐步成熟,人工智能已经是一个个落地的真实应用,是我们行业不能忽视的重要方向,是智慧广电的必然选择。在4K+5G+AI三个概念中,AI是其中重要一环,给今后科技带来变革,同样也给今后科技持续的发展产生重要的影响。
接着,讲述了视频图像超分辨率的三种做法:运用数字图像的插值等算法的方法,多场景图像融合的方法,深度学习卷积神经网络的方法,指出海量数据中潜在的数据映射关系为深度学习提供了基础,深度学习以数据驱动的方式建立重建模型和相关约束,与传统的技术方法相比,深度学习能够更智能地增强适应不同场景的图像。
通过目前深度学习超分辨率在网络结构、信号结构、实时重建、对抗网络等方面的几个主要领域应用和代表性的研究进展,较为详细的介绍了每种算法的改进及优缺点。
华创高科所采用的超分辨率技术,是基于信号结构与深度网络技术两个内容,其主要工作包括:在实时方面,在快速超分辨率卷积神经网络的基础上展开。主要思想是用通道数量换深度,减少每层的网络参数,扩大感知域;加入批归一化,加快训练速度;同时加入跨越连接,提升网络性能。在信号结构方面,采用基于子带重建的方法,通过信号复原结构进行分析,将其映射到网络结构中进行端对端的学习,成功将传统信号重建理论和深度网络建立起关联。除此之外,华创还着力于视频技术重建和增强,包括从SDR到HDR增强工作的研发,已经初步完善了前期构架等工作。
最后,何總演示了系统超分辨率的效果视频,以及对一些图像的修复增强、风格变换等扩展应用。指出华创高科的本项成果,将帮助广电及视音频行业重点解决4k频道片源不足,劣质视频图像增强,历史影像修复,画面风格变换,融合媒体UGC素材增强等行业痛点。
华创高科在摄像机的成像技术和高质量图像重显实现上有着丰富的经验,在基于对抗网络的经验上也有几年的研究积累。华创高科推出基于深度学习的视频重建技术,是一次崭新的亮相,这也标志着华创高科从一家广电摄像成像、录像、技术硬件,成功地实现了硬件、软件双驱动的高科技企业。
用AI技术助力我国广电影视视频传媒事业发展尽份微薄之力,为实现“中国创造,世界共享”的宏伟目标而努力!B&P