APP下载

逐梦科研路 潜心育桃李记北京航空航天大学电子信息工程学院徐迈教授

2021-04-12文/王

中国科技产业 2021年10期
关键词:复杂度模型学生

◎ 文/王 艳 陈 浩

“刚来北航工作的时候,我的人生目标就是踏踏实实做科研,不断突破技术瓶颈,实现科研成果转化与应用,能够服务于社会、服务于国家,这是第一点。第二点也很关键,就是能培养一批人才。我的学生毕业后,很多都能在国内外著名的高校继续深造,这也是让我感到特别欣慰的地方。”谈及回母校工作的初衷,徐迈笑着说道。

徐迈,北京航空航天大学电子信息工程学院教授、博士生导师,从事科研与教学工作多年,始终保持谦逊严谨、兢兢业业的作风,坚守在科研教学的第一线,通过自己的言传身教、凭借对学术科研的执着追求和对教书育人的无限热爱,深深地影响着身边的北航学子。

航空报国,青春的选择

1999年5月7日午夜(北京时间5月8日),中国驻南联盟大使馆遭到了美军轰炸机发射的导弹袭击,造成正在使馆中工作的3名中国记者不幸牺牲,同时炸伤数十人,使馆馆舍严重损毁。

噩耗传来,犹如当头一棒,国人甚为震惊和愤慨。也是从那时起,徐迈心中那枚航空报国的种子开始慢慢生根发芽……“天行健,君子以自强不息;地势坤,君子以厚德载物。”1999年9月,怀着航空报国的满腔热血,徐迈进入北京航空航天大学电子信息工程学院,开始了本科阶段的学习。

做研究要知其然,也要知其所以然。在大学积淀几年后,徐迈深知理论知识的重要性,为填补自身知识上的欠缺,拓展视野,他又攻读了清华大学电子工程系的研究生。2006年至2010年,他在伦敦帝国理工学院电气与电子工程系师从英国皇家工程院院士Maria Petrou教授,攻读了博士。基于此前理论基础的不断积累,2013年徐迈以人才计划被引进到北京航空航天大学工作。

作为国家重点建设的高校,北京航空航天大学是全国第一批16所重点高校之一,也是20世纪80年代恢复学位制度后全国第一批设立研究生院的22所高校之一。学校服务国家,锐意创新。学校以国家重大战略需求为先导,强化基础性、前瞻性和战略高技术研究,引导和支持创新要素向关键瓶颈技术汇聚、与产学研用深度融合,打造顶级创新平台和一流科研团队,科研总量不断扩大,科研经费人均位居全国高校第一,入选教育部第二批高等学校科技成果转化和技术转移基地。“北航是一个很好的基地、平台,在科研支持和青年人才培养方面都特别吸引我。能回到母校工作,我特别开心。”徐迈说。

科技是国家强盛之基,创新是民族进步之魂。在国家自然科学基金委、教育部等项目持续资助下,他立足于计算与通信学科交叉,长期致力于视频通信理论与关键技术研究,在图像处理、计算机视觉,人工智能及在视频压缩与通信、生物医学工程领域取得了一系列创新成果。

从信源出发,徐迈在视频感知、压缩与传输方面取得了理论和技术突破,将人工智能引入视频通信,创建了率-复杂度-感知失真优化的视频压缩新方法,提出了面向用户感知的多帧质量联合增强技术,解决了传统率-失真理论无法优化用户体验的难题,码率节省超过60%,计算复杂度下降超过50%,授权国家发明专利16项、PCT国际专利2项,美国专利1项……

近 五 年 来,徐 迈 在IJCV、IEEE TPAMI、JSAC、TIP、TMI、JSTSP、TCSVT等 国 际 顶 级 期 刊及CVPR、ICCV、ECCV、AAAI、DCC、ACM MM等顶级会议上发表论文100余篇(均为SCI/EI检索),其 中SCI检索60+篇(JCR1区50+篇,IEEE期刊论文40+篇),谷歌引用3千余次,SCI他引千余次,多篇论文入选ESI高被引论文/热点论文。作为负责人承担项目10余项,包括国家自然科学基金首批原创探索项目、优青项目、2项面上项目、青年项目、军委科技委创新特区项目、3项863项目。担任图像处理领域顶级期刊IEEE TIP编委(Associate Editor)、IEEE TMM编委(Associate Editor)、信号处理领域权威期刊IEEE J-STSP的首席客座编委(Lead Guest Editor)。

产学研合作,促进成果转化应用

科技成果是国家科技创新的重要推动力量,也是国家经济发展的关键竞争力。科技成果转化是实现科学到技术、技术到产品,保障经济高质量发展的“关键环节”。同时产学研合作教育是高校促进科技成果转化、履行社会职责、全面实施素质教育、培养创新人才诸多模式中影响最深远、效果最明显的一种模式,也是高校为经济发展服务必然要走的一条根本道路。高校着眼于知识创新和人才培养,是科技产业化的源头。企业是科技成果的需求方和转化方,是科技成果转化的主要推动力量。加强产学研合作是打通创新链条、促进创新发展的重要支撑。在徐迈看来,高校、科研院所和企业具有不同的优势资源,但也有不同的短板,发展产学研结合可以实现优势互补,对于科技成果转化具有重要的推动作用。

宽带视频通信一直是国家战略需求,其关键在于解决用户体验需求不断增长与通信带宽受限之间的矛盾。依托学校资源,徐迈带领团队始终瞄准国家重大战略需求和社会经济发展需要,基于丰硕的研究成果,坚持走产学研协同创新之路,始终致力于科研成果的转化和应用,并取得了显著效果。

徐迈说:“图像处理和视频处理的核心目标就是让我们的生活越来越美好。具体来说有两个方面,第一个方面就是让视频质量越来越好,分辨率越来越高,人们的沉浸式体验感可以更强;第二方面就是能够把人们从繁重的劳动中解放出来,做一些人工智能的行为研究。”

据徐迈介绍,视觉心理学研究表明:人眼实现了8Mbps带宽下的5亿像素超高清视频传输,其关键在于图像的结构化表征与是人类的视觉注意机理。因此,以人工智能为学科基础,可构建视频感知计算模型,在数据驱动下学习图像结构化表征与视觉注意模型,揭示视频在用户体验上的感知冗余,从而降低视频压缩码率、提高通信效率。然而,传统感知计算模型存在泛化能力弱、精度低的缺陷。为此,徐迈带领团队借鉴人类视觉感知机理,提出了基于图像视频显著性预测新方法。在该框架下构建新型的视频感知模型,能突破现有模型的泛化能力,显著提升模型精度。

“人类能够高效感知视频的主要机理为人类观看视频时关注的清晰区域仅为2~3度,符合视觉注意模型。”徐迈说。对此,他又揭示了与人类关注点相关的视频压缩域特征,提出了基于压缩域特征的视觉注意模型,大幅提升了显著性检测精度与处理效率。此外,他还构建了大规模关注点数据库,设计了新型深度神经网络,提出了基于深度学习的视频显著性检测方法,从训练数据中学习关注点的动态混合高斯模型,阐明了关注点空时分布关系,在模型精度、泛化能力上有显著提升。

徐迈说:“科研成果要落地,要产生价值,必须注重产学研的合作,推动科技成果的转化。”针对传统感知模型难以提升泛化能力的难题,徐迈构建了知识塔框架下视频感知计算模型,精确地揭示了视频通信在用户体验上的感知冗余,突破了现有模型的泛化能力与精度,为优化视频用户体验、降低压缩码率奠定了理论基础。他将感知模型应用于视频监控系统,不仅可提取、定位视频中关键目标,节省视频监控的人力成本,也显著降低了视频压缩码率,最终在多个上市企业中得到成功应用。

此外,徐迈还创新性地将视觉注意模型拓展应用于医学影像,解决了北京同仁医院在青光眼自动检测上的难题,同时论文发表在生物医学工程领域顶级期刊IEEE Transactions on Medical Imaging上,获得了北京市医管中心创新大赛一等奖。据了解,早发现、早干预、终生随诊治疗是避免青光眼致盲的根本途径。然而,青光眼发病隐匿,绝大部分患者处于疾病早期甚至中期却不知情,到发现视功能障碍甚至丧失视力而就医时已到晚期。因此需要建立青光眼的筛查机制,在疾病早期就给予有效地干预治疗。数字眼底图像因其方便和相对经济而成为大规模青光眼筛查的一种方法,但一方面对眼底图像的判读具有主观性,其判读结果依赖医生的个人经验和知识水平;另一方面,通过判读眼底图像进行青光眼筛查也会耗费大量的专业人力资源。人工智能可能是解决上述困境的突破口。近年来随着可视化概念的提出,人们开始用机器关注的热点区域与专家标识的重点区域进行对比,而这在此前的青光眼相关深度学习研究中并未提及。对此,徐迈及其团队将视觉注意模型拓展应用于医学影像,可准确检测眼底图像的病理区域,解决了医院在青光眼自动检测上的难题,在对眼底图像病灶区进行准确判断及后续的临床应用中发挥了重大作用。

持续创新,推动科技成果落地

科学的探索永无止境,创新的每个路口也绝没有尽头。在科研这条道路上,徐迈又开始了新的探索。针对传统率-失真理论无法优化用户体验的难题,他提出了基于感知模型的视频压缩新方法,实现了率-复杂度-感知失真优化,显著降低了视频压缩码率与计算复杂度,有效提升了视频用户体验与通信效率,广泛应用于华为、联通的网络视频直播系统。

1948年,被誉为信息论的创始人克劳德·香农,发表了划时代的论文《通信的数学原理》,奠定了现代信息论的基础。自香农创立信息论以来,视频压缩理论以率-失真优化为核心,沿着数字信号处理的技术路线演进,通过降低视频的空时冗余,提升压缩效率;受理论“边际效应”制约,现有编码标准压缩效率的小幅提升以巨大的计算开销为代价,技术发展遭遇困境。为此,徐迈在感知计算模型基础上,以降低感知冗余为目标,提出了率-复杂度-感知失真优化的视频压缩新方法,解决了传统率-失真模型无法获得感知失真最优闭式解的瓶颈难题,在相同用户体验下,显著节省了视频压缩的数据量与计算资源,有效提升了视频通信效率。

此外,在视频视觉注意模型基础上,徐迈还提出面向视频编码最新标准HEVC的率-复杂度-感知失真优化方法,突破了HEVC无法优化视频用户体验的局限。首先,提出了率-感知失真优化的一系列方法,面向用户体验,建立了感知失真度量准则,设计了率-感知失真优化方程,针对方程中分数阶多项式求解难问题,提出了循环泰勒展开的闭式求解算法,解决了传统方法无法实现最优码率分配的难题,在满足目标码率前提下,使视频压缩后感知失真最小。其次,构建了面向四叉树分割的深度学习模型,提出了HEVC复杂度-感知失真优化方法,推导了复杂度控制方程,实现了感知失真优化下视频压缩编解码复杂度控制。

坚守初心,甘当春风育桃李

产业发展的背后是智造人才的智力支持。多年来,在深耕科研的同时,徐迈也始终坚守在教学一线。2013年起承担本科生“数字图像处理”及研究生“机器学习”“科技论文写作”教学工作。

师者,所以传道授业解惑。在日常教学中,徐迈注重培养本科学生概念理解能力、逻辑思考能力和分析问题能力,致力于开放型和创新型人才培养体系的建立与完善。教学过程中,他注重教与学的互动,理论和实践的结合,鼓励他们用发散思维进行实践和创新。针对学生的特点因材施教,积极将教学研究和改革成果应用到教学中去,向学生开放实验室,在业余时间指导学生进行探索性实验研究。徐迈说道:“实践是检验真理的唯一标准,对科学的探索离不开教学中的实际操作,既要培养学生的创新意识,也要锻炼他们的实际动手操作能力。”

在对学生的培养过程中,徐迈鼓励学生们要敢于突破常规、大胆设想、小心求证、持之以恒。谈到创新,他表示,自己总是鼓励学生要学会“胡思乱想”,完全放开自己的思维。同时,他认为创新需要基础,因此引导学生了解行业领域的情况,了解行业发展的现实需求和存在的实际问题,建议学生通过广泛阅读,建立牢固的知识体系。“科技创新需要兴趣引领。科技创新不是走形式,必须有扎实的理论根基,并了解行业需求。”徐迈说。

对于学生科研素养的培养,徐迈则有自己的见解。在他看来,首先是坚持。徐迈谈到,对学生科研素养的培养应该尽早开始。大一大二的学生,必须夯实基础知识,把课程学好。从大三开始,在兼顾课程的同时,就可以做一些研究方面的工作。在这过程中,最重要的品质就是坚持。持之以恒很重要。其次是传承。“组员同心协力将一件事情做好,并能够一代代传承下去。科研之路漫长艰辛,良好的实验室氛围也尤为重要。”徐迈说道。最后是开放。徐迈特别鼓励学生走出去,在疫情之前,他常鼓励学生走出去交流。只要一有经费,徐迈都会提供经费让学生走出去,参加一些有关航空航天方面的会议,拓宽眼界、开放思想,让学生在良好的环境中不断提升自己,为日后科研工作做好能力储备。

从事科研教学工作多年,徐迈获得了一些荣誉。面对取得的荣誉,他显得低调平和。用他自己的话来说:“这些荣誉不属于我个人,它属于科研团队的每一个人,是团队共同努力的结果。未来,我将一如既往脚踏实地做科研,不忘初心、勤奋教学,为学校、社会发展作出应有的贡献。”

猜你喜欢

复杂度模型学生
一半模型
重要模型『一线三等角』
重尾非线性自回归模型自加权M-估计的渐近分布
一种低复杂度的惯性/GNSS矢量深组合方法
赶不走的学生
求图上广探树的时间复杂度
学生写话
3D打印中的模型分割与打包
学生写的话
某雷达导51 头中心控制软件圈复杂度分析与改进