面向世界 面向未来
——模式识别国家重点实验室
2019-06-05
模式识别国家重点实验室于1984年由原国家计委批准筹建,1987年通过国家验收并正式对外开放。依托于中国科学院自动化研究所。
实验室现有固定人员103人,45岁以下年轻人约占80%,中国科学院“百人计划”引进人才10人,国家杰出青年基金获得者7人。实验室流动人员568人,包括博士后20人、博士研究生210人、硕士研究生167人、项目聘用人员、高级访问学者、客座研究人员等,形成了一个以年轻学术带头人为核心、以青年科研骨干为主体和以高素质的研究生队伍为主力的研究梯队。
立足国家需求,开展创新研究
实验室的定位和目标是:面向国际学科前沿,面向国家战略需求,面向国民经济主战场,开展模式识别领域的基础和应用基础研究,建设国际一流的科研团队,打造具有广泛影响力的模式识别领域国家公共研究平台,使其成为国内外著名的科学研究、技术创新和人才培养基地,推动和引领模式识别学科的发展,为我国信息技术等战略新兴产业发展提供知识、技术与人才储备。
实验室以模式识别基础理论、图像处理与计算机视觉及语音语言信息处理为主要研究方向,研究人类模式识别的机理及有效的计算方法,为开发智能系统提供关键技术,为探求人类智力的本质提供科学依据。
1.模式识别基础理论是开展模式识别及其相关研究的基础,主要研究模式识别中的共性基础理论与方法,包括模式识别的认知机理与计算模型、模式分类与机器学习、模式描述与结构理解等。
2.图像处理与计算机视觉主要研究视觉模式的分析与理解,有着广泛的应用领域和前景。主要研究内容包括三维视觉和场景分析、物体检测与识别、视频分析与语义理解、医学影像分析、生物特征图像识别、遥感图像分析、文档图像分析、多媒体计算等。
3.语音与语言信息处理主要研究听觉模式的分析与理解,是改善人机通信和交互方式、有效利用网络内容资源的重要手段,是实现不同语种之间的全球自由通信的重大关键技术。主要研究内容包括语音识别、话语理解、口语翻译、情感交互、中文语言处理与信息检索等。
4.脑网络组研究内容包括在宏观、介观及微观尺度上建立人脑和动物脑的连接图,以脑网络为基本单元的组学,在此基础上研究脑网络拓扑结构、脑网络的动力学属性、脑功能及功能异常的脑网络表征、脑网络的遗传基础,并对脑网络的结构与功能进行建模和仿真,为类脑研究及下一代人工智能提供基础支撑。
模式识别国家重点实验室
5.类脑智能研究致力于解析神经系统的微观环路,通过借鉴脑的工作原理,构建大规模神经连接的认知计算和学习模型,实现机理类脑、行为类人的类脑智能系统,并研究脑机融合技术,促进人机混合智能的发展。
目前,实验室已承担300余项科研项目,其中包括国家重点研发计划项目,国家自然科学基金重大、重点和面上项目、杰出青年科学基金项目和创新群体项目,国际合作项目,企业合作项目等。近年来,实验室已获授权发明专利300余项;获国家自然科学奖二等奖1项、国家技术发明奖二等奖2项、国家科技进步奖二等奖3项,北京市科学技术奖一等奖1项,中国科学院自然科学奖二等奖2项,其他部委级一等奖2项,国际发明金奖与世界知识产权专项奖各1项。
创新成果大展览
在国家有关部门的大力支持下,模式识别国家重点实验室在模式识别领域开展基础性、前瞻性、战略性和系统性的创新研究,取得了一些成绩,奠定了良好基础。科研成果大量应用于国防建设、社会安全保障和国民经济发展领域。
虹膜识别技术被普遍认为是最具有发展前景的生物认证技术,具有高安全性,可用于安防、国防、电子商务等多个领域。实验室从零开始,通过自主创新,打破国际上的虹膜识别技术垄断,完成了从跟跑者到领跑者角色的转变。如今,在虹膜图像获取方面,实验室实现了从单目到双目、由近及远及从固定到移动状态的图像获取。与此同时,实验室自主建设的CASIA虹膜图像数据库成为目前国际上使用最广泛的虹膜图像数据库,有来自170多个国家和地区的3万多个科研团队申请使用。在完成基础研究的同时,实验室的虹膜识别技术也从实验室走向了市场。
除此之外,实验室也一直在跟踪研究另一种生物特征识别——步态识别。何谓步态识别?即根据一个人走路的姿态和人体信息进行身份鉴定。虽然相对于人脸识别,步态识别的准确率还较低,影响识别效果的因素还有很多,但在安防等一些特殊应用领域,步态识别有远距离识别这一特定优势。
步态识别以其远距离、难隐藏性、非接触性和非侵入性等特点从众多生物特征识别中脱颖而出,大量应用于各个行业。以实验室孵化的银河水滴科技有限公司为例,一些石油企业开始引入其步态识别技术完善防控网络,防范非法闯入者对油田安全的威胁和对油田经济利益的损害;在智能家居领域,该公司的技术可以很好地区分用户属性,替代遥控器等传统操作工具,让家电感知更加智能化。
银河水滴公司还与公安系统合作,首次利用步态识别技术搜索到犯罪嫌疑人。现有的公安系统缺乏有效的视频分析和检索工具,平均每个现发案件需要人工审核数百甚至上千小时的视频资料。利用步态识别技术,对真实监控摄像头拍录的数小时视频进行搜索比对,最终警方在近千人的目标人群中成功确认嫌疑人范围,完成国内首次步态识别办案工作。
虹膜、人脸、指纹、掌纹、掌静脉、笔迹、步态……事实上,各种生物特征识别只是模式识别国家重点实验室众多研究方向中的一个。如何让计算机模拟人类去听、去说、去看、去读、去思考、去决策,让电脑像人脑那样分析和识别文字、图像、视频、音频等是实验室近些年一直致力的方向。
实验室研发的高性能机器翻译系统,率先实现了汉语和蒙藏维等少数民族语言之间的自动翻译,翻译的准确率和速度均已达到国际先进水平,该系统广泛应用于大型跨国公司、军队等部门,在保障国家信息安全方面发挥了重要作用;针对各类文档图像,实验室提出了有效的版面分析、文本行提取和识别方法,获得了领先的性能,在金融和安全等领域实现了规模化应用;实验室研发的高性能多模态人机交互平台,具有远场语音识别和情感识别能力,以及个性化的语音合成系统,向众多企业授权使用。
实验室脑网络组研究中心联合陆军总医院和广州总医院组成联合攻关团队,在基于“植物人”病因、年龄和病程作为重要预测指标的基础上,使用基于脑功能磁共振影像的患者脑功能网络特征,结合机器学习相关算法,构建了一个计算模型预测患者一年之后恢复意识的可能性,准确率达到88%。
在研究计算机感知外部世界的同时,实验室还引入了脑连接信息对脑区进行精细划分,成功绘制出全新的人类脑图谱:脑网络组图谱包括246个精细脑区和亚区,比传统的脑图谱精细4至5倍,该项成果入选2016年“中国十大科技进展”“中国十大医学进展”和改革开放40年中国科学院40项标志性重大科技成果之一。
在人工智能越来越重要的今天,模式识别国家重点实验室在面临着机遇的同时也面临着挑战,尽管如此,实验室仍将继续立足国际前沿,面向国家需求,坚持自主创新的发展之路,力求为我国的信息高科技基础研究做出新的更大的贡献。