APP下载

基于专利数据的全球深度学习技术创新态势

2019-08-16陆平侯雪曹茜芮

机器人产业 2019年4期
关键词:专利算法深度

陆平 侯雪 曹茜芮

通过对截至2018年底全球深度学习领域专利文本数据的分析,赛迪智库规划研究所发现,我国虽在深度学习技术应用层具有较强的拓展能力,但基础层深耕不足成为制约发展的重大短板。为此,本文提出三点建议:打造平台以统筹协调促进研发资源聚合,引导计算、存储、传输等共性技术发展,加快建设人工智能新基础设施,辐射未来更广的应用领域。

人工智能的应用和落地场景越来越宽泛,图像识别、语音识别、机器翻译、AI医疗、自动驾驶等领域不断有新产品落地,深度学习技术则是促进这些产品落地的关键。以深度学习领域相关技术术语为关键词进行12门语种跨语言检索,获取截至2019年3月底的中、美、韩、日、德等17个国家专利局及PCT(国际专利合作协定)相关专利信息,形成深度学习领域包括16335项专利文本数据集。通过对该样本数据集进行LDA主题挖掘,可分析把握全球深度学习技术的创新态势。

全球深度学习技术创新态势分析

从新增专利数量看,目前全球深度学习领域技术创新正处于蓬勃发展期。2018年全球深度学习领域新增专利7429项,是2017年的2.34倍。2018年PCT新增专利429项,是2017年的3.67倍。中国、美国与韩国专利局的新增专利数量居于全球前三,其中,2018年中国为5638项,美国为736项,韩国为315项。从深度学习领域新增专利数量的变化看,中国目前是深度学习创新全球最活跃的国家。

从申请主体构成看,企业与科研院所的研发能力大致相当。2018年,全球以公司为申请主体的深度学习技术专利有3496项,人工智能的应用和落地场景越来越宽泛,图像识别、语音识别、机器翻译、AI医疗、自动驾驶等领域不断有新产品落地,深度学习技术则是促进这些产品落地的关键。以深度学习领域相关技术术语为关键词进行12门语种跨语言检索,获取截至2019年3月底的中、美、韩、日、德等17个国家专利局及PCT(国际专利合作协定)相关专利信息,形成深度学习领域包括16335项专利文本数据集。通过对该样本数据集进行LDA主题挖掘,可分析把握全球深度学习技术的创新态势。

全球深度学习技术创新态势分析

从新增专利数量看,目前全球深度学习领域技术创新正处于蓬勃发展期。2018年全球深度学习领域新增专利7429项,是2017年的2.34倍。2018年PCT新增专利429项,是2017年的3.67倍。中国、美国与韩国专利局的新增专利数量居于全球前三,其中,2018年中国为5638项,美国为736项,韩国为315项。从深度学习领域新增专利数量的变化看,中国目前是深度学习创新全球最活跃的国家。

从申请主体构成看,企业与科研院所的研发能力大致相当。2018年,全球以公司为申请主体的深度学习技术专利有3496项,以高校科研院所为申请主体的有3416项,大致呈现平衡格局。根据专利数量排名,2018年全球排名前五的企业主要有IBM、平安科技、三星电子、谷歌和英特尔,分别新增62、53、52、46和45项相关发明专利。全球排名前五的科研院所主要有华南理工大学、电子科技大学、天津大学、浙江工业大学和清华大学,分别新增140、114、93、79和78项相关发明专利。

从算法角度上看,卷积神经网络算法占比最高,生成式对抗网络算法使用量快速增长。从深度学习算法角度看,卷积神经网络(CNN)、循环神经网络(RNN)、生成式对抗网络(GAN)、长短期记忆网络(LSTM)等成为深度学习热门算法,使用频率逐年增高。2018年,全球涉及CNN、RNN、GAN、LSTM算法专利数量为3061、239、38和31项,分别比上年增长122.7%、94.3%、533.3%和416.7%。可见,卷积神经网络算法占绝大部分比重,生成式对抗网络(GAN)算法增长势头迅猛。

从技术应用领域看,深度学习技术在机器视觉领域的应用比重较大,自动驾驶领域应用创新热度较高。深度学习技术目前主要应用于机器视觉、自然语言、自动驾驶等领域,其中机器视觉创新热度最高。在机器视觉领域,2018年全球涉及图像、视频等机器视觉领域的深度学习技术专利分别有3674项和673项,两者合计约占2018年全球深度学习技术专利总量的58.5%。在自然语言领域,2018年相关专利技术有495项,比上年增长约104.5%,充分表明自然语言领域应用深度学习技术的创新热度较高。在自动驾驶领域,深度学习技术应用创新最热,2018年相关专利技术有133项,比上年增长约182.9%。

我国深度学习技术创新现状分析

我国在深度学习技术应用层具有较强的拓展能力,但基础层深耕不足。我国创新涉及的应用方向较为广泛,已涉及行人识别、能耗預测、中医文本命名实体识别,以及眼底图像的视网膜血管分割等很多不同的领域。例如,百度在线公司把深度学习技术应用于语音识别、图像生成、人脸图像识别、端到端自动驾驶系统等领域,商汤科技公司把深度学习技术应用于人物识别、三维人体姿态预测、实例分割、图像分割神经网络、视线追踪等领域。而美国在深度学习领域的技术创新大多聚焦于基础层的效率提升。例如,IBM公司研发了一种应用于大规模深度学习的多方向缩减技术,能够较大限度地减少系统节点间通信所需的传输数据量,从而提高计算效率。整体而言,我国更偏向于应用创新,做计算、存储与传输优化方面的专利相对较少。

我国深度学习专利增长迅速,但以企业为主体的创新较少。从增速上看,2016-2018年,我国深度学习领域的新增专利数量分别为701、2487和5638项,平均年增速达到183.6%。从构成上看,中国的研发力量集中于高校科研院所,而美国主要集中于企业。2018年,美国以企业为申请主体的新增专利数占其总量的81.5%,而中国以企业为申请主体的占比仅为40.8%。

我国使用深度学习技术的企业高度聚集于广东省、北京市等地,区域分化差距拉大。从空间分布格局看,京津冀地区和珠三角地区创新活跃度最为显著。2018年,我国深度学习领域技术创新最活跃的前30家企业(按新增专利数排序),分布在北京市、广东省的数量占比分别为46.7%和20%。从空间分布变化看,对比2017年和2018年最活跃的前30家企业分布格局,广东省从4家上升至6家,北京市从13家上升至14家,上海市从4家下降至0家。可见,广东省、北京市在人工智能(深度学习技术领域)领域的活跃度在上升,而上海等地的活跃度有所下降。

发展建议

打造平台,统筹协调促进研发资源聚合。美国近81.5%的人工智能(深度学习方向)研发创新力量集中在企业,有很强的商业目标性。我国研发主力则大多集中于科研院所,且研究力量比较分散,研发方向不够聚焦(多数是技术在某些新领域的应用),研发经费也碎片化,难以聚集力量解决重点问题。建议借鉴美国成立国防部高级研究计划局、Google X 实验室、Facebook 人工智能研究院的经验,成立我国的人工智能国家实验室和人工智能产学研协同创新中心,以打通政产学研用各环节,促进研发资源聚合,聚焦难点环节重点攻关。

加强导向,引导计算、存储、传输等共性技术发展。不管人工智能应用如何拓展,其数据存储、信息传输、高性能计算等共性技术还是相通的。美国很多企业已经看到了这一点,谷歌、IBM、英特尔、英伟达等企业,大多围绕计算效率、数据传输等人工智能的基础层进行专利布局,而把应用创新交给了研发社区。这种做法既抓住了人工智能产业的关键核心,又能够确保创新活跃度。从我国专利布局看,目前还主要集中于深度学习技术应用层,只有通过引导资源投入通用与共性技术领域,才能使我国人工智能产业走出“专利成果数量多但关键技术少”的怪圈。

构建产业生态,加强人工智能新基础设施建设,辐射更多应用领域。从谷歌公司的专利创新看,一些是围绕TPU云服务方向布局。其近期开源的Tensorflow框架、云化TPU计算资源,就降低了深度学习模型部署难度,大大促进了人工智能的大众化与普及。不管未来应用如何变化,计算和存储都是核心领域,只有掌握这些领域,才能成为智能时代的基石。目前我国仍然缺乏完整的人工智能产业生态,特别是在基础硬件(芯片)领域。未来,一方面要加快补齐基础层软硬件短板,围绕一些特定应用场景(如智能手机、无人机、智能驾驶等),从硬件实现角度颠覆性地突破类脑神经芯片,如深度卷积神经网络芯片等。另一方面,加快建设人工智能新基础设施,发展高性能、高安全的异构计算服务集群及边缘计算,通过开源深度学习框架、云化计算资源等,促进人工智能普及,辐射更广更深的应用领域。

猜你喜欢

专利算法深度
四增四减 深度推进
深度思考之不等式
Travellng thg World Full—time for Rree
简约教学 深度学习
学习算法的“三种境界”
算法框图的补全
算法初步知识盘点
2007年上半年专利授权状况统计
深度挖掘