基于专利计量的全球人工智能技术在医疗健康领域应用发展态势分析
2021-04-23陈欣然李国正崔一迪夏秋芳王明强
陈欣然,李国正,崔一迪,夏秋芳,王明强
(1.中国中医科学院,北京 100700;2.中国中医科学院眼科医院,北京 100400)
1 研究背景
专利是科技创新的源泉,而专利指标是反应创新过程的重要指标[1]。随着专利申请量、优先权量的增长加速,掌握前沿领域及关键技术的专利权成为世界各国(地区)相互竞争的热点,专利已经成为国际上处理国与国之间政治、经济、科技、贸易竞争的重要手段之一[2-3]。
目前医疗卫生健康服务是当今世界发展最快的行业之一[4]。人工智能(artificial intelligence,以下简称AI)已经成为诸多行业技术创新发展的重要来源之一[5]。在国际创新政策环境不断优化、科研投入持续加大的背景下,AI与医疗的结合,满足了医疗行业的价值链多方面需求点,使精准化智能服务更加丰富多样,在各个环节演化出丰富的应用场景[6]。因此,基于全球专利信息进行国内外医疗健康产业的AI创新应用分析,不仅能帮助了解相关领域申请专利的发展历程,掌握AI作为创新医疗健康领域技术热点和关键点的发展现状及趋势,也有利于相关决策者调整医疗卫生健康服务科技发展战略与政策,提高资源配置效率。
2 数据获取与研究方法
2.1 数据获取
本文以德温特专利数据库(derwent innovations index,以下简称DII)为数据来源。德温特专利数据库是由Thomson Derwent与Thomson ISI公司共同推出的基于Web专利信息数据库,整合了Derwent World Patents Index(德温特世界专利索引)与Patents Citation Index(专利引文索引),共收录了始于1963年来自全球40多个专利机构(涵盖100多个国家)的3 000多万条专利信息[7-8],其专利情报和科技情报具有非常高的权威性。因此,本文使用DII作为数据来源,可保证结论分析的充分性、可靠性。
2.2 研究方法
2.2.1 数据分析工具
本文专利数据分析工具依托于中国工程科技知识中心,由中国工程院战略咨询中心、清华大学、华中科技大学、浪潮集团共同建设的战略咨询智能支持系统(intelligent Support System,以下简称ISS系统)及其CDA可视化分析软件和Microsoft Excel。通过ISS系统对专利数据进行整理,提取专利信息分析中所需字段,如摘要、完整IPC报告、DWPI记录等。
2.2.2 检索策略及分析方法
根据本文研究的范围和主要内容,结合中国专利保护协会发布的《AI技术专利深度分析报告》中列举的AI的主要技术关键词以及新兴技术行业研究公司Venture Scanner对AI领域的分类[9-10],通过调研关键词在德温特世界专利索引的检索测试的结果,提炼出相应的关键词及其英文,本文用于界定此次专利分析的检索式如下:
ALLD=((artificial intelligence or AI or machine learning or Depth learning or natural language processing or Speech Recognition or Computer vision or Gesture control or smart robot or Video recognition or Voice translation or Image Recognition or Basic algorithm or Smart search or Smart recommendation)and(healthcare or Clinical or medical or health or telemedicine or Diagnosis or health or hospital or Doctor-patient or medicine));
使用高级检索途径在DII中检索,得到国内外专利6957项以确保查全率和查准率又对重要申请人的申请进行了补充检索,然后从结果中人工剔除明显不符合研究范畴的文献,最终确定全球相关领域专利3807项。
需明确的是有关本次数据分析的图表数据约定:数据检索日期截至2020年2月11日,由于专利申请满18个月方可公开,因此导致在与年份有关的分析中并未完全展示全部量集,前瞻性可参考前两年数值。
2.2.3 专利信息分析法
专利信息分析法又称专利分析法,本文综合运用实证分析、比较分析、系统分析、文字论述与图表描述等研究方法,对收集整理的专利文献中国家信息、申请人信息、技术信息进行统计与分析,旨在明晰AI技术在医疗健康领域应用发展态势[11]。
3 结果
3.1 专利申请概况分析
3.1.1 申请量时间趋势
AI技术在医疗健康领域全球专利申请总量如图1所示。
图1 人工智能技术在医疗健康领域全球专利申请总量
首先对所采集的数据按照时间序列进行了统计分析。从发展趋势看,由于数据发布滞后,目前2019年专利数据未收录全,但根据趋势可以断定随着AI新技术浪潮的兴起,其在医学领域中的应用己势不可挡,行业发展潜力较大。
图1中全球申请量总体呈现增长态势大致可分为3个阶段:约从1973-2010年为萌芽阶段,2010年开始有所发展,相较于前一个阶段,专利数量增幅较大,说明AI技术在医学领域的发明创造活动和专利申请近年来开始活跃,但仍未有实质性突破,可将这段时间视为初步发展阶段;2012年开始专利数量增幅攀升,特别是2016年的专利数量是2012年专利数量的2.96倍。随着技术的飞速发展,行业需求使得AI技术在医疗行业进入快速增长阶段,显示出医学领域对AI技术的融合发展迎来新的发展趋势,这与此时宏观经济发展趋势、医疗需求及供给以及AI技术发展密切相关,人们对医疗健康服务的效果、品质、体验等提出了更高的要求,医疗健康服务将更加注重个性化、人性化;优化就医流程、增加便捷性、改善候诊就诊及病房条件、提升医护人员服务意识、提供精准医疗将是大势所趋。尽管医疗行业通过AI技术驱动服务提质增效的需求迫切,然而,医疗与AI依然需要不断融合,围绕医疗健康核心业务流程,AI技术在提高效率节约成本的目标下,明确技术创新突破攻坚方向。对于以上重点问题,下文将采用比较分析法从重点申请人、技术构成方面进行对比分析。2010-2019年年AI医疗健康领域专利申请数量如表1所示。
表1 2010-2019年人工智能在医疗健康领域专利申请情况
3.1.2 申请国家/地区分析
对3 807件专利进行统计分析得出,中国申请专利数量最多为1 391,其次是美国1 072件、世界知识产权组织611件,及日本、韩国、欧洲专利局等,详见图2所示。中国和美国的专利申请量占全球相关领域所有专利申请总量的36.53%和28.15%,发展态势比较突出。作为创新领域技术发展的热点和关键点,AI技术在医疗健康领域的融合应用不仅创造了开发新技术和知识的机会[12],成为科技发展新的增长点,还成为改变一个地区乃至国家定位医疗产业创新的重要驱动力[13-14]。
图2 人工智能在医疗健康领域专利申请国家/地区
继而采用气泡图来展示申请国家-申请时间二维分析,进一步了解各个国家发展趋势,见图3所示。从图3中可以看出,该领域的主要申请国家发展趋势形成了该领域整体发展趋势。
图3 人工智能技术在医疗健康领域专利申请国家/地区-申请时间二维分析
如图3所示,我国2004年之前相关专利零星分布,这一阶段属于探索阶段。从2004年开始重视申请专利,致力于相关产业发展,开启初步发展阶段。尤其是对比中美的申请情况,我们可以发现从2016年开始中国申请数量突破百项,可将这段时间视为快速发展模式。由此可见,我国AI技术在医学领域的应用专利申请虽然起步晚,探索阶段比较短。
值得注意的是,美国、日本和欧洲专利局虽然总数上低于我国,但都属于行业开始较早的领先国家;尤其是目前美国和中国的专利优先权申请数量增长迅速,领先其他国家地区,但中国只2018年才首次超过美国。这与我国相关医疗创新政策环境不断优化、科研投入持续加大密切相关。我国首次正式在AI领域进行系统部署的规划文件,是2017年7月8日,国务院发布的《新一代AI发展规划》[15]。《规划》指出到2030年,中国AI理论、技术与应用总体上要达到世界领先水平。在《规划》提出的六大重点任务中,医疗作为其中一个重要的应用领域受到了极高的重视,明确了发展智能医疗方向:“推广应用AI治疗新模式新手段,建立快速精准的智能医疗体系。探索智慧医院建设,开发人机协同的手术机器人、智能诊疗助手,研发柔性可穿戴、生物兼容的生理监测系统,研发人机协同临床智能诊疗方案,实现智能影像识别、病理分型和智能多学科会诊。基于AI开展大规模基因组识别、蛋白组学、代谢组学等研究和新药研发,推进医药监管智能化。加强流行病智能监测和防控”。
对比其他国家拓展AI技术在医疗健康领域创新应用,2016年美国白宫公布的两份报告——《白宫为未来人工智能做好准备的报告》和《美国国家人工智能研究与发展战略计划》[16],分别明确强调AI为医疗带来的社会意义和经济价值,使AI医疗领域具有非常乐观的前景,并要在医学诊断等领域开发有效的人类与AI协作的方法,当人类需要帮助时,AI系统能够自动执行决策和进行医疗诊断。2017年3月[17],法国《法国人工智能战略》中指出“在国家健康数据研究所的基础上,法国优先发展卫生健康领域,并将成立真正意义上的‘卫生健康数据中心’,该数据中心包括医保报销数据、临床数据和科研数据等,并最终实现数据开放。”2017年3月,日本发布《人工智能技术战略》,文中日本将医疗健康及护理作为AI的突破口[18]。为应对快速老龄化社会的到来,日本基于医疗、护理系统的大数据化,将建成以AI为依托、世界一流的医疗与护理先进国家。2019年12月17日,韩国政府公布“人工智能(AI)国家战略”,以推动AI产业发展。该战略旨在推动韩国从“IT强国”发展为“AI强国”[19],从2020年起在高校增设AI专业。
纵观世界各国在AI上的一系列战略政策布局,不难发现拥有AI技术或在应用领域具有优势的国家均快速作出反应,并基于自身国情制定出一系列相关医疗领域的AI应用战略[20]。激发近年来全球多国AI在医疗领域申请专利数量增长迅速态势。另一方面,这也与AI技术属性相关,大量AI深度学习平台的出现和框架开源,促使AI技术能够迅速在医疗产业领域中融合研发,足见未来全球在医疗领域AI是重要的应用发展方向。
3.2 主要专利申请人分析
主要专利申请人的专利申请量可以反映出一个产业领域的技术开发程度、投入程度,对专利申请人的分析更能真实反映国内外技术竞争格局。通常认为拥有的专利申请数量较多的申请人的创新能力相对较强,或具备相当的技术优势。图4分析专利申请人的专利数量排名情况,即每个数据点代表该申请人总共申请了多少件专利。
图4 人工智能技术在医疗健康领域主要专利申请人
由图4可以发现申请人有科技巨头、行业巨头、医疗信息化企业和AI技术企业,这反映出AI在医疗行业的应用以满足核心人群和主体参与者的价值需求点为中心,不再集中于医疗背书的行业结构参与为主体,这些申请人为医疗体系的改革突破以及创新发展注入了新的活力。从图4可以看出,SIEMENS Inc.(西门子)、International Business Machines Corporation(国际商业机器)、PHILIPS Inc.(飞利浦)申请的专利数量最多,分别为:141件、120件、68件。其中企业专利申请人为9个,4个为美国公司,欧美国家公司具有显著优势;中国申请人为2个,其中1个为企业、1个自然人,回顾上一节分析我国AI技术在医疗应用专利申请领域总数多,对比排位差距,说明中国专利申请人构成相比国外较为分散,单位申请人能力与国际前沿水平相差较大,其中值得肯定的是平安集团走在我国申请人的前列。
图5 人工智能技术在医疗健康领域专利申请人-申请时间二维分析
继续分析前20排名的重点专利申请人-申请时间二维分析,如上图5气泡图中可以看出,排名第1的SIEMENS Inc.(西门子)和排名第3的PHILIPS Inc.(飞利浦)虽然总数差距较大,但专利申请创新性的时序性,一直常年保持较为持续和高产的发展;而在整体趋势分析中第5位的平安集团及其他后序中国申请人整体集中于近两年开始申请专利,其中浙江工业大学起步较早;排名第8位的HITACHI Inc.(日本日立)虽然是最早开始相关领域的专利申请,但自2007年至2015年及2018年的申请数据为零,创新性相比其早期阶段相差甚远,说明该公司这段时期失去相关研发能力,进一步论证了该公司在重点专利申请人和重点专利权人排名差异较大的原因。
以上申请人中International Business Machines Corporation(国际商业机器)作为科技巨头资金雄厚、能长期布局和投资,AI技术和人才实力有积累,并能结合云平台提供服务,最容易形成全疾病范围、多区域覆盖、平台式的产品服务。而SIEMENS Inc.(西门子)与PHILIPS Inc.(飞利浦)、General Electric Company(通用公司)、上海联影等影像设备企业通过依靠现有的影像设备加入AI算法切入医疗机构,易在自有体系内形成一致性的标准和连接。HeartFlow、腾讯、平安等AI创企对市场反应灵活,部分企业在某些医疗健康领域布局较早,通过与医院进行科研合作、集成进医院信息化厂商软件等形式,形成了一定数据和算法壁垒。足见在新一波技术发展浪潮中,以AI技术为代表的“技术簇”正在为各行各业带来新的技术架构、新的商业模式和新的发展理念。AI技术发展催生的医疗健康行业智能化正在推动各行各业创新发展。
但是由于AI不同于传统的计算机辅助系统,其具有自学习和快速迭代的特性,推理过程也不完全透明[21],上述研究多从宏观层面进行融合应用的整体跨领域研究,而从微观层面即具体技术视角明确其是否能与医疗健康发展创新,产生持久的、稳健的、可靠的产业升级,这为本文提供了新的研究思考。
3.3 技术分析
国际专利分类(IPC)完善的专利技术分类体系,是目前国际通用的比较完善的专利技术分类体系。IPC分类号为5个不同等级:部(Section)、大类(Class)、小类(Subclass)、大组(Main Group)、小组(Group),可以进行技术领域的区分。
3.3.1 IPC3级分类技术分布趋势分析
一般情况下,具有普通意义的可视化能够展示分析结果。可是采取交互式可视化的方式,能够对进行探究式的询问,从而让分析有新的线索,从而形成分析迭代以及可视化。当前,该领域研究的重点,包括以大规模数据为基础的实时交互可视化分析,以及该过程引入的、自动化相关的要素。
IPC能及时得到满足分析需求的专利数据和信息。通常来说,公开专利申请数量较多的IPC,申请人在该技术分支中创新相对较为活跃。可进一步揭示不同类型技术领域比较优势持续时间特征的差异。具体而言,本文借鉴已有研究从以下 4个方面对 IPC大类进行分组分析。通过统计发现医学AI领域的专利技术主要分布在G16H(包含专门用于处置或处理医疗或健康数据的信息和通信技术)、G06F(电数字数据处理)、A61B(诊断;外科)等小类。其中医疗专业性相关的专利数最多。
表2 人工智能技术在医疗健康领域专利申请IPC3级分类
在信息处理方面,G16H、G06F、G06N、G06K这与算法与数据作为AI基础有直接关系。目前通用算法和开放数据集训练构成AI医疗健康产品核心竞争力。通过实现数据精雕、满足泛化医疗健康应用需求和有针对性优化算法的专利申请,为增强算法的鲁棒性、安全性、易用性,获取高质量数据并对数据标注进一步优化,增强对不同医疗属性的数据良好适应性,以及在算法和技术层面针对小样本、多模态、分布式样本进行优化。
在医疗诊断及其图像和语音处理方面,A61B、G06T、G10L的大量专利申请,与AI极大提升医学用于疾病筛查和临床诊断的能力有关。AI算法可接入医院信息系统或医疗设备,表现为筛查系统、分析软件、检测诊断平台等,也可将算法软件集成到专业设备中,直接生成分析报告,例如辅助诊疗一体化解决方案。尤其是医学影像已成为重要的临床诊断方法,AI可大批量、快速处理图像数据,提供疾病筛查和辅助诊断功能,有效解决临床医生读片速度、时间长、工作量大,减少误诊、漏诊率等问题。基于语音识别的AI技术医疗产品,实现深入发展医疗场景语言沟通模型的理论和应用,满足无人在线语音沟通智能化、精准化提供技术支撑,达到适用于自然语言沟通的语音问答,满足患者医疗知识需求,缓解医疗资源紧张。
围绕医疗健康生态体系,医疗体制改革越来越重视以人为本的全生命周期精准医疗。G06Q作为适用于行政、商业、金融、管理、监督或预测目的专利应用,可以实现利用AI技术满足医疗机构资源智能化管理,能对多源数据进行联合处理,不仅为医疗健康服务质量管理提供核心算法与技术,还可进行适用于医疗资源利用效率最大化并行信息处理,达到符合医疗健康行业结构特征和运营特征的绩效评价和资源配置方法,满足对资源配置与调度智能管理,推动医疗体系各方的变革和提升。
在医疗健康药物及材料方面的专利集中于A61K、G01N的申请。专利分类中定义为医用的配制品、借助于测定材料的化学或物理性质来测试或分析材料。当前,尽管医疗行业通过人工智能技术驱动服务提质增效的需求迫切。然而,AI应用能够带来缩短研发周期、降低研发成本、提高研发成功率、加速临床进程、提质增效、迈向精准医学等多方面价值。尤其在药物研发阶段,成熟的AI技术协助,找到与原研药相似的化学结构并优化设计,实现近似或更好的诊疗效果,则能够在加速国内药品上市的同时,帮助药企控制研发成本。
3.3.2 IPC4级分类技术分布趋势分析
图5中每个数据点代表已公开的专利申请IPC4级分类情况。可以了解AI技术在医疗健康领域专利申请中的具体应用情况。反映国内和国外在医疗健康领域技术能力的累积程度,也可剖析国内外在哪些技术领域从事创新活动的积极性。
图6 人工智能技术在医疗健康领域专利申请IPC4级分类专利数
根据IPC4级分类数值趋势来看,从图6可知“用于诊断目的的测量;人的辨识”“专门适用于医疗诊断,医学模拟或医疗数据挖掘的ICT;专门适用于检测、监测或建模流行病或传染病”“专门适用于特定应用的数字计算或数据处理的设备或方法”这3个IPC四级分类号在专利中的数量最多,数量分别为:754项、679项、652项,可见AI在医疗信息的获取、处理上应用广泛,医疗信息化是医疗AI融合创新的重点领域,而数据是医疗AI发展的基础。对于病历结构化、实现虚拟助理和辅助诊断、挖掘文献和临床等证据中药物与疾病的关系等应用至关重要。当前,国内绝大部分医院的病历以自然语言记录,这些非结构化的病历无法直接被机器使用,需要通过AI技术转换为结构化信息,以便机器进一步挖掘利用。
在引入技术领域的时间特征,从时间维度上拓展深化技术比较优势的动态研究,进一步分析技术发展趋势,该趋势用来反映某个技术领域的技术机会空间。
图7 人工智能技术在医疗健康领域专利IPC4级分类-申请时间二维分析
从年度申请趋势上来看,第1位的“用于诊断目的的测量;人的辨识”申请数量最多且应用较早,近5年增长最快;第3位的“专门适用于特定应用的数字计算或数据处理的设备或方法”早期发展略有波动,2016年之前一直是申请数量最多的,而2016年后发展较差,证明在该技术分支中创新活力相对下降;而第4位的“用于阅读或识别印刷或书写字符或者用于识别图形”持续时间相对较久,且申请量始终保持前列,创新保持相对较为活跃;相比较“图像分析”和“语音识别”技术平稳发展,始终保持专利申请且态势起伏较小,说明在语音和图像数据处理技术方面的研究持续时间长,是AI技术在医疗健康领域应用中重要的一部分。
值得注意的是第2位的“专门适用于医疗诊断,医学模拟或医疗数据挖掘的ICT;专门适用于检测、监测或建模流行病或传染病”、第7位的“专门用于加工或处理患者相关医疗或保健数据的ICT”、第10位的“专门用于处理或加工医学图像的ICT”、第17位的“特别适用于治疗或健康改善计划的ICT”及第20位的“专门适用于促进医师或患者之间的沟通的ICT”从2008年陆续开始出现,且近三年来增长最快,目前国内外技术累积及竞争程度还处于中等水平,目前大部分医院仍处于数字化的初级阶段,AI应用于医院管理的条件尚未完全成熟。AI技术的应用需要大量、标准、结构化的数据集,目前医院在信息化发展、院内数据互联互通、数据质量等方面尚不能满足AI应用的条件,而且大部分医院未形成一致性的临床规范和标准,也为智慧医院管理增加难度。未来,医院应持续推进数字化进程,在整体业务和数字化发展策略的基础上,规划医疗AI发展举措,建立一致性的、互联互通的数据基础,实施标准化的管理原则,在高度数字化的基础上,将AI等先进技术应用于医院管理中,从而提升医院管理质量和效率。
4 结论
本文采用国内外申请的发明专利数据,从整体和分领域层面系统分析了AI技术在医疗健康领域的应用发展态势。可以看出AI与医疗的结合,满足了医疗行业的价值链多方面需求点,使精准化智能服务更加丰富多样,在各个环节演化出丰富的应用场景[22]。
(1)在专利申请整体概况可知,目前,AI技术在医学领域应用处于快速成长期,还有非常广阔的发展空间,我国目前也处于快速发展期,国家或企业应该加强该专利领域的研发投入[23-24]。虽然在国家分析中,主要申请人国家集中产生于中国和美国,其他国家专利数量相对较少,但在优先权趋势上,近5年诸多国家竞争意识加强,如澳大利亚的优先权远高于申请数量,开始布局AI技术在医疗健康领域的专利申请,保护核心竞争力。尤其是在全球主要专利申请人分析中,中国公司/高校数量相较于医学科技发达地区的公司,专利数量较少,国际化程度相对不高。虽然国内在稳步提升自主创新能力,涌现出了平安、高校等拥有全球竞争力的企业和科研机构,但该领域由于初始劣势和早期积累不足,仍然受到跨国公司的严重掣肘。因此,我国未来应该以AI技术在智慧医疗产业发展为契机,拓展实施国家重大科技项目,通过资金支持加强高校和科研院所在该领域的基础研发和应用拓展,同时通过政策引导促进产学研合作,培养具有竞争力的跨领域专业人才,为我国“人工智能+”战略的充分实施提供人才支撑。
(2)从专利IPC分类和技术点二维分析可以看出,用于处置或处理医疗或健康数据的信息和通信技术是专利申请的热点;电数字数据处理、数据识别、数据表示等是专利申请中关注度较高的基础技术。此外,医学AI领域还比较关注医疗信息相关设备、通信工程及材料装置等,更多服务于医疗信息采集。长期积累的海量历史数据如何发挥其作用、非结构化数据如何转化为结构化数据、数据如何标准化、如何实现以人为本的数据全生命周期记录、如何打通不同医疗参与方的数据,都是AI与医疗健康参与方需要长期关注并解决的问题。只有持续拥有高质量的数据,医疗AI才拥有真正发挥作用的基础。
综上所述,目前以医学、AI学科为支撑,借助于大数据、云平台、移动互联、物联网等行业发展[25-26],专利技术已经不仅仅是医学与AI的技术融合,已经渗透到了其他领域,很有可能促进突破性创新的发展事态。然而,面临外国大企业激烈的市场垄断竞争,我国必须努力在目前处于早期、累积技术能力相对较低以及新兴高技术领域迎头赶上,避免被锁定在不利的国际技术分工格局之中。如根据不同医疗健康模式行业特征,适时调整AI的支持重点和方向,加强对目前处于比较劣势或者比较优势如中医药的新兴技术领域的产业布局。中国作为科研新兴国家,需要拓展相关多学科交叉融合,多学科协调发展,通过优势互补、合作创新,深入联合开展基础与应用研究[27],对接信息化促进医疗健康事业发展的国家重大战略,从而提高医疗健康质量和效率的水平。
需要注意的是,随着研究的不断深入,领域出现越来越多相关的研究点,可以形成庞大的关键词网络,后续相关进一步医学AI领域的专利技术分析可以结合分析与IPC高相关的词云,从而提高领域前沿识别的准确度[28],准确把握医学研究前沿与AI开发前沿技术结合发展方向,不断探索提高实践技术成果转化,引领医学学术发展和产业升级。