APP下载

基于多特征决策树的专利智能画像模型研究

2019-09-10刘朝章赵海兵李晓博李勇李笋

计算机与网络 2019年24期
关键词:决策树画像专利

刘朝章 赵海兵 李晓博 李勇 李笋

摘要:随着知识产权在科技浪潮中的地位逐步提升,专利作为技术成果转化的重要标志,各类企业对专利保护及管理工作摆放在同规划同等级别工作上。电网企业作为能源界的龙头老大,在专利布局工作等方面应体现出中国科技水平的优势,基于大数据对数据智能存储、获取、挖掘和分析等特点,以自动化方式评估专利价值,快速、定量地给企业、权利人和投资机构提供参考。选择模糊决策树算法来刻画科技创新和专利技术的特征和规律,对每个专利打上多维度标签,建立专利画像,同时对每个企业进行技术需求画像,进而增强专利的转化能力。本研究专利管理办法有效平衡了专利转化整个生命周期对企业的影响,指导了电网企业专利管理工作。

关键词:专利;决策树;画像;模型

中图分类号:TP391.4文献标志码:A文章编号:1008-1739(2019)24-64-4

0引言

专利是知识产权的主要表达形式,在当今知识经济、科技引领的时代下,已成为企业发展和竞争的制高点。专利质量体系与企业的运营发展息息相关,企业传统的产品市场占有量发展模式逐步采用创新竞争模式。对于企业而言,专利是保护自身产品、防御对他人侵权的重要武器;是企业技术创新能力的证明;是企业规划开辟多源收入的重要手段。可见对专利的深度分析,形成企业有效的专利布局体系,对企业在行业中的长足发展起到推波助澜作用。

国家电网公司作为能源企业的领头羊,科技创新性不仅代表着公司的先进性,也是其立足国际竞争之位的盾牌。通过提升专利部署格局体现公司保护创新的价值,顺畅开拓和主导市场,提升在行业内外的竞争力和影响力。因此国网公司一直把专利布局工作摆在至高位置,根据自身的发展愿景和目标有目的地制定专利布局规划,作为企业规划战略的起点,根据专利布局规划对发明创造进行专利挖掘,深入并贯穿整个企业发展实施过程,通过专利战来体现对企业战略的实施成果及效果,保障企业在行业科技变幻的状态中一直保持新鲜血液[1]。

1国网专利形式及内容统筹分析

2013年,国家颁布了有关知识产权标准《企业知识产权管理规范》《国家专利运营试点企业指引》,企业应根据自身经营管理需要建立专利分级管理体系,可见国家对专利知识产权工作的重视。国网公司认真贯彻国家知识产权战略纲要,深化专利分析布局,加强专利创造和保护,促进专利运营。2018年出台了《国家电网公司知识产权法律保护管理办法(试行)》,以通用制度的形式明确了知识产权法律保護工作的职责分工、保护内容、纠纷应对和评价考核等事项,实现了公司系统各级单位知识产权法律保护工作的有“法”可依,为依法合规处置纠纷、强化保护提供了制度保障,形成知识产权管理体系,有序指导公司各级单位切实做好知识产权法律保护实务工作,推动创新力与法治力双轮驱动[2]。

国网公司将专利工作作为每年应完成的硬性科技指标,下属各单位根据业务规模确定专利数量和内容。近年来,公司已积累了一定量的专利,从国家知识产权局数据库中对公司已经公开的专利申请进行检索,统计目前的专利数共有7万余件,其中发明专利超过1.6万余件,实用新型专利3万余件,外观设计专利2万余件,已授权专利2万余件,未授权专利4万余件。从数据上分析明显发现公司有效专利构成结构不均衡,科技含量及创造水平较高的发明专利占比相对较低,仅为32.6%,发明专利数明显低于实用新型专利数,而调研国外在华有效专利多年均为发明专利为主,占到国外有效专利总量的79.9%。存在此现象的主要原因是,在专利布局起始阶段,公司偏重单方面寻求专利数量的堆积,使专利规模上产生量的变化,忽略了对专利质量的监控和管理,导致出现了大批专利不符合公司产业发展需求,或者内容描述不当等错误,使得专利通过率较低。以上问题是专利发展策略的必经之路,在经过量变的冲击后,应提升到质的转变。公司及下属各单位都逐步意识到这个问题,从上至下制定适合各自的专利质量评价体系,保持专利形式及内容与企业产业发展的一致性。

为了分析国网系统专利内容与质量申报现状,选择国网信通产业集团近期专利申报数据来统筹分析。根据集团所发布的产品线目录,本节从智能芯片、硬件设备和软件产品三大领域进行专利分布的统计和分析。统计2016年以前集团各公司的专利申请总量(包括专利授权和专利受理)共计1 451条记录,其中智能芯片116件,硬件设备631件,软件产品657件。统计芯片产品相关专利申请数量116项,其中安全芯片79件,传感芯片104件,通信芯片19件;硬件产品相关专利申请数量为631项,其中涉及数据采集终端133件,智能交互终端360件,网络通信设备120件,信息安全设备仅19件;软件类产品线相关专利申请记录经过统计共计657条,其中平台软件46件,支撑软件361件,地理信息软件99件,经营管理软件105件,生产管理软件33件,网络与信息安全软件仅为13件;从统计数据分析可看出,集团下属7个公司基本按照各自主营业务开展专利申请,但也存在部分业务重叠,造成恶性竞争,集团应严格划分子公司业务制定专利格局。

2专利质量评价方法分析

从国网申请和授权专利的调研数据可粗略分析出,专利数量已达到了一个基本积累量,与国际专利数保持较小的差距;在内容及质量评价方面,专利虽大致符合企业自身发展方向,并围绕核心产品向多方向延伸科技点,但核心专利总体质量较差,无法达到持续保护企业知识产权的效果;边缘性延伸专利质量参差不齐,内容相对独立,缺乏联络性,无法形成专利点位知识体系。针对这2个问题,需要制定高水平的专利组合质量评价系统,通过对专利知识体系进行整体规划、监督、评价及布局优化,凸显专利的成果化效用,防止为冲击数量而申请专利的盲目举措,提升专利产业在企业整体规划中的地位。

目前专利质量分析系统类型五花八门,从传统指标人工分类发展到智能数据分析法,核心思想都是通过定位企业核心技术及产品方向,然后确定评价参数、判断流程和指标,将专利作为系统输入,来衡量专利内容方向及质量是否符合企业产业发展要求。根据专利源数据特征将组合评价方法分为3类[3-4],如图1所示。

小型企业专利量较小,一般选择小批量数据分类方法,这类企业专利内容相对较集中,因此选择较简单的分类算法就能获得较好的评价效果,例如KNN算法(通过数据概率值大小来判断数据类型)、随机森林算法(按照權重排序大小分类)和文本分类(内容过滤方法)等;对于国网总部大型企业而言,需评价的专利数据量大,专利类型和涉及内容多且复杂,简单的分类算法无法囊括所有专利,因此一般选择可承受多数据源的分类算法,如神经网络、机器学习这种较高级的分类学习算法,但这种算法维护成本较大;针对电网下属各企业而言,专利类型较多且数量适中,在选择评价算法时一般注重算法过程不过于复杂但分析效果较好的算法,如贝叶斯算法、层次分析法和决策树算法等。国网内部企业选择第3类评价方法较多,因此本文针对第3类算法中的某一种算法进行优化升级,提出一种模糊决策树算法的评价方法,并剖析算法在专利评价过程中的优越性[5]。

依然选择信产集团的专利数据作为源数据进行分析,建立评价系统。首先可采用文献资料法,对集团专利工作相关研究文献进行收集、整理、归纳和分析,通过文献资料的分析,梳理公司专利工作研究的基本脉络和主要成果,确立研究的方向、研究的重点和预期的目标等,收集统计专利数据,利用定量分析法对公司专利数据进行量化分析。集团主营方向有硬件、软件和芯片,找出3类方向背后蕴藏的深层次信息,硬件包括技术外观、技术性能、技术功能和专利质量等方面推断专利综合评价指数;软件包括技术集成性、软件响应度、软件使用便捷性、软件功能度、专利质量等方面来综合评价指数;芯片包括芯片工艺、芯片性能、芯片设计能力和芯片控制功能等方面来综合评价指数。利用定性模糊决策分析法对提取的特征指数进行智能学习训练,获取某个专利的多指数评价结果,从结果分析产生问题的原因,提出相应的对策建议[6-7]。模糊决策树算法的评价模型如图2所示。

按照输入总专利数1 451条记录,其中智能芯片116件,硬件设备631件,软件产品657件,最终获取芯片综合评价分数0.78,硬件专利综合评价分数0.62,软件专利综合评价分数0.67,可见软件及硬件产业转化实力还需进一步提升。

3基于大数据的专利智能画像模型建立

上面研究了专利综合评价方法,可对每个专利所属技术范围及编译质量做一个较全面的审核及评分,但评价系统对于企业而言意义改进范围狭窄,仅能根据评价结果将得分较低的专利进行提升或者删除,而统筹规划下一步该如何制定专利范围、内容等。作为一个企业,发展一定不是从单个技术点来衡量其经济效益,而是采取多点并进的方式,而专利评价往往最终会着点于某个专利评价结果的好坏,违背专利同企业共同发展的规划思路。因此专利评价系统一定要从多个层面统筹考量,紧密同企业发展需求相结合,将专利技术保护点进行组合排列,制定各技术线条的发展规模和强度,形成多维度专利画像模型,同企业规划相契合,才能更好地支撑企业发展。

所谓专利组合优化是通过分析技术竞争力,比较技术领域中竞争对手公司的专利地位和技术优势,制定专利战略,清晰地分析公司所处的位置和竞争者的竞争地位,据此制定相应的研发策略和营销策略,企业兼并、收购、许可和授权,确定与评估外部技术发展趋势,有利于资源的优化合理配置,人力资源管理,识别潜在科研合作者等。企业专利画像模型如图3所示。

企业未来发展决不仅满足于眼前的优势和利益,必须长远考虑在行业内外如何一直保持竞争优势。一个或几个孤立产品的短期利润绝对不是长久的盈利方式,必须逐步形成企业技术核心圈或系统,才能更好地维护企业知识产权。应充分利用专利评价系统,把对单个的专利评价按照企业发展规律形成核心专利组合评价体系,企业可以根据自身需求随意选择多组合系统,凸显专利组合优势。例如技术层面的专利组合主要由技术相对定位(相对专利位置)、技术吸引力(专利相对成长率或相对潜力)以及研发重点(专利集中度)等构成。在基于技术层面的专利组合分析模型中,横坐标为相对专利位置,由企业在某技术领域的专利效能与该技术领域内最高的专利效能之比测定,主要评估企业的相对技术定位;纵坐标为技术吸引力,用企业在该技术领域的专利申请量增长率来测定。相对专利增长率高的技术领域在未来会比相对增长率低的技术领域更具吸引力,研发重点表示某一技术领域在企业总的研发组合中的技术重要性,在图中用圆圈的大小表示,其值为企业在某一技术领域的专利申请量占企业专利总量的比例,从而清楚地了解到企业的技术组合情况。管理层面专利组合一般考虑企业经营管理、人员管理、人才管理和流程管理等多个管理的组合,辅助指导公司管理部门形成企业智能管理人事平台。专利组合评价一方面将企业需求多维度进行了深度刻画,并统筹规划了发展模型,形成了核心的产品圈、专利圈、产业圈,限制竞争对手优势,还能辅助企业在基于专利技术的参考下,建立更好的企业技术及管理体系,实现目标用户和偏好专利的自动化匹配,增强专利转化能力,体现企业专利画像的布局优势。

4结束语

随着知识产权在科技浪潮中的地位逐步提升,专利受理量和授权量是衡量专利水平的重要指标,企业一般在成立之初迅速布局了大量专利,但专利申请数量激增的背后,专利作为技术成果转化的重要标志,专利质量如何需要认真进行分析和对待,各类企业对专利保护及管理工作摆放在同规划同等级别工作上。电网企业作为能源界的龙头老大,在专利布局工作等方面应体现出中国科技水平优势,基于大数据对数据智能存储、获取、挖掘和分析等特点,以自动化的方式评估专利价值,快速、定量地给企业、权利人和投资机构提供参考。本文提出了一种模糊决策树算法来刻画科技创新和专利技术的特征和规律,对每个专利打上多维度标签,建立专利画像,同时对每个企业进行技术需求画像,进而增强专利的转化能力。本研究专利管理办法有效平衡了专利转化整个生命周期对企业的影响,指导了电网企业专利管理工作。

参考文献

[1]吴汉东.中国知识产权制度评价与立法建议[M].北京:知识产权出版社,2008.

[2]张应强.高等教育现代化的反思与建构[M].哈尔滨:黑龙江教育出版社,2000.

[3] Bhaven N. Sampat.大学在美国技术创新中的角色与《拜杜法》的实际效果[M].北京:科学出版社,2006.

[4]唐纳德·肯尼迪.学术责任[M].北京:新华出版社,2002.

[5]熊彼特.经济发展理论[M].北京:商务印书馆,1990.

[6]张竹筠,余雅风.高校知识产权保护与管理的法律分析[J].科技管理研究,2001(1):51-54.

[7]郭秋梅,谭晓宁,叶青峰.高校科技管理创新中的知识产权战略探析[J].研究与发展管理,2004(2):106-109.

[8]刘慧,贺颖.知识产权保护与高校科技创新[J].情报理论与实践,2004(5):518-520.

猜你喜欢

决策树画像专利
简述一种基于C4.5的随机决策树集成分类算法设计
画像
决策树学习的剪枝方法
画像
莫尼卡的画像
画像背后藏着活人
决策树在施工项目管理中的应用
2007年上半年专利授权状况统计