基于企业画像的高校专利个性化推荐*
2022-09-20宋凯冉从敬
宋凯,冉从敬
0 引言
知识经济时代,具备技术、经济、法律属性的专利在区域产业和企业发展中发挥着关键作用。面对全球经济增长乏力、“一带一路”建设深化、国内动能转换阵痛期,企业存在提升产品质量、增强产品竞争力、推进产品“走出去”的现实需求,因此,依靠并大力发展知识产权才能赢得新一轮生产力布局调整的主动权。高校集聚大批具有重要技术价值的专利资源和雄厚的人才资源,能够为国家科技发展和企业技术创新提供重要支持。但依据《2020年中国专利调查报告》,高校专利产业化率为3.8%、许可率为4.4%、转让率为3.6%[1],表明高校专利应用比例偏低,造成了大量科技浪费与闲置。《中华人民共和国国民经济和社会发展第十四个五年规划和二O三五年远景目标纲要》提出要改革国有知识产权归属和权益分配机制,扩大科研机构和高等院校知识产权处置自主权。《“十四五”国家知识产权保护和运用规划》,提出要支持高校和科研院所加强市场化知识产权运营机构建设,提升知识产权转化能力。拓宽专利技术供给渠道,推进专利技术供需对接,促进专利技术转化实施。一系列政策颁布表明高校专利转移转化是国家持续关注的领域。政策实施旨在促进专利创造运用,提升高校专利转移转化效率,以实现技术价值转化为产业价值,推动实现创新驱动发展战略。
目前存在多个高校专利运营平台,如国家知识产权运营公共服务平台、科易网、汇桔网等均提供高校专利对外展示窗口,为企业选择高校专利开展技术交易提供系统支持。然而,随着高校专利授权数量的快速增长,信息过载问题也随之而来。信息量的不断增加让情报机构遭受信息超载的困境[2]。在使用已有高校专利运营平台过程中,面对海量高校专利,企业需要花费大量时间成本和人力成本进行专利筛选,在确定符合技术需求的专利过程中面临较大困境,较难快速高效地锁定相关高校专利。因此,如何构建提升企业专利查找效率的推荐机制尤为必要。
已有高校专利运营平台聚焦于业务功能和服务模式等问题,缺乏个性化推荐机制,导致企业不能快速定位符合需求的专利,高校专利仍束之高阁。20世纪90年代以来,推荐系统受到广泛关注,在学术资源推荐[3]、图书馆个性化服务[4]、用户个性化教育[5]、虚拟社区知识推荐[6]等场景中进行探索应用,极大提升了用户服务满意度。此外,学者也将推荐方法应用到专利技术交易和合作研发中,通过结合推荐主体特征,设计应用场景,实现对技术需求者的专利推荐和合作推荐。Trappey等[7]提出融合机器学习和自然语言处理的专利推荐模型;Du等[8]设计基于语义增强的高质量专利推荐系统;Chung等[9]提出基于社会网络分析和文本挖掘的合作伙伴识别方法;Kang等[10]构建基于主题模型的合作团队选择方法;张金柱等[11]设计基于表示学习的无监督跨语言专利推荐方法;何喜军等[12]构建基于异构信息网络嵌入的专利技术主体间交易推荐模型;翟东升等[13]提出基于TRIZ理论的企业潜在研发伙伴的推荐方法;陈浩等[14]提出融合主题模型与决策数的跨地区专利合作关系发现与推荐方法。
综上,个性化推荐目前已广泛应用于多个平台场景,通过基于内容或基于协同过滤的传统推荐方法为用户提供个性化服务,缓解了信息过载问题。同时,个性化推荐在专利技术交易和合作研发中的应用也为本文研究提供了理论和实践参考。从企业视角出发,将高校专利精准推送给企业,对建立产学研深度融合的技术创新体系,实现高校优质专利在经济社会中的高效配置具有重要意义。已有高校专利运营平台均缺乏必要的个性化推荐机制,导致企业不能快速定位符合需求的专利,陷入信息超载困境;而相关专利推荐研究较少综合考虑企业画像和专利技术影响力,导致推荐结果的匹配度有待进一步提升。因此,本文从技术研发属性和竞争对手属性两个维度描述企业画像,并结合基于内容推荐和基于协同过滤推荐的思想,制定高校专利个性化推荐策略,为企业选择高校专利开展技术交易提供决策支持。
1 基于企业画像的高校专利个性化推荐模型构建
基于企业画像的高校专利个性化推荐模型见图1,推荐模型主要涵盖五个流程:数据检索与预处理、技术主题提取与专利聚类、基于目标企业技术研发属性的专利推荐、基于目标企业竞争对手属性的专利推荐、基于企业画像的高校专利个性化推荐列表。
图1 基于企业画像的高校专利个性化推荐模型图
流程一:数据检索与预处理
从企业视角出发,选取目标企业,基于目标企业重点关注的技术研究方向,确定技术领域;然后以技术领域作为关键词在数据库中进行检索,获取技术领域下包含目标企业的企业专利数据和高校专利数据;进一步对专利数据进行清洗,获取专利标题和专利摘要,借助学术论文和专利技术功效词形成技术领域专业词典,应用R语言的jiebaR包进行专利文本自然语言处理,最后获得实验语料集。
流程二:技术主题提取与专利聚类
应用R语言中的lda包对实验语料集进行主题抽取,借助LDAvis模型确定最优主题数目;通过设置主题数目,调整α和β两个隐含参数,形成最优主题模型,分别得到每个技术主题下的相关技术语义词和“专利-主题”概率矩阵,用于对技术主题名称进行总结,并结合K-means算法进行专利聚类[15]。
流程三:基于目标企业技术研发属性的专利推荐
企业受市场竞争、研发战略、人力资源等影响,不能在一个技术领域的各个技术主题中同时发力,决定了在一个技术领域中企业会存在技术研发重点主题和技术研发薄弱主题,可从技术研发属性维度描述企业画像。依据专利文本聚类结果,统计目标企业的专利布局情况,根据目标企业的专利授权数量及申请人排名,通过阈值设定,确定企业的技术研发重点主题,从而结合基于内容推荐的思想为企业进行高校专利推荐。基于目标企业技术研发属性的专利推荐过程如下。
(1)对目标企业技术研发重点主题下的专利进行汇总,形成目标企业专利集合Etarget={PE1:(S1,S2,…,Sn),PE2:(S1,S2,…,Sn),…,PEm:(S1,S2,…,Sn)},其 中P表示特定技术主题下目标企业的专利,S表示应用LDA模型获取的目标企业专利主题支持度,n表示主题数量,支持度范围在0→1之间,越接近于1表明目标企业专利与相应技术主题越相关。
(2)汇总此技术主题下的高校专利,形成高校专利集合Uall={PU1:(S1,S2,…,Sn),PU2:(S1,S2,…,Sn),…,PUw:(S1,S2,…,Sn)}。
(3)在向企业推荐高校专利过程中,除要求推荐的精准性,还要保证推荐质量。在探析企业自身技术研发属性外,还需要考虑高校专利技术影响力,将具备高影响力的专利推荐给企业。专利被引证次数能够反映专利技术重要程度,被引证次数越多,越能够体现对该方向上的其他专利技术创新产生重要的导向作用。但仅依赖被引证次数进行专利技术影响力评价存在两个不足:一是没有考虑专利主题因素,在学术文献评价中,已有研究指出文献影响力与学科领域、研究主题密切相关,将主题因素纳入文献影响力评价是合理且必要的[16]。此外,专利被引证次数具有时滞性,因此,对不同阶段授权的专利,在应用被引证次数进行影响力评价时需要考虑时间因素。例如,2015年授权的一件发明专利被引证次数为10次,而2019年授权一件发明专利被引证次数也为10次,如果按照被引证次数评价两件专利的技术创新性及影响力,则不分伯仲,但2015年专利历经5年被引证次数才达到10次,而2019年授权专利仅1年就达到同样量级,证明其创新性更高,时效性更强,技术研究更前沿。综合以上分析,在进行专利技术影响力评价过程中,需要综合考虑企业技术研发重点主题因素及专利授权时间因素,具体计算过程如下。
①对任意一件高校专利PUi,确定PUi的被引证次数,记为UCi,将专利被引次数与授权时间融合,计算融合时间因子后的被引证次数WC,计算公式为:
其中,t为数值常量,以专利授权时间为2012-2020年为例,2020年授权专利的t值为1,而2012年授权专利的t值为9,通过这种方式,凸显授权时间较晚,被引证次数较高的专利重要性。为避免被引证次数为0的情况,将分子和分母分别做加1处理[17]。
②对任意一个技术研发重点主题Ti,确定Ti对PUi的支持度,记为PUSi,将融合时间因素后的专利被引证次数与技术主题支持度融合,作为高校专利的技术影响力指数(Patent Technology Influence Index,PTII),计算公式为:
(4)计算得到高校专利Pi与技术研发重点主题下目标企业所有专利的平均Cosine相似度Sim_Pi[18],并进一步与技术影响力指数融合,形成高校专利匹配度(Patent Matching Degree,PMD),其中W1和W2为指标权重,分别取值0.5。根据技术研发重点主题下每件高校专利匹配度进行排名,形成基于企业技术研发属性的高校专利推荐列表。
流程四:基于目标企业竞争对手属性的专利推荐
竞争对手属性是描述企业在技术领域的最大技术竞争者,特别针对的是企业的技术研发薄弱主题。在此类主题中,结合基于协同过滤的推荐思想为企业进行高校专利推荐。因此,在分析目标企业技术研发属性的基础上,探寻出目标企业的技术研发薄弱主题,并发掘目标企业竞争对手,以实现专利推荐。基于目标企业竞争对手属性的专利推荐过程如下。
(1)针对目标企业的技术研发薄弱主题,对其他企业申请人进行专利数量统计和排序,排名第一的企业申请人视为目标企业的最大技术竞争者。
(2)对技术研发薄弱主题下的技术竞争者专利数量进行统计,形成技术竞争企业专利集合Ecompetitors={Ec1:(P1,P2,…,Pa),Ec2:(P1,P2,…,Pb),…,Ecn:(P1,P2,…,Pz)}。
(3)参考流程三中(3)的计算过程,计算目标企业技术研发薄弱主题下每件高校专利的技术影响力。
(4)计算目标企业技术研发薄弱主题下,每件高校专利与目标企业技术竞争者专利的平均Cosine相似度,并结合高校专利技术影响力,计算高校专利匹配度-PMD。
(5)依据专利匹配度对目标企业技术研发薄弱主题下的高校专利进行排名,形成基于目标企业竞争对手属性的专利推荐列表。
流程五:基于企业画像的高校专利个性化推荐列表
从技术研发属性和竞争对手属性两个维度描述企业画像,结合基于内容推荐和基于协同过滤推荐思想制定推荐策略,并依托专利匹配度指标进行高校专利排名,通过对以上两种不同推荐策略得到的推荐结果进行结合,形成高校专利个性化推荐列表。基于技术研发属性的高校专利推荐,聚焦企业技术研发重点主题,通过转让高校专利,实现“强上加强”,围绕城墙式布局、地毯式布局等构建专利保护网,形成对企业占据竞争优势的专利组合。基于竞争对手属性的高校专利推荐,聚焦企业技术研发薄弱主题,通过借助高校技术力量,一方面可以快速提升在薄弱主题的技术实力,节约研发成本,实现弯道超车;另一方面为在薄弱主题开展专利布局积累基础,防止被竞争对手遏制,提起专利诉讼。
2 结果分析
2.1 数据来源与实证设计
本文数据来源于IncoPat专利数据库,选择分析的技术领域为“云计算”。在数据检索过程中,专利来源选择为中国发明授权专利和实用新型专利,检索式设置为标题/摘要=(“云计算”or“云平台”or“云存储”or“云数据中心”or“数据云”or“医疗云”or“云计算中心”or“云计算系统”or“大数据云”or“云计算技术”),时间截至2020年12月31日,共检索到9,975件专利。对校企合作专利数据进行剔除,仅保留由高校或企业独立申请的专利,剩余专利数据7,650件,其中高校数据1,520条、企业数据6,130条。
数据收集完成后,需要选择一个目标企业设计实证场景,遵循财政部、国家知识产权局联合印发《关于实施专利转化专项计划助力中小企业创新发展的通知》的政策精神,本文重点考虑选择“云计算”领域的中小企业进行研究。综合考量企业的专利授权数量、成立时间、行业专注程度等,选择“A公司”作为目标企业,该企业成立于2010年,是专业云计算解决方案供应商,专注于云计算、虚拟化、云存储、云平台、应用虚拟化等领域的方案解决与服务提供,在云计算领域授权专利23件。因此,将应用高校专利个性化推荐模型,根据“A公司”在“云计算”领域的企业画像,进行高校专利个性化推荐,解决“找专利”问题。
2.2 “云计算”领域专利布局统计
根据技术主题提取流程,当主题数目设置为12个,α=0.01,β=0.02时,基于LDAvis模型呈现的主题可视化结果,各主题之间交叉度较小,主题之间相对独立,表明主题数目最优。依据最优模型的输出结果,应用“专利-主题”概率矩阵进行专利聚类,结合技术主题下的相关词对主题进行总结凝练。依据计算结果,统计“A公司”在“云计算”领域各个技术主题下的专利布局情况,见表1。“A公司”在“云计算”领域中3个技术主题的专利授权数量超过5件,在企业申请人排名中,这3个主题也进入前5名。因此,“A公司”技术研发重点主题和技术研发薄弱主题的阈值设置以“双五”为阈值进行划分,即专利授权数量超过5件且排名前5的技术主题。通过阈值设置,判断出“A公司”在云计算领域有3个技术研发重点主题,分别为:“主题3→云服务器”“主题10→云计算机”“主题11→射频识别”,其余9个主题视为“A公司”的技术研发薄弱主题。通过上述分析,实现对企业画像中技术研发属性的描述。
表1 “A公司”技术主题专利布局统计表
2.3 “云计算”领域最大技术竞争企业统计
对“A公司”技术研发薄弱主题下的企业申请人专利进行统计,确定“A公司”在各个技术研发薄弱主题下的最大技术竞争企业,统计结果见表2。“A公司”在“主题1→虚拟化技术”“主题4→工业云计算”“主题5→云计算安全”“主题6→设备控制”“主题7→智能终端”“主题9→图像处理”中的最大技术竞争企业是“华*技术有限公司”;在“主题2→云传感器”“主题8→云管理”“主题12→大数据处理”中的最大技术竞争企业是“国*科技股份有限公司”。在本文所用实验数据集中,华*技术有限公司拥有独立授权专利115项,在所有企业申请人中排名首位。“华*云”是“华*技术有限公司”的云服务品牌,专注于云计算中公有云领域的技术研究与生态拓展,为企事业用户提供一站式云计算基础设施服务,已成为中国最大、全球领先的公有云服务与解决方案供应商之一。“国*科技股份有限公司”拥有独立授权专利85项,在所有企业申请人中排名第二位。“国*科技股份有限公司”在云计算领域拥有自主研发的安全可控G-CLOUD云操作系统,还拥有“职教云、政务云、应急云、遥感云、交通云”等成功案例和整体解决方案,是中国领先的云计算全面解决方案及服务供应商。通过以上分析,“华*技术有限公司”“国*科技股份有限公司”是“A公司”在云计算领域的最大技术竞争企业,“A公司”拥有独立授权专利23件,与“华*技术有限公司”“国*科技股份有限公司”存在较大差距,而在技术研发薄弱主题中,“主题4→工业云计算”“主题8→云管理”“主题9→图像处理”“主题12→大数据处理”中授权专利为零。因此,“A公司”在立足技术研发重点主题的基础上,需要针对技术研发薄弱主题开展技术探索及专利布局,以提升其在云计算领域的竞争实力,拓展业务范围,增加在云计算解决方案与应用服务的市场占有率。通过以上过程,实现了对企业画像中竞争对手属性的描述。
表2 “A公司”技术薄弱主题下最大技术竞争企业统计表
2.4 “云计算”领域高校专利个性化推荐
通过分析技术研发属性和竞争对手属性,能够描述A公司在云计算领域的企业画像,并依据制定的推荐策略进行高校专利个性化推荐。本文以主题3和主题6为例,进行高校专利个性化推荐结果的展示,见表3-4,每个主题展示4件专利,排名结果以专利匹配度为衡量指标。
分析表3发现,“主题3→云服务器”是A公司技术研发重点主题,因此,采用基于企业技术研发属性的专利推荐流程,结合基于内容推荐的思想,进行高校专利推荐。其中,专利匹配度排名第一的是湖南大学肖国庆等人的“一种可高效更新权限的多用户可搜索加密方法和系统”,授权时间为2020年,被引证次数为2次,该发明规避数据权属者与用户的并行交互,提升数据权属者的相关数据更新效率,但不会对用户查询产生影响,具有扩展应用空间。排名第二位的是黑龙江大学郭贤达的“用于客户信息管理的机器人”,授权时间为2018年,被引证次数为2次,通过将智能机器人管理系统与云计算实时平台进行连接,提高客户信息管理效率。排名第三位的是成都信息工程大学李斌勇等的“基于云平台的智慧交通大数据预测分析系统”,授权时间为2018年,被引证次数为2次,该发明依托云计算平台对多源交通数据进行预测处理,以提升汽车的通行效率。排名第四位的是鲁东大学曲海平等的“一种基于云计算的数据交换监控系统”,授权时间为2017年,被引证次数为2次,该发明能借助云计算后台服务器远程监控实时交换数据。
表3 基于企业技术研发属性的高校专利推荐汇总表
分析表4发现,“主题6→设备控制”是A公司的技术研发薄弱主题,最大技术竞争企业是“华*技术有限公司”,因此,采用基于企业竞争对手属性的推荐流程,结合基于协同过滤推荐的思想进行专利推荐。其中,专利匹配度排名第一的是陕西科技大学孟彦京等人的“一种基于电气PLC和远程云平台的复卷机控制系统”,授权时间是2018年,被引证次数为4次,本系统将采集到的复卷机数据传输至云平台,实现移动端对复卷机的实时监控,可降低人力成本,提高生产效率。排名第二位的是重庆交通大学林鹏飞等人的“一种支持多种支付方式的智能云存储柜系统”,授权时间是2014年,被引证次数为4次,该存储柜依托云平台,实现支持在线支付、验货录像等功能,可以保障相关方利益,提高派送效率。排名第三位的是北京工业大学沈琦等人的“一种基于Hadoop架构的移动终端云资源调度方法”,授权时间是2017年,被引证次数为2次,该方法提升了移动终端的本地化执行效率,在多并发和请求拥堵情况下,实现集群节点的复杂均衡。排名第四位的是湘潭大学曾以成等人的“基于FPGA和云平台的智能家居系统”,授权时间是2015年,被引证次数为3次,本系统整合了三重网络机制,能够实现对智能家居的高效控制,具有安全性高、适用范围强、智能化程度高等优势。
表4 基于企业竞争对手属性的高校专利推荐汇总表
3 模型评估
通过上述分析,针对A公司在云计算领域的企业画像,分别结合基于内容推荐和基于协同过滤推荐的思想,为A公司进行高校专利个性化推荐。财政部办公厅、国家知识产权局办公室发布的《关于实施专利转化专项计划 助力中小企业创新发展的通知》指出,校企技术交易率低的关键原因在于中小企业缺乏快捷高效寻求高校专利以及与专利权人、发明团队对接的渠道。因此,相对于企业“被动”搜索专利,本文所提专利“主动”推荐模型将切实提升企业获取高校专利的效率。此外,推荐过程中的重点内容,一是构建“A公司”的企业画像,从技术研发属性和竞争对手属性两个维度出发,为选择应用不同的推荐策略提供参考;二是推荐专利的优先级是采用“专利匹配度”这一指标进行排名,需要进一步对“专利匹配度”评价有效性进行评估,进而验证本文所推荐模型的科学性和合理性。因此,本文采用“主题6→设备控制”的专利推荐结果,从相关性、统计学特征、区分能力三个角度展开分析。
3.1 相关性分析
将“主题6→设备控制”中专利匹配度与专利影响力、专利相似度、被引证次数、时间因子进行Spearman相关性分析,结果见表5。由表5可知,在0.01水平(双侧)上,专利匹配度、专利影响力、专利相似度、被引证次数之间呈显著正相关,相关系数介于0.453~0.927,但专利匹配度与时间因子呈显著负相关。这种高度相关性与专利匹配度的设计原理有关,传统的基于内容或基于协同过滤的推荐,都仅考虑相似度的匹配,而本文提出的专利匹配度指标又进一步考虑了专利影响力因素,将两个指标进行了进一步的融合。所以,专利匹配度与专利相似度以及专利影响力的相关系数分别为0.696、0.927,表明专利匹配度指标是延续了传统推荐方法中重视相似度匹配的重要特征。而专利影响力是综合考虑了专利的被引证次数、企业技术研发主题因素及时间因子,其中专利被引证次数是评价专利技术创造性的通用指标,专利影响力公式的设计就决定了时间因子会将时间靠前的专利突显出来,而相关研究表明在影响力评价过程中融入主题因素能够让评价结果更加科学合理[19]。上述内容表明,专利匹配度综合考虑了专利相似性、专利被引证次数、专利技术主题、时间因子等因素,具有更全面的评价视角,用于专利推荐过程中,对专利进行评价是可行的,推荐结果是可接受的。
表5 相关性计算统计表
3.2 统计学特征分析
将“主题6→设备控制”中的专利匹配度绘制Q-Q图,见图2。Q-Q图是用来鉴别样本数据分布特征的一种统计图形技术,如果被检验的样本数据近似落在一条直线附近,则其理论分布为标准正态分布。分析图2发现,主题6中各件专利匹配度对应的数据点基本在一条直线附近,说明各件专利对应的专利匹配度服从正态分布,指标服从正态分布更符合人们的打分习惯。俞立平在分析期刊评价指标的内部差距时发现,目前多数期刊评价指标普遍是右偏的,不服从正态分布,指标数据右偏会导致期刊评价值偏低,影响期刊一般水平的判断,并建议最好选取数据偏倚情况相对较好的指标来评价期刊[20]。可见,服从正态分布的专利匹配度是进行高校专利推荐过程中较为理想的专利评价指标。
图2 样本数据正态分布的Q-Q图
3.3 区分能力分析
为判断专利匹配度、专利影响力、专利被引证次数、专利相似度几种指标的区分能力,计算它们评价结果的标准差(STDEVP,SD)。标准差反映一组数据的发散程度,标准差越大,则数据越发散。四种指标对应的标准差分别为:被引证次数(SD)=0.931、专利相似度(SD)=0.078、专利影响力(SD)=0.151、专利匹配度(SD)=0.097,专利匹配度的标准差仅比专利相似度高,表明其评价结果发散程度较小。进一步对主题6下不同指标的排名结果绘制折线图,见图3。其中横轴表示专利,纵轴表示专利排名情况。
图3 “主题6”四种评价指标的高校专利排名变化图
分析图3发现,专利匹配度对应的专利排名图示是一条直线,表明没有相同的评价结果,而专利影响力、专利被引证次数、专利相似度对应的专利排名图示是曲线,且具有较大的波动,出现不同专利具有相同评价结果的现象。以主题6中专利匹配度排名前两位的专利为例,专利6-1和专利6-2的被引证次数均为4次,但前者的专利匹配度(PMD=0.984)要高于后者(PMD=0.776),这是因为专利6-1授权时间为2018年,而专利6-2的授权时间为2014年,通过融入时间因子后计算专利影响力,专利6-1明显高于专利6-2,因此,其专利匹配度的排名靠前。专利6-3和专利6-4的专利相似度均为0.928,且后者的专利被引证次数高于前者,但前者的专利匹配度(PMD=0.761)要高于后者(PMD=0.747)。这是因为专利6-3的专利授权时间是2017年,而专利6-4的专利授权时间是2015年,且专利6-3的技术主题支持度(UPS=0.990)要高于专利6-4(UPS=0.987),所以专利6-3的专利影响力就高于专利6-4,使得专利6-3的专利匹配度高于专利6-4。可见,专利匹配度综合考虑了专利被引证次数、企业技术研发主题、专利授权时间、专利相似度,能够将上述指标相同的专利有效地区分开来。因此,与被引证次数、专利影响力、专利相似度相比,专利匹配度具有较好的专利区分能力,通过结合基于企业画像的推荐策略,适用于向企业推荐高校专利。
4 结语
本文提出基于企业画像的高校专利个性化推荐理论模型,旨在为企业寻求高校专利开展技术交易时,从技术研发属性和竞争对手属性两个维度构建企业画像,结合基于内容推荐和基于协同过滤推荐的思想,依据“专利匹配度”指标进行专利推荐。既关注了目标企业在技术研发重点主题层面的资源倾斜,又兼顾其在技术薄弱主题层面的潜在需求,能够改变以往企业在应用高校专利运营平台过程中的专利搜索模式,从“被动搜索”转变为“主动推荐”,帮助企业缓解专利信息过载困境,解决了企业“找专利”的问题。“专利匹配度”融合了多个维度指标,能够保证推荐专利的主题性、影响力、时效性、相关性,在传统推荐方法仅重视推荐精准性的基础上,又进一步凸显了推荐质量,从而实现了最佳的推荐结果。本文不足之处在于,首先,企业画像维度广泛,本文仅从技术研发和竞争对手两个属性维度进行描述,画像维度有待进一步拓展;其次,在专利相似度计算过程中,采用余弦相似度实现,虽然提升了计算效率,但忽略了语义关联,后续研究需要重视从语义层面的探索。以上内容会对本文的推荐结果产生一定影响,将在后续研究中加以改进。