电力专利在线交易撮合模型与算法研究

2022-01-04杨芳，彭珍，张艳

山西电力 2021年6期

杨芳，彭珍，张艳

（1.国家电网有限公司信息通信分公司，北京 100032；2.北京科慧远咨询有限公司，北京 100191）

0 引言

专利交易是专利运用的重要环节，是专利市场化的重要手段，也是专利价值变现和增值的重要渠道。就国内外交易平台来看，供需双方信息不对称、交易在线服务技术缺乏是阻碍专利技术交易的核心要素，充分利用互联网技术在专利在线交易方面的优势，探索解决专利交易过程中供需双方信息不对称问题，开展专利在线交易撮合算法研究，是破解国内专利线上交易困境，提升专利交易市场活跃度的重要抓手。本文结合电力行业专利数据探索专利在线交易撮合模型与算法。

1 专利在线交易技术研究现状

近年来，国内外社会各界，特别是学术界和工业界非常重视专利交易，我国各级政府也在不断完善推进专利交易的标准体系建设工作。2014年，深圳市市场监督管理局发布《专利交易价值评估指南（SZDB/Z 103—2014）》[1]，用于指导深圳市企业及中介机构开展专利交易价值评估，规范专利交易市场秩序；2020年，国家市场监督管理总局和国家标准化管理委员会联合发布《科技成果经济价值评估指南（GB/T 39057—2020）》[2]，完整阐述了专利交易在交易结构、交易信息需求要素等方面的内容，为专利交易研究提供了方向指导。

2 专利在线交易撮合模型设计

交易撮合是指卖方在交易市场委托销售订单、买方在交易市场委托购买订单，交易市场按照一定的原则（可以是价格优先或时间优先等）确定双方成交并生成交易合同，且按照交易订单指定的交割仓库进行实物交割的交易方式。撮合算法直接关系到撮合交易的数量和质量，随着电子商务的飞速发展，交易撮合算法也在不断更新。

各个供方/需方在发布供给信息/需求信息时，向专利交易系统提供可交易专利的信息，从多维度对待交易专利技术进行标准化描述，是专利技术开展自动撮合的数据基础。本文专利技术撮合采用“TLGMP”模型，具体包括技术T、法律L、地域G、模式M、价格P要素，模型要素及权重如表1所示。

表1 专利技术撮合要素模型及权重

3 专利交易撮合核心算法设计

对于具体的交易撮合案例，供需双方基于“TLGMP”模型的最终相似度应以该模型各一级要素的总相似度的加和计算，各一级要素总相似度为其各二级要素相似度与对应子权重相乘后加总计算得到，本节详细阐述“TLGMP”模型各一级要素、二级要素的相似度计算方法。

3.1 各要素的相似度计算

3.1.1 技术(T)

技术（T）要素主要是专利技术维度的描述，其二级要素均是以文字表述的形式构成，该类要素统一记为文字表述类要素。在判断文字表述类要素的相似度时，需要依赖智能语义技术，从文字表述中提取关键词，并对比待匹配供需双方关键词的相同和近似相同程度。即：

供方要素相似度=双方关键词相同或近似相同数量/供方要素文字表述关键词数量。

此处的近似相同是由智能语义技术结合大数据统计，比较两个关键词的近似程度达到一定阈值时，则判断为近似相同，通常为近义词、同义词或一种技术特征的不同表述形式等。

以二级要素技术关键词（T_K）的相似计算为例具体介绍如下。

会上，著名白酒专家高景炎宣读了产品鉴评结果，举行了颁奖仪式。江苏省食品工业协会副会长孙林对峰会进行了小结并举行了会旗交接仪式。会议完成各项议程，圆满结束。

某供方A提供10个技术关键词，某需方B提供8个技术关键词，经对比分析，完全相同的关键词3个，近似相同的关键词4个。则对于供方A而言，需方B在技术关键词（T_K）这一要素上的相似度为（3+4）/10×100%=70%；对于需方B而言，供方A在技术关键词（T_K）这一要素上的相似度为（3+4）/8×100%=87.5%。

其他文字表述类要素的相似度计算同理。

3.1.2 法律(L)

法律（L）要素的二级要素中，专利剩余年限（L_Y）、专利包数量（L_P）和专利质量指数（L_I）均是通过数值表述，专利类型（L_T）、标准专利情况（L_S）、专利运营情况（L_O）和专利诉讼情况（L_L）虽然是通过文字表述，但是其对比通常是判断是否有无的完全匹配，可以通过数字化的比较是否等于、是否大于、是否小于来实现，该类要素记为数值表述类要素。

与文字表述类要素的相似度比较相比，数值表述类要素的相似度比较更为直接。例如，专利剩余年限的表述是具体数字，若供方提供剩余年限为7，需方要求的剩余年限为≥5，则比较相似度时，由于7满足“≥5”的要求，因此无论对于哪一方，都视为满足要求，相似度记为1，否则记为0。

3.1.3 地域(G)

地域（G）要素描述的内容为具体的国家或地区，进行需求比较时，得到结果只有一致或不一致，因此，比较相似度时，地域（G）整体可以视为数值表述类要素。由此可得，地域（G）的相似度计算，可以参照法律要素的相似度计算。

3.1.4 模式(M)

模式（M）要素用以描述当前交易接受的交易模式，结合专利交易实际情况很容易理解，其需求比较结果同样为匹配或不匹配，因此模式（M）整体可以视为数值表述类要素。

3.1.5 价格(P)

价格（P）要素旨在描述专利标的交易价格，属于典型的数值表述类要素。在双方的预期专利价格无法匹配时，需要分析一方的预期专利价格是否属于另一方的专利价格浮动区间内，即判断双方的专利价格浮动区间是否有交集。

3.2 专利交易撮合算法流程

在专利交易系统中，依据前述“TLGMP”专利交易撮合要素模型的分析比对，实现将适合的供需双方进行配对撮合，自动提取交易系统中供方、需方的全部交易主体，将其中一方的信息提供给另一方，本文的交易撮合算法不限于处理一对一的交易撮合，而是可以实现交易系统中全部交易主体的、多对多的交易撮合。下面以国家电网有限公司（以下简称“国网公司”）为例进行说明。

步骤1：配置“TLGMP”模型的要素及权重。以“TLGMP”模型为基础，结合撮合场景，为模型选取合适的二级要素，并为各级要素配置权重，为后续撮合提供完善的撮合模型基础。

以国网公司为例，其在电力应用和电动汽车领域拥有一定的研发实力和优势，凭借自身专利存量基数大，无论需方在法律要素上提出什么需求，找到合适的专利标的与之匹配的几率都很大，是典型的供方需求明确场景，法律（L）、价格（P）并不是国网公司的关注点，权重配置可以偏低，因此“TLGMP”的权重分别为40%、5%、20%、30%、5%。

另外，当下热门的人工智能、区块链技术能够为电力交易中的难题提供新的解决思路，社会各界对人工智能、区块链技术的研究和实践，值得国网公司采用和借鉴，属于需方需求明确场景，需重点关注技术（T）、法律（L）和地域（G），相应的权重配置可以偏高，因此“TLGMP”的权重配置分别为40%、20%、20%、5%、15%。

步骤2：获取待撮合的供方/需方清单。在专利交易系统中建立供需双方数据库，该数据库包括但不限于供需双方的名称等基本信息、供应的专利标的技术信息、需求内容等。在匹配撮合时，算法从数据库中获取待匹配撮合的供方/需方清单。仍以国网公司为例，其可以在交易系统中发布可供交易的输变电技术、电动汽车等相关领域专利标的信息，算法将其发布的信息录入数据库，等待进行撮合。

步骤3：以“TLGMP”模型为基础，逐一为待撮合的供方/需方提取模型要素数据。通过智能语义算法，从数据库中提取国网公司待撮合专利交易标的解决的技术问题、技术效果、技术领域、专利基本情况、专利地域、专利运营模式、预期交易价格等要素信息，构建“TLGMP”模型，为后续匹配撮合做好准备。

步骤4：为供方/需方匹配可能的交易对象。在步骤3的基础上，按照模型相似度算法，寻找可能的交易对象（需方）。即根据步骤3中构建的模型，在交易系统中通过要素匹配，寻找需要输电变技术、电动汽车领域专利技术的需方，并计算双方的相似度。也可以以需方清单为基础，为每一个需方寻找可能的交易对象（供方）。

步骤5：为供方/需方推送可能的交易对象。通过专利交易系统的自动推送功能，定期将匹配到的需要输电变技术、电动汽车领域专利技术的需方对象清单，推送给国网公司，亦可将国网公司的相关领域专利标的信息推送给需方。

匹配结果显示必须由多个需方满足某一供方条件时，或者必须由多个供方满足某一需方条件时，应将特别标注说明，并将多个需方/供方清单专门打包。

步骤6：询问是否接受撮合结果，并进行后续操作。推送可能的交易对象清单后，如果供方/需方选择查看该推送结果，则根据其查看的清单条目，系统询问是否选择该条目对应的需方/供方作为交易对象。若是，则根据专利交易系统的交易流程，转入下一交易环节。

步骤7：算法的自我学习。基于深度学习等基本算法，本文的专利交易撮合算法具有自我学习功能。在供方/需方选择查看该推送结果的某条目后，撮合算法记录最终的选择结果至后台，以便算法得到加强和改进，更加精准地适用于各种不同场景。