基于多元关系融合的科学—技术—产业关联模式识别方法研究
2024-06-03刘佳钟永恒何晓东等
刘佳 钟永恒 何晓东等
关键词: 科学关联度; 产业关联度; 多元关系; 技术关联; 关联模式; 量子通信
DOI:10.3969 / j.issn.1008-0821.2024.06.006
〔中图分类号〕G301 〔文献标识码〕A 〔文章编号〕1008-0821 (2024) 06-0067-15
“围绕产业链部署创新链, 围绕创新链布局产业链, 促进创新链和产业链双向融合、精准对接、相互促进、协同发展” 等内容成为各地科技创新“十四五” 规划的重要内容。广东省、上海市、天津市、湖北省、内蒙古自治区等地区已发布的科技创新“十四五” 规划中, 对产业链和创新链的双向融合方式、重点推进领域均作了具体要求。围绕产业链部署创新链, 就是要求在产业链的每一个环节都将科技创新与产业创新融合; 围绕创新链建立产业链, 就是要围绕核心高技术研发组建产业链[1] 。产业链与创新链融合发展, 需要解决的首要问题是在每个环节实现产学研深度融合[2] 。因此, 开展科学—技术—产业关联模式的研究, 对揭示技术关联的科学基础和产业方向, 促进产学研深度融合具有重要意义。
数据资源的极大丰富和数据挖掘技术的迅速发展, 为从海量数据中定量挖掘技术与科学、技术与产业之间的关系提供了有力支撑。尤其是文本挖掘技术飞速发展, 自然语言处理技术、机器学习、知识挖掘与可视化等技术日新月异, 不断更迭, 可以提高和加深原有研究的效度和粒度, 为进一步发现和挖掘科学—技术—产业的关联模式提供新方法和新思路。
目前关于科学—技术—产业关联模式的研究以定性分析为主, 缺少融合多元关系的科学—技术—产业关联关系的测度指标, 影响了对科学—技术—产业关联模式的认识。专利与论文之间的引用关系、内容相似度关系、相同主体的关系, 以及专利与产品之间的交叉关系均从不同角度展现了科学与技术、技术与产业之间的关联关系。因此, 本研究拟以论文代表科学、专利代表技术、产品代表产业, 设计科学关联度和产业关联度指标, 构建科学—技术—产业关联模式的识别框架, 理论上为科学—技术—产业关联模式的识别提供一种新的研究思路和手段; 实践上为揭示技术关联的科学基础和产业方向提供依据, 为创新政策的制定、资源的合理配置提供决策支撑。
1 科学—技术—产业关联的理论基础
1.1 科学—技术—产业关联理论研究
科学与技术之间具有复杂的双向作用。Rip A[3]指出, 科学与技术并不是静态的、简单的统一整体,而是以多种方式持续发生关联, 两者就像一对共舞者相互配合、协作。Price D J[4] 指出, 知识可能从科学流向技术, 也可能从技术流向科学, 二者之间的互动能够推动领域的快速发展, 一方面科学知识的突变或科学原理的变化为引导技术创新和突破技术瓶颈发挥了极其重要的作用[5-6] ; 另一方面现代科学研究更加依赖技术, 技术为科学研究提供了更优的条件和更全面的视角[7-8] 。科学与技术之间的互动过程并非线性关系, 不同学者从不同理论角度论述二者之间的关系。Bassecoulard E 等[9] 基于系统论思想, 发现科学与技术通过相互制约和耦合形成全新的整体效应。李醒民[10] 从自然辩证法角度论证科学和技术互动的形式多种多样, 互动的过程错综复杂, 而不是线性的。王建芳[11] 从科学知识进化的基因理论、技术系统演化理论、科学与技术知识之间的互动理论3 个角度综述了科学与技术演化过程, 指出科学与技术系统是互动发展的, 科学与技术知识之间的交互与转移具有规律性。科学与技术的互动方式有多种。根据科学与技术之间的作用方向, 二者的互动方式可以分为科学推动技术、技术推动科学、科学技术双向交互发展、科学与技术各自独立发展4 种[12] 。根据科学与技术之间的作用强度, 二者的互动方式分为科学与技术之间的融合、科学与技术之间的互动协作、科学与技术间的知识传递以及技术对科学的依赖[13] 。
技术创新与产业系统的发展也是相互作用的,技术创新能够通过多种途径对产业系统的演化产生影响, 反过来, 产业系统的演进也会影响技术创新的活动与过程[14] 。当前的产业发展往往伴随新科研成果和新兴技术发明的出现, 当1 项或少数几项重要的技术创新出现后, 会随之涌现出一系列以此技术为基础或与此技术相关的产业, 新技术的出现以及进步会给全球产业经济带来重大变革[15] 。董坤[16] 在参考科学—技术关联双螺旋模型的基础上,对科学、技术与产业互动关系形式进行重新思考,同时结合科技、产业发展实践提炼出科学、技术与产业的三螺旋互动关系模式。
以上理论研究成果揭示了技术创新是复杂动态的过程, 从科学到技术, 再到产业, 不是简单的单向推导, 而是产学研深度融合的过程[17] 。本文认为科学、技术、产业“三位一体” 共同推动技术创新。
1.2 科学—技术—产业关联路径研究
1.2.1 科学—技术关联路径
科学计量领域, 以科学论文作为科学研究的载体, 技术专利作为技术创新的载体, 研究科学—技术之间的关联关系已成为共識[18-21] 。分析的角度包括创新主体的关系和知识单元内容的关系。创新主体包括大学、科研机构、企业、科学研究者、技术开发者等。知识单元内容的关系包括专利与科学论文的引用关系、科研人员的技术创新活动(合作、共现)、专利与科学论文的内容相似或相近关系。根据关联关系主/ 客体以及相互之间的关系, 可以得到科学与技术之间有9 种关联路径, 如表1 所示。进一步可以划分为4 种类别, 即引用关系、创新主体共现关系、类目映射关系、主题词相同/ 相似关系。
1) 引用关系。专利和论文均含有参考文献,通过专利引用论文、论文引用专利、专利与论文互相引用可以形成有向引用关系和无向关联关系。
2) 类目映射关系。科技论文和专利均有成熟的分类体系。通过构建科学论文分类体系和专利分类体系类目含义上的映射关系, 形成类目映射关系。
3) 创新主体关系。创新主体可以分为创新个体和创新机构。专利中的创新个体对应于发明人,创新机构对应于申请人; 论文中的创新个体对应于作者, 创新机构对应于作者归属机构。根据是否发表论文或申请专利, 将创新个体分为3 类, 一是学术型发明人, 指既发表论文又申请专利的创新主体; 二是纯发明人, 指仅申请专利的创新主体; 三是纯学术型创新主体, 仅撰写论文的创新主体。作者—发明人关系方法是指以学术型发明人为关系纽带, 研究论文和专利之间关联关系的方法。相应地, 根据创新机构是否发表论文或申请专利, 可以分为学术型申请人, 纯申请人、纯学术型研究机构。根据学术型发明人、学术型申请人在专利和论文中的创新活动关系可以形成创新主体关系。
4) 主题关联关系。论文由作者提供关键词,主题可以通过关键词聚类获得, 也可以通过文本挖掘方法根据论文标题、摘要、全文等内容提取主题。专利文件本身没有关键词和主题, 一般利用文本挖掘方法可以从专利标题、摘要、说明书或者权利要求项提取关键词或主题。每份专利文档或者论文文档均含有多个关键词和主题, 以关键词或主题为节点, 关键词的相同、相似关系或者主题相似关系为连线, 形成主题关联关系。
1.2.2 技术—产业关联路径
在产品作为产业表征[22-23] , 专利作为技术表征的前提下, 通过专利文本、专利分类、专利主题等维度可以发现, 技术与产业之间有3 种关联路径, 即专利技术与产品的应用关系、专利分类与产业分类的映射关系、专利技术主题与市场需求主题的匹配关系, 如表2所示。
总体上, 科学—技术、技术—产业之间的关联关系共涵盖12 种关联路径。本研究基于数据可获取性、指标可对比性、结果的有效性等维度重点选择了4 种关联路径, 即专利引用论文、学术型申请人、相似主题、专利应用于产品, 并以技术作为科学—技术—产业关联的纽带, 形成科学—技术—产业关联模式的判断依据, 如图1 所示。
2 分析框架设计
本文遵循“数据获取与预处理—主题提取—关系挖掘—关联模式可视化” 的研究思路设计科学—技术—产业关联模式识别的研究框架, 如图2所示。第一, 根据文献调研、专家组意见, 制定领域检索式, 并对领域内的海量论文、专利、产品数据进行检索、采集。第二, 基于LDA 主题模型,对获取的论文、专利、产品数据进行主题提取, 定量地识别语义主题。第三, 挖掘专利数据与论文数据、产品数据之间主题粒度的多元关联关系并进行测度。第四, 基于科学—技术、技术—产业之间的关联程度, 识别出科学—技术—产业关联模式。
2.1 数据获取与处理
创新者产生成果, 机构鼓励创新者为他们的成果出版论文、申请专利、标准、商品等。知识在创新过程中相互交换, 并在交换过程中实现文件化。因此, 各类科技文献作为科技活动的副产品, 为挖掘技术创新过程提供了依据。论文是基础研究成果的表现形式, 专利文献是技术创新成果的表现形式,尽管论文和专利不能代表科技创新产出的全部成果,但是通过论文计量分析可以获取基础研究的总体趋势[24] , 通过专利分析可以发现技术活动充分和详细的信息[25-27] 。产品反映的是科学、技术知识的产业应用情况, 可在一定程度上揭示市场需求变化及发展动向。因此, 本文以论文、专利及产品数据为分析对象, 分别从中获取科学主题、技术主题及产业主题。
对论文数据集和专利数据集的标题、摘要信息进行合并, 将其作为LDA 主题模型的文本语料,形成初始语料库。在语料库的基础上, 利用DDA内置停用词删除部分词语, 利用正则表达式进一步清洗特殊符号, 保证语料的可靠性。利用DDA 关键词统计功能, 得到初始的领域关键词术语表。根据LDA 模型得到的“文档—特征词” 表进一步调整停用词和领域关键词术语表, 保证分词结果的准确性和可靠性。
2.2 主题提取
主题提取是为了下一步开展基于主题粒度的关系挖掘。TF-IDF、Text Rank 方法无法区分主题之间的关系强度, 导致无法很好地揭示主题之间的关系。因此, 本文选用LDA 主题模型方法对专利和论文文本数据进行主题识别。该方法分为LDA 主题模型构建、LDA 模型迭代次数确定、LDA 模型主题数量确定、LDA 主题解读等步骤。LDA 主题提取准确度直接由主题数量决定, 为提高LDA 主题模型准确度,本文结合困惑度(Perplexity)及“肘形” 理论确定模型参数, 困惑度用于度量概率分布或概率模型的预测结果与样本的契合程度, 困惑度越低则契合越准确[28] 。“肘形” 是困惑度曲线的拐点, 该拐点与上一节点差值最大, 与后一节点的差值最小, “肘形”对应的主题数为模型的最优主题数[29] 。产品数据的主题以TOD 获得的产品数据清单为基础, 通过人工判断产品类别构建产品主题。
2.3 多元关系挖掘与测度
科学、技术、产业之间的关联关系错综复杂。本研究基于论文、专利数据之间的关联关系, 探究科學与技术之间的关联关系, 构建科学关联度指标;基于专利与产品数据之间的关联关系, 探究技术与产业之间的关联关系, 构建产业关联度指标。
2.3.1 科学关联度
科学关联度的计算过程由4 部分组成, 如图3所示。第一部分, 选择可靠的论文、专利数据库,分别制定论文、专利检索式, 建立论文、专利数据集, 数据经处理后形成LDA 主题模型语料库。第二部分, 利用LDA 主题模型对论文、专利数据聚类, 形成文档—主题矩阵和主题—词矩阵。第三部分, 基于专利的引文数据、申请人数据、摘要文本数据, 以及论文的发文机构数据、摘要文本数据,挖掘专利主题与论文主题引用关联、主体关联、内容关联, 计算得到引用关联度、主体关联度和内容关联度。第四部分, 融合引用关联度、主体关联度和内容关联度, 计算得到科学关联度。
以下对引用关联度、主体关联度、内容关联度、科学关联度的指标计算方法分别进行介绍。
1) 引用关联度CRIc 。引用关联度用于反映专利与论文主题之间的引用关系。Narin F 等[30] 提出利用专利所引用的科学论文或研究报告等的平均数量测度技术创新对基础研究的依赖程度。据此设计本文的引用关联度指标, 计算公式如式(1) 所示:
2.3.2 产业关联度
产业关联度的计算过程由3 部分组成, 如图4所示。第一部分, 建立专利数据集和产品数据集。用产品数据集匹配专利摘要文本, 计算每个产品词在专利文档中出现频次, 形成专利文档—产品词矩阵; 第二部分, 依据专利的LDA 主题模型聚类结果, 计算每个产品词在各专利主题包含的专利文档中出现的频次, 形成专利主题—产品词矩阵; 第三部分, 基于产品词清单, 通过文献调研和专家咨询,构建产品—主题词典, 以专利标题和摘要中出现的产品词为依据, 以专利主题—产品词和产品—主题词典为基础计算得到产业关联深度和产业关联广度,最后得到产业关联度。
2.4 关联模式识别
为了综合反映技术主题的科学—技术—产业关联关系, 本文尝试根据科学关联度(SL)和产业关联度(IL)对技术主题的科学—技术—产业關联模式划分为4 种模式, 分别对应4 个象限, 如图5 所示, 并将Ⅰ、Ⅱ、Ⅲ、Ⅳ4 个象限的技术主题分别命名为S-T-I 模式、T-I 模式、S 模式和S-T 模式。Ⅰ象限技术主题的科学关联度和产业关联度均较高, 说明科学、技术、产业之间互动频繁, 创新链与产业链融合程度高, 是当前发展最为活跃的技术, 也是产业化程度最高的技术。Ⅱ象限技术科学关联度低, 产业关联度高, 说明科学与技术之间互动较少, 技术与产业之间互动较多, 此类技术主题的科学积累薄弱, 技术发展的稳定性有待检验。Ⅲ象限技术主题的科学关联度和产业关联度均较低,说明科学与技术之间、技术与产业之间互动较少,此类技术主题未来市场前景不明确, 当前处于科学研究阶段。Ⅳ象限技术主题的科学关联度高, 产业关联度低, 说明科学与技术之间互动较多, 技术与产业之间互动较少, 需要增强技术与产业之间的互动, 提高技术的产业化应用程度。
3 实证研究
量子通信理论产生于科学综合期, 其最初出现的目的和意义在于突破现有经典信息系统的极限。随着量子通信自身理论的发展, 量子通信克服了经典加密技术的安全隐患, 是当前唯一被严格证明的无条件安全通信方式, 成为各国科学研究的重点[32] 。此后, 国与国间的激烈竞争使得量子通信理论得到快速发展。就目前而言, 量子通信技术的基础研究成果比较丰富, 并正由基础研究走向应用基础研究和应用研究[33] , 具备构建“科学—技术—产业” 网络所需的论文、专利和产品数据, 所以选择量子通信领域作为实证研究领域, 以此验证科学—技术—产业关联模式识别方法的可行性和准确性。
3.1 数据来源及获取
1) 论文数据。以Web of Science 为论文数据源, 采用高级检索方式, 获得论文数据50 519篇。
检索式为TS=(“quantum communicat?” OR “linearoptic?” OR “quantum key” OR “electromagneticallyinduced transparency” OR “neutral atom” OR “key distribution” OR “quantum memor? ” OR “quantumnonlocality” OR “photon entanglement” OR “entan?gled photon” OR “photon detect? ” OR “resonancefluorescence” OR “quantum gateway” OR “quantumswitch” OR “quantum random switch” OR “quantumencryption ” OR “ quantumand teleportation ” OR“quantum cryptography” OR “ quantum network” OR“ quantum satellite? ” OR “ quantum relay ” OR“quantum random number”)。
2) 专利数据。选择德温特专利数据库(Der?went Innovation Index, DII)作为专利数据源, 采用高级检索方式, 获得专利数据15 997项。检索关键词以论文数据检索关键词为基础, 加入分类号H04L9 和H04B10。
3) 产品数据。选用韩国科技信息研究所(Ko?rea Institute of Science and Technology, KISTI)开发的产品机会发现数据库(TOD 数据库, tod.kisti.re.kr)为产品数据来源。该数据库中的产品词均来源于美国专利商标局中的商标信息。TOD 数据库共收录164 030个产品词[34] 。使用TOD 数据库中的产品词, 作为领域产品词表来源。
由于研究数据时间跨度较大, 全局数据分析将导致重要主题被淹没, 所以对数据进行时间段划分。选择2003—2022 年近20 年数据作为分析对象, 以5 年为一个时期, 各时期的论文文献数、专利文献数、产品词数量均呈现增长趋势, 具体分布情况如图6 所示。
3.2 主题识别结果
按照研究流程所述步骤, 利用LDA 主题模型分别对预处理后的专利和论文语料库进行聚类, 根据困惑度(Perplexity)及“肘形” 理论确定专利技术主题数和论文主题数。经过Python 编程共提炼出4 个时期的专利技术主题集群(Pat_TS)和论文主题集群(Pap_TS)。利用Python 算法, 对专利中涵盖的产品词数量进行标引、归类, 得到各时期的产品主题词及产品主题集群(Pro_TS)。4 个时期的主题数量识别结果如图7 所示, 论文主题、专利主题、产品主题4 个时期累计数量分别为54 个、61个、379 个。
3.3 多元关系挖掘与测度
依据科学关联度、产业关联度计算方法, 得到4 个时期的科学关联度、产业关联度。科学关联度指标中的引用关联度、内容关联度、主体关联度的权重采用全局数据, 通过CRITIC 法计算得到, 权重依次为0.28、0.29、0.42。为了较直观地展示量子通信领域各技术主题与科学主题、产业主题的关联程度, 利用Python 的Matplotlib、Seaborn 工具包,绘制4 个时期的主题关联热力图, 如图8~图11 所示。从4 个时期的科学关联度热力图来看, 科学—技术关联逐步加强, 在P3 时期达到最高, 且多数技术主题的科学关联度高于0.2, 说明量子通信技术的发展高度依赖科学理论研究成果, 2018 年及以后量子通信技术发展对科学理论研究的依赖程度开始减弱, 更多地依赖现有技术创新成果取得突破;从4 个时期的产业关联度热力图来看, 技术—产业关联持续处于增强趋势, 说明随着量子通信技术的成熟, 技术创新成果逐渐走向产业化应用, 未来技术—产业关联程度将进一步增强。
3.4 科学—技术—产业关联模式的数量统计
在获得各时期技术主题的科学关联度和产业关联度后, 需要结合阈值识别各技术主题的关联模式。本文采用科学关联度和产业关联度的中位数作为阈值, 其中科学关联度的中位数为2.8246, 产业关联度的中位数为2.4266。依据此标准, 量子通信领域4 个时期61 个技术主题数共分为S 模式、S-T 模式、T-I 模式、S-T-I 模式4 种模式。其中, S 模式、S-T-I 模式的技术主题数量最多, 各包含17 个技术主题, 具体分布如图11 所示。如图12 所示, 在量子通信领域发展早期, 技术主题的科学关联度和产业关联度均较低, 以S 模式为主, 说明该时期量子通信技术领域已有的可供借鉴的研究成果较少,技术原创性较高, 现阶段产业应用较少。随着时间推移, S-T 模式和S-T-I 模式的技术主题越来越多, 表明科学、技术、产业之间互动逐渐频繁, 科学流向技术, 技术推动产业快速发展; 同时, T-I模式的技术主题在各时期均有分布, 表明量子通信技术创新活动一直伴随着量子通信产业的发展。
3.5 科学—技术—产业关联模式的主题分析
图13 是量子通信领域4 个时期各技术主题科学—技术—产业关联模式的可视化图谱, 横轴为科学关联度, 其交叉位置为科学关联度的中位数; 纵轴为产业关联度, 其交叉位置为产业关联度的中位数。图中圆点代表技术主题, 各技术主题的标签采用“时期+主题序号” 格式标注, 如“1-1” 代表第1 时期主题序号为1 的技术主题。
下面重点对各个时期技术主题的科学—技术—产业关联模式进行分析, 并对各种模式下专利数量最多的技术主题的具体技术内容进行深入分析。
3.5.1 P1 时期科学—技术—产业关联模式
2003—2007 年, 量子通信领域技术主题涵盖S模式和T-I 模式。S 模式的技术主题数有5 个, 分别是1_1、1_3、1_5、1_6、1_7。其中, 技术主题1_3(碳量子点)对应的专利数量为612 件专利, 高于该模式下其他主题对应的专利数量。该主题包含的重要主题词有材料、复合物、有机、聚合物、For?mula、Functional、派生物。碳量子点(Carbon Quan?tum Dots, CQDs)是一种粒径小于10nm 的零维碳纳米材料, 具有优异的发光性能、低毒、低成本、低寿命等优点[35] , 在通信领域有巨大應用前景[36] 。
T-I 模式的技术主题数有两个, 分别是1_2、1_4。其中, 技术主题1_2(量子光源)对应的专利数量为1 432件, 高于其他主题对应的专利数量。该主题包含的重要主题词有激光、光学、波长、光束、信号、光子、通信等。光源模块是量子密钥分发(Quantum Key Distribution, QKD)系统发送方最主要的模块之一, 其光源为弱相关光源。激光是由受激辐射而产生的相同模式的相位关联的光, 是一种较好的弱相干光源, 其中单模激光器因其较高的输出激光质量、较低的激光阈值和良好的激光转换效率在量子通信中广泛应用[37] 。
材料和光源模块是该时期的发展重点, 且S 模式的技术主题占有较大比例, 即科学关联度和产业关联度均较低的技术主题较多, 表明量子通信技术属于原创性较高的技术领域; 量子光源属于T-I 模式, 科学关联度低, 产业关联度高, 主要是因为量子光源关键核心技术主要来源于已有的光电子技术领域, 相关的产品应用较广泛。
3.5.2 P2 时期科学—技术—产业关联模式
2008—2012 年, 量子通信领域技术主题涵盖的科学—技术—产业关联模式与P1 时期的类型一致, 主要为S 模式和T-I 模式, 各模式下的技术主题数量均为9 个。处于S 模式的技术主题分别是2_6、2_7、2_8、2_10、2_13、2_15、2_16、2_17、2_18。其中, 技术主题2_16(电磁诱导透明)对应的专利数量为63 件。该主题包含的重要主题词有原子、电磁诱导透明、吸收区域、信号处理单元。电磁诱导透明指的是微观系统中原子能级之间的量子干涉效应过程, 使得原本能量吸收区域出现一个激光透射窗口。因为实验条件的限制, 例如, 较低的实验温度, 高强度激光等在常规实验条件下难以获取, 使得电磁诱导透明的发展受到了极大的限制[38] 。目前, 电磁诱导透明技术处于S 模式, 并未进入产业化阶段。
进入T-I 模式的技术主题分别是2_1、2_2、2_3、2_4、2_5、2_9、2_11、2_12、2_14。其中,技术主题2_1(量子密钥)对应的专利数量为1 222件。该主题包含的重要主题词有量子密钥、量子密钥分发、终端、信息、无线、安全、移动等。量子密钥是量子保密通信的核心, 从第一个BB84 协议被提出到目前为止该方向已有近40 年的发展历程,已经成为量子信息领域最成熟也最接近于实用化的技术之一[39] 。得益于率先开展广域量子保密通信的技术验证与应用示范, 目前我国量子保密通信核心器件的国产化和设备的小型化已初步实现, 已经具备了在关键部门先行先试的条件[40] 。
该时期S 模式和T-I 模式的技术主题数量分布较均匀。一方面, 说明量子通信技术领域的基础理论研究成果对技术创新的支撑程度还需要继续加强;另一方面, 量子通信技术的关键核心技术取得重大突破, 为量子通信技术走向产业应用提供了基础。
3. 5.3 P3时期科学—技术—产业关联模式
2013—2017 年, 量子通信领域技术主题涵盖了4 种类型, 其中S-T-I 模式是该时期的主要模式,已有9 个技术主题进入S-T-I 模式。S 模式、S-T模式和T-I 模式也均有一定数量的技术主题分布。
进入S-T-I 模式的技术主题有3_1、3_2、3_4、3_5、3_6、3_8、3_11、3_17、3_18。技术主题3_1(新型量子材料)对应的专利数量为1 864件, 该主题包含的重要主题词有石墨烯、过渡金属氧化物、钙钛矿量子点玻璃、聚合物、晶体。瑞士科学家利用石墨烯制造了首个超导量子干涉装置, 用于演示超导准粒子的干涉[41] 。过渡金属氧化物中新奇量子态具有成为高性能自旋源材料的巨大潜力, 钙钛矿量子点玻璃具备良好的稳定性和独特的光学性能, 均引起人们广泛的关注和研究。
该时期科学—技术—产业关联的4 种模式均有分布, 但是S-T-I 模式成为主导, 说明该阶段量子通信的理论研究成果能够较好地支撑技术创新, 并且在推动产业升级方面的作用开始显现, 量子通信技术领域已经形成了科学、技术、产业良性互动的局面。
3.5.4 P4 时期科学—技术—产业关联模式
2018—2022 年, 量子通信领域技术主题涵盖S-T 模式、T-I 模式和S-T-I 模式3 种类型, 分别有9 个、1 个和8 个技术主题进入对应模式。进入S-T 模式的技术主题为4_6、4_7、4_8、4_10、4_11、4_12、4_13、4_14、4_17, 技术主题4_13(量子器件)对应的专利数量为261 件, 该主题包含的重要主题词有相位切换、电容、电阻、线性光纤、生成器等。量子器件相关的理论研究与应用研究为量子通信技术的大规模工程化应用提供基础条件。
进入S-T-I 模式的技术主题有4_1、4_2、4_3、4_4、4_5、4_15、4_16、4_18, 技术主题4_1(量子卫星)对应的专利数量为2 323件, 该主题包含卫星、地面、分发、量子基态、Sagnac 效应、增强型加密等主题词。当前, 量子通信的科学研究与实验活动越发活跃, 高科技企业积极探索产业应用场景[42] 。中国科技大学研究团队主导完成的全球首颗量子实验卫星“墨子号” 成功发射, 推动了量子通信实用化。英国、奥地利等国家组建的研究团队发射低地球轨道微型卫星——CubeSat 量子卫星, 进行了量子密钥分发和纠缠分发试验[43] 。
该时期S 模式的技术主题已经消失, 即科学关联度和产业关联度均较低的技术主题消亡, 并且,该时期S-T 模式和S-T-I 模式的技术主题数量之和远多于前3 个时期, 量子通信领域理论研究成果对技术创新的支撑作用, 以及产业应用对技术创新的拉动作用逐步加强。量子通信技术的发展为量子通信理論研究提供了研究手段, 带动了理论研究的深入, 越来越多的产业应用提升了技术稳定性和升级换代频率, 进一步拓宽了技术产业化应用的广度。
4结语
现有研究主要是从不同维度挖掘论文与专利之间的联系, 以此反映科学与技术之间的依赖与促进关系, 而对于反映市场需求的产品数据与专利、论文之间的联系较少展开研究, 未形成科学—技术—产业之间关联模式的有效识别方法。针对以上不足,本文提出基于多元关系挖掘的科学—技术—产业之间关联模式识别方法, 通过LDA 模型与人工判断方法相结合识别出论文、专利、产品等主题; 并从论文与专利的主题粒度挖掘二者的引用关系、主体关系、内容关系, 形成科学关联度, 反映科学与技术之间的主题关联; 从专利与产品的主题粒度挖掘产品词的交叉关系, 形成产业关联度, 反映技术与产业之间的主题关联。然后, 基于科学关联度和产业关联度的计算结果, 识别各技术主题在各时期的科学—技术—产业关联模式。最后, 以量子通信技术为例进行实证, 对该领域61 个技术主题的科学—技术—产业之间的关联模式进行识别。
研究结论主要有两个方面: ①量子通信领域S模式、S-T 模式、T-I 模式、S-T-I 模式的技术主题均有分布, 且随着时间推移, 处于S 模式的技术主题减少, S-T 模式和S-T-I 模式的技术主题增多, 这反映出量子通信基础理论研究逐渐成熟, 量子通信技术逐渐向应用研究发展, 科学—技术—产业之间的互动逐步加深; ②从产业链视角看, 量子通信技术遵循“材料—应用模块—应用核心技术—应用系统” 的演化路径。早期碳量子点材料和量子光源模块为热点技术领域; 中期量子密钥作为量子通信的关键核心技术成为热点领域; 后期量子卫星成为推动量子通信走向应用的热点领域。
本研究的局限是在科学—技术—产业关联模式识别中, 选用科学关联度和产业关联度的中位数作为阈值设置标准。该方法未考虑领域的差异性, 今后研究中将围绕领域特征, 更科学地设置阈值, 进一步准确地识别科学—技术—产业关联模式。同时, 由于科学理论成果直接转化为产业应用的影响因素较复杂, 本文未对科学与产业之间的关联路径进行探索, 仅从科学与技术、技术与产业的关联角度研究科学—技术—产业之间的关联模式, 未来将综合考虑更多类型的数据和关联路径, 更全面系统地研究科学—技术—产业之间的关联模式。