APP下载

基于多指标隐马尔可夫模型的技术生命周期识别方法研究

2023-02-06何晓斐夏志杰上海工程技术大学管理学院上海201620

物流科技 2023年1期
关键词:马尔可夫生命周期专利

何晓斐,夏志杰(上海工程技术大学 管理学院,上海 201620)

0 引言

技术战略对国家提高科技创新综合实力至关重要,且技术战略的制定离不开对技术当前发展状态及未来发展趋势的准确把握与判断,而技术生命周期是反映技术发展趋势的重要指标[1]。技术生命周期的科学判断不仅可以帮助国家快速把握国内外技术的发展态势,帮助企业宏观了解技术发展现状。因此,技术生命周期的准确判断对国家和企业的发展规划和前瞻性管理都有至关重要的作用。

识别技术生命周期的方法集中在以下三个方面:第一种为模型化方法,即使用曲线或者已构建模型对技术生命周期进行识别判断,如S 曲线[2]、Fish-pry 模型法[3]和系统动力学方法[4];第二种为计量法,即使用文献计量和数据挖掘的方法对技术生命周期进行识别和判断,如专利指标分析法[5]、TCT 计算法[6]和多指标测量法[7];第三种为描述法,即偏向于主观评估度量,如基于TRL 的技术成熟度分析方法[5]与德尔菲法。其中模型化方法和计量法无法深入技术生命周期内部探索其技术演化的内在特征。随着技术生命周期发展判断的研究逐渐增多,运用多指标识别技术生命周期分界时间线被越来越多的研究者采用[7],但面对演化时间长且发展曲折的技术会忽视技术内部的客观演化规律,导致划分效果具有较大的随机性。故拟融合模型法和计量法构造技术生命周期预测模型,深入探讨技术的发展演变情况。

结合多指标模型和隐马尔可夫模型构建多指标隐马尔可夫模型,从专利申请数量、技术开发人员数量和审查过程持续时间三个指标优化隐马尔可夫模型,更准确地识别技术生命周期。具体的研究包括:提取相关专利指标的数据处理成时间序列数据;然后,利用BIC 判断技术生命周期的阶段数,再运用Baum-Welch 模型来估计模型参数,Viterbi 算法获得最可能的状态序列;最后将多指标隐马尔可夫模型同技术生命周期的经典S 曲线和多指标技术生命周期判断体系相比较,验证其有效性及精确度。

1 预测模型构建

本文基于数据源和预测方法进行改进,以智能手表技术为例,提出一种技术预测和改进模型。首先,对数据指标进行重构,丰富数据指标,提供更为可靠的结果;其次,利用双随机过程的隐马尔可夫模型确定技术生命周期的阶段数及每个年份所对应的技术生命周期阶段,并给出每个技术生命周期阶段的转移概率;最后,利用主成分分析法分析每个指标的贡献率,构造技术生命周期指数,对隐马尔可夫模型所判断的技术生命周期阶段进行对比和验证。

1.1 技术生命周期数据指标的构建

提取技术生命周期的时间序列专利指标需考虑以下问题:首先,专利指标可以捕获决定技术生命周期阶段的因素—技术影响,并分析这些指标的动态行为是否可用于技术生命周期分析。其次,选择的专利指标可表明不同生命周期阶段之间存在的显著差异,以提高准确性和可靠性。最后,在数据可获取性方面,从公共数据库中提取的指标提高了所提方法的可行性。基于这些考虑,选择了以下3 个时间序列专利指标。

(1)专利数量(PNt):该指标是分析技术生命周期最常用的指标之一。在分析技术生命周期时,该指标的增减可以被解释为研发活动水平和变化情况。根据以往文献表明,一项技术的专利数量会一直增加直至生命周期的成熟期,然后开始逐渐下降,达到饱和。考虑到这些因素,本文将此指标定义为时刻t 某技术领域发布专利数量的时间序列数据。

(2)技术开发人员数量(TDt):在技术生命周期的初始阶段,有许多开发者试图进入该领域,但随着技术的逐渐成熟,少数技术开发人员仍然留在该领域。基于此,本文将此指标定义为时刻t 某技术领域中技术开发人员数量的时间序列数据。

(3)审查过程持续时间(DE Pt):专利审查过程的持续时间和技术价值之间存在重要关系。因为审查者缺乏新技术的经验,对先前技术数量进行严格检查,故专利审查持续时间受到技术生命周期阶段的影响。因此,本文将此指标定义为时刻t 某项技术相关专利从申请日到授予日之间平均时间的时间序列数据。

1.2 技术生命周期识别模型构建

隐马尔可夫模型是一种基于双随机过程的机器学习技术,在双随机过程中,潜在的随机过程不能直接观察到,但可以通过第二组随机过程观察到。隐马尔可夫模型由初始概率分布、状态转移概率分布及观测概率分布确定,可表示为λ=(I,O,A,B,π),I 是长度为T 的状态序列I=(i1,i2,i3,…,iT),O 是对应的观测序列O=(o1,o2,o3,…,oT),A 是状态转移序列A=[aij]N×N,其中:

是在时刻t 处于状态qi的条件下在时刻t+1 转移到状态qj的概率。其中it是t 时刻的一种状态,N 是可能的状态数,可以通过定性分析或贝叶斯信息准则等定量工具根据情况确定最佳状态数N。B 是观测概率矩阵B=[bj(k)]N×M,其中:

是在时刻t 处于状态qi的条件下生成观测vk的概率。π 是初始状态概率向量π=(πi),其中:

是在时刻t=1 处于状态qi的概率。

对于连续的隐马尔可夫模型,需要确定观测向量的状态概率密度函数分布来估计模型参数。本文假设专利指标遵循均值为μj,协方差矩阵为Σj的多元高斯分布,不同技术之间的均值和协方差不同,相同技术在不同生命周期阶段的均值和协方差也不同。公式如下所示:

其中:第j 个分量是混合参数φj的多元高斯分布,平均值为μj,协方差矩阵为Σj。

然后利用贝叶斯信息度量(BIC)确定技术生命周期的阶段数。BIC 准则解决时间序列数据定阶问题时,在大样本的情况下表现优于AIC 准则,BIC 使用贝叶斯因子方法来选择模型,不需要考虑参数的先验概率。通过选择BIC 最小值对应的拟合模型来确定贝叶斯后验概率最高的模型。其公式如下所示:

其中:f(y|θk)为模型的极大似然函数,K 为模型参数个数,n 为样本数。

接下来利用Baum-Welch 模型来估计模型参数,它的参数学习可以用EM 算法来实现。输入相应的观测序列即可学习隐马尔可夫模型λ=(A,B,)π 的参数;再利用Viterbi 算法获得最可能的状态序列。最后,得到了技术生命周期进程的各个阶段,以及状态转移概率矩阵、观测概率密度矩阵和初始状态概率向量。

1.3 技术生命周期指数构造及有效性验证

一般情况下多指标测度体系用于技术生命周期判断时,需要构建技术生命周期指数模型,目的是将多个指标综合起来,通过主成分分析法获取主成分个数及特征因子权重,然后通过指数综合模型来计算综合评价值,观察技术生命周期演化曲线发展趋势判断技术所处发展阶段。其中,主成分所表现出的信息贡献率是有差异的,为了更好地反映出指标重要性的差异性,本文采取主成分的方差贡献率与累计方差贡献率的比值作为主成分权重赋予的依据,保证加权的客观性,体现出指标构建的科学性。目前关于多指标体系综合指数模型构建已有大量相关研究工作,本文在参考了相关研究资料后所构建的技术生命周期指数模型为:

公式中I 代表技术生命周期指数,ωi代表第i 个主成分的权重,Fi为第i 个主成分。利用构造的技术生命周期指数对隐马尔可夫模型判断的阶段数进行排列,得出技术生命周期的状态序列。

为验证构建的技术生命周期多指标测度体系的优越性,选择技术生命周期判断方法中最为常用的基于累计专利申请量的S曲线和多指标技术生命周期识别模型与其进行对比分析,判断多指标隐马尔可夫模型识别技术生命周期的有效性及灵敏度。

2 实证分析

2.1 数据来源及处理

本文以智能手表专利技术为例,对模型进行实证分析。数据来源于专利分析与检索网站(https://pss-system.cponline.cnipa.gov.cn/),检索“智能手表”获取2013 年至2021 年的智能手表专利数据。根据IPC 专利号将智能手表分类成若干子类,因某些子类专利数较少仍处于生命周期的早期阶段,故选取子类专利数较多的子类进行技术生命周期的讨论分析。选取9 个子类共6 530 条专利数据,专利子类分别为A44、A61、G01、G04、G06、G08、H01、H02、H04。为减少短期波动,将9 个子类共6 530 条专利数据按照指标PNt、TDt和DEPt处理成以年为单位的时间序列数据。

2.2 技术生命周期发展判断

将处理后的时间序列数据集用多变量高斯混合模型与时间序列专利指标拟合后,根据BIC 拟合模型阶段数,拟合结果如图1 所示,由图1 可得将类别设置为4 时,BIC 的值最小,这意味着分子扩增诊断技术的生命周期最好由4 个不同阶段来解释。

图1 BIC 划分技术生命周期阶段数

运用Python 中实现的“hmm”包,通过Baum-Welch 和Viterbi 算法估计模型的相关参数均值及各阶段状态转移矩阵,但由于计算机输出的技术生命周期阶段的阶段顺序不确定,故引入技术生命周期指数。运用SPSS 软件中的主成分分析法,确定各特征因子权重,得到技术生命周期指数的表达式为:

其中:Fi设定为各指标在每个阶段的均值。根据技术生命周期指数确定技术生命周期阶段顺序,各指标所处阶段状态转移概率矩阵分别如表1 所示。最后,推导出智能手表的子技术生命周期序列如图2 所示。

图2 智能手表子技术生命周期预测

表1 状态转移概率矩阵

由隐马尔可夫模型预测的智能手表子技术的技术生命周期所处阶段不一,大多数子技术处于技术生命周期的第二阶段,但是子技术G06 和H04 发展较快,已发展到技术生命周期的第四阶段。

2.3 有效性验证

为验证隐马尔可夫模型预测技术生命周期阶段划分的准确性,选择技术生命周期判断方法中最为常用的基于专利累计申请量的S 曲线和多指标技术生命周期指数方法与多指标隐马尔可夫模型进行对比分析来验证所构建的技术生命周期多指标测度体系的有效性。本节选取的技术生命周期指数表达式为公式(7)。

图3 中的长虚线表示S 曲线和多指标技术生命周期指数方法曲线所判断的技术生命周期阶段划分的结果,两种方法所判断的结果相同;图中短虚线所表示的是本文所构建的隐马尔可夫模型所判断的技术生命周期阶段划分的结果。可知隐马尔可夫模型所判断的萌芽期和成长期的分界时间点和成长期与成熟期的分界时间点与S 曲线和多指标技术生命周期指数方法所判断的相差不大;但是隐马尔可夫模型判断成熟期与衰退期的分界时间点要早于S 曲线和多指标技术生命周期方法所判断的分解时间点,这两种方法所表现的较为延迟。

图3 H04 技术三种技术生命周期阶段判断技术对比

针对所选取的智能手表的子技术而言,多指标隐马尔可夫模型与S 曲线和多指标技术生命周期模型相较,多指标隐马尔可夫模型在技术生命周期不同发展阶段分界线方面更加符合实际,更加精准。

3 结束语

本文融合多指标模型与隐马尔可夫模型构建多指标隐马尔可夫模型,采用智能手表专利技术进行实证研究并对模型的有效性和精确度进行验证。首先,从“多指标测度体系与隐马尔可夫模型相结合”这一研究视角出发,利用技术生命周期多指标测度体系与隐马尔可夫模型相结合,判断技术生命周期阶段的分界线。然后,选择智能手表产品为例,对其技术生命周期进行预测。最后,将多指标隐马尔可夫模型与S 曲线模型和多指标技术生命周期指数测度体系对比,验证其有效性和精确度。结果表明多指标隐马尔可夫模型在划分技术发展阶段分界点方面更加准确、更加符合实际情况,为技术生命周期不同发展阶段的研判提供了一个新的研究视角。所构建的多指标隐马尔可夫模型也存在一定的局限性,模型中所需要的指标体系还未得到全面考虑,指标体系中未加入专利文献指标;或可进一步考虑较难量化的技术性能指标的量化与计算,将有利于获得更加全面及科学的技术生命周期研判结果。

猜你喜欢

马尔可夫生命周期专利
全生命周期下呼吸机质量控制
专利
从生命周期视角看并购保险
民用飞机全生命周期KPI的研究与应用
发明与专利
保费随机且带有红利支付的复合马尔可夫二项模型
基于SOP的核电厂操纵员监视过程马尔可夫模型
应用马尔可夫链对品牌手机市场占有率进行预测
认知无线网络中基于隐马尔可夫预测的P-CSMA协议
专利