基于全生命周期成本理论的知识匹配方法
2017-09-14湖南理工学院经济与管理学院湖南岳阳414000
□ (湖南理工学院经济与管理学院湖南岳阳414000)
一、引言
面向产品全生命周期成本管理的知识库的构建厘清了成本控制与相关知识的关系,促进了组织成员之间的知识共享。知识库易用的关键是用户要能快速有效地获取知识,因而知识匹配方法受到人们重视。现有知识匹配方法主要有基于文档的方法和基于查询日志的方法。Dumais T等于1988年提出LSI(隐性语义标引)模型,该模型已在文本匹配领域已得到广泛应用。现有知识匹配的研究往往忽略岗位对知识的重要性需求,而用户的岗位调动或个人工作职责变更也经常发生,现有文献也较少从控制全生命周期成本的角度进行知识匹配。因此,已有知识匹配方法直接应用于企业全生命周期成本知识库均存在一定的局限性。基于此,利用控制生命周期成本的岗位知识重要性和LSI模型,提出一种基于全生命周期理论的知识匹配方法。
二、基本理论和方法
(一)全生命周期成本理论
按全生命周期成本理论,产品按其生命的产生到结束可分为设计过程、制造过程、销售过程、使用过程、处置回收过程。
图1 全生命周期成本组成图
每个过程又包括成多个任务,完成每个任务都需要耗费成本,这些成本之和组成产品生命周期成本。
(二)控制生命周期成本的岗位重要知识
由于按产品从产生到消亡的生命周期可分成多个阶段,每个阶段可分成多个过程,每个过程又可分成多个任务,在完成任务时,该岗位积累了所需的控制生命周期成本的知识。
利用专家经验,可以为每份知识文档在各岗位下定义重要性,例如文档j在岗位l下控制产品生命周期成本的重要性为Zlj,其取值范围为0—1,值越大表示该岗位越需要该知识,据此可构建控制全生命周期成本的岗位知识重要性的数据表。
(三)基于LSI模型的知识匹配过程
基于生命周期成本理论的知识匹配方法仍需要利用LSI模型实现知识匹配,当用户从知识库中输入查询条件后,系统根据用户所在的岗位找到该岗位所需的知识文档,同时将用户查询视同“伪文档”,利用LSI模型计算用户查询和知识库文档的相关性,并根据岗位知识重要性,确定需匹配的知识,具体过程见图2。
图2 基于LSI模型的知识匹配过程
如图所示,首先,构建隐性语义空间,通过对特征词i在岗位所需的文档j中出现的频率和反文档频数因子组成的特征词-文档矩阵进行预处理,生成矩阵X,利用式(1)对矩阵X进行奇异值分解,其中:U0TU0=1,V0TV0=1,S0为r阶对角矩阵。
选择S0中k个最大的奇异值,将其余的元素都置为0,构成矩阵S。同时,取U0和V0的前k列得矩阵U和V,利用Xk=USVT构建X的k秩近似矩阵Xk;其次,计算查询文本与文档j的相似度,把查询文本视同一份“伪文档”,则可转换为查询文本向量q,并利用q*=S-1UTq将q投影到k维语义空间形成向量q*。
利用式(2)计算查询文本与文档j在隐性语义空间相似度,其中dj为文档j的隐性语义空间中的投影;再次,据式(3)计算该岗位下查询文本与知识文档的匹配度,选择匹配度大于阀值的知识,降序排列送给用户。
三、实验结果及分析
某企业构建了基于生命周期成本知识库,知识库中存储了用户、岗位、岗位知识重要性、特征词、知识等实体。我们选择五份知识文档 K1、K2、K3、K4、K5,一个用户,两个岗位B1、B2,通过变更查询条件,变更人员岗位来测试匹配方法的有效性。
(一)实验
与生命周期成本相关的六个特征词在该五份文档中形成矩阵A,五份文档在两个岗位B1、B2下控制全生命周期成本的重要性矩阵为(B1,B2)T,将岗位 B1分配给用户,查询文本的特征词词频向量(1,1,0,0,0,0)T。
可计算出归一化的特征词权重矩阵A*。
映射到k=3的隐性语义空间形成矩阵X3。则查询文档在该隐性语义空间中的映射向量 q*为 (-0.4229,0.6114,-0.7355)T,据式(2)得相似性向量(0.6282,-0.2712,0.8707,0.3198,0.2123),据式(3)得匹配度为(0.6282,-0.2712,0.8707,0.3198,0.2123),设置阀值 0.2,则选择知识(K3,K1,K4,K5)依序推送给用户。
实验表明:在岗位知识重要性相同的情况下,查询文本和知识文档越相似,匹配度越高,表明方法合理有效。
(二)查询条件变化的影响分析
保持以上实验中其他参数不变,更改查询向量,实验结果如表1所示。表1中各列的值表示知识Ki与各查询向量的匹配度。由于岗位B1下各项知识重要性相等,实验结果等同于不考虑岗位知识重要性的LSI法。
由表1可知,查询文本向量与某份知识的词频向量越相似,则匹配度就越高,如第四行,当所有特征词均放入查询文本时,5份知识与查询文本的匹配度均大于0.2,文档均能成功匹配,说明LSI方法的有效性。
表1 知识匹配度与查询文本向量的关系
(三)岗位变换的影响分析
保持以上实验中其他参数不变,将用户分配的岗位由B1更改为B2,实验结果如表2所示。表2中各列的值表示知识 Ki与各查询向量(1,1,0,0,0,0)T的匹配度。
表2 知识匹配度与岗位分配的关系
由表2可见,更换用户分配的岗位,知识匹配度发生变化,这表明匹配的知识会随用户的岗位变动而变动,既说明了匹配方法的合理性,也证实了方法满足企业岗位轮换的需求。
四、结语
在生命周期成本知识库的应用过程中,考虑知识在控制生命周期成本作用的重要性差异,且轮岗常态的特点,提出基于生命周期成本理论的知识匹配方法。建立岗位知识重要性的数据表,利用LSI模型形成隐性语义空间,在隐性语义空间中计算查询向量和知识文档的相似度,结合用户查询时的所在岗位、岗位知识重要性计算查询与知识文档的匹配度,实现知识匹配和推送。实验表明该方法的有效性和可用性,可为企业知识库的应用提供参考,后续工作可围绕如何基于生命周期成本理论更好确定岗位知识重要性展开研究。