APP下载

面向船舶试航问题的技术知识超网络专家推荐方法

2022-02-19吉永军蒋祖华黄咏文刘建峰

计算机集成制造系统 2022年1期
关键词:对象专家船舶

吉永军,蒋祖华+,黄咏文,刘建峰

(1.上海交通大学 机械与动力工程学院,上海 200240;2.上海外高桥造船有限公司,上海 200137)

0 引言

试航是船舶在交付使用前至关重要的环节。新船试航前,很多系统和设备没有进行调试,无法保证它们处于正常工作状态,存在大量的事故隐患[1]。在试航过程中,这些具有事故隐患的问题一旦出现,需要及时地找相关专家解决问题,保证船舶试航的安全性。因此,研究面向船舶试航问题的专家推荐方法,并及时、准确地推荐合适的专家来解决试航过程中的特定问题,是极为必要的。

目前,专家推荐技术已经广泛应用于企业组织和在线社区,包括MediaWiki平台下知识审阅的专家推荐[2]、Q&A论坛用户推荐系统[3]、学术文章审稿人查询系统[4]、特定疾病医生查询系统[5]等。根据专家推荐技术种类的不同,可以将专家推荐技术分为基于知识内容的专家推荐方法、基于社交网络分析的专家推荐方法、混合专家推荐方法3类。研究早期,专家推荐技术是在企业组织内部结构化、规范化基础上对高质量知识库进行研究,大多数学者均基于知识内容评估专家在特定领域的技术能力[6-9],主要通过文本挖掘技术从专家关联文档中提取特征来定义用户的专业能力,利用相关方法如模糊逻辑[10]和向量空间模型[11]计算用户需求与专家技术能力的相关性,并根据相关性对专家进行排名,向目标用户推荐最佳候选专家。随着社交网络分析技术的发展,相关研究发现社会网络分析有助于专家推荐技术研究[12],专家推荐技术研究的范围从企业组织扩展到在线社区[13]。ZHANG等[14]基于Java在线论坛构建了社交网络模型,提出基于社交网络模型的PageRank用户推荐算法,并验证了该算法在知识论坛的优越性;ALAM等[15]考虑用户的评级和社交网络分析方法,开发用户动态信誉模型,在社区问答平台中推荐合适的专家。但是,这些基于社交网络的算法只能应用于在线社区中查找专家,无法找到特定主题的专家。近年来,专家推荐研究逐渐趋向于知识内容、社交网络信息等多方面特征信息融合研究。ZHOU等[16]设计了一个主题概率模型,将用户之间的社交关系和主题相似性融合到统一框架下进行专家查找;LIU等[17]综合考虑用户主题相关性、声誉、权威度进行专家查找;NESHATI等[18]综合考虑主题相似性、新兴主题、用户行为和主题转换4个特征,提出一个学习框架来预测在线社区未来的专家排名;XU等[19]通过用户的专业知识和社会信息融合构成复杂的异构网络,提出一种基于异构网络的方法来推荐相关学者。

3类方法在企业组织和在线社区的应用中各有所长,企业组织中的专家推荐研究主要基于知识文档相关性等方面进行专家推荐,大多数专家推荐方法适用于信息质量高且知识层次分明的组织[19]。由于在线社区的信息质量远低于组织中的信息质量,在线社区的专家推荐研究主要基于知识主题相关性、社会网络结构特征等方面[2,12]。大多数专家推荐技术都依赖于知识相关性来评估专家在特定问题的专业水平[12,19,20]。

然而,船舶试航问题的专家推荐涉及不同实体(如,技术专家、问题对象、技术问题、问题情境等)以及实体之间的各种关系(如,技术专家与问题对象之间的关系、技术专家与技术问题之间的关系等),实体之间的关系能够反映技术人员的专家专业知识或社会关系,例如:滑油日用系统和主滑油泵两个对象存在一定的关联性,则解决滑油日用系统的专家具有一定的可能性来解决主滑油泵出现的问题。但在船舶试航问题中,这些已有的专家推荐方法难以将不同属性以及属性之间的各种关系整合到统一框架中,无法深层次地刻画各知识属性与技术专家之间关系,从而导致船舶试航问题中的专家推荐准确率不高,无法满足船舶试航问题解决过程中专家查找的高精度要求。

因此,本文在综合考虑已有专家推荐方法优缺点的基础上,针对船舶试航问题解决过程的特点,利用超网络搭建各知识属性与技术专家之间的关联关系,将船舶试航问题涉及的技术专家、技术对象、专业知识等信息整合到统一框架中,提出一种基于技术知识超网络模型的专家推荐方法,降低船舶试航问题的专家查找难度,提高专家推荐的准确率,及时、准确地推荐最合适的专家列表,解决船舶试航过程中出现的问题,以保证船舶试航的安全性。

1 面向船舶试航问题的技术知识超网络专家推荐方法

1.1 船舶试航问题

船舶试航问题的解决过程是技术知识形成的过程。为解决船舶试航中出现的问题,工程师会对发生的问题信息及问题情境信息进行详细地描述记录;造船企业会依据试航问题中的技术对象、问题信息及问题情境信息在企业中查找相关的技术专家;在解决试航问题的技术活动中,技术专家会针对技术对象、技术问题信息以及问题情境信息进行分析,提出详细的解决方案,并形成一则技术知识文档存入到造船企业知识库中。如图1所示为从某造船企业获取的一则技术知识文本,该文本中存在大量与试航问题相关的描述性信息,这些信息以自然语言的形式分布在技术知识文本中,如“燃油澄清舱的油不断溢流”、“溢流至燃油泄放舱”等。此外,技术知识文本也包含大量问题解决方案的信息和一些无意义的信息。

船舶类型158K COT问题编号M3-1025关键字燃油澄清舱 预压阀技术人员王传明 杨 勇 周 海问题名称:燃油澄清舱的油不断溢流。简述:试航前燃油大舱加油800 t,高度8 m,燃油澄清舱在机舱二甲板,仓高5.8 m,溢流管高度5 m。试航过程中,转油结束后出现燃油澄清舱的油不断溢流至燃油泄放舱。解决措施:将燃油输送泵出口的阀更换为预压阀,压力设定略大于燃油大舱与燃油澄清舱的高度差,使得燃油澄清舱的油位只能通过输送泵补给。相关图纸: 修改前修改后启示:对油舱布置要考虑使用情况,深入分析系统使用的功能性,试航过程中,重点关注燃柴油系统。

考虑技术知识文本中船舶试航问题解决过程所需的信息及先前工作[22-24]中的技术知识(TK)元素,船舶试航问题解决过程中形成的TK通常采用5个基本属性来描述技术知识的核心特征,包括技术专家(TE)、技术对象(TO)、技术问题(TP)、问题情境(PC)、解决方案(TS)。其中:TO、TP、PC构成试航问题的详细信息,TP、PC、TS是技术知识的核心内容(Main Content, MC)。因此,以TK=〈TO,TP,PC,TS,TE〉的形式对TK进行结构化描述,各属性的内涵如下:

(1)技术对象(TO):发生技术问题的具体对象,如燃油澄清舱;

除了这些哺乳动物之外,还有一种神奇动物多次在纽特身陷囹圄时帮上大忙。那就是外型看起来像植物的“护树罗锅”。在魔法世界,护树罗锅是一种守护树木的动物,长着两只褐色的小眼睛,性情平和、极其害羞,但是如果它所栖身的那棵树受到威胁,它就会一跃而下,奋起反抗。

(2)技术问题(TP):描述出现的特定技术问题;

(3)问题情境(PC):描述技术问题所发生的具体环境、原因、过程等信息;

(4)技术方案(TS):解决技术问题的措施、操作步骤和难点;

(5)技术专家(TE):所有参与解决问题的技术人员。

可以看出,船舶试航问题是由技术对象、技术问题、问题情境3个属性构成,造船企业若能够依据技术对象、技术问题以及问题情境信息,在企业知识库中快速、精确地查找到解决问题的技术专家,将具有很大的价值。

1.2 技术知识的规范化表征

(2)基于技术知识超网络的专家推荐 提取试航问题的技术对象、技术问题和问题情境3个属性特征,利用超网络中贝叶斯(Bayesian)推理方法计算技术专家与试航问题的相关度,并向用户推荐相关度高的技术专家,以满足解决试航问题的专家需求。

为了避免在TP,PC,TS属性中提取到“试航”、“现象”等常见但刻画技术知识无明显意义的词,本文对技术知识文档进行文本预处理,计算技术知识文本中每个词的TF-IDF权重,保留不超过10个权重最大的名词[21],填入TP,PC,TS属性中,技术专家、技术对象中的信息直接填写到TE、TO属性中,形成TK=〈TO,TP,PC,TS,TE〉规范化表示形式,如表1所示。

表1 抽取的技术知识

续表1

经过技术知识的规范化表征,过滤掉大量无关信息,仍然能够保留技术知识文本中的关键概念,如图1的原始文本和表1的规范化表示结果中,燃油澄清舱、机舱、溢流管等关键概念仍然保留在对应的属性中。

1.3 基于技术知识超网络的专家推荐方法框架

本文提出的专家推荐方法包括技术知识超网络模型构建和专家推荐两部分,如图2所示。

(1)技术知识超网络模型构建 基于规范化表征的技术知识和计算技术问题解决过程中技术专家之间的关联度、技术对象之间的关联度、知识核心内容之间的关联度,构建专家子网、对象子网和知识子网;利用TO,TP,PC,TS,TE共同作用形成的超边构建技术专家、技术对象、知识核心内容之间的关联关系,计算子网之间的超边关联度,从而形成技术知识的超网络模型。

从企业技术部门收集相关的技术文档,将包含技术问题、技术对象、问题情境、技术方案、技术专家属性的文本和其他不需要的文本信息分离开,形成多属性结构化的技术知识文本。这种技术知识文本依然存在大量无意义的信息,不便于计算机的自动处理。为过滤掉文本中对刻画技术知识无意义的信息,便于计算技术知识超网络中不同知识属性之间的关联性,对技术知识属性信息进一步精炼。

2 方法的具体实现

2.1 技术知识超网络模型构建

面向船舶试航问题的专家推荐是基于试航问题的技术对象、技术问题、问题情境3个属性进行的技术专家推荐,而传统的专家推荐方法没有综合考虑问题对象、技术问题、问题情境与技术专家的相关性,导致船舶试航问题中的专家推荐准确率不高。超网络建模能够描述同质网络节点之间的关联关系和异构网络节点间的映射关系[26]。因此,通过利用技术知识超网络模型构建船舶试航问题解决过程中的知识属性之间的关系,刻画各知识属性与技术专家之间的相关性来提高船舶试航问题中专家推荐的准确率。

技术知识超网络模型构成属性主要包括TE、TO、MC,其中MC=〈TP,PC,TS〉,各属性之间的关系通过TE、TO、MC共同作用形成超边进行连接。超边(HE)表示一个技术问题解决的技术活动,即一则技术知识表示一条超边。3种属性构成关联关系:在技术活动中,技术专家在处理技术对象问题的技术活动中产生了技术知识的核心内容。由以上3种属性构成技术知识超网络模型的3层子网络,分别是专家子网、对象子网、知识子网。

(2)对象子网No是由技术问题中各技术对象Vo及其关联关系Eo组成的有向加权网络,连接两个节点的边表示技术活动中解决两个对象问题的专家之间关联度。例如:滑油日用系统→主滑油泵两个对象的关联度为0.9,表示解决滑油日用系统问题的专家与解决主滑油泵问题的专家存在一定关联性,其关联度为0.9。换句话说,解决滑油日用系统的专家具有90%的可能性能够解决主滑油泵出现的问题。

(3)知识子网Nk是由知识核心内容Vk及其关联关系Ek组成的无向加权网络,知识核心内容Vk是由技术知识属性TP、PC、TS构成,其关联关系Ek反映技术活动中产生两条技术知识内容的技术专家之间关联性。

现存资料中,吕温的文和赋并不多,但是其文体范围很广泛。吕温的文学思想,深受其师古文家梁肃“文本于道”“经世致用”等观点的影响,又与中唐文学运动中韩愈、柳宗元提出的“文以明道”观点紧密相连。吕温在二十几岁时,写下《送薛大信归临晋序》一文,提出自己的文学观点:

背景的解读是帮助学生理解作者的写作用意、理解作者所表达的中心思想的一项重要内容,也是锻炼学生文本解读能力的关键。但是,从目前的教学现状来看,很多学生常常忽略这一部分内容的解读,导致在分析作者借助文本所传达的意思时会有所偏离。所以,为了改变这一现状,也为了真正提高学生的文本解读能力,在教学时,教师可以尝试着让学生借助课外资料或者是网络资料来了解“背景”,进而为学生解读能力的提高夯实基础。

知识超网络模型中3层网络之间的关联关系通过超边HE进行连接,HE由一个技术活动中多个专家、对象、知识核心内容构成,技术知识超网络模型H=(V,E),其中V=(Vs,Vo,Vk),E=(Es,Eo,Ek,HE)。专家子网Ns=(Vs,Es),对象子网No=(Vo,Eo),知识子网Nk=(Vk,Ek)。

工程勘探工作是建筑工程施行之前所必须要进行的工作,但是当前相关人员大多忽视了工程勘探的重要性,仅仅在勘探的过程中做表面工作,或者在勘探的过程中忽视了对土质的物理和化学指标的勘察,另外,在地质勘探过程中,布孔过于稀少或者深度不够都会造成勘探不准确的问题。

2.1.1 对象关联度计算

对象子网No的构建需要评估各技术对象概念之间的关联关系。领域本体能够较好地描述技术对象概念之间的关系[26],技术对象间的关联关系Eo蕴含在本体概念关系中,通过利用对象关联系数(ORC)和对象关联路径(ORP)计算对象Vo的关联度(OCD)。

定义1对象关联系数(ORC)。ORC反映了船舶试航过程中对象概念之间的关联关系,其关联关系反映解决不同对象问题的专家之间的关联度,取值范围是0~1。若是相同关系,则两个技术对象概念间的关系系数为1;若完全不相关,则为0。关联系数值越大,表明技术对象概念之间的关联关系越高,即解决前一个对象问题的专家具有更高的可能性能够解决另一个技术对象出现的问题。

根据技术专家和知识工程师调整试航问题的技术对象本体概念间的关联关系和关联系数,船舶试航问题的技术本体概念之间的关系包括相同关系(Same-as)、相似关系(Similar-with)、继承关系(Kind-of)、整体与部分关系(Part-of)等,其值如表2所示。如图3所示为“滑油日用系统”技术对象本体片段。

表2 对象本体间的关联系数

OCD(滑油日用系统,主滑油泵)=0.9;

(1)

定义3对象关联度(OCD)。设Oi和Oj是试航过程中的两个对象,从Oi到Oj之间存在ω条对象关联路径,即可能存在ω个关联关系系数乘积,其中最大的关联路径乘积称为对象关联度,即为Eo,

Eo(O1,On)=OCD(O1,On)=maxk=1,2…,ω

[RNumk(O1,On)]。

(2)

基于图3“滑油日用系统”本体片段,计算一些对象之间的关联度,例如:

菊芋生长高度在1~3 m不等,秋季开花,花如菊,黄色。叶子是椭圆形,多毛。根茎系统深埋于地下并且比较结实粗壮,叶子互生于茎的顶端,较低的叶子能够长30 cm,长而宽,中央是花头,5.0~7.5 cm,被茎分支下单独生出的侧花包围。多瘤的块茎在地下不均匀生长,其颜色有浅褐色、白色、红色等[1]。

OCD(主滑油泵,滑油日用系统)=0.7;

OCD(滑油系统,主滑油泵)=0.9×0.9=0.81;

OCD(滑油泄放系统,主滑油泵)=0.7×0.9×0.9=0.567。

2.1.2 知识核心内容关联度计算

TSSim计算两则TK中TS属性相似度,反映提出两个TS的专家之间的关联性。由于TS是概念集,可直接利用语义相似度进行属性关联计算。

基于技术知识网络需要评估各Vk节点间的关联强度。对两则规范化TK的属性TP、PC、TS进行关联性评估,通过线性加权求和的方式得到Vk间的关联强度。

(1)KACSim计算

由于TP,PC是概念集,可直接利用语义相似度进行属性关联计算。情境关联侧重于面向不同知识应用情境之间的专家关联关系,对此,采用式(3)进行计算,即:

KAC是描述技术知识中技术方案所应用的情境,包括技术知识的技术问题(TP)和问题情境(PC)。KACSim反映了根据两个KAC产生技术方案的技术专家之间存在一定的关联关系,即解决一个KAC问题的技术专家具有一定可能性解决另一个KAC的问题。对于KACSim,存在3种假设关系,具体如下:

(3)

(4)

(5)

(6)

(2)TSSim计算

知识核心内容Vk由技术知识属性TP、PC、TS构成,其关联关系Ek反映了产生两条技术知识内容的技术专家之间的关联性,其中TP、PC组成了技术知识的知识应用情境(KAC)[27],即KAC=〈TP,PC〉。

(7)

计算式(4)~式(7)中的技术知识属性KA(KA表示一个TP,PC,TS)的相似度,技术知识属性KA是由一组工程概念组成的概念集,即属性KA1={XS1,XS2,…,XSm},属性KA2={YS1,YS2,…,YSn},属性关联度

4.技术创新是系统发展的动力。长远来看,随着大数据、云计算、3S、自动驾驶、人工智能等新兴技术的快速发展与其在城市智能交通管理中的应用,我国必须重点发展本土创新技术。当前,我国智能交通管理系统的发展仍在依赖于国际成熟系统,如智能交通控制系统,我国主要应用英国SCOOT系统和澳大利亚SCAT系统。在发展创新技术中,不仅要重视软件系统的开发,也要重视基础设备的开发和创新性应用。选准突破口进行产业化,形成自己的技术创新力量,才能保持我国智能交通产业的健康可持续发展。

但是随着与菲莉斯恋爱关系的推进,卡夫卡对于婚姻带来的伦理关系和肉体关系的恐惧逐渐增加。在日记中他剖析自己“恐惧结合,恐惧失落于对方”[13]117-137,用他自己的说法,除写作之外,他几乎恐惧一切。

Rel(KA1,KA2)=

(8)

式(8)中的工程概念语义相似度

第三,大数据保护是财产权利和道德权利的结合。尽管美国法一直秉承实用主义,但在数据保护的研究中,学者们也广泛意识到道德权利的重要性。对道德权利的关照,大陆法系国家是具有法治传统的。大数据领域涉及海量个人信息,这些信息往往与个人身份有关,而大数据收集、共享、使用等过程都在个人不可控的情况下隐匿进行,倘若在大数据保护中不关照道德权利,个人身份利益保护将成为无稽之谈,因为大数据完全突破了传统民法保护的藩篱。因此,大数据保护立法必须体现道德权利与财产权利的结合。

CSSim(XSi,YSj)=

(9)

式(9)中,采用词语的标准化互信息(NMI)[21,28]计算技术知识文本库D中两个不相同且词义不同的词语word1和word2间的语义关联度

NMI(word1,word2)=

(10)

式中:p(word1)表示含有词语word1的技术知识文本在技术知识文本库D中所占的比例;p(word1,word2)表示同时含有word1和word2的文本在文本库D中所占比例;|D|为文本库中文本数量。

(3)Vk之间的关联度计算

问题设计:谈谈第三单元课文中让你印象深刻的一位父亲或母亲;诵读文中父母让你动情的语句;说说这些语句让你感动的原因。然后由学生总结细节描写的作用(可以全面展示人物性格,使人物形象更丰满,使作者情感流露得更真实细腻)。

(11)

对知识应用情境关联度赋权重α,技术方案关联度赋权重(1-α),α∈[0,1]。α值用来区分KAC和TS的重要性,由于船舶试航问题的属性仅包含TO和KAC,与TS无关,因此α赋值为1。

在中国传统文化中,牲畜是被认为很低贱的,常用来骂人,《资治通鉴·隋文帝仁寿四年》:“上恚,抵床曰:‘畜生何足付大事!”胡三省注曰:“今人詈人犹曰畜生。言其无识无礼,若马牛犬豕然,待畜养而生者也。”在众多牲畜中,驴被认为比其他牲畜更为低贱,也常用来骂人,例如蠢驴、犟驴等。

2.1.3 超边关联度计算

为利用技术知识超网络模型推荐相关专家,本文提出技术知识超网络中两项统计特征指标:

(1)节点超度dV(Vi)

ELISA实验用来检测MH7A细胞上清中炎症细胞因子IL-1β和IL-6水平,具体实验方案如下:收集处理好的MH7A细胞培养上清,12 000 r/min离心10 min,收集上清,按照GenStar ELISA试剂盒说明进行试验。

(12)

(13)

2.2 面向船舶试航问题的专家推荐

2.2.1 船舶试航问题的特征信息抽取

面对船舶试航过程出现的问题,试航人员将试航问题按照“技术对象—技术问题—问题情境”形式进行表示,然后对试航问题文本进行分词并计算TF-IDF权重,抽取技术问题和问题情境属性不超过10个权重最大的名词作为对应属性的特征,从而过滤掉文本中对刻画试航问题无意义的信息,而对于技术对象的内容直接作为该问题属性的特征信息。

2.2.2 基于技术知识超网络模型的专家相关度计算

(14)

2.2.3 基于技术知识超网络模型的专家推荐方法

第三个项目体现了医院各部门间的良好协同性,促进了节能项目的顺利开展。连续数月的数据显示锅炉运行时间延时之后,能源管理平台及时分析原因,发现是由于供应室任务量大、加班所致,对此拟定了数条解决方案。经过与相关部门的反复沟通,确定由总务处配合供应室进行清洗、蒸汽消毒设备增容改造,使得供应室工作流程得到优化,工作效率获得提高,锅炉供汽时间缩短2小时/天,蒸汽损失减少约159立方米/月。

如何利用技术知识文本构建的超网络模型准确地推荐与试航问题匹配的技术专家,是实现本文提出的专家推荐方法的关键。本文通过利用技术知识超网络模型进行专家推荐,其方法流程图如图5所示。具体步骤如下:

图8 为总氮的分析结果,由图8可以看出降雨开始时总氮为0.8mg/L,为Ⅲ类水体;降雨开始4小时后污染物浓度达到峰值1.4mg/L,为Ⅳ类水体;降雨开始6小时后,由于稀释作用,基本恢复为Ⅲ类水体。之后随着第二次降雨峰值的出现,水质有一定的恶化。总体而言,降雨径流对总氮的影响较小,一天中超过Ⅲ类水质时间约为6小时,降雨径流对总氮的浓度变化存在一定影响,但在可接受范围内。

输入:船舶试航过程中某条试航问题的技术对象O、技术问题属性特征集合TP、问题情境属性特征集合PC,以及船舶技术知识超网络H(根据造船企业中的知识文档库构建)。

输出:j个最匹配的设计专家s1,s2,…,sj。

步骤5按最终得分对技术专家降序排序,输出排名最高j个技术专家。

3 案例分析

本文的案例分析数据来自上海某大型造船企业,为保证上述方法的推荐效果和验证方法的有效性,在Core i7 CPU(3.6 GHz)、8 G内存、Windows10操作系统的计算机配置环境下,以Python语言执行专家推荐算法进行了两组实验。造船企业中资深工程师对专家推荐结果进行了评判和统计分析,对比分析不同参数下的专家推荐的准确率,以确定基于技术知识超网络模型的专家推荐(Supernetwork-based)方法中最优参数值(β,j);对比分析Supernetwork-based专家推荐方法与仅考虑文本内容相关度的专家推荐方法(Content-based)、知识相关度和专家权威度融合的专家推荐方法(REAU-based)的效果,以评估方法有效性。

3.1 实验数据

在企业技术知识文本库中抽取实验所用的技术案例,按照技术知识的属性内容并进行规范化表征,计算技术问题解决过程中知识属性之间的关联度,构建用于专家推荐实验的技术知识超网络模型,以船舶试航过程中10组试航问题作为输入进行实验分析验证。如表3所示为试航过程中出现的试航问题。

表3 试航过程中部分问题

续表3

3.2 方法有效性评估

实验1确定Supernetwork-based算法中的最优参数值,即阈值β值和推荐数量j值。准确率precision评估推荐结果的精确性,是衡量专家推荐性能的最常用指标之一。precision=TP/(TP+FP),对于给定的试航问题,TP表示被正确分到这个问题的专家数量,FP表示被错误分到这个问题的专家数量。

测试本文所提方法在不同阈值β值和j值的专家推荐效果,不同阈值β值和j值专家推荐的准确率对比采用P@j(前j项结果中的准确率)在10组专家查询实验中专家推荐准确率的平均值。测试实验结果如图6所示。

在图6的实验中,当β值逐渐增大时,Supernetwork-based方法能够推荐与问题更加匹配的专家;当专家推荐的准确率持续上升,Supernetwork-based方法能够推荐与试航问题更加匹配的专家,在β=0.6时达到较高的准确率。但当β值不变时,j值过高时,很难推荐足够数量与问题匹配的专家,从而影响用户的体验结果。阈值β值和推荐数量j值在某种程度上影响试航问题中的专家推荐效果,当β=0.6,j=10时,算法效果较佳。

实验2Supernetwork-based专家推荐方法与知识相关度和专家权威度融合的专家推荐方法(REAU-based)[3]、仅考虑文档内容相关度的专家推荐方法(content-based)[9]的推荐效果比较。REAU-based是一种面向MediaWiki平台的专家推荐方法,实验过程中对该造船企业MediaWiki平台数据进行筛选,保证与Supernetwork-based方法中的技术知识集一致,然后计算技术专家的知识水平与特定试航问题关键词的相关度以及专家在专家网络中的权威度并进行专家排序;Content-based是计算试航问题关键词与专家创建的技术知识文档主题的相关度并推荐相关度高的专家。

Supernetwork-based专家推荐方法的主要目的是提高专家推荐的准确率,因此设定Supernetwork-based专家推荐方法中问题相似度阈值β值为0.6,分别对3种专家推荐方法进行10组专家查询实验,选取前10位专家的准确度作为实验结果,测试实验结果如图7所示。

通过实验发现,技术知识超网络模型的专家推荐方法推荐准确率高于其他方法。另外,在实验过程中发现试航问题Q7、Q9、Q10利用Content-based方法几乎很难准确查询到相关专家,REAU-based方法查询专家的准确率较低,产生这一现象的原因是试航问题Q7、Q9、Q10在以往的试航过程中没有或者很少发生,很难在技术知识库中匹配到相关的技术知识文档或主题,无法搭建技术专家与特定问题的关联关系,使得Content-based和REAU-based方法在这一类试航问题中很难快速有效地查找到足够数量的相关专家;而Supernetwork-based方法在这一类试航问题中依然能够根据试航问题中的技术对象属性对专家相关度进行计算,其推荐准确率高于其他方法的推荐准确率。因此,从图7可以看出,Supernetwork-based方法在面向船舶试航问题的专家推荐中具有更好的推荐效果。

4 结束语

针对传统专家推荐方法的不足,本文综合考虑船舶试航问题解决过程中的信息需求及企业知识库中技术知识文本的结构特点,提出一种基于技术知识超网络模型的专家推荐方法,其特点为:①针对船舶试航问题的特殊性,利用5个属性来描述试航问题解决过程中形成的技术知识核心特征,抽取技术知识的属性内容并进行规范化表征,有效避免专家推荐过程中存在大量无关信息;②采用本体构建技术和语义相似度计算方法构建技术知识超网络模型,将船舶试航问题中的不同属性以及属性之间的各种关系整合到统一框架中,刻画各知识属性与技术专家之间关系,提高了船舶试航问题的专家推荐精确度;③通过利用超网络中贝叶斯推理方法计算试航问题中问题对象与技术专家之间关联度,有效降低船舶试航问题的专家查找难度。不失一般性,本文提出的方法也可用于其他复杂工程问题解决的专家查找,但存在一定先决条件:工程问题需要具有明确的问题对象,且在领域内建立了较为完善的对象本体概念间的关联关系。

因为技术专家网络具有无标度和小世界特性,这可能导致某些技术实力较强的专家会在多个问题中被同时推荐,但在实际问题解决过程中技术专家很难有大量的精力同时解决多个技术问题,所以实际应用中会影响问题的解决效率。下一步,将通过不同的船舶试航场景进行方法的应用验证,根据实际应用的场景调整超网络模型结构和参数,同时设置问题难度等级、专家水平等级以及扩充专家库,使本文提出的基于技术知识超网络模型的专家推荐方法能够考虑实际应用特点,更好地适应不同场景的专家推荐要求。

猜你喜欢

对象专家船舶
神秘来电
致谢审稿专家
《船舶》2022 年度征订启事
船舶!请加速
BOG压缩机在小型LNG船舶上的应用
攻略对象的心思好难猜
船舶压载水管理系统
基于熵的快速扫描法的FNEA初始对象的生成方法
请叫我专家
区间对象族的可镇定性分析