一种改进的组合策略评审专家推荐算法
2021-02-06张高明张善从
张高明,张善从
(1.中国科学院大学经济与管理学院,北京 100190;2.中国科学院空间应用工程与技术中心,北京 100094)
当今世界正在经历一场更大范围、更深层次的科技革命和产业变革[1],在此背景下,科技创新正加速推进,并深度融合、广泛渗透到人类社会的各个方面。为抢占科技制高点、引领未来,同时巩固国防和改善民生,各国政府、巨头公司纷纷投入巨大资金发展科技[2],滋生出大量的跨领域、多学科交叉的重大科技项目,如载人航天工程、物联网、天地一体化信息网络、集成电路装备项目、港珠澳大桥工程、FAST 工程、脑科学与类脑研究等重大科技项目。近年来,国家在重大科技项目的投入呈现逐年增加的态势,随之带来的是重大科技项目的种类、数量和复杂性也不断增加[3],如何对重大科技项目进行高效管理面临重大挑战。长期以来,项目评审已成为高科技领域主要的工作模式,选择合适的评审专家尤为重要[4]。
1 问题提出
在项目管理的知识体系(Project Management Body of Knowledge,PMBOK)中,项目评审已成为标准的工作模式。选择评审专家的需求首先导致了专家库的产生,最初的专家库往往包含很少的属性信息[5],如专业领域、单位、联系方式等,当时的评审专家数量也比较少。随之自然语言技术的兴起,逐渐形成了基于内容特征、主题特征和协同过滤的为代表的单一策略的推荐算法[6]。这些推荐算法在电商领域取得了较好的结果,然而在高科技领域,评审专家推荐往往是一个复合型目标的选择过程,不仅考虑专家的知识维度,还要考虑评审专家的政治立场、沟通交流、健康状况和职业道德等综合因素[7],在实际过程中,单一策略的评审推荐算法往往不能满足管理需要,也存在数据稀疏、冷启动等计算问题[8]。因此为满足特殊应用场景下的评审专家推荐,本文构建了一种改进的组合策略评审专家推荐算法。
2 算法构建
2.1 用户偏好维度
项目管理人员是评审专家推荐算法的用户,在多次选择评审专家的管理过程中形成了一定的选择偏好,本文结合自身在工程项目管理选择评审专家的实习经验及与相关资深项目管理人员交谈的基础上选择用户偏好维度,分别由评审专家的健康状况、年龄状况、政治立场、道德品质、专业声誉、职业精神、合作能力和特殊关照等8 个因素组成,如表1 所示。
表1 用户偏好维度评价体系
2.2 专家知识维度
本文对评审专家的知识能力综合评价结合了显性知识和隐性知识两个维度[9],综合评价体系共计2 个维度、15 个元素和45 个指标,其中显性知识维度包含了论文、专著、译著、教材、研究报告、专利、标准和条例等8 个因素,隐性知识维度包括了职务、职称、学历、人才培养、国家级项目、省部级项目和地市级项目等7 个因素,每个因素又分为若干指标进行定量分析[10],如表2 所示。
表2 专家知识维度评价体系
表2 (续)
2.3 历史信息维度
历史信息维度包括项目的历史属性信息和专家历史表现信息,而属性信息又包括项目间的专业相似性信息和层次相似性信息[11],假设存在一个当前待评审项目和个历史项目的项目集其中表示当前待评审项目,且每个项目具有个特征,当前项目和历史项目的相似度计算步骤如下[12]:
步骤1:明确项目涉及的专业领域,如电子学、软件学、热学、会计等。
步骤3:分别计算当前项目和历史项目专业领域的相似度大小,相似度大小的计算公式如1 所示。
步骤4:明确项目层次的度量维度,如专家人数中的院士、高级职称、中级职称、初级职称的数量等。
步骤6:分别计算当前项目和历史项目层次水平的相似度大小,计算公式如(2)所示。
步骤7:计算当前项目和历史项目的综合相似度,计算公式如(3)所示。
2.4 改进的组合算法
综合考虑用户选择偏好维度、知识维度和历史信息维度,构建了一种改进的组合策略评审专家推荐算法[13],首先,根据评审项目选择偏好维度的具体因素并计算偏好值,排除偏好值较低的一部分专家,其次计算知识维度的专家和项目的匹配度获得topK的评审专家,再者利用项目的历史信息和专家历史表现信息计算匹配度同样获得topK 的评审专家,最终,将两个推荐结果的交集和知识维度匹配度较高的专家作为评审推荐专家[14]。算法原理如图1。
图1 改进的组合推荐算法原理图
3 实验分析
3.1 实验数据
3.1.1 评审专家数据
本文采用网络爬虫和人工的方式收集专家信息及数据,专家来源于相关政府、研究机构、高等院校和企业等机构[15],本文对专家信息按照显性知识维度、隐性知识维度、用户选择偏好维度及专业领域维度进行整理,其中显性知识维度包括学术论文、专著、译著、教材、研究报告、专利、标准和条例等8 项内容,隐性知识维度利用专家的项目、职务、学历、人才培养、项目等因素进行测量相对性的大小,用户偏好维度包括专家的建立状况、年龄状况、政治立场、道德状况、国籍状况、人才层次、职业精神、合作能力、特殊关照和性别等8 项因素,针对航天范围的专业领域包含了热学、结构学、电子学、六性、软件、工艺、元器件、材料、金属、空气动力学、轨道学、飞行控制学、质量、财务、保密、管理、法律等诸多领域。经过整理,评审专家库共计500名专家。
3.1.2 评审项目数据
本文收集了航天领域的评审项目文档100 份,其中历史评审项目50 份,人工合成项目50 份。每份项目文档的信息包括项目名称、关键词、摘要信息、项目专业信息、项目层次信息、参与项目评审专家的信用及评审表现,项目的关键词一般为3~8 个,摘要不超过1 000 字,项目的领域信息与专家的领域信息相对应[16],在航天项目方面专业领域热学、结构学、电子学等20 个专业领域,项目的专业信息通过参与的评审专家的专业领域进行表征,项目的层次信息通过参与评审专家的职称等级进行表征,专家在评审中的表现根据评审期间专家的贡献和评审之后项目的质量效果综合决定。人工合成项目是通过专家的显性知识中论文等合成,合成项目尽可能与历史项目的格式内容相一致。
3.2 文本预处理
3.2.1 分词和降噪处理
航天领域包含了较多的专业词汇,而专业词汇较大程度上代表了项目文档和专家文档的主要信息,为了提高分词效果,首先需要构建航天领域的自定义专业词典,具体做法是将2010 年1 月1 日至2019年12 月31 日期间发表的所有的航空航天领域论文的关键词去除重后作为自定义词库,共计5 072 个专业词汇。
本文分词工具采用的是基于Python 框架的Jieba分词工具,Jieba 分词工具对中文分词的效果较好并易于操作,Jieba 分词支持自定义词典和添加去停用词,支持精确模式、全模式和搜索引擎模式3 种分词模式,并且支持繁体字分词。分词后的语料库存在类似标点符号、无意义词、公有词以及近义词等噪声,这些噪声对文档的主干信息造成了干扰,因此需要进行降噪处理,主要方式是通过停用词库过滤掉与主干信息不相干的词汇,本文的去停用词库结合了百度去停用词和哈工大去停用词,并增加了一些航天领域的一些专有词汇,该类专有词汇属于常识词,去除后不影响项目和专家文档的主干信息,如地球、火箭、月球、航天等,经过整理常识词汇共计102 个。
3.2.2 文本特征处理
本文的文本特征处理采用两种比较成熟的方式[17],分别为TF-IDF 算法和LDA 模型,其中,TF-IDF 算法的思想是抽取项目的关键词汇信息,同时降低共有词的比重,而LDA 模型通过概率模型获取潜在的主题信息,二者均是对显性知识的信息提取,在分词阶段的处理过程是一致的。将文本特征处理后获得文本向量[18],通过计算文本相似度的大小作为评审专家推荐的标准,文本相似度的计算受到向量维度大小的影响,维度过高造成计算的时间复杂度过高,没有必要保留一些权重较小的词汇或者主题信息,如果维度过小,反而易造成关键信息的缺失。因此文本的策略是分别选择不同维度的值进行计算,并对综合的推荐结果进行比较。在TFIDF 算法中,本文选择维度值为50、100、150 和200进行计算。在LDA 模型中,本文选择主题词个数分别为20、40、60 和80 进行计算,并比较推荐结果。
3.3 实验设计
3.3.1 实验环境
本实验所使用的硬件设备为联想ThinkPad 笔记本电脑一台,操作系统为64位Windows10家庭中文版,处理器为intel(R) Core(TM) i5-7300HQCPU @ 2.50GHz,机带RAM 为8.00GB,软件程序基于Python3.7 版本实现。
3.3.2 具体设计
为了验证文本设计组合策略评审专家推荐算法的推荐效果,文本设计了5 个实验分别对真实项目和人工合成项目的推荐效果进行验证,其中组合策略的推荐算法是本文设计思想的体现,以4 个单一策略的推荐算法作为对照实验,以下实验的K 值设置为15。
实验一:基于内容特征的评审专家推荐实验
将经过文本预处理后的语料通过TF-IDF 算法进行文本特征化,将TF-IDF 的值从大到小排序,分别设计维度为20、50、80、100、200 的文本向量,通过计算项目文本向量和专家文本向量相似度的大小,获取TopK 的推荐专家。
实验二:基于潜在主题特征的评审专家推荐实验
将经过文本预处理后的语料通过LDA 模型进行文本特征化,分别将主题的个数设置为5、10、20、30、50,依据主题概率设置文本向量,通过计算项目文本向量和专家文本向量相似度的大小,获取TopK 的推荐专家。
实验三:基于协同过滤的评审专家推荐实验
通过构造项目间的属性特征向量,计算当前项目与历史项目的相似度的大小,按照相似度值从大到小的顺序获取TopK 的推荐专家。
实验四:基于内容和协同相结合的评审专家推荐实验
构造项目的内容特征向量和属性特征向量,分别计算当前项目和历史项目的内容相似度、属性相似度,通过线性求和的方式获取项目的综合相似度,按照相似度值从大到小的顺序获取TopK 的推荐专家。
实验五:本文组合策略的评审专家推荐实验
通过构建用户偏好评价体系,对评审专家进行评价,排除得分较低的评审专家,在此基础上综合项目的内容相似性、主题相似性、项目相似度、专家历史表现等因素,获取TopK 的评审推荐专家。
3.4 结果分析
通过对以上的5 个模型在真实项目和人工合成项目两类数据集上进行实验,评价标准采用精确率、召回率和F1 值,对每个实验都进行了参数优化,将模型的最好的实验效果统计如表3~表5 所示:
表3 几种推荐算法的实验结果(精确率)
表4 几种推荐算法的实验结果(召回率)
表5 几种推荐算法的实验结果(F1)
通过实验结果可知,本文构建的基于组合策略的评审专家推荐策略在准确率、召回率和F1 值的表现均好于其他几种推荐算法,实验结果表明文本构建的算法模型具有可行性和有效性。相比于其他的评审专家推荐算法,本文的算法考虑了更多的因素,不仅考虑了专家和项目之间的知识匹配性,而且考虑了项目间的相似性、项目管理人员的选择偏好以及评审专家的历史表现等信息,该组合算法集中考虑了项目管理人员的多重需求,因此算法推荐的结果与人工标注的结果更接近。
4 研究结论
在高科技项目管理的多重目标约束下,基于单一策略的评审推荐算法的推荐结果无法完全匹配多重的评审需求,尤其是无法满足用户的选择偏好,造成推荐效果较差。另外专家的历史表现信息也是检验专家技能的重要因素。实验表明,文本综合用户偏好、知识匹配和历史表现构建的改进的组合策略的评审专家推荐算法具有可行性和有效性。