专家遴选系统设计与实现
2019-08-06陶砾刘恒初杨朔林勇
陶砾 刘恒初 杨朔 林勇
摘 要: 在实际应用中,根据关键词或者学科分类等方法不能找到合适的项目评审专家。文章通过对中文分词技术、相似度匹配算法、专家检索方法等的研究,对专家的论文、著作进行挖掘与分析,通过同义词分析和向量模型来计算专家著作与项目领域之间的相似性,并通过相似度计算方法将专家的研究领域与项目的学科领域自动匹配,从而达到准确地推荐项目评审专家的目的。
关键词: 专家库; 遴选; 中文分词技术; 专家推荐
中图分类号:TP317.1 文獻标志码:A 文章编号:1006-8228(2019)07-36-03
Abstract: In practical application, it is difficult to find appropriate project evaluation experts according to keywords or subject classification methods. In this paper, through the researches on Chinese word segmentation technology, similarity matching algorithm and expert retrieval method, expert's papers and works are mined and analyzed, the similarity between expert's works and project fields is calculated through synonym analysis and vector model, and the similarity calculation method is used to automatically match the research field of the expert and the subject area of the project, to achieve the purpose of accurately recommending experts for project evaluation.
Key words: expert database; selection; Chinese word segmentation technology; recommending expert
0 引言
从国家到地方,各领域各企事业单位都投入大量人力、物力开展科研和产业建设,在项目招标、申报、实施、验收等阶段,都需要组织专家进行评审。评审专家作为项目评审及成果评审的主体,他们的选择影响着这些项目评审、成果评审的客观性和准确性[1]。高质量的专家评审能够为项目质量把关,保障国家、企业的投资用到真正有益的项目上。而如何为项目招标、申报、验收等工作选定合适的评审专家是正确评价项目质量和提升项目风险管理水平的关键[2]。本文提出一种专家遴选的方法,通过对专家信息的挖掘分析并利用相似度计算方法匹配专家,使得系统能够精确的推荐相应的专家。
1 专家信息提取
专家信息提取主要包括对专家特征提取、项目资料特征提取。
⑴ 专家特征主要基于专家的论文、专利、著作等内容信息,文档来源比较丰富,包括了比单一文档更多的信息,是对专家各方面的全面标识,并在一定程度上反映了专家所研究的领域和水平[3]。
以专家文档为分析内容,使用中文分词技术对专家文档的标题、关键字、摘要、正文等进行分词,运用词频统计算法,计算每个词项与候选专家的相关度,将结果作为内容特征值存储起来,建立专家库[4]。
⑵ 项目资料特征提取,一般各种项目申报书、验收申请书都有固定的格式,因此,可以对科技项目申报书进行文本分块处理,并对其文本进行分析,建立项目资料特征库。
2 专家信息的分析及构建
在完成专家信息提取后,需要对已提取信息进行处理并构建相应的检索库,包括以下内容。
⑴ 同义词词典:通过同义词的获取能够搜索到更全面更准确的信息,利用模糊匹配实现关键词对应,故考虑使用二维数组来构造该词典。
在本系统中,同义词词典选择基于字符串匹配的分词方法,因为这种分词方法具有算法简单、运行效率高等特点。
⑵ 专家检索:针对专家检索,专家检索将专家作为实体检索的一个特例,利用能够表征专家专长的各种知识资源,包括网页、电子邮件、报告数据库文件等,识别专家在某给定查询的专长相关性程度,并按相关性程度高低排序返回专家结果列表的过程。
⑶ 专家回避:根据实际需要,主要通过专家库中标注的单位确认专家的同事关系,根据提交的相关项目资料确认项目合作关系,将专家与项目之间的关系分析识别并根据紧密程度予以合理量化,同时,根据不同的评审要求,设置评审阈值,根据值的高低采取回避措施。
⑷ 专家分组:根据专家库中的专家信息和专家特征值,以专家领域研究的相似度为基础,并结合专家分组的互斥规则进行专家的自动分组功能[5]。
通过对专家的研究论文等著作进行挖掘与分析,计算专家著作与项目领域之间的相似性,将相似度高的专家研究领域与项目学科领域自动匹配,再结合一定的抽取规则和回避规则,最终可构建一套可面向各领域项目评审的匹配度高的专家遴选库。
3 专家遴选系统的设计及分析
3.1 专家信息
专家若已注册,则直接登录,否则需要注册,其注册流程描述如下。
⑴ 姓名:请输入您的姓名。
⑵ 证件类型:有三种类型可选,分别是:身份证、军官证、护照。
⑶ 身份证(军官证、护照)号码:正确输入对应类型的证件號码。
⑷ 手机号:输入您的11位手机号。
⑸ 用户名:请正确输入您的用户名(字母开头,可填写字母、数字加下划线)。
⑹ 密码:请输入您的密码,密码长度不能少于6位。
⑺ 重复密码:重复输入您的密码,保证两次输入的密码一致。
⑻ 专家地区:请选择您是省内/省外专家。
⑼ 工作单位:点击“选择”按钮,右侧会出现选择单位框,分两种搜索方式,按名称查询选择和按单位层级选择,按名称查询选择支持模糊搜索,选择好后点击“确认单位”按钮,如果没有找到单位请选择“新增单位”按钮,按照提示完善单位信息。
⑽ 验证码:点击发送验证码,系统将往您的手机发送一条信息,将信息中的验证码在120秒内输入,若您的手机没有接收到信息,请等待120秒后重新点击发送验证码按钮。
⑾ 专家基本信息填写完成后,点击“注册”按钮,系统提示“基本信息注册成功”后,跳转到专家详细信息填写界面。其界面如图1所示。
在完成基础信息的录入后,需要填写专家的特征信息,包括专家的详细信息和特征信息,在系统后台会将专家信息和特征信息进行分析,并通过分词和语义模糊化,将特征信息载入专家库中,专家特征信息录入界面如图2所示。
3.2 专家库管理
在专家库管理模块中管理员可以对专家库相关信息可以进行直观的查看统计,包含子库建设情况,省内外,区域,年龄,专家类型的图表统计。统计可以通过数据表格形式和图样形式展示,图样形式如图3所示。
专家库除提供图形化显示外,还能够对专家进行分组。将专家细分为子库后,可设置对应类别的满足条件,筛选满足条件的专家,本系统不仅可以手动分配专家子库,还可以配置对应的业务领域的满足条件,系统根据设置的领域条件筛选专家进入相应的领域分组中。若自动划分专家不符合条件,可以管理该分组中的专家信息,进行相应的补充或者移出分组等操作。专家库在存放专家领域信息的同时,还能够对专家进行评审信用进行查询和管理。
3.3 专家评审配置和抽取
当抽取专家时,可设定抽取条件,进行手工筛选和抽取操作或系统更新设定的关联评审项目,实现系统自动抽取专家并通知专家参加评审。抽取过程中全程自动处理,避免人工干预。在选择专家评审模式后,可配置短信模板,可针对不同情况配置短信模板。当评审结果为平票时,本系统还支持多轮评审,直至票选出最优项目。
3.4 后台监控进度
管理员可以通过后台监控模块对专家评审结果进行实时的监控分析,该界面显示所有在评项目,支持对单个项目进行状态监控,在屏蔽掉专家基础信息后仅显示评审的进度,保护了在评专家的隐私信息。其总监控界面如图4所示。
4 结论
本文通过对中文分词技术、相似度匹配算法以及专家检索方法等进行研究,实现了专家遴选系统的设计,以达到准确地进行专家推荐的目的,最终建设一套可面向各领域项目评审的匹配度高的专家遴选系统。本项目的研究应用能够为各种项目评审工作遴选出研究领域匹配度高的专家,保证项目评审的有效性和权威性,保证评审活动公平公正合理的进行。解决专家关键词标注不规范、匹配不精确等已有专家遴选系统存在的问题。
参考文献(References):
[1] 高琢玉.基于多目标决策的专家遴选算法的研究[D].中南大学博士学位论文,2011.4.
[2] 王嘉鹏.农村信用社信贷项目评审专家智能管理软件的设计与实现[D].电子科技大学硕士学位论文,2014.9.
[3] 郑义平.基于非结构化数据的专家综合评价技术研究与应用[D].广东工业大学硕士学位论文,2014.10.
[4] 陆伟,韩曙光.组织专家的检索系统设计与实现[J].情报学报,2008.27(5):657-663
[5] 杨艺,余鲁.精品课程智能评价系统设计[J].重庆工商大学学报(自然科学版),2013.30(10):96-102