APP下载

数据挖掘技术在科技项目评审专家遴选系统中的应用

2016-05-14洪英汉

电子技术与软件工程 2016年6期
关键词:数据挖掘

摘 要本文分析传统科技项目评审专家遴选过程存在不足等问题,提出了利用数据挖掘技术的聚类、关联、推荐等方法来辅助系统,实现科技项目评审的客观、公正、公平、公开为目的。系统主要围绕“政策-项目-专家-评估”全过程的模式,一方面提高了系统的科学性,另一方面降低了科技管理人员的工作难度。未来系统的模型研究将通过程序实现,应用到科技服务平台系统。

【关键词】遴选系统 数据挖掘 智能推荐

1 科技项目评审系统的研究背景及意义

1.1 研究背景

随着科学技术的持续发展和社会的不断进步, 各类科学技术研究项目的申报数量也越来越多,某省科技计划项目的申报书从2007年的7344项,上升到2013年的13477项。 科技项目公平评审是科技计划管理工作的重要环节之一,如何实现科技项目评审的客观、公正、公平、公开,对于这些项目评审的主体——评审专家的遴选及其评审行为的科学性就显得尤为重要。既要适应众多科技申报项目又要保证公平评审是目前科技管理部门遇到的管理难点。

传统的科技项目评审体系无法满足当前科技评审的需求,主要表现在:项目评审体系制度陈旧、科技评审项目的数量多、时间短、专家遴选的不科学性、系统无法识别评审专家与评审项目之间的关系等现象。这些现象严重影响了政府管理科技工作的健康、可持续发展。

1.2 系统研究的意义

(1)大力促进政府管理科技工作的健康可持续发展;

(2)保障科技项目评审专家的遴选工作的客观、公正、公平、公开;

(3)节省评审专家遴选环节的人力物力,为公平评审提供快速指引;

(4)以公平手段促使科技人员积极申报有价值的课题,为国家的政治、经济、科技、社会发展提供更好的理论和技术支撑。

2 专家遴选系统的方案设计

2.1 平台环境的总体情况

本项目的主要运行环境如下:

(1)操作系统:Windows Server 2012;

(2)编译语言:Java7.0;

(3)Web服务器:Tomcat7.0;

(4)数据库:MySQL5.5;

(5)数据挖掘工具:Mahout 开源工具。-

2.2 模型过程的描述

2.2.1 基础数据

(1)科技项目基础信息:包括科技项目的名称、关键字、专项资金类别、申报单位、项目成员、内容摘要……等信息;

(2)专家基础信息:姓名、职称、职务、所属领域、所在单位、身份证号码、毕业学校、毕业专业、研究项目……等信息;

(3)项目评审全过程日志信息:评审开始时间、评审结束时间、子项评审时长

(4)项目评审得分明细表:子项评审开始时间、子项评审结束时间、子项得分情况

(5)科技项目政策权重信息:重点支持领域、支持区域、支持数量、支持资金、支持人员……等信息。

2.2.2 挖掘模型

(1)专家信息知识表示图:提取专家的毕业专业、研究项目和从事领域,结合专业领域知识库,通过聚类算法架构出专家信息知识表示图。

(2)申报项目信息知识表示图:提取项目申报名称、关键字、内容摘要等信息,结合专业领域知识库,通过知识发现算法架构出申报项目信息知识表示图。

(3)项目-专家信息知识关联图:提取项目名称、关键字、摘要结合专家的毕业专业、研究项目和从事领域等信息,通过关联规则和相似度计算算法架构出政策权重图。

(4)专家-申报人科技社交网络图:提取科技专家信息知识表示图,对评审专家及申报项目成员进行关联规则算法挖掘,深度构建专家-申报人科技社交网络图。

(5)项目评审全过程日志-得分评价图:提取项目评审日志,结合得分明细表和专家-申报人科技社交网络图,通过异常评分补偿修正算法得出评价模型。

2.2.3 管理过程

(1)获取项目信息功能:从系统中获取本次需要评审的项目,项目按照领域方向分类。

(2)智能推荐专家功能:基于专家信息知识表示图、申报项目信息知识表示图、专家-申报人科技社交网络图、项目-专家信息知识关联图,通过内容推荐算法和关联规则算法,推荐相应的专业领域专家评审项目。

(3)专家评审质量评价库功能:基于项目评审全过程日志-得分评价图、专家信息知识表示图、专家-申报人科技社交网络图,实时登记评审评价结果,把评价的结果存入数据库,为以后的项目评审专家遴选提供数据参考。

2.3 模型总体设计图

本项目在传统的评审专家遴选系统基础上,利用新兴的数据挖掘算法关键技术,结合科技评审管理方法,提出了基于数据挖掘技术的科技项目评审专家遴选系统。它包括基础数据、数据存储、挖掘模型、管理过程四个阶段,如图1所示。形成了“政策—项目—专家—评估”全过程的智能化专家评审遴选体系。

3 总结

本文提出了数据挖掘技术在科技项目评审专家遴选系统中的应用模型,通过分析科技评审项目全过程的需求分析,融合了众多数据挖掘的算法,提炼并整合出适合系统的算法模型。模型重点四个环节:基础数据层搭建了数据的基本机构;数据存储是基于HDFS的大数据云存储;挖掘模型把专家、申报人、项目之间的关联起来;管理过程最终给出智能处理的结果供系统管理参考。在今后的工作中,将算法模型通过程序实现出来,在实际项目中应用,多方位测试,保证项目符合管理者的要求。

参考文献

[1]陈平华,陈传瑜,洪英汉.一种结合关联规则的协同过滤推荐算法[J].小型微型计算机系统,2016(02).

[2]黄敏.科技项目专家推荐系统研究[D].浙江:杭州电子科技大学,2012.

作者简介

洪英汉(1984-),男,广东省潮州市人。硕士研究生学历。现供职于韩山师范学院。研究方向为云计算、因果关系发现、推荐系统。

作者单位

韩山师范学院 广东省潮州市 521041

猜你喜欢

数据挖掘
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
数据挖掘的分析与探索
数据挖掘技术综述与应用
基于GPGPU的离散数据挖掘研究
利用数据挖掘技术实现LIS数据共享的开发实践
高级数据挖掘与应用国际学术会议
高级数据挖掘与应用国际学术会议