基于大数据的兵团科技创新服务云平台的研发
2016-08-31李晓明兵团第十二师网络信息中心
李晓明兵团第十二师网络信息中心
基于大数据的兵团科技创新服务云平台的研发
李晓明
兵团第十二师网络信息中心
本文拟以科技主管部门、企业、科研人员需求为研究方案,以定制服务为研究重点,为研究对象的精细化管理提供帮助,使各部门的领导在需要科技数据时,不是到处查证,而是根据权限自动提供,使一切科研相关的资料都有据可查,有据可依,并且通过自动感知,定制服务等个性服务,让使用者,快速找到自己需要的科技信息。
1 兵团科技创新服务云平台模块建立
1.1科技管理中的智能感知模型的创建
随着云计算和互联网技术的发展与广泛应用,以大规模服务器集群作为存储介质,以高速互联设备作为传输载体,以服务计算和社交元素为基础的开放式的因特网分布式资源已经成为世界上数量最多、种类最为丰富的信息资源[1。因此,如何在分布式信息源中针对特定科技信息资源,采用开放式的系统以自动或半自动的方式感知、采集、跟踪,以提供具有高科技价值的信息和服务,比如科技主管部门,不同部门、不同级别需要对科技项目的了解层次和情况是不一样的,关心的点也是不同的,这就需要通过智能感知,主动给使用者推送不同的需求信息。这里我们通过对感知模型的构建,对根据具体的科技任务进行智能获取,以提取感知信息,进行智能推送。
1.2基于云平台的科技服务模块的构建
结合兵团服务业发展现状,综合考虑系统建设奠定开放性的技术架构,满足应用的整合和持续扩展性,提高响应科技创新办公业务需求不断变化的能力[2],需要应用支撑平台提供标准的接口、完整的集成机制和丰富的构建集,为全兵团内其他各类应用系统的开发和运行提供基础性的共性服务,为各部门之间实现业务资源、数据资源共享和协同作提供支撑,使各类科技创新办公应用能够有机结合。其中查询模块如:图1所示。
图1 工作流程模块
2 兵团科技创新服务云平台创新性
2.1模型算法创新
自动向科技主管部门、企业、科研人员进行推送科技资源信息时,采用的智能感知模型,无论是经典的还是计算的,有关文献还不多见。相关应用在科技资源领域更是少有研究。
本文方法目的是为了求得一组过完备的基Φ来对每一个科技信息xi进行线性表示。首先目标函数第一项是重构输入数据X的代价函数;第二项是对系数稀疏性的惩罚项,过完备是指n的个数远大于样本xi的维数,其分解系数a不能唯一确定,一般的做法是对系数a作一个稀疏性约束。除此之外,传统的稀疏编码不能保证得到的字典是非负的,而负值在图像里面是没有意义的,因此这里我们加入非负的约束即Αij≥0,Φij≥0。设αi,αj为xi,xj在新的基底Φ下的稀疏表示。基于流行学习与降维相关理论,我们认为如果数据xi,xj在原空间距离相近,在新的基底下αi,αj的距离也会相近,反之亦然。因此我们加入平滑的约束项R,来防止由噪声引起的数据表示的不一致性,R计算公式如下:
(3)求解稀疏系数
该步骤为标准的LASSO问题,采用Feature-sign search 算法求解。
(4)对结果进行评价,评价指标为
在上一步中的编码J被称为编码的代价函数,J值越大说明样本X在字典Φ的表示之下误差越大[3],即:该科技信息的隶属度越低。很明显该指标取值范围0-1,取值越大越可能属于某个科技类型。
2.2技术创新
率先将科技决策模型应用到科技资源分析的研究领域,以实现对科技项目、政策的辅助支持;并将基于科技大数据的数据挖掘技术应到科技主管部门及企业科技精细化管理方面。
2.3应用创新
本文以兵团为研究对象,以科技主管部门、企业、科研人员为调研对象,系统的成功研发,可以弥补目前兵团科技领域信息化应用方面的不足、整合兵团现有的科技资源,进行决策分析,提供决策支持。使科技主管部门、企业进入科技信息化定制服务时代。自动向科技主管部门、企业、科研人员进行推送科技资源信息时,采用的智能感知模型,无论是经典的还是计算的,有关文献还不多见。相关应用在科技资源领域更是少有研究。
随着计算机技术和网络技术的飞速发展,以及我国信息化建设的日益普及,为了更好的实现“大众创业、万众创新”,迫切需要一个基于定制服务的兵团科技创新云平台。由于基于定制服务,对科技主管部门、企业、科研人员在科技管理方面进行决策支持,使更加符合兵团发展的科技项目,为兵团技主管部门、企业锻炼培养创新人才等它的建设和发展有利于提高行业、区域甚至整个兵团的科技创新水平,增强科技竞争力。
[1]陈欣,李晓菲 ; 基于领域本体的专业文献信息检索研究.[N]D 现代图书情报技术,2009(7-8):6-63
[2]陈 越,郭力;隐含语义检索及其应用 [N]D 现代图书情报技术,2001(17):27-29
[3] NAVIGLI R,VELARDI P.An analysis of ontologybasedquery expansion strategies[A].2003.42-49.