面向中国科学院科研成果转移转化的产业信息集成服务平台构建方法探索
2016-01-04丁小芹吴跃伟
邵 荣 徐 雯 丁小芹 杨 锐 吴跃伟
1 中国科学院科研机构在科技成果推广转化方面的现状
当前,我国的经济建设和科学发展已进入新的重要历史时期,知识创新、技术创新和高新技术产业化成为衡量国家竞争力的关键因素。特别是在出现国际金融危机之后,依靠科技创新创造新的经济增长点、新的就业机会和新的发展模式,是摆脱危机、实现新一轮繁荣的根本出路。
历年来中国科学院始终把“改革创新、服务国家、造福人民”作为立院的崇高使命和责任,面对新的历史时期和新阶段,中国科学院2010年制定了《知识创新工程2020——科技创新跨越方案》(简称“创新2020”) ,创新2020明确提出中国科学院今后要把面向区域经济和产业发展需求,开展产业前沿技术创新、技术集成创新、工程化研发和成果转移转化作为重要工作任务。并且计划通过组织战略性先导科技专项,初步建成“3+5”区域创新集群,与国家创新体系各单元形成功能互补、协同发展的关系,形成覆盖全国、特色鲜明的院地合作体系[1],截止到2013年,中国科学院先后与地方政府合作共建了31个产业技术创新与育成中心、8个技术转移中心、5个科技园、44个院级转化型非法人单元稳步健康发展,年度转化项目964个,实现销售收入277亿元,孵化企业202个,为社会培训23 897人次。2013年,中国科学院通过科技成果转移转化,使地方企业当年新增销售收入3 105.79亿元,利税425.83 亿元[2]。
2013年7月17日习近平总书记视察中国科学院并发表重要讲话,对中国科学院的未来提出了“率先实现科学技术跨越发展,率先建成国家创新人才高地,率先建成国家高水平科技智库,率先建设国际一流科研机构”的4个率先要求,为了贯彻党的十八大和十八届三中全会精神和习近平总书记的讲话精神,2014年中国科学院积极研究制定和组织实施了《“率先行动”计划暨全面深化改革纲要》(以下简称“率先行动”计划) ,明确了未来10~20年改革发展思路,目标任务和主要改革举措。“率先行动”计划提出通过建设科技服务网络 (STSNetwork) 和技术创新与产业化联盟,促进知识与科技成果的转移转化、辐射与扩散,通过科技成果转移转化和示范应用,强化和革新现有产业,培育和创建新兴产业,力争到2020年为社会创造年产值逾万亿元[3]。
作为支撑科学研究和科技创新的中国科学院国家科学图书馆 (又名中国科学院文献情报中心,包含北京、兰州、成都、武汉4个中心) 面向科研信息环境的变化,如果仅提供传统的科技文献信息资源保障已远远无法满足科研人员工作的需求[4],因此了解从事成果转移转化相关的科研用户对非文献资源 (主要是社会经济资源) 的需求和利用情况,并以此作为基础重新规划资源建设的资源知识体系和服务体系显得非常重要。
2 科研机构科技成果转化过程的用户信息需求和服务需求
为了准确了解不同科研用户在成果转移过程中的信息需求,笔者及团队分别通过问卷调查和专家访谈的方法选择了我国10个城市16家中国科学院从事新能源、先进材料和生物医药产业化发展相关的研究机构作为调研对象,重点围绕科研用户基本情况、用户信息需求特点、用户信息利用行为、产业信息利用困难、用户对产业信息与服务的期待5个方面设计了50多项指标和7大开放问题。共回收调查问卷207份,访谈科研人员78人。访谈人员主要由研究员、一般科研人员、副研究员和助理研究员、主管领导以及少量参与科研的研究生组成。其中研究员占到29%,科研人员占23%,负责科研项目管理的领导占17%,副研究员和助理研究员分别占14%和10%。调研结果表明:
(1) 中国科学院产业化相关项目经费主要来源于国家及省部级项目、企业合作项目、自筹经费及其它三大类。其中经费来源来自国家及省部级项目支持,占到45%,与企业合作占到35%,自筹或其它方式获取经费比例为20%;
(2) 对用户参与项目的实施阶段的数据进行解读,显示处于立项和研制阶段、小试/中试阶段的用户最多。如果把市场预测目标阶段加入,则用户近80%都处于成果转移转化的前三阶段,这说明中国科学院大多数科研成果还未真正进入市场,处于探索阶段,科研单位将科研产品推向市场这一环节还存在一定的困难;
(3) 在成果转移过程中,科研人员对常规文献 (包括期刊、会议、学位论文、专利、标准) 和非常规文献 (包括技术信息、新闻动态、产业信息、政策信息、市场信息、企业信息、研究报告等,以下统称为产业相关信息) 都有需求,但是这些需求会因不同人员的身份职位、职责、兴趣和不同的研究阶段而有所不同;
(4) 目前科研人员获取产业相关信息的渠道主要通过公共信息渠道 (如中国科学院国家科学图书馆、研究所订购文献资源、网络搜索引擎、免费网站) 、院内渠道 (院内相关机构及网站、中国科学院信息咨询机构,院地合作局等) 、内部或者个人渠道 (参加展会、对接会、项目评审会、鉴定会、学位论文答辩、项目申请书等) 、商业渠道 (购买图书、商业杂志、购买咨询报告) 等;
(5) 目前科研人员获取产业相关信息面临的困难是信息源多、数据分散、收集耗时耗力,而且可靠性和权威性无法保证,信息获取渠道相对缺乏,科研人员对国家、行业层面的信息把握相对比较多,缺乏对整个应用行业的发展态势的把握,对核心技术、小试、中试阶段数据跟踪比较困难;
(6) 用户对图书馆开展产业相关信息与服务的期待包括,希望能有一个具有检索和分析功能的技术市场信息整合平台,保障信息权威性、即时性和储备量,能挖掘有用数据,随时调用;跟踪中国科学院研究所研究的重大项目,对项目所需信息提供咨询服务;针对某项技术开展技术情报分析产品服务等。
3 面向科研用户需求的产业相关信息资源发现和遴选
3.1 产业相关信息包含的资源类型及特点
通过上面调研发现,中国科学院相关研究所科研用户在产业前沿技术创新、技术集成创新、工程化研发和成果转移转化过程中除了常规文献需求外 (这些都有相对固定的获取渠道和方式,如直接登录数据库网站或者通过全文传递服务,不作为本文讨论的重点) ,更加关注的是与产业相关的非传统文献信息,其中最主要的信息资源可以归纳为如下几种:
3.1.1 信息报道类信息
主要报道国内外科学技术与国民经济发展的状况或某一学科专业、某一行业出现的新进展、新苗头和新动向等信息。信息报道的主要特点是能比较迅速而及时地向用户提供国内外科技、经济、生产建设、科学管理或市场动态等方面的动向与最新信息,在网站上一般以行业资讯、国内外新闻动态、行业动态等形式进行表现,有些也以快报、信息刊物等形式进行表现。如“新华资讯网”的“每日快讯”、“经济新闻”、“Yahoo”的“财经新闻”、“中国能源网”的最新资讯等。
3.1.2 统计数据类信息
数据是有关部门经过调研或者资料整理和分析研究所形成的重要的产业信息资源。数据通常以“年鉴”、“年报”、“汇编”、“手册”、“要览”、“概览”、“数据库”等形式进行表现。如“中国经济统计年鉴”、“中国经济网产业数据库”等。
3.1.3 研究报告类信息
研究报告是围绕某一课题或者专题,通过各种方式,全面系统地收集各类信息,然后对信息进行综合分析研究后撰写而成的研究成果,它以分析说明、归纳提炼、论证推测为主,具有结构严谨,分析深刻,结论明确等特点。研究报告从不同的角度出发可以分为多种类型,如按照研究深度程度可以分为调查报告、分析报告、预测报告和可行性报告;从报告的文字形式可以分为统计图表型、技术分析型和新闻报道型;从报告的涉及的内容不同可以分为数据型、分析型,决策咨询型报告[5];从报告的来源可以划分为政府有关机构 (如“IEA”每年出具的“世界能源展望”研究报告、“DOE报告”) 研究报告;研究机构、专业学会、协会出版的研究报告;商业咨询机构出具的行业分析报告;数据库系统收录的各种研究报告 (如“中经网”包含的“中国地区发展报告库”、“中国行业季度报告库”、Dialog中的“Forst& Sullivan Market Engineering”、“Profound市场研究报告数据库”) 。
3.1.4 经济政策法规信息
科研人员技术创新活动依托于国家的国情国力和国际创新趋势等大环境,受到国家有关政策的调控和约束,因此了解政策信息是进行技术创新的基础。政策信息的内容主要有:技术政策信息、产业政策信息、区域发展政策信息、环境政策信息和证券市场政策信息等。
3.1.5 公司厂商信息
包括国内外各公司厂商的情况,如公司的名称、地址、电话、电传号码、成立开业年份等情况;公司的财产状况、公司的信誉与信用等;公司的经营策略等情况。
3.1.6 市场产品信息
产品信息主要包括产品的供应商;产品的各种价格(包括交易所价、出厂价、批发价、零售价) ;产品的规格、性能与特点的比较;产品市场的供需情况,包括市场销售情况、产品的市场占有率、消费者的意愿及其购买力投向、消费者需求与兴趣的变化、新产品及其市场预测与投放市场的情况;以及各种市场预测、开辟新市场的可行性研究和行情调研报告。
3.1.7 生产技术信息
主要包括不同行业先进的生产工艺、先进的专用设备、新技术、新材料、新能源、新产品的研制与开发情况,如专利信息、标准信息、科研成果信息、项目信息等。
3.1.8 分析评论、预测信息
围绕宏观经济、行业经济、地区经济以及世界经济热点问题,汇聚海内外著名专家学者以及国内外著名研究机构的最新学术观点和研究成果,让用户通过“外脑”第一时间、全方位把握国内、国际经济发展脉搏和行业发展态势。如“中经网”的“中经评论”、“世经评论”、国研网的“世界经济和金融评论”、中国能源咨询网的评论栏目等。
3.2 产业相关信息的获取方法和途径
产业相关信息资源具有资源类型繁杂、组织形式、表现形式多样、发布渠道多途径、部分需要收费等特点。笔者通过实际调研总结主要从以下9种渠道进行收集:
3.2.1 国内外权威机构、组织及统计网站
各个国家的权威机构、组织及相关的统计机构都会定期发布一些政策、法规、统计公报、研究报告等信息,并定期出版各类统计年鉴,这些都是很有权威和价值的信息来源。
3.2.2 国际上大的出版集团、数据库公司出版的商业数据库
数据库具有信息检索方便、容量大、更新快、检索价格相对便宜等特点,是非常重要搜集技术、行业、经济、社会信息来源之一。据统计Dialog拥有的600多个数据库中,其中经济信息数据库就超过300多种。我国的经济类数据近年来也发展很快,按照《中国数据库大全》中的1 000多个数据库划分,属于经济类的数据库有500多个,占 50%[6]。
3.2.3 新闻媒体
主要指的是以新闻为主要表现形式的大众媒体,包括印刷媒体 (报纸或杂志) 、广播媒体 (广播电台或电视台) 和互联网媒体。如“新华网”、“人民网”、“中国日报”等。
3.2.4 经济信息网站
是指那些整合国内外主要媒体的经济新闻及信息,为政府部门、企业决策提供权威参考的综合性经济网站。如“国研网”、“中经网”等。
3.2.5 管理咨询公司网站
管理咨询公司是指从事管理咨询活动、为企业和企业家提供咨询性服务的公司。他们网站上一般均提供研究报告的订购和定制服务,同时很多网站上也提供产业经济动态、统计数据、公司名录、年鉴和部分研究报告免费下载等信息。
3.2.6 证券公司及相关财经证券类资讯网站
证券公司即经营证券交易的公司,一般大的证券公司设有专门的投行部,有自己的研究部门发布研究报告,称为券商报告。国内券商并不将其公司网站作为发布报告的渠道,要想获得相关的分析报告,一般可以通过各类财经证券类资讯网站,如“巨潮信息网”、“全景网”、“和讯网”、“汗牛网”等或者通过收费的资讯终端获得。
3.2.7 行业学会、协会
学会是由科技工作者自愿组成的科技学术性团体,是科技发展的必然产物。协会作为行业内部沟通的桥梁与纽带,能协调上下游企业的利益平衡,维护行业整体利益,具有较强的公共性、行业性。它们网站上经常公布发表一些行业销售情况、生产经营情况及专题报告,并且会经常公布年度统计报告。如“国际太阳能学会”、“中国医药协会”等。
3.2.8 行业或产业的主管机构、研究机构
行业或者产业主管机构主要是指负责制定相关行业的发展战略、拟定行业规划和产业政策并组织实施、指导行业技术法规和行业标准制定的权威部门。如“工信部”、“国家能源局”等。行业或者产业研究机构是指从事相关行业领域研究的科研机构。如“北京化工大学国家碳纤维工程技术研究中心”、“中国科学院广州能源研究所”等。
3.2.9 行业资讯门户网站
主要指的囊括发布整个行业动态、新闻、资讯、政策、分析、技术、数据、会展等整合信息的门户网站。如能源行业的“中国能源信息网”、“世界能源金融网”、“国际能源网”。
3.3 产业相关信息获取渠道的遴选与评价
近年来随着Internet信息技术的迅猛发展和各国对产业发展的重视,互联网上各行业相关产业信息资源数量庞大、分布分散,存在质量良莠不齐、虚假和欺骗信息并存的现象,科研人员都希望获取经过遴选和评价的产业相关信息,帮助科研人员在进行成果转移转化工作中获得全面的信息服务支撑,产业相关信息获取渠道 (以下简称网络信息源) 的遴选和评价就显得尤其重要。不同来源渠道网络信息源共性遴选指标包括行业领域指标、信息资源类型指标、适用对象指标、内容指标 (适用性、权威性、实用性、准确性、时效性、独特性和连续性) 、形式指标 (内容的提供形式、使用的便利性、可获取性、稳定性、规范性、美观性、影响性) 、时效指标和法律指标等。不同来源渠道网络信息源除了这些共性遴选指标外,也具有个性化遴选指标,如组织机构 (包括政府机构、行业主管机构等权威机构) 主要从级别层次、网站链接的各机构站点的权威性、其他网站也经常链接此网站 (PR值高) 角度进行遴选;新闻媒体 (报纸、杂志、媒体网站) 的遴选指标和评价内容包括新闻媒体的主办方、网站的更新频率;商业数据库主要从数据库的信息内容、数据库的质量、系统平台功能、信息检索和获取功能、使用统计功能、互操作和集成服务功能等角度进行遴选;综合性经济信息网站主要从网站的创建者具有一定的权威性、在业界具有较高的知名度进行评价;学/协会则从学/协会的级别、会员的数量、成立时间、经费来源、组织活动进行遴选。
4 面向中国科学院科研院所成果转移转化需求的产业信息集成服务平台构建
根据中国科学院“创新2020”方案、中国科学院院地合作一三五规划、中国科学院产业信息网、中科院年鉴等渠道了解中国科学院十二五拟实现重大技术创新向产业、产品转移转化的行业及相关领域主要有能源行业——煤清洁利用、太阳能综合利用、新能源汽车;生物医药行业——生物制造、生物医学工程;先进材料——碳纤维;电子行业——半导体照明;信息技术——物联网、云计算;节能环保等。考虑到中国科学院研究所涉及的行业及领域广泛,资源调研渠道和产业信息资源类型复杂,笔者先期以能源行业——太阳能综合利用和新能源汽车为例,构建可供移植的产业信息资源整合示范平台,再逐步应用到生物医药、新材料、节能环保平台的建设。现以能源行业为例,介绍产业信息集成服务平台构建步骤与要点:
4.1 资源调研
资源的调研是进行集成平台建设最基础最核心的工作,笔者首先根据上文所讨论9种渠道分别针对需要监测的8种信息资源类型进行逐一调研,共跟踪网站200多个,随后详细分析每个网站相关栏目包含的资源内容类型、数量、更新频率、文档格式,并以表格的方式进行汇总。最后整理出每种资源类型对应需要监测的信息来源网站,其中政策法规类、生产技术类、新闻资讯类、研究报告类信息监测网站分别为62个、35个,150个、100个,除了网络信息源,同时也参考了图书、年鉴、词典、咨询报告等纸本载体作为信息源的补充。
4.2 资源采集、分析标引、审核、组织
在参考国家科技部科技基础条件平台《数字规范与标准建设》项目下的《网络资源描述元数据规范》[7]、2008年国家科技图书文献中心 (National Science and Technology Library,简称NSTL) 制定的《NSTL数据加工规范》和中国科学院成都文献情报中心制定的《开放会议资源的元数据研究》[8]的基础上分别制定了《社会经济网络资源集合元数据描述规范》和《社会经济资源内容元数据描述规范》。
根据监测的信息来源网站栏目包含的资源数量、更新频率、文档格式,确定3种不同方式的资源采集方式,分别是对大量有规律信息资源的自动化采集和人工识别、对批量数据的自动化导入和零星数据的手工添加。针对网站分布数量比较多的资源内容根据系统自主开发的采集软件和引进的深圳乐思采集软件对150来个信息源进行自动采集规则的配置和自动采集,采集后的信息内容辅以人工筛选和识别,按照每种资源内容类型的元数据规范导入到后台管理系统;数据库资源因元数据比较规范、统一,主要采取的是批量数据自动导入的方式;对于不能采集和数量比较少的网络资源和其它途径获取的资源则通过手工录入和扫描的方式。对采集到的不同来源、不同标准的资源内容类型制定统一的后台标引和资源审核规范。实现对不同类型信息资源多维度 (包括资源类型、研究领域、国家、语种、时间、信息来源、可获得性等) 的规范化组织。
4.3 产业信息集成服务平台的开发
根据前期用户需求调研和资源调研情况,能源行业产业信息资源整合平台建设的技术路线为借鉴现有优秀开源系统上实现自主开发,整个系统建设工作采用dotCMS开源系统进行二次开发,结合系统投入运行后的安全性和稳定性,系统开发环境和部署环境为dotCMS+Eclipse+tomcat+MySQL,主要包括的模块有:系统前台模块、检索模块 (简单检索组件、高级检索组件) 、系统管理模块 (索引管理、数据库管理、接口管理) 、资源采集模块、用户推荐模块、用户资源评价模块、用户服务申请处理模块和定制扩展功能模块 (资源量统计分析组件、用户访问统计分析组件) 等。
4.4 产业信息集成服务平台前台的呈现与服务功能
在遵守知识产权的前提下,平台围绕用户需求和行为习惯,实现对不同信息资源的高度整合,平台主要集成的信息资源包括:新闻资讯、政策法规、行业报告、公司机构、统计数据、生产技术 (技术动态、科研成果、标准、专利) 、分析评论和监测网络信息源。每种资源类型可以分别提供按照研究领域、信息来源渠道 (或者信息来源渠道性质) 、资源内容类型、国家、年代等方式进行分类导航和关联信息链接。除了按照不同资源类型进行浏览外,平台还提供用户推荐、全文传递、资源上传下载和评论等交互式服务功能。在用户的推广使用过程中,按照用户的需求不断补充完善系统的功能,包括系统访问量的统计、用户注册登录、用户空间、首页动态新闻图片展示、Web Service/OAI开放接口、面向第三方系统调用的RSS个性化定制。
4.5 产业信息集成服务平台实施效果
目前能源行业信息集成服务平台 (http:∥energyose.whlib.ac.cn) 从2014年6月份已经正式上线为中国科学院相关研究机构科研人员提供服务,生物医药 (http:∥biomedose.whlib.ac.cn) 、新材料 (http:∥newmatose.whlib.ac.cn) 、节能环保平台 (http:∥epose.whlib.ac.cn) 也分别在2014年9月和2015年4月逐步提供应用服务。按照“成熟一个,推广一个”的服务理念,在每个产业平台搭建完成后,通过各种渠道加强了对相应学科馆员、所图人员和相关科研人员的宣传和推广,4个平台在中国科学院相关研究所得到了广泛的应用,目前已经10多个研究所图书馆网站和40多家课题组群组平台通过网页嵌套、链接、RSS定制、接口的方式实现了平台的资源与其他系统之间数据的交换和共享。截止到2015年6月系统访问量达32 578人次,访问次数363 601次,网页点击量5 783 483次。从收集到的用户反馈体验报告可看出,95%以上的用户反映网站收集的内容比较丰富、网站整体风格比较合理;92%的用户对平台的内容更新及时性比较满意;用户也对系统增加整体搜索功能、平台名称简化、页面布局美观等方面提出了很好的建议。
5 结语
面向产业信息集成服务平台作为支撑中国科学院产业前沿技术创新、技术集成创新、工程化研发和成果转移转化研究的信息服务系统,需要建立密切的院所协同工作机制。院所协同包括图书馆与研究所协同、科研用户与图书馆员协同、学科馆员与研究所图书馆员协同、资源建设人员与技术开放人员协同,学科馆员与资源建设人员之间协同。这种协同模式贯穿于用户需求调研、资源内容发现、遴选、系统建设和推广应用以及日常运行管理等整个过程中。
[1]中国科学院2011年度会议——“十二五”的总体目标任务[EB/OL].http:∥www.cas.cn/zt/hyzt/2011ndgzhy/2010gzhg/201101/t20110127ɻ3068308.html.
[2]中国科学院2014年年鉴[EB/OL].http:∥www.cas.cn/jzzky/nj/2014nj/201503/P020150320605882139156.pdf.
[3]中科院:全面改革改什么 (关注) [EB/OL].人民网.http:∥politics.people.com.cn/n/2014/0929/c1001 - 25756587.html,2014-09-29.
[4]马建玲,王楠,张延敏,等.科研用户对非文献资源需求研究——以中国科学院科研用户及研究生为例[J].情报理论与实践,2011,34(2) :67-71.
[5]胡晖,刑峰.竞争情报[M].北京:海洋出版社,2006.
[6]姚建平,杨占彬.市场信息学[M].北京:机械工业出版社,2008.
[7]肖珑,赵亮.中文元数据概论与实例[M].北京:北京图书馆出版社,2007.
[8]柴苗岭,朱江,陈漪红,等.开放会议资源的元数据研究——以重要开放会议资源采集与服务系统为例[J].图书馆建设,2011,(2) :52-56.