科学数据开放共享的价值共创模型及运行机制研究*
2022-09-30冯媛
冯 媛
(郑州航空工业管理学院 信息管理学院 郑州 450046)
随着开放科学(Open Science)、开放获取(Open Access)运动的快速发展,科学数据开放共享已经成为共识,国内外的科学数据开放共享实践也取得了不小的进展。经济合作与发展组织(OECD)、欧洲研究理事会、科学国际联盟、国际科技数据委员会(CODATA)等国际组织以及美国、英国、德国、中国等重要国家先后制定了“全面开放”的科学数据开放共享政策,推动科学数据资源尽可能无限制地免费跨界流动。中国与OECD各成员国等30多个国家共同签署了《开放获取公共资助的科学数据宣言》。我国先后启动了“科学数据共享工程”项目和国家科技基础条件平台建设,建立了开放科学中心、国家地球系统科学数据中心等国家科学数据中心,制定、实施了国家大数据战略,发布了《促进大数据发展行动纲要》《科学数据管理办法》等文件,推动科学数据开放共享。然而,科学数据相关主体间缺乏互动,共享意识薄弱,直接限制了数据开放共享的时效、深度和广度[1]。
科学数据开放共享的实质是,解决利益相关主体间的矛盾冲突,最大限度实现科学数据资源的潜在价值。其中,价值问题作为数据开放共享和管理的本源问题,是支配科学数据开放共享的主线[2]。基于价值创造视角探讨科学数据共享的价值规律这一基础性问题至关重要。价值共创作为一种新的价值创造模式,强调客户参与、主体间互动[3],有助于解决科学数据开放共享存在的主要问题以共创价值。本文基于价值共创视角,探讨科学数据开放共享的价值共创模型及机制,以期实现科学数据价值和价值增值。
1 理论基础与相关文献回顾
1.1 相关文献回顾
价值是决定科学数据存亡的关键因素。学者很早就开始关注科学数据的价值属性。江洪和钟永恒赋予了科学数据价值概念,认为科学数据是人类社会从事科技活动所产生的各类原始数据,具有使用价值和科学价值[4]。孙九林认为增值性是科学数据的重要特点之一[5]。邓君等也认为科学数据具有独特的科学研究性与增值性,提出了科学数据价值鉴定的基本原则和鉴定依据[6]。Whyte和Wilson则重点强调了科学数据是否具有科学价值、社会价值、历史文化价值作为价值鉴定的主要标准[7]。然而,科学数据价值的实现和增值依托于对科学数据的使用与再利用。开放共享是将科学数据“活化”并实现价值增值的重要手段,能够将有潜在价值的静态数据“激活”[8]。盛小平和吴红认为科学数据共享是数据管理者、生产者、组织者、资助者、出版者、传播者、利用者等利益相关者间协同互动的一种价值创造活动[9]。司莉和辛娟娟指出科学数据共享具有重大的科学价值、经济价值和社会价值[1]。澳大利亚通过构建研究数据共享中心(ARDC)为数据共享实践提供功能架构,实现从数据到新知识、新方案的转化与融合,科学数据价值得以创造[10]。新加坡国立大学也通过数据共享空间进行数据描述、分析和发现,从而使科学数据隐性价值和结构显化[11]。黄鼎成认为科学数据共享管理系统、管理能力是实现科学数据效用价值的重要条件,而共享法律制度的完善程度和信息技术环境是促进科学数据共享的价值创造的重要力量[12]。司莉和辛娟娟研究了美国的科学数据共享政策,认为美国完善的科学数据共享政策机制保障了科学数据价值的充分发挥[1]。
整体来看,以科学数据开放共享方式进行价值创造已经在科学界、政府部门形成共识。然而,实践中,科学数据相关主体间尚缺乏有效的互动机制[13],数据开放共享和价值创造意愿低下,直接影响着科学数据价值实现和增值[14]。因此,从价值共创角度突破当前数据开放共享困境,是目前亟须解决的重要科学问题。
1.2 理论基础
21世纪初,随着互联网发展和市场供需结构的变化,顾客成为稀缺资源,学术界对价值关注的重点从企业生产过程转向顾客的生活实践,顾客作为价值主导并参与价值创造过程。基于顾客视角逐渐形成了一种新型价值创造理论,即价值共创理论[3]。价值共创的概念最早由Prahalad 等人提出,认为顾客与企业共同创造价值,从而打破了价值由企业独立创造的传统价值创造论。他立足于企业经营和战略设计的微观基础提出基于顾客体验的价值共创理论,认为成员间的互动是价值共创的基本实现方式[15]。Vargo和Lusch基于经济发展和演化模式的宏观视角提出服务主导逻辑的价值共创理论,认为产品不是价值创造和交换的首要因素,价值应该聚焦于使用价值,而不是交换价值[16]。虽然两个视角的研究内涵有所差异,但均强调顾客和生产者合作创造价值的核心思想。此后,价值共创理论研究迅速兴起,不断完善。Lambert和Enz将价值共创的参与者群体进行了扩充,认为除了顾客以外,还应包括其他一切利益相关者[17]。目前,价值共创理论已经形成了较清晰的研究脉络和理论体系框架,其强调的顾客参与、主体间互动等价值创造思想对科学数据共享的价值规律研究有很强的启发性和较大的借鉴意义,有助于破解科学数据共享主体互动不足、共享效率不高等共享困境。
2 科学数据开放共享的价值效应分析
科学数据是富有价值的科技资源,其作用已经超越传统的科技范畴,对整个经济、社会、文化生活有着深刻影响,对其开放共享能够产生科学价值、经济价值和社会价值等多重价值。
2.1 科学价值
科学数据产生于科技创新活动,是记录科技创新活动及成果的重要档案,这就决定了科学数据的科学价值。自上世纪50年代以来,科技发展对科学数据共享、交流和应用的需求不断增强,对科学数据价值的认可度不断提升,科学数据的基础性价值地位得以确立。随着开放科学(Open Science)运动的深入发展,科学数据管理及其开放共享在世界范围得到高度重视。为缩短科技创新周期,全球范围内掀起了科学数据开放共享热潮。科学数据在国家科技创新体系中占据基础性战略地位,成为发达国家制定科技规划和重大科技项目时考虑的关键因素之一[18]。开放共享科学数据成为世界主要国家近年来抢占大数据战略高地和提升国家科技竞争力的核心举措。
大数据背景下,科学数据作为支持和激发科技创新所必需的原始材料,逐渐成为科技创新的核心和最活跃的要素[19],以数据为中心和驱动因素的数据密集型科学成为新的研究范式和创新模式。科技创新越来越依赖于对大量、系统、高可信度的科学数据的挖掘分析和综合利用,例如借助DNA海量数据认识生命。科学数据开放共享源于科技创新活动和科技主体对科学数据资源的共同需求。科学数据以标准、规范的形式进行开放共享,供科技主体免费或低成本获取和再利用,能够破除科技主体间的信息壁垒和信息孤岛等问题,减少科研人员重复劳动。美国国家研究委员会指出科学数据的价值在于使用[20]。数据分析、再使用的多样性,能够发挥数据价值,促进开放科学研究,发现新的研究方向和主题。这也加速了科学数据转化为知识的进程,改变了传统的创新思维方式,有利于加快科研进程、提高科技创新能力和效率。同时,验证和再现研究过程与结果,降低伪造数据的发生率,也提高了科技创新透明度和准确性,产生高质量的创新成果。科学数据开放共享大大鼓励了跨学科、跨部门、跨机构的科技创新主体间的合作研究和国际化研究。英特尔曾在2010年联合全球70多家知名企业创建了“开放式数据中心联盟”,协同研发开放的云计算和数据中心解决方案。
2.2 经济价值
科学数据作为重要的科研产出,是一种具有潜在开发价值的经济性战略资源[21]。宏观层面,开放共享科学数据加快了科技创新成果向产品和服务的转化,使得这些成果快速产业化、市场化,从而刺激下游应用和商业创新,企业等社会实体能够获得更大的竞争力,促进经济增长。上世纪90年代以来,美国将开放共享数据政策作为一项基本国策,借助数据的流动和应用来刺激经济发展。政策实施后的10年(1991—1999)间,后5年经济增长比前5年每年平均多增长1.1个百分点,其中,0.5个百分点来自数据开放产生的经济价值[22]。欧盟实施的开放数据战略每年也能产生700亿—1400亿欧元的经济效益[23]。据统计,我国2020年的大数据产品和服务业务收入突破1万亿元。微观层面,科学数据开放共享可以促进企业协同创新,提高生产率,创造更多利润。美国利用大量的科学元数据,对企业的知识距离进行比对模拟,分析企业间联盟的协作效率,极大促进了实体企业的发展。麦肯锡全球研究所调查显示,数据开放共享每年能够在电力、卫生保健、交通等7个领域创造出3.2万亿—5.4万亿美元的经济价值[24]。此外,科学数据开放共享还有利于营造开放共享的企业文化,提升企业数字化、信息化建设水平,帮助企业赢得长期竞争优势。阿里巴巴早在2011年就建立了数据共享平台,腾讯公司也将大量合作伙伴纳入腾讯开放平台,这些数据共享平台成为了实现共享共赢竞争战略目的的重要手段。
2.3 社会价值
随着网络通信技术与大数据技术的快速发展,科学数据开放共享在社会发展中的巨大推进作用日益凸显。2015年,国务院发布《促进大数据发展行动纲要》,明确提出要充分释放数据红利,公共数据资源应合理适度向社会开放,以激发大众创业、万众创新活力。中科曙光也提出“数据中国”战略构想,让全社会共享数据价值。科学数据开放共享了打破传统科技创新的数据垄断地位,显著扩大了科学数据的应用范围和用户覆盖范围。同时,它也打破了部门之间、行业之间、部门与行业间的信息壁垒,使科学数据广为人知,广为所用。科学数据向公众开放后,有利于公众了解国家的科学研究及其成果,促进公众参与科技创新,增加公众参与度和对政府的信任度、满意度,提高政府信誉和治理能力,促进社会和谐发展。美国国家环保局开放共享大气、饮用水、废物等环境数据后,公民的环保意识显著增强,政府出台的环保决策和政策的支持率一直保持比较高的比例[22]。
3 科学数据开放共享的价值共创模型
科学数据开放共享的内涵是允许数据面向社会,被自由获取和使用,强调数据的可发现、可理解、可访问、可传播和可重用。而科学数据开放共享的价值共创则强调数据的可加工性、可用性、可转化性,强调不同组织或主体之间的协同合作,从而将数据转化为知识、技术,完成数据价值实现与增值。鉴于科学数据开放共享的三重价值,价值已经成为科学数据资源共享的重要动力,其价值创造存在于科学数据生产加工、存储、发布传播和使用的全过程。科学数据流动、传递的过程也是价值产生、实现和增值的过程,其价值流图如图1。
图1 科学数据开放共享的价值流图
科学数据由不同的研究机构、人员生产出来后,其价值也随之形成。经过加工、分类、存储和维护,科学数据便于高效利用,发挥其潜在的开发和使用价值。这些数据进而统一汇总、整合到科学数据中心、图书情报机构、出版社、协会等数据平台。研究表明多源异构的科学数据深度融合不仅提高了数据的科技价值和经济价值,也提升了科技创新能力和创新效率[25]。因此,资源整合是科学数据共享的价值共创核心功能之一。整合后的数据以平台形式向社会各领域的用户(科研人员、机构甚至社会公众)进行发布、传播。各种科学数据资源被不同用户利用,进行再整理和深加工,完成科学数据价值实现和增值。由于数据、平台及其服务都是开源的,各用户端会将数据的使用情况、使用结果反馈给数据平台,以丰富数据库资源,使得科学数据的价值规模不断扩大。
科学数据开放共享的价值实现和增值过程也是研究机构、研究人员、数据中心、用户等多元主体相互作用的结果。科学数据作为一种公共物品,虽然没有一般商品所具有的交易价值,但其共享需求是与生俱来的,能够被众多利益相关主体所使用,以共享和扩大科学数据价值。除了上述主体外,与价值共创有关的利益相关主体还包括政府、学术组织、公益组织、公众等主体。这些主体通过数据来驱动主体间的互动,共同依存、相互促进,凝练共识,聚分力为合力。每个主体都有独特的优势资源,在科学数据共享与价值共创中有着自己的角色、需求和责任,并由此形成一个复杂的多元主体互动关系网络,如图2。政府拥有法律制度、政策、资金等资源优势,扮演着科学数据组织者、监管者、资助者等角色。行业协会拥有制定行业规范、共享标准等资源优势,主要扮演数据资助者、发布传播者、监督者等角色。各类学术委员会、研发联盟机构等学术组织则拥有专业技术、人才或资金等资源,主要扮演资助者、监督者角色。包括基金会等在内的公益组织拥有数据开放监督等专业优势。科研机构、科研人员则遵守专业领域的数据标准对科研活动的过程数据和成果数据进行存档、注释和保存,是科学数据的生产者、加工者和组织者。以数据中心为代表的数据平台具有专业的数据管理技术和硬件设施,制定或执行数据标准、格式、元数据,并进行数据存储、质量控制、数据发布等数据管理计划,扮演着组织者、管理者、发布传播者等角色。其他科研机构、科研人员作为科学数据的用户,是价值共创的重要节点。图书情报机构、出版社等信息服务机构拥有专业信息网络技术,能为整个价值共创活动提供重要技术支撑。社会治理和大众创新背景下,公众也有科学数据需求,是科学数据的使用者。由图2可以看出,政府、科研机构(数据主要生产者)、数据中心(主要的数据平台)和用户是整个关系网络的核心,与其他利益相关者互动关联关系最多。这些互动关系具有多样性特征,包括行政关系、产权关系、契约关系以及基于声誉的社会关系。这些互动关系的关联强度存在较大差别,其中契约关系和产权关系是一种显性的强关联关系,而社会关系和行政关系则是隐性的弱关联关系。
图2 科学数据开放共享的价值共创多元主体互动关系
整体来看,科学数据共享的价值共创是一个开放的数据资源整合、多元主体互动过程,并由此形成一个有机的价值共创系统。该系统的关键要素包括共创角色、共创行为和平台三个方面,如图3。共创角色主要是指多元利益主体借助各自优势资源在价值共创活动中扮演的重要角色。共创行为主要包括多元利益主体互动和科学数据资源整合两大活动。平台则为多元主体互动和资源整合提供基本框架。共创角色、行为和平台这三大要素可细化分解为开放共享与价值共创政策制定、共享意识和共创文化提升、利益相关者识别、平台构建、数据资源整合、利益相关者互动、数据价值实现与增值等步骤,以实现完整的价值共创。政府主要从宏观层面制定科学数据开放共享与价值共创政策制度,推动形成科学数据开放共享意识和价值共创文化氛围。基于价值共创需求和目的,识别出有影响力的利益相关者,吸引其主动参与科学数据开放共享的价值共创系统。例如,在国内外有较大影响力的专业学术委员会,应将其纳入价值共创系统,在国家数据开放共享政策指导下,鼓励其制定专业领域的数据开放共享细节,推动价值共创活动。以数据中心、图书情报机构、出版社等主体为核心构建科学数据共享的价值共创平台,在整合多源异构科学数据的同时,为多元利益主体互动提供重要媒介。其中,科学数据资源整合与多元利益主体互动是整个价值共创系统的关键。由于数据的生产、流动是一个连续的过程,因此数据开放共享的价值共创也是一个循环往复、不断完善调整的动态过程。
图3 科学数据开放共享的价值共创模型
4 科学数据开放共享的价值共创机制
科学数据开放共享的价值共创系统持续、健康、稳定地发展,需要一系列机制来规范、激励利益相关者主体数据共享、价值共创行为,协调主体间可能的矛盾冲突。
4.1 法律政策机制
从我国科学数据开放共享实践来看,数据共享、价值共创已初见成效,但是国家层面的科学数据共享法律和政策还很不健全。法律方面缺少科学数据开放共享、价值共创的法律框架[26]。2018年,国务院印发的《科学数据管理办法》虽从国家高度提出开放为主的指导思想,也体现了“谁开放、谁受益” 的价值原则,但相关规定还很宽泛。鉴于科学数据重要的三重价值效应,参考美国《开放政府数据法案》、英国《数据保护法案》、澳大利亚《在线隐私保护法案》等国外法律法规,我国应制定《国有科学数据法》,将科学数据的开放共享、价值最大化作为国家的基本国策之一,明晰数据公开、数据安全、个人隐私、数据权益归属、数据伦理和法律豁免等内容。修订《知识产权法》等相关数据使用权和数据共享相互矛盾的法律条款,鼓励科学数据开放共享实践;政策方面尚缺少一整套体系配套、内容衔接、效力相互补充的科学数据共享政策体系[27]。例如,尚缺乏统一的科学数据发布政策[13]。为适应国家大数据战略,应制定政府资助项目中的科学数据开放获取与共享计划、数据服务管理计划、数据价值增值计划和政策,出台《科学数据管理规范》《科学数据服务规范》《科学数据价值分配规范》等政策,重点明确科学数据价值共创原则、目的、范围以及利益相关者角色、职责、权利和价值权益分配。
4.2 价值共创文化机制
目前,开放共享意识和价值创造文化不足是科学数据开放共享的价值共创最大障碍之一[13]。研究机构及人员的科学数据开放共享意识薄弱,因担心科学数据价值被外界所知、所用,不愿对外宣传其科学数据,也没有靠数据创造收入,大量科学数据被封锁在“黑箱”中,没有得到有效利用[1]。而其他利益主体也对数据潜在价值认识不足,缺乏获取他人研究数据的意识。因此,应培养科技主体的科学数据价值意识、开放共享意识和价值共创社会文化氛围。科学数据作为公共物品,属于公共资源,科技主体应改变传统的独享、垄断作法,树立共享共赢基本观念。与大数据、共享经济背景相适应,应对科技主体加大宣传、教育,提高理解、合理利用科学数据的能力以及判断科学数据价值的能力,改变科技主体的一些错误认识或忧虑,消除其对失去数据控制、破坏原始研究计划、降低自身竞争优势等方面的担心,让其认识到开放共享科学数据并不会降低其竞争优势,相反可以提高科技主体声誉,扩大数据规模和价值。
4.3 平台机制
Janseen等指出因缺乏合理的开放共享平台导致科学数据利用不足[13]。科学数据开放共享平台既能整合多源异构的科学数据资源,解决“数据孤岛”问题,又能为利益相关者良性互动提供协作平台,缓解信息壁垒和沟通障碍。美国的基因组数据共享空间(Genomic Data Commons,GDC)不仅是临床基因数据导入、标准化与应用平台,还是多元主体互动的知识共享网络[8]。目前,我国虽已建成国家科技基础条件平台中心、国家地球系统科学数据中心等众多平台,但重建设、轻服务,在数据开放共享的时效、深度、广度等方面难以满足价值共创要求。为此,应统筹科学数据平台布局,合并、整合分散的同类型数据平台,提高转化利用效率。例如整合清华大学、北京大学、复旦大学等高校的科学数据中心,集成各高校科学数据资源,扩大科学数据规模和数据价值。同时,开展协作研究、决策支持、预测预警以及用户管理与培训等增值服务,夯实平台的科学数据处理分析、知识转化和应用等基础功能。此外,借助平台对多源异构的科学数据资源进行标准化,统一数据模型、专业术语、数据格式表达、数据管理技术和数据处理软件框架,建立元数据标准、公共数据库、数据索引搜索方式和数据处理标准软件,从而消除多元利益主体互动方面的数据访问障碍,推动科学数据协同处理和价值增值。
4.4 互动协作机制
科学数据价值共创活动涉及政府、科研机构、数据中心等众多分散于不同专业、领域或部门的利益相关者。目前,这些性质各异的利益主体间相互孤立,造成我国大部分科学数据依然保存在项目组或个体手中,数据操作也相互独立,价值共创活动不连续、不持续。分散的多元利益主体不利于科学数据的标准统一、数据集成与整合、数据关联分析,也阻碍了科学数据的价值发挥。同时,利益相关者在 数据资源获取、分析技术应用和价值区隔等方面均存在不平等和不公平的“数字鸿沟”现象。处于科技价值链底端的主体,数据获取和处理分析能力较差。因此,有必要建立有效的互动协作机制来促进多元利益主体间的良性互动。欧盟委员会(EC)、美国国家科学基金会(NSF)、澳大利亚创新部(AID)等共同组建的研究数据联盟(RDA),美国斯坦福大学与其他科研机构、公司及应用主体组成的RDM联盟链。这些数据联盟都使得联盟成员具有明确的角色、权利和责任,促使多元数据利益主体遵循共同协商声明或原则,对科学数据开放共享与价值共创进行总体规划与计划。如透明度和匿名化协议,采用统一的数据标准或软件接口,进行元数据或数据的存储、加工、访问、处理、应用等价值活动,在价值共创方面发挥了重要作用。我国也应加强此类数据联盟建设,让用户需求透明化、一致化,基于用户需求合理共享数据资源、分配数据价值,保障多元主体间的权益,并防止数据滥用等数据伦理问题。目前,我国科学数据开放共享与价值共创以行政手段推动为主,行政关系和产权关系在多元互动关系中占主要地位。鉴于存在的数据共享困境,我国应该强化契约关系、社会关系的重要性,借助市场交易、社会声誉等手段提高数据主体参与开放共享、价值共创的主动性。市场交易可增加相关数据主体的价值收益,激发其数据共享积极性。相关研究也表明,提高学术信誉是科研机构开放共享科学数据的动力之一[28]。
4.5 资金支持机制
科学数据作为公共物品,其开放共享、价值共创需要多渠道的资金支持。一方面,国家财政长期、稳定的资助是推动科学数据开放共享、价值共创的关键,在以立项申请等形式加大资助研究机构、学术组织等数据共享项目的同时,应以财政补贴形式大力建设科学数据中心等共享平台。仿效英国政府建立的大学数据发布资金,我国政府可以建立科学数据开放基金,支持数据共享与价值共创活动。当然,对于科学数据开放共享活动产生的价值、利润应采取税收减免等优惠,这也是财政支持的另一种有效形式;另一方面,改变单一的政府资金支持方式,多渠道筹措社会资金,采用数据中心成员会费、社会捐款等多种融资方式,保障科学数据开放共享、价值共创活动的持续性。
4.6 知识产权保障机制
科学数据作为科技创新成果的一部分,属于知识产权范畴。知识产权不能成为科学数据开放共享的绊脚石,而应是重要的保障机制。科学数据开放共享与价值共创需要协调好相关知识产权问题。科学数据的全球开放共享特性与知识产权的地域性、专有性和排他性存在一定矛盾。为避免科学数据生产者(知识产权权利人)不开放共享自己的研究数据,避免重复性科研劳动,需要第三方介入协调。例如政府对科学数据生产者进行资金补贴,鼓励其共享数据。澳大利亚的“城市数据共享”(Urban Data Commons)通过资金奖励、数据引用和展示典型共享案例等形式激励科研机构、人员共享数据资源[29]。知识产权具有一定保护期限,只有在保护期满后才能向社会公开,但科学数据的生产加工、发布、传播速度快且老化周期短,可能在保护期内就会失去科技价值。对于政府资助项目的科学数据所有权,应鼓励其尽快从速开放共享。对研究机构自身研究项目所获得的科学数据,在一定限期内拥有数据优先使用权,并可以协议形式开展数据共享。考虑到科学数据存在公权和私权之争,既要保障数据生产者的知识产权权益,又要保障社会公众的知情权,应合理界定科学数据发布条件和时间,以调和研究机构优先使用权与公众知情权的矛盾冲突。对于涉及商业机密、个人隐私的科学数据,可以重新编码进行匿名化脱敏处理、设置严格的访问权限、事先获得分享许可、申请数据开放例外等处理。美国国立卫生研究院(NIH)在数据共享前对涉及受试者隐私的数据采用修订、匿名化、重新鉴定以及隐藏标识符等方式进行保护。对于数据著作权,要求数据使用者对数据进行规范引用、认可和致谢。
5 NASA科学数据开放共享的价值共创案例研究
美国国家航空航天局(National Aeronautics and Space Administration,NASA)是美国科学数据的重要来源机构之一。在美国《开放政府数据法案》的指导下,其重要科学数据大多开放共享,并为此建立了openNASA网站,创造了巨大的价值。NASA的地球地表环境影像数据免费开放后,每年创造出9.35亿美元的环境管理产业价值,并为美国每年创造出超过1亿美元的经济收益[30]。为方便用户获取科学数据,NASA编制数据目录来定位和引用数据集,并将数据集链接到科学文献,作为科学数据获取的最便捷途径。NASA科学数据开放共享的价值共创系统运行如下。
科学数据开放共享及使用政策制度化和文化氛围形成。致力于科学数据的完全开放共享和价值最大化,NASA制定了《数据与信息政策》《NASA资助研究成果开放获取政策》等政策,采取科学数据开放共享、在线发布和非歧视性获取政策。NASA明确提出科学数据共享方法、权限、元数据使用格式和标准、数据长期开放存取和数据管理职责等内容,并通过审核项目进展报告、建立问责机构等形式监督科学数据开放共享计划的执行,形成了持续开放的文化氛围[28]。在价值意识方面,NASA的社科数据与应用中心(SEDAC)强调数据科学价值是鉴定科学数据长期保存的首要标准。
广泛吸纳外部参与者,形成价值共创系统。为充分利用科学数据这一重要价值资产,NASA高度重视发现、吸纳和激励外部潜在的合作者,常态性地与世界范围内的政府机构、学术界、产业界开展合作,为航空航天前沿研究寻找和发现更合理的解决方案。NASA科学数据开放共享的价值共创系统囊括了科学家、工程师、合伙人、代理商、教育机构、政府机构或雇员、公众等利益相关者。openNASA网站上分别设置了科学家、内部人员、开发者、好奇者等入口,吸引多元主体参与数据分析。NASA启动的数据研究员项目采用选择性招募方式,征集数据科学专业专家参与数据价值增值活动[31]。NASA的开源性网络数据社区Datanaut,通过设置火箭数据任务挑战栏目,吸引数据科学爱好者、编程新手、软件工程师等主体,利用NASA真实数据,共同迎接任务挑战,从而获得创新性方法、思维、流程和产品,达到数据价值实现和增值的目的。
构建价值共创平台。NASA建立了一系列的开放共享与价值共创平台,来整合、扩大科学数据资源,促进多元主体互动。NASA执行的大天文观测计划整合了著名的康普顿伽马射线天文台(CGRO)等四个天文台的太空技术资源,形成一套完整的天文观测数据库。openNASA将CODE NASA与GitHub进行功能集成,使得网络用户可以及时查看NASA日常创新活动,增强了主体间的互动性。对于对地观测计划形成的大量MODIS(Moderate Resolution Imaging Spect rometer)数据,NASA专门建立MODIS数据共享平台,以全开放形式,免费公开共享所有的原始数据、文档、算法、处理过程、源代码,推动科学数据价值创造。
数据资源整合。NASA将其科学数据统一存储在指定的PubSpace存储库,并要求具有长期保存价值的科学数据要保存5年以上。当然,NASA开放共享的不仅仅包括元数据、数据集、数据文档等科学数据,还包括开源代码、API等相关资源。例如,openNASA网站共提供了42966个数据集,449个开源代码,50个API接口[31]。
价值共创的多元互动。NASA借助全开放的数据算法、文档、开源软件等资源,推动科学家们及科学团队间互动协作,并鼓励成员间通过Blog和Wiki进行交流合作。为确保NASA的学术视野、创新水平和技术前瞻性,NASA主动与Akamai、SunGard、Yahoo等著名企业保持良好互动协作关系。NASA曾投资3400万美元,执行“创新合作伙伴计划”项目,集成NASA下属10个中心、9所大学、17家大型公司、23家中小企业,形成创新联盟[32]。
价值实现与增值。在多元主体互动和数据流动过程中,会形成众多数据产品,实现数据价值。在MODIS项目中,来自高校、研究机构的不同专业、文化背景的科学家组成了MODIS科学家组,采取全开放式,在标准数据生产、数据产品校验和质量控制、数据处理算法设计、数据软件开发、综合应用等方面互动协作,形成新的数据产品[33]。在价值实现基础上,NASA开展创新成果转化利用,促进价值增值。NASA每年通过“中小企业技术转(STTR)”移计划、“创新伙伴(IPP)”计划等政府性扶持计划,大约开展40—50项的航空航天技术成果转移与产业化,广泛分布在计算机、运输、环保、公共安全、医药等领域[34]。
在NASA科学数据开放共享的价值共创系统中,除了上述涉及的政策机制、文化机制、平台机制、互动协作机制支持外,NASA也采用了重要的资金支持机制和知识产权机制。资金支持方面,openNASA对科学数据的价值创造活动进行现金或非现金奖励(例如运载火箭食宿费等)。NASA实施的百年挑战计划竞赛,对产生的创新想法、产品和服务进行竞争性奖励;知识产权方面,NASA规定国家安全数据、敏感但未分类的数据等为不能公共获取的数据,对涉及个人信息、商业秘密的敏感数据,在共享前需要取得受试者知情同意,并做匿名化处理。
6 结语
科学数据从封闭、孤立走向开放、共享,从资源发展为价值,是未来科学数据资源发展、应用的方向。基于科学数据的价值属性,本文从价值共创理论视角分析了科学数据开放共享的三重价值效应,提出了价值共创模型和价值共创机制,并以NASA为对象进行案例研究。然而,在价值共创过程中,如何促进主体间的资源整合,如何协调多元主体互动中的利益冲突,如何保证价值共创系统持续、稳定、健康地发展等均是需要解决的科学问题,有待进一步研究。