海洋科学数据流通与交易推进思路
2023-05-12王漪康林冲姜晓轶童心曹磊符昱
王漪,康林冲,姜晓轶,童心,曹磊,符昱
(1.国家海洋信息中心,天津 300171;2.国家海洋科学数据中心,天津 300171)
随着科学研究第四范式——数据密集型研究的兴起和发展,科学发现与科技创新越来越依赖对科学数据的集成与分析,科学数据作为国家科技支撑条件的基础性和战略性地位愈发显著[1]。我国高度重视科学数据管理和开放共享工作,制定发布了《国家科技资源共享服务平台管理办法》和《科学数据管理办法》等政策制度,从国家层面为我国科学数据工作奠定了政策基础。2019年,科技部、财政部在原有科学数据国家平台基础上,调整组建了海洋、气象、地球系统、基因组、微生物等领域的20 个国家科学数据中心,形成了支撑国家宏观决策的科学数据领域布局和多元化运行机制。我国科学数据的发展迎来了历史上最好形势。近年来,科学数据开放共享成效显著,特别是驱动新型国家建设的作用日益凸显。
近年来,党中央、国务院高度重视数据要素发展。自党的十九届四中全会将数据增列为生产要素以来,密集出台了《关于构建更加完善的要素市场化配置体制机制的意见》(以下简称“《意见》”)等多项政策法规。2022 年12 月19 日发布的《关于构建数据基础制度更好发挥数据要素作用的意见》,首次从数据产权、流通交易、收益分配、安全治理等四个方面提出20 条政策举措(又被称为“数据二十条”),初步搭建了我国数据基础制度体系,标志着我国正式进入数据要素市场有序规范的探索阶段。数据作为新型生产要素,具有无形性、非消耗性等特点,对传统产权、流通、分配、治理等制度提出了新挑战,亟须构建与数字生产力发展相适应的生产关系。“数字二十条”的发布,有利于充分发挥数据要素作用,赋能实体经济,推动高质量发展;做大做强数字经济,推动全民共享数字经济发展红利,也为各地区、各行业参与培育数据要素市场提供了基本遵循和行动指南。
作为数据宏观范畴的重要分支,科学数据在已有开放共享成效的基础上,该如何顺应时代潮流,开展市场化数据流通与交易服务,在培育数据要素市场的进程中发挥促进科技创新的引擎作用,是科学数据工作者当前应该思考的重要问题。以海洋为例,随着海洋在促进数字经济发展领域的重要性越来越高,在开展海洋科学数据开放共享的实践中,沿海地方、涉海企业等各类用户对海洋科学数据的精细化、定制化需求越来越迫切,数据需求的深度与广度也在不断延伸,在数据申请过程中有大量用户提出了明确的购买意向。但由于海洋科学数据流通交易在研究方面尚属空白,在实践中也存在着哪些数据可以交易、数据该如何定价、收益该如何分配、数据安全要如何保障等现实挑战,越来越多的数据交易需求得不到有效满足。开展相关政策机制的研究,参考国内外海洋科学数据及相关领域数据交易的经验和教训,是推动海洋科学数据流通交易落地实施的有效途径。
本文从政策脉络、运行机制、服务模式和技术手段等角度梳理了国内外海洋及相关领域科学数据流通交易的发展现状,并提炼出值得借鉴的经验和教训,结合海洋科学数据特点以及我国海洋科学数据管理与共享服务现状,分析了目前在我国海洋领域开展科学数据流通和交易服务可能面临的问题和挑战,并初步提出了推进实施思路。
1 国内外海洋科学数据流通交易现状
1.1 国外海洋科学数据流通交易现状
美国在科学数据开放共享方面,严格以投资来源和数据产权为依据,划分为完全开放、保密和市场管理三种机制。对于政府所有或由政府资助产生且不会危及国家安全、影响政府政务、涉及个人隐私的科学数据,美国遵循无偿、无限和无歧视原则,实施完全开放策略。对于可能涉及国家安全或按照交换协议规定不能扩散的数据,实施保密性运行管理。被纳入市场管理体系的有两种情况,一是由私营企业投资产出的科学数据,二是用户需要大量历史数据、精细化处理或定制化的数据产品,这两种情况均需支付一定费用,包括提档复制分发、数据加工处理和定制化开发服务费等。以国家海洋和大气管理局(National Oceanic and Atmospheric Administration,NOAA)为例,可从互联网下载的数据大多是免费的,但利用采购的商用卫星数据研制形成的产品则需付费,用户可在网上商店付费获取定制请求数据、以CD-ROM 或DVD 存储的历史数据和出版物等。数据产品和服务的价格根据NOAA 和美国商务部的指导方针制定,价格水平需不妨碍获取数据且定期根据市场价值和管理成本调整,并在联邦公报上发布[2]。
欧洲国家同样采取“无偿+有偿”的策略提供科学数据共享服务,数据交易主要发生在提供定制化产品等场景,一些国际组织和研究机构也会根据数据所有者和用户权限决定数据服务模式以及数据定价。英国气象局(Met Office)通过国家气象图书档案馆(National Meteorological Library&Archive)和气象观测网站(Weather Observation Website,WOW)无偿发布科学数据在线目录,而公开数据与具体商业场景结合定制而成的气象分析报告则需付费使用,例如通过智能气象模型和敏感度分析工具得出天气条件对特定业务影响指数的分析报告,定价一般在500~1 500英镑之间,具体要视所需时间和专业知识而定[3]。英国海洋资料中心(British Oceanographic Data Center,BODC) 的数据共享模式完全由数据所有者决定:CTD 剖面、波浪、海流等观测数据以及自主研发的数据产品全部无偿共享;用户如需获取BODC 与世界大洋环流试验(World Ocean Circulation Experiment,WOCE)、联合全球海洋通量研究(Joint Global Ocean Flux Study,JSOFS)等国际项目合作产生的科学数据,则需向如美国国家环境信息中心(National Centers for Environmental Information,NCEI)和世界数据中心(World Data Center,WDC)等项目实施单位提出购买申请[4];代表其他组织发布的数据需经过所有者授权认证才能向用户提供,数据定价及用途规则均由数据所有者确定[5]。欧洲中长期天气预报中心(European Centre for Medium-Range Weather Forecasts,ECMWF)则主要根据用户权限划分数据共享服务模式,ECMWF 由23 个成员国和11 个合作国组成,提供7×24 h 全球海洋气象再分析数据,其成员国和合作国及其授权用户拥有完全访问ECMWF 产品和服务的权限,但其他商业组织必须购买商业使用许可才可获取数据下载和API 调用等服务[6]。欧洲国家在数据流通交易方面还拥有较完善的法律和政策体系作为支撑,例如《通用数据保护条例》(General Data Protection Regulation,GDPR)注重在“数据权利保护”基础上的“数据自由流通”。为了促进数据的进一步开放和使用,欧盟围绕GDPR 打造了《开放数据和公共部门信息再利用的指令》[7]等一系列法律文件,为欧盟数据流通活动提供了明确规则和操作指南。
1.2 国内海洋科学数据流通交易现状
在我国,随着大数据技术的飞速发展和国家“培育大数据交易市场”的政策引导,各地以多种形式开展了关于数据交易的探索和实践,先后成立了贵阳、东湖、华中等48 家大数据交易所或交易中心[8]。这些交易机构多数由政府主导建立,有相当一部分数据属于科学数据范畴,交易形式主要有API 接口、数据包、解决方案和定制服务等,在推动数据交易发展的进程中逐渐形成了系列标准和规范体系。例如,贵阳大数据交易所制定的《贵阳大数据交易观山湖公约》《贵阳大数据交易所702 公约》《大数据交易区块链技术应用标准》等文件,强化了平台管理力度,明确了数据交易准入门槛,规范了技术手段在数据交易中的应用标准。深圳大数据仲裁中心尝试通过电子证据固化、在线公证保全等方式为数据交易过程中产生的争议提供解决方案,创造法治化的交易环境。这些大数据交易中心先试先行,在交易形式、标准规范、技术手段等方面开展了积极的探索与尝试,为海洋科学数据要素市场培育提供了大量的正向参考。
但事实上,大多数交易机构的实际运营情况与预期存在着很大差距,甚至有些机构已停止运营或转变经营方向[8]。这一局面的形成主要归因于以下三点:一是数据量较少,内容不够丰富,服务模式固化,不能满足多样化的市场需求;二是数据确权等交易机制缺失,数据所有者和使用者的利益难以得到保障,数据安全仍是制约流通交易的一把枷锁;三是市场监管缺位,一旦发生数据泄露等安全事故,无法通过溯源得到交易过程中权利让渡记录;如出现交易纠纷无处投诉,无法维权,数据交易市场总体秩序欠佳。这些交易中心在发展中暴露出来的问题,值得我们进行反思,并采取积极的策略进行规避。
气象部门是我国最早实行数据有偿服务的行业部门,在科学数据流通交易方面为其他相关领域树立了典型示范。早在1985 年,国务院办公厅就发布了《关于气象部门开展有偿专业服务和综合经营的报告》(国办发〔1985〕25 号),允许和鼓励气象部门在继续做好无偿公益服务的同时,逐步推行有偿专业服务。随着25 号文件的批复,有偿服务逐步在全国气象部门普及,并取得了良好的效果,贵州[9]、山东[10]、广东[11]等省市和地区的气象部门在开展有偿服务的最初几年,就呈现出科技收入逐年增加、服务项目领域飞速拓展的良好势头。其成功的实践经验可总结为以下三点:一是利用专业优势,通过定制化服务针对性地解决数据需求方的痛点问题;二是以农业生产、海洋渔业、交通运输等受气象影响较大行业的典型应用场景为切入点,通过气象灾害预测提升农业产量、为渔场提供精细化预报服务、解决省际包车业务因道路结冰导致效益差等问题的方式促进经济社会发展;三是不断完善气象预报模式,健全质量管理体系,持续将气象产品推向市场,不断寻找新的利润增长点,注重打造品牌效应,逐渐形成专业服务拳头产品。
气象部门创造性地打通了气象产品作为商品进入市场的渠道,使气象产品实现了从潜在到现实生产力的转化,充分体现出数据价值,为海洋科学数据流通交易打造了优秀范本。多年来,气象部门不断推动专业有偿服务向规范化和产业化方向发展。2014 年修订的《中国气象法》,以立法的形式规范气象有偿服务活动,对有偿服务主体资质、项目范围和收费标准等做出了明确的规定。国家气象科学数据中心通过中国气象数据网发布地面气象、高空气象、数值模式等10 类API接口服务,用户可以根据需要定制台站、层次和要素,免费试用7 天后再选择是否购买,有偿服务愈发安全便捷。
2 海洋科学数据特点及开放共享现状
海洋科学数据是指通过海洋调查、观测监测、海洋综合管理、国际合作交换等活动获取或形成并可用于科学研究活动的原始数据及其衍生数据。海洋科学数据在研究海洋本身的机理机制、科学知识,以及海洋综合管理、海洋开发与可持续利用等方面发挥着重要作用,是关心海洋、认识海洋和经略海洋的重要基础性信息[12]。
2.1 海洋科学数据特点分析
海洋科学数据的本质是科学数据,具有科学数据的普遍特征,同时也具有鲜明的学科领域特征。2003 年,孙九林院士总结了科学数据资源的12个特征[13]:分离性、驾驭性、共享性、客观性、长效性、积累性、增值性、传递性等。随着近20年的发展,科学数据的共享性、积累性、增值性等特征得到进一步强化。
高度开放是对科学数据的基本要求,《科学数据管理办法》明确要求“保障科学数据安全,提高开放共享水平”,以“开放为常态,不开放为例外”为原则,大力推进科学数据资源尤其是由国家财政支持产生的科学数据开放共享。科学数据开放共享是提高科学数据共享应用水平和效率的重要方式,共享的核心要义在于让有限资源得到最大化的利用[14]。科学数据与科研设施、生物种质等其他科技资源一样,具有形成、成长、成熟的生命过程,其生命周期呈现螺旋式上升趋势,且没有销毁终点。对科学数据进行分析挖掘,形成的科学数据产品价值难以估量,科学数据增值空间巨大,《科学数据管理办法》首次明确了科学数据增值服务的主体、对象以及服务方式,鼓励社会组织和企业开展市场化增值服务。
在学科领域特征方面,由于海洋本身的整体性及其与各种自然过程相互作用的多层耦合性,海洋科学研究具有明显的特殊性和复杂性,且直接依赖科学观测。这些长期、连续、系统和多层次的科学观测获取的海洋科学数据,具有种类多、覆盖面广、时空跨度大、获取成本高、数据结构复杂等鲜明的领域特征。
从来源看,海洋科学数据来源于海洋调查/科学考察项目、海洋业务化观/监测、海洋综合管理、国际合作与交换等。从学科看,海洋科学数据覆盖了海洋水文、海洋气象、海洋地球物理、海洋地质、海洋生物、海洋化学、海洋光学、海洋声学、海洋遥感和海洋基础地理等多个学科。从数据获取角度看,海洋科学数据采集呈现“天”(天基:遥感卫星)-“空”(空基:飞机、无人机)-“岸”(岸基:海洋环境监测站、高频地波雷达等)-“海”(海基:浮标、船舶等)-“潜”(潜标、水下移动潜器等)-“底”(水下水声探测等)的立体化布局,采集难度大且获取成本高;由于海洋是瞬息万变的,同一要素在同一地点、不同时间都在不断地变化,所以科学观测一般是连续的,多数海洋科学调查也要持续数年之久。由于来源多样,数据结构也复杂多变,且不同数据之间由于时空关联也可能具有高度耦合性。海洋科学数据具有丰富的空间、时间和属性信息,通过分析挖掘可为深入研究海洋及其周边其他地球系统项目作用的过程和机理提供科学、客观的信息保障,是一座极为重要的科学金矿。
2.2 我国海洋科学数据开放共享现状
我国通过长期的海洋观测、监测、调查和管理工作,已经产生和积累了海量的海洋科学数据,依托国家海洋科学数据中心等平台,不断强化海洋科学数据的汇聚、处理、管理与共享服务,建立了海洋科学数据分类分级管理体系,并以此为依据开展数据开放共享服务。目前,我国将海洋科学数据划分为公开数据、内部数据和敏感数据三个级别,对应完全公开、有条件公开和离线共享三种服务模式。公开数据一般在互联网上以“主动公开”的方式发布清单和实体[12],主要用于公共安全、环境保护、公益性科学研究等领域。内部数据一般只在互联网发布数据清单,而数据实体需要按照“依申请公开”方式提供离线服务,或在海洋通信专网环境下提供实时分发和在线使用服务。敏感数据的清单和实体要求严格保密,一般不提供数据共享服务。
海洋科学数据开放共享,已在我国经济开发、权益维护、环境保护、防灾减灾等海洋工作中发挥了重要的数据支撑作用。以国家海洋科学数据中心为例,截至2022 年底,已通过海洋科学数据共享服务门户系统(互联网版)发布400 余个数据集,累计已有1 100 余所涉海单位的2 万余名用户实名注册,日均访问量2 000余次,在线服务累计3 500 余万次,热门数据集下载量达100 余万次。针对内部和敏感数据,通过离线定制化模式,平均每年为军方、涉海科研院所等单位提供离线服务200 余次。数据共享成果广泛应用在国家海洋发展决策规划、涉海科学研究和科技创新、重大涉海工程建设和社会公众科普等领域,应用案例和证明300余项,社会效益和经济效益显著。
国家海洋科学数据中心的建设成果极大地促进了海洋科学数据共享生态的良性发展,为我国海洋科学数据的互联共享和服务应用起到了引领作用,但新的问题也随之而来。越来越多的沿海地方和涉海企业提出了定制化的数据产品需求,需求多样化且精细化要求高,中心不仅需要汇聚多学科技术力量开展专业化的数据分析与挖掘工作,还要制定合理的数据定价和收益分配规则。据不完全统计,目前已收到百余项数据有偿服务需求,基本采用“一事一议”方法开展共享服务,亟须通过开展相关研究工作,逐步形成体系化的海洋科学数据流通交易制度、标准和技术体系,推动海洋科学数据流通交易的落地实施。
3 对我国海洋领域的启示及建议
3.1 明确可交易的海洋科学数据范畴
在海洋科学数据分级分类管理体系中,公开数据已在互联网公开,不纳入可交易的数据范畴;敏感数据要求严格保密,应作为明确不能交易或严格限制交易的数据内容。而内部数据一般未经过加工处理但却最能直接反映海洋环境要素和海洋现象的本质,在此基础上进行分析挖掘或定制产出的数据产品,极具学术和实用价值,可作为流通数据交易的主要内容。建议进一步考虑数据的覆盖时空范围及连续性、时间序列、空间范围、分辨率或比例尺、应用场景等因素,持续优化更新海洋科学数据分级体系,在保障国家安全和社会公共利益的前提下尽可能给数据“松绑”,不断提升数据开放程度,将越来越多高质量的海洋科学数据及其衍生数据纳入可流通交易范畴。
3.2 制定海洋科学数据定价和收益分配机制
海洋科学数据获取成本极高,无法使用市场法、成本法等普适性的资产价值评估方法对其进行价值认定,在目前国内数据要素市场已探索形成的交易双方协议定价、第三方平台预定价、拍卖定价等定价策略[15]中,基于数据使用权的交易定价机制适用性最高,可以参考引用。首先,基于海洋科学数据多源异构多模态的特征,构建数据质量评价体系,根据数据量、类别、时间跨度、空间覆盖范围、完整性、一致性、实时性、权威性、稀缺性等指标给出评价结果和合理的价格区间。其次,确定数据交易形式,可考虑以API 接口、数据包、人工智能工具等方式提供产品服务,将数据交易归结为数据和技术的增值服务。
收益分配机制是基于数据权利归属和定价方式的数据价值实现机制[16]。结合科学数据全生命周期流程,海洋科学数据流通交易参与方可归纳为数据获取方、数据处理方、产品制作方、服务平台方和数据需求方,主要职责分别为:开展数据采集、生产与制备;对数据进行排重、缺测、一致性检查等标准化处理;研发形成高附加值数据产品;汇聚管理数据资源,公布海洋科学数据目录清单并提供数据服务。根据贡献大小,制定公允的收益分成比例,有助于提高数据供给方的参与积极性,实现供需双方效益最大化。
3.3 加强海洋科学数据流通制度体系和监管体系建设
在制度设计方面,建议相关部门联合制定海洋科学数据流通交易管理办法。该办法一是要明确交易的原则性条件,即在确保公益性海洋数据无偿服务的前提下,可以依法开展有偿服务,服务内容包含但不限于为渔业生产、海洋开发、交通运输、水利电力、法律仲裁等行业的企事业单位和个人提供专业产品或技术服务。二是要对数据供方资质作出要求,包括并不限于具有较强的海洋科学数据生产和整合能力,数据资源应具有明显的学科或区域特色,且体量较大等。三是要确立服务范围、收费标准、审查管理等具体规则,明确交易各参与方的责任权利,做到“责任可追溯、过程可控制、风险可防范”。
在安全监管与防控方面,建议有关部门成立海洋科学数据交易监管机构,该机构一般由主管部门或其授权委托的第三方专业机构承担,主要职责是建立健全海洋科学数据交易制度和标准规范体系,对交易各方行为进行规范化管理,对交易全流程进行合规性监督,有效避免出现数据供方无资质、数据质量无保障、定价规则不透明、数据安全风险高等问题。
3.4 开展涉海领域试点示范
本文以智慧渔业、海洋交通运输和海洋油气开发三个受海洋影响较大的典型应用场景为切入点,探讨潜在的数据市场化需求。在海洋渔业方面,近海海水养殖极易受到海洋环境的影响,为改变“靠天吃饭”的困境,满足稳定持久发展的产业需求,可通过构建针对典型养殖经济物种的病害与环境预测预警模型,提升海水养殖抵抗环境风险的能力;在远洋捕捞时,结合海洋数值预报和海洋遥感数据,研究海洋要素时空变化及动力过程对渔场位置变动及移动趋势的影响,快速准确确定渔场位置,提升捕捞效率。在交通运输方面,可通过对长时间序列的完整潮汐周期数据进行分析挖掘,建立多点潮位站点间的潮位回归方程,实现多点乘潮在深水航道设计中的应用。在海洋油气开发方面,基于渤海海域卫星遥感影像数据,对海冰的空间分布、面积及外缘线的变化趋势进行分析,通过精细化的海冰预警预测服务,有效降低海上钻井平台事故发生率,避免造成重大经济损失。
3.5 以技术驱动创新海洋科学数据流通手段
人工智能、零知识证明、区块链等新兴技术飞速发展,将这些技术手段与海洋科学数据交易深度融合,才能规避流通交易过程中数据安全问题。例如,基于隐私计算的“数据可用不可见”模式[17]是目前较为有效的解决方案,该模式通过多方安全计算、联邦学习等隐私计算方法对交易数据加密传输与保存,在“数据不动”的基础上实现“价值流动”。海洋科学数据的原始数据一般以如专项调查数据、业务化观/监测数据、低分辨率海底地形数据等原始接收资料和特定比例尺基础地理数据为主,这些数据一般由国家公共财政支持的科研项目产出且开放程度较低。如能确保这些原始数据不出域,只传输模型计算结果,数据使用者只被允许在“数据安全岛”上对数据进行合理使用和分析建模,即可有效避免数据泄露,又可实现数据所有权不因流通发生让渡。上述技术手段都可为海洋科学数据在责权利界定、数据溯源、权利让渡和权益保护等交易环节的安全问题提供技术方案,在未来还需要探索更多样化、普适性的综合技术方案,从应用场景出发保障海洋科学数据要素安全可控。
4 结语
加快培育数据要素市场,促进数据流通交易已成为大势所趋,在数据作为新生产要素的时代背景下,实现海洋科学数据从数据资源到数据资产再到数据资本的转变,是推动数据要素流通、释放数字资源红利、促进数字经济发展的重要举措。本文结合《科学数据管理办法》的有关要求,借鉴国内外政策理念和实践经验,提出与我国海洋科学数据开放现状及市场需求相适应的流通交易实施路径,以期激活数据要素潜能,释放数据要素价值,充分发挥海洋科学数据驱动数字经济高质量发展的引擎作用。