基于大数据的海洋安全治理论析
2021-01-06陈菲王蓉
陈 菲 王 蓉
(1.华中师范大学,湖北 武汉430079)
中国幅员辽阔,海陆兼备,拥有广泛的海洋战略利益。党的十八大报告中首次提出“建设海洋强国”的战略目标,报告中明确强调:“提高海洋资源开发能力,发展海洋经济,保护海洋生态环境,坚决维护国家海洋权益,建设海洋强国”。①“胡锦涛在中国共产党第十八次全国代表大会上的报告”,人民网,2012年11月8日,http://cpc.people.com.cn/n/2012/1118/c64094-19612151-1.html。党的十九大则进一步提出“坚持陆海统筹,加快建设海洋强国”。“陆海统筹”这一新的海洋管理理念和“加快”二字体现出了新时代海洋事业发展的新要求。②孙悦民、张明、张慧鑫著:《中国南海海岛行政价值观的历史演进与现实选择研究》,中国经济出版社,2019年版,第185页。十九届五中全会审议通过的《中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议》再次提到“坚持陆海统筹,发展海洋经济,建设海洋强国”,凸显了海洋在新时代中国特色社会主义事业发展全局中的突出地位和作用。③“中共中央关于制定国民经济和社会发展第十四个五年规划和二〇三五年远景目标的建议”,《人民日报》,2020年11月4日。
2019年4月23日,习近平总书记在会见应邀出席中国人民解放军海军成立70周年多国海军活动的外方代表团团长时指出:“我们人类居住的这个蓝色星球,不是被海洋分割成了各个孤岛,而是被海洋连结成了命运共同体”,海洋命运共同体的概念被首次提出。习近平总书记还指出“各国人民安危与共。海洋的和平安宁关乎世界各国安危和利益,需要共同维护,倍加珍惜”。①李学勇、李宣良、梅世雄:“习近平集体会见出席海军成立70周年多国海军活动外方代表团团长“,人民网,2019年4月23日,http://politics.people.com.cn/n1/2019/0423/c1024-31045279.html。作为国际交往的大通道和人类可持续发展的战略资源宝库,海洋在当今世界经济、政治、社会等领域的地位与作用越来越突出,海洋安全也有了更加深刻的含义。作为国家安全的重要组成部分,同时也作为世界安全的重要一环,海洋安全不仅对国家总体安全目标的实现具有重要意义,而且对维护世界和平与发展也有着举足轻重的作用。然而,海上安全态势日趋复杂,传统安全与非传统安全问题相互交织,使中国的海洋安全治理面临巨大挑战。在大数据时代背景下,充分挖掘并发挥海洋大数据的巨大价值,利用海洋大数据助力海洋安全治理,为维护海洋权益、发展海洋经济、保护海洋生态提供优质的信息服务和决策支持,是建设海洋强国、构建“海洋命运共同体”、坚持陆海统筹的必经之路。
一、大数据与国家安全治理
在过去的十几年中,“大数据”已经成为学术界、专业界和媒体中无处不在的流行语,所谓的大数据是指:“无法用常规软件在规定时间内进行收集、操作、处理和加工的数据集,”②“Big Data,”Wikipedia,https://en.wikipedia.org/wiki/Big_data,访问时间:2021年3月3日。“是海量、高速和多样化的信息资产,它需要新型的处理方式去促成更强的决策力、洞察力和流程优化能力”。③“Big Data,”Gartner Glossary,http://www.gartner.com/itglossary/big-data/,访问时间:2021年3月3日。易卜拉欣·阿巴克·塔吉奥·哈什姆(Ibrahim Abaker Targio Hashem)等人则认为大数据是一系列技术,以新的整合形式从多样化、复杂和大规模的大型数据集中发现巨大的隐藏价值。④Ibrahim Abaker Targio Hashem,Ibrar Yaqoob,Nor Badrul Anuar,“The Rise of‘Big Data’on Cloud Computing:Review and Open Research Issues,Information Systems,Vol.47,2015,pp.98-115.因此可以从两个层面对大数据加以理解,即狭义和广义。狭义的大数据可以理解为“体量异常庞大、结构复杂,以至于传统数据处理技术难以应对的数据集”;广义的大数据则可以将获取、传输、存储、处理、分析和应用狭义的大数据的方法、技术和模式也包含在内。⑤吴江、张小劲:“大数据国际政治研究的回顾与展望”,《华中师范大学学报(人文社会科学版)》,2016年第4期,第1-10页。大数据的特征通常被概括为“5V”,即Volume(海 量)、Variety(多 样)、Velocity(高 速)、Veracity(真实)及Value(价值)。⑥Samuel Fosso Wamba,Shahriar Akter,Andrew Edwards,“How‘Big Data’Can Make Big Impact:Findings from a Systematic Review and a Longitudinal Case Study,”International Journal of Production Economics,Vol.165,2015,pp.234-246.
维克多·迈尔·舍恩伯格(Victor Mayer-Schonberger)指出,大数据正在改变我们的生活以及理解世界的方式,成为新发明和新服务的源泉,而更多的改变正蓄势待发。⑦[英]维克托·迈尔·舍恩伯格,[英]肯尼思·库克耶著,盛杨燕、周涛译:《大数据时代生活、工作与思维的大变革》,浙江人民出版社,2013年版,第1页。其与肯尼思·库克耶(Kenneth Cukier)在《外交事务》杂志2013年5月/6月号上发表的《大数据的崛起》一文被视为国际关系学界对大数据予以重视的标志。⑧陈菲:“大数据时代背景下的国家安全治理”,《国际观察》,2016年第3期,第42-52页。2014年,大卫·鲁宾(David Rubin)等人发表了“利用大数据保障国家安全”一文,文章认为大数据及其分析可以帮助政府和相关组织更好地解决公共卫生问题,提前洞察社会、政治、经济变化以确保经济、政治、网络安全,从而,加强国家安全,从此大数据在国家安全中的应用受到学术界的广泛关注。⑨David Rubin,Kim Lynch,Jason Escaravage,“Harnessing Data for National Security,”SAIS Review of International Affairs,Vol.34,No.1,2014,pp.121-128.
在全球大数据急速增长的同时,海洋大数据也实现了爆炸式增长,这标志着海洋也已进入大数据时代。海洋大数据是大数据技术在海洋领域的科学实践,是在大数据的理论指导和技术支撑下的价值实现。①侯雪燕、洪阳、张建民等:“海洋大数据:内涵、应用及平台建设”,《海洋通报》,2017年第4期,第361-369页。海洋大数据兼具大数据的普遍特征与自身特点,当前各类海洋观测计划覆盖全球几乎所有大洋,进行着各类周期性、实时性的数据采集,海洋大数据体量不断增长,目前其总体量已达到EB级。②Jonathan T.Overpeck,Gerald A.Meehl,Sandrine Bony,“Climate Data Challenges in the 21st Century,”Science,Vol.331,No.6018,2011,pp.700-702.海洋大数据囊括了海洋水文、海洋化学、海洋地质、海洋气象和海洋生物等类数据,类型丰富多样,蕴含着巨大的价值,可以转化为丰富的信息,供人们学习、开发和保护海洋。但由于海洋系统十分庞杂且呈非线性特征,时空尺度差异大,因此海洋大数据除了拥有大数据的一些基本特征以外,还呈现出时空性、异构性、敏感性等特点。时空性是指海洋现象不仅存在于一定的空间范围内,还在时间上具有一定的持续性,绝大部分区域相近的空间位置及时间点都具有相同或相近的物理属性,这也将导致海洋大数据存在一定的冗余性。异构性源于海洋大数据的多源采集与应用目的的不同,主要表现为系统异构,即数据生产所依赖的观测系统存在显著差异;模式异构,即数据的逻辑结构或组织方式不同。敏感性是指海洋数据中包含大量机密敏感数据,如大比例尺的海岛暗礁、近海岸线数据等,需要采取数据安全保障措施。③刘帅、陈戈、刘颖洁等:“海洋大数据应用技术分析与趋势研究”,《中国海洋大学学报(自然科学版)》,2020年第1期,第154-164页;黄冬梅,邹国良等编著:《大数据技术与应用:海洋大数据》,上海科学技术出版社,2016年版,第82页。以上特点使得海洋大数据在具有充分挖掘价值的同时面临着处理、分析与共享的困难。作为建设智慧海洋、海洋强国与构建“海洋命运共同体”的基本技术依托,海洋大数据毋庸置疑地成为经略海洋的必然选择,充分发挥海洋大数据在海洋安全治理中的重要作用机遇与挑战并存,需要明确现状、冷静应对、迅速行动、突破关键技术。
二、大数据在海洋安全治理中的应用
当前,海洋安全已经发展成为一个集水上、水下、海底等多维的立体概念,作为一个濒海国家,中国大陆海岸线总长18 000多千米,岛屿岸线14 000多千米,面积在500平方米以上的沿海岛屿6961个。④国家海洋局海洋发展战略研究所课题组编:《中国海洋发展报告》,海洋出版社,2007年版,第15页。中国海上邻国众多,且除渤海外,中国与其他国家在黄海、东海、南海海域均有岛屿主权争端或海洋划界纷争。此外,海上恐怖主义、海洋气象灾害等海上非传统安全也日趋严峻。无论是岛屿归属、海域划界、军事威胁、航道安全还是海洋生态等问题,都会给中国的海洋安全带来巨大威胁。而大数据时代的到来,或将为以上安全威胁的治理带来新的机遇。
2.1 大数据在海洋传统安全治理中的应用
在传统的军事和政治安全治理方面,海洋大数据正得到广泛应用。辅之以其他智能技术手段,海洋大数据正推动传统海战模式向智能化转变,这不仅能极大地提升海上作战与防御能力,还能为中国与周边海上邻国的海区划界谈判工作提供详实的海区地理资料,助力维护中国海洋权益。
首先,可以更全面、及时地收集与分析海洋军事情报。大数据时代的海上作战将需要通过获取信息优势来获得作战优势。早在2014年,美国海军研究办公室(ONR)就发布了《海军作战计划及其实施的先进分析方法和数据科学》白皮书,旨在发展和完善一个全新且强大的海军大数据生态系统,识别、获取和索引与海军作战任务相关的数据源,通过新的方式利用数据来获取潜在价值。⑤“Advanced Analytics and Data Science for Naval Warfare Planning and Execution,”Office of Naval Research,Department of the US Navy,ONRBAA 14-009,http://www.onr.navy.mil/~/media/Files/Funding-Announcements/BAA/2014/14-009.ashx,访问时间:2021年3月3日。在众多的海军作战数据源中,情报数据至关重要。正如萨那坦·库什雷斯塔(Sanatan Kulshrestha)所言:“信息和情报对军队的重要性来自这样一个事实,即它是和平或战争中任何军事行动的基础。”⑥Sanatan Kulshrestha,“Big Data in Military Information&Intelligence,”Social Science Electronic Publishing(2016).大数据的出现使得海洋军事情报的收集呈现“数据驱动”特征,传统的情报收集一般由政策制定者向情报管理者表达情报需求后,再进行有针对性地情报收集工作。大数据分析则通过异常检测和关联算法在庞大的数据集中辨别一般趋势和异常,从而发掘潜在情报,推动情报需求。与此同时,无所不在的数据也使得情报获取的来源更广,极大地扩充了海洋军事情报挖掘的内容,也丰富了海洋军事情报的分析手段。例如,吴少飞、刘军等人将数据挖掘技术引入网络军事情报分析,构建基于数据挖掘的军事情报分析模型,使军事情报分析系统能够自动分析网络上的数据和信息,并提取潜在的有价值的综合情报知识,①Shaofei Wu,Jun Liu&Lizhi Liu,“Modeling Method of Internet Public Information Data Mining Based on Probabilistic Topic Model,”The Journal of Supercomputing,Vol.75,No.9,2019,pp.5882-5897.从而提高开放网络环境下军事情报分析的效率,极大地丰富并发展了军事情报分析方法。
其次,能有效提升海上作战任务的完成率。一方面,大数据技术和分析方法在一定程度上会推动传统的海战模式向“智能化”转变。传统的海上作战环境严酷,战场远离陆地,后方补给、支援路途遥远,且需要防范来自水下、水面、空中的各种威胁,作战难度大。依托大数据技术和智能化装备,形成自主或半自主的作战模式,能减少参战人员,提高指挥控制敏捷度,也能更大程度保存作战实力。②张海、陈小龙、张财生等:“人工智能时代智能化海战模式”,《科技导报》,2019年第12期,第86-91页。另一方面,能有效预防并减少海战场环境因素带来的不利影响。海战场环境是影响海上作战能力的重要因素。就现代海战而言,掌控海洋环境参数与掌握敌情态势同等重要,通过收集大量的海洋大数据进行海战仿真系统建模,能不断增强军事装备及作战人员应对复杂多变的海战场环境的能力,从而提升作战能力。
最后,能为海区划界谈判提供地理资料支持。如前所述,中国作为一个濒海国家,与韩国、日本、马来西亚、菲律宾、文莱、越南和印度尼西亚等7个国家都存在着划分专属经济区和大陆架边界的纷争。海域划界一直是一个十分敏感的问题,因为涉及永久性的国家主权和海洋利益,各国历来也高度重视,并围绕海域划界产生过冲突。因此,为避免与上述国家在解决海域边界问题时因疏漏和差错产生不必要的冲突,维护海上作业环境稳定,对海域划界技术和方法的研究与改进变得非常重要。
传统的海域划界技术主要依赖手工地图量算工具,进入大数据时代后,海域划界主要采用地理信息系统(以下简称GIS)技术,GIS的空间数据管理功能可以对划界方案等各种数据进行可视化处理;基于GIS软件平台可以较为容易地实现点对点、点对岸线、点对基线的距离测量。这不仅能减少人工测量的误差,还能有效节省劳动力,提高工作效率。利用新技术、新装备对中国中近海区,特别是近邻周边国家的海区进行精确测量,积累大量数据,也能在一定程度上为中国的海区划界谈判工作提供详细、可靠的海区地理资料。
2.2 大数据在海洋非传统安全治理中的应用
(1)防范应对海上恐怖主义
恐怖主义一直都是人类发展面临的全球性安全威胁之一,根据《2020全球恐怖主义指数报告》(Global Terrorism Index 2020,GTI),2019年因恐怖袭击而死亡的人数仍是2001年的近两倍。③“Global Terrorism Index 2020,”Institute for Economics&Peace,November 2020,http://visionofhumanity.org/reports,访问时间:2021年3月3日。同样,海上恐怖主义活动也一直是海洋安全的一项重大威胁。国际商会国际海事局(ICC-IMB)发布的《2020年海盗和武装抢劫年度报告》(《2020 World-Wide Incidents of Piracy and Armed Robbery Against Ships》)显示,2020年全球共发生195起海上袭击和持枪抢劫事件,较2019年发生的162起有所增加。④“ICC-IMB Annual Report:2020 World-Wide Incidents of Piracy and Armed Robbery Against Ships,”Maritimecyprus,January 17,2021,https://www.maritimecyprus.com/2021/01/17/icc-imbannual-report-2020-world-wide-incidents-of-piracy-and-armedrobbery-against-ships/.在这195起袭击事件中有97起发生在亚洲海域,占比近50%,且多分布在中国主要远洋航线上。①“Piracy and Armed Robbery Against Ships in Asia Annual Report January-December 2020,”Information Sharing Centre,https://www.recaap.org/resources/ck/files/reports/annual/ReCAAP%20ISC%20Annual%20Report%202020%20v1(1).pdf.作为恐怖主义的一个分支,海上恐怖主义正与海盗行为逐渐融合,变得日益严峻与复杂。
一方面,如上所述,利用大数据挖掘和大数据可视化等技术可对发生在全球范围内的恐怖袭击事件进行统计,并将其分布与发展趋势直观地展现出来。陈冲和庞珣就利用大量事件数据和GIS技术,以0.5×0.5经纬度作为分辨率对恐怖袭击的时空规律进行把握,并把恐怖袭击的地理定位“叠加”(Overlay)在时空网格上,以便精准观察恐怖袭击的时空规律。②陈冲、庞珣:“非洲恐怖袭击时空规律的大数据分析——基于GIS技术和分离总体持续期模型”,《外交评论(外交学院学报)》,2020年第2期,第121-154页。这有利于掌握恐怖袭击发生的实时态势、时空分布,从而在恐怖袭击高发区加大管控,投入更多的兵力、警力加以防范。另一方面,恐怖主义组织的人员招募、资金筹集等活动都必须利用互联网来完成,这也会在互联网平台上留存很多元数据,通过收集大量的交通出行或财务记录等数据,研究人员可以将这些点联系起来,从而甄别出可疑人员。③Yasmin Tadjdeh,“Big Data Helping to Pinpoint Terrorist Activities,Attacks”(UPDATED),April 1,2015,https://www.nationaldefensemagazine.org/articles/2015/4/1/2015april-big-datahelping-to-pinpoint-terrorist-activities-attacks-updated.米歇尔·法尔(Michel Farr)等人就使用结构链路预测方法(Structural Link Prediction)检测在特定社会网络中的潜在社会关系,从而协助识别隐藏在社交网络中的恐怖分子。④漆海霞:“大数据与国际关系研究创新”,《中国社会科学》,2018年第6期,第163页。此外,不少学者正在致力于研究和开发预测恐怖袭击活动的大数据模型,弗赖肯·阿齐兹(Furqan Aziz)、马尔万·马哈穆德(Marwan Mahmoud)等人利用全球恐怖主义数据库(the Global Terrorism Database,下文简称GTD)数据,基于神经网络(Neural Network,简称NN)和深度神经网络(Deep Neural Network,简称DNN)建立了五个不同的模型来理解和预测恐怖活动,实验结果表明,基于DNN的模型的预测精准度超过了95%,充分证明DNN是一个适合用来预测恐怖活动行为的模型。⑤M.Irfan Uddin,Nazir Zada,Furqan Aziz,Yousaf Saeed,Asim Zeb,Syed Atif Ali Shah,Mahmoud Ahmad Al-Khasawneh and Marwan Mahmoud,“Prediction of Future Terrorist Activities Using Deep Neural Networks,”Complexity,Vol.2020,2020,pp.1-16.这使得政府和执法机构能够更好地了解恐怖主义的因素,并在恐怖活动实际发生之前设计应对恐怖活动的策略。
尽管海上恐怖主义活动的暴发频次远远比不上陆上恐怖主义活动,且目前大多数研究仍聚焦于防范和应对陆上恐怖主义。但是已有的利用大数据技术和分析方法进行暴恐分子甄别、恐怖袭击预测等研究能为海上反恐提供良好借鉴。当前,海上恐怖主义正呈现出与海盗活动等海上非法行为的融合趋势,这更需要充分挖掘海洋大数据在应对海上恐怖主义活动中的潜在价值,借助大数据技术和分析方法提升海上反恐能力,提升海洋安全系数。
(2)保障远海航行
在经济全球化的今天,全球90%的贸易运输都经过海洋。⑥郑海琦、胡波:“科技变革对全球海洋治理的影响”,《太平洋学报》,2018年第4期,第37页。越来越多的船只开始进入远离人类大陆、环境恶劣的远洋航行,航行海船船员的规模也在不断扩大。仅2019年,中国新增注册国际航行海船船员就有29 946人,同比增长5.5%。⑦“2019年国际航行海船船员队伍规模与结构”,中华人民共和国海事局,2020年6月25日,https://www.msa.gov.cn/html/xxgk/tjsj/cysj/20200625/BCEC8F00-BD6F-40AE-9C4A-7026132 E7B75.html。因此,加大远洋航行船只、船员的安全保障十分重要,海洋大数据的出现,使得人类进入远洋航行的安全系数得以提升。
船舶碰撞事故因其多发性和灾害性而一直是安全航行研究的重点,在这方面自动识别系统(下文简称AIS)数据发挥了很大作用。例如,李连博等人根据AIS信息中提取和分析的相关数据,通过高风险海域多目标、多层次、模糊优化模型的仿真计算,构建了一个包含船舶交通量、船舶密度及其分布、船速及其分布、船舶间距、船舶航迹、遭遇率等参数在内的决策模型(多目标、多层次、模糊优化模型),能预估出船舶碰撞风险,同时也为船舶定线系统设计、搜救地点布置、救援力量配置和航行安全管理提供决策参考。①Lianbo Li,Wenyu Lu&Jiawei Niu,“AIS Data-Based Decision Model for Navigation Risk in Sea Areas,”Journal of Navigation,Vol.71,No.3,2018,pp.664-678.日本学者福田(Fukuda)等人利用1年的AIS海啸监测数据,采用基于气体模型(Gas)和障碍区目标(OZT)对海上交通状况进行了分析,可用来识别和评估船舶碰撞的高风险区域。②Fukuda G.&Shoji R.,“Development of Analytical Method for Finding the High Risk Collision Areas,”TransNav:International Journal on Marine Navigation and Safety of Sea Transportation,Vol.11,2017,pp.531-536.通过大数据技术对航道进行规划也能在很大程度上降低船舶碰撞的风险。路线规划中最常用的方法是启发式算法(如进化算法和蚁群优化)。刘钊等人认为遗传算法和粒子群算法这两种基于启发式的优化技术在路线规划中有其特有的优势,为了提高受限水域航运路径规划的准确性,他们提出了一种融合遗传算法和粒子群算法的混合启发式算法,实验结果表明这种混合启发式算法使路线规划的精确度大大增加。③Zhao Liu,Jingxian Liu&Feng Zhou,“A Robust GA/PSOHybrid Algorithm in Intelligent Shipping Route Planning Systems for Maritime Traffic Networks,”Journal of Internet Technology,Vol.19,No.6,2018,pp.1635-1644.在多船相遇的情况下,为避免船只碰撞,一般会采取分布式局部搜索算法(DLSA)和分布式禁忌搜索算法(DTSA),这两种算法的缺陷是船只相遇避碰需要收集大量信息,在紧急情况下仍然无法快速应对。金东云(Donggyun Kim)等人则引入了分布式随机搜索算法(DSSA),由此使得每艘船在收到目标船的所有意图后,可以立即改变航道。④Donggyun Kim,Katsutoshi Hirayama&Tenda Okimoto,“Distributed Stochastic Search Algorithm for Multi-ship Encounter Situations,”Journal of Navigation,Vol.70,No.4,2017,pp.699-718.
在极地航行中,大数据也发挥着重要作用。例如,2014年1月中国“雪龙号”极地考察船(简称“雪龙”号)在南极冰海救援被困的俄罗斯“绍卡利斯基院士”号时,由于气象条件突变导致海冰快速聚集使得其自身被困。在国内业务部门和有关科研单位等多部门的协同努力下,通过综合快速地分析卫星遥感数据、气象海洋数据等,最终指导“雪龙”号成功脱困,成为海洋大数据指导极地航行船只脱困的典型案例。⑤侯雪燕、洪阳、张建民等:“海洋大数据:内涵、应用及平台建设”,《海洋通报》,2017年第4期,第361-369页。随着极地生态环境和自然情况的变化,海洋生态环境与生态系统也发生了巨大改变,从而产生系列连锁反应,对林业、农业、海洋渔业等产生不利影响。⑥“《中国的北极政策》白皮书(全文)”,中华人民共和国国务院新 闻办公室,2018年1月26日,http://www.scio.gov.cn/zfbps/32832/Document/1618203/1618203.htm。极地地区无疑将具有越来越重要的战略意义,俄罗斯、加拿大、美国和芬兰等国家都十分重视北极冰域船舶航行的安全,如加拿大学者费萨尔·汗(Faisal Khan)等人就利用贝叶斯网络数据挖掘算法构建了一个北极水域运输事故风险评估模型。⑦Bushra Khan,Faisal Khan,BrianVeitch&MingYangab,“An Operational Risk Analysis Tool to Analyze Marine Transportation in Arctic Waters,”Reliability Engineering&System Safety,Vol.169,2018,pp.485-502.作为一个“近北极国家”,无论是在极地考察与极地治理,还是在北极水域运输方面,大数据及其技术对于中国来说都不可或缺。
除此之外,极端天气也是影响船舶航行安全的重要因素。王冬梅、卢峰等人则通过船舶行为与异常天气的回放来构建极端天气条件与船舶密度变化的算法预测模型,根据对大量样本的学习、预报和检验,得到灾害天气情况下的船舶行为预测,为海上防灾预警、港口泊位管理与指挥调度等应用提供信息支撑。⑧王冬海、卢峰、方晓蓉等:“海洋大数据关键技术及在灾害天气下船舶行为预测上的应用”,《大数据》,2017年第4期,第81-90页。
(3)加强海洋渔业安全风险防控
海洋渔业作为海洋经济的支柱产业之一,在海洋经济中占有较大份额。但海洋渔业的发展仍面临着海洋灾害、非法捕捞等问题,对渔民人身安全及渔业的可持续发展造成一定威胁。
2018年12月,上海海洋大学“数字海洋”团队紧跟大数据的关键前沿技术,通过对多形态、高维度、强时空关联等复杂海洋大数据的有效挖掘,研发了涵盖海洋灾害数据全生命周期、海洋环境态势监测、专项服务与公众服务一体化的智能服务平台,实现海洋灾害的快速准确预警预报和辅助决策。该服务平台采用新的信息获取技术——基于时空序列模式挖掘和机器学习的海洋灾害信息获取技术,实现了数值预报方案人机交互式编制与多套预报方案的优化遴选,将海洋预报作业周期由数小时提高到准实时级,为解决海洋灾害预见期前信息获取难的问题提供了新方法。①郜阳:“上海海洋大学‘数字海洋’团队研发智能服务平台驾驭大数据准实时预警海洋灾害“,新民网,2018年12月24日,http://newsxmwb.xinmin.cn/kechuang/2018/12/24/31469282.html。过度捕捞会对海洋生态系统安全带来巨大威胁,因此,一些研究探讨了利用AIS数据监测非法、未报告和无管制捕捞活动的潜力。盛凯等人采用逻辑回归模型,利用从船舶轨迹中提取的特征来构造船舶分类器,给出了基于真实AIS数据建立渔船和货船分类模型的实例②Kai Sheng,Zhong Liu&Dechao Zhou,“Research on Ship Classification Based on Trajectory Features,”Journal of Navigation,Vol.71,No.1,2018,pp.100-116.,可以很好地解决渔船和货船在沿海地区的分类问题,在分类的基础上对渔船的活动进行密切监测。米歇尔·维塞(Michele Vespe)等人则提出了一种方法,通过从AIS数据中提取捕鱼活动,绘制欧盟的捕鱼足迹(即捕鱼面积和强度)。③Michele Vespe,Maurizio Gibin,Alfredo Alessandrini,Fabrizio Natale,Fabio Mazzarella&Giacomo C.Osio,“Mapping EU Fishing Activities Using Ship Tracking Data,”Journal of maps,Vol.12,No.sup1,2016,pp.520-525.
此外,大数据技术和分析方法还能在渔情渔场的预报方面发挥作用,如预报渔期、渔场、鱼群数量和质量以及可能达到的捕获量等。这类研究主要通过对海洋水温、海洋叶绿素浓度等影响鱼类分布的海洋环境要素进行监测和分析,从而判断鱼类的分布密度。④侯雪燕、洪阳、张建民等:“海洋大数据:内涵、应用及平台建设”,《海洋通报》,2017年第4期,第361-369页。这能有效缩短渔民出海时间,提高捕鱼效率,实现精准作业,因而在一定程度上降低安全事故的发生概率。
(4)助力海洋环境治理
“海洋是人类社会发展的重要自然领域,是世界各国利益交汇的社会空间。”⑤Jie Zheng,Ruifeng Luo,“The Path Research of Improving Ocean Discourse Power,”Design Engineering,Vol 2020:Issue 9,p.335.随着人类生存空间和活动范围不断向海洋拓展,海洋生态环境也面临着前所未有的挑战。现阶段,塑料造成的海洋污染是一个日益严峻的全球性问题。约有一半的塑料碎片密度低于海水,因此这种漂浮的污染物要么聚集在亚热带环流的中心,要么被冲上海岸和海滩。数据显示,全球192个沿海国家每年向海洋输入的海洋垃圾大约在500万~1200万吨。如果不及时采取减少塑料污染的策略和方法,到2040年塑料污染将增加两倍。⑥Fanny Chenillat,Thierry Huck,Christophe Maes,Nicolas Grima,Bruno Blanke,“Fate of Floating Plastic Debris Released along the Coasts in a Global Ocean Model,”Marine Pollution Bulletin,Vol.165,April 2021,p.1.据估计,按当前海洋垃圾的倾倒速度,到2050年,全球海洋垃圾的总重量甚至会超过海洋鱼类的总重量。⑦Nitin Agarwala,“Managing Marine Environmental Pollution Using Artificial Intelligence,”Maritime Technology and Research,Vol.3,No.2,2020,p.121.海洋将成为一个“塑料世界”。此外,海洋溢油事故、海水富营养化、海水酸化等都给海洋环境和生物安全造成了严重威胁,海洋环境的治理与保护已刻不容缓。
在处理海洋塑料垃圾方面,西方已经有不少国家致力于利用人工智能和大数据技术进行海洋废弃物识别。2020年4月,英国人工智能团队报告了一种能检测海洋环境中大塑料(大于5毫米)漂浮垃圾带的新方法。研究人员利用欧洲空间局“哨兵2”号卫星数据,训练机器学习算法将塑料从其他材料中区分出来,平均准确率达86%,局部区域最高达到了100%。⑧张梦然:“新AI算法能监测全球海洋塑料垃圾”,中华人民共和国国家互联网信息办公室,2020年4月23日,http://www.cac.gov.cn/2020-04/24/c_1589274584553968.htm。同时,也有许多国家开发出用以识别和上报海洋废弃物的应用程序,比如美国研发的Marine Debris Tracker、欧洲环境署研发的Marine Litter Watch,以及加拿大研发的Coastbuster等程序。这些程序可供大众下载、上传和报告具有潜在危险性的海洋垃圾,通过信息共享和数据分析,从而对海洋垃圾进行分类识别和处理。①Nitin Agarwala,“Managing Marine Environmental Pollution using Artificial Intelligence,”Maritime Technology and Research,Vol.3,No.2,2020,p.128.2017年5月,中国船舶重工集团公司第七〇五研究所联合国家海洋局,共同开发的国内首款海洋环境大数据系统——“西西海洋”海洋环境预报及仪器共享平台也正式上线运行。该系统可以对海洋近岸海水环境进行预报,对海水污染进行实时监控预报,满足公众对海洋健康产业关注。同时整合了国内主要海洋企业的环境试验能力,可以实时为海洋装备研发企业提供产品测试环境、技术指导、试验配套等方面的服务。②沈谦、杜兴民:“七〇五所开发国内首款海洋环境大数据系统成功上线”,中国青年网,2017年5月21日,http://news.youth.cn/jsxw/201705/t20170521_9829287.htm。识别海洋垃圾后,就是对其进行清除。在海洋垃圾的清除工作中,人工智能与大数据技术同样也发挥着重要作用。例如,荷兰非营利组织净洋卫士(The Ocean Cleanup)研发推出了一个海洋清洁系统,该系统使用算法来帮助识别移除系统的最佳部署位置,同时会自动在指定区域中收集垃圾,采集器的运行和功能将通过实时遥测技术监控。该系统的规模和数量可以扩大,几经修改换代,该系统已距清除海洋中高达90%的塑料碎片的目标越来越近。③Rachael Meyer,“The Ocean Cleanup Successfully Collects Ocean Plastic,Aims to Scale Design,”MONGABAY,October 28,2019,https://news.mongabay.com/2019/10/the-ocean-cleanupsuccessfully-collects-ocean-plastic-aims-to-scale-design/.
对于监测海洋溢油与海水水质变化等问题,也有不少学者探索了基于大数据的识别模型。在过去的二十年里,已经开发了许多基于传统机器学习(ML)的合成孔径雷达溢油检测分类算法,如线性模型、人工神经网络、贝叶斯分类器等。④Kan Zeng and Yixiao Wang,“A Deep Convolutional Neural Network for Oil Spill Detection from Spaceborne SAR Images,”Remote Sensing,Vol.12,No.6,2020,p.1015.溢油事故经常发生在海洋环境复杂的区域,往往难以及时进入污染区监测和清洁,需要持续观察数日甚至是数月才能研究其扩散情况以及评估其对环境安全的具体影响。由于合成孔径雷达是基于卫星的,对偏远地区的监测也可以在没有人为干预的情况下进行,实现了远程识别溢油,在有效处理溢油方面领先一步,从而尽量降低溢油对人类和海洋生物的危害。同时,这类系统也可以在一定程度上辅助监测造成海洋污染的非法倾倒行为。此外,海水富营养化、海水酸化等问题日益严重,并引发连锁反应,直接威胁到生态平衡与全球气候变化。阿迪尔·哈米德(Aadil Hamid)等人通过层次聚类方法分析监测数据的时空变化,验证了水质监测和聚类分析在水质预测中的效果。⑤Aadil Hamid,Salim Aijaz Bhat,Sami Ullah Bhat&Arshid Jehangir,“Environmetric Techniques in Water Quality Assessment and Monitoring:A Case Study,”Environmental Earth Sciences,Vol.75,No.4,2016,p.321.雅妮丝·德尔普拉(Ianis Delpla)等人则利用数据挖掘技术设计了饮用水源监测预警系统,通过基于时间序列的浊度趋势分析建立了人工神经网络模型,验证了该模型在调查流域平均浊度预测中的有效性。⑥Ianis Delpla,Mihai Florea&Manuel J.Rodriguez,“Drinking Water Source Monitoring Using Early Warning Systems Based on Data Mining Techniques,”Water Resources Management,Vol.33,No.1,2019,pp.129-140.林海夏等人则利用数据挖掘中的K-means聚类技术快速识别水污染类型,提出了分类精度更高的“判别”概念。结果表明,在基于判别的K均值聚类分析下,重金属污染物和苯酚苯胺污染物的检测率分别为94.7%和97.8%,海水污染物的总分类准确率达到96.3%。⑦Haixia Lin,Jianhong Cui&Xiangwei Bai,“Feature Extraction of Marine Water Pollution Based on Data Mining,”Symmetry,Vol.13,No.2,2021,p.355.
人工智能与大数据技术可以科学、准确地对各类海洋环境进行监测并进行数据收集,迅速发现海洋环境问题,有利于提升海洋环境治理的效率,加速海洋环境问题的解决进程。在重视利用人工智能与大数据技术的同时,必须意识到海洋的和平安宁关乎世界各国安危和利益,需要各国共同维护。这也意味着,海洋治理的国际合作必不可少,海洋大数据的国际共享也是大势所趋。
三、局限与挑战
在海洋安全治理迈向数据时代的同时,也必须认识到,当前仍然面临着大数据存储、分析、质量控制、大数据安全及共享等方面的挑战。
3.1 海洋大数据的存储、分析及质量控制尚存技术瓶颈
大数据的指数级增长的确意味着大数据的规模更加庞大,但这并不完全意味着可用的大数据也在随之增加。相反,大数据的急剧增长会给数据存储和分析带来巨大挑战,这是普遍面临着的现实困境。据估计,研究者们用来收集和转换数据的时间占了80%,而只剩下20%的时间用来做数据的分析与处理。①James G.Kallimani,“The Challenges of Digitisation and Data Analysis in the Maritime Domain,”Maritime Affairs(New Delhi,India),Vol.14,No.1,2018,pp.36-50.而且海洋数据所具有的复杂化、碎片化、异构性、敏感性等特征也给其存储和分析增加了难度,它对存储空间的可扩展性、存储系统与模型的多样性都提出了更高的要求。同时多源异构的海洋数据数量庞大、格式不一、质量不高,这便需要其分析技术更快速,才能满足海洋数据的实时性要求,这对机器的硬件条件以及算法模型的改进都提出了挑战。②黄冬梅、赵丹枫、魏立斐等:“大数据背景下海洋数据管理的挑战与对策”,《计算机科学》,2016年第6期,第17-23页。当前,中国在数据存储管理及挖掘方面仍处于跟跑阶段。
此外,大数据的质量也极其重要。从数据的获取、存储,一直到数据共享、维护、应用、消亡的整个过程中,大数据都可能被污染,从而导致研究结果出现误差。海洋大数据多元异构,因此,在数据的获取阶段其完整性、可靠性也无法完全保证,相同或不同的数据源之间都可能存在矛盾或冲突。而且由于规模较大,其存储、传输和计算都可能会出现错误。因此,如何制定适用于海洋时空大数据的质量检验方案也是不得不面临的问题。
3.2 海洋大数据面临诸多安全挑战
海洋大数据的安全问题包括存储安全、访问安全、共享安全和监管安全等。来自不同海洋业务系统的海量数据汇集存储到海洋大数据平台,并采用基于HBase的NoSQL存储技术完成对大数据的抓取、管理和处理。由于业务敏感程度不同,所依托的HBase的认证、访问控制和数据安全管理机制尚不满足分级数据保护的要求,海量分布式数据存储,增加了数据访问失控的风险。③董贵山、王正、刘振钧:“基于大数据的数字海洋系统及安全需求分析”,《通信技术》,2015年第5期,第573-578页。在数据的流通共享过程中,数据容易受到黑客攻击,遭到窃取、伪造和篡改,还有可能在未授权的情况下数据被读取,从而造成情报和重要信息的泄露,极易泄露隐私信息。因此,对海洋数据的严格监管显得尤为重要。大数据监管主要包括拦截与删除违法信息,减少和降低冗余开销,检验存储内容完整性,验证计算结果的正确性等,而这一系列操作也需要相应的技术手段与专业人员。但是,目前中国的大数据监管技术尚未发展到领先水平,且同时面临着大数据技术人才紧缺的问题,目前中国大数据人才缺口达到150多万,到2025年或将达到200多万,④“新职业——智能制造工程技术人员就业景气现状分析报告”,中 国 政 府 网,2020年8月26日,http://www.gov.cn/xinwen/2020-08/26/content_5537486.htm。大数据平台运维与开发、数据分析、数据安全等专业人才供求矛盾十分突出,这也给大数据的安全保障带来挑战。
3.3 数据共享阻碍重重
数据更大价值的发挥离不开数据的共享,这既包括数据的境内流动,也涉及数据的跨境流动。海洋强国建设必然要求海洋大数据实现境内的自由流通,而海洋命运共同体的建设自然也离不开国际社会,特别是沿海各国的通力合作,实现数据资源共享。然而,当前联合国领导下的全球海洋治理体系“碎片化”现象明显,各国之间协同不够,甚至充满相互竞争和冲突。各种海洋行动体,包括国家、国际组织和非政府组织,存在着观念与利益分歧,区域性海洋组织也具有一定排他性,所以现实中,多样的、碎片化的全球海洋治理尚未形成真正意义上的全球海洋治理体系。①庞中英:“在全球层次治理海洋问题——关于全球海洋治理的理论与实践”,《社会科学》,2018年第9期,第3-11页。针对更为具体的全球海洋安全治理,各主权国家所面临的海洋安全环境不同,海洋安全治理能力有异,海洋安全治理意愿有别,所以主权国家间的不平衡性与差异性日渐凸显。②张景全、吴昊:“全球海洋安全治理:机遇、挑战与行动”,《东亚评论》,2020第2期,第83-107页。破解当前治理困境的关键就是要形成全球海洋治理的价值共识。在此背景下,“海洋命运共同体”新理念应运而生,以海洋命运共同体理念聚合全球海洋治理共识,促进国际社会共同应对全球海洋安全威胁、完善全球海洋治理体系,具有重要的理论价值和现实意义。③马金星:“全球海洋治理视域下构建‘海洋命运共同体’的意涵及路径”,《太平洋学报》,2020年第9期,第1-15页。但在全球海洋治理体系新旧交替之际,传统海洋治理范式的内在矛盾与冲突也极大地限制了海洋大数据的共享,主要表现在国家和国际两个层面。
在国家层面上,欧美一些国家对海洋数据的共享较早做出了规划。例如20世纪90年代初,美国就颁布实施了“全球变化研究数据管理政策”,确立了以“完全与开放”为基调的科学数据共享政策。④Bromley,Allan,“Policy Statements on Data Management for Global Change Research,”University of North Texas Libraries,July 2,1991,https://digital.library.unt.edu/ark:/67531/metadc11862/.到1998年,美国国家海洋数据中心建立了可与用户共享海洋信息的交互式数据查询检索系统,包括温度、盐分信息、站点实时洋流信息、海洋浮标信息、卫星检索的海温信息等。⑤Qian Deng,Xiaolu Yan,“Information-Sharing Mechanism of Marine Environmental Management in China,”Journal of Coastal Research,Volume 106,Issue SI Summer 2020,p.544.英国在2013年颁布的《把握数据带来的机遇:英国数据能力战略》(Seizing the Data Opportunity:A Strategy for UK Data Capability)也对确保数据安全与共享做出战略部署。⑥“Seizing the Data Opportunity:A Strategy for UK Data Capability,”Department for Business,Innovation&Skills,October 31,2013,https://www.gov.uk/government/publications/uk-data-capability-strategy.受限于海洋数据安全保密规定以及海洋信息管理机制不健全等原因,中国在海洋数据共享方面仍存在一定程度的“数据孤岛”现象,共享意识、共享技术及共享机制与欧美发达国家存在一定差距。
一方面,海洋大数据的共享存在较大的安全风险。利用传统的中心化数据共享模式进行数据共享,数据被篡改和违规拷贝利用的风险较大。目前,探索相对安全的数据共享模式,仍将是长期面临的挑战。另一方面,海洋大数据的分散独立保存、统一的信息化建设标准缺乏,以及海洋数据处理的信息技术部门无法及时满足所有业务部门的实际需求等都是造成“数据孤岛”的重要原因。共享技术的不成熟和共享机制的不完善是大多数国家面临的共同问题,也是限制海洋数据国内流通的最重要因素。
在国际层面上,各国数据主权交锋日益激烈,具体体现为各国对跨境数据流动的管制不同。主要分为“本地化”与“全球化”两大派。一是以欧盟和俄罗斯为代表的“本地化”派。欧盟在2018年与2019年分别实施了《通用数据保护条例》(General Data Protection Regulation,简称GDPR)和《非个人数据自由流动条例》(Regulation on the Free Flow of Non-personal Data,FFD),共同推动了数据在欧盟境内的自由流动和广泛使用。然而,两项条例建立起来的数据自由流动仅限于欧盟境内,并不包括第三方国家。⑦张娟、张志强、阮伟南等:“科技强国最新数据战略及其实施态势分析”,《世界科技研究与发展》,2021年,第1-12页。俄罗斯以及印度、巴西、越南等发展中国家,出于维护网络和数据安全的考虑,都要求一定程度的数据本地化存储或限制数据跨境流动。⑧茶洪旺、付伟、郑婷婷:“数据跨境流动政策的国际比较与反思”,《电子政务》,2019第5期,第123-129页。二是以美国为代表的“全球化”派。一直以来,美国主张“淡化国境概念,在合法公共政策目标得到保障的前提下、强调数据实现全球自由流动”,但近几年呈现出“正常流动+合理限制”的数据管制趋势,“合理限制”则意味着出于自身安全和利益的考虑,美国将关键和重要的数据截留在国内,确保全球数据源源不断地流向美国的同时,却又限制数据流出。①石中金、单寅,“主要国家和商业社群跨境数据流动主张”,《人民邮电》,2017年8月23日。由此可见,对于数据跨境流动的不同规制不仅体现出各国已经把数据作为攫取竞争优势的重要资源,也体现了各国间的数字权益冲突,这无疑为全球海洋数据的共享带来了极大的困难。
四、结 语
“谁掌握了大数据谁就掌握了主动权”,作为“21世纪的新石油”“世界上最有价值的资源”,②Damien Van Puyvelde,Stephen Coulthart&M.Shahriar Hossain,“Beyond the Buzzword:Big Data and National Security Decision-Making,”International Affairs,Vol.93,No.6,2017,pp.1397-1416.大数据的管理和分析变得越来越重要,并广泛地对行业产生更大的影响。海洋大数据平台建设与应用是建设“海洋强国”和“海洋命运共同体”,实现海洋“数字化”和“智慧化”的必然趋势,为海洋安全治理、海洋经济发展和海洋生态保护提供了新的决策支撑工具。然而,海洋大数据应用的行业落地过程也有不少问题需要解决,要真正实现海洋数据从“数据大”困境到“大数据”时代的战略性转变需要做出更多的努力。
技术发展与人才培养是首先需要解决的问题。无论是海洋大数据的存储与分析,还是其面临的多种安全挑战,都与相关技术尚不成熟有很大关系,加快突破技术瓶颈一方面需要国家的财政支持,另一方面也需要专业知识过硬的人才队伍,应创新人才培养模式,加快建立健全多层次、多类型的大数据人才培养体系;此外,海洋大数据管理及共享安全需要制定和完善相关标准或法规制度,通过符合时代要求的新标准或新法规来规范、降低各种安全隐患的发生。③钱程程、陈戈:“海洋大数据科学发展现状与展望”,《中国科学院院刊》,2018年第8期,第884-891页。同时应明确经济社会发展对海洋科学各领域的具体需求,伴随着网络信息平台的多样化,公众参与海洋信息的管理成为可能,给予公众更多的监督权和选择权,使其通过听证会和信息共享应用程序等渠道向有关部门表达诉求和建议将是可行的选择。④Qian Deng,Xiaolu Yan,“Information-Sharing Mechanism of Marine Environmental Management in China,”Journal of Coastal Research,Vol.106,Issue SI Summer 2020,p.547.关于海洋大数据的国际合作与共享,各国对跨境数据流动的管制尚存差异,全球性的共享机制和数据保护法规还未形成。因此,各国不仅要在现有基础上不断健全和完善有关国内数据保护和共享的法律法规,还要通过国际交流、对话和谈判等方式加快建立海洋数据的公开性服务机制与管理办法,按照“合理公开、增量先行”的原则对数据开放边界、方式和时效达成一定共识,建立数据开放效果的评估、考核和安全审查制度;⑤蔡翠红、王远志:“全球数据治理:挑战与应对”,《国际问题研究》,2020年第6期,第38-56页;杨锦坤、韩春花:“大数据新时代背景下的海洋数据资源管理策略”,《海洋信息》,2018年第3期,第1-5页。遵循“循序渐进、先易后难”的原则,选择低敏感、浅层次的领域展开初步合作与交流。海洋渔业、海洋灾害、海洋气象、海洋生态、海洋环保等关乎全人类切身利益与共同安全,是推进海洋大数据跨国交流与共享的突破口。就中国而言,中国与东盟国家在低敏感海洋领域的合作已取得丰硕成果,与相关海洋管理部门、科研机构建立了广泛的海洋合作伙伴关系,当前双边的海洋合作正在向关键敏感领域纵深迈进,⑥“吴士存等:中国—东盟南海合作的新进展与新特点”,中国海洋发展研究中心,2020年12月3日,http://aoc.ouc.edu.cn/2020/1202/c9821a308466/page.htm。“循序渐进、先易后难”模式是值得借鉴的成功经验。在推动海洋大数据国际合作的进程中,中国可继续借力“一带一路”倡议推动实施中国—东盟、中国—欧盟、金砖国家、中日韩、中俄等双多边海洋大数据应用技术合作研发,分类开展海洋数据国际共享与交换,牵头打造互利共赢的海洋大数据共享平台,这也将是践行海洋命运共同体理念的重要举措。