卫星“废片”如何变成地图资源
2020-07-31科技日报
文/科技日报
卫星虽被形象地称为“天眼”,事实上卫星数据的应用,却难以做到“尽收尽用”。
中国工程院院士杨小牛就曾经表示,卫星在天上飞来飞去,效能其实并不高,每天只有几十分钟时段内采集到的数据是地面需要的。
那些大量的被认为是无效数据的“废片”,有没有可能被利用起来?
近日,清华大学理学院院长、地球系统科学系主任宫鹏介绍,在高性能云计算的支持下,通过数据建模、人工智能算法等手段,完成了首套中国30米逐日无缝遥感观测数据集,以及逐季节土地覆盖和逐年土地利用的数据集,让“拼图无解”的卫星“废片”能够成为高分辨率的地图资源。
人工智能深度“补片”
宫鹏解释,卫星直接获得的图片不能拿来直接用,因为卫星图片不是自然连续的,很可能像100块的拼图,有时候是少了50块的效果,但也有可能同样的拼图来了好几块。
不止如此,卫星轨道的偏差还会造成同一地方不同时间拍摄的图片难以重叠,云彩的遮挡、雾气不均匀的散射都会导致大量的卫星遥感数据难以反映地表的真实情况,而成为难用的“废片”。
“我们构建了人工智能需要的知识库,其中包括世界首套全球全季节普适样本库和相关领域知识。库中分为训练样本库和完全独立的验证样本库。”清华大学博士生刘涵介绍,团队设计了一套适应遥感大数据的深度遥感特征学习和分类模型,利用机器学习和数据建模对人工智能系统进行了训练,使其能够“理解”或者说“推断”出缺失的图块,进而补缺。
通过训练,模型可完成高性能的推理,把不完整的“拼图”重建成时空一致的图像库,建立起这一深度遥感制图模型的“超能力”,完成各种不合格“废片”的补片工作,从而生成与真实情况相匹配的遥感观测数据集。
计算上云避免巨大资源消耗
“地球系统科学使用和产生的数据是极其巨大的,例如气候模拟和预测会生成时间间隔在小时级、地面分辨率是3公里的气候数据,这些数据的数据量级往往相当于数百万集高清电影的量级。”宫鹏介绍,因此需要超强算力来完成。
如果为这些数据进行数据中心建设的话,需要三四百个机柜,占地成本和时间成本耗费巨大。对这些数据集中的数据进行AI处理时,如果不在云上进行而是搬运下载后再运算,那光是用来搬运的时间也可能需要几个月。
“现在中学生、小学生想拿数据做点什么,从里面拉几条曲线,或者把一个区域拿出来做一些探测、变化、趋势的分析,都已经变得非常容易。”宫鹏说,对于卫星公共数据的梳理、重建,让卫星遥感图的使用门槛大大降低,如果说之前只有专业用户能从数据中获得价值,那么以后更多的普通用户也能看懂和利用这些数据。