APP下载

Kmeans聚类与多波谱阈值相结合的烟检测算法研究

2022-05-19

工业加热 2022年4期
关键词:反射率波长波段

王 伟

(青岛市退役军人服务中心,山东 青岛 266000)

发生森林和草原火灾时,会释放大量的烟雾。传统烟检测算法通常多波段阈值组合,再辅助以噪点滤除进行烟检测。这种方法受限于地域和时间变化,而且由于烟雾的化学组成千变万化,并没有固定的波谱特征。本文将Kmeans聚类和多波谱阈值相结合进行烟检测研究,以克服阈值方法的不足,期望得到更好的烟检测算法。

1 Kmeans聚类算法

聚类分析就是在数据特征相似的基础上来进行分类。聚类分析广泛应用于科学和工业诸多领域,包括数学、图像学、经济学以及生物学等。在不同的应用领域,很多聚类技术都得到了发展,这些技术方法通过一定的标准,比较衡量不同数据间的相似性,把数据分类到不同的簇中。

Kmeans 算法是广泛应用于科学和工业诸多聚类算法中简单有效的算法之一。Kmeans算法的工作机理是:把n个样本点分为k个簇,使得各簇内的样本点具有较高的相似性,而各簇间的样本点相似程度较低,相似度的计算是依据一个簇中样本点的平均值来进行。该算法根据聚类性能指标最小化原则,通常使用的聚类准则函数是求簇内的各个样本点到该簇中心的误差平方和最小。

算法具体流程如下:

(4)更新各簇的聚类中心:

(5)计算数据集D中的所有点的平方误差Ei,并与前一次误差Ei-1比较。

若|Ei+1-Ei|<δ则算法结束,否则转入(2)进行再次迭代。

应用Kmeans算法进行聚类分析时,分类数k需要事先给定,然而很多时候,事先并不知道这个k值应该给定多少才最为合适,这也是Kmeans 算法的一个缺点。但是也可以根据需要以及样本空间分布,指定分类的数目。Kmeans聚类算法计算速度快,聚类性能良好,因此Kmeans聚类算法在工程实际中得到了广泛的应用。

将遥感影像分割成为一系列的像元矩阵,采用聚类分析法获取影像中各像元所代表的云、烟或者其他地物类型。当像元矩阵内各种地类观测值存在明显差别时,聚类方法可以将各种地物非常合理的检测出来。

2 烟检测聚类特征分析

根据之前学者的研究,表1列出了与烟雾检测相关的MODIS波段信息[1]。

表1 MODIS 烟检测相关波段分析

1)0.87 μm和0.66 μm波段反射率比值

烟和云都是由一些微小颗粒组成,它们的波谱特征具有一定的相似性。可见光0.66 μm波段(MODIS 1通道)和0.87 μm波段(MODIS 2通道)可以用于陆地、海洋以及沙漠地区的云检测以外,也可以用于烟检测[2]。烟在这两个波段上的反射率相近,通常情况下,0.87 μm波段反射率比0.66 μm波段反射率略大一点,而水体和植被则在这两个波段上的反射率差异明显。但是该方法容易受到云的影响,对于白天无云时烟检测的效果较好。

2)0.4 μm和0.87 μm波段反射率

通常情况下,烟雾颗粒非常小,其平均半径约为0.14 μm。根据瑞利散射理论,尺度小于入射光波长的粒子产生的散射现象,分子散射强度与入射光的波长四次方成反比,且各方向的散射光强度是不一样的。烟雾颗粒对波长较短的波段的辐射更加敏感,而对波长较长的波段则正好相反。其中与烟检测相关的MODIS通道中,0.4 μm波段(MODIS 通道3、通道8)对于烟雾颗粒最为敏感。0.87 μm波段(MODIS 通道2)为辐射波长最长的波段通道,对于植被辐射更为敏感。该方法除了受到云的影响以外,还会受到裸露地表的影响。

3)11 μm波段亮温

在可见光波段云和烟有相似的波谱特征,但是在红外波段,云顶温度随高度增加而降低,云层越高其温度越低。由于植被燃烧产生的高温,烟雾颗粒具有较高的亮度温度值,因此可以利用11 μm波段将二者区分。基本思想是设置阈值检验11 μm波段(MODIS 31通道)亮温值的大小,当亮度温度高于设置的阈值时则判识为烟。

低云与地面接近,云顶温度较高,在红外波段内不易区分低云和烟。陆地表面的反射率变化很大,该方法会受到裸露的地表或者高温热点的干扰。因此简单的11 μm波段阈值需要辅助以其他的烟检测方法。

3 烟检测算法构建

将Kmeans聚类和多波谱阈值相结合进行烟检测研究,以克服阈值方法的不足,期望得到更好的烟检测算法。本算法选取MODIS L1B级数据作为研究数据。算法过程分为以下三个步骤:第一步,采用Kmeans聚类算法对聚类特征参数进行聚类分析,得到初始分类;第二步,将初始分类再进行多波谱阈值判断排除云干扰因素;第三步采用中值滤波器滤除噪点,最后得到烟检测结果。其具体检测流程如图1所示。

图1 Kmeans聚类与多波谱阈值相结合的烟检测算法流程

3.1 Kmeans聚类分析

在不同时间和不同条件下,植被燃烧的产物会有很大的不同,所以烟雾没有一个相对固定的波谱特征。因此采用传统的阈值方法很难选用合适的波段组合,而且阈值的设置会随着烟雾波普特征的不同而不同。通常情况下烟雾颗粒都非常小,根据瑞利散射理论,烟雾颗粒对波长较短的波段更加敏感,而对波长较长的波段则正好相反。与烟检测相关的MODIS通道中,通道3和通道8的中心波长最短,因此对于烟雾颗粒也最为敏感。本文选用通道3数据作为聚类分析的主要特征参数。初始聚类中心的选取采用最大最小距离选心法,以提高聚类分析的效率。

根据实验结果,初始聚类可分为两类:第一类为烟雾和一部分云;第二类为植被、水体和陆地等其他地物类型。

3.2 阈值法滤除云

云是由大气中的水汽凝结而成的水滴、冰晶以及由它们的混合物组成。云的亮温相对于烟一般较低,因此本文选取热红外辐射波段区分烟雾和云:

BT31>285K

R1<0.3

式中:BT31为31通道的亮温值;R1为通道1的辐射率。在一定情况下若满足上式,认为该点为烟,否则认为该像元为非烟。本文依据云及下垫面的反射率与亮度温度统计分析,确定本次实验使用的阈值为285 K。

3.3 中值滤波器滤除噪点

在去除一些孤立的像元点以外,水体和裸露地表的反射也会产生一些噪点。在进行图像处理之前,通常需要使用降噪技术先进行一定程度的降噪。中值滤波就是一种非线性的数字滤波器技术,通常用于去除图像或者其他信号中的噪声。中值滤波是图像处理中的一个常用步骤,对于斑点噪声和椒盐噪声来说尤其有用。中值滤波的基本原理就是把数字图像中一点的值用该点的一个邻域中各点的中值代替,让周围的像素值更加接近真实值,从而消除噪声点。其设计思想就是采样检查输入信号并判断它是否代表了真实信号,使用奇数个采样组成的劈窗算法进行运算,以实现这项功能。首先对劈窗口中的数值进行排序,位于窗口中间的中值作为输出;然后丢弃最早的值,取得新的采样,重复上面的计算过程。其具体实现方法如下:

(1)从图像中的某个采样窗口取出奇数个数据进行排序。

(2)用排序后的中值取代要处理的数据。

中值滤波在图像处理中,常用于用来保护边缘信息,是经典的平滑噪声的方法。中值滤波是基于排序统计理论的一种能有效抑制噪声的非线性信号处理技术。

4 算法应用研究

为了验证该算法进行烟检测的精确性和适用性,本文选取了2009年4月29日10时30分的黑龙江省大兴安岭山区MODIS数据进行应用研究。结合马里兰大学李占清提出的亮温法火点检测算法,对本文提出的烟检测算法进行了验证。李占清提出的火点检测算法的基本步骤为

BT21>315K

BT21-BT31>14K

BT31≥260K

R2≤0.22

BT31-BT32<4KANDBT21-B31≥19K

式中:BT21,BT31,BT32分别代表21通道,31通道和32通道的亮温值。R2代表通道2的辐射率。若像元点通过以上所有公式的检验,则判识该像元为火点,否则为非火点。烟雾主要由火灾燃烧产生,因此火点周围会聚集大量的烟雾。应用火点检测算法与烟检测算法相互印证,从而检验本文算法的精确性和实用性。

2009年4月27日黑龙江与莫斯科交界处的大兴安岭山区发生了森林火灾,大火共燃烧蔓延了5天,在森林上空聚集了大量的烟雾。图2是对2009年4月29日10时30分过境的Terra卫星获取的MODIS 1KM数据进行投影和定标,获得的大兴安岭山区白天遥感影像。截取的图像的大小为400×400,中心经纬度为东经128.4度,北纬49.6度。

图2 黑龙江大兴安岭山区白天遥感影像真彩色合成图像

图2中A、B、C三处有植被燃烧形成的东北向烟羽;D处有大片的白色云区。

烟检测结果如图3所示,黑色区域为森林火点,白色区域为本文烟检测算法的检测结果。图3(a)、图3(b)、图3(c)分别是图2 中A、B、C处烟雾检测结果,烟雾形态提取完整。经过几日的森林火灾,烟雾会扩

散到火点的上方或者下风处。通过与火点检测算法的比对,可以看出检测到的烟雾位于火点的下风处,这十分符合烟雾扩散的规律,烟检测结果与火点检测结果吻合得很好。而且从图3(a)可以看出该算法对于细小的烟羽仍然具有较好的检测结果,图3(c)则显示该算法具有一定的穿透云层检测云下烟羽的能力。

图3 基于聚类分析的烟检测结果图

猜你喜欢

反射率波长波段
车灯反射腔真空镀铝反射率研究
最佳波段组合的典型地物信息提取
鲁棒多特征谱聚类的高光谱影像波段选择
杯中“日出”
利用小波分析对岩石图像分类
紫外分光光度法测定溶血率的研究
显微光度计在偏光显微镜鉴定不透明金属矿物的应用
高光谱遥感数据下城市植被碳汇的研究
分步催化制备纳米SiO2减反射膜的性质与结构研究