APP下载

基于卷积神经网络的图像异常检测方法

2018-08-11胡明辉李俊桂林电子科技大学

数码世界 2018年7期
关键词:概率密度函数概率密度损失

胡明辉 李俊 桂林电子科技大学

引言:异常的本质性的定义是:异常是数据集中与众不同的数据,这些数据并非随机偏差,而是来自于完全不同的机制。

异常检测的目标是找出给出数据集中的异常,由于异常检测任务中只有目标样本充分采样,而异常往往欠采样,故目前的异常检测,一般均从已知的正常类数据中进行学习,建立正常行为的模型来进行异常检测。

在图像处理领域,异常的图像是和大部分图像都不太一样的图像,这些图像的质量往往是很差的,比如图像模糊、显示不全、噪声严重等。异常检测可以找出这些异常的图像,方便下一步的处理。

1 直接概率密度比估计方法

利用概率密度比的方法来进行异常检测已被证明是一种很好的方法,通过求解正常样本集与要检测样本集的概率密度比的值来判断异常。根据异常的定义,异常一般发生在概率密度值很小的范围内,当用正常样本集的概率密度函数与要检测样本集的概率密度函数相比时,在异常处的概率密度比值会相对很小,这样异常就会被检测出来。

uLSIF(无限制条件的最小二乘拟合算法),就是用最小二乘方法对未知方程进行拟合来求得方程的输入对应的输出。无限制条件是指用最小二乘法拟合时的损失函数是没有限制条件的二次凸函数,而且损失函数的罚项为二次正则项,可以对拟合方程进行求导来求得拟合方程的系数矩阵,系数矩阵的值是非负的。

当用uLSIF算法时,要求直接密度比估计,需要先假设估计模型,然后构造代价函数用最小二乘法逼近真实值,当代价函数最小时估计模型最优。我们设概率密度比的估计为,定义损失函数为平方损失函数:,均方差:

又由于x为测试集样本概率密度函数。所以:

J(α)为J0(α)忽略最后一项常数项后的值。J(α)可以认为是两个期望的相减。损失函数最终可以用表示(uLSIF准则):

2 基于CNN的直接密度比估计与异常检测

用卷积神经网络(CNN)求解概率密度比时,根据uLSIF准则,是估计的直接密度比函数,为总的损失函数。在CNN中对于单个的独立样本可以把损失函数等价为:

为了训练CNN求解直接概率密度比,要把训练集分成两部分,一部分是全是正常样本的标准集,另一部分既有正常样本也有异常样本,我们称之为评价集。评价集包含训练集所有的异常样本,其他的样本从标准集中选取。

CNN根据反向传播算法更新参数完成对网络的训练。训练阶段完成时,损失函数调节为最小,参数调节结束。对于每个评价样本输入到训练好的CNN,输出是对样本进行求解的直接概率密度比估计值。

在测试阶段,输入测试样本到已经训练好的CNN,把求得的测试样本对应的直接概率密度比值小于阈值的检测为异常。

3 结论

本文根据直接概率密度比估计用于异常检测的思想,提出了使用卷积神经网络来求解概率密度比估计,再根据概率密度比估计值进行图像的异常检测。该方法利用了卷积神经网络模拟函数和自动提取图像特征的能力,比传统方法在思想上更加简洁、易于实施。

猜你喜欢

概率密度函数概率密度损失
幂分布的有效估计*
少问一句,损失千金
胖胖损失了多少元
连续型随机变量函数的概率密度公式
玉米抽穗前倒伏怎么办?怎么减少损失?
已知f(x)如何求F(x)
一般自由碰撞的最大动能损失
Hunt过程在Girsanov变换下的转移概率密度的表示公式
随机变量线性组合的分布的一个算法
随机结构-TMD优化设计与概率密度演化研究