APP下载

BP神经网络在静态图像压缩中的应用

2014-03-12邹强韩涛张杰

新媒体研究 2014年2期
关键词:权值神经元向量

邹强+韩涛+张杰

摘 要 BP神经网络模型是一种发展较为成熟的网络模型,近年来在数字图像处理领域获得了广泛应用,尤其在图像压缩方面更有其先天的优势性。文章在介绍BP网络模型的基础上分析了基于BP网络的图像压缩原理与过程,并在Matlab平台上对静态灰度图像压缩进行了仿真实验,结果表明所设计的BP网络具有不错的泛化能力,用于图像压缩的效果较好。

关键词 BP神经网络;图像压缩;Matlab神经网络工具箱;仿真

中图分类号:TP391 文献标识码:A 文章编号:1671-7597(2014)02-0140-02

随着信息数字化时代的来临,计算机能更加灵活的综合处理文字、声音、图像与视频等多媒体信息,这从一定程度上丰富并改善了人们的生产生活方式,同时也为计算机产业的发展开辟了广阔的市场。图像作为主要的多媒体元素之一,具有直观准确、信息含量大、易存储可压缩、特征丰富等特点。图像信息的数字化处理及应用在医疗教育、国土资源、环境监测、工业化管控、远程视频会议等发挥了重大作用。但是图像数字化后的信息量与日俱增也给图像的存储与远程传输提出了重大挑战,单纯地增加介质存储容量与传输信道带宽并不能彻底解决问题,因而图像的压缩处理是必不可少的。近年来数字图像压缩技术作为数字图像处理技术的重要组成部分,取得了长足的发展,尤其在编码算法方面异彩纷呈。本文在阐述BP神经网络的图像压缩原理基础上,仿真实现了基于BP神经网络的静态灰度图像压缩。

1 基于BP神经网络的图像压缩

1.1 BP神经网络模型结构与训练原理

BP网络是目前发展较为成熟的神经网络模型之一,是一种利用非线性可微分函数进行权值修正与调整的多层前馈人工神经网络,能通过严谨的数学理论进行推理验证,在模式识别、函数逼近、数据压缩等方面获得了广泛应用与认同。BP网络算法的主要特点是输入信号正向传递,误差反向传播。BP网络的学习训练算法的实质是把样本集合的输入输问题变换为一个非线性优化问题。其网络结构分为输入层、隐含层、输出层等三层。一个典型的BP神经网络模型结构如图1。

图1 一个典型的BP网络模型结构

BP神经网络训练过程常包含以下几个步骤:①BP神经网络的初始化:根据具体问题抽取的样本输入输出向量集合系列确定输入层神经元节点数n1、隐含层神经元节点数n2及输出层神经元节点数n3;初始化输入层、隐含层与输出层三层神经元间的连接权值wij、wjk,并初始化隐含层阈值θ1与输出层阈值θ2,给定学习率α与神经元激活函数。②根据样本的输入向量X,输入层与隐含层间权值的wij及隐含层的阈值θj计算隐含层的输出Hj。j=1,2,…L式中,L为隐含层节点数;f为隐含层激活函数。③根据隐含层输出Hj,隐含层与输出层间的权值wjk和输出层阈值θk计算输出层的输出Ok。k=1,2,…M。④根据预测的输出Ok与期望输出Y计算网络的预测误差e。e=Y-Ok k=1,2,…M。⑤根据误差e对连接权值wij、wjk和阈值θ1、θ2进行更新。i=1,2,…n;j=1,2,…L。j=1,2,…L;k=1,2,…M。⑥判断训练算法是否迭代结束,若没有则返回步骤②继续进行。

1.2 BP神经网络的图像压缩原理

数字图像压缩是以较少的比特数有损或者无损地表示原来的像素矩阵的一种图像处理技术,其目的是减少图像数据中的时间冗余、空间冗余、频谱冗余等一种或多种冗余信息而达到更加高效的存储与传输数据。图像压缩系统无论采用什么具体的结构或者技术方法,其基本过程却是一致的,可概括为如图2所示的流程图,包括编码、量化、解码等三个环节。

图2 图像压缩基本流程

从理论上讲,编解码问题可以归纳为映射与优化问题,而人工神经网络从数学上分析就是实现了从输入到输出的一个非线性映射关系,并具有高度并行处理能力、较高的容错性与鲁棒性。分析图像压缩的基本原理、环节与BP的网络结构分布,可得出基于BP网络的图像压缩原理如图3所示。

图3 基于BP网络的图像压缩原理

在BP网络中,输入层到隐含层之间的映射关系相当于编码器,用于对图像信号进行线性或者非线性变换。而隐含层到输出层之间的映射关系相当于解码器,通过对压缩后的信号数据进行反变换以达到重建图像数据。压缩比率S=输入层神经元节点数/隐含层神经元节点数。BP神经网络的输入层与输出层的神经元节点数目从理论上应该是一致的,而隐含层的神经元数目比输入输出层地数目要少的多。这样理论上可通过调节隐含层神经元节点数目可达到不同图像压缩比效果。

2 基于Matlab平台的BP网络图像压缩过程分析

在Matlab平台上应用BP神经网络对数字图像进行压缩主要包括训练样本构造、及仿真与图像重建等以下环节。

2.1 网络训练样本的构造

考虑到须将整幅图像中的所有像素数据都作为BP网络的输入数据,为控制整个网络的训练规模及训练速度,对图像数据进行分块化处理,但同时考虑到邻近像素间的相关性及差异性,因而小图像块所占像素数不宜过大。假设一副图像由N×N个像素构成,将整幅图像分割为M个规则小图像块,其中每个图像块由n×n个像素组成,将每个小图像块的数据重构为一个列向量,作为网络的训练样本向量。在使用BP网络进行图像压缩前,需对样本向量进行归一化数据处理。常用的归一化处理方法很多,本文采用最值线性函数转换法。其函数表达式如下式:

式中,分别是转换前后的数据值,分别为数据集合中的最小值与最大值。通过以上归一化处理手段,可将每个训练向量的像素值归一到[0,1]的范围内。

2.2 仿真与图像重建

在创建并训练好符合条件的BP网络后,可借助仿真预测函数Sim对归一化处理后的图像向量数据进行仿真压缩,输出仿真向量,然后通过图像重建处理重新还原为一幅完整的图像数据。

3 Matlab平台上仿真实现及实验分析

图4 原始图像

本文以静态灰度图像作为实验研究对象,以大小为256×256的一幅灰色图像数据为例,如图4所示。为控制网络训练规模及时间,首先将整幅图像分割成大小为4×4的小图像块,再将每个小图像块转化为16×1的列向量,统一归一化处理后作为网络的输入训练样本。按照以上基于BP网络的图像压缩过程的分析,先创建BP网络,对相关参数进行适应性调整后,确定网络收敛结束的条件对网络进行训练。应用训练效果最佳的两组BP网络对图像进行仿真压缩并重建,其中第一组压缩比为4,第二组压缩比为2,仿真重建结果如图5、6所示。

从图5、6压缩后重建的图像视觉效果来看,隐含层的神经元节点数在一定范围内影响了图像的压缩效果,当隐含层节点数较多时,压缩比较低,压缩后重建的图像质量较好;但是从多次实验的过程来看,这种影响不是成线性比例的。同时网络训练的好坏也对图像压缩的质量效果有显著影响。

图5 S=4的压缩图像

图6 S=2的压缩图像

4 结束语

本文基于BP神经网络模型对静态灰度图像进行了图像压缩的研究,并在Matlab平台进行了仿真实现,训练出的网络的图像压缩效果较好。基于BP神经网络的图像压缩编码是一种有损压缩编码,它不是借助图像数据中的统计信息冗余进行压缩,因而在一定程度上牺牲了图像的细节。

参考文献

[1]贾永红.数字图像处理[M].武汉:武汉大学出版社,2003.

[2]蒋宗礼.人工神经网络导论[M].北京:高等教育出版社,2010.

[3]飞思科技产品研发中心.神经网络理论与MATLAB7实现[M].北京:电子工业出版社,2005.

作者简介

邹强(1987-),男,汉族,江西宜春人,助理工程师,硕士研究生,研究方向:近景摄影测量、数字图像处理、光电测试。

韩涛(1985-),男,汉族,陕西汉中人,助理工程师,硕士研究生,研究方向:近景摄影测量、光电跟踪测量。

张杰(1983-),男,汉族,江苏苏州人,工程师,硕士研究生,研究方向:近景摄影测量、数字图像处理、光电测试。endprint

猜你喜欢

权值神经元向量
向量的分解
AI讲座:神经网络的空间对应
仿生芯片可再现生物神经元行为
这个神经元负责改变我们的习惯
研究人员精确定位控制饮酒的神经元
向量垂直在解析几何中的应用
财务风险跟踪评价方法初探
向量五种“变身” 玩转圆锥曲线
基于洪泛查询的最短路径算法在智能交通系统中的应用