太赫兹检测技术中的低成本信号处理方法
2017-06-02邹舟诣奥
邹舟诣奥
摘要:本论文以太赫兹频谱技术为基础,利用太赫兹频谱与物质上对应的独特性来检测不同物质。本文中的检测算法只利用有限个太赫兹频段而并非整个太赫兹频谱,因而是低成本处理太赫兹信号的方法。在比较五种不同的检测算法之后,得出最佳方法是最小二乘法。
关键词:太赫兹技术;物质鉴别;频谱信号分析
中图分类号:TN015 文献标识码:A 文章编号:1007-9416(2017)04-0056-02
1 太赫兹频谱简介
太赫兹(Tera Hertz,THz)是波动频率单位之一,等于1012Hz,通常用于表示电磁波频率。太赫兹波段能轻易穿透物质,基于不同分子在同一太赫兹频段反射或者折射的能量不同,可得独特的太赫兹反射或穿透频谱[1][2]。
2 方法步骤
(1)将3-120Thz频段电磁波射线照射物质获得太赫兹穿透频谱。本论文的太赫兹频谱数据来自RIKEN Center (3)。本文研究的10种物质:D(-)果糖、D(+)葡萄糖、黑钻、果糖、L(-)山梨糖、L(-)山梨糖、乳糖一水合物、麦芽五糖、麦芽五糖、麦芽糖。
(2)将穿透过物体的太赫兹级射线经16个滤波器过滤,并利用传感器换成电压值。
(3)在原数组中加入误差干扰,产生误差序列。
(4)找到在同等错误率下,允许误差干扰程度最大的算法。
简要流程图如下图1所示。
3 计算太赫兹频谱能量
计算太赫兹能量是利用矩形积分的方法:先将频谱划分为小矩形,再计算滤波曲线下小矩形的面积之和。将过滤频段的频率依次记为f1,f2…fn,太赫兹穿透率用T表示。积分之和计算如下。再将经过过滤器的太赫兹能量利用电压传感器转换成每种物质相应的16个电压数据。
4 算法简介
本章节阐述了五种寻找最相似数组的算法。误差干扰数组在matlab中用以下代码实现:resultnoise(1:100,i)=table(number,i)*(1-beta+(2*beta).*rand(100,1));其中table是原數组,resultnoise是误差序列。误差干扰程度由beta决定。检测正确率表示能成功检测出相匹配物质的正确次数百分比。反之为检测错误率,该文中用检测错误率来表示实验结果。
4.1 算法一:互相关系数法
互相关系数计算公式如下:
式中,ρ表示互相关系数;X,Y分别表示X序列和Y序列;σ为自相关系数;u为平均数;m为两序列之间的序列差。
表1表示应用互相关系数在低错误率时,最小误差干扰程度对应的物质。
4.2 算法二:最小二乘法
最小二乘法基本原理是计算误差序列与原数组的均方根值。公式如下:
其中,sample表示原数组;material表示误差序列。
表2表示应用最小二乘法在低错误率时,最小误差干扰程度对应的物质。
4.3 方法三:余弦分析法
两序列的相似度还可以用连线的斜率差异来反映,其中斜率差异用各时间段上连线的夹角的余弦量度。余弦分析法具体算法如下:
(1)原数组记为material,误差序列记为sample。
(2)标准化。
1)求均值。以原数组为例。
2)均值化生成。以原数组为例。
(3)求增量序列。以原数组为。
(4)计算各时段的相关系数。
其中βj计算式为:
(5)计算各时段关联度的加权系数。正关联加权系数记为W+,由下式计算而来。
其中m +是正相关总数;m -是负相关总数;A+是正相关平均值;A-是负相关平均值。负关联加权系数记为W_,关联度为零其加权系数为零[3]。
(6)计算总系数。
表4表示应用余弦分析法在低错误率时,最小误差干扰程度对应的物质。
4.4 方法四:邓氏关联度分析法
灰色关联分析是基于序列曲线几何形状的相似度来判断联系是否紧密。步骤如下:
(1)原数组记为material和误差序列记为sample。
(2)标准化。计算误差序列与原物质数组的差值。代入下式:
其中,ρ = 0.5;分别对应绝对差最大值和最小值。
(3)系数平均数即是相关系数。相关系数
n=16,k=1,2,….16
(4)依次计算出误差序列与原物质序列之间的相关系数。如果误差序列与本身原物质序列最相近则检测出相匹配的物质,表示检测正确。表5表示应用邓式关联法在低错误率时,最小误差干扰程度对应的物质[4]。
4.5 方法五: 灰色斜率关联度分析法
灰色斜率关联度分析法是基于斜率关联度计算的,其计算步骤如下:
(1)原数组记为material,误差序列记为sample。
(2)计算出序列的增量。
(3)确定灰色斜率关联度,由下面计算式而来
其中,k=1,2,…..16;i=1,2,……10;σ是序列方差;Δk=k+1-k=1;为序列在时刻t的斜率;σ是相关序列的标准差[4]。
斜率关联度
表6表示应用灰色斜率关联度分析法在低错误率时,最小误差干扰程度对应的物质。
5 五种方法的比较
从表7可知在同等错误率条件下,最小二乘法允许的误差干扰程度最高。因而,最小二乘法为最佳方法。
6 结语
本文研究了5种基于太赫兹频谱用于鉴别匹配物质的算法。由于只利用有限太赫兹频谱进行物质鉴别,所以本文里的算法为“低成本”算法。从5种算法的结果看出,最小二乘法为最佳方法。
还需进一步解决的问题:此篇论文研究限定于确定的10种物质之内,排除其他物质的算法还需继续研究。
参考文献
[1]F.Kaori. 5 Terahertz Spectral Database[J]. Journal of the National Institute of Information and Communication Technology. 1, 2008, Vol. 55, p. 66.
[2]B.Stuart.Modern Infrared Spectroscopy[M].New York,United States:John Wiley&Sons,Ltd,1996.
[3]D.Pengyu. Analysis on the Comparable Character of Sequences and a New Computation of Model of Correlation Degree[D].Hubei:Department of Control Science and Engineering,Huazhong University of Science and Technology, 2000.
[4]郭建博.三种灰色关联度分析法比较研究[J].科技信息,2008(01).