模糊语义距离在多媒体信息检索中的应用
2020-08-26党鹏飞
摘要:由于传统的多媒体信息检索方法,在进行多媒体信息检索时无法对模糊语义多媒体信息特征距离的计算不精准,因此多媒体信息模糊相似度低,无法实现对多媒体信息的精准检索。针对这一问题,根据模糊语义距离在多媒体信息检索中的应用,提出基于模糊语义距离的多媒体信息检索方法。首先,确定多媒体信息特征的模糊空问;计算模糊语义多媒体信息特征距离;根据多媒体信息的模糊相似度完成检索。实验结果表明:设计的检索方法多媒体信息检索模糊相似度最高可达0.873,实验对照组最高仅为0.425,设計的检索方法检索能力更强,可以实现对多媒体信息的精准检索。
关键词:模糊语义距离;多媒体;信息检索;特征距离
中图分类号:TP391 文献标识码:A
文章编号:1009-3044(2020)20-0195-02
多媒体信息在传统信息的基础上增加了Binary Large Ob-ject数据类型,主要用于对多媒体信息中的图像数据、文本数据以及声音数据等的表示[1]。模糊语义距离实际上指的就是模糊测度,通过具体数值来表示相似性之间的度量。模糊语义距离作为一种应用广泛的度量方法,其最基本也是最主要的就是确定特征的模糊空间。可以肯定的是,语义的模糊性并不会影响信息检索的准确性。模糊语义距离在多媒体信息检索中的应用也主要体现在通过模糊语义距离确定多媒体信息特征的模糊空间,可以通过判断模糊空间中多媒体信息特征确定的大小程度,进而判断多媒体信息特征的相似权值[2]。在多媒体信息实际检索过程中,对多媒体信息的模糊查询概念是不可避免的,在没有完备检索条件的前提下,检索到最接近或者说最相似的多媒体信息检索结果[3]。因此,本文根据模糊语义距离在多媒体信息检索中的应用,提出基于模糊语义距离的多媒体信息检索方法。
1基于模糊语义距离的多媒体信息检索方法
1.1确定多媒体信息特征的模糊空间
假定在一个多媒体信息V中,包含个多媒体信息特征。在每一个多媒体信息特征中都可以通过进行测量,那么之间的连线就构成了多媒体信息特征的空间。再通过模糊语义距离中的模糊子集[ail,ai2,…,ain]对多媒体信息特征的空间进行模糊语义描述,可得到多媒体信息特征的模糊空间为[ai1×ai2×…×ain]。多媒体信息特征的模糊空间示意图,如图1所示。
在图1中,A、B、C为映射多媒体信息特征的模糊空间的三条直线。通过图1不难看出,多媒体信息特征的模糊空间的性能会随着多媒体信息特征空间维数的增加而下降,大多用于对单一多媒体信息特征进行描述,综合多媒体信息特征描述较少。
1.2计算模糊语义多媒体信息特征距离
在确定多媒体信息特征的模糊空间的基础上,通过模糊语义距离衡量两个多媒体信息特征模糊空间的模糊相似度[4]。模糊语义距离包括三种距离,分别为Hamming距离、Euclid距离以及Minkowski距离。本文针对Hamming距离对多媒体信息特征进行测距。设模糊语义多媒体信息特征Hamming距离为Sim(x,y),则Sim(x,y)的计算公式,如公式(1)所示。
在公式(1)中,n指的是多媒体信息特征矢量;i指的是多媒体信息特征个数,为实数;w指的是多媒体信息特征模糊空间的平滑系数;m指的是多媒体信息特征模糊空间的摩擦系数;k指的是多媒体信息特征权值系数;g指的是多媒体信息特征隶属度函数;μ指的是多媒体信息特征维数;x指的是模糊语义多媒体信息特征Hamming距离横坐标;y指的是模糊语义多媒体信息特征Hamming距离纵坐标。对公式(1)进行基于模糊语义距离的公式转换,得到的模糊语义多媒体信息特征距离最终计算公式,如公式(2)所示。
公式(2)就是本文提出的基于模糊语义距离的多媒体信息检索方法对模糊语义多媒体信息特征距离的计算表达式。根据模糊语义距离的三种属性,可得模糊语义多媒体信息特征的具体距离信息,如表1所示。
结合表1信息,不同的模糊语义距离属性对模糊语义多媒体信息特征距离会造成一些微小的影响。在利用公式(2)计算模糊语义多媒体信息特征距离时,多媒体信息特征检索条件可能不是完整的,甚至有可能遇到连多媒体信息模糊描述的语义都不能提供。所以,必须将这些不能确定值的多媒体信息特征在棋糊语义距离的计算中删除,确保模糊语义多媒体信息特征距离计算结果不受其干扰。
1.3检索多媒体信息模糊相似度
在利用模糊语义距离检索多媒体信息中,通过计算多媒体信息模糊相似度,检索用户感兴趣的多媒体信息特征。设多媒体信息模糊相似度为c,则其计算公式,如公式(3)所示。
在公式(3)中,u指的是模糊语义多媒体信息特征相似权值。通过多媒体信息模糊相似度,检索多媒体信息模糊相似度最高的多媒体信息。同时,每个多媒体信息模糊相似度的重要性依赖于多媒体信息特征的模糊空间中查询特征矢量的位置,多媒体信息模糊相似度越大,对多媒体信息检索的精度也就越高。
2实验
2.1实验准备
为构建实验,本文在Windows计算机系统上采集了7584个多媒体信息样本作为实验对象。根据多媒体信息样本的特征作为识别依据,确定多媒体信息特征的模糊空间。本次实验选取的多媒体信息样本具体参数,如表2所示。
结合表2信息,分别使用传统检索方法以及本文设计检索方法进行实验,设置传统的检索方法为实验对照组。验证硬件环境包括:处理器Inter(R) Core(TM) Duo CPU;支持8线双绞线同轴电缆光纤专网、CPRS/DCMA无线公网、无线专网。实验软件为Multimedia Data系统,主要用于对多媒体信息检索的仿真模拟。实验主要内容为测试两种检索方法的多媒体信息检索模糊相似度,从而评定检索精准度更高的检索方法。在此次的实验中,共进行9次实验。针对Multimedia Data仿真实验软件测得的多媒体信息模糊相似度,记录实验结果,进而判断两种检索方法对于多媒体信息的检索能力。
2.2实验结果分析与结论
根据上述设计的实验步骤,采集9组实验数据,将两种检索方法下的多媒体信息模糊相似度进行对比,多媒体信息模糊相似度对比结果,如表3所示。
通過表3可得出如下的结论:本文设计的检索方法多媒体信息检索模糊相似度最高可达0.873,实验对照组最高仅为0.425,设计的检索方法检索能力更强,可以实现对多媒体信息的精准检索。通过实验验证结果证明,所没计的检索方法其各项功能均可以满足设计总体要求,可以广泛应用于多媒体信息检索方面。
3结束语
综上所述,模糊语义距离在多媒体信息检索应用中的具体优势已经显现出来。多媒体信息检索模糊相似度的高低是保证多媒体信息检索精度的主要衡量标准,而针对多媒体信息检索方法进行基于模糊语义距离的设计可以大幅度提高多媒体信息检索精度。基于模糊语义距离的多媒体信息检索方法不但能够完成传统多媒体信息检索方法所不能完成的任务,还能以模糊语义距离为核心算法,为多媒体信息检索领域的研究提供学术意义。本文唯一不足之处在于没有对模糊语义距离在多媒体信息可视化检索中的应用进行深入分析,相信这一点,也可以作为多媒体信息检索领域日后的重点研究方向之一。
参考文献:
[1]张静,靳淇兆,王洪振,等.多尺度信息融合的遥感图像语义分割模型[J].计算机辅助设计与图形学学报,2019,31(9):1509-1517.
[2]杨建宇,周振旭,杜贞容,等.基于SegNet语义模型的高分辨率遥感影像农村建设用地提取[J].农业工程学报,2019,35(5):251-258.
[3]何晓庆,唐李杏,张雅晴.基于知识转移的翻转课堂在信息检索课教学中的应用——以四川大学图书馆为例[J].四川图书馆学报,2018,1(3):012-015.
[4]朱卫东,兰月华,蔡德清.面向科研创新的研究生信息检索实习模式构建研究——以Web of Science检索平台在线分析为例[J].老区建设,2019,1(10):075-078.
【通联编辑:张薇】
收稿日期:2020-03-15
作者简介:党鹏飞(1984-),男,河南周口人,本科,中级工程师,研究方向:数据统计分析技术。