基于深度学习的网络音乐检索系统设计
2022-07-26黄文专
黄文专
(肇庆医学高等专科学校, 口腔医学院, 广东, 肇庆 526020)
0 引言
网络音乐信息与用户提供的偏好信息相结合能够在用户查询网络音乐的过程中扩大音乐搜索范围,但现有的系统查询方式较为单一,查询结果的排序也难以满足用户需求[1-3]。为此,本文提出了一种基于深度学习的网络音乐检索系统,在不同机制下进行查询结果的初排序和重排序,通过深度排序学习的方式优化最终的查询结果,在很大程度上提升了用户的使用体验。
1 网络音乐检索系统架构
本文所设计的网络音乐检索系统主要包括初排序与重排序两个模型,系统的结构和工作流程如图1所示。
图1 基于深度学习的网络音乐信息检索系统
用户提出查询请求后,系统根据用户输入的原始内容通过Galago搜索引擎进行首次查询,得到网络音乐信息的原始排序结果,接下来利用伪相关反馈技术扩展查询内容并以此为基础进行二次查询,从而得到网络音乐信息的初排序结果;对初排序结果中的社会信息进行特征提取,基于不同的特征或多种特征的不同组合选择重排序机制;通过排序学习方法创建重排序融合模型,在充分融合各种排序结果的条件下输出最优的排序结果。
2 深度学习方法及技术实现
2.1 数据预处理
在用户进行网络音乐信息查询的过程中,系统会根据用户输入的查询内容和网络音乐信息中关键词词频对输出的结果进行排序,在系统启动搜索程序之前,需要同时对查询数据和音乐数据进行预处理,即通过建立信息丰富的索引来提高查询结果的质量[4]。网络中的部分音乐为数字形式,所以需要将其转换为统一的文本信息[5]。本文采用Galago搜索引擎根据文本信息的具体内容分别建立四种索引:整体数据索引、元数据(作者提供的关键词)索引、内容(音乐内容概括)索引、社会信息(用户的评论及为其设定的标签)索引。
2.2 伪相关反馈技术
为了获得更多的查询结果,可以在用户输入的初始查询内容的基础上选择与关键词意义相近的扩展词,同输入内容相结合组建扩充后的查询词句,以此来提高查询内容的丰富性、准确性和完整性[6]。伪相关反馈技术能够有效实现查询扩展,且通过该技术所获得的扩展词是对查询内容最大化扩展的结果[7],在基于用户的原始查询获得首批网络音乐信息后,在排序靠前的信息中提取扩展词来进一步丰富查询内容,可见扩展词的数量与准确性是由这部分网络音乐信息所决定的。
伪相关反馈技术有一个假定的前提,即根据用户原始查询内容所获得的查询结果中排序为1~k的网络音乐信息都确实与用户输入的关键词句相关,以此为基础实现查询结果初排序的流程[8]如下。
步骤1 通过用户输入的原始内容对查询结果进行首次排序,依据内容相关性的强弱选出排序靠前的k个网络音乐信息。
步骤2 从以上k个网络音乐信息中提取内容关键词,将出现次数最多的前w个词作为与用户输入相关的扩展词。
步骤3 根据用户输入关键词与扩展词相结合组建成的新查询词句进行二次查询,获得新的查询结果。
步骤4 利用Galago搜索引擎的查询似然模型对以上结果进行初排序,排序依据即相关性采用下式进行计算[9]:
(1)
2.3 重排序机制
对于本文所设计的检索系统,为了扩大查询目标的范围,首先假定与用户所偏好的音乐类型相近的音乐也可一并视为用户偏好的音乐,以此为前提的重排序可通过下式进行:
scorer(Q,D)=a×score(Q,D)+(1-a)e(D)
(2)
式中,score(Q,D)代表初排序评分;e(D)代表相似音乐发挥作用的大小,其数值通过相似度加权进行计算,即:
(3)
式中,sim(Di,Dj)代表初排序结果中第i名与第j名音乐的相似程度。Q为音乐的数量集。
若以网络音乐数据中单个域的出现次数作为重排序的依据,那么两首歌曲之间相似度的计算方法为
Sim(Di,Dj)=cos
(4)
式中,vecDi代表排名为i的音乐的特征向量;vecDj代表排名为j的音乐的特征向量。若以组合特征的相似度作为重排序的依据,那么基于初排序结果的相似度计算方法[10]为
(5)
式中,S(Di)代表与Di类型相似的音乐。对于式(5)的计算结果,若S(Di)中包含初排序结果中的音乐,那么该音乐的标记值为1,反之则为0,由此可通过相似度的对比得到重排序的结果。在此基础上,本文所建立的重排序机制为DTN、ITN、DT、IT、TN、T、N、I、D,其中T、N、I、D分别代表用户标签、浏览节点、相似音乐、相似音乐的相似音乐。
在以上多种重排序机制下所获取的排序结果需要经历一个有机融合的过程来保证排序的准确性,而当前排序融合多采用人工或半人工的方式进行,使得最终的结果极容易产生偏差,因此本文采用基于pointwise的深度排序学习方法来获得最优排序结果。Pointwise主要用于单一文档的处理,它能够将文档以特定的方式转换为特征向量,从而以机器学习模式下回归或分类的方式进行排序。在排序学习的过程中,以音乐的多个不同排序结果为特征向量,以音乐在最优排序结果中的排名为训练目标,获取多个排序结果与最优排名的映射关系,作为选择最佳重排序机制的依据。本文引入随机森林模型实现排序学习在重排序过程中的应用。
3 系统应用测试
3.1 测试参数
本文选取HIFIVE网络平台的音乐查询结果建立实验样本集,平台数据库中保存了280万首音乐的数据,每一条数据都包含丰富的内容信息和用户添加的各种社会信息,这些信息可划分为2种标签域,一是
表1 实验数据集
3.2 测试结果分析
本次测试选用排名前10的查询结果的准确性DB-CF算法平台[5]作为系统性能的评价指标。选取2019年的平台查询记录分别针对系统的初排序、重排序以及特征融合3个模型的不同参数进行实验。
首先对伪相关反馈的相关参数的不同设定值进行比较,实验结果如表2所示。Initial代表首次排序,PRF代表初排序,由表2中的数据可见在从原始排序结果前20名中提取15个关键词的条件下能够得到最优的初排序结果。
表2 初排序结果
接下来对重排序过程中所需设定的社会信息占比a的不同设定值进行比较,在表1数据集中进行初排序和全部特征组合的重排序,实验结果如表3所示。
表3 不同a值条件下的重排序结果
由表3中的数据可见,所有重排序结果的准确性都高于初排序结果,其中以tag为重排序机制的重排序结果相较于初排序结果在训练集与测试集中的准确率分别高出了6.17%和9.30%。
针对基于排序学习的重排序结果进行实验,以不同重排序机制为训练的输入,以训练集中的现实排序结果为标准,通过改变随机森林模型参数组合方式进行数据集训练,实验结果如表4所示。
表4 基于排序学习的重排序结果
由表4中的数据可见,利用排序学习方法将不同重排序结果进行有机融合,能够进一步提高重排序结果的准确性,其中通过排序学习使tag(T)重排序机制的准确率提高了13%,由此可见,本文所设计的系统能够大幅提高网络音乐信息查询的准确性。
4 总结
为了切实提高网络音乐查询结果的质量,本文提出并设计了一种基于深度学习的网络音乐信息检索系统,利用伪相关反馈技术初步扩大了网络音乐的搜索范围并获得初排序结果,根据用户在查询过程中生成的社会信息建立了重排序机制,最终通过排序学习方法实现了不同重排序结果的融合,由此得到了最优的排序结果。系统测试结果表明,该系统在很大程度上提高了网络音乐信息查询的准确性,为用户提供了良好的使用体验。