APP下载

旋律搜索开辟音乐海洋新航道

2012-11-09袁莉萍房雨林

中国教育网络 2012年2期
关键词:搜索引擎旋律检索

文/袁莉萍 房雨林

旋律搜索开辟音乐海洋新航道

文/袁莉萍 房雨林

利用旋律主题搜索导航是一个全新的搜索方式,它主要基于旋律特征和旋律的主要片断对音乐内容进行检索,在大规模的音乐数据库中找到想要的音乐资源。

旋律主题联想(Melody Theme Associate)的音乐搜索引擎主要是针对网络上的音乐教学资源及音乐研究单位而研制的一个搜索引擎(Search Engine),它旨在为从事音乐研究、音乐教学、师生、艺术从业人员及社区民众在网络的海洋中进行资源的导航。它的目的是引导专业的用户通过搜索引擎有效地检索网络音乐信息资源。

音乐搜索引擎的构想

在对音乐教学多媒体资源引擎构想和设计的考虑过程中,首先对目前网上流行的几个知名搜索引擎的主要功能进行比较。WebCralwer是第一个全文搜索引擎,利用元搜索引擎的原理将模糊的、附加的搜索条件来智能优化用户的搜索结果。AltaVista是第一个支持自然语言搜索的搜索引擎,是一个能运用逻辑运算符实现高级搜索语法的搜索引擎。Google在网页排序、动态摘要、网页快照、多文档格式支持等方面颇具优势,它在集成搜索、多语言支持、用户界面等功能上独具匠心。Baidu虽然只能提供中文搜索,但是相关搜索词、错别字纠正提示、Flash搜索、信息快递搜索等方面进入一个崭新的阶段。

以上的几个引擎各具特色,它们最具精华的共同点就是注重关键词检索,重视链接的文字描述和链接的质量,重视描述(Description),以及超文本匹配分析。因此,搜索的功能具有广泛性,而音乐教学多媒体资源搜索引擎具有明显的针对性,特别是利用旋律主题检索技术求得网上搜索音乐教学资源的准确性。

搜索引擎的设计

音乐教学资源搜索引擎的构想是基于旋律主题联想的思考。网上有很多搜索引擎并没有了解到音乐教学机构和研究机构的真实需求,它们在设计的设想上通过一些简单的办法和“捷径”快速达到“优化”的效果,这种做法主要考虑到的是商业上的效益,而且有关于音乐方面的关键词也不够专业,不利于专业人士的搜索。而音乐教学资源搜索引擎在设计上一方面从关键词基本要素入手进行优化,建立音乐方面的专业关键词库;另一方面进行音频检索的优化,建立音乐主题音频库,以简谱的形式为搜索语言,以阿拉伯数字为表达方式,主要在音频的检索上做一个新的突破。

搜索引擎构想的目标

搜索引擎的目的是要为用户获取信息和服务提供方便。而音乐搜索引擎的目标是针对网络上的音乐信息资源实施深层次的挖掘研究,力求搜寻有利于音乐学术研究的核心信息源,为专业用户不断提供有价值的学术信息,提高音乐学科的研究人员和师生搜寻信息的准确率。它的最终目标是要用专业的网站结构设计和高质量的内容为专业用户群体进行服务。

图2 旋律主题引擎的工作模式

音乐信息资源搜索引擎优化既要遵守引擎内部的基本要素:网站结构、网站内容、网站功能和网站服务,与此同时要在搜索的手段上进行创新。引擎的优化立足点将表现在创建独具特色的音乐学科各专业的关键词索引数据库,以及以音乐为标识的简谱旋律主题数据库,通过实现对声音的检索将音乐多媒体数据库中的音频、视频、超文本等非格式化结构复杂的信息进行定点搜索。

搜索引擎主要功能特征

音乐教学资源在制作过程当中,采用多媒体信息技术和Web技术,网络上有关音乐资源多以图像、音频、视频等多媒体数据为载体,如何有效地按照多媒体数据的特性准确获取搜索信息已逐渐成为显学,由此产生基于内容的多媒体信息存取技术。音乐教学资源搜索引擎的功能就是基于内容的多媒体信息检索而产生,它吸纳传统数据库系统中信息以离散的形式(如字符、数字等)存储在关系数据库或W W W动态数据库中,以音乐专业术语和音乐主题旋律检索语言(Structured Query Language,SQL)对音乐旋律或超链接进行搜索,它的突出特点是建立独有的音乐旋律数据库,利用音乐键盘和计算机键盘为搜索工具,实现弹奏式检索。

搜索引擎的结构

引擎中的特色数据库

与许多引擎一样,音乐多媒体资源引擎也是由多个数据库组成。音乐教学资源库、音乐主题数据库、音频索引数据库、知识信息库四个专业数据库体现该引擎的主要特色。音乐教学资源库是集多媒体资源(图像、音频、视频、流媒体)形成音乐教学的精品课程、教学改课程、网络课程等优秀资源为一体的数据库。音乐主题数据库是采用音乐的主旋律以数字字符为内容,以数字为代表形式的关键词数据库。例如:《雨打巴蕉。音乐特征数据库创建音乐专业术语的数据表单,保证数据表的唯一性,根据独有的特征,预处理自动提取的内容特征,加速表和表之间的连接。知识信息库音乐教育领域的知识信息和通用知识信息,其中知识表达可以更换,以适应不同领域的信息要求。

总体结构及工作原理

数据库存储:这个阶段的主要工作是音乐教学资源库、音乐主题数据库、音乐特征数据库、知识信息库和相关文件的维护。在图2中,首先Robot到指定的站点上将旋律主题和可能相关的音乐信息下载,通过音乐教学资源库和音乐主题数据库进行特征识别和抽取模块中的音乐,信息处理模块的主要功能是去除页面中的无关信息,并对音乐信息做一些预处理,抽取出与旋律主题相关的描述信息,并生成相应的特征文件系统,根据知识库在特征文件中抽取出关键词,对关键词进行分析、聚类和分类,建立同义、相似、上下位等关系,并建立索引数据库,供系统进行检索。下文就对其中的四个关键部分作详细描述:

1. 旋律(简谱)数据库:旋律又称曲调,它是按照一定的高低、长短和强弱关系而组成的音乐线条。在数据库中,它是以阿拉伯数字为表达方式的七个音符组成,在数据库制作的过程中,根据音乐的特点一般截取音乐主题的前四个小节作为音频媒体信息中的特征。

2. 知识信息库:采用人工建立、系统自动建立、系统基于日志将搜索出的音乐有关信息加入到索引库中。这里所说的知识库在很大程度上就是指电子词库和词库,不同的是它还体现词间关系。此间关系分为同义、相关、上下位关系,通过知识库将这些关系组织在一起,就可以用来计算关键词之间的距离。比如:某一音乐的关键词是“歌剧”,通过它们之间的上下关系可以计算出与“歌剧”距离最为接近的是戏剧音乐、音乐剧等。

3. 音乐特征库:多媒体信息检索平台中的搜索引擎可以把用户检索接口获得的用户提问标识与多媒体特征库中的检索标识进行相似性匹配,并对匹配结果进行排序,按照检索算法,将满足用户信息需求的多媒体信息返回客户机,输出检索结果。

4. 检索式处理:检索服务器(客户机端)建立在Java apples上,主要功能是接受用户提供的检索式,并构建出符合系统需要的检索表达式。检索表达式经过Hnp server送到检索服务器(服务器端),检索服务器再根据检索结果的多少来调整检索表达式的范围,最后将结果包装成HTML格式返回给用户。

音乐信息的Web获取模式

音乐的旋律搜索是音乐学科与计算机学科交叉而研制出的一个成果。引擎采用J2EE应用程序、Applet、Java Servlet和Java Server Pages(JSP)、JDBC数据库等技术的组合。而音乐的旋律由一系列能反映该音乐主题的音符组成,能够充分显示音乐的内容特征。在一段旋律中,各个音符以一种含义丰富的形式连接在一起。它基本的音高符号在五线旋律谱中用C、D、E、F、G、A、B七个字母命名,在简谱中对应的是1、2、3、4、5、6、7。而在搜索当中,我们就利用7个简谱来作为搜索的条件来实现对旋律主题的检索。例如:中国曲目《花灯舞》的搜索流程如下:

1. 客户端发送请求到服务器端。

2. 服务器将请求信息发送到Servlet。

3. Servlet生成响应内容并将其传给服务器。响应内容动态生成,通常取决于客户端的请求。

4. 服务器将响应返回给客户端。

利用旋律主题搜索导航是一个全新的搜索方式,它主要基于旋律特征和旋律的主要片断对音乐内容进行检索,在大规模的音乐数据库中找到想要的音乐资源。这种新型的搜索方式,可快速准确地找到用户所要查找的音乐资源,这对于在互联网上实现音乐内容的检索(CMR: Content Music Retrieval)有重大的现实意义。这一课题的实现,将为大规模Melody 系统走向实用化提供关键性技术。

[1] 邱哲,符滔滔.开发自己的搜索引擎Lucene2.0+Heritrix[M].北京:人民邮电出版社: 2007: 9.

[2] 李 蕾,等.中文搜索引擎概念检索初探[J].计算机工程与应用:2000:1.

[3] 钟哲辉.基于计算机网络的信息检索[M].北京:电子工业出版社: 2007:125.

[4] 张晶.基于Web的音乐哼唱检索关键技术研究[D].西安:西北大学:中国优秀硕士学位论文全文数据库:2008:7.

广东省计算机网络重点实验室华南理工大学开放基金项目CCNL 2008704

(作者单位为星海音乐学院)

猜你喜欢

搜索引擎旋律检索
春天的旋律
吟诵的旋律性初探
2019年第4-6期便捷检索目录
7月,盛夏的旋律
专利检索中“语义”的表现
网络搜索引擎亟待规范
大地的旋律
基于Nutch的医疗搜索引擎的研究与开发
广告主与搜索引擎的双向博弈分析
国际标准检索