APP下载

基于聚类分析的多谱式工尺谱文稿的有效空间信息提取研究

2016-06-22陈根方董凌宇

关键词:空间信息聚类分析

陈根方,董凌宇

(杭州师范大学杭州国际服务工程学院,浙江 杭州 311121)

基于聚类分析的多谱式工尺谱文稿的有效空间信息提取研究

陈根方,董凌宇

(杭州师范大学杭州国际服务工程学院,浙江 杭州 311121)

摘要:针对中国留存的大量古代多谱式工尺谱文稿的时空异构信息分类问题,通过分析多谱式工尺谱的记谱法准则,对文稿携带的异构信息进行时空拆分,提出了基于层次聚类分析的文稿有效空间信息提取方法.实验数据表明,层次聚类分析对多谱式工尺谱文稿的有效空间信息提取具有较好的识别效果,能为工尺谱等传统文化与艺术形式的数字化提供相应的思路与手段,对传承和弘扬中国传统文化具有一定意义和良好的应用前景.

关键词:工尺谱;聚类分析;空间信息

五线谱是西欧传统的音乐记谱法,中国传统的音乐记谱法主要是工尺谱记谱法,存见的大多数传统剧种(如昆曲)和中国传统乐器(如琵琶)的乐谱都采用工尺谱记谱法来记录音乐[1].工尺谱记谱法使用的记谱模式多样,乐谱的谱式和书写方法呈现多样化异构特征(图1).根据文献[2]统计,存见的工尺谱谱字有30余种异构形态,乐谱的书写谱式有半蓑衣谱式、直行竖写谱式(图1a)、直行横写谱式(图1b)等类型,字体有刻板印刷体(图1a)、手写体(图1c)等,并形成了一些独立的区域性工尺谱记谱子体系,如福建一带的南音记谱法、北京智化寺的佛教用工尺谱谱字、西安鼓乐工尺谱等都与通用的工尺谱谱字略有变化[3].

联合国教科文组织在2001年公布中国昆曲为第一批人类口头与非物质文化遗产[4].昆曲遗产丰富,其剧本曲谱采用工尺谱记谱法,如清代乾隆十一年(1746年)允禄等奉旨编纂的《九宫大成南北词宫谱》就收录了工尺谱曲谱4 466首[5];在敦煌莫高窟中发现的《敦煌曲谱》(933年)有25首琵琶曲谱.工尺谱作为载体,保存了前人大量的音乐遗产,为中华民族音乐的传承与发展做出了巨大贡献.

目前,有关工尺谱的研究主要集中在对工尺谱乐谱音乐理论的分析和研究上,利用信息技术处理工尺谱乐谱的研究和探索相对较少.如陈荣鑫等[6]设计开发了福建南音工尺谱的排版软件,可以输出工尺谱乐谱和简谱或五线谱合成的乐谱;文献[7]介绍了工尺谱的翻译和排版软件等.这些研究成果仅局限于工尺谱的翻译和排版,为工尺谱在数字化时代的传承打下了一定基础.利用光学乐谱识别技术的传统模式对工尺谱文稿的音乐信息提取已经有了一些研究[8],它采用传统的OMR技术,针对昆曲的工尺谱乐谱(乐谱主要来源于《纳书楹曲谱》与《九宫大成南北词宫谱》)进行了音乐信息的提取研究,但谱字分割正确率和谱字识别率较低,存在乐谱中噪音多、谱面复杂、分割算法对倾斜敏感等缺陷.

1多谱式工尺谱文稿的时空信息分析

音乐是时间艺术,乐谱中不仅要用空间符号体现出音高、节奏信息,而且要体现出乐音间的时间信息,工尺谱记谱法巧妙使用了页面的二维空间,把音乐信息的三维结构或者二维结构进行合理的布局.三维结构谱面的第1维是歌词,第2维是音高谱字,第3维是节奏谱字,如图1;二维结构谱面的第1维是音高谱字,第2维是节奏谱字.各维度之间存在附属关系,歌词、音高谱字、节奏谱字之间的附属关系明确,每个歌词附属若干个音高和节奏符号,每个音高谱字附属若干个节奏符号.

a:来自《纳书楹曲谱》[9];b:来自《遏云阁曲谱》[10];c:来自《太古传宗》[11].图1 不同书写谱式的多谱式工尺谱曲谱图例(时间跨度1 000年—从唐代到清代)Fig. 1 Different writing type of Gong-che notation musical scores

尽管工尺谱的书写谱式多样,但乐谱的时空信息在页面记谱方式上仍有一定的规律:1)时间信息.乐谱的时间信息由符号的书写顺序决定,页面书写顺序与中国传统书写方式一致,遵循从右到左、从上到下的顺序.图1的3张乐谱中,不仅歌词符合这一规律,每个歌词的若干个音高谱字也符合这一规律;2)空间信息.在字号大小上,歌词(如有)的字号大于等于音高谱字的字号,音高谱字的字号大于节奏谱字字号.图1a中,字号最大的符号是歌词,其次是歌词右边的音高谱字,最小的是音高谱字右上角的节奏谱字.

工尺谱乐谱的历史文稿汗牛充栋,是明清时期使用最普遍同时刊印出版乐谱最多的中国传统音乐记谱法.但现今国内绝大多数音乐院校和普通中小学以西方的音乐体系教学和培养人才,中国原有的传统音乐遗产只能在民间和音乐研究机构范围内被传承,极大地制约了传统音乐的广泛传播.

2去除无效空间信息的聚类分析方法

尽管工尺谱的谱面形式多样化,其中携带的信息包括了有语义的信息和无效的信息,从图1的工尺谱谱面的二维空间分析,无效信息主要集中在边框和边框外的二维空间区域,因此,去除边框和边框外的二维空间区域即可提取有语义的有效信息.

2.1特征提取

特征是某物体区别其他物体信息的描述.图像的特征通常有局部特征和统计特征之分,局部特征一般指图像的空间特征,包括颜色、光亮、灰度、直方图、连通区域等,而统计特征则指图像空间的统计信息.

本文利用图像的连通区域标记算法[12]对文稿图像的连通区域进行标记,得到多维特征数据集,如连通区域的长、宽、面积、最小横坐标、最小纵坐标等,图2显示了对图1a进行连通区域标记后得到的特征数据,其中子图2a为所有连通区域的长、宽为坐标的图示.很明显,有些孤立点是页面框架,有些是粘连在一起的谱字块;图2b为利用形态学变化聚类去掉孤立点后的所有连通区域的长、宽图示;图2c为连通区域的相同最小横坐标出现的次数图示;图2d为连通区域的相同最小纵坐标出现的次数图示.

图2 对图1a的连通区域标记后特征数据的图示结果Fig. 2 Graphical results of the characteristic data of the connected-components from Fig. 1a

2.2聚类分析

聚类分析是人工智能的重要研究内容,是无监督的分类方法,通常把一些具有某些特征表示的数据集按数据之间的相似性进行合并,最后达到分类的目的.常见的聚类方法有层次聚类算法、顺序聚类算法、基于密度聚类算法、基于代价函数最优聚类算法、概率聚类算法、模糊聚类算法、最小生成树聚类、竞争学习算法、基于形态学变换聚类算法、边界检测聚类算法、分支与约束聚类算法、遗传聚类算法等.

层次聚类具有距离和规则的相似度容易定义、限制少、不需要预先制定聚类数等优点,适合工尺谱语义信息和无效信息的分类特征.它一般包含若干步,对于第t步而言,是在第t-1步的基础上进行进一步聚类,包括合并聚类和分裂层次聚类两种算法.工尺谱的有效空间信息提取采用合并算法,具体步骤如下:

3) 重复2),直到所有的数据加入到2个类别中,即有效语义信息类别和无效信息类别.

3实验结果与分析

实验选取了两部经典的清昆曲剧本《九宫大成南北词宫谱》[5]和《纳书楹曲谱》[9]为例,它们分别包含有6 951页和4 242页有效的乐谱.先利用图像处理方法对每页乐谱图像进行二值化处理,然后对每页乐谱图像进行区域标记,提取出区域特征,包括面积、周长、宽高等,再利用层次聚类算法,对每页乐谱进行有效语义信息和无效信息的分类,最后统计无效信息的识别效果.

随机选取了《纳书楹曲谱》的一页曲谱,对分类结果进行图示(图3).图3a为有效语义信息的空间图像,图3b为无效信息的空间图像.很显然,图3b主要由边框组成,利用边框可以获取边框内的有效语义信息,而边框外为无效信息的空间图像.

表1统计了实验用乐谱的无效信息的识别率,这里的无效信息以边框为代表,统计了乐谱的三边边框或四边边框的识别率.显然,每种图像局部特征的三边边框的识别率都高于四边边框.观察图3可知,一般的乐谱由于版式上的安排,边框的三条边比另外第四条边要明显,这也符合人们的主观感受.

表1 《九宫大成南北词宫谱》和《纳书楹曲谱》的乐谱空间无效信息的总识别率

4结语

工尺谱作为中国和东亚地区古代主要的音乐记谱法,记录了大量的音乐作品,包括入选世界非物质文化遗产名录的昆曲等戏剧和琵琶等乐器的乐谱都采用工尺谱为音乐信息的记录方法.在现代,中国和东亚地区的音乐人大多使用五线谱和简谱为音乐信息的传承载体,携带有大量音乐信息的工尺谱乐谱已经少有人用,因此分析和提取工尺谱乐谱的音乐信息,并用现代记谱法进行还原,是古代音乐复用的关键工作.

由于工尺谱的记谱方法和音乐符号在历史的长河中变化多端,乐谱的谱式多样,这给工尺谱的数字化带来了诸多不便.本文通过分析工尺谱的时空信息布局特点,利用层次聚类分析方法,提取出乐谱中的有用信息,为进一步的音符音高识别、板眼识别、时序识别等后续时空信息的分类工作打下基础.

参考文献:

[1] 陈泽民.工尺谱入门[M].北京:华乐出版社,2006:1-6.

[2] 杨荫浏.工尺谱浅说[M].北京:音乐出版社,1962:15-18.

[3] 吴晓萍.中国工尺谱研究[M].上海:上海音乐学院出版社,2005:32-97.

[4] 周兵,蒋文博.昆曲六百年[M].北京:中国青年出版社,2009:1-2.

[5] 允禄,周祥钰,邹金生,等.九宫大成南北词宫谱[M].[S.l.]:[s.n.],1746(清乾隆11年):1207-1230.

[6] 陈荣鑫,陈维斌.南音工尺谱排版软件的设计与实现[J].计算机工程与设计,2005,26(8):2246-2248.

[7] 新华网.南音工尺谱可直译成五线谱:泉州两教师用电脑立功[EB/OL].[2015-06-18].http://news.xinhuanet.com/newscenter/2002-10/17/content_599827.htm.

[8] CHEN G F,XU J X.A novel method of multiple classifiers combination forGong-chenotation musical score[J]. International Journal of Digital Content Technology and its Applications,2012,6(1):82-87.

[9] 叶堂.纳书楹曲谱[M].[S.l.]:[s.n.],1792(清乾隆57年):1725.

[10] 王锡纯.遏云阁曲谱[M].[S.l.]:[s.n.],1871(清同治10年):587.

[11] 汤斯质,顾峻德.太古传宗[M].[S.l.]:[s.n.],1749(清乾隆14年):259.

[12] CHANG F, CHEN C J, LU C J. A linear-time connected-component labeling algorithms using contour tracing technique[J]. Computer Vision Image Understanding,2004,93(2):206-220.

Cluster-based Extraction Method for Effective Spatial Information of Multi-typeGong-cheNotation Musical Manuscript

CHEN Genfang, DONG Lingyu

(Hangzhou Institute of Service Engineering, Hangzhou Normal University, Hangzhou 311121, China)

Abstract:Aiming at the space-time heterogeneous information classification for the ancient-retained multi-type Gong-che notation musical manuscript in China, a hierarchical cluster-based extraction method is proposed by analyzing the criterion of Gong-che notation and the heterogeneous information in the manuscript. The results show that hierarchical cluster analysis has good recognition effect for multi-type Gong-che notation musical manuscript. The method provides relevant idea and methods for the digitization of traditional culture and art forms like Gong-che notation, and has important significance and good application prospect for the inheritance and development of Chinese traditional culture.

Key words:Gong-che notation; cluster analysis; spatial information

收稿日期:2015-07-31

基金项目:国家社会科学基金项目(14FYS004); 浙江省自然科学基金项目(LY14F020037).

通信作者:陈根方(1968—),男,教授,博士,主要从事非物质文化遗产数字化保护、数字音乐研究.E-mail:cgf@hznu.edu.cn

doi:10.3969/j.issn.1674-232X.2016.03.018

中图分类号:TP391

文献标志码:A

文章编号:1674-232X(2016)03-0321-04

猜你喜欢

空间信息聚类分析
结合多层特征及空间信息蒸馏的医学影像分割
《地理空间信息》协办单位
基于聚类分析研究贵州省各地区经济发展综合评价
新媒体用户行为模式分析
农村居民家庭人均生活消费支出分析
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
基于作战环的空间信息时效网关键节点分析模型
“县级供电企业生产经营统计一套”表辅助决策模式研究
基于空间信息格网与BP神经网络的灾损快速评估系统