基于修正型粒子群算法的智能音乐作曲研究

2017-12-27崔峰

山东农业大学学报（自然科学版） 2017年6期

崔峰

渭南师范学院丝绸之路艺术学院,陕西渭南 714000

智能音乐作曲是指通过某种形式化的过程，使得曲作者借助于计算机实现音乐创作，保证人为介入程度最低。现阶段，国外在计算机作曲方面研究非常活跃[1]，而国内外由于这方面人才和技术的欠缺，导致智能音乐作曲还处于起步阶段。通过研究智能音乐作曲有助于我们理解和模拟作曲人进行创作的思维方式，同时有助于辅助作曲人进行音乐创作，此外还能娱乐于人。

1 修正型粒子群算法

1.1 粒子群算法

粒子群算法（Particle Swarm Optimization Algorithm，PSO）是受鸟群觅食行为启发所提出的群智能算法，通过群体间的协作和竞争实现最优化搜索，粒子通过公式（1）和公式（2）实现粒子位置和速度的更新[2]：

公式（1）和公式（2）中，vid(t)和xid(t)分别表示在t时刻时第i粒子的速度和位置；rand1和rand2表示随机数，处于[0 1]之间；c1、c2表示学习因子，为非负常数。

1.2 修正型粒子群算法

针对粒子群算法在优化搜索后期存在搜索能力下降和收敛速度缓慢的缺点，结合文献[2]的研究结果，提出一种修正的粒子群算法(MPSO)，其迭代公式如下：

其中，公式（4）用来保证粒子搜索的方向，确保算法可以在有效区域内进行搜索。公式（5）用来提高算法初期粒子的全局搜索能力和后期的算法局部搜索能力。a为改进粒子算法的控制参数，其大小决定粒子的分布。

2 音乐特征分析和描述

2.1 基本音乐特征分析

音乐特征主要包括三类，分别为整体特征、基本特征和复杂特征[3]。开始阶段，通过提取音乐中的基本特征，在此基础上分析得到复杂特征，之后结合基本特征和复杂特征识别出音乐的整体特征，主要有音乐的风格、曲式结构和情感内涵，结构图如图1所示。

图1 音乐特征结构图Fig.1 Music characteristic structure diagram

2.2 基本音乐特征描述

通常，音乐信息记录格式主要为WAVE格式和MIDI格式。其中，WAVE格式主要用于实时播放音乐信号的采样和数字编码，同时记录音乐的实际演奏效果。MIDI格式是音乐信号的传输标准，该格式主要用于音乐的演奏和全部乐谱的全过程的记录。绝大多数智能作曲均采用MIDI格式，因此本文智能作曲采用MIDI格式。

3 基于修正型粒子群算法的智能作曲算法

3.1 乐曲参数设置

调号为（1=C、1=G等），拍号为（2/4、4/4、6/8等）、调式选择方式主要有民族调式、小调式和大调式以及小节个数。

3.2 音级编码

音级主要包括基本音级和变化音级，所谓音级即乐音体系中的各音。乐音体系中，7个具有独立的音级被称为基本音级。通过升高或降低基本音级实现的音被称为变化音级[4]。

将低音1编码表示为11，中音1编码表示为12，高音1编码表示为12，音级由低到高，每增加一个音级，编码数值增加10。为了方便计算，本文的乐曲曲调定为C调。部分音级的编码如表1所示，其中，偏移半音数表示偏移中音1的半音个数。

表1 部分音级编码表Table 1 Partial scale degree encode

3.3 拍数时值的编码

拍数类时值型主要有1/2、1/4、1/8、1/16等多种类型，将拍数1/16为参考标准，标记为0，其它拍数的编码如表2所示：

表2 拍数时值编码表Table 2 Beat duration encode

3.4 音符的编码

音符编码采用三位十进制编码方式进行实现，前两位为音级，第三位为时值。选择歌曲《得民心者得天下》中的一小节简谱为研究对象[5]：4336

结合表1、表2的编码规则，该小节简谱可编码为：423,320,320,615

3.5 适应度函数选择

智能音乐作曲的主要问题就是作曲质量的评价，为了使得生成的音乐质量能最大限度地符合绝大多数人的审美和听觉习惯，需要多个不同类型的人群的参加，使得音乐质量的评估结果更加准确和合适。为了便于计算和操作，本文选择非对口组、对口组和专业组为评价对象，其评价的权重分别为15%、40%和45%。

其中，Ru、Rf、Rm分别表示非对口组、对口组和专业组的评估分数，Fitness(i)表示乐段个体的适应度值。

4 实验分析

4.1 评价指标

为了更好地客观地评价智能音乐作曲效果，本文采用区域内部均匀性测度(Uniformity Measure，UM)、区域间对比度(Regional contrast，RC)以及综合测度等三个指标评价智能音乐作曲效果[6]。

1）RC通过区域间的对比度实现智能音乐作曲结果的评价，其公式如下：

其中，f1，f2分别表示区域1和区域2的适应度值。

2）UM评价指标公式如下：

其中，Ri，Ai分别第i个区域的适应度值；f（x，y）表点（x，y）出的适应度值；C表示归一化参数。

3）综合测度

其中，α，β表示权值，且α+β=1。M越大，则音乐作曲效果越好；反之，效果差。

4.2 结果分析

为了验证本文算法的有效性和可靠性，将本文算法（MPSO）和遗传算法（GA）、人工神经网络（ANN）和粒子群算法（PSO）等进行智能音乐作曲结果进行对比，对比结果如表3、表4和图2所示。

图2 修正型粒子群算法作曲结果Fig.2 Composed result from MPSO

表3 不同方法的区域间对比度Table 3 Interregional contrast of different methods

表4 不同方法的均匀性测度Table4 Uniformity measure of different methods

图3 不同方法的作曲速度Fig.3 Composing speed of different methods

实际应用中，作曲速度也是一个关键指标，其快慢决定了方法的应用和推广。将作曲时间作为衡量其速度快慢的指标，单位为ms，对比结果如图3所示。由图3可知，GA进行智能作曲耗费的时间最多，MPSO具有作曲速度快、质量高的优点，同时能够满足实际应用的实时性要求。

5 结论

针对传统作曲算法存在速度慢、工作量的缺点，提出一种基于修正型粒子群算法的智能音乐作曲算法。选择非对口组、对口组和专业组的加权评价结果为适应度函数，通过音级、拍数时值和音符的编码实现音乐的数值编码。实验结果表明，提出的算法具有作曲速度快、质量高的优点，有助于作曲人进行音乐创作，极大地降低工作量，为后续研究工作奠定了较好的基础。

[1]Jones GA,Copley P.The suitability of genetic algorithms for musical composition[J].Contemporary Music Review,2003,22(3):43-55

[2]崔嘉,刘弘.遗传算法在计算机辅助创新作曲中的应用[J].计算机工程与应用,2007,43(3):198-206

[3]Todd PM,Werner GM.Frankensteinian methods for evolutionary music[M].Musical networks:parallel distributed perception and performance.Cambrige MA:MIT press/Bradford boos,1999:313-340

[4]Mehrabian A.Pleasure-arousal-dominance:A general framework for describing and measuring individual differences in temperament[J].Current Psychology,1996,14(4):261-292

[5]杜鹏,周昌乐,贺志强.一种基于遗传算法的自动生成创意曲动机的方法[J].计算机技术与发展,2007,17(4):150-153

[6]Maeda Y,Miyashita S.Chaotic Interactive Sound Generation System Using Interactive Genetic Algorithm[J].Journal of Japan Society for Fuzzy Theory and Intelligent Informatics,2009,21(5):768-781