模式化思维与人机互动交互式遗传算法作曲

2014-12-31刘灏

人民音乐 2014年7期

数学原理向来对西方音乐有着悠久的历史性影响。不管是古希腊的毕达哥拉斯学派或是随着科技不断发展而涌现出来的宇宙学家与计算机学家，在观念里都一定程度上受到着“整个宇宙即是和谐和数”的观念的影响，诸如翰尼斯·开普勒、伽利略、莱昂哈德·欧拉、让·巴普蒂斯·约瑟夫·傅立叶、哈代等人都潜心研究过音乐与数学的关系。圣奥古斯汀有名言如是说道：“数还可以把世界转化为和我们心灵相通的音乐”。现代作曲家贝拉·巴托克、阿诺尔德·勋伯格、约翰·凯奇等人曾经在音乐与数学的结合这个命题上进行了大胆的尝试。作曲家泽纳基斯通过实践，创立了“算法音乐”，这种形式的音乐有机的将数学算法与音乐语言结合在了一起，将数学方法与音乐思维融会贯通，通过数字演算来完成创作，采用数字公式来为其作品命名，例如创作于1962年2月8日，通过计算而创作出的为10件乐器而作的作品《S+/10-1.080262》。根据时间的推移，跨国界国际音乐机构普利斯玛（PRISMA）通过不断创新与研究，在数学与音乐结合的体系中发展了卡尔海因兹·斯托克豪森的“图表音乐”（chartmusic）的思想，运用几何图形的旋转作曲为基础形成了一个新的创作体系，即“几何音乐”。数学思维在现代作曲技术中的地位变得越来越重要和具体。

一、模式化思维是算法作曲的重要特性

从一个音中蕴含的律到一部作品所契合的结构，数学无不体现着音乐的自然规律，音乐也无不体现着数学的严密逻辑。数学不仅对音乐研究、音乐分析以及乐器设计等能提供一种工具或技术的支持，在音乐创作——作曲方面，也具有其他学科不可替代的作用，我们所熟知的算法作曲（aIgo-rithmic composition）就是数学与音乐完美结合的产物。

模式化思维是算法作曲的重要特性，许多音乐结构形式如卡农、赋格以及许多作曲发展手法如倒影、逆行、模进等，都具有这种特征。具体表现为：算法作曲在一个有限的步骤中，利用某种预先设定的公式化的处理方法，来按部就班地产生音乐中的各个参数。人作为“算法音乐”的“创作者”，对音乐作品的干预仅仅体现在对处理过程（公式）的设定上。在这个过程的进行中，要最大限度地减少人为的干涉因素。如果我们宽泛地认定算法作曲是某种模式化作曲概念的延伸，那么，在计算机诞生以前，模式化作曲就已经是常用的音乐创作方法之一了，如巴赫的《歌德堡变奏曲》（见谱例1）。

该曲分两个声部，每个声部都有自己固定的节奏模式，每一小节的节奏模式都相同。第一小节所形成的节奏模式始终贯穿在乐曲中，在第五、六小节中，虽然上下声部来了个对调，但节奏型依然不变，模式化作曲对乐曲节奏的影响可见一斑。从《哥德堡变奏曲》的整体布局中，我们可以发现一个有趣的现象——30个变奏为每三个分为一组，每一组都是由一个抒情性较强的变奏、一个炫技性较强的变奏和一个卡农变奏组成。例如，第一组由变奏1、2、3组成，变奏1为一首前奏曲，偏重炫技；变奏2是一首三部创意曲，偏重抒情；变奏3是卡农变奏；而在最后一组中尽管没有卡农变奏但变奏30也大量使用了复杂的对位技法；其他两个变奏中，变奏28偏重抒情，变奏29偏重炫技。这是作曲家在创作过程中使用了模式化作曲的又一力证。

再如，14世纪经文中男高音声部常使用的等节奏，就具有模式化作曲的意义。

谱例2中前三小节的节奏模式始终贯穿旋律之中，3到5小节是节奏模型的重复，4到6小节是节奏模式的逆行，6到8小节是原型，9到11小节是原型。

美国作曲家勃朗宁（Zack Browning）在创作中把魔术方阵当作最重要的组织手法，这是模式化在算法作曲中的典型体现。他通常以四分音符的个数对应魔术方阵中的数值，每个数字对应由相同数目的四分音符数组成乐思段落。当一个数字转换至另一个数字时，音乐段落也会相应地变化。简单而言，就是作曲家规划好每个音乐段落中四分音符的数量，然后利用魔术方阵中每个数字对应相同四分音符的数量，随着魔术方阵中的数字改变，相应地音乐段落也随之发生改变。

勃朗宁运用算法作曲创作《丝乐王朝》时，事先规划好作品的整体布局和基准速度，具体是一个四分音符等于150，以此作为基准速度，然后按照比例关系如50就是基准速度的三分之一，200是其一又三分之一等，在作品的中段使用的方阵严格按照基准速度与其比例速度，保证了四分音符的数量与方阵的数字相对应。

《丝乐王朝》分为三个部分，即引子、中段和尾声。中段由三个方阵组成：方阵1代表中元六运的洛书方阵；方阵2代表1974年的洛书方阵i方阵3代表九月的洛书方阵。三者分别为乐曲委约者出生的所属年份周期、出生年份及出生月份。作者还从一本风水学入门中获得了所有方阵数字的排列，用三组方阵中的每个数字均乘以6，既符合方阵的规则，也使作品的长度恰当。勃朗宁选择了三个方阵并为每一个方阵设置其行进路径，其中方阵1是三条横向向右的路径，方阵2是两条横向向右和一条右下至左上的对角线路径，方阵3则是三条纵向并数字排列顺序有所变化（见图1）。

图l中的数字为方阵中数字排列，箭头表示作品中通过各数字的路径走向，圆圈内数字表示作品中路径使用的先后顺序，英语字母表示各数字相对应的乐思。作者按照框架结构中的路径，横向排列出方阵中相对的各数字，为每个数字配以速度和音乐素材，开始了音乐的创作。

运用魔术方阵的音乐创作方式是算法作曲的创作手法之一。魔术方阵是一种特殊的数字排列方式，1950年至1951年间，约翰·凯奇曾使用魔术方阵创作了两首乐曲，即《协奏曲——为预置钢琴与室内乐团》和《十六位舞者>。英国作曲家彼得·麦克斯威尔·戴维斯（Peter Maxwell Davies）从1975年起也持续地使用魔术方阵进行创作。除此之外，算法作曲还有确定性和偶然性两个特点。因此“算法作曲”也被称为“自动化作曲”（automated Ocomposition）。

二、计算机的出现为算法作曲带来endprint

技术上的革命

1946年，计算机的发明为人类带来了第三次技术革命。作为一种既能进行数值和逻辑计算，又能进行存储记忆，还能按照程序运行，并能自动、高速处理海量数据的现代化智能电子设备，它的发明在算法与作曲之间铺设了一条宽阔的现代化的高速通道，加速了算法作曲理论与实践发展的进程，对世界音乐产生了革命性的影响。如果说，算法作曲是某种模式化作曲概念在计算机上的延伸，那么，正是计算机作曲将音乐和科技联系到了一起。二者的结合，使人们利用计算机就能方便地创作出表达自己内心情感的音乐，即使作曲者对乐理知识不是很熟悉，也能做到游刃有余，因为乐曲是由计算机创造出来的。

20世纪是一个勇于探索的时代，在音乐方面，首先是调性被打破。调性打破后，音高独立了，音与音之间平等了。这一带有革命性的改变使许多作曲家摆脱传统的羁绊，力图用一种新的思维模式创造出崭新的音乐作品。在音乐文本的组织方式上，20世纪以后的现代派作曲家尤其呈现出多样莫测的变化。在这种情势下，加之音乐与科技的有机结合，必然会产生新的作曲理念，特别是在科技高速发展的今天，这种趋势日益明显。人们利用计算机、数学和Java Sound API，加入一些Java代码，就可以制作出一些迷人的音乐来。于是乎，一种崭新的音乐模式——运用电子手段产生或修饰的声音所制作成的音乐——电子音乐便应运而生。

由于计算机的出现，大大推进了算法作曲的发展。计算机本身强大的运算能力和可编程性为算法作曲提供了一个更为广阔的发展平台。借助计算机，作曲家获得了一个实现作曲过程自动化的新的机会。在整个算法作曲过程中，作曲家所要面对的“特定问题”就是“产生”音乐中的各个参数（创作音乐）。此时的作曲家更像是一个计划者或程序设计员，对具体产生音乐的过程很少甚至不进行任何的干涉。而在具体的音乐应用中，“算法”又可以被看作是一个在给定的上下文中判定音乐材料是否恰当的过程，音高、时值、力度和其他声音与结构的要素都可以根据某一组提问和回答的需要而被选择。

算法作曲之所又称自动作曲，是因为人（或作曲家）利用计算机进行音乐创作时，其介入能达到最小的程度。简而言之，就是在人（或作曲家）适当的介入下，计算机就能模仿人脑进行音乐创作活动。计算机技术的高速发展给电子音乐、数学算法和模式化作曲之间搭建起了一座互通的桥梁，特别是在新兴的交互式作曲领域，使用计算机来为特定的电子音乐编写程序，可以将数学的算法和模式化作曲的理念体现在计算机程序中。此时，作曲家甚至再也不需要写谱子了，因为其思维的体现已经隐藏在了程序里面，而演奏员每次演奏的音响均可能不尽相同，观众得到的感受也会体验各异。例如，用MIDI协议将音乐的音高，音强、音色都变成一堆数字，利用计算机的方式将其按照一定的作曲技法来进行排列组合，得出的音乐可能在初期音响感极差，但是当算法和计算机技术进一步完善之后，我们可能会惊奇地发现，计算机已经成为一个初级的作曲者。随着人工智能技术的发展，这个初级作曲者可能会慢慢变成一个高级作曲者，使用程序的平台也有可能从一个台式计算机慢慢转变到平板电脑甚至手机上，以致任何一个普通人都可以借助手机来完成作曲和最终的音响。至时，可能我们会感觉，音乐的巨大革命到来了。

三、人机互动的交互式遗传算法作曲

如前所述，算法作曲是在计算机上使用某种逻辑过程来控制音乐的生成，所以又称自动作曲，它是一种人工智能的作曲方法。随着计算机技术的普及和发展，这种方法越来越成为音乐创作中的一个重要辅助手段。一般说来，利用人工智能技术进行音乐创作时主要有数学模型方法、知识系统方法、人工神经网络方法、语法方法、案例推理方法、进化方法和混合系统方法等。这些方法，若论其优劣，各有长短。

作为最早被计算机作曲所采用的数学模型方法，其主要思路是通过分析作品，对其转换并构成一个数学模型，然后根据数学模型来创作新的音乐作品其数学模型主要是概率模型。这种方法的优点在于，它能利用随机过程或其他数学方法快速地产出新的音乐。与此同时，其弊端也较明显：首先，必须以大量的例子作为分析所采用的原始数据，收集并归纳整理出一套概率模式；其次，如何从大量的音乐作品中萃取出具有规律性和高层次的抽象音乐概念，是一件十分艰巨的工作。我们所认识的知识系统方法，就是通过建立一个知识库，采用如魔术方块这样的一类符号方式，遵循一定的规则来对知识进行描述。在创作时，人或作曲家可以根据自己的需要在知识库中进行明确推理和解释行为的选择。从当前来看，对于算法作曲而言，利用专家系统技术也许是最理想的选择但其本身存在严重的问题：其一，音乐领域十分广泛与抽象，涉及到许多社会与人文以及精神上的非物质层面，因此在音乐领域进行人为的归纳提炼，不仅费时而且十分困难；其二，程序设计员与专家存在很大的差异，包括所涉及的专业相关知识，因此难以设计出一种既合适音乐领域的程序处理方法；其三，系统会随着专家系统对本领域增加必须的规则例外与规则前提条件这两点而变得十分庞大与复杂。人工神经网络方法在作品的识别和感知中有较为成功的应用，它能获取和声性质音乐直觉，使听者产生主和弦出现的期望，作曲者可以选择在不同程度上符合或违背这种期望。在音乐创作中，人工神经网络虽然能比较成功地获取旋律表面的结构信息，但也存在问题：首先，它很难获取音乐中深沉的特性；其次，在时间的表示方面缺乏有效的手段。其他如语法和案例推理等方法，同样存在着这样那样的弊端，在此不一一讨论。

以上种种，无论是从随机事件中获取乐句的数学模型方法，或是知识库系统方法和神经网络方法等，在作曲过程中均存在着某种严重的局限或是不实用，特别是在需要为有关音乐知识寻找灵活表达时，往往很难。与此相比，遗传算法却具有优越于上述方法的一些特点，渐渐被越来越多的音乐创作者接受并应用到乐曲创作中。这是一种模仿生物进化过程的智能计算方法，其基本思想是将旋律看作是生物的染色体，通过交叉、互换、变异等操作，产生新的染色体，并用适应度函数判断哪些染色体被淘汰，然后进行新一轮的进化。endprint

交互式遗传算法作曲（Interactive Genetic Algorithmin Music Composition）是遗传算法作曲方法中的一种，它的特别之处在于当利用遗传算法来控制乐曲生存的过程时，人要对作曲系统产生的每一首乐曲进行艺术评价，进而引导乐曲的进化过程。这样，人与作曲系统之间就建立了一种交互关系。换句话说，在乐曲创作过程中，人机可以进行对话，并引导乐曲不断进行新一轮的进化，使生成的乐曲按照人的期望往优良方面发展。使用这种方法进行作曲时，能克服其他方法中人的被动性、随机性和盲目性等弊端，所选择和生存的乐曲比较适合人的欣赏习惯。交互式遗传算法系统作曲过程如图2。步骤说明： 1.系统使用者选取一定数量的与所要产生乐曲类型类似的乐曲进行试听，通过试听而进行感知，以增强判断乐曲的灵敏度： 2.系统根据音乐理论首先产生200个染色体，然后从中随机选取20个作为参与进化的个体： 3.使用者基于自己的认知对这些乐曲进行逐个评估，并选出最佳乐曲作为评价标准；

4.系统根据使用者的评估来对乐曲进行进化操作，随即再从200个新的染色体中选择出20个，然后乐曲评估与乐曲进化进行重复操作，直到系统使用者找到自己所期望的乐曲为止。

大量的实验证明，纯粹由计算机生成的音乐总是缺少点“感觉”，而这“感觉”恰恰就是音乐不能丢失的精髓或是灵魂，亦或是深沉特性。利用交互式遗传算法作曲技术进行音乐创作，开启了人（或作曲家）与计算机之间新的音乐关系，其中从人到计算机和从计算机到人的信息交换是其核心。这项技术的特点在于，计算机在生成音乐的过程中并不是独断专行地进行，人与机的关注是相互的、双向的，计算机关注着人的行为动向，而人又根据计算机的处理反应结果，通过评估不断地淘汰“劣等”染色体，从而获得更默契的融合。染色体的选择进化是通过人的评估来实现的，当人对于系统给予的乐曲不满意时，可以根据自己的情感意志反复对乐曲进行评估，使乐曲往优良方向进化，直至到自己满意的效果为止。这样，就避免了其他计算机作曲方式造成的被动性、盲目性、随机性。此外，在计算机生成音乐过程中，对系统使用者的要求并不是那么严格，具有一定的广泛性，它可由一人或多人参加，也可由专业人士或非专业人士参加，而这些人只要参与进行音乐评估，就能将自己的音乐感知融入到设备之中。利用这种交互式遗传算法所创作的乐曲，能基本满足部分人的感情表达需要和审美标准，对促进计算机音乐技术的发展具有重要的科学意义。

结语艺术借助技术的手段构建了艺术的“轮廓”，技术也因印有了艺术上的感觉而获得了特有的“神情”。如果不了解数学对于音乐的意义，在计算机进行音乐创作、音乐复制、现代乐器设计和声控设计等方面就不可能有进展。音乐创作的形式化技术除了被计算机专家使用外，古往今来的音乐家们也一直在使用。作曲家最重要的工作之一就是不断探寻各种方式，尽可能地把声音与时间以一种秩序或逻辑组织起来，使之成为一个整体，即音乐作品。算法作曲是基于数理逻辑的，且多数是基于计算机编程方式而自动生成的。随着计算机辅助作曲方式的出现与发展，日益成为许多作曲家所关注的焦点。研究交互式遗传算法在作曲中的应用，是对新媒体艺术的发展和创新的探索，是对多种学科有机结合的思考，更是艺术和技术有着天然不解之缘的理论证明。交互式遗传算法作曲的优点在于，乐曲在生成过程中，人的判断、评价、识别和情感在系统中扮演着十分重要的角色。这种方法在乐曲的创作中具有一定的现实意义，但并非完美无缺。与算法作曲中的其他方法一样，同样存在着不可避免的一些缺陷。不过，随着人工智能科学的高速发展以及对算法作曲研究与实践的不断深入，相信在不久的将来，人们不仅可以用计算机算法作曲制作出表达自己情感的音乐，还可以创作出类似莫扎特、贝多芬等著名音乐家风格的音乐来。参考文献[1]陶辛《计算机音乐思维研究》（一），《音乐艺术》2001年第 4期。[2]刘健《算法作曲及分层结构控制》，《黄钟》2003年第2期。[3]玛丽一克莱尔缪萨《二十世纪音乐》[M]，北京：文化艺术出版社2005年版。[4]陈世哲《基于全面控制的算法作曲系统的实现》，上海音乐学院[5]陶捷《九宫格中的牡丹亭与美国当代音乐》，《武汉音乐学院学报》2012年第1期。[6]田梅、黄智兴、张友刚《算法作曲中的人工智能技术》，《四川教育学院学报》2006年第12期。[7]张英俐、苏庆堂《交互式遗传算法在作曲中的应用》，鲁东大学现代教育技术教学部《计算机工程与设计》第20期。刘灏上海音乐学院音乐工程系讲师

（责任编辑张萌）endprint