APP下载

探索未来:从计算机辅助作曲到AI作曲

2022-10-12文字林新远

音乐爱好者 2022年7期
关键词:作曲音高计算机

文字_林新远

随着科技的不断发展,计算机与音乐的结合日益深入。当下,我们的生活中不断充斥着一个名词“人工智能”(Artificial Intelligence,简称AI),它深刻影响着我们的工作与生活,现在在医疗、购物领域几乎随处可见,在音乐创作方面亦然。如今我们也能听到许多由AI“创造”的音乐作品。其实,计算机音乐、人工智能音乐早已不是一个新名词了,可追溯至二十世纪五十年代,《伊利亚克组曲》()就是一部由计算机创作的音乐作品。提及计算机对音乐创作的影响,我们不可绕开的一个概念便是“算法作曲”。

算法作曲与AI作曲的关系

算法作曲,又称“自动作曲”,是指创作者使用某种形式化过程(如编程)来生成音乐。由于创作过程的不同,算法作曲可被分为计算机辅助创作、计算机独立完成两种方式,后者则是AI作曲的雏形。为何将计算机独立完成音乐创作的方式称为AI作曲的雏形呢?这是由于当下我们对AI作曲的认识不仅停留在“独立”完成上,还寄希望于AI能拥有人一般的“大脑”与“情感”。虽然计算机辅助创作与AI作曲之间有着密不可分的关系,但两者又有所区别,AI作曲更像是计算机辅助作曲遗传变异的结果。这类创作形式,计算机的自动化程度较低,大多需要人为干涉操作。通常情况下,计算机辅助创作有多种运用方式,如对声音进行处理、利用一些数据来设计算法、使其生成音高与节奏等。

利用算法对声音进行处理——数字信号处理器

在对声音进行处理时,计算机需要参与的内容较为简单,包括对声音素材进行变形,改变音高、速度、切片等。

在使用实时方式时,我们可以通过计算机编程,借助Kyma、MAX/MSP等辅助算法作曲系统(CAAC)来实现。例如,作曲家可以提前将需要使用的数字信号处理器以插件的形式搭载在辅助算法作曲系统上,或者直接使用辅助算法作曲系统在预先设计好算法后,搭建起所需要的数字信号处理器模块。当音乐演奏进行到指定位置时,作曲家可通过人为控制数字信号处理器模块或者动态变化音量,来实时触发与关闭数字信号处理器模块。

无论选择以上哪种形式,计算机此时需要做的工作就是对声音进行改变,通过算法创造“新声音”的方式,正是计算机协助作曲的魅力所在。

利用算法生成音高与节奏——“随机性”

关于计算机辅助作曲的早期实验,大多基于当代音乐强调“不确定”性的创作观念。作曲家开始使用计算机进行辅助创作,就等于拥有了一个很快做出随机决定的工具。《伊利亚克组曲》的第四乐章主要通过运用马尔科夫链和表格进行创作,其使用了概率表来控制四把提琴声部中的间隔分布,固定音型被设置为八分音符,计算机只用来决定八分音符的音高。整个乐章随旋律间隔分布的概率表每秒钟改变一次,第一个表将重复音高的概率设置为100%,将任何其他旋律间隔设置为0%。如果计算机将相同的音高分配给两个连续的八分音符,它们会自动含糊不清,构成一个较长的音符值。因此,乐曲开篇的前两小节正是如此,在持续性的音高中展开全曲。

利用算法生成音高节奏的方式,并不局限于传统作曲观念中的“音高”与“节奏”等维度,同样作用于音频素材与MIDI素材当中,我们以Somax-2为例。

Somax是一个可以在MAX/MSP系统中使用的实时人机即兴创作的模块。该模块可以通过在一个音频或是MIDI的素材库中,采用重组其频率、切片、循环的方式实时生成新的即兴音乐片段,同时也可以接收和转化音频、MIDI信号,并提取其中的切片内容。

此外,“自适应模型”为多层树状结构,每层可实时捕获特定参数,并且每层可进行参数的匹配,从而进行合并和缩放。它基于OMax(另一套人机即兴模块)之上,添加了反应性这一概念,使得系统不仅能从输入端接收信号,还可以对音乐家的演奏进行实时的反馈,从而营造一种共同即兴的效果。

无论是《伊利亚克组曲》还是Somax模块,他们都需要大量的人为参与。前者需要对参数不断进行设定与修改,从而使马尔可夫决策过程得到一个较好的反馈结果;后者则需要演奏员对其音频或是MIDI信号输入,使其拥有更多可供处理的信息。

因此,计算机辅助作曲的手段,或者说传统意义上的算法作曲,并不能与当下AI作曲相提并论,AI作曲可以被视作算法作曲的一种进化与蜕变。

推动机械化高效生产。采用综合技术和现代设备相结合的方式,积极采购竹材、竹笋等采伐(掘)专业设备,对环境友好的竹产品、竹制加工品等的相关生产流程给予经济补助。

关于人工智能作曲

大量的音乐理论家曾深度剖析莫扎特、贝多芬、肖邦等知名作曲家的音乐作品,对其中的旋律、和声布局、音乐结构、配器方式等一系列技法问题进行深入的研究,并提炼出系统化的分析方法。算法作曲正是将不断变化发展的音乐创作技法,转变为人工智能中的参数,即对传统作曲技术手段的数字化运用。当下,人工智能在各个领域逐渐成为热门话题,提及人工智能作曲,我们不得不提及机器学习。

机器学习与AI作曲的关系

机器学习实际上就是科学家希望机器能够像人类大脑一样进行思考。我们提供给计算机一个数据库,让它对其进行学习,然后通过对数据的分析处理形成新的结果预测与预判。将机器学习映射至作曲技法上,我们可以得出“监督学习”“无监督学习”“半监督学习”“强化学习”等结果。

所谓“监督学习”,就是让机器在有“答案”的条件下提取数据,并得到一个函数,根据这个函数去进行结果预测。例如,我们可以将其运用于和声习题的批改上,在古典和声体系中,因受限于具体时期的音乐风格,故而产生了许多条条框框的“规则”。在“监督学习”的过程中,我们可以将这一系列不符合风格时期的和声进行,提前在机器中设定为错误的和声进行方式,机器便能够以此为依据,参照这一标准,逐步完成和声习题的批改。

“无监督学习”则是对数据库进行分析,但无需对其中的某项结果负责,仅分析潜在的规律。例如,我们可以将其运用在分析莫扎特作品的横向旋律的音高走向、纵向和声的音高构成,以及音乐的节奏、速度、力度等方面,机器可以根据其通过分析所得出的结果,有效建立一个模仿莫扎特风格的写作模型。当然,“无监督学习”并不单单局限于对单一的某个特征数据进行分析,我们希望能够通过一系列的数据分析帮助我们建立其复杂的分析应用系统。

实际上,我们还可以将“监督学习”与“无监督学习”两种学习方式结合到一起,一部分数据能产生“答案”,另一部分则能为我们总结“规律”。例如,我们可以运用“无监督学习”分析莫扎特作品中的一系列数据,然后将“规律”建立为相应的模型,运用“监督学习”的手段对其进行训练和预测。这样系统的数据分析方式,更有利于我们后期建立多维度、综合性的分析应用模型。

“强化学习”则是根据周围环境的反馈做出变化。例如,我们在建立模仿莫扎特风格写作的算法模型时,该模型会自主生成一系列结果,我们在训练的过程中对结果进行干预,这一过程犹如我们教小朋友区分“对”与“错”一样。在我们对结果进行干预之后,算法模型就会收到反馈,通常我们会使用奖惩机制来进行反馈。当算法收到反馈后,它就会相应地改进自己的行为模式,以此不断地反复循环。这样,我们的算法模型就可以通过一次又一次循环,强化算法模型的“智能”性。这个过程已经非常接近人类的真实生活状态了:不断优化结果,改正自己的错误行为。

从深度学习到AI作曲

不难发现,上述四种机器学习的方式都是基于一种“见招拆招”的模式之下,只能适用于较为单一的运用,很难用于处理更复杂的情况。人工智能作为一门跨学科的领域,基于脑科学的发展,通过人类对大脑已知的工作原理,使得机器模拟出人脑的结构——人工神经网络。(见下页示意图)

对上述模型的训练,需要巨大的资料库。先以正向传播的方式输入该模型与现有的“答案”,随后进行比较,算出两者之间的差值,接下来再通过反向传播的方式,以减少差值为目的,调整每一个感应器。从理论上来讲,只要学习的资料足够庞大,在计算机计算能力足够的情况下,该模型可以通过不断反复学习,成为一个系统性的模型。

示意图

通过深度学习的方式,我们可以看到当下已经有许多人工智能作曲的产物。例如,索尼计算机科学实验室的研究人员盖坦·哈杰里斯(Gaetan Hadjeres)与弗朗索瓦·帕切特(Francois Pachet)开发出了一种名为“深度巴赫”(Deep Bach)的神经网络,它可以学习如何创作巴赫风格的复调圣歌。研究员使该设备学习了巴赫的三百五十二首众赞歌,进而用它创作出了近似巴赫众赞歌风格的音乐;在人工智能的帮助下,来自洛杉矶的作曲家卢卡斯·康托尔(Lucas Cantor)用手机续写了舒伯特的《未完成交响曲》;人工智能“作曲家”AIVA通过机器学习的方式创作了大量音乐,其范围涉及流行歌曲、古典音乐、影视配乐;清华大学生物医学工程专业博士生,运用人工智能写歌,参加选秀节目。上述均是AI作曲的优秀成果。

人工智能的发展,使得计算机不再是辅助作曲的形式,而是逐步在向拥有“人”一般“独立思考”能力的方向发展。

AI作曲的问题与困境

尽管人工智能的发展十分迅速,但当下在AI作曲方面仍然存在着许多问题,有待我们解决。只有解决好这些问题,我们的AI作曲技术才能进一步提高。

有不少爱乐者提出,作曲家通过人工智能进行作曲是否会失去音乐创作的初衷呢?当下人工智能的智能化程度相对而言还是比较低的,并没有完全达到人们对它的预期。我们对一部音乐作品的期待值,并不单单取决于音乐本身,而有相当一部分是基于情感的宣泄。目前的AI作曲更倾向于是一个完全没有感情的“人”,它通过对成千上万首歌曲、音乐进行技术分析,从而机械式地将一个一个音符计算出来。AI如果无法真正意义上拥有“人”一般的感知能力,即使对成千上万部经典作品进行学习,也无法创作出“优秀”的作品来。

音乐学界的专家、学者也曾提出“AI作曲是否存在同质性”的质疑,由于AI作曲是基于大量的乐曲学习,通过算法逻辑推断生成的结果,很容易与所提供的素材库有雷同。我们知道,人类作曲家是很谨慎地使用音符的,更会注意避免“雷同”问题的发生。因此,AI创作的音乐同质性的特征,极容易产生“抄袭”的现象。

AI作曲在很大程度上是基于对过往作曲手段的深度“学习”,在音乐风格上也会存在着一定的滞后性。目前的AI作曲仍处于一个通过规律选择逻辑推断的阶段,尚未形成自主创新力。虽然有一定量的学习内容,但是却没有学习后拥有的举一反三的能力。正如普通画师不可能靠着一辈子临摹大师的作品成为画坛巨匠一样,AI真正缺乏的是自主的创新力。

对AI作曲的展望

音乐创作是一种脑力负荷极大的活动,作曲家必须具有个性化的音乐语言、多样化的风格类型以及饱含哲思性的人文理念,创作的难度不断加深。不得不说,人工智能的发展能够更好地服务于作曲家的音乐创作活动。AI已经从提炼与运用过往的作曲手法,逐步发展为通过分析数据,以期能够创作出具有“情感温度”的音乐作品。至少从目前来说,AI作曲还是能够生成一些优秀音乐作品的,例如流行歌曲、氛围音乐等。未来,AI作曲将不仅局限于音乐创作方面,还会延伸至声音设计领域。

AI作曲可以有效地帮助我们省掉许多机械化、重复性高的工作。例如,我们可以通过人工智能加强总结我国民族化创作道路上的那些成功作品的特征,这些“规律”可以帮助当代作曲家实验更多新的音响与创作思路,关注如何通过算法增加不确定性,帮助他们在未来创作出更具时代意义的作品。AI作曲的发展之路,将不再局限于生成一些有规律的音高组织片段,而是扩大对音乐要素的数据分析,在不断总结原有音乐“规律”的基础上,涵盖更多日常生活中的声音,甚至未来一系列存在于我们生活中的声音,都会成为音乐的一部分。AI作曲的辐射面将越来越宽,这将促进作曲技术手段的发展,促进音乐分析理论研究。

此外,AI 作曲对声音的设计也可以缓解人类的精神压力,尤其是生活在城市中的高负荷工作人群。我们知道,当精神高度集中时,为了排除自身其他想法对该工作的影响,无声的环境并不是最佳的选择,甚至身处完全静音化的世界会使得大家的情绪过于紧张。未来AI的声音设计系统,可以通过释放具有疗愈功能的新声音,适度地刺激人们紧张的神经,舒缓情绪,提升工作的效率。目前,日本东京艺术大学人工智能实验室致力于研发一项声音/音乐自动生成系统“SoundDroid”,该系统把提升工作效率作为目标。如果该系统能够成熟运用,其原理同样可以运用于人们生活的其他方面,例如在放松、睡眠、情绪诱导、背景音乐(BGM)、音乐治疗、餐厅和酒店等气氛营造中。

人脑的认知活动从未停止,同样对AI的理解也会随着人类各学科的发展与认识得到提升。随着计算机音乐的发展,从计算机辅助作曲到人工智能作曲,再到未来的“强”人工智能,将会是一个必然的发展趋势。

猜你喜欢

作曲音高计算机
AI:像贝多芬一样去作曲
计算机操作系统
里盖蒂《小提琴协奏曲》中的“双律制音高组织”研究
邀你来我家
作曲心语
基于计算机自然语言处理的机器翻译技术应用与简介
改进音高轮廓创建和选择的旋律提取算法
George Gershwin
信息系统审计中计算机审计的应用
序列的蜕变——皮埃尔·布列兹室内乐作品《无主之槌》音高组织初探