基于文献计量法对算法作曲发展趋势的可视化分析
2022-07-26钱文琪李子晋
钱文琪,李子晋
(1.中国音乐学院,北京 100101;2.中央音乐学院,北京 100091)
1 引言
近几年来,计算机技术介入作曲领域的研究呈现出不断加速、扩大的趋势,众所周知,音乐领域是极富有创造性的领域,音乐创作与计算机的结合迅速受到社会各领域广泛关注。“算法”和“作曲”之所以可以结合形成一个新兴的研究领域,两者之间一定有逻辑关系将其联结。追溯到很久之前,作曲本身其实就是一种严格的规则逻辑,从很早的简单节奏及音高对应关系到巴洛克时期复调音乐中严格的逻辑对应,再到后来的十二音序列音乐,音乐中各种要素的随机对应关系,算法始终贯穿在作曲过程之中。因此,可以将算法作曲认为是两种不同领域的逻辑在当代的交叉碰撞。
现阶段,在计算机领域,英文文献中大部分学者更加偏向于“自动作曲”这个解释,普遍认为算法作曲是使用算法创作音乐的技术,认为算法作曲这个术语通常用来表示无需人工干预进行的音乐创作过程。中文文献中大部分学者更加偏向将算法作曲解释为“计算机作曲”,在作曲的过程中,人尽可能少地干预音乐的生成,以实现计算机算法作曲的主导作用最大化。在音乐领域,中英文献在算法作曲的释义理解上则出现较大分歧。英文文献中部分国外音乐家是希望形成完全自动化的作曲,但中文文献中音乐家更加注重人在其中的干预作用,强调了人干预是必不可少的,甚至是有利于结果的最优化。
“算法作曲”就是“在算法辅助下的作曲”,算法作曲在计算机算法的支撑下,已经成为当代创作音乐的新趋势,随着各种算法的不断更新完善,人们越来越依赖计算机的算法来进行音乐的创作,赋予计算机更多的权限,人们将更多的关注点逐渐移向算法。在计算机算法作曲系统中,人们担任的角色只是规则制定者与反馈调试者。这种趋向“自动化创作”的方式虽然新颖,但是当作曲家将自己的灵感和情感输入到计算机中,计算机是否能够给予他们与之匹配的音乐才是至关紧要的。这种认知的差异性其实主要取决于人们对它的定位。直到现在,对“算法作曲”的理解还没有一个统一的概念。
各领域对算法作曲认知的偏差,在很大程度上影响了算法作曲的研究内容和趋势发展,但是仅基于个人的主观判断是不能够得出结论的,而是需要通过客观准确的数据来说话。文献计量的方法应用领域十分广泛,在近几年呈现出与其他领域学科相结合的趋势,通过这种方法可以提取到文章内容的核心要素。文献计量法可以将文献量、作者数、词汇数作为研究对象对大量文献进行量化分析,而后实现对相关研究领域的研究热点的预测和评估。本文对国内外算法作曲发展趋势、研究热点进行定量考察,借助可视化文献计量分析工具Citespace,通过发文量及词频分析中关键词聚类、突现词分析的方法确定算法作曲研究内容在不同发展阶段的核心关键词变动,以获取其研究领域演变趋势及热点变化。
2 算法作曲文献量化可视化分析
2.1 数据来源和参量选择
严格地说,与其它专著、研究报告等文献相比,期刊论文更直接、客观、严谨地反映了相关研究领域的研究课题和研究前沿。本文研究以中文学术期刊库中国知网(CNKI)和美国科学信息研究所Web of science(WoS)核心合集数据库为主要数据来源。其中,以“算法作曲”作为主题词和关键词为中国知网(CNKI)数据库检索式,检索时间跨度为1955-2020年,时间切片为1,检索文献时间为2020年2月29日,统计结果时间为2020年3月1日,经过人工筛选,把显然不属于该领域的文献剔除,并删除重复文章。结果共检索出相关文献共63篇,将检索出的论文题目、关键词、作者、摘要等数据以Refworks的纯文本格式导出,以备数据分析所用。
本文又以Web of science(WoS)为检索平台,选择“Web of Science Core Collection”数据库为样本框,检索策略设定为 TS=(Antibiotic*AND Soil),文献类型设定为“Article”,检索主题为“Algorithm composition”和“music”;OR 主题为“Computer Composition”和”music”;检索时间跨度是1985-2019年,检索时间为2020年2月29日,统计时间为2020年3月1日,经过人工筛选,对检索结果逐条筛选,剔除不相关的非学术文章,并且删除重复文献,最终共得到相关有效文献共295篇,将筛选过后的文献保存为纯文本格式导出,以备数据分析所用。
2.2 研究方法
本文采用文献计量法中的关键词共现分析方法,关键词共现可以分为几个分析维度,分别为关键词频次(关键词提取检索所得论文中的高频关键词,以揭示算法作曲在不同发展阶段的研究主题)、关键词中心性(Betweenness Centrality)、关键词聚类图谱(可以反映聚类结构特征,表征识别聚类的性质,从特定聚类的标题、关键词、摘要中抽取名词短语,作为聚类标签,更能清晰得出该研究领域的核心)、Time line图谱(揭示聚类时间跨度、发展脉络及研究进程)、Time zone图谱(在时间层面展示关键词关联及研究领域知识演进)。
3 数据分析及结果
3.1 发文量
通过对中英文算法作曲相关文献的发文量进行对比分析(如图1)。首先看到的是明显的发文量数量的差距,英文相关文献发文总量大致为国内发文总量的2倍。中文相关文献发表时间明显晚于国外,之间相差近20年。首先,通过观察发表论文的数量趋势,两者趋势基本一致。英文相关文献的数量分别在1995年、2005年、2015年出现高峰值,在1993年、2009年出现低峰值;而对比中文文献,在2006年、2010年及2013年出现高峰值,在2008年、2012出现低峰值。可以得知,英文文献几乎每隔10年就会出现一个高峰值,而中文文献几乎每四年出现一个高峰值。由此可见,这种数量的发展趋势是相同的。
图1 国内外中英文算法作曲发文量散点对比图
3.2 关键词聚类
在科学研究中,关键词通常可以表达一篇论文的研究核心内容,继而可以表征出该领域的研究主题和发展动向[1]。因此,如果某一主题词或关键词在其领域文献中出现次数较多,则可认为该关键词或主题词所表征的研究主题即为该领域的研究热点。
聚类分析是机器学习的一个很重要的分支。聚类(Clustering),就是将相似度较高的团或簇聚成一组。聚类也是一种可视化样式,它可以展示网络的聚类分布概况。Citespace自动聚类的实现是依据谱聚类算法(Spectral Clustering,SC),聚类样式中的聚类以不同颜色的节点来表示。谱聚类是从图论中演化出来的算法,目前在聚类研究中得到了广泛的应用,是一种新型聚类算法。其原理是基于聚类矩阵的相似性,然后利用图分割形成聚类。
本文将所得中国知网(CNKI)文献数据导入Citespace软件进行关键词共现分析,软件时区选择为1990年-2019年,时间切片(Slice length)为1,节点类型选择“keyword”,TopN为50。经过参数筛选,关键词共现图谱中共出现关键词141个,形成200条连线,密度为0.0203。此次研究中,CNKI数据的轮廓值S为0.5696,模块值Q为0.8262,一般而言,Q的值在区间[0,1)内,Q≥0.3说明划分出来的关键词聚类是明确的[2];当S值在0.7时,聚类是高效率令人信服的,若在0.5以上,一般认为聚类是合理的,表明形成聚类的结构层次比较清晰,该方法的置信度较高且具有意义[3]。另外,笔者采用潜在语义索引算法(LSI)从施引文献的关键词(Keyword list)中提取名词性术语对聚类进行命名。
同样,本文将Web of science(WoS)核心合集数据库中文献数据导入Citespace软件进行关键词共词分析,软件时区选择为1970年-2019年,时间跨度(Slice length)为1,节点类型选择“keyword”,TopN为50。经过参数筛选,图谱中共出现关键词386个,形成836条连线,密度为0.0113。WOS数据的轮廓值S为0.7022,模块值Q为0.6268,表明形成聚类的结构层次比较清晰。另外,笔者同样采用相同语义索引算法(LSI)从施引文献的关键词(Keyword list)中提取名词性术语对聚类进行命名。
图2 中文文献中“算法作曲”关键词聚类知识图谱
图3 英文文献中“算法作曲”关键词聚类知识图谱
从关键词聚类视图可以发现,中文文献中该领域聚类分布较分散,每个聚类相关性较小;而外文文献中该领域聚类分布密集,相关性较大。
本文将中英文算法作曲相关论文关键词聚类进行对比得出表1(如下表)。中文文献关键词主要聚类分析结果有4个,分别是“人工智能”(聚类0)、“计算机音乐”(聚类1)、“适应度函数”(聚类2)、“计算机作曲”(聚类3);英文文献关键词主要聚类分析结果有5个。分别是“深度学习”(聚类0)、“教育”(聚类1)、“机器学习”(聚类2)、“算法作曲”聚类3)、“算法”(聚类4)。可见,中文文献中算法作曲研究主要以算法为主要研究内容;而英文文献中算法作曲研究内容涉及很多方面。
表1 中英文献算法作曲关键词聚类视图对比表
此外,本文将文献中算法作曲高频中介中心性关键词进行整理对照(如表2),可以看出,中文文献中关于算法作曲的主要研究重点在于算法的研究,如“遗传算法”、“神经网络”、“机器学习”、“交互式遗传算法”、“循环神经网络”、“马尔科夫链”等;而英文文献以“evolutionary algorithm”(进化算法)为算法研究方向的主要内容,与此同时,还进行作曲本身要素的研究,如“结构”、“模型”、“作曲技法”等,另外还加入了主观情感的影响因素研究。
表2 中英文献算法作曲中介中心性关键词汇总
3.3 文献关键词时区图
关键词时区视图可以清晰地呈现算法作曲研究主要研究内容的变化以及研究前沿。在中文文献中,前期的研究中几乎都是算法相关的研究,如“隐马尔科夫模型”、“遗传算法”、“适应度函数”这些关键词。在中期的研究阶段,关键词为“节奏”、“音乐创作”、“神经网络”等,这表明研究重点虽没有离开算法,但是加入了一些音乐创作相关的内容。目前,中文文献中算法作曲的研究以“局部自动化”为研究前沿。
英文文献中算法作曲关键词时区视图中可知前期出现“algorithm”、“music”、“composition”、“computer music”这些关键词,这表明前期大部分的研究虽然是以算法为研究出发点,但主要研究内容是在音乐创作本体上。在研究中期,出现“machine learning”、“genetic algorithm”等关键词,表明这个阶段是以算法的研究为主。目前,英文文献中算法作曲的研究以“emotion”、“education”、“evolutionary algorithm”为研究前沿。
3.4 突现词
通过对比中英文文献中算法作曲关键词突现视图可以得出下表(表3),表中可以看出中文文献中算法作曲在2005年之前的研究成果几乎为空白,而英文文献中在该领域已经开始有针对算法的研究,主要体现在交互遗传算法和人工智能相关的算法研究;2005年-2010年这个阶段中文文献中算法作曲的研究内容开始集中在算法,而在此阶段,英文文献中相关研究已经开始强调计算机的辅助作用,甚至出现了计算机算法作曲应用于教育的研究;在2010年-2015年,这个阶段,中文文献中该领域从单一算法研究变为交互式编程语言的应用研究,与此同时,英文文献中该领域已经开始了细胞自动机(CA)、生物反馈的相关算法研究来进行作曲;2015年-2019年这个阶段,中文文献中的研究没有明显的进展,研究内容上也没有明显的变化。这个阶段的英文文献中已经在算法作曲研究中加入了情感、主观感知等影响因素的探索研究。
表3 中英文献中算法作曲突现词阶段对比
4 结束语
本文通过运用文献计量法,对比中英文算法作曲相关文献,根据国内外算法作曲发展趋势和研究热点,演测其研究前沿并总结出以下结论:
(1)国内外研究进度趋势大体相同。从发文量看,国内和国外发文量都是经过短暂的缓慢增长后出现三个明显的峰值,且各峰值之间的年份间隔分布均匀,发展趋势线条走势大体相同,其原因可能在于国内外研究时代背景相同,两者的发展始终存在密切的联系。
(2)国内外研究热点存差异。在算法的研究方面还处于寻找“最优解”的过程中,国内大多数研究偏重早期遗传算法和神经网络。且以遗传算法为主流方向。目前,国外的多数研究侧重深入研究进化算法辅助作曲,并且在找到“最优解”的情况下,加入了主观情感因素的干扰性,这也是由于领域学科之间的教育方式的差异性,导致国内外在学科领域的融合度不同。在研究过程中,也会由于语言翻译的问题,对于算法作曲的本身具有的逻辑性认知存在差异。
(3)国内外研究前沿趋于一致。通过时区图谱的对比,也可以发现国内的研究前沿是局部自动化,而国外是自动作曲。局部自动化是需要人工干预的,而自动化的概念已经扩展为计算机技术代替人体力或者脑力的过程。目前,国内对于算法的探索研究不仅局限于遗传算法,还进行了神经网络等复杂算法的突破性实践以及音乐风格情感方面的研究探索。
目前,算法作曲的相关算法经过多年的蜕变、演算、进化,已基本满足该领域研究要求。与此同时,研究视角开始切换到作曲理论,即关注于作曲理论规则制定的科学性,如何让一个音乐作品更具有可听性。但是可以说,自动化是算法作曲发展的必然趋势。