降噪世界中的耳语：ASMR亚文化与大众文化中的声音转向

2021-03-06赵柔柔

文艺研究 2021年12期

赵柔柔

近年来，中国在线音频行业迅速发展，以音频为主的网络平台（如喜马拉雅FM、蜻蜓FM、荔枝）日益成熟，语音直播、听书、语音社交的受众逐年增多。据艾媒网《2019中国在线音频市场研究报告》显示，2018年中国在线音频用户突破4亿，增速达到22.1%，高于移动视频和移动阅读行业；动漫配音、广播剧等亚文化热度攀升，催生出一些与声音有关的文化产品，如以声优为主题的“声临其境”综艺节目、以语音包为主要卖点的手机游戏等。语音的机器识别与合成成为人工智能发展的前沿，促使许多网络平台将音频添设为独立的功能（如视频与音频的切换、人工语音阅读、智能音箱等）①。可以说，声音正搭载着新的网络媒介与技术，拓展以往以图像为主导的资本地图。为了理解声音这一媒介在听觉文化热潮中的意义，本文选择聚焦ASMR亚文化的个案，试图回应大众文化中的声音转向和听觉文化研究的理论脉络，讨论在现代社会声景中听觉逐渐被客体化的趋向，及其与声音数字化、语音识别与合成等技术之间的张力。最终，本文希望通过这一讨论，显影出声音的媒介特性转变所关涉的后人类境况。

一、ASMR亚文化与听觉文化研究

ASMR无疑已超出小众文化的范围，成为近年来声音热潮中最值得关注的现象之一。一方面，它是一种独特的以声音为中心的表演模式；另一方面，它也构成了对知觉（特别是声音）快感的描述和认同。从概念上来看，ASMR是“autonomous sensory meridian response”（往往译为“自发性知觉经络反应”或“颅内高潮”）的缩写，在网络通行的释义中，意指一种新的关于知觉的描述，即由视觉、听觉、触觉、嗅觉等引发的某种生理上的愉悦感和刺激感②。

然而，回溯ASMR亚文化的发生，会发现这一看上去具有科学色彩的命名实际上并非来自医学、心理学或生物学等领域，而是一种在社交网络平台上发展出来的“模仿式描述”（meme）。据一些最早的ASMR作品创作者回忆，促使他们关注到这种独特效应的，是在大众文化产品中偶然出现的令人愉悦的声音。比如，20世纪80年代风靡美国的电视系列节目《欢乐画室》（The Joy of Painting）中，鲍勃·罗斯（Bob Ross）讲授绘画技巧时低沉、柔和、耳语般的声调，常常被ASMR爱好者追溯为这种特殊舒适感的最初体验。在21世纪初的真人秀节目《老大哥》（Big Brother）美国版中，一位女孩偶然的耳语声也令许多人感到强烈的愉悦感。这种现象最初在网络上引起关注，是在与睡眠治疗相关的主题讨论中，如2007年steadyhealth网站建立的子论坛“令人愉悦的奇怪感觉”（weird sensation feels good）上就不乏相关讨论。尽管“催眠”至今仍是ASMR最常见的标签之一，ASMR的内涵却早已溢出睡眠、白噪音等，转而与一种一般性的声音体验相关。2008年，steadyhealth网站出现了对这种体验的第一个概括性命名：“at⁃tention induced head orgasm”（AIHO），但过于模糊的描述以及“高潮”（orgasm）一词明确的性指涉，使这一概念并未被广泛采用。2010年，珍尼弗·艾伦（Jennifer Allen）以带有医学色彩的“autonomous sensory meridian response”替换了AIHO。她认为，概念的含混会造成理解上的偏差，性指涉则给该词的推广造成困难，因此一个具有医学色彩的命名是必要的，尽管“批评家倾向于称之为伪科学”，但是“在现在这种被可悲的怀疑主义和知识的即时性主导的特殊社会情境下，任何不够正式或清晰的东西都很难满足人们的要求”③。

通过仿拟医学术语，珍妮弗·艾伦的命名获得了最广泛的认可。ASMR这一缩写作为一种标签，随着直播行业的繁盛而流行起来，一度成为热门直播内容之一，并迅速发展为全球性的文化现象。来自美国、俄罗斯、加拿大、日本、韩国、中国等国的表演者几乎毫无区隔地分享着ASMR文化，来自陌生语言的语音甚至成为一种常见的触发音④。2014年前后，一些爱好者，如网名为“Richard_Price”的投稿者开始制作包含中文语音的ASMR音频或视频，同时，国内也出现了模仿国外形式的作品。随后，在被称为“中国直播元年”的2016年，涌现出许多主打ASMR的主播，如“轩子巨2兔”“少寒shine”等。值得注意的是，ASMR逐渐走出亚文化的圈子，被应用在广告、电视剧、电影、游戏等多种媒介平台上，成为一种独特的商业营销手段。在汽车（雷诺）、家居（宜家）、美妆（SK-II）、食物（德芙巧克力、肯德基）、购物平台（京东商城）等领域，都曾经推出ASMR主题的广告；网易在2017年发行的热门手游《恋与制作人》推出了以掏耳朵、读诗、哄睡等经典ASMR情境为主题的语音包；2017年的网剧《河神》也用大量水泡声、主角的低语声等ASMR效果作为特色进行宣传。

通过对ASMR命名与实践的简短梳理可以看到，它以一种生物学意义上的知觉现象命名，寄身于网络视频平台，迅速成为全球性的文化现象，随之被资本市场捕获，衍生出一系列声音产品。同时，它在多重意义上构成了当下声音文化现象的中心：一方面，在近年来急速推进的声音（特别是人声）商品化的进程中，ASMR似乎正是对声音中可估价部分的命名，音质、音色及其唤起的感官愉悦成为重要的资本聚焦点；另一方面，语音识别与合成技术日益成熟，并极大地支撑着关于人工智能的想象，这令人声问题在后人类命题中显得尤为突出，此时，ASMR似乎成为了某种“残留物”——它暗示着某种越过意识形态的知觉快感，凸显了声音的身体性。此外，ASMR的媒介依赖性和独特的表演/聆听方式，也折射着建立在今天的媒介现实之上的社会“声景”（Soundscape）。

ASMR亚文化的流行唤起了国内外研究者的关注。一类研究聚焦于ASMR的知觉感受与助眠功能，尝试借助“通感”等概念，在医学、神经科学与生物学等学科基础上探寻其本源⑤。这类研究以将ASMR合法化为底色，希望使其突破亚文化的局限，获得科学的定位。另一类研究则仅仅将之视为一种文化现象，倾向于用既有文化理论框架予以阐释⑥。可以看到，在第二种文化解读中，描述性工作占了较大比重，如用社会调查的方法确认ASMR的一些基本特征和参量（性别、年龄、触发音的种类、情绪反馈、功能效果、网络平台等）；此种解读在阐释层面，则大多平行地使用不同学科（如社会学、声学、政治经济学）的术语尝试加以界定。这些讨论无疑是在面对一个边界模糊的文化现象时的有益尝试，但也存在一些问题。比如，当研究者在统计性别、种族、年龄等参量的基础上推论ASMR制作者是对母亲角色的模拟时，就消解了ASMR的知觉本体论色彩⑦；而忽略对ASMR媒介或文本特征的细读，则可能会将其简化为重复印证理论框架的案例。

本文延续既有研究，同时通过对ASMR进行媒介特征分析与文本细读，推进对“声音转向”的理论与现象的思考，尤其关注听觉快感的凸显在当代声音理论中的意义。进一步说，ASMR的实践有着明确的媒介依赖性，在网络媒介、特制的收音设备与播放装置的中介下，听觉自身的媒介性减弱了，被凸显为可量化和分析的客体。需要注意的是，以声音媒介及其影响为参照，可以看到ASMR并非一种孤立的现象，它内在于现代社会声景的变化与发展之中，并预示着日渐清晰的后人类境况。在结构上，本文以ASMR概念自身为导引，首先借助对“触发音”（trigger）的细读，强调在ASMR实践中听觉的知觉（sensory）中心性，进而论及这种知觉快感（meridian）所对应的社会声景，以及它所凸显的知觉本体性与自发性（autonomous）在后人类现实中的独特意味。

二、触发音与声源谬误

尽管ASMR被定义为一种宽泛的知觉快感，但因媒介技术的局限，味觉、嗅觉和触觉尚未进入大规模复制与数字化，因此目前还无法得到文化表达。值得注意的是，相对于视觉，ASMR亚文化显现出某种听觉倾向性，这尤为清晰地体现在对核心概念“触发音”的强调上。如字面所示，触发音指的是可以触发ASMR、使听者获得愉悦感的某个或某类声音。尽管ASMR爱好者认为触发音极具个人差异性，但在既有作品中，其种类仍然相对集中，使用频率较高的有低语、剪头发、流水、火柴燃烧、倾倒碳酸饮料、掏耳朵、头部按摩、咀嚼、敲击等。ASMR创作者往往追求视觉上的风格化，比如以不同的服饰、装扮和色彩凸显差异性，但是在听觉上却有明确的共性，特别体现在对触发音与触发方法的专注上。一般而言，实现触发音的材料越丰富、底噪控制得越好、声音越清晰干净，表演者就越被认为拥有更高的专业性。以表演者“Dmitri”为例，他因制作了大量零底噪、触发方式多样的高质量ASMR作品而获得较高关注度。他的视频十分简洁随意，在视觉上仅注重展示触发方法，如用豆子模拟雨声、手指敲击纸板、刷子轻刷录音设备等，并无过多布景、衣着、滤镜、面容或身体语言方面的考量。

这种由触发方式而不是表演者占据中心位置的视频风格，最为清晰地体现在广告中。宜家的一则长达25分钟的广告，重复播放手掌摩挲床单的声音、抽屉开合的声音等，营造出一种温馨精致的居家生活感。京东商城在2018年为“618”促销活动造势时，也推出了一支ASMR广告，将红唇咬苹果、涂抹护手霜、相机的快门和镜头调焦等声音拼贴在一起。显然，这类广告实现了一种不同于叙事性广告的效果：它们没有功效的介绍、材质的说明，亦无对消费者的意识形态性诱导与建构，只凸显出由听觉引发的对事物本身的流连与认同，或曰“凝听”⑧。

不过，这种效果也显现出ASMR的一重矛盾：尽管凝听是作品的一个关键特质——它们以声音作为主要表现手段——然而触发方式本身的“可视性”，即对发声之物的凝视，在一些情况下也是必要的。这些触发音大多取自日常可见的器物。在每一次表演的开始，表演者几乎都会以简短的耳语描述和展示触发物和触发方法，包括录音设备的距离和方位等。比如，ASMR表演者“zeitgeist”在某次表演中，将碳酸饮料倒在耳型的录音设备周围，仅就声音而言，这难说有多么悦耳，但视觉上涌出的气泡无疑增加了愉悦感。这种通过声音将注意力引向触发物的凝听，在雷诺汽车的广告中体现得十分清晰：敲击汽车的不同位置所发出的声音与一般的敲击音并没有本质的不同，而恰是借助人们对声音的凝听，引发其对崭新、精致的汽车与缓慢抚摸、敲击汽车的手的凝视，才令人沉浸在这种对物的痴迷中。即便是早期一些纯音频的作品，也大多会有一段语音简介，或至少在标题中说明这段声音的触发音与具体的表演形式。

如何理解ASMR中视觉与听觉的关系？在此，法国学者米歇尔·希翁（Michel Chion）对声源的探讨或许可以带来一定的启示。在《声音》（Le Son）一书中，希翁指出了一种“声源谬误”。世界上95%的东西是不会自己发出声音的，声音也不反映形象，比如一个很大的物体可能发出的是很细微的声音，而流动的小溪的声音并不流动。但是，人们对于声音的直觉反应是去寻找声源，而非关注声音自身，甚至会主观地为一个形象配上符合它的声音——借助听觉，声音被封闭在了声源上⑨。这种对声源的依赖，曾在克里斯蒂安·麦茨的文章《声音客体》中引发本体论意义上的思考。麦茨认为，正如“隆隆”的声响本身并不会成为我们的认知客体（“隆隆”的声源雷声才会），声音相对于图像来说，更像是可变的修饰语，在认知上无法与声源相脱离⑩。美国电影研究者里克·阿尔德曼在其专论电影人声的文章《翕动的嘴唇：作为腹语术的电影》中说明了声音与声源脱离的后果，即一种认知上的分裂与恐慌——人的自我认知同一性幻觉是在声画的同一中实现的，无声源的声音会引发来自未知的威胁感，在电影中正是通过声源图像来消弥这种恐惧⑪。齐泽克在《“以目听之”，或看不见的主人》中同样认为，给无声电影添加一条音轨所带来的恐慌来自“自动发声的怪怖”（uncanny antonomization），“当我们进入象征界的时候，声音便与身体发生了永久性的断裂”，声音由此获得了某种意义上的自主性⑫。同时，他借用德里达的讨论说明“听到你自己在说”比“看到你自己在看”更是自我感发（auto⁃affection）的基础，因为在“听到你自己在说”的过程中，精神分析理论中关于视觉的隐喻“镜像阶段”所包含的人与镜像的距离也被取消了⑬。

在法国音乐家皮埃尔·舍费尔（Pierre Schaeffer）的“具体音乐”（Musique con⁃crète）实践的影响下，希翁想通过自己的声音理论建构一种无声源的聆听方式，进而阻断滑向声源的认知倾向，而将关注锁定到“声音客体”上。舍费尔的“具体音乐”是20世纪下半叶影响力最大的音乐先锋实验之一，它抗拒以乐谱为基础的音乐，试图借助录音技术，通过对录下的自然声音（如鸟鸣、火车、汽笛）加以编辑、剪辑来制作音乐，亦即直接用我们在现实中能够听到的声音作为音乐的基本构成要素，放弃抽象符号的中介。比如，舍费尔在1948年的成名作品《铁路练习曲》（Etude de Chemin Fer）中，将敲击声、火车汽笛声、鹅鸣声等剪辑在一起。需要注意的是，舍费尔的声音理念与音乐实践促使他提出了“声音客体”“无起源聆听”等观念，而它们在很大程度上被跟随舍费尔进行“具体音乐”创作的希翁所继承。在《视听：幻觉的构建》中，希翁区分了三种听的方式：因果关系聆听（causal listening）、语义聆听（semantic listen⁃ing）和简化聆听（reduced listening），其中，简化聆听借自胡塞尔的现象学还原（re⁃duction），是一种对去除了声源和意义的声音本身的聆听方式。希翁指出，这种聆听方式“富有成效”，因为它可以推进关于声音本身的认知，但它又是新的、“非自然的”，人们需要经过漫长的训练与探索才能把握它，进而建立对声音的描述性体系⑭。

有趣的是，简化聆听似乎正是ASMR亚文化的题中之义：它呼唤一种对于触发音自身的凝听，拒绝在声音中携带意义。同时，ASMR的受众几乎天然是希翁所期待的“老练的听者”——点明声源的因果关系聆听在他们的凝听中不仅不是阻碍，反而消除了无声源带来的潜在疑问和威胁，保证了一种更为安全、放松的凝听：

知道这是“X的声音”之后，我们就能继续下去，而不再追究这声音像什么或本身是什么。⑮

简化聆听显影了ASMR作为一种声音实践的独特之处，它不同于以声音为载体的语言，大部分作品并无内容，只匀速、轻柔、缓慢地重复同一个声音，在一个小时的视频/音频中，变换触发音往往不超过十次。即使最常见的触发音之一“人声”，也被表现为“耳语”（whisper），消除语义层面，仅保留它的声音特质。一些爱好者甚至认为陌生语言的语音比母语更具有ASMR的触发效果。同样值得注意的是，ASMR也抗拒音乐，不诉诸某种文化教养式的审美体验或专业鉴赏，拒绝以旋律、音色为中心。比起钢琴发出的乐音，抚摸或敲击钢琴表面所发出的声音恐怕更符合ASMR对触发音的选择。可以看到，尽管作为当下网络视听平台上的流行文化，ASMR并不能被称为一种自觉的艺术实验，其与舍费尔颇具反思性和先锋性的“具体音乐”创作相去甚远，并且前者也没有明确表达过与后者是否有所关联，然而，二者在内容和形式上却有十分明显的一致性，并且都激活了一种更新、更广泛的对声响（或噪声）的聆听，拓展了“听”的内涵。

“声源”问题的引入，或许提供了一个关于ASMR的特殊视听形式的有效解释。对声源的展示与强调，避免了听者的快感因下意识追寻声源而遇到阻滞，从而令听者可以更为专注地聆听声音本身。可以说，对于希翁而言理想化的、需要长期训练才能掌握的简化聆听，对于舍费尔而言极具先锋性的“具体音乐”创作理念，在ASMR亚文化中却被部分地实现了。这或许意味着，ASMR的出现并非偶然，而是内在于一个逐渐将声音“提纯”并客体化、将听觉剥离于其他知觉的进程，它以强调知觉快感的方式探索着听觉的本体性特征。然而，对这一进程的理解不能停留在生物学层面，具体来说，无论简化聆听、“具体音乐”抑或ASMR亚文化，其对声音和听觉的理解与强调都极为清晰地依赖于某种媒介变革与社会声景的变化。对舍费尔和希翁而言，声音的录制与剪辑技术至关重要，他们的实践呼唤一种对抗音乐的人为整体性、重建听觉的努力，回应了20世纪中期去中心化的艺术趋向。那么，近年来ASMR亚文化的流行又在回应什么现实议题呢？下文试图从两个角度进行分析，即降噪与声音空间治理下的社会声景变化，以及数字媒介影响下的听觉中介化。

三、现代声景中的听觉快感

近年来对声音问题的关注中一个较为显著的趋向是，不同于丰富而历史悠久的音乐研究与人声研究，这些讨论将声响（sound）或噪音（noise）推到了前景。噪音被赋予丰富的意涵：它是某种无意义、无秩序的扰动，因此强调了声音本身而非声音的内容。在此，加拿大作曲家、声音研究者罗伯特·默里·谢弗提出的“声景”概念以及他对噪声的讨论，可以作为理解ASMR亚文化的社会语境的切入点，而ASMR亚文化在某种程度上，正是对当代社会声景的回应。20世纪60年代，谢弗仿照“风景”（land⁃scape）提出“声景”概念，尝试以此涵盖我们所能听到的一切声音。他认为现代工业与城市使一种被机器的嘈杂声所遮蔽的低保真（lo⁃fi）声景取代了能够听到声源的高保真（hi⁃fi）的自然声景，从而引发了一种现代的“声音分裂症”（Schizophonia）⑯。在谢弗看来，机器噪声意味着权力，意味着对社会生活的压制与剥夺⑰。通过指责现代工业噪音和现代媒介对人们听觉环境的毁坏，他呼吁进行噪声治理与声音设计，以恢复某种田园式的自然声景。“声景”概念的应用范围极为广泛，自20世纪70年代以来，在声音研究、历史学、人类学、城市设计等诸多领域中都被借用，构成当代听觉文化研究的重要范畴。然而，正如乔纳森·斯特恩所指出的，这种借用过于泛化，以至于稀释了概念本身的意指⑱。此外，这一概念本身也遭到了质疑与反思，如希翁在论及声源时表达了对谢弗执着于自然声音的不满，认为这是“声音自然主义的教条”，他还以摄影和电影为例，指出视觉或听觉的媒介化早已存在⑲。

本文并不试图延续这个讨论，而是要借“声景”概念说明，20世纪的媒介技术变革引发了声景的巨大变迁，特别值得注意的有两个方面：噪音治理下私人空间与公共空间声景的区隔；声音存储与编码等技术影响下的听觉中介化。与谢弗的描述不同，当下都市的声景并非被工业噪音淹没，反而是在噪音治理中生产出某种日益绝对化的宁静。以中国为例，社会性的“降噪”倾向在近年来尤为明显，体现在：隔音材料与设备（中空玻璃、降噪耳机等）的广泛应用；噪音标准的明确与推行，如2011年实施的《民用建筑隔声设计规范》细化了噪音标准；对公共空间噪声的社会关注与舆论导向，如高铁“静音车厢”的推出、公共空间背景音的治理、对“熊孩子”“广场舞”等的舆论挞伐，等等。这一方面是对连续性的声音空间的分割与私有化，另一方面形成了一种分裂的声景——与公共空间的寂静相对，私人空间借助耳机等设备变得十分喧闹。近年来付费知识等音频市场的热度攀升，在某种程度上可以说印证了这种分裂声景，伴随性的音频恰好填补了降噪的社会空间留下的声音空白，并将它分割，造成个人时间的连续与独立。谢弗所担忧的工业噪音与城市噪音已被极大降低，而降噪带来的空间阻隔却日益凸显。在《被玻璃所阻隔的“声音景观”》一文中，谢弗指出，“每一个社会的‘声音景观’都是由该社会的主要物质材料所决定的”，玻璃在现代社会声景中扮演着重要角色，在20世纪的广播与背景音乐的急速推进中，玻璃窗户使得人们的“内部空间彻底绝缘于‘外部噪音’”，“室内的听觉感受‘交响化’起来”⑳。与此同时，由于玻璃的作用，室内外的视觉与听觉也产生了分裂，这亦引发了人的知觉之间的分裂。

降噪的技术发展与社会支持表现出了将声音有序化的诉求，声音本身的事件性大幅降低，听觉也随之受到规训㉑。希翁在讨论声音的特性时，曾将它与视觉对比，指出，“视觉世界的大部分是由持续性（至少以人的时间为刻度）的元素所构成，可是声音世界只有极少一部分的全体属性和强度属性是持续性与稳定性并存”，“声音不仅发自运动，其自身也经常处于变动中”，因此是“事件性的、偶发的”㉒。显然，声音技术的推进极大地削弱了声音的事件性，以服务于对声音图景的操控。在这一语境下，“噪音”不再简单地与“乐音”相对，而是逐渐获得了隐喻性。比如雅克·阿塔利的《噪音：音乐的政治经济学》将噪音视为普遍存在于社会图景之中的颠覆性力量，认为它是秩序中的裂隙与杂音，预示着新的社会变革的到来，并经由音乐的组织和秩序化而被人们感知㉓。

作为一种对“噪音”的凝听，ASMR在2010年前后开始被辨认与命名，其流行固然与直播平台的出现、双耳录制设备成本的降低、技术的普及等因素密切相关，但其内容与表现形式与当代声景之间存在某种张力。如前所述，它唤起人们对被降噪和遮蔽的日常声音的关注，通过自然声音引发对其声源的感知。希翁指出“噪音”定义的暧昧与模糊，总结了四种不同标准的定义：第一，在声学上，噪音的特征是“非周期性的频率结构”，“导致人们无法听到可对之命名的准确音高”；第二，在信息科学上，噪音是指“声音信号无用的那一部分”；第三，在分类学上，噪音是“不是语音也不被识别为音乐声的声音”；第四，在心理学上，噪音是“干扰或者侵害”㉔。在这些描述中，除了第四种较为含混外，ASMR中被集中表现的触发音与前三种对噪音的定义显然是重合的。它们在日常生活中随处可见，又往往“难以听见”，因听觉的“遮蔽效应”㉕而无法引起注意，如涂抹手霜、整理床单、水倒进玻璃杯、翻动纸张等。即便是触发音“耳语”，也往往贴近麦克风发声，低频、缓慢、声带不震动。耳语并不简单等同于人声，它总是伴随着视频中的动作出现，但仅仅具有提示作用（如“我们接下来听到的是动听的气泡音”等），表意简单，不传递太多信息，有时甚至难以听清。可以说，在某种程度上，ASMR正是在主动地恢复日常性的噪音。

需要进一步分辨的是，就效果而言，人们十分容易将ASMR与自然声效（如雨声、瀑布声）或白噪音等混同，但是比较之下可以发现，二者仍然有倾向性的不同。比如，相对于白噪音来说，ASMR中“角色扮演”式的情境塑造更为常见。需要注意的是，ASMR的情境并不导向清晰的叙事或者特定的亲密关系。那么，如何理解这种情境的意义呢？

笔者希望以“弱情境”一词来表示ASMR中既有其特定意义、又刻意削弱叙事性的情境特征。实际上，ASMR所展现的并非是自然界中5%的可发声物，相反，它更关注如何通过动作（敲击、摆动）令事物发声。换句话说，ASMR不同于自然音效之处在于，它要求人作为主体的在场，它通过声音激活的是人与事物之间的关系。这提示着ASMR中另一个听觉快感的来源，即特定的情境，如剪发、按摩、掏耳朵等。其效用的情境性远远高于叙事性——大部分作品极力避免戏剧化情节，声音和动作是重复循环的，没有清晰的时间延展和因果逻辑。此外， ASMR的受众必须依赖耳机才能获得应有的效果，这也增强了其私人性与亲密性。需要特别指出的是，2015年的一项相关研究指出，YouTube上75%的ASMR视频都有耳语元素㉖，而YouTube上第一个ASMR频道就是“耳语生活”（WhisperingLife）。这些轻柔的耳语声通过双耳录制，在听者耳边萦绕，进而将各种触发音连缀起来，形成某种弱情境。这些情境极为日常，往往有意避免戏剧冲突或者有着明确意指的人际关系和特定情境，但又包含着常见的、温和的弱亲密关系。

以谢弗描述的现代声景为参照，可以显现出ASMR的声音实践对现代声景所引发的种种分裂的弥合与想象性修补：经由视频表演，被区隔的视觉与听觉得以重合；被室内“交响声”掩盖或被玻璃阻隔在外的日常噪声得到了虚拟性的呈现；原子化的、彼此隔离的中产阶级生活，也在一种仿拟的、安全的弱情境之中象征性地恢复了亲密关系。从这个意义上来说，作为大众文化的ASMR正是对现代声景的无意识应答，而听者的快感很大程度上来源于此。不过，需要注意的是，这样的论述事实上还缺失一块重要的拼图，即现代声音媒介以及听觉的中介化。

四、声音中介化与听觉具身性

现代声音的开端往往被回溯至19世纪晚期电话与电报的技术发展以及留声机的发明，因为技术令声音脱离了事物自身，进入再生产进程并逐步被资本裹挟。这一论题成为当代声音研究的重要基石。比如乔纳森·斯特恩的《能听见的过去：声音再生产的文化起源》将促发声音再生产的技术进一步上溯至听诊器，指出它开启了声音的中介化，并迎合、推动了强调社交距离的中产阶级文化㉗。他在2012年出版的著作《MP3：一个格式的意义》中，讨论了在20世纪的声音编码、媒介变革与资本选择中一种声音格式的标准化过程㉘。如前所述，声音现代媒介的演进也令听觉日益中介化。在20世纪逐步推进的声音录制、存储、编码进程中，声音得以与声源相分离，听觉也越来越远离发声物，人们倾向于通过机器接收秩序化的声音。数字化声音作为这一进程的结果，也在资本推动下迅速全面发展，展示出十分丰富复杂又难以估量的前景。如果说以日本虚拟偶像“初音未来”的合成语音仅仅是一个象征性事件㉙，那么，近几年语音识别与合成的技术推进及其对社会生活的全面渗透，无疑表征着数字化声音对现代声景的控制力量。值得一提的是，无论是希翁还是谢弗，其理论都在不同程度上对数字化声音持有疑虑：对于希翁来说，数字化声音是一个关于无损声音的神话，它是被追求高保真度的商业宣传催生出来的㉚；而在谢弗的论域里，数字化声音恐怕同样可疑——对所有声音（包括乐音、自然声音乃至语音）的模拟和取代，使它成为声音的“拟像”，更彻底地隔断了人对于真实环境音的感知。

显然，在新的语境下，ASMR亚文化与数字化声音之间的关联变得更加复杂：一方面，ASMR以知觉快感为旗帜，回避意义而凸显身体性；另一方面，正是声音的数字化进程促使听觉成为可消费、可编辑的客体，而ASMR文本对媒介（如网络、收放音设备等）的依赖，又在客观上将身体知觉符号化。如前所述，ASMR对知觉快感的强调在广告中尤为明显。相比于传统的叙事性广告，这些广告更直接地展示商品本身，通过重复、特写式地聚焦于商品在使用中所发出的细微声音，唤起人们对商品的直接感知。比如，在雷诺汽车与ASMR表演者“zeitgeist”合作的广告中，并无常规汽车广告对性能、外观的强调，也没有对消费者身份的暗示，在十多分钟里，“zeitgeist”只是用手指轻柔敲击汽车的引擎盖、车身、轮胎，抚摸方向盘、座椅，反复启动汽车。美国快餐公司Applebee’s推出的一支长达一小时的ASMR广告，也只表现了牛排、鸡翅等在炉架上烤得滋滋作响的情形，而并无快餐广告中常见的聚会、家庭、节日等要素。在修辞学意义上，一般广告往往隐喻式地将被售卖的商品置换为其他事物，如偶像明星、社会地位、生活方式、家庭关系等，而ASMR广告则倾向于借代式地放大商品的声音特质，将注意力引回商品自身。正如autonomous（自发性）一词所示，ASMR对叙事性的疏离是有意为之，因为它所尝试定义的并非一种由心理、经验、情感影响的可被规约的感受，而是一种生理性的、神秘的、不能被理性和既有知识所解释的知觉。

ASMR对于听觉身体性的强调，使得它在探讨声音本体性问题上比希翁更加激进。在这一点上，20世纪末兴起的后人类主义思潮关于具身性的讨论具有一定启发性。凯瑟琳·海勒在《我们何以成为后人类：文学、信息科学和控制论中的虚拟身体》一书中，直接表达了对“身体的后现代意识形态”的不满，因为在这一流行的学说中，“身体的物质性是第二位的，身体编码的逻辑或符号结构是第一位的”㉛。为了讨论身体的物质性，她用“具身”（embodiment）来替代“身体”（body），同时，用具身与意识更换了身体与灵魂的二元对立，认为意识不过是“运行着自我建构和自我保障程序”的“小系统”㉜，而长久以来将它视作“人类身份的根本”则是人文主义意识形态的盲区。与此相对，海勒强调“身体实践”的重要性：“身体实践具有这种力量，因为它们已经沉淀到习惯性的动作和行为中，深入到意识觉悟之下。在此层面，它们获得了一种惯性。这种惯性可以惊人地抵制想要对它们进行修正或改变的意识动机。”㉝换句话说，通过习惯性的动作和行为，具身产生了一种不需要“在认知上被确认”的知识，这意味着“人类知道的东西，比他们意识到自己知道的东西多得多”，因为新变化不一定能够被形式化、放入已有的程序中㉞。

通过颠倒意识与具身之间的等级关系，凯瑟琳·海勒预示出一种“后人类的未来”，即放弃以意识为中心的人类自我想象，重新思考我们在面对机器、特别是智能机器日益重要这一现实时，应当如何处理人和机器之间的关系。在她看来，人与机器非此即彼的竞争关系是一种来自人文主义的幻觉，在不可逆转的趋势下，思考二者如何共存恐怕比强化敌意要更为迫切。因此，具身在某种程度上正是人面对机器时的自我认同㉟。在这个意义上，ASMR亚文化回应着后人类主义的论题。一方面，数字化声音急速显影了后人类现实之一隅，如合成语音被越来越广泛地应用于公共空间，日渐取代人声在信息传递上的媒介功能。与此同时，关于听觉和声音的亚文化日益繁盛，特别是以人声为核心的声音崇拜，其中潜在的听觉的知觉本体性或具身性，在ASMR亚文化中体现得最为清晰——它将对声音的关注从信息载体的媒介维度转向引发快感的知觉维度。由此，它或许正提示着人与机器的知觉再分配已然启动。另一方面，令这种回应更为复杂的是，ASMR所体现的并非声音本质主义，它也不抗拒机器的中介，相反，它对于声音技术与设备极为依赖。比如，它们有着极为一致的特殊录制方式——双耳录制。在ASMR视频中，录音设备总是与声源同时在场，最为主流的录音设备是3DIO，它的外形特征模拟人的双耳，是更为昂贵的人头录音设备（如Neumann Ku100）的简化版。这种录音设备的显著特征是模拟人耳的听觉效果，如骨传导、鼻梁和耳廓所造成的声音衍射和反射等等。在ASMR的录制过程中，表演者最常见的动作是将声源从一只“耳朵”移向另一只，或者前后移动——由于双耳会通过其所听到声音的强弱来确定事物的方位，这样的动作可以营造出一种声源如在耳边的错觉，也构成了重要的快感来源。可以说，这一设备直观地将身体机械化，在某种程度上令知觉与机器信号得以互相流动和转换。由此，探究知觉本源、强调听觉快感的ASMR呈现出它的另一面——其对于声音数字化和媒介技术的依赖，或许正意味着当声音的媒介功能日益受机器掌控时，一种新的听觉规训进程也由此启动。也就是说，ASMR并不单纯是对听觉的知觉本体性的探讨，而是在声音技术促发所形成的声音媒介性与知觉性的分裂中显现出来的一种征候，它凸显着身体的机械化进程与后人类具身性探讨之间的张力。

结语

ASMR亚文化现象在当下的媒介、技术与社会语境中，或许成为了关于声音诸问题的索引。它对声音本身而非其内容的强调，将19世纪以来现代声音逐渐中介化和资本化的进程推向了高峰，并进一步将听觉从诸知觉中分离出来。同时，它对弱情境与亲密感的营造和独特的聆听方式，显影了当代原子化社会公私区隔、可控性增强的声景。更值得注意的是，它对人声的强调在当下广泛应用的语音识别与合成技术中构成了一个征候：在语音本身进入数字化进程后，其媒介功能也正在被机器取代。作为一个概念范畴与实践形式，ASMR或许提示着某种更为复杂和隐蔽的后人类进程，其中，知觉功能向机器的移交令人文主义式的主体想象进一步瓦解，而由此显现出的具身性知觉能否承载一种新的主体想象，开启后人类主义讨论的命题，则有待更深入的思考。

① 艾媒大文娱产业研究中心：《2019中国在线音频市场研究报告》，https://www.iimedia.cn/c400/63744.html。

② “What Is ASMR?”,https://asmruniversity.com/about⁃asmr/what⁃is⁃asmr/.

③ “History of ASMR”,https://asmruniversity.com/history⁃of⁃asmr/.

④⑦ Joceline Andersen,“Now You’ve Got the Shiveries: Affect, Intimacy, and the ASMR Whisper Community”,Television&New Media,Vol.16,Issue 8 (December,2015):693,692.

⑤ Cf. Emma L. Barratt and Nick J. Davis,“Autonomous Sensory Meridian Response (ASMR): A Flow⁃Like Men⁃tal State”, https://peerj.com/articles/851/; Emma L. Barratt, Charles Spence and Nick J. Davis,“Sensory Deter⁃minants of the Autonomous Sensory Meridian Response (ASMR): Understanding the Triggers”, https://peerj.com/articles/3846/; Stephen D. Smith, Beverley Katherine Fredborg and Jennifer Kornelsen,“An Examination of the Default Mode Network in Individuals with Autonomous Sensory Meridian Response (ASMR)”,Social Neuroscience,Vol.12,Issue 4(August,2017):361-365.

⑥ Joceline Andersen,“Now You’ve Got the Shiveries: Affect, Intimacy, and the ASMR Whisper Community”,Television&New Media,Vol. 16, Issue 8 (December, 2015): 683-700; Rob Gallagher,“Eliciting Euphoria On⁃line: The Aesthetics of‘ASMR’Video Culture”,Film Criticism,Vol. 40, Issue 2, 2016, https://quod.lib.umich.edu/f/fc/13761232.0040.202?view=text;rgn=main.

⑧ 笔者未使用“聆听”“倾听”等词，而是尝试模仿“凝视”一词提出“凝听”，以强调视觉与听觉的对应关系，以及ASMR文化对于声音本身而非其内容的专注。

⑨⑲㉒㉔㉚米歇尔·希翁：《声音》，张艾弓译，北京大学出版社2013年版，第153页，第172页，第70—71页，第227页，第146页。

⑩ Christian Metz and Georgia Gurrieri,“Aural Objects”,Yale French Studies,No.60(1980):26.

⑪ Rick Altman,“Moving Lips:Cinema as Ventriloquism”,Yale French Studies,No.60(1980):76,74.

⑫⑬ Slavoj Žižek,“‘I Hear You with My Eyes’; or, the Invisible Master”,in Renata Salecl and Slavoj Žižek (eds.),Gaze and Voice as Love Objects,Durham and London:Duke University Press,1996,p.92,p.94.

⑭⑮ 米歇尔·希翁：《视听：幻觉的构建》，黄英侠译，北京联合出版公司2014年版，第27页，第29页。

⑯⑰ Raymond Murry Schafer,The Soundscape: Our Sonic Environment and the Tuning of the World,Rochester, Ver⁃mont:Destiny Books,1994,p.71,p.74.

⑱ Jonathan Sterne,“Soundscape, Landscape, Escape”, in Karin Bijsterveld (ed.),Soundscapes of the Urban Past: Staged Sound as Mediated Cultural Heritage,Bielefeld:Transcript Verlag,2013,pp.181-193.

⑳ 雷蒙德·默里·谢弗：《被玻璃所阻隔的“声音景观”》，王敦译，《文学与文化》2016年第2期。

㉑ Emily Thompson,“Introduction”,The Soundscape of Modernity: Architectural Acoustics and the Culture of Listening in America,1900-1933,Cambridge,Massachusetts and London:The MIT Press,2002,pp.1-12.

㉓ Jacques Attali,Noise: The Political Economy of Music,trans. Brian Massumi, Minneapolis:The University of Minne⁃sota Press,1985.

㉕即空间中并存的不同声音会相互竞争和相互干扰。参见米歇尔·希翁：《声音》，第57页。

㉖ Dr. Richard,“The First Peer⁃Reviewed Publication about ASMR: Meaning of the Data & Next Steps”, https://asmruniversity.com/2015/04/25/first⁃asmr⁃research⁃publication⁃three/.

㉗ Jonathan Sterne,The Audible Past: Cultural Origins of Sound Reproduction,Durham and London: Duke University Press,2003,pp.104-117.

㉘ Jonathan Sterne,MP3:The Meaning of a Format,Durham and London:Duke University Press,2012.

㉙ “初音未来”最初指雅马哈公司的Vocaloid系列语音合成程序的音源库，2007年被赋予了绿色长发少女的形象，成为软件的虚拟象征，并逐渐发展为虚拟偶像歌手。

㉛㉜㉝㉞㉟凯瑟琳·海勒：《我们何以成为后人类：文学、信息科学和控制论中的虚拟身体》，刘宇清译，北京大学出版社2017年版，第257页，第388页，第275页，第270页，第388页。