推进计算文学研究
——对笪章难《以计算的方法反对计算文学研究》一文的讨论①
2019-02-09霍伊特安德鲁派博泰德安德伍德马克阿尔吉休伊特凯瑟琳伯德笪章难姜文涛
[美]霍伊特·朗 [美]苏 真 [加]安德鲁·派博 [美]泰德·安德伍德 [美]马克·阿尔吉-休伊特 [澳]凯瑟琳·伯德 [美] 笪章难>撰 汪 蘅>译 姜文涛>校
(芝加哥大学,美国 芝加哥 60637;麦吉尔大学,加拿大 蒙特利尔 H1K2E3; 伊利诺伊大学厄巴纳-香槟分校,美国 伊利诺伊州厄巴纳-香槟市 61801;斯坦福大学,美国 加利福尼亚州斯坦福市 94305;澳大利亚国立大学,澳大利亚 堪培拉 ACT 0200;圣母大学,美国 印第安纳州南本德市 46556)
一、重申《以计算的方法反对计算文学研究》的基本观点——笪章难
首先,一个限定条件。由于论坛的时间限制,我只能谈及论坛参与者提出的议题中的一部分,而且仍然不够精确。我计划发布一份附加回复,处理更为细致的技术问题。
《以计算的方法反对计算文学研究》不是为了改进计算文学研究(CLS)而写的,不只是呼吁更严谨或呼吁全面的重复,不是为了解决哪种统计学研究模式最适用于计算文学分析。这不是一篇方法文章;一些回复我的人也指出了,那样的文章非常多。
写这篇文章是要为文学学者和编辑们赋权,让他们能够提出关于计算和定量文学批评的合乎逻辑的问题——假如他们怀疑在结果和论证中间存在概念上的不匹配或察觉到文学批评批判方法的收益特别的低。
我希望这篇论文使我们意识到两种类型的CLS研究。第一,有统计上严谨的研究,但无法真正回答它要着手解决的问题,或完全不提有趣的问题;第二,看起来发布了有趣的结果,但要么没有鲁棒性(robustness),要么逻辑混乱。混乱有时来自用户错误等问题,但更经常的是由次优地或不必要地使用统计学和其他机器学习工具引起的。论文尝试去神秘化这些工具在文学语料库上的应用,并解释为何当你的目标是文学解释或描述时,技术错误会被放大。我的文章是长时间调研的终点,调查的是计算方法及其定量分析模式能否在文学研究中有收获。结论是,驱动定量结果和数据模式的事物往往和学者们宣布的文学批评或文学史论点关系甚少,他们号称正在找出如此的结果或那般的模式——尽管有时候看起来像是这么回事。如果我们在CLS中发现的结论证实了或驳斥了现有知识,这并不标志它们是对的,而是说它们在最好情况下是同义反复,在最坏情况下只不过流于表面。
本文对文学批评应该为何持不可知立场,不对阐释习惯做诊断。指控它采取“纯粹主义”立场,这纯属推测。文章意在描述学术研究不应为何。即使在文章最后几页呼吁读书,也并不推测“实际在读”有内在的意义,而仅仅是反驳意在简单分类的工具应用,人类在这方面的抉择要精确且所费要便宜得多。
至于探索性数据分析VS验证数据分析的问题:我不倾向于任何一种。如果涉及数字及其解释,那么统计学不得不发挥作用;我不知道任何绕开它的方法。如果你仅仅想要描述数据,那么你就得展现一些来自非简化论测量结果的有趣内容。至于求助探索性工具:如果你的工具由于缺乏力量或对目标来说过于拟合而完全不能探讨正在考虑的问题,你的解释性工具就是不需要的。
定量方法和非定量方法也许可以协力工作,这看起来无可指摘。我的论文只是在说:理论上也许如此,但实际不足。安德鲁·派博指出归纳问题,关于如何从局部到整体、从检验性到说明性,这正是我的文章质询的那个缺口,因为这就是合作的理想开始崩坏之处。可以随便称呼这个缺口的强行弥合——一种新的解释学、认识论,或者形态——但到最后,逻辑必须清楚。
批评我的人指出了一种困境,说的没错。但这困境是他们的,不是我的。我的观点也是说,再往前走,不是由我或一小群人来决定这个工作价值为何或应该怎么做。
首先,文学学者一直在向其他领域的学者请教意见和评价。其次,精神分析解读的收益,哪怕寻求的是文学外的意义和有效性,也不是为了心理学,而是为了文学批评的意义,其成功与否取决于自身。CLS想说:我们的工作本身作为文学批评没有太多收益也OK的,不管是在散文的水平上还是洞察力的精微上;收益就在于用到这些方法、描述数据、产生预测性模型,或者让别人未来能够提出(也许更好的)问题上。收益在于建立实验室、资助学生、创办新期刊、为终身教职和博士后资格以及高得惊人的拨款给出理由。如果是这些说法,那么不止一个学科需要被叫来评估这些方法、应用及其结果。由于已发表的对特定文学学术研究的批判通常不会被通过指出依然蓄势待发的事情而遭反驳,我们对付的是两种不同的学术模型。这种情况下,我们应该最大限度地跨学科。
二、 信任计算文学研究 ——霍伊特·朗、苏真
笪章难的《以计算的方法反对计算文学研究》一文在过去反对文学计算方法的论战中很醒目,因为她自称要严肃对待计算。她承认,严肃从事此类研究意味着要发展统计及涉及其他概念的素养。她的论文许诺要让争论超越对数字的断然拒绝,转向关于研究可否科学重复的对话,这是这种辩论朝前迈出的对于批评有益的一步。
但其效用终结于此。“不要相信数字,” 笪章难警告说,“不要相信他们的数字,相信我的。”“如果你相信他们的数字”,她暗示道,“那么计算方法的整个立场就分崩离析了。”相信她的数字,你会发现这一点。但她的数字无法信任。笪章难对文化分析学领域14篇文章的批判充满技术和事实错误。这不只是关于细节的争吵。这些错误反映出她对基本统计概念理解的缺陷,类似于文学研究的外行把乔治·艾略特称为“著名男作家”(1)乔治·艾略特(George Eliot),英国19世纪著名女作家玛丽·安·伊文思(Mary Ann Evans, 1819—1880)的笔名。——译者注。更让人担心的是笪章难没能将统计方法理解为与语境相关的、历史的和阐释的项目,坦率地说,她的论文最大的错误是人文主义错误。
这里我们关注的是笪章难和预测模型有关的错误。这是她在批判我们的两篇文章中使用的核心方法。在《湍流:世界文学的计算模型》中,我们用13个语言学特征建立了一个意识流(SOC)叙事模型,发现其中10个合起来能可靠地区分我们确定为SOC(和现实主义小说语料库中的篇章相对比)的篇章。类符/型符比(TTR)是词汇多样性的测量,是其中最有区分力的,尽管它本身并不提供信息。我们在论文里仔细解释过了,这个预测模型的目标在于理解多种特征如何协同辨认风格模式,而不是单独辨认。笪章难的批判中没有什么内容表明她意识到了这个基本原则。
其实,笪章难只质询了我们模型中的一个特征(TTR),并认为修改它就会让我们的建模失效。具体来说,她检验了TTR和SOC之间的强关联在移除她的“标准停顿词列表”中的词语后是否依然成立,而不是移除我们使用的停顿词列表的词语。她发现它不成立。这里有两个问题。首先,TTR和“TTR减去停顿词”是两个分开的特征。我们在模型里确实纳入了这两种,而且发现后者有最低的独特程度。第二,尽管检验特征鲁棒性的本能是恰当的,但断言存在一个应该普世使用的“标准”停顿词列表就是拆台了。我们的列表是特为用于19世纪和20世纪早期小说而创建的。就算有正当理由采纳她的“标准”列表,也必须重新跑模型、检验重新测量的“TTR减去停顿词”特征是否改变了整体的预测精度。笪章难没有这么做。这就像随意拨弄钢琴的一只琴键,还没弹另一个音符就宣布整个乐器走调了。
但是错误还不止于此。批判《文学模式识别:文本细读与机器学习之间的现代主义》时,她试图让我们的模型分类英语俳句诗和非俳句诗的鲁棒性失效。她的办法是创造一个新的“中文对联英译文”语料库,在这个语料库上检验我们的模型。为什么这么做?她表示这是因为它们充满了和英语俳句“类似的意象”,也很“亚洲”。这个误入歧途的抉择,有东方主义的气味,它完全抹去了语境和历史,提出一个实际不存在的本体论关系。这就是为什么我们花了超过12页篇幅从批评和历史的角度叙述英语俳句形式。
这些错误代表了一种始终如一的拒绝:拒绝将某人的阐释实践置于语境和历史中考虑(确实去“好好解读”),不管是统计上还是人文上。我们不相信存在“客观上”好的文学阐释或者存在一种“正确的”做统计分析的方法:笪章难的立场是多数科学史家和多数统计学家都会拒绝的。文学和科学的惯例都是持续争论和重新阐释的,而非从高处传下来。和文学研究一样,统计学这种知识体系形成于乱糟糟的学科史和不同的实践群体。笪章难的论文坚持一种非常固执的、“客观的”、黑白分明的知识版本,这种倾向同统计学和文学研究全都完全相反。这种版本的故事不怎么让人信任。
三、所研究案例的选择不能代表计算文学研究——安德鲁·派博
笪章难的研究文章加入了横跨几个学科的新潮流,可以归在“重复”的主题下。(2)Nan Z. Da, “The Computational Case Against Computational Literary Studies”, Critical Inquiry 45 (Spring 2019),601-639.引自本文的内容,下不一一注释,只随正文标注页码。——译者注这方面,她的文章遵循了其他领域的主要做法,例如开放科学合作联盟(OSC)的“重复性项目”,该项目寻求重复心理学领域过去的研究。(3)Open Science Collaboration, “Estimating the Reproducibility of Psychological Science”, Science 28 Aug 2015:Vol. 349, Issue 6251, aac4716.DOI: 10.1126/science.aac4716.OSC作者写道,如果做得好,重复的价值在于它能“在发现结果被复制时增加确定性,在不能复制时促进创新”。
但是,尽管她的研究做出了关于整个领域的影响广泛的结论,却未能遵循任何由OSC等项目创立的程序和实践。虽然提到了重复的认知论框架——也就是证明或驳斥单个文章和整个领域的有效性——她的实际做法却遵照了文学批评领域的古老的选择性阅读传统。笪章难的研究归根结底有价值,但不是因为她提出的以计算的方法反对计算文学研究(这项工作还待做),而是她突出了传统文学批评模型被拿来做大规模证据性结论时伴随而来的诸多问题。好消息是这篇文章让归纳问题,也就是如何同选择性阅读做斗争的问题,进入了本领域面对的中心议题。
以所选的证据开始说。OSC在做重复项目时,生成的样本有100个研究,取自1年内出版的3个不同期刊,以接近合理的本领域抽样。笪章难却选择了“少量”文章(我数了下是14篇),来自不同年份、不同期刊,没有清晰的理由说明为何这些文章能代表整个领域。问题不是所选的数量,而是我们无法知道为什么选择这些文章而非其他文章,因此无法知道她的发现结果是否可延伸至所选样本之外的其他研究。唯一的联系似乎是这些研究按她的标准都“不成立”。试想一下,如果OSC发现百分之百的样本文章都不能重复,我们会不会认为他们的结果可信?而笪章难则相反,永远正确,令人惊讶。
笪章难对这些文章的关注表现出更深程度的无代表性。OSC在重复项目中建立了清晰可辨的标准,可以宣布一项研究无法重复,也能承认做出这一结论的困难;相反,笪章难则每篇文章用不同标准,做出有争议的选择,并犯下彻底的错误,明显是特意设计的,目的是为了突出差异。
她把文章作者的名字弄错、引用版本弄错、论证所引用的书弄错,还在一些基本数学问题上出错。(4)她把Mark Algee-Hewitt 写作Mark Hewitt, 把G. Casella当作 Introduction to Statistical Learning 的作者,实际上作者是Gareth James, 在附录中把我和Andrew Goldstone当作共同作者,实际上不是。但是每一个论断加起来总是得到同一个肯定的结论:不能重复。在笪章难的认知里,部分总是整体的完美代表。也许笪章难文章的最大局限在于她对统计推论和计算模型极为狭窄的(也就是无代表性)的定义。在她看来,使用数据唯一恰当的方式是做显著性检验,也就是用统计模型去检验给定的假设是否“成立”。(5)像下面这种说法也表明,就算在统计学这个方面,她也远远不够做可信的向导:“毕竟,统计学假定95%的时间里都没有差异,只有5%的时间里存在差异。寻找低于0.05的P值就是这个意思。”这不是寻找低于0.05的p值的意思。p值是零假设成立时得到观测数据的估计概率。原假设成立的情况下,p值越小,就越应该拒绝原假设。前面提到的5%门槛对于出现“差异”的频率(或者说,零假设不成立的频率)并无影响。相反,它的意义是:“如果我们从数据得出结论认为存在差异,我们估计我们在5%的时间内是错的。”“统计学”也不会“自动”假设0.05是合适的临界点,这取决于领域、问题和建模的目标。这些都是很严重的过分简化。解释性数据分析、理论建构或预测性建模在她对本领域的理解中没有位置。(6)关于对文学模型的反思,见Andrew Piper, “Think Small: On Literary Modeling”, PMLA132.3 (2017): 651-658; Richard Jean So, “All Models Are Wrong”, PMLA132.3 (2017); Ted Underwood, “Algorithmic Modeling: Or, Modeling Data We Do Not Yet Understand”, The Shape of Data in Digital Humanities: Modeling Texts and Text-based Resources, eds. J. Flanders and F. Jannidis (New York: Routledge, 2018).考虑到笪章难自己就没有做此类检验,这特别讽刺。她要别人按标准来,自己却不用据此负责。她也没有引用那些明确做了检验的文章,(7)参见Andrew Piper and Eva Portelance, “How Cultural Capital Works: Prizewinning Novels, Bestsellers, and the Time of Reading”, Post-45(2016); Eve Kraicer and Andrew Piper, “Social Characters: The Hierarchy of Gender in Contemporary English-Language Fiction”, Journal of Cultural Analytics, January 30, 2019. DOI: 10.31235/osf.io/4kwrg; and Andrew Piper, “Fictionality”, Journal of Cultural Analytics, Dec. 20, 2016. DOI: 10.31235/osf.io/93mdj.或者引用质疑此类检验的价值的研究,(8)讨论显著性检验的价值的文献非常多。见Simmons, Joseph P., Leif D. Nelson, and Uri Simonsohn. “False-Positive Psychology: Undisclosed Flexibility in Data Collection and Analysis Allows Presenting Anything as Significant”, Psychological Science 22, no. 11 (November 2011): 1359-66. doi:10.1177/0956797611417632.或引用那些探讨词频和人类判断之间关系的研究,她是认为这一关系很成问题的。(9)参见Rens Bod, Jennifer Hay, and Stefanie Jannedy, Probabilistic Linguistics (Cambridge, MA: MIT Press, 2003); Dan Jurafsky and James Martin, “Vector Semantics”, Speech and Language Processing, 3rd Edition (2018): https://web.stanford.edu/~jurafsky/slp3/6.pdf; 关于交流和信息理论的关系,参见M.W. Crocker, Demberg, V. & Teich, E. “Information Density and Linguistic Encoding”, Künstliche Intelligenz 30.1 (2016) 77-81. https://doi.org/10.1007/s13218-015-0391-y; 关于与语言习得和学习的关系,见Erickson LC, Thiessen ED, “Statistical learning of language: theory, validity, and predictions of a statistical learning account of language acquisition”, Dev. Rev. 37 (2015): 66-108.doi:10.1016/j.dr.2015.05.002.笪章难的研究工作的选择性和更广阔的研究景观深深脱节。这些实践突出了一个更普遍的问题,文学研究领域中太长时间以来都未审查这个问题——对于世上万物,要如何可靠地从个体观察转移到普遍信念?涉及归纳个体研究或整体领域时,笪章难的文章是选择性阅读问题的杰作。处理负责的、可信的归纳问题,将是未来本领域面临的最大挑战之一。数据和计算建模会和宇宙中其他学科一样,在此过程中扮演不可或缺的角色。
四、需要更有成效地讨论计算文学研究——泰德·安德伍德
人文学科和其他学科一样,和数字打交道的研究者们时常会重复并检验彼此的结论。(10)Andrew Goldstone, “Of Literary Standards and Logistic Regression: A Reproduction”, January 4, 2016, https://andrewgoldstone.com/blog/2016/01/04/standards/. Jonathan Goodwin, “Darko Suvin’s Genres of Victorian SF Revisited”,Oct 17, 2016, https://jgoodwin.net/blog/more-suvin.笪章难对这个成长中的流派的贡献与先例不同,区别主要在于移动得更快。例如,我和我的共同作者用5800个词描述、重复并部分地评论一篇关于流行乐的文章。(11)Ted Underwood, “Can We Date Revolutions in the History of Literature and Music?”, The Stone and the Shell, October 3, 2015, https://tedunderwood.com/2015/10/03/can-we-date-revolutions-in-the-history-of-literature-and-music/ Ted Underwood, Hoyt Long, Richard Jean So, and Yuancheng Zhu, “You Say You Found a Revolution”, The Stone and the Shell, February 7, 2016, https://tedunderwood.com/2016/02/07/you-say-you-found-a-revolution.相反,笪章难用38页就打发了14篇运用不同方法的文章。文章的能量令人印象深刻,其长期影响应是正面的。
但这节奏有代价。如果读者尚未了解她总结的那些作品,当她匆忙解释、开始谴责时,其论证也许让人头晕,了解这些作品的读者会意识到笪章难的总结充满重大的忽略和错误。对文学研究领域的计算开展理论争论的时机已成熟,但很不幸这篇文章非常误导人——即使在释义的层次上——无法作为这一争论的起点。
例如,笪章难提出,我的文章《体裁的生命周期》让体裁看起来稳定,只是因为它忘了比较苹果和苹果:“安德伍德应该在1941年前的侦探小说(A)上训练他的模型,和1941年前的‘乱炖’(指随机混杂的作品——译者注)相比较,再在1941年后的侦探小说(B)上训练,和1941年后的‘乱炖’相比较,而不是在两组作品上用同一批‘乱炖’作品”(p.608)。
这让人迷惑不已的批判要我去做的事,我在文章里明确说过已经做了:根据出版日期比较不同组的作品。(12)Ted Underwood, “The Life Cycles of Genres”, Journal of Cultural Analytics, May 23, 2016, http://culturalanalytics.org/2016/05/the-life-cycles-of-genres.文章里也没有随机混杂的作品,笪章难的可笑措辞将随机对比集和令人不快的“乱炖”混为一谈,它在论证中起到了不同的作用。
更重要的是,笪章难的批判压制了我的文章的比较主题——主题确定侦探小说比其他几个体裁更稳定——以便竖起一个声称所有体裁“从19世纪20年代直到如今都多少保持一致”(p.609)的稻草人。这个稻草人主题缺乏任何可用于测量一致性的比较准绳,因此变得无法证明。在其他情况中,笪章难忽略了一篇文章的显著性结果,就为了嘲笑一个显著性有限的结果,而作者已经承认了这一点——但她完全没有提及作者承认了有限。这就是她对待乔科斯和基里洛夫的方式(p.610)。
简单说,这篇文章没有在整体批判上下工夫。笪章难没有描述组织起一篇文章的各种目标,而经常假设研究者试图(或未能)做一些她认为他们应该做的事。比如,主题模型能识别语料库中的模式,而不用假装发现了独特而正确的描述。人文学者用这个方法多半是为了解释性分析,但笪章难一开始就假设主题模型肯定是混乱的尝试,要证明某种假设。于是,当她发现(并花了一页内容去证明)这个方法跑了好几次能出现不同的主题,感到震惊。这是真的。这也是这个方法的基本预设,笪章难提及的所有作者都承认这一点——他们彼此之间用了好几页来讨论变化的结果如何仍能用来解释研究。笪章难没有承认这一讨论。
最后,《以计算的方法反对计算文学研究》一文起始就有一些关键性误导,暗示说文化分析学纯粹基于语言学证据,主要是词语。确实,词语能揭示许多事情,但这种对当代趋势的说法很误导人。定量方法正掀起浪潮,部分因为研究者们已经学会从文学中提取社会关系,部分因为他们将语言和外部社会证据配对——例如评论家的判断。(13)Eve Kraicer and Andrew Piper, “Social Characters: The Hierarchy of Gender in Contemporary English-Language Fiction”, Journal of Cultural Analytics, January 30, 2019, http://culturalanalytics.org/2019/01/social-characters-the-hierarchy-of-gender-in-contemporary-english-language-fiction.有些文章,就像我自己关于叙事速度的文章一样,使用数字完全是为了描述读者的阐释。(14)Ted Underwood, “Why Literary Time is Measured in Minutes”, ELH 25.2 (2018): 341-65.笪章难的论战战略再一次要将整体中的细节孤立出来,然后当作整体来批判。
对文化分析学更盘根究底的研究方法也许已经发现,它不是单块巨石,而是几个彼此频繁互相批判的项目之间持续展开的辩论。例如凯瑟琳·伯德就在一个范例性的论证中批评其他研究者的数据(包括我的),论证开头精确描述了历史表现的不同研究方法。(15)Katherine Bode, “The Equivalence of ‘Close’ and ‘Distant’ Reading; or, Toward a New Object for Data-Rich Literary History”, MLQ 78.1 (2017): 77-106.笪章难本可以做出类似有成效的干预——比如解释研究者应该如何在解释性分析中报告不确定性。她的论文没能做到这一点,因为要急匆匆谴责尽量多的例子,这阻止了该文花时间描述并真正地理解其批判对象。
五、文化分析学是增强版的人文学科,不是没有阐释技巧的虚拟人文学科——马克·阿尔吉-休伊特
笪章难的文章《以计算的方法反对计算文学研究》中充满了一系列二元对立:计算或阅读;数字或词语;统计或批判性思考。从这些错误的对立出发,文章魔术般变出了计算和批评之间的冲突。但文化分析学领域却是依赖于发现这些二元项目间的可兼容性的:计算要有和文学批评手牵手一起工作的能力,从业者用批评性阐释去理解自己的统计。
笪章难假设的这些对立导致她把注意力完全集中在对验证数据分析(CDA)的零假设检验上:选择图表,提出假设,寻找显著性中的错误。(16)笪章难提到的许多文章都结合了CDA and EDA.但是,在探索性数据分析(EDA)的创始人、数学家约翰·图基看来,让数据自己说话,不带潜在假设地将之视觉化,能让研究者避开确认偏见的陷阱。(17)Tukey, John. Exploratory Data Analysis, New York, Pearson, 1977.这就是心理学家威廉·麦奎尔(1989)说的“假设检验神话”:如果研究人员一开始就相信一个假设(例如文学太复杂,无法用计算分析),那么,她或他就能通过对数据的简单操纵证明自己是对的(挑拣支持自己论点的例证)。(18)McGuire, William J. “A perspectivist approach to the strategic planning of programmatic scientific research”, In Psychology of Science: Contributions to Metascience ed. B. Gholson et al. Cambridge: Cambridge UP, 1989. 214-245.拘束于本领域正统的从业者往往会在统计学整合到新研究领域时错过被揭示出来的新模式。
文学研究中,EDA产生的视觉化并不取代阅读;相反,它将阅读重新导向新的目的。统计显著性的每个场所都揭示出新的阅读中心:定量行为和任何解释一样并不特别简化。统计的严谨依然关键,但这些数据目标嵌入理论装备中的方式同样不可或缺,这一装备依赖文学阐释。(19)例如我们关于“批评的模块化”的论证,见Algee-Hewitt, Mark, Fredner, Erik, and Walser, Hannah. “The Novel As Data”, Cambridge Companion to the Novel ed. Eric Bulson. Cambridge: Cambridge UP, 2018,189-215.然而在笪章难的文章中,她从平均长度10250个词的13篇文章中摘取简单的统计数字。她只有忽视这些万字文章,拒绝解读图表语境及论证、调整、异议,才能控制其论断。
由于笪章难坚持验证数据分析,她的批判就需要一个假设:如果缺席语境之外没有假设,她就被迫发明一个。就算粗略读一遍《维特拓扑学》就能发现,我们对于“《维特》对其他文本的影响”的问题不感兴趣:相反,我们感兴趣的是当语料库围绕《维特》的语言重新组织时对语料库的影响。(20)Da (2019), 634; Piper and Algee-Hewitt, (“The Werther Effect I”, Distant Readings: Topologies of German Culture in the Long Nineteenth Century, Ed Matt Erlin and Lynn Tatlock. Rochester: Camden House, 2014), 156-157.这种拓扑学创造出新的邻接性,激发了新的解读:它并不证明或反驳,它不存在对或错——如果提出其他理解,那就是范畴错误。
文化分析学不是要用数学严谨性取代学者们数百年来发展出的阐释技巧的虚拟人文学科,它是增强的人文学科,在最好的情况下,能展现最仔细的细读读者往往也看不见的新类型的证据和仔细考虑过的理论观点,二者联手产生新的批评研究。
六、需要对用机械方法研究文学数据、统计学和机器学习进行更多的批判——凯瑟琳·伯德
笪章难对CLS的统计学评论所驳斥的一种研究方法我本人也很关注,但她对这个领域和统计研究的框架有误解。她对CLS的定义——用统计学,主要是占压倒性地位的机器学习去研究词语模式——排除了大多数我会归到计算文学研究范畴的内容,包括以下研究方式:运用数据建设和数字信息综合处理作为批评分析的形式;分析文献学和其他元数据,探讨文学趋势;采用机器学习方法界定文学现象,做非计算解释;或者为了文学研究的目的,将数据视觉化和机器学习等方法的含义理论化。
除了笪章难对CLS独具一格的限制性定义外,我最吃惊的是她对统计研究的构想过于拘束且前后不一致。笪章难提到的研究者中,大多数都明确认为机器学习的支点排斥以实证主义观点对待文学数据和计算,而更倾向于将建模看作主观实践。笪章难似乎认为,首先,这个支点出现得还不够(CLS采取机械方法处理文学解释);其次,走得太远了(CLS对数据推论太随心所欲,例如“隐喻化……编码和统计学”[p.606 n.9])。一方面,笪章难一再表明,如果CLS选择一条略微不同的路——也就是用更恰当的样本训练,准备文本数据时更严谨,避免主题模型等不可复制的方法,以语料库语言学家的成熟方式运用自然语言处理——就能抵达转折点:采用的数据、应用的方法、提出的问题就能变得适于统计分析。另一方面,她又将“好好读文学”确定为“界限点所在”,从而排除了这个可能性,在这个点,计算文本分析就不再有“效用”(p.639)。这种对统计研究的有限看法也在笪章难关于文本挖掘的统计工具的两个说法中浮现:它们“在伦理上是中性的”;必须“根据其实际功能”使用(p.620),笪章难界定的实际功能是简化信息以便快速做出判断,但是任何知识上的探索,任何测量结果——更不用说有此特定目标的测量——都是和这个有伦理维度的世界的互动。
统计论证的统计检验至关重要。我同意笪章难的看法:用机器学习去界定文学中的词语模式往往简化了复杂的历史和评论议题。她提出,这种简单化包括将模型看作“有意的解释”(p.621),认为词语模式表示文学因果关系和影响。但是,认出这些问题和坚持认为统计工具有对文学研究有害的“实际功能”,这中间相距甚远。我们的学科历来从其他领域(历史、哲学、心理学、社会学等)吸收不同方法。也许正是假设中的文学研究缺乏功能效用(而笪章难声称要为之辩护)才让这些吸收采纳如此富有成效;也许这些采纳卓有成效是因为文学的意义不是单一的,而是由社会构成性地锻造而成的,在这个社会里,特定时刻中特定范式(历史的、哲学的、心理学的、社会学的,现在是统计学)的突出地位塑造了我们所知的一切和了解这一切的方式。任何情况下,学科的纯洁性都无法保护贫乏的方法论;跨学科性能增加方法论意识。
笪章难对统计学“实际功能”的僵化看法阻碍了她就文学研究和统计方法间可能的遭遇提出更有“论证意义”(p.639)的问题。这样的问题可能包括:如果不是有意的或解释性的,那么机器学习辨识出的模式在认识论上——以及本体论和伦理上——地位为何?有没有将词语计数和其他文学或非文学因素相连的方式,可以促进类似模型的“解释力”(p.640)和/或批评潜力,如果没有,为什么?就像哲学、社会学和科学技术研究领域中发生的一样,文学研究能否应用理论视角(如女性主义经验主义或新唯物主义)重新想象文学数据和统计研究?没有这些方法论和认识论上的反思,笪章难用统计方式对统计模型的暴露就落入她归到这些论点头上的同一陷阱中:将“机械地发生的事混淆为深刻的见识”(p.639)。我们非常需要机械的——实证的、简化论的和非历史的——方法处理文学数据、统计学和机器学习。不幸的是,笪章难的批判却显示出她强烈批评的问题。
七、我文章中的一些错误——笪章难
1. “毕竟,统计学自动假定”(p.608)这个说法是不对的。更正确的说法应为:在标准假设检验中,95%置信度意味着,当零假设成立时,95%的情况下无法拒绝。
2. 将不同的文本挖掘/机器学习应用描述(p.620)为“伦理上是中性的”,措辞不够小心。我显然并不认为其中有些应用在伦理上是中性的,例如用算法追踪恐怖分子。论文中的意思是,这些工具有无数种应用:为了好的、坏的,或其他的目的。总的来说,很难给它们分配一个意识形态的位置。
3. 泰德·安德伍德说我在讨论他的文章《体裁的生命周期》时,将“令人不快的‘乱炖’”和他用于预测性模型中的随机控制集混淆了,他是对的。安德伍德也没有犯我在文章中提到的他犯下的基本统计错误(“安德伍德应该在1941年前的侦探小说[A]上训练”[p.608])。
有关错误陈述的指控:一篇论文“仅有的中心思想……是说我们称为‘体裁’的东西也许是不同种类的实体,有不同的生命周期和文本连贯度”,要释义这篇论文是困难的。此处安德伍德的论点涉及侦探小说、哥特小说和科幻小说随时间过去的相对连贯性,以1930年为截断点。
我关于这篇文章的其他说法依然成立。该文引用了不同文学学者关于体裁变化的定义,但它隐含的体裁定义是“10000个常用词随时间过去的一致性”。它无法“拒绝弗朗哥·莫雷蒂关于体裁有代际循环的推测”(多数人应已发现这个推测太过于简化论),因为它所用的不是同样的可检验的体裁定义或变化定义。
4. 主题模型:我的观点不是说主题模型不能重复,而是说,在这个特定应用中,它们不鲁棒(robust)。例举各种证据中的一个:如果我从一百个文档中移除一个文档,主题就变了。这就是问题。
5. 关于霍伊特·朗和苏真的论文《湍流:世界文学的计算模型》,我需要更多一点时间,负责地重新跑一下其他方案。霍伊特·朗和苏真建立的工具有13个特征,用于预测两个体裁间的差异——意识流和现实主义。他们说:大多数特征单独不怎么有预测性,但合起来就非常有预测性,而那种能力被集中在单独一个特征中。我表明那一个特征不鲁棒。修正一下他们令人困惑的隐喻:就好像如果有人声称一架钢琴弹奏起来很优美而大半声音来自一个键。我按了那个键——没用。
6. 苏真和霍伊特·朗辩称,因为我证明他们的分类器错误地分类了非俳句——如他们指出的,我不仅使用了中文诗歌的英译,还用了俳句之前久已存在的日文诗歌——我就犯了“误入歧途的抉择,有东方主义的气味,它完全抹去了语境和历史,提出一个实际不存在的本体论关系”。这一点值得搞清楚。他们的分类器缺乏力量,因为它仅能以非常不同于俳句的诗歌为参照分类俳句;说白了,它会把包含和俳句很接近的重叠关键词的同样短小的文本分类为俳句。重叠的关键词是他们的预测特征,不是我的。我不确定为什么指出这一点就东方主义了。至于他们的模型,如果不得不说,我会说,它只是轻微东方主义,如果不是决定性的东方主义的话。
7. 霍伊特·朗和苏真提出,我的“数字无法信任”,我的“批判充满技术和事实错误”,结尾也同样断定我的论文“不怎么让人信任”。我承认在这篇文章中犯了一些错误,但不是在我对霍伊特·朗和苏真论文的分析中(错误基本在第3部分)。我希望用印刷出版或在线附录这种更正式的回复列出所有这些错误。总而言之,发现一个错误不能就似是而非、含沙射影地说证明了某人模型无效就是东方主义、冥顽不化,诸如此类。
八、我最后的回应:呼吁有效、公平的批评——笪章难
我想表明,这个《批评探索》杂志设立的论坛没有不平衡或不公正之处。我写了这篇文章,不同意这篇文章(部分或全部)的人也有权在学术论坛批判它。
我的批评者和中立方想从《以计算的方法反对计算文学研究》中得到的不外是:(1)全面的重复性检查(如派博建议的,由OSC来做);(2)对CLS工作的仔细分析,其中就算对细枝末节的“抑制”都算作误导;(3)计算文学研究和相关数字人文领域的研究现状。在他们看来,此种脑力劳动会让我的研究变得有效。
泰德·安德伍德提出,我的文章和这个论坛其实是设计好用来吸引关注的噱头,这个说法损害了我们可以简单称为批评研究的学术工作模式。他认为这可能是时代的功能,他是对的。社交媒体等都提出,由于我以非恭贺的方式批判CLS,要求我必须立刻为此负责,这是一种征象,体现出计算研究和数字人文为自己积累的社会和体制权力。
确实,“杀死领域”这个说法不属于学术界,它是又一个迹象,表明特定类型的学术话语只应发生在特定语境中。说了这些,关于团结和“更多”的无根修辞——我们全都在一起,在其中——是拙劣的辩解方式。如我所言,现在是时候提出一些问题了。
安德伍德谴责社交媒体和其他公众回应,他遗漏了社交媒体和其他圈子里同样有害的要让我的文章无效的尝试,其方法是私下议论——或不如说,公开质疑——《批评探索》的同行评审程序。安德伍德和这篇文章的其他许多批评者提出,文章没有领域外人士恰当地进行过同行评审。这不是事实,而且造成了破坏——我的论文由一位定量分析和数学建模专家评审过。它表明,任何敢于核查CLS领军人物研究工作的人将会被流言折磨。
我的文章是否犯了实证错误?是的,有几个,大多在第3部分。我会及时列出,但它们对该部分的宏观论点并无影响。除了讨论安德伍德论文时的一处误解,在这个论坛上发表的以实证为基础的反驳当中,没有一个有任何根据。派博说我“基本数学不及格”的证据涉及的是一处简单的修辞,我出于易读性考虑将数字四舍五入到千位。
任何从事严肃定量分析的人都能看出,我肯定不是评估这一工作的理想人选。但我仍然认为,此处争议的根本利益冲突对所有人都显而易见。能够高水平做这个工作的人往往不太在意,不去批判它,或者他们倾向于不去质疑定量方法如何以各种形式和论证模式同文学批评的独特性相交叉。为了充分表露情况:我的领域外评审人在评估了我的实证观点的有效性后,最终并不赞成我认为计算方法对文学目标效果不佳的看法。这就是问题的症结。统计学家或计算科学家能够核查执行中的实证错误和误差,他们不理解什么构成了文学学术研究中的弱论证或概念混淆的论证。这就是为何我在附录中列出的指南——有很多人参与了同行评审——应该得到考虑。
九、要鼓励文化分析学新学术与新生代学者——马克·阿尔吉-休伊特
2010年,我作为新的博士后研究员向一些资深学者讲解一篇论文,主题是詹姆斯·汤姆逊1730年的诗《四季》。我用细读表明,汤姆逊在这首诗的每部分都为读者模仿了一种审美体验,然后教他们如何解释它。听众反应温和,多数正面。六个月后,我已经获得略多一些的信心,又讲了同一个题目,但有个逆转:我加入了一张图表,显示我的解读是基于诗歌贯穿始终的一个重复语篇模式。反应迅速且两极分化:屋里有些人认为定量方法深化了论辩,其他人强烈认为我正在破坏整个领域。对我来说,这次经验对我的发展是形成性的:在数字人文还远未获得任何声望、资金或制度支持之前,仅仅拿出数字就足以惹怒年长我许多的学者们。
我的经验表明,这个项目通过了笪章难说的“气味测试”:评论结果依然有效,甚至不用定量分析的设备支持。同时,尽管笪章难说这证明了项目的定量方面原本并无必要,我表示尊重,但还是对此提出反对。我发现的模式是我的解读的基础,假如我讲解时表现得好像完全是通过细读得到的结论,再怎么也是不真诚的。我的论点的定量部分也让我能够将这首诗和18世纪更大规模的诗学模式相连。而且我进一步认为,定量分析进入一个领域并改变了这个领域,那么同样,这个领域也改变了这个方法,让它适应自己的目的;根据统计学结果和文学史方法得到的结论的一致性而肯定这一结果,这和零假设检验一样有力。换句话说,笪章难的“气味测试”提示了综合这些方法的向前的潜在方式。
但我学到的教训依然强大:不管计算方法如何嵌入研究、不管谁使用,它总能激发许多人文学者即刻的、往往是负面的反应,这值得问一句为什么。审查各种方法的体制、政治和性别史总是值得的,如新历史、形式主义,甚至细读,那么就像凯瑟琳·伯德建议的,在数字人文中作为整体仔细考虑这些议题,也是重要的。关键是从事这些工作时,我们不要抹除本领域新出现的、往往结构上脆弱的成员的工作。这些方法在新的学生和年轻学者群体中有很强的吸引力。想要断言方法和目标之间存在完全的不兼容并借此压制学术,这将损害新生代学者令人惊叹的探索工作,而这些工作正在重新塑造我们的批判实践和我们对文学的理解。
附录1:远读与文学知识——评《远距离视野:数字证据与文学变化》(21)附录1、2两篇书评摘自耶鲁大学 “Post45”研究团队网站(post45.research.yale.edu)。2019年5月,该网站发表了由丹·辛金(Dan Sinykin)主持的“Cultural Analytics Now”学术专栏,这两篇书评为此专栏的一部分。感谢“Post45”及丹·辛金授予中文版权。附录1所评书为泰德·安德伍德(Ted Underwood)的《远距离视野:数字证据与文学变化》 (Distant Horizons: Digital Evidence and Literary Change, Chicago, London: The University of Chicago Press, 2019 ),引自本书的内容只随正文夹注页码,不再另注。书评作者丹·辛金是美国圣母大学(University of Notre Dame)数字人文博士后研究人员,从2019年秋天起将担任埃默里大学(Emory University)的助理英语教授。
一、冲突
泰德·安德伍德野心勃勃。在芝加哥大学出版社2019年2月出版的《远距离视野:数字证据与文学变化》(以下简称《远距离视野》)一书中,他报告说,统计模型中的最新进展提供了“表现和阐释世界的新方法”(p.162)。《远距离视野》用一本书的篇幅论证了应在文学研究中采用这些方法。他用统计模型修订了语言、体裁、声望和性别的文学史,并特别提出,将文学研究划分为不同的历史时期培养了局部见识,却妨碍了有关横跨长时间的文学史知识,而统计模型可令这种知识成为可能。其中涉及的观点有力且充满争议,事关文学语言的独特性和美国大学英语系在宇宙中的位置,他的直截了当令人佩服。最近围绕文学计算分析的热烈讨论可在这里找到其根源上的利害关系:英语作为一门学科的未来和知识本身的性质,受到学术界中英语学科的权力份额下降和2008年后世界政治经济秩序的影响。
《远距离视野》的写作充满大家风范。任何关注文学研究的人都应阅读本书,尽管安德伍德因其抱负而意在让本书面向更广泛的受众——“那些想要理解人类历史的人们”(p.162)。这本书清晰易懂、调子精确、令人信服。安德伍德知道,许多计算文学批评——或者用他更喜爱的说法:远读——“都可能陷入过分苛求的泥潭”(p. 150),他在附录中阐述自己的数据和方法,解决了这一障碍。他相信“大规模文学分析的真正挑战并非认知的或伦理的,而是审美的:根本很难以风卷残云之势就数千本书写作”(p. 156)。关于认知和伦理,他错了;但就他给自己设立的“风卷残云”这个挑战而言,完成得很漂亮。对我来说,这本书令人欲罢不能。
文化分析工具的批评者往往声称定量工作并未产生——甚至无法产生——有价值的文学研究知识。《远距离视野》应能终结这些批评。安德伍德特意为此目的做了安排。前四章的每一章都对当前学术研究做一种介入,揭示出学术研究中历史分期如何模糊了长期趋势。例如第一章中他问道,小说在其历史上是否从讲述转移到表现?我们有时会听到这个问题。对比亨利·菲尔丁《汤姆·琼斯》中的全知叙述和一部亨利·詹姆斯小说中受限的第三人称叙述,就能轻易看出这点。但是,安德伍德写道,“还完全不清楚之前的19世纪小说是否应理解为在此方向的缓慢进展。全知叙述成就了维多利亚时期小说的独特力量,在如今的后现代元虚构作品和类型小说中也依然重要”(p. 7)。学者如何才能判断实际发生了什么?
为了回答这个问题,安德伍德引进了模型,他简单将模型定义为“变量间关系”(p. 19)。这在有关近代大学的思想史方面的研究上,是令人兴奋的进展。安德伍德采用的模型只有一二十年历史,但已经转变了社会科学和自然科学的诸多学科,《远距离视野》是其应用于人文学科的最成熟案例。要理解它,文学评论家需要忘掉之前听说的有关数字人文的许多说法。安德伍德强调,现在是时候对这一工作进行重大框架重整了。他用不着大数据,没有扩展正典或分析大量未读作品。他欣然承认笔记本电脑力量足够,不到一个下午就能运行一个典型程序。和算法标榜的客观性相反,他为了人文研究的目的而利用了人类对计算模型的偏见。
阅读安德伍德第一章的兴奋感部分来自观看他麻利地改变了文化分析学的范式,这是从测量到模型的转移。作为对小说叙述长时间线理解的最初把握,安德伍德求助于斯坦福文学实验室早期的一个著名发现。2012年,赖安·霍伊泽尔和朗·勒-柯克发表了一个小册子,表明在1800—2000年间,物理描述在小说中越来越常见,抽象则越来越少见。乍一看,这种测量似乎让小说从讲述到表现转变这一说法令人信服。但安德伍德仔细地消除了这种模式发现可能提供的任何权威,他尤其提到“翻遍海量证据、寻找有趣内容时,我们冒着选择性使用的风险”(p. 17)。
关键的转变在于一开始就不从文学数据中寻求模型,而是“以阐释性假设起步”并“发明检验这个假设的方式”(p. 17)。安德伍德写道:“我们需要调转研究中的步骤顺序”(p. 17)。而后,他复制了霍伊泽尔和勒-柯克的研究。他添加了传记,“作为对比研究的试金石”(p. 13),并证明霍伊泽尔和勒-柯克揭示的小说的语言倾向对此并无影响。不同寻常的是,他提出假设说:在文学史的漫长区域内,小说偏离了传记。为了检验这一点,他采用了统计模型。
贯穿全书所用的模型是逻辑回归——机器学习的一种形式。一种常见的解释这个模型的方法是以垃圾邮件为例。一个假想的电子邮件提供商训练模型学习区别垃圾邮件和合法邮件,方法是给它加标注的两种邮件的范例,要它学习能借以最可靠地分辨二者的那些特征。这些特征可能包括充斥着全大写或类似“意外之财”或“得到报酬”等短语。提供商测试模型时给它未加标签的电子邮件并让它分辨。如果它大部分时候都能做到,那就是个不错的垃圾邮件过滤器。一旦模型内化了专属一个范畴的模式,从业人员就能测试其他范畴的文本与其有多接近。如果我训练了一个垃圾邮件过滤器,就可以用来自我母校和我母亲的邮件来测试其中一类邮件和垃圾邮件的相似度,采取的角度来自使垃圾邮件和其他内容不同的任何内容。安德伍德把这叫作视角化模型。他用它做各种用途,包括从任意一个体裁的视角来测试不同体裁的相似之处,比如侦探小说和科幻小说。
在这个例子中,安德伍德在加标注的小说和传记上训练模型,让它预测未加标注的文本的种类。对他最有用的不是模型的二元预测,而是其他功能属性中的两个:它展示出任意文本是小说或传记的可能性,将其显示为二者间连续体上的一个百分比;它显示出让它得以辨别二者的那些特征。这两种体裁随着实践分道扬镳,行为动词、身体部位和感官知觉动词成为小说的特征,传记的特征则是政治术语、有组织的信仰体系、抽象概念。(p. 25)安德伍德的结论是“小说在传记(和其他非虚构形式)很少能够提供的方面稳定地专业化起来:精确描述的时空中的身体描述、肢体动作和即刻的感官知觉”(p. 26)。通过模型,他确认了霍伊泽尔和勒-柯克测量的真实性,将其置于更大的语言趋势中与传记相比,发现了小说的独特之处。尽管这一测量揭示的是孤立的事实,能引发猜测,安德伍德的模型使得关于文学史的一种有说服力的论点成为可能。
他巧妙地结束了本章,回到批评传统,承认“学者们对小说和传记间不断扩大的差距中每个部分都已有了一些解释”(p. 31)。但他提醒读者,占有片段不一定就认出了整体。文化分析学的批评者太经常落入事后诸葛亮的偏见中,想象他们一直就知道分析家刚刚展示的内容。安德伍德仔细审视分析的每一步骤,明确表明我们尚未了解之事,又在本章末尾指出并暴露后见之明的偏见,径直解决了这个问题。其论点的力量是两面的:从长时间线来看,各特定时期的主张变得彼此一致;特定文本的语言行为通过表达或进入争论而以新的方式产生意义,不仅和该时期公认的规范争论,也和数世纪来延伸的趋势争论。本章结尾安德伍德暗示了能展示这种力量的一种细读。我希望他写了,但他没有写,这是他对这种做法意见减弱的表现。
第三章令人满意地扩展了第一章,提出了可能的机制。安德伍德发现,史上建立在评介基础上的有威望的判断越来越鼓励人们将文学性理解为“时间上的即时性和具体性”(p. 107)。他将此发现和传统上对文学史的叙述相比,后者强调对比和革命。在亨利·詹姆斯的序言中或在艾兹拉·庞德的宣言中,文学批评家已经发现了断裂,其中盛行的文学价值观发生了戏剧性变化。但安德伍德利用机器学习表明这不是文学史起作用的方式;相反,视角化模型显示,文学史遵循一个积累过程,他称之为“更是如此”(p. 107)逻辑。“‘更是如此’这个逻辑”,他写道,“解释了每一次赚到钱的单次真实重启(gritty reboot)如何让我们注定要有一长串越来越真实的重启。”(gritty reboot指的是更为现实、逼真地重新制作系列电影,以符合成年观众口味,此处的“真实”带有现实得令人不快的含义,如《蝙蝠侠》系列等。——译者注) “但是,”他又说,“高级文学形式的文学史家忽视了这种势头”(p. 107),就像我们得到越来越真实的重启那样,文学的声望经济中的刺激给了我们小说,由于其与众不同的语言,小说和传记的差异越来越大,而我们逐渐将这样的语言确认为文学性。
被追问时,安德伍德关于历史分期的论证显出裂缝。他写道,“过去六七十年,我们假定只有当文学史关于冲突的故事时,才可能有趣且有启发”(p. 106)。这个我们是谁?我认为符合这一描述的文学评论家很少,有两个原因:“才可能有趣”忽略了许多并不依赖冲突叙事的学术工作;另外它低估了反讽的可能性,我们让自己与历史分期保持试探性距离,我们拿它当特洛伊木马用,一旦进入其中我们也许能发现许多有趣、有启发的内容,超过允许我们进入其中的那些学科规范。他对历史分期的评价延续了前一本书《为何文学时期很重要》的阐述,他在那本书中表明文学分期的兴起最初是一种让中产阶级维护文化权威的方式,后来是文学研究维护文化权威的方式。阿曼达·安德森在另一篇本来热情洋溢的评论文章里提到安德伍德让论证的需求导向了他对那些不那么强调中断的思想流派的忽视,例如马克思主义,另外在她看来,中断“并不像他说的那么普遍和具决定性”(p. 136)。在《远距离视野》中,中断在安德伍德眼中的用处导致了对它的夸大。
安德伍德反对文学史冲突模型的论证中还有一种未明言的张力。冲突模型——我们以为事情是这样但它们其实是那样——也是他的模型,如果从文学史传递到文学批评史的话。他经常背离它(冲突模型),用他的发现去综合现存学术研究,而这些都是本书最佳段落,但他自己对冲突模型的使用是导致他夸大分期对文学史影响的原因之一,他写道:“冲突确实能讲个好故事”(p. 107)。
二、文学性
笪章难在《以计算的方法反对计算文学研究》中提到,在文化分析学的“数据工作”中,“要决定哪些词语或标点要计数、如何表现这些计数。就这些。”(22)Nan Z. Da,“The Computational Case Against Computational Literary Studies”,Critical Inquiry 45, no. 3(2019): 606.她提到这一点是作为批判。她认为用电脑给词语计数无法提供必要的细微之处来解释文学的复杂性。在她的叙述中,尝试这么做的学者注定失败,包括安德鲁·派博和泰德·安德伍德。
安德伍德为词语计数的力量辩护。他的视角化模型只需依靠词语计数便可区分文本类型。“不熟悉这种方法的读者”,他写道,“经常为了仅仅通过词频来表现文学作品这种做法表面的单纯而感到困惑不安”(p. 21)。他有两条论证对此反驳:在学术研究中,“基于词频的模型在预测人类读者(关于如何分类文本)的判断时和更为复杂的方法一样(成功)” (p. 21);另外,“体裁在诸多不同层面上被冗余地表现”(p. 42),包括词语计数。第一条很可靠;第二条也不可不加考虑,而笪章难希望读者不用考虑这条——但也无法像安德伍德有时候认为得那么牢靠。安德伍德好几次暗示词语计数捕捉了——对应于——定义体裁的其他模式,包括风格(p. 42, p. 52, p. 58, p. 89)。但是他很大程度上将这个问题交由他人决定,包括安德鲁·派博和他在《列举》中的说法。反过来,派博又指向计算语言学和自然语言处理中的规范语言哲学:分布语义学,苔丝在她的评论中对此有讨论。(23)此处指的是苔丝·麦克纳尔迪对安德鲁·派博出版于2018年的著作《计算:数据与文学研究》的书评,见附录2——译者注分布语义学和文化分析学的相遇对我来说既充满可能性又远远未充分研究。
但《远距离视野》基本不取决于词语计数是否与风格相关。这本书的一个成就在于表明了词语计数在视角化模型方面的力量,安德伍德以此为基础做出的结论基本上有说服力。再想想他的第一章,他用词语计数为随时间出现的小说与传记间的差异制作模型。他的模型借以权衡每个词的基础在于它对于区分这二者有多少帮助。他用一个词汇表(“行为动词”“身体部位”“政治术语”)将词语分组为语义范畴并计算各自权重,这让他对这两种体裁间大规模的一般性话语差异有细微的感知。安德伍德承认这有点简略,但也展示了他提到的它揭示的内容:在漫长的小说历史中之前不为人知的趋势。我在别处也写到过,他在第四章中以更精彩的方式用了同样的方法,其中就有和大卫·班蒙、萨宾娜·李的合作研究,揭示了作者如何就性别写作的历史。他的模型很容易区别1850年的角色性别,但这种二元属性越来越不清晰,直至当下,同时倾向于性别的聚合或模糊或增加。安德伍德追踪了个体词汇如何对这种性别化做出贡献。例如,19世纪时“露齿一笑”(grinned)和“微笑”(smiled)意思中性,但到了1950年变得两极分化——“露齿一笑”意味着男性,“微笑”则是女性——但到了2000年才重回中性。“眼睛”(eyes)和“头发”(hair)在1800年是中性的,渐渐却变得女性化;“口袋”(pocket)则变得男性化;而“阅读”一直都是中性的。
这样的论辩为文化分析学做了有力辩护,显示出模型建造能如何挑战或促进批判的本能。《远距离视野》解决了文化分析学对文学研究是否有用的问题。但是笪章难的论文以及它所吸引的关注揭示出学科内关于在紧缩时代文学研究应该做什么这个问题上分歧有多严重。
安德伍德预料到他的方法和笪章难的观点容易引发争吵,他用最后一章为作为学科实践的“远读”辩护。考虑到这场争论的性质,许多观察者也许会惊讶地了解到笪章难和安德伍德的意见有许多一致之处。安德伍德不喜欢“技术崇拜”,对“大数据”也保持怀疑。他和笪章难一样,批评文学评论家天真地运用主题建模和网络图表。他和笪章难一样,坚持认为研究者应该分享代码、报告效应值并测量可能的不确定之处。他们彼此一致的范围表明我们已经抵达了争论的新阶段,不再那么涉及计算的能力或文化分析学是否能有所贡献,更多的是关于建立模型和统计方法的含义和作用。这样,笪章难因为确认了安德伍德提倡的重构正在顺利展开而推进了这个领域。
尽管他们有一致之处,笪章难和安德伍德也确实站在一项重要分歧的两端。对于文化分析学是否适合文学分析,他们意见不同,而且这一分歧来自根本上互不相容的文学观念本身。笪章难认为计算方法无法评估文学细微的复杂性,她的专著《不可传递的相遇》讲述了陌生而遭误解的跨太平洋文学互动,她在书中关注了“文学独特的形式或修辞或逻辑”(24)Nan Z. Da, Intransitive Encounters: Sino-U.S. Literatures and the Limits of Exchange (New York: ColumbiaUniversity Press, 2018): 2.。文学独特的功能属性立于其视野的核心处。她认为远读无法辨识或阐明她所研究的短暂的中美交流。(25)Nan Z. Da, Intransitive Encounters: Sino-U.S. Literatures and the Limits of Exchange (New York: ColumbiaUniversity Press, 2018):26-31.2018年12月,笪章难和加州大学洛杉矶分校的阿纳海德·内西西安扩展了这个学科观点,在芝加哥大学出版社发布了系列丛书——《思考文学》,专注于“改进作为推理模式的文学批评”,将“解释的艺术当作独特的研究种类”。(26)“Thinking Literature”, series ed. Nan Z. Da and Anahid Nersessian, University of Chicago Press.在其他地方,内西西安还复活了克林斯·布鲁克斯的观点,提出将文学定义为无法充分释义的事物,文学是“行动而不示意” 的艺术品。(27)Anahid Nersessian, “Literary Agnotology”,ELH 84, no. 2 (2017):341.她认为,文学提供了有关“修辞格或修辞手段”的“否定的或延期的知识”。(28)Anahid Nersessian, “Literary Agnotology”,ELH 84, no. 2 (2017):342.另外,内西西安和耶鲁大学的乔纳森·卡拉姆尼克为作为文学研究概念的“形式”的特异性做了辩护,它“无歉意也不妥协地服务于文学的学科性”。(29)Jonathan Kramnick and Anahid Nersessian,“Form and Explanation”, Critical Inquiry 43, no. 3 (2017): 39对卡拉姆尼克而言,尊重文学研究的自治性——“其学科阅读实践及相关形式、风格或体裁的词汇,以及涉及关注、严谨、历史背景等等的相关规范”——来自更基本的多元主义,一种“对世界多样性的尊重”(30)Jonathan Kramnick,“The Interdisciplinary Delusion”, Chronicle of Higher Education, October 11, 2018.。
这些就是安德伍德在最后一章里讨论的观点,指出这是远读的一个对立来源。他确定它们属于更悠久的文学史,尊崇独特细节而非概括,大概随着浪漫主义出现,直至新批评和新历史主义。他直接反对在方法论之间划一道“理想化的边界”(p. 150)。他写道:“我们发明了关于某种知识形式的理论,只有文学批评家才能接触——因为唯有我们在照料语言的微妙、思想的本质吊诡,或人类多样性的伦理后果”(p. 148)。在他看来,“定义(文学研究的)独特性的坦诚方式是说出我们拥有关注有趣或令人愉快之物的特权”(p. 148)。这一点上他很坚定:“我只愿意通过直截了当强调文学的趣味和乐趣,将文学史同社会科学分开”(p. 150)。安德伍德通常都宽厚面对对话者,此时他跌入少见的严苛时刻:“为文学研究自治性辩护的论点是为不关心做辩解”(p. 150)。很奇怪看到他在用这本书展示了文学研究的独特力量之后,又这么摒弃了它。
文学知识在多元论世界中是独特的还是同万物相连?双方都有夸张。文学既非严格自治于其他类型的语言,也非断然与其同构。安德伍德表明了文学性如何是历史的偶然、如何依赖于特权的社会学、如何与传记区分并成为自身;但文学评论发展了特别的方法处理修辞格、修辞手段、形式、风格、体裁——语言的微妙之处。这些方法需要经年的大量实践方能掌握,就像我记得每次我教授文学研究入门时都发现本来很聪明的学生并不觉得细读是凭直觉的。
双方都表达了摒弃,还鼓励了认为文学分析学同文学研究实践不相容的错误想法。这就是为何我认为安德伍德细读的缺乏令人失望。他在《远距离视野》中所做的一切都为新鲜而有潜力、令人惊艳的细读铺好了路,能展示计算分析在阐释文本中看不见的细微差别、复杂性、微妙之处和利害关系方面的能力。例如他顺带提到,他的科幻小说模型错误地将托马斯·品钦的《拍卖第四十九批》分类到自己这边。学者们传统上、也很有理由地将品钦的小说看作对侦探小说的恶搞。但根据安德伍德的模型,令科幻小说与众不同的是一种粗略的崇高感。“这个模型认为的同科幻小说传统有关的内容可能并不是品钦明面上对熵的关注,”他写道,“而是他对大众社会的规模本身偏执着迷”(p. 59)。随后本来可以是一段让人头晕眼花而又愉快的解读,有机会促进我们对这本小说、这个体裁,以及词语计数变为纸页上的风格方式的理解;但安德伍德匆匆走开,错失了能证明评论家错了的机会。
三、现实主义
安德伍德很现实,考虑到学习定量方法所包含的挑战,“如果今后十年哪怕有2%的文学学者愿意投身这项任务”,他“都会很惊讶”(p. 145)。他相信,如果我们承认“如今数字在人文学科中着实边缘的地位,就这个话题大量辩论会很可笑”(p. 145)。我同意。围绕这些方法的争斗是象征性的,是个替代物,为了争论我们珍视之物以及我们对身为学者所做之事的看法。从争辩往后退一步,这场争斗看起来像是浪费精力。莎拉·布洛莱特认为英语系的命运不取决于这场斗争的结果,更宏大的力量正参与其中。
文化分析学在学科中的位置非常小,其方法不仅和笪章难、卡拉姆尼克和内西西安提倡的完全兼容,和文学批评家支配的所有领域都兼容。它和任何其他方法一样,也可能被糟糕地使用。安德伍德通过《远距离视野》已经表明,这个方法能够被出色地运用,教我们一些与文学语言、体裁、特权及性别有关的事。对于任何对文化分析学如何看待文学感兴趣的人,安德伍德搭好了舞台,让伟大的工作到来。
附录2:模型与意义——评《计算:数据与文学研究》(31)附录2所评书为安德鲁·派博(Andrew Piper)的《计算:数据与文学研究》(Enumerations: Data and Literary Studies,Chicago,London:The University of Chicago Press,2018),引自本书的内容只随正文夹注页码,不再另注。书评作者苔丝·麦克纳尔迪(Tess McNulty)为哈佛大学学者,研究方向为当代文学和数字文化。
一、模型
2018年8月,芝加哥大学出版社出版了安德鲁·派博的《计算:数据与文学研究》(以下简称《计算》),开篇便提出简单而具煽动性的指控:文学评论家不懂如何恰当地归纳。为了证明观点、表明野心,派博以艾里希·奥尔巴赫的《模仿论》为例——这个选择特别且单一,出人意料。在派博看来,这本备受尊崇的书为整个“西方文学”提出了主张(p. 6);但他认为这是建立在谬误的基础上。《模仿论》的每一章都用一个单篇代表一部完整的“巨著”。这些单个“巨著”又代表了“所有西方文学”。派博称这种错误为“认识论悲剧”:它表明了将部分与整体相联系这种基础能力的缺乏(p. 7)。
派博认为问题一直存在。文学评论依然像奥尔巴赫那样寻求归纳——例如,我们也许会对“那本小说”(p. xi)做出总体性断言。派博认为,即使那些抵制归纳的人也必须承认其重要性。甚至凯瑟琳·加拉格尔和史蒂芬·格林布拉特等新历史主义者——那些留意文本独特个性的人——最终也将其纠缠置于一般语境之中。但派博说,尽管有必要做归纳,我们却仍不胜任。我们无法以“用于单个文档的……那种严谨”将文本与其语境联系起来。派博称,我们要呼吁的是“归纳的科学”(p. xi)。在《计算》中他提出了一种:他认为文学评论家能够用计算模型更好地归纳。
初初一看这可能很眼熟。过去20年,计算文学评论和弗朗科·莫雷蒂的名字紧紧相连,他2005年的《远读》一书提出类似观点。莫雷蒂和派博一样强调需要提出归纳性论点——他说,除非文学评论家也看了另外99.5%的作品,否则就无法理解那0.5%的正典化作品。莫雷蒂也和派博一样推崇计算,他认为压根就没办法让学者们去“细读”那些“大量未读作品”。(32)Franco Moretti, Distant Reading (London: Verso, 2019), 66-7. 他将这个说法归功于玛格丽特·科恩(Margaret Cohen),是她造了这个词。他们必须求助于“远读”,这完全必要。
不过,派博在两个方面修正了莫雷蒂的想法:第一,他并不强调规模——也就是查看更多文本的必要性——而强调代表性。他问道,我们如何能够做出真正有代表性的归纳,我们是在谈论单个篇章抑或全部体裁?第二,他不是宽泛地提议使用计算方法,而是更具体地为建造“模型”辩护。派博所称的“模型”是电脑设计的文本“体现”或“缩微模型”(p. 9)。如通常所说,它们给“词语计数”,但也能进行更复杂多样的操作。派博说,建立这些模型就能更好地议定文学的部分和整体。
我们能怎样着手这项任务?讽刺的是,很难归纳。派博在他内容广泛的书里建立了诸多不同类型的模型——仅举三例:“矢量空间模型”“主题模型”和“预测模型”。他用这些模型回答不同类型的问题。在本书的六章里面,他逐步使用越来越复杂的计算方法来处理基本的文学评论主题:标点、情节、传统主题、功能性、角色塑造和语料库(或诗歌生涯)。他的推进结束于自我意识中。派博将他的方法用于自身,开始有点异想天开地建造模型,描述我们刚读过的这本书。例如,他优雅地承认,书的章节随着它们的逐步进展越来越自信——也就是随着他的逐步进展。对我来说,最后这个谦逊的姿态比这本书开头大胆的火炮齐鸣更加体现力量。《计算》为模型提出了两个野心勃勃的理论辩护,但最终其论据由于在实践中被小心限制的程度而令人信服。
二、词、词、词
派博给模型做的第一个辩护源于以下信念:词语计数不只是词语计数,它是通往我们所谓文本“意义”的关键因素。这一信念在派博从计算语言学中得来的“分布语义学”理论中找到了支持。根据这个理论的“分布假设”,一个词的意义和它出现在特定语境中的频率以及它在该语境中和其他词相比出现的频率相关。由此可推论,一个文档的意义也和词频及分布相关。这个理论有某种直觉的力量:一条能发现“花生”和“杏仁”这两个词意思相近的捷径也许可以指出它俩都经常在“酱”这个词的前面出现在名词词组中。这也有认知心理学支持:有证据表明这是我们阅读时大脑处理意义的方式。
文学评论家可能觉得这些概念不太熟悉。可以说,分布语义学以其对词语间关系的强调把结构主义语言学理论编码了。派博将它和后结构主义理论相连,后者将意义置于“句子之外”。他引用了巴特在《作者之死》当中的看法,即文本“不是一串发布单一神学含义的词语”,而是一种“多维空间,其中多种作品混杂碰撞”(p. 16)。他还提到德勒兹的“块茎论”阅读和克里斯蒂娃的互文性。这一切意在提出:当我们建造适应于词频的模型时,就捕捉住了某些非常接近语言学意义的事物,不仅是计算语言学家所理解的那样,而且也还是后结构主义理论家理解的那样。
矢量空间模型尤其适合这个任务。为了解释其工作原理,派博提出了歌德的三个句子。
1. My dear friend, what a thing is the heart of man!(亲爱的朋友,人心是何等的事物!)
2. I treat my poor heart like a sick child.(我待我可怜的心灵如对待病童。)
3. I have possessed that heart, that noble soul.(我拥有了这颗心,这高贵的灵魂。)(p. 14)
派博解释说,矢量空间模型将每句话转换为词频。在此基础上,它能测量其语义学关系。此处,它发现前面两句话彼此更为类似,超过它们和第三句话的相似度,因为这两句话都有“心灵”(heart)和“一个”(a)。细读的读者可能提出异议(后面会更多谈到这一点)。但根据分布语义学理论,至少这个模型表现并比较了这些句子的意义。
派博求助于分布语义学,意在先发制人,阻止一种普遍的反对意见:词频对于阐释文本没有功能上的用处。近来,笪章难重新提起这条反对意见,她在《以计算的方法反对计算文学研究》中再次强调:派博的这种工作仅仅探讨了词频。“要决定哪些词语或标点要计数、如何表现这些计数。就这些。”(33)Nan Z. Da,“The Computational Case Against Computational Literary Studies”, Critical Inquiry 45, no. 3(2019): 606.这种计数“不是阐释”,也并未捕捉到文学特质,例如“同音异义、比喻、多义性,(和)反讽”。(34)Nan Z. Da,“The Computational Case Against Computational Literary Studies”, Critical Inquiry 45, no. 3(2019):606,636.派博则多亏了他在分布语义学中的投入,以相反的效果重复了笪章难的表达。他说,词语重复讲述了文学的“深层故事”,它们是文化表达的“沟槽和渠道”(p. 3)。
派博的反驳很有力。分布语义学的存在就表明词语计数不能根据表面而被视为无意义。但他也得加以更多说明才能说服持怀疑态度的人站到他这边。就算抛开有关分布假说是否确实成立,或是否和后结构主义观念一致的疑虑,还有其他问题浮现。除了矢量空间模型,其他模型能捕捉到分布假说理解的那种意义吗?即使捕捉到了,这是否说明它们也能捕捉《计算》分析的更为具体的文学性,如体裁、人物或情节?派博诉诸分布假说,开始回答笪章难这样的反对意见,但没有解决争论。
三、超凡魅力
派博对建造模型的第二个辩护带有民主的腔调:模型不仅有助于我们更严谨地争论,还能更透明。派博说,典型的细读读者从高处提出“盛气凌人的声明”,依赖纯粹的“超凡魅力”去说服别人;相反,建造模型的人则受制于更为严格的方法,她能“界定(其)智识过程的每一步”;计算或许“也经常模糊费解”,但完善而公开地操作,就能打败“评论的超凡魅力的黑盒子”(pp. 10-11)。
论证在多种层次上展开。在智识层面,它暗示了模型更为精确,因为它鼓励自我意识——模型建造者面对外部机制必须抑制本能。在政治层面,它提出模型也许可以拆解学院等级制度。确实,派博更宽泛地接受了这个目标。在他的后记中,他用模型揭示了体制特权的运转。他表明,从1970年开始,在最显赫的文学评论期刊上发表的所有文章中,86%都来自颁发博士学位的学院中的前20%。
但是如果派博在表明模型能够揭示学院等级制时很轻松,那他在提出模型本身并不依赖有超凡魅力的权威时就不那么有说服力。他有关细读对超凡魅力的依赖性的提法则小题大做——毕竟细读的读者不得不求助于文本本身、抑制其本能并给出有说服力的论点;而他关于模型对超凡魅力的依赖则论述太少。在一个大多数文学评论家仍然不理解高级统计学的世界里,就算最为“开放”的计算分析也不得不被无条件地信任。他们诉诸高等技术,这仍可能构成其权威的基础。
文学评论家对卖弄技术并不陌生。新批评派产生了严格的“细读”方法,合法化了文学研究。从那以后我们将自己的“理论镜头”运用到文本样本上——詹明信式的解释学、解构主义的操作以及读者的“方法”。“远读”并不比之前的评论实践更加摆脱了光晕式技术性,很可能还更迷恋它。例如,派博在第四章分析角色时,很快就引入了“角色特征工具”,这是他和一位同事开发的,“尝试根据26种不同维度评估角色塑造的实践”,包括“行为形态”“目标—导向”和“行为、描述及能动位置的多变的组曲”(p. 131)。除了屈服于这壮观而莫测的工具运作,还能怎样。
无论如何,来自超凡魅力的论点都是次要的,它能否起到重要的论证作用将首先取决于派博更基本的声称是否成立:模型能产生好的文本阐释。如果不能——笪章难就提出模型在捕捉文学性上表现差劲——那么它们包含透明流程这一事实本身就不足以举荐这些模型。许多流程可以逐步设计——比如我能轻松解释我只阅读一个文学文本每第800个单词最后一个字母所采取的步骤,但这不意味着它们应该在解释学实践中被接受。
四、双聚焦
派博很幸运,他的论证经得起彻底检查——至少就它本身而言。确实,它的弹性往往来自其谦逊。模型也许是,也许不是所有文学批评归纳的最终解决办法。但也不必如此,派博更有保留的评论实践为其目标效用提供了有力证据。
首先,派博用模型工作,这不是单一方法,而是许多评论方法中的一种。他毫不含糊地提倡细读和远读彼此启发的实践方式,并在第一章里对此做了说明。此处,派博讨论了20世纪诗歌中的标点。他运用一种叫作grep的方法确定了一组1900年以后的诗歌,其中词均句号的数量特别高;有意思的是,他发现这些诗歌作者中非裔美国诗人的数量高得不成比例。有了这个发现,派博通过新的镜头细致查看了阿米里·巴卡拉和安吉拉·杰克逊的“多句号诗歌”:为何如此多的句号?这和诗歌的种族政治可能有何关系?他的细读令人信服:它们表明句号编码了斗争和潜力,就像刺伤一样作为一再重复的痛点起作用。派博的解读在评论上也是有成效的:就我所知,还没有专门对非洲裔美国诗歌中过量句号的诗学研究。
借用派博所说的“双聚焦”过程结合细读和远读的一个较大的好处在于,它让远读摆脱了要无所不包的压力。再想想歌德的句子:
1. My dear friend, what a thing is the heart of man!(亲爱的朋友,人心是何等的事物!)
2. I treat my poor heart like a sick child.(我待我可怜的心灵如对待病童。)
3. I have possessed that heart, that noble soul.(我拥有了这颗心,这高贵的灵魂。)(p. 14)
回忆一下,矢量空间模型判断出句子1和句子2在语义上更为接近,从而显示了它的力量。然而,这个例子起初可能显得会适得其反。为什么?因为如果你和我一样最初直觉认为其实句子2和句子3才最为接近——共享第一人称代词,在我看来,这才是最要紧的特征。但这不意味着模型错误或我在这件事上错了;相反,模型促使我去考虑另一种解释。毕竟这是真的——就像派博给他的结果做的注解中说的——由于句子1和2中“我的”和“一个”的重复存在,它们通常强调“所有”和“一般性”(p. 17)。如果我们以这种方式考虑模型,作为阐释的伙伴而非单一的仲裁者,就难以否认它们能对实践有所贡献。
甚至在派博只使用远读时,他的例子对论证的支持也和他更宽泛的理论申诉一样多——如果不是更多的话。想想他有关功能性的第四章问的那个基本问题:什么是小说?约翰·塞尔告诉我们,虚构语言和非虚构语言之间没有本质差异。但派博还是提出,难道没有哪怕一些常见特征能区分二者?为了找出这些常见特征,他采用预测性机器学习模型,类似于区分垃圾邮件的模型(参见笪章难的评论中的解释)。后来发现,这个模型能根据许多特征可靠地区分虚构和非虚构文本。派博对这些特征的运用落实了一个更普遍的文学史说法,即尽管我们往往认为现代主义引入了对角色和世界间不确定关系的更多重视——“测试”或“假设”的关系——这种强调实际上显而易见属于虚构作品。
当笪章难将她关于词语计数不能有意义地捕捉文学性的论断具体化时,想到的正是此类模型。的确,她提出这个论点时,有一段话提到了垃圾邮件过滤。她认为,我们使用垃圾邮件过滤器等工具时,“(知道)人类的阅读能够捕捉更多细微差异、例外、歧义和限定条件。”但正因为这些过滤器执行了实际任务,我们不在乎——“你就不会愿意自己手动来做了。”但是,当我们做文学批评时,我们执行的不止实际任务,因此我们应该在乎——我们应该更愿意“自己手动来做”。笪章难再次断言垃圾邮件过滤器的“实际”功能和文学批评的“隐喻”功能之间有分野,以此强调她的论断:“如果我们所用工具明面上的目标是功能性而非隐喻性的,那我们必须根据其实际功能来运用。”(35)Da, “Against Computational Literary Studies”,620.
但是,仅仅因为一个预测性模型为“实际”功能服务并不能说明它就无法产生“隐喻性”的看法。其实,应该说,预测性模型在实际上起作用,恰是因为它们注意到了与隐喻性或描述性相关的特征。例如,假如垃圾邮件能被部分识别,是因为它们可靠地运用例如“钱”这种词,那么可能“钱”就和“垃圾特质”有某种重要关联。如果根据虚构文学对感知和身体的讨论就能可靠识别它,那么也许这种“现象学”的关切——派博如此称呼它们——就和“虚构性”有某些重要关联。如笪章难所说,细读——如果能在这种规模上运用——会觉察其他细微之处,这也许是真的。但并不完全清楚它是否会探知到相同的细微之处。热切的细读读者读一年的小说,也未必能偶然发现关于身体的词汇如此频繁出现。而这正是派博的重点:计算机可以对我们正常的阐释实践提供信息而不会压倒它。
五、结论:或许可以两全其美
当然还是会有反对意见。有些人会说我们作为文学评论家的任务本不是归纳——因为,正如派博提到的,新历史主义倾向的评论家认为我们存在主要是为了处理特殊性。其他人会说无论我们是否应该归纳,用计算方法这么做不值得付出那些政治代价——对莎拉·布洛莱特这样的评论家来说,远读对于学术界的新自由主义化让步太多。派博的书可能对这两种人都无法影响。它并未小心翼翼为归纳辩护,而主要假设——虽然我认为是很公平的假设——我们确实至少某些时候想要归纳(我们真的情愿让本学科每一本做出一般性声称的主要作品都失效?)它也没有从抵抗新自由主义化的具体指控出发为模型辩护,而是从不同的政治原因为模型背书:作为一种可拆解学术等级制的工具。
《计算》最可能说服我这样有两种思路的批评家。我和许多人一样,就模型能对智识项目做贡献这个想法持开放态度;但我也和许多人一样,一想到英语系整个儿投入文本挖掘就不寒而栗。对那些和我有同感的人来说,派博也许在这些方面引起兴趣:它所假设的批评世界中,细读和远读、美学分析和数据分析、文化批评和文化分析学可以共存。如果《计算》是某种象征,那么远读就不会、也不应压垮我们这个变化中的学科。我们可以有电脑分析的小说;我们也可以读它。