APP下载

《资本论》中的“性情马克思”
——基于R语言syuzhet安装包的文本情感分析

2020-07-10王建红冉莹雪

海南开放大学学报 2020年2期
关键词:资本论资本主义马克思

王建红,冉莹雪

(华北电力大学 马克思主义学院,河北 保定 071003)

一、R语言syuzhet安装包及说明

(一)syuzhet安装包介绍及其适用性

R语言是一个优秀的数据分析和制图的软件环境,它的设计提供了广泛且多样的统计性与图形化技术,并且具有很高的可扩展性。它的优势之一在于其设计优良的高质量的作图效果与数学符号及公式的应用。其中,基于Syuzhet package安装包做出的图即为从文本中提取情感和情感衍生的情节弧,集数据统计分析与数据可视化于一体,它附带了四个情感字典,并将其科学整合以方便R语言用户的使用。不仅如此,它也提供了一种能够访问并使用由斯坦福自然语言处理团队开发的情感提取工具与绘弧标准化等多种方法。基于R语言syuzhet安装包的情感分析能够对广泛庞杂的文本大数据高效整合与分析,使得文本情感的获得更加科学与便捷。

具体而言,这种情感分析方法是将自然语言文本作为分析对象,将每个单词的情感值按其内部情感词典的标准模型进行分值评估,基于正向情感词汇的情感值大于0,负向情感词汇的情感值小于0的评判标准(绝对值越大表示情感倾向越显著),最后以“句”为情感分值计算单位,将其进行内部整合与算法结合计算得出该句的情感值。到目前为止,由于syuzhet安装包在英文文本的分析处理中较为成熟与全面,不必进行分词、停用词添加等繁琐处理,但鉴于其程序开发还未涉及到中文语言的分析与处理,所以这一工具在国内自然语言处理、图像处理等方面还未有广泛应用。也正是因此为中国学者对于国外自然语言的大数据分析与研究提供了可靠的研究思路与技术方法。

具体到《资本论》情感趋势与文本内容比较分析,由于其堪称科学巨著,包含3卷内容,全卷全文里英文单词多达九十五万余字,这无论对于初学者或是有待对其深入研究的学者来说通读全3卷都是较为庞大与复杂的工作。基于数理统计的syuzhet情感分析工具包,可以在较有效地降低主观因素倾向性干扰的前提下准确掌握文本语言整体的情感演变,根据结果,再通过定量和定性研究结合方式,便能得出更为客观的评判,使结论更具说服力。

(二)研究过程及说明

1.文本预处理

首先是获取研究对象的电子文本。鉴于上述说明且为使分析结果更为准确可靠,本文以英文文本为语言处理对象,其电子文本来源版本为(《资本论》全3卷,卡尔.马克思著,弗雷德里克·恩格斯编,塞缪尔·摩尔和爱德华·艾夫林译,出版于1887年的第1版英语译本,苏联 莫斯科:Progress出版社)。其次,本研究对获取的上述电子文本进行了格式转化,以适应R语言环境下的格式要求。之后,对格式转码后的文档进行关键处理,手动删除无用于或干扰到数据处理和情感分析准确性的脚注、章节目录、表格、计算公式等,以避免对其自动分句处理、情感计算、整合等过程造成影响。最终共去除十万余单词、数字(和字符),并以最终的28919句英文文本为分析对象。

2.分析过程说明

本研究具体的文本内容分析对象为《资本论》全3卷整体情感趋势曲线中高峰、低谷区间中所对应的原文,所以在出现具有显著特点的情感曲线波段上进行标注并通过横坐标上标注的句子数量进行对应范围的截取并定位原文。其具体操作过程操作如下:

(1)情感值曲线的生成

鉴于R语言syuzhet安装包下涉及到的情感分析功能众多,基于本研究文本的特点与研究目的,将主要以下列两点作为生成情感值曲线对应函数功能的选择依据。

其一,降低噪声由于文本对象句数众多,每句话的情感值体现在作图中会生成密集且变动剧烈的曲线且结果易受极值影响,所以在这里使用zoo::rollmean命令通过滚动平均值的计算对曲线进行降噪处理。

其二,平滑处理与拟合去噪之后的曲线还未能展现较为明显的整体情感趋势,为了可视化效果更佳,这里使用get_dct_transform函数来通过使用离散余弦变换(DCT)代替快速傅里叶变换,以更好地展现边缘值在情感向量中的平滑版本。其中还包括在low_pass_size命令中对曲线的平滑程度进行设置,当其值设置为10时,拟合效果最佳,为2处低谷与2处高峰;但由于拟合处理在一定程度上会使波动范围发生偏移,所以本研究以设置值为12时生成的曲线图为基础,重点分析最高峰与最低谷以及具有代表性的曲线段。

(2)定位原文

在情感值曲线生成后对高峰、低谷区间内的曲线进行标记,并通过截取显著转折点作为划分定位范围的依据。为使定位结果更加精准,通过定位到的范围内的首句与尾句,摘取其区间内的所有文本,并按照句子语序进行2次情感值曲线作图。作图后通过比对整体情感趋势变化中的该部分,对定位范围进行缩减或扩大调整。需要说明的是,本研究中定位范围的首句与尾句都已归属到其属原文的具体章节,并最终以章节序号为定位范围划分。

二、数据结果分析

(一)整体情感趋势分析

在对于全3卷对象文本进行处理后,首先得出基于原始情感值曲线的降噪曲线(见图1)。

图1 降噪曲线

从图1可直观看出,马克思在全3卷的表述中情感起伏较大,其中有高于分值为10的正向情感,以及低于分值为-5的负面情感,且分值集中在[-5,5]区间内的句子数量众多;拟合的曲线也具有较明显的波动起伏,整体以情感值0为基准点展开分布。由此可见,此著作的书写与表达凝结着作者丰富且饱满的情绪,而非只是平白叙述以追求所谓的客观性与科学性。

从文本内容角度看,在资本主义生产方式的内在矛盾突显、无产阶级与资产阶级激烈斗争的社会背景下,马克思代表着无产阶级的利益,以浓厚的阶级情感来书写《资本论》,他以唤起工人阶级和一切劳动人民起来革命为口号,用推翻资本主义制度、创建社会主义社会的目标为指引,毫无隐藏地表达出其愤怒的激情和磅礴的气势[1]。

为了使文本的整体情感趋势更为可读,得出基于原始情感值曲线的平滑与拟合处理后的曲线(见图2)。

图2 平滑与拟合处理曲线

经过平滑与拟合处理后的情感曲线可得出《资本论》的情感在整体上为上扬趋势,虽经历两处显著的低谷曲折,但曲线后半段总体情感发生趋势为正向,且完整曲线中明显划分为正负两向情感走势曲线。经过拟合后的情感值分布范围有所缩减,其处理依据基于R语言的内部算法,最终得出拟合后的情感值居于[-0.1,1]。

对应到文本内容后,可大致得出全3卷全文前1/3的文本情感较为负向,其之后虽成上升趋势并在文本中间部分到达顶峰,但在后1/3处也出现了情感值大于零且相对较为平缓的叙述。

(二)情感趋势变化的具体分析

由于拟合处理会在一定程度上使高峰、低谷对应的句子范围出现偏移,故在此使用拟合程度较低的情感趋势图作更为具体的探讨(见图3)。

图3 范围标记曲线

由图3可见,全文情感趋势曲线按照其波动情况共标记8处,H1-H4与L1-L4分别表示高峰(High)与低谷(Low)范围,高峰与低谷划定具有相对性,其中情感高峰4处、情感低谷4处,下面将按照行文顺序对标记处进行文本[2]对应说明。

全书开篇通过对商品、货币等概念的引入表达出马克思对于资本主义制度对推动社会新变化的肯定,其情感呈正向态势但随着叙述的递进由情感值0.5处开始逐渐递减。情感趋势曲线第1处低谷(L1)的情感值介于(-1,-0.5],原文对应主要集中在第4篇(相对剩余价值的生产)的第13章(机器和大工业)部分。在这部分论述中,马克思从对个别企业的微观研究入手,对资本主义社会暴露的问题与各种剥削现象进行严厉的批判,特别是提到现代工场手工业中对廉价劳动力和未成熟劳动力的剥削以及打压时,他采取原话引用、数据列举等表达方法,并结合丰富的采访调查资料、实际观察情况作为佐证和引例,揭露了资产阶级为了获得利润而利用残酷手段、机器工具压迫无产阶级的种种罪行。资本的生产过程实质是资本家剥削雇佣工人的剩余价值,资本的生产过程核心就是剩余价值的生产[3]。对这一核心问题的阐述,马克思在两篇章节的基础上总结了剩余价值理论,揭示出掩盖资本主义经济关系本质的假象同时,又结合丰富的个人情感与卓越文采,饱含对无产阶级所受遭遇的同情与怜悯,并站在他们的立场,用尖锐犀利的眼光、辛辣讽刺的语言对资本主义社会进行强烈的抨击与批判。

第1处高峰(H1)的情感值略高于L1,但其值范围始终在(-0.5,0)之间,且较为靠近情感值-0.5,这说明此部分的论述情感虽较上部分相比有所缓和,但论述的问题与现象仍体现出较显著的负面倾向。原文对应到第1卷第7篇(资本的积累过程)第22章(剩余价值转化为资本)至第23章(资本主义积累的一般规律)第4小节。马克思通过对这部分的理论阐述与相关事实论述,对“扩大规模的再生产的资本主义形式”开展深入挖掘。此部分引用的案例与访谈少于上一部分且对于规律、理论的客观表述增加,所表达的激烈负向情感随之略有减少,这也是情感值较之前有所上升的原因。

情感趋势曲线的第2处低谷(L2)也是整体曲线中情感值最低部分区间,其值到达最低点并在很大程度上接近情感值-1。原文对应到第1卷第7篇资本的积累过程部分,具体到第23章第5小节(资本主义积累一般规律的例证)至第24章(所谓原始积累)。在涉及到资本主义积累的一般规律的例证阐述与解释时,马克思大量引用医生、经济学家的调查研究来体现英国一些地区在资本主义社会资本的积累过程中对穷苦人民造成的灾难与打击,说明了资本在积累的同时,贫困、劳动折磨、受奴役、无知、粗野和道德堕落也在积累。

图4 情感最低区间范围词云图

图4展示了此部分的负向情感词汇词云图。可以大体看出“slavery(奴隶)”“poor(贫穷)”“death(死亡)”“misery(悲惨)”“oppressed(虐待)”等词为负向情感,其选自情感值为负值部分的文本,马克思用压抑低沉的词句生动描述了原始积累带给劳动者的痛苦与灾难。就所谓原始积累来说,马克思在这一部分对以暴力方式剥夺劳动者而实现资本原始积累的现象进行严厉批判,他认为,马克思认为资本主义的原始积累过程就是征服、奴役、掠夺、杀戮过程。其中在讲到资产阶级对于工人、妇女、童工的压榨与剥削行径时,更是直言不讳地用言辞激烈的语言对事实进行描述。不仅如此,他还曾概括地说:“暴力是每一个孕育着新社会的旧社会的助产婆。暴力本身就是一种经济力[4]。”此外,行文中形象化的表述更是引人入胜,通过运用不同写作手法使理论命题形象可观,例如,“资本来到世间,从头到脚,每个毛孔都滴着血和肮脏的东西[4]。”这大大加深了读者对他的叙述的理解,从而引起广泛的共鸣与支持,这也正是在当时社会背景下无产阶级将《资本论》视为圣经的原因之一。值得注意的是,马克思在阐述资本主义积累的历史趋势时,更是对第1卷关于剩余价值的相关论述达到了极致,不仅揭示了资本主义私有制必然灭亡的客观规律性,更突出了资本主义私有制为公有制所代替的历史必然性,也为未来新社会的构建奠定了理论基础。正如他在谈及此话题时内心激动地写道:“这个外壳就要炸毁了,资本主义私有制的丧钟就要响了。剥夺者就要被剥夺了[4]。”

第一卷以压抑又愤慨的批判语气为感情基调,随着行文的推进以及第一卷内容的结束,全书的情感开始出现较为明显的变化与转折。整体情感趋势曲线中的第2处高峰(H2)为全书中情感值最高部分区间且集中分布在(0.5,1),集中趋向于情感值1,原文对应第2卷第2篇第15章(周转时间对预付资本量的影响)至第3篇(社会总资本的再生产和流通)第19章(前人对这个问题的阐述)部分。从第2卷开始,对于资本的生产过程研究就转为对其流通过程的剖析,其中心是分析剩余价值的实现问题[5]。

图5 情感最高区间范围词云图

图5展示了此部分的高频词汇词云图。“capital(资本)”“money(货币)”“period(周期)”“value(价值)”“circulation(流通)”等词汇为核心主题。马克思通过对经济运行规律、经济范畴、流通过程等相关原理的发现与论述,大量使用科学规范的公式、数据来进行解释与说明,陈述性与说明性语言居多,词汇的情感表达偏正向。尽管第2卷与第3卷的出版还归功于恩格斯的整理,但其在整理叙述过程中未添加过多个人情感,而是尽可能完整准确地将马克思记录在手稿中的理论新发现展示出来。可见,对于资本运动中其复杂的本质和运动规律等经济原理的叙述偏重于客观性的解释与说明,这也为此部分内容的情感值达到顶峰的现象做出了合理解释。

第2卷的书写与整理以客观且规范的论述为主,它的结束又为第3卷的开启提供理论上的必要准备。第3处低谷(L3)出现情感值急剧下降并分布在(0,-0.5)之间,且较接近于情感值-0.5。具体原文对应到第3卷第1篇(剩余价值转化为利润和剩余价值率转化为利润率)的第5章(不变资本使用上的节约)至第2篇(利润转化为平均利润)。第3卷论述了资本主义生产的总过程,重点研究剩余价值在剥削阶级内部的分配问题[6]。特别是在论述不变资本使用上的节约部分时,马克思运用历史与逻辑相统一的叙述方法,列举了大量资本主义经济中的实际材料,如通过引用报告、采访等现实生产中的一手资料来对进一步印证所阐述的理论部分,即不变资本节约的形式所带来利润率的提高的根本原因就在于对大量剩余劳动的占有。在叙述中,马克思依旧运用锋利现实的文笔来抨击资本主义制度下资本家为获取更多利润而采取的种种手段、揭露了掩盖资本主义剥削的实质。

随着行文的推进,全书后三分之一的情感开始向正向转变。第3处高峰(H3)的情感值范围位于(0,0.5)之间,原文对应到第3卷第5篇(利润分为利息和企业主收入。生息资本)的第33章(信用制度下的流通手段)至第34章(通货原理和1844年英国的银行立法)部分。这一部分内容要考察信用制度下货币流通的问题,虽然在叙述中也大量穿插着引用的证词材料,但多为大商人、公司股东等资本家的话语,他们用语言为自己辩护,故情感值偏正向与积极,这也是较之前几处高峰值所对应文本特点的不同之处所在。但马克思却以此种直接引入资本家原话方式作为揭露他们利用信用制度谋取暴力行径的方式。之后,随着第5篇最后一部分的叙述,特别是第35章(贵金属和汇兑率)部分,情感值达到第4处低谷(L4),但仅略低于H3并依旧介于(0,0.5)之间。此处叙述情感较为平缓,用客观平实的语言分析了信用制度与国际间货币流通的关系,虽其间穿插银行家的证词解释但叙述偏向原理性说明。

整体情感趋势曲线的最后一处高峰(H4)仅略低于第2处高峰(H2),介于(0.5,1)之间。原文出自第6篇超额利润转化为地租中的第39章(级差地租的第一形式)至第45章(绝对地租)部分。这一部分主要围绕对地租范畴的原理性说明,加之借助大量表格、公式和数字列举来开展论述。在论述的语言中未过多体现对于土地所有者阶级的强烈批判,更多侧重于对这一经济现象的原理说明。而与之形成对比的是,此高峰处之后的情感曲线出现显著下降趋势,也正是在第47章(资本主义地租的产生)部分,马克思的批判情绪增加对土地所有者阶级的寄生性质进行了无情鞭笞,意在彻底揭露他们对社会生产力发展的破坏作用。

通过整体情感趋势曲线特殊区间的截取与对应原文的比对分析发现,马克思高昂激烈的批判、讽刺挖苦的轻蔑、雄辩理智的解释等充满感情色彩却又十分理性的叙述贯穿于《资本论》著作之中。可看出较有意义的现象是,文中4处低谷区间所对应的内容多涉及到对于一些实证材料的引用以及人物观点的原述,富有较多浓厚的负面情感色彩词汇与形象化叙述,这也使得整体上马克思在第一卷对资本主义社会中的丑恶现象进行描述与批判时的情感色彩较为压抑与低沉。而文中4处高峰区间所对应的内容多为经济问题的原理性阐述,结合表格、公式等数据说明,学术性的叙述语言客观且科学,情感表达趋于平缓,这也足以能够说明后两卷内容偏注重对经济原理命题的论述与解释。

三、结 语

全书3卷情绪整体趋势呈前低后高、前剧烈后平缓走向,第1卷中明显的情绪低谷与高峰区间的出现是马克思在沉着冷静地剖析了资本主义经济规律,了解了资本主义和资产阶级本质后的必然的情感反应,是他的全部情感和理智在与整个资本主义世界的斗争中迸发出的产物。二三卷的叙述语言则较为客观与严谨,情感表达较平稳与缓和,重点在于用严肃且明确的语言说明资本主义关系中复杂的经济原理与命题,从而达到其揭示现代社会经济运动规律、推翻资本主义制度、最终实现共产主义社会的创作目的。

马克思用通俗易懂的叙述方法,深入浅出地展现了社会科学研究的叙事魅力所在。站在实证科学研究立场,从经济事实出发的理论研究更彰显了马克思的科学品格。虽其间以丰富的情感表达为论述基调,但无可否认他阶级立场与人民情怀的科学性,其“真性情”的流露便是对资本主义社会最真实彻底的揭露与批判。

毋庸置疑的是,《资本论》的写作与论述中心突出,结构严密,不仅是科学的逻辑论述体系,更彰显其是马克思主义最厚重、最丰富的伟大经典巨著。除了上述所提到的行文风格与情感特色外,为配合特定的语境,马克思还在论述时多次提到文学巨匠的作品、巧妙运用古代作家的诗篇以及恰当引用多国古老神话,加之以锋利的文笔、形象地表达来彰显其愤怒的激情和磅礴的气势,既饱含感情因素,也有理智成因。马克思在严谨客观的科学表述之外,其扎根劳动大众、立足穷苦人民的真切之感,体现了他在引导世界劳动人民争取彻底解放的号召下蕴含的深沉又饱满的人民情怀。可见通过情感表达角度的特殊解读,体会情感流露的真切与严谨理论的相融,更足以深化对《资本论》这一伟大的科学著作的认识与理解。

猜你喜欢

资本论资本主义马克思
国际金融垄断资本主义是垄断资本主义的最新发展,是新型帝国主义
马克思像
我与《资本论》的故事
马克思对资本主义剥削的两重批判——基于《资本论》第一卷的思考
道德资本论的双重误读
辩证法与历史唯物主义的内在统一——以《资本论》第一卷为例
论马克思的存在论
在马克思故乡探讨环保立法
习近平:马克思是“千年第一思想家”
逆全球化:资本主义最新动向研究