APP下载

从手段到思维:数据史料运用再探

2020-07-04潘承生

中学历史教学 2020年6期
关键词:史料数字文本

潘承生

随着大数据时代的到来,数据史料正成为一种新样态史料,数据论证法亦方兴未艾。可喜的是,中学历史教学中,数据史料的运用渐成燎原之势。然而,将数据史料等同于数字史料的现象也屡见不鲜。数据史料运用时诸如数字的准确性等一些难以解决的问题也让一线教师相当困惑。

不仅仅将数据史料看作史料教学的一种手段,更要以全新的思维来审视数据史料,换言之,不仅仅是区分史料类型,而是运用与数据史料相匹配的文献学方法论——“文本解读法”,以及弄清楚数据史料所适切的教学内容。或许,有关数据史料运用时一些棘手问题,可能就会柳暗花明,刃迎缕解了。

一、从手段到思维:数据史料就是数字史料?

数据史料是史料一种类型。但史料分类时,更要注意史料遗存的形态以及教学时需提取的信息载体。

数据史料,不仅包含数字史料,更包括文献史料或实物史料的数据化形态。中学历史教材所涉及的模糊数据化的表述(如中华文明起源的特征,八方雄起,满天星斗)、历史人物或时间编年(如教科书上的大事年表)、各种人物关系的列表(如封邦建国示意图),以及教学时所使用的长安城、伦敦与罗马城规模比较的3D模型图等,其实也就是文献史料或实物史料的数据化。

数据史料与计量史学有相当的渊源。计量史学,“有时又称为数量史学、定量史学、历史计量学,虽然翻译名称不一,但其基本含义是一致的,即它是运用现代数学的手段和统计学的方法,以及现代计算机技术,对历史上的数量和数量关系(无论是显性的还是隐性的),以及由这些数量关系所构成的特定的数据结构进行定量的研究和分析,进而使定性研究和定量研究相结合,使历史研究进一步精确化和科学化的学科。其最重要的特征是对所研究的对象进行数量分析,当然也包括数理模型分析”[1]。 由此可见,计量史学研究的对象是历史上的数量及数量关系所构成的特定数据结构。其方法是定性与定量研究相结合。因计算机的出现,将文献史料中的价格、籍贯、出身、数量、产量等信息以表格的方式加以量化分析,甚至文献史料中的一些描述性信息的量化考察、分析都有了可能。因而数据史料与计量史学密不可分。

需要注意的是数据化史料与数字化史料,其含义并不相同。数字化史料,意指“将文献从物理形态转化为电子形态”;数据化史料是“将电子形态进一步转换为可识别的文本与可分析的数据”的史料[2],比如文献史料中所包含的人物籍贯、出身、官名、社会关系、亲属关系等;经济方面的税收、土地产量、数量、价格等信息,可制成表格,进行量化分析、理解或掌握文献史料中的信息所反映出来的问题或趋势,以增进历史理解或历史解释。

二、从手段到思维:数据史料运用

黄庭坚到桂林,看到桂林山水如画,作诗云:“桂岭环城如雁荡,平地苍玉忽嶒峨。李成不在郭熙死,奈此千峰百嶂何!”。慨叹李成和郭熙不在,愧无高超的画技,无法描摩尽桂林山水之美。面对海量的史料,不要说中学历史教师,就是历史学家,恐怕亦有此叹。张邦炜教授就曾谈到运用数字史料因数字无法精确计算而失去证据效力的案例。[3]中学历史课堂中数字史料的使用往往使学生陷入到数字正误辨析的泥潭而无法自拔。这些问题的出现,多因固守传统史学依赖精确或清晰数据的研究方式的思维,过于纠结数字的精确性。实际上,文献史料、实物史料、口述史料或图像史料,其信息也是有真伪的。

要解决这个困境,从手段到思维的转变,或有所裨益于数据史料的运用。具体而言,一是要运用“文本解读法”;二是要探究数据史料中的结构关系或趋势,从专门的探究因果关系转向相关联系的各种关系的深层分析。如谷歌公司开发出在文本中统计词频的算法,输入“黑鬼、黑人、非裔美国人”、“科学、哲学与宗教”等词组,计算机绘出这些词组出现的时间、频次等相关信息的对比图,对这些数据进行分析,就能对黑人在不同时期美国社会受的不同对待或科学、哲学与宗教在人类历史不同时期的地位开展多样性的研究。[4]

1.数据史料之“文本解读法”

数据史料作为史料的一种类型,常规的解读史料的方法当然同样适用于数据史料。比如,互参法,将数据史料与其他文献史料对比解读;追本溯源法,多参考原始资料,追寻文字版本史料的承传流变等。但对于数据史料而言,仅用上述方法来解读,或有捉襟见肘之虞。其原因在于:大数据时代,数据不完全是狭义上的数值,更是由运用大数据的方法对描述性史料中的数量关系进行统计或列表量化而来。不要说中学历史教师,即便是历史学家,若将文献逐条核对,恐有九牛二虎之力也难成其事。

在中学历史教学中引入数据史料时,为免“烟涛微茫信难求”的失向感,可采用“文本解读法”。何谓“文本解读法”?即“不对数字进行分析、批判再加以估算,而是将数字史料当作文本,回归历史场景,直接依据原始数据去理解当时的行为者的决策”[5]。如平型关战役中的死伤人数问题。许多数字或战报纯靠估计,其失实不可避免。其原因与战场形势的千变万化,作战双方迅速撤离阵地或改变行动计划,而失去统计战果和敌我伤亡情况的条件。从我方来说,之所以出现战果数字较大的情况,与当时抗战的形势,以及需要鼓士气、扬军威有关。[6]有教师认为平型关战役中的歼敌人数有一千到一万不等,但大多数学者认可一千人左右,而且认为教学中使用夸张的数据会降低学生对抗战艰巨性的认知。[7] 这个结论可能有些偏颇了。得出这个结论,最主要的是未能明了文本化解读数据的方法。未能将数据置于当时的场景去理解行为者的决策。夸大歼敌数据,正是为了鼓舞士气,扬军威,恰恰印证了抗战的艰巨性。事实上,数据的精确性是相对的,即便是失真的数据或非精确性数据,与所证明的对象属性,或论证结论的需要而言,亦有相当的证据效力。

2.数据史料的运用举例

如同中药配伍,数据史料同哪些课程内容最为匹配,才能最大程度挖掘出数据史料的价值呢?

“现代史学(尤其是经济史、工业史、农业史、人口史、地方史、社区史、教育史、社会史等等),更要求以历史过程中所表现的种种数量关系,去解释历史的趋势,判断历史的性质与价值。”[8]在中学历史课堂教学中,涉及到上述领域的史事教學,因数字或数量关系较能清楚、直观地揭示历史现象,定量与定性分析相结合,可严密史论逻辑,故能有效提升结论的信度。试举两例说明之。

比如新文化运动的教学,一代名刊《新青年》,荟萃群英,影响一代青年,开创一个时代。其中《新青年》荟萃群英,如何影响一代青年?在具体教学设计时,教学设计者常见的思路是列出《新青年》由少到多的发行数量,并呈现一些人名或一些回忆录史料等予以实证。这样的设计也无不可,但细究之下,其实发行量与其影响力之间并无必然的联系。易言之,《新青年》发行量大并不意味着其影响力大。若将这些人地域、籍贯、回忆录等资料进行数据化分析,则可事半功倍,《新青年》影响力不言自明。

上表的统计数据表明:《青年杂志》、《新青年》创办之初,编者仅有陈一人,而且供稿者也只是陈独秀安徽老乡,可见其创刊之初充其量只是地区性的。且其创始之初,不温不火,影响力有限。自迁至北京后,情形大变,从编者和供稿者来分析,《新青年》群贤咸集,已成舆论阵地。而受众(部分)的统计显示,无论是地域还是受众群体,《新青年》的确受众广,影响大。不言而喻,此则数据史料的运用补强了《新青年》以发行量实证其影响的逻辑链。

再如《康乾盛世》教学为例,有教师在有关清康乾盛世之农业繁荣教学时,采用了自战国以来几个重要朝代的土地面积、人均产量等相关宏观数据进行实证对比分析。即将清康乾盛世时期的耕地面积、人均粮食产量与战国以来历代耕地面积、粮食产量等数据进行纵向对比,实证康乾盛世经济繁荣到底在何种意义上才算“繁荣”。

——整理自吴慧《中国历代粮食亩产研究》

若以“辨数字真伪”的方式进行此项内容教学的话,几乎是不可能的。因为历代的宏观数据因统计方式方法的不同,数据也会有差异,而且数据统计的精确性也存疑。如果采用“文本解读法”,史论上就不会出现方枘圆凿的问题了。文本解读主要探究耕地面积、粮食亩产量、人均耕地面积、人均粮食产量等数据之间的结构关系,从结构关系看其发展的趋势,而非深究繁琐的数值量。通过历代农业发展的比对、升降趋势,让学生对康乾时代的农业发展有一个总体宏观的感受:即耕地面积与粮食总产量大幅提升。但与此同时,人均粮食的下降,人口问题正成为清政府沉甸甸的负担,盛世中有隐忧。

总之,从上述两个例子来看,社会史和经济史的内容,以“文本解读法”对数据史料进行结构或数量关系的逻辑或实证分析,既有助于严密史论逻辑,也避免了结论的空洞性、模糊性。

三、余论

运用数据史料仍需要关注的是:数据史料,更多的是处理后的数据或数量关系,因而数据史料的可靠性、客观性会受到数据处理方式方法的影响。即便运用文本解读法,选择数据史料进行教学时,需要考虑这些数据处理方式和方法。另外,因数据所反映的数量关系与政治、经济、社会等各个方面的变动紧密相关,故教学时引入数据史料,需要与其他史料相互印证,以补强证据的效力。

【注释】

[1]霍俊江:《计量史学研究入门》,北京:北京大学出版社,2013年,第2页。

[2]赵思渊:《地方历史文献的数字化、数据化与文本挖掘:以<中国地方历史文献数据库>为例》,《清史研究》2016年第4期。

[3]张邦炜:《历史学如何算起来——从北宋耕地面积、粮食亩产量等数字说起》,《唐宋历史评论(第三辑)》,北京:社会科学文献出版社,2017年,第249—257、387页 。

[4]吴玲:《大数据时代历史学研究若干趋势》,《北方论丛》2015年第5期,第69页。

[5]黄国信:《清代盐政的市场化倾向——兼论数据史料的文本解读》,《中国经济史研究》2017年第4期。

[6]杨奎松:《开卷有疑——中国现代史读书札记》,南昌:江西人民出版社,2007年,第59页。

[7]姜佳曦:《避陷阱寻方法——例谈数据史料的使用》,《中学历史教学》2019年第6期。

[8]姜義华:《史学导论》,西安:陕西人民教育出版社,1989年,第169页。

猜你喜欢

史料数字文本
文本联读学概括 细致观察促写作
走马史料赠故里 川渝民间文艺添新篇
挖掘文本资源 有效落实语言实践
搭文本之桥 铺生活之路 引习作之流
文本与电影的照应阅读——以《〈草房子〉文本与影片的对比阅读》教学为例
答数字
数字看G20
史料教学讨论征文
史料教学讨论征文
成双成对