研究生学术英语写作抄袭认知与识别的调查研究∗
2019-04-09章木林邓鹂鸣
章木林 邓鹂鸣
(武汉大学,武汉430072 )
提 要:本研究通过抄袭认知问卷调查与抄袭识别测试,考察我国非英语专业研究生对于学术英语写作抄袭的认知状况与识别能力。结果表明,受试对显性抄袭有较好的认知,但对隐性抄袭、不当文献参引的认知较为有限,其抄袭识别能力较弱。说明受试关于抄袭的陈述性知识与程序性知识之间存在差异。此外,学术写作经历可显著提升受试文献参引与文献引用的能力,但在改进其抄袭认知方面的作用较为有限。本文指出,应通过针对抄袭的系统化显性教学和产出性写作活动促进研究生抄袭规避知识与能力的发展。
1 引言
学术论文写作是一种基于文献的写作,文献引用或文本借用是构建学术语篇的重要修辞手段。写作者须通过复制、直接引用、释义、概括、翻译等策略对文献中的话语或观点进行准确的、有意义的重构(马蓉 秦晓晴 2014:50)。受文化差异、语言水平、学术规范意识、教师行为与态度等因素限制(Pecorari,Petri'c 2014:269),对英语非本族语的学术写作新手而言,如何有效使用英文文献颇具挑战,他们更可能因文献引用或文本借用行为不规范而导致抄袭现象出现(Weber⁃Wulff 2015:103)。国内相关研究发现支持上述观点。比如,蔡基刚(2017)分析国内不同高校40 名本科生撰写的国际会议论文,发现直接照搬文献和数据却不注明出处的抄袭现象较为普遍。中国英语学习者的抄袭行为及其对抄袭的认知与态度一直是国内外研究关注的焦点,但多在二语情境下展开,基于中国外语学习环境的研究较少(Flower⁃dew,Li 2007a;Hu,Lei 2012,2016;桂敏等2016),针对研究生的研究更少。有鉴于此,本研究针对我国非英语专业研究生对学术英语写作抄袭的认知情况与识别能力开展调查研究。
2 文献回顾
学术写作抄袭指写作中的不当文本借用行为,本质在于将他人的作品或思想当作自己的,不正确标注出处的文献使用行为。根据行为意图,抄袭分为有意抄袭和无意抄袭(Flowerdew,Li 2007b:164);根据表现形式,分为显性抄袭和隐性抄袭(Hu,Lei 2012:813),前者指未标注出处的原文复制,后者指未标注出处的释义或总结。有研究者认为,抄袭一词的负向道德指向可能对教学产生消极影响,主张摈弃抄袭概念,使用更关注文本关系、更道德中立的语言,如拼凑写作(Howard 1995:788)、不合规范互文(Pecorari,Shaw 2012:150)、互文越界(Chandrasoma et al.2004:171)。可见,抄袭是一个复杂且敏感的问题(Hyland 2001:380),应从不同视角进行探讨。在集体主义导向的亚洲文化环境中,“知识是共同财产,可以学习互用”,记忆、重复、模仿被视作有效的学习方式,这导致中国学习者对抄袭持相对包容的态度、抄袭识别能力较弱(蔡基刚2017:41)。也有研究者认为,尽管中国学习者的抄袭识别能力较弱,但他们对被识别出的抄袭行为同样持惩罚性态度;抄袭在外语学习者群体中较为常见,并非因为他们对抄袭的接受度更高,而是因为不熟悉英语学术社群对抄袭的界定标准和引用规范(Hu,Lei 2012:838;桂敏等 2016:61)。
更多的研究者从学术写作能力发展的视角看待抄袭。Howard 用“积极抄袭”一词描述学习者在写作过程中不太成功的拼凑式或释义写作行为(Howard 1995:796);Pecorari 认为,现在的拼凑式写作者将成长为成功的学术写作者(Pecorari 2003:338)。孙厌舒发现,我国英语专业研究生的文献使用能力经历由“严重依赖文献、难以适应文献”到“文献依赖减少”、由“大块拼接”到“小块借用”的变化(孙厌舒 2016:vi)。可见,抄袭或拼凑式写作是一种可能指向学习的文本借用行为,是初学者为弥补其语言能力不足而采用的应对策略(Hyland 2001:380)和学术生存技巧(Cur⁃rie 1998:2),可能因其与英美模式高等教育或英语学术社群接触的增加而逐步改变(Abasi et al.2006,Song⁃Turner 2008)。外语情境下,学术写作初学者必须通过学术适应(孙厌舒2016:vi)或学术社会化(Hu,Lei 2016:108)的过程,逐步了解英语学术社群有关抄袭的学术规范、提升抄袭规避意识和能力。
尽管中国学习者对抄袭问题的认知与态度一直是研究关注的焦点,研究情境也逐步从二语向外语学习环境延伸,相关研究在方法设计或对象方面仍存在不足。比如,桂敏等(2016)基于视频考察英语专业本科生的抄袭判别,其近似于真实写作场景的设计更能反映学生的抄袭判别能力,但该研究主要考察学生对显性抄袭行为的识别情况,未涉及基于释义的隐性抄袭行为。此外,现有研究主要关注无学术论文写作经历或发表需求的本科生(Hu,Lei 2012,2016;桂敏等 2016)或英语专业研究生(马蓉秦晓晴2014,孙厌舒2016)。相比之下,非英语专业研究生有一定的学术写作经历和学术发表的现实需求,以其为研究对象更有助于深入了解各种社会文化因素对学生抄袭认知与态度的影响,研究发现可为本科阶段的学术英语课程建设和教学改革提供借鉴。
有鉴于此,本研究调查非英语专业研究生关于学术英语论文写作抄袭的认知状况与识别能力。具体研究问题包括:(1)非英语专业研究生关于学术英语论文写作抄袭的认知情况如何;(2)他们能否有效识别显性抄袭和隐性抄袭;(3)他们关于抄袭的认知与识别能力是否受英语水平、学术写作经历和文献使用能力等因素的影响。
3 研究方法
3.1 研究对象
本研究受试为湖北省某高校的242 名理工科硕士研究生,其中,男生160 人、女生82 人;研一学生152 人、研二学生90 人。该校学位授予条例规定硕士研究生必须至少公开发表一篇北大核心及以上级别刊物的期刊论文才能获得硕士学位。本研究受试具有较强的学术发表需求。
3.2 研究工具
本研究参照 Wheeler(2009)、Hu 和 Lei(2012)的研究设计,采用两种研究工具。“抄袭检测工具”由针对同一主题的3 篇英语文章构成(分别署名为 S,Z,W;字数分别为 220、224、181),旨在通过学生对文章的评价考察其抄袭识别能力。3 篇文章间的关系如下:S 文章已公开发表于某英语期刊(发表时间在另两篇学生文章之前),Z 文章是对S 文章的原文复制(仅改变几处表述,如将dif⁃fer 改成is different),但未标注出处,代表显性抄袭;W 文章是对S 文章的释义复制,但未标注出处,代表隐性抄袭。“学术英语写作文献使用知识与能力问卷” 的主体部分主要从 Hu 和 Lei(2012)的问卷翻译而来,旨在了解学生的文献使用能力(题项 1-5,α =.831)、文献参引能力(题项 6- 10,α =.888)、显性抄袭认知 (题项11-14,α =.632)、隐性抄袭认知(题项 15-17,α =.786)、不规范文献参引认知(题项 17-19,α = .636),问卷整体信度为 α = .809。问卷的个人信息部分旨在了解受试的专业、年级、性别、学术论文写作经历、研究生入学考试英语成绩等。为帮助受试理解原文引用(quote)、释义/转述(paraphrase)、归纳/总结(summarize)、综合(syn⁃thesize)等文本借用行为,本研究保留 Hu 和 Lei(2012)问卷中19 个题项的英文表述。
3.3 数据收集与分析
本研究分两阶段进行,第一阶段为课堂不限时抄袭识别测试,共125 名研一受试参与该测试。流程如下:(1)向受试说明测试内容与要求;(2)发放Z 文章,受试按照0-10 分的标准评分并给出书面评价(一评);(3)发放S 文章,受试对比后重新对Z 文章评分并给出解释(二评),回收Z 文章;(4)发放 W 文章,受试评分并给出评价(三评);该阶段共收回有效答卷116 份①。第二阶段为基于问卷星平台的网络问卷调查,除第一阶段的125 名受试外,另有27 名研一受试和90 名研二受试参与调查,共收回有效问卷242 份。
通过SPSS24.0 对阶段一的评分、阶段二的问卷数据进行统计分析,以了解受试的抄袭认知现状、识别能力及其影响因素。针对书面评价,研究者主要通过反复阅读进行主题提取,进一步验证受试的抄袭识别情况。
4 研究结果
4.1 抄袭认知与文献使用能力的现状
使用独立样本t检验了解不同年级受试在英语成绩、学术写作经历②、文献使用能力以及抄袭认知方面的基本情况及差异。由表1可知,两个年级的英语成绩不存在显著差异(p=.265);研二受试的学术写作经历显著多于研一受试(p=.000),具有产出性英语学术写作经历的研二受试(共112 人次,140%)远多于研一受试(共22人次,14.4%)。然而,两个年级在显性抄袭、隐性抄袭、不规范文献参引认知上的差异均未达到显著性水平(p值分别为.071/.506/.879)。两个年级在显性抄袭行为认知上的均分分别为3.64、3.80,但在隐性抄袭以及不规范文献参引认知上的均分仅为3 分左右、SD 值更大,说明大部分受试认为未标注出处的原文复制属于抄袭,但关于对文献进行释义、总结、综合而未标注出处以及不规范的文献参引是否属于抄袭,受试的认知较为模糊且差异较大。研二受试的文献引用、文献参引能力显著高于研一受试(p值均为.000),说明研二受试对文献进行直接引用、释义、总结、综合的能力以及按正确格式进行文献参引的能力更高。
表1 受试在文献借用能力与抄袭认知上的差异
4.2 抄袭识别情况
运用单因素重复测量方差分析方法检验受试在抄袭检测中的3 次评分是否具有显著性差异。由正态分布和球形假设检验结果可知,本文所采用的样本数据符合重复测量方差分析的假设条件。表2显示:F(2,248) = 3.880,p= 0.022,效应量根据 Cohen(1988)的标准,3 次评分之间的差异虽达到显著水平,但差异并不明显,即样本数据的效应量较小。事后检验结果显示:一评均分高于二评均分,说明对比S 文章后,受试对Z 文章(显性抄袭)的评分有所降低、但未达到显著水平,即差异并不明显;三评均分高于一评、二评,与二评的差异达到显著性水平,说明受试更认可W 文章(隐性抄袭)。但由于上述均分差很小,分别只有 0.316、0.188、0.504,没有充足理由相信大部分受试成功识别出显性抄袭和隐性抄袭。
表2 抄袭识别情况的单因素重复测量方差分析结果
为确认受试的抄袭识别情况,本研究进一步分析受试的书面评价。针对Z 文章的二评书面评价结果显示,尽管许多受试能发现Z 文章与S文章的相似度较高并准确找到Z 在复制时刻意做出的改变,比如将 cuisine 改为 food,41 位(32.8%)受试在二评时反而提高对Z 文章的评分,主要理由是Z 文章与S 文章的“表达一致”,对比之后“Z 文章也不错”;66 位(52.8%)受试降低评分,主要理由是Z 文章“将词语替换后表述更为普通”;仅7 位受试将Z 文章界定为抄袭。该结果与问卷调查中研一受试在显性抄袭上的认知均分达3.6 分不太一致。
针对W 文章的书面评价结果显示,许多受试能发现W 文章在内容方面与S 文章的相似度以及在语言表达方面的区别。他们指出,W 文章
“用简单的词汇表达意思”“语言简明扼要”“句式结构简单”“出现我熟悉的内容”“更易理解”,因此对其评分高于对Z 文章的一评、二评;有趣的是,另有受试则认为:W 文章“缺少高级词汇”“句型简单”“句型变化单一”“太多第一人称、不够客观”“无亮点、口语化”“更像是我写的”,因此对W 文章的评分低于对Z 文章的评分;没有受试将W 文章定性为抄袭。7 位识别出显性抄袭的受试均大幅降低二评分数,说明受试对识别出的抄袭行为持惩罚态度,该结果与 Hu 和 Lei(2012,2016)、桂敏等(2016)的研究发现基本一致。在评价W 文章时,尽管6 位受试明确指出该文与S文章在观点上的相似性,但因W 的释义行为而未将其视为抄袭,甚至觉得该行为“应鼓励”。以上发现进一步支持问卷调查的结果,即受试认为对他人观点或语言进行释义,但不标注出处的行为不属于抄袭。
4.3 抄袭认知与文献使用能力的影响因素
4.31 抄袭认知的预测变量
本文分别以显性抄袭认知、隐性抄袭认知、不当文献参引认知为因变量,采用逐步进入法进行多元线性回归分析。由表3可知,所有模型F值检验中的p值均小于.05,即回归方程均有效。投入的6 个变量中,对“显性抄袭”具有显著预测力的变量为隐性抄袭(β=.386)、文献参引(β=.188),决定系数(R2)为.183,即这两个变量可解释“显性抄袭”18.3%的变异量,预测力大小分别为14.7%、3.5%。对“隐性抄袭”具有显著预测力的变量为显性抄袭(β=.355)、不当文献参引(β=.149),决定系数(R2)为.169,即这两个变量可解释“显性抄袭”16.9%的变异量,预测力大小分别为14.7%、2.1%。能显著预测“不当文献参引”的变量只有隐性抄袭,决定系数(R2)为.048,即隐性抄袭可解释显性抄袭4.8%的变异量。英语成绩、学术经历、文献引用未进入任何回归模型。结果表明,显性抄袭认知与隐性抄袭认知、隐性抄袭认知与不当文献参引认知相互预测;学生越了解文献参引规范,对显性抄袭的认知越深刻;学生的学术写作经历、英语成绩、文献引用能力对其抄袭认知不产生显著影响。
4.32 文献使用能力的预测变量
为进一步了解影响受试文献使用能力的因素,分别以文献引用能力、文献参引能力为因变量,采用逐步进入法进行多元线性回归分析。由表4可知,所有模型F检验中的p值均为.000,即回归方程均有效。投入的6 个预测变量中,对“文献引用”最具显著预测力的变量依次为文献参引(β=.495)、学术经历(β=.238)、英语成绩(β=.107),决定系数(R2)为.462,即这3 个变量共可解释“文献引用”46.2% 的变异量,预测力大小分别为40.5%、4.6%、1.1%。对“文献参引”最具预测力的变量依次为文献引用(β=.525)、学术经历(β=.225),决定系数(R2)为.443,即这两个变量可解释“文献参引”44.3%的变异量,预测力大小分别为40.5%、3.8%。显性抄袭、隐性抄袭和不当文献参引未进入任何回归模型。以上结果表明,研究生文献引用能力与文献参引能力相互预测,并随学术写作经历的增加而逐步提升;英语学习成绩越高,文献引用、转述、总结等能力越高;研究生关于抄袭的认知对其文献引用以及文献参引能力无显著影响。
表3 显性抄袭认知、隐性抄袭认知、不当文献参引认知的预测变量
表4 文献引用能力、文献参引能力的逐步多元回归分析结果
5 讨论
研究发现,研一和研二受试在显性抄袭、隐性抄袭、不当文献参引认知方面不存在显著性差异;多元回归分析结果显示,学术写作经历、文献引用能力未能有效预测抄袭认知。这说明受试的学术写作经历在改善其抄袭认知方面的作用非常有限。这与 Abasi 等(2006)、Song⁃Turner(2008)的研究结论不太一致。究其原因可能在于,他们的研究是在二语情境下展开,其受试与英美模式高等教育或英语学术话语社群的接触更为深入;本研究受试是外语环境下的英语论文写作新手,未接受过针对英语学术写作的系统教育,与英语学术话语社群的接触不够深入。该发现证实教育情境对学生抄袭认知的重要影响(Bikowski,Gui 2018:194)。值得注意的是,尽管研一和研二受试对显性抄袭的认知较好(均分分别为3.64、3.80),但对更复杂的隐性抄袭、不当文献参引的认知非常有限(均分仅在3 分左右),这与先前研究发现基本一致(Hu,Lei 2012;马蓉 2017),说明即使已完成毕业论文、有一定的学术写作经验,研究生对英语学术写作规范的认知仍然有限(徐昉2013:56)。
研二受试的文献引用、文献参引能力均显著高于研一受试(p=.000),且研二受试的文献参引能力均分为4.01;回归分析结果显示,学术写作经历是文献引用及文献参引能力的显著性预测变量。这说明学术接触,尤其是产出导向的学术写作经历,可显著提升研究生的文献参引和文献引用能力。有关文献参引的规范较为直观、机械,在学术发表目标的驱动下,学生只须阅读目标期刊的相关文献或投稿指南并加以模仿,便能基本掌握。为顺利发表论文,研究生须开展广泛的文献阅读,在导师、期刊编辑与评审专家的指导与建议下对论文进行反复修改与润色,此即“学术适应”或“学术社会化”的过程。该过程促使研究生在直接引用、释义、归纳和综合等方面学习并模仿英语学术话语社群的做法,其文献引用能力逐步提升,从严重依赖文献、“大块拼接”走向“小块借用”(孙厌舒 2016:vi)。
回归分析结果显示,英语成绩是文献引用能力的显著预测变量之一,证明学生文献引用能力与其语言能力发展密切相关(Currie 1998:10)。由于研究生入学英语考试主要考察学生的读写能力,该成绩很大程度上代表学生的文献阅读能力,而阅读能力是影响学生文献引用能力的重要因素之一(马蓉2017:122-123)。分析各题项得分可知,尽管研二学生在直接引用能力上的均分为3.82,在释义、归纳、综合能力上的得分并不高,分别为3.56、3.52、3.36,说明他们对如何重构文献中的话语或观点“有所知、但不够熟练”(徐昉2013:58)。该结果说明,学术写作经历有助于学生较快习得直接引用、文献参引等机械式文本借用能力,但深入了解英语学术社群的知识构建方式,通过文本借用行为与被引作者及读者发生对话,进而强化自己的声音、建构作者身份,是一个长期积累的过程。为此,各高校应针对文献引用规范与技巧开展显性的系统性教学,在产出性学术论文写作实践中,通过循序渐进的学习和模仿、不断地使用和反思逐步提升(同上:59)。
尽管研一受试在显性抄袭认知上的均分达到3.64,仅7 人成功识别显性抄袭,无人识别出隐性抄袭,该比例远低于同类型研究(Wheeler 2009:24;Hu,Lei 2012:829)。自我汇报式问卷调查反映受试对于“什么是抄袭”的认知,可理解为抄袭的陈述性知识,抄袭识别反映受试“如何识别以及避免抄袭”的技能,可理解为抄袭的程序性知识。可见,受试关于抄袭的陈述性知识与程序性知识存在很大差异。结果证实,尽管部分学生已具备有关抄袭的陈述性知识,但缺少如何识别以及避免抄袭的程序性知识(Pecorari 2003:320)。
陈述性知识是程序性知识学习的基础,陈述性知识作用于程序性知识的关键环节是有意识的输出。为促进陈述性知识内化为程序性知识,不仅应通过学术道德教育或抄袭检测的惩戒作用培养学生的抄袭意识,更应在支持性学习环境下提供更多的学术写作产出机会,开展结构化学术读写活动和有关抄袭的系统化显性教学。教师应通过直接引用、释义、归纳与综合等方面的策略教学和融入式练习提升学生的抄袭规避能力,通过有意识地使用陈述性知识来调整和发展学生的程序性知识体系,逐步降低学生对文本的依赖,助其从拼凑式写作者向更为成熟的写作者发展。
6 结束语
本研究考察我国非英语专业研究生的抄袭认知状况与识别能力及其影响因素。结果表明,研究生对于显性抄袭有较好的认知,但对较为复杂的隐性抄袭、不当文献参引的认知较为有限;研究生的抄袭识别能力较弱,关于抄袭的陈述性知识与程序性知识存在很大差异。此外,学术写作经历对硕士研究生的文献参引、文献引用能力有显著影响,但对抄袭认知的作用有限。
本研究对学术英语写作教学有一定启示,但仍存在以下不足。本研究主要借鉴 Wheeler(2009)、Hu 和 Lei(2012)的抄袭识别工具,以未标注出处的段落原文复制、段落释义分别代表显性、隐性抄袭,未涉及未标注出处的直接翻译、文献归纳等更隐蔽复杂的抄袭行为;此外,本研究抄袭识别工具中文章话题的学术性较弱,可能影响受试的抄袭判断。后续研究应设计更全面、更具学术性的抄袭识别工具,在更真实的学术读写任务中考察研究生的抄袭识别能力。鉴于显性教学以及抄袭回避策略培训的重要性,后续研究可开展有关抄袭的教学行动研究或纵向个案研究,从而了解中国英语学习者抄袭认知与识别能力的发展路径。
注释
①为尽可能保证测试结果准确反映受试的抄袭识别能力,本研究先进行抄袭识别测试,再进行问卷调查,测试前以及测试现场,研究者均未向受试提及与抄袭有关的任何概念;测试过程中,研究者多次向受试保证,评分或评价均无对错之分,不会对其课程成绩带来任何影响。此外,尽管研究者反复强调第二次评分是重新评价Z 文章,仍有受试针对S 文章进行二评,这些受试的抄袭检测数据未纳入本文数据分析。
②关于学术经历的题项为多项选择题,按选择人数由高到低排列(研一+研二),分别为用中文写过课程论文(83 +59)、经常阅读英文文献(83 +53)、正在写以发表为目的的中文论文(31 +40)、用英文写过课程论文(4 +55)、正在写以发表为目的的英文论文(18 +40)、已发表中文论文(10 + 18)、已发表英文论文(0 +17)。本研究对这7 个选项分别赋值1-7 分,受试在单个选项上的最高得分代表其学术经历,如果某受试已发表英文论文,则其学术经历得分为7 分。