ChatGPT 类阅读平台对研究生学术阅读能力的影响

2023-11-28马洋珍杨现民李康康

开放教育研究 2023年6期

王卓马洋珍杨现民,2 李康康,2

（1.江苏师范大学智慧教育学院，江苏徐州 221116；2.江苏师范大学江苏省教育信息化工程技术研究中心，江苏徐州 221116）

一、引言

学术阅读是为学术研究和写作展开的文献阅读工作（孙锦明等，2021）。学术阅读能力作为研究生科研训练必备技能之一（李润洲，2022），是衡量研究生科研能力的基础指标（Keskin，2014）。然而，研究生学术阅读常面临疑难问题难以得到及时解答的窘境。近年来，以ChatGPT 为代表的生成式人工智能技术对学术生态（骆飞等，2023）、科研范式、教育应用（夏琪等，2023）和教学变革（朱雨萌等，2023）产生了重大影响。例如，以ChatGPT 为技术底座的学术阅读平台，以自然语言交互的方式为学习者提供即时解答的阅读体验和有益可靠的回答（王佑镁等，2023），成为研究生学术阅读的重要工具。那么，该类阅读平台对研究生学术阅读能力的影响如何？为回答该问题，本研究从学术阅读能力的获取信息、理解理论、探寻观点和发表观点等维度展开准实验研究，探讨该类平台对研究生学术阅读的影响。

二、文献综述

（一）研究生学术阅读之难

学术阅读能力是研究生科研能力发展的基石，但研究生在学术阅读中常感疲惫和无助。究其原因，主要是功利性阅读目的导致习得性无助（陈斯琪，2021）和缺乏即时指导丧失阅读耐心所致。具体而言，研究生学术阅读面临的困难主要表现在以下五方面：

1）专业知识匮乏。学术文章包含大量概念性与理论性内容（Eriksson，2023），部分研究生基础知识掌握不够扎实，难以领会文章的核心观点（古明珠，2019）。2）即时指导不足。研究生学术阅读常会遇到问题，但碍于情面或其他原因而不愿请教他人，且导师亦无法全天候地给予即时回复或指导（李苒，2021）。3）海量信息焦虑。海量数字化学术文献层出不穷，质量良莠不齐（王晓光等，2021），面对爆炸性增长的学术文献，研究生极易陷入信息过载的困境，造成信息焦虑的心理惆怅感。4）阅读技巧缺乏。学术阅读需采取问题导向式阅读、精读与泛读结合、交流讨论等方式提升阅读体验感（王春玺等，2011）。刚入门的研究生常无法全面掌握并灵活运用这些方法，导致学术阅读挫败感强烈，未形成正向的学术激励。5）独立思考能力不足。很多研究生陷入唯知识论、文献至上或形式主义的误区，学术阅读独立思考能力不足，思考问题不够深入，导致学术阅读效果不佳（林敏儿，2021）。

（二）学术阅读能力调研

学术阅读能力指阅读者阅读学术文献需具备的能力，包括获取信息、理解理论、探寻观点和发表观点的能力（Jordan，1997）。1）获取信息能力指研究者关注学术文献基本信息和关键信息的能力。其中，基本信息包括学术文献的作者、书名、出版社、出版时间等。关键信息包括关键词、研究对象、研究内容、研究方法和研究结论等核心内容。2）理解理论能力指研究者剖析和辨析学术文献理论观点的能力。3）探寻观点能力指研究者能够从学术文献中准确定位、概括和分析观点的能力。4）发表观点能力指研究者根据学术文献的内容表达自己观点和看法的能力。学术阅读能力对学生的专业发展至关重要。然而，实际情况是，学生对该技能的掌握程度令人堪忧。例如，美国成人读写能力评估（National Assessment of Adult Literacy，NAAL）、学术能力测试（Scholastic Aptitude Test，SAT）、美国大学入学考试（American College Testing Programs，ACT）等学术阅读能力测试的结果表明，只有一半的学生达到合格标准（Chang et al.，2023）。相关调查显示，研究生缺乏批判性阅读技能（Anuar & Sidhu，2017）。杨雪姣（2021）发现，研究生整体学术阅读能力呈低水平，且研究生之间的能力差异显著。彭倩（2017）发现，阅读动机、阅读资源获取便捷度、文献语言、科研工具熟悉度和科研培训等均会对研究生的学术阅读产生影响。朱向阳（2019）发现，学生学术阅读存在信息获取不全、信息筛选不当、信息理解不深入等问题，且阅读理解水平存在不同程度的差异。林敏儿（2021）从行为、认知、情感三个维度综合调研研究生的学术阅读状况发现，研究生学术阅读存在功利性强、时间投入不足和内容不成体系等问题。

近年来，基于ChatGPT 技术的阅读平台如雨后春笋般涌现，如出现SCISPACE、ChatPDF、ChatDOC等在线阅读平台。这类阅读平台可通过即时文字交流的方式为阅读者提供文献概括、观点定位和知识解答等服务，能满足研究生个性化学习的需求，解决信息焦虑的困扰，有效弥补专业知识和即时指导等不足。然而，少有研究关注此类学术平台对研究生阅读能力的影响。

三、研究设计

（一）研究对象

为排除专业的干扰，本研究选取江苏省某高校40 名硕士二年级学生为研究对象。其中，教育技术学（学硕）研究生28 人，现代教育技术（专硕）研究生12 人。所有研究对象均受过研究方法课程的教育，接受过英文论文阅读训练。本研究将这些研究生随机分成人数相同的实验组和对照组。实验组采用ChatGPT 类阅读平台为阅读工具，对照组采用非ChatGPT 类阅读平台为阅读工具。为保证公平，实验组研究生为20 人，其中教育技术学研究生14 人，现代教育技术研究生6 人；对照组研究生为20 人，其中教育技术学研究生14 人，现代教育技术研究生6 人。

（二）研究问题

本研究拟解决的核心问题为ChatGPT 类阅读平台能否提升研究生的学术阅读能力？为回答上述问题，本研究从阅读能力上述四个维度出发，提出四个子问题：1）ChatGPT 类阅读平台能否提升研究生获取信息的能力；2）ChatGPT 类阅读平台能否提升研究生理解理论的能力；3）ChatGPT 类阅读平台能否提升研究生探寻观点的能力；4）ChatGPT 类阅读平台能否提升研究生发表观点的能力。

（三）阅读材料

学术期刊论文因专业性强和高质量成为研究生获取学术前沿知识的主要渠道，同时为保证内容的前沿性，本研究选择近5 个月发表的学术论文作为阅读材料。此外，为降低不同期刊论文对实验产生的可能影响，经筛选，本研究确定《计算机与教育》（Computers & Education）的四篇论文为实验的阅读材料。其中，第1 篇主要探索情感教学代理和自我解释策略融入计算机辅助学习的有效性（Wang et al.，2023）；第2 篇主要探讨虚拟实验室对学生内在和外在学习动机的影响（Diwakar et al.，2023）；第3 篇主要探究虚拟现实环境下具身感知和视觉提示对乐器学习的影响（Yu et al.，2023）；第4 篇主要探寻动机信念对在线学习学生学业拖延和学业表现关系的调节作用（Cheng et al.，2023）。

（四）阅读工具

调研发现，目前市面上有三款较为成熟的ChatGPT 类阅读平台： SCISPACE（https://typeset.io/）、ChatPDF（https://www.chatpdf.com/）和ChatDOC（https://chatdoc.com/）。三款工具均以ChatGPT 大语言模型为核心技术，皆提供即时交互功能，其功能对比见表1。

表1 ChatGPT 类阅读平台功能对比

SCISPACE 可根据用户提供的阅读材料生成摘要，方便用户快速获取文章的核心信息。1）特定内容解释功能。用户选中需要解释的文本、数学公式和表格，便可在聊天区获得对应的解释，但相较ChatDOC 特定内容可直接提问的方式，SCISPACE使用不够便利。2）公式解析功能。用户通过截图选择文档的公式，聊天区随即提供结合文档内容的公式解释。3）预设问题功能。文档被上传的同时，平台会生成与之相关的问题，辅助用户快速了解内容。4）持续追问功能。用户可对疑惑的内容采用持续追问的方式获得解析。5）高亮笔记功能。用户对有价值或疑问的内容设置高亮显示并记录所思所想。

ChatPDF 除提供内容概括和解释功能、预设问题功能外，还提供答案定位功能。该功能可在生成答案的同时定位参考内容的段落来源。但相比于ChatDOC，ChatPDF 的定位功能较弱。

ChatDOC 是一款功能较全的在线阅读平台。1）提供跨文献交流服务。ChatDOC 支持建立文件夹作为总数据库，用户可通过对话轻松提问文件夹内不同文献的综合性问题。2）特定内容提问功能。用户选择特定文本内容，提出针对性问题，以获得更准确的答案。3）答案定位功能。相比其他阅读平台，ChatDOC 标记生成内容的段落来源更准确。用户还可要求ChatDOC 根据主题罗列文献中相关参考信息。

综合对比发现，ChatDOC 的功能更全面，生成内容、答案或定位也较精准，有利于研究生获取准确的信息。ChatDOC 官方提供的技术测评结果显示，ChatDOC 在事实性检验、准确性、一致性和综合性方面都功能突出。此外，在国内使用ChatDOC时，网络环境较稳定，即时交流服务可持续性强。因此，本实验选择ChatDOC 作为阅读工具，对照组采用非ChatGPT 类阅读平台，无法提供即时交流互动功能。

（五）实验量表

本研究使用实验量表评估实验前后研究生学术能力变化。实验量表包括研究生学术阅读能力量表、测验试卷和学术阅读平台体验访谈表。

1.研究生学术阅读能力量表

本研究采用较成熟的学术阅读能力评估量表（杨雪姣，2021），共39 个题项，分别从识记、理解、应用、分析、综合、评价六个维度测量研究生的学术阅读能力。量表选项从1 到5 依次代表“非常不赞同”到“非常赞同”。

为保证量表的有效性，本研究在实验开始前邀请105 名不同学校研究生作答，问卷回收率100%。统计显示，量表的标准化Cronbach α= 0.979>0.8，表明量表信度较高，通过该量表能较真实可靠地反映研究生学术阅读能力。

2.测验试卷

本研究根据论文内容制定测试试卷，每份试卷共四题，总分都为100 分。四份试卷的出题人为同一位教育技术学专家，以保证出题风格和题目难度一致。第一题考察研究生获取信息的能力，共10 分，题型为单选题和多选题，测试知识点为论文的基本信息和关键信息；第二题考察研究生理解理论的能力，共20 分，题型为多选题，知识点为论文的主要理论观点；第三题考察研究生探寻观点的能力，共30 分，题型为简答题，测试知识点为文章核心观点；第四题考察研究生发表观点的能力，共40 分，题型为论述题，包括与论文内容相关的思考题和应用题。

3.学术阅读平台体验访谈表

为综合分析阅读平台对研究生阅读能力的影响，本研究采用访谈法了解学生使用该类平台的感受体验，包括整体感受、功能体验和阅读兴趣等（见表2）。

表2 访谈提纲

（六）实验流程

首先，本研究采用研究生学术阅读能力量表对被试进行前测，分析学生的学术阅读水平。其次，研究进入准实验阶段。实验组研究生使用ChatDOC平台阅读学术论文，对照组研究生使用非ChatGPT类阅读平台，如知云文献翻译、WPS、小绿鲸和Adobe reader 等文献阅读工具。实验为期一个月，共实施四次学术阅读实验。实验期间，研究者对研究生阅读过程进行录屏，以便于后期分析。每次阅读实验结束后，研究生完成对应的测验试卷，之后出题人采用密封评审的方式评分，以保证结果的公正。最后，研究者采用研究生学术阅读能力量表进行后测。实验结束后，研究者邀请学生填写访谈表，以便深入了解学生平台阅读体验（见图1）。

图1 实验流程

四、研究分析

（一）阅读能力分析

1.学术阅读能力量表前测分析

研究生学术阅读能力量表前测结果显示，实验组和对照组学术阅读能力各维度均值差距较小，研究生学术阅读能力整体介于中等和良好之间（见图2）。独立样本T 检验结果表明，两组被试在识记、理解、应用、分析、综合、评价六个维度的Sig值均大于0.05，说明两组研究生实验前的学术阅读能力不存在显著差异，实验分组公平公正（见表3）。

图2 研究生学术阅读能力前测的描述性统计

表3 研究生学术阅读能力前测的独立样本T 检验

2.测验试卷结果分析

实验组和对照组研究生的测验结果独立样本T 检验结果显示，两组被试第一次（Sig=0.543>0.05）、第二次（Sig=0.101>0.05）和第三次（Sig=0.164>0.05）测验得分不存在显著差异，第四次测验分数（Sig=0.005<0.05）存在显著差异（见表4）。两组得分从无显著差异变为存在显著差异，实验组测验均值增长显著。

表4 研究生学术阅读能力试卷测验独立样本T 检验

3.学术阅读能力量表后测分析

研究生学术阅读能力量表后测结果显示，实验组和对照组的学术阅读能力各维度均值介于中等到良好之间，实验组平均分均高于对照组（见图3）。这说明相较于前测，两组的后测平均得分均有提升，且ChatGPT 类平台更有助于提升研究生学术阅读能力。

为探究不同阅读工具对学术阅读能力的提升效果，本研究对两组研究生的前后测结果进行配对样本T 检验。结果显示，实验组研究生学术阅读能力前后测结果（Sig=0.01<0.05）存在显著差异，且后测成绩高于前测成绩。对照组研究生学术阅读能力前后测结果（Sig=0.15>0.05）不存在显著差异（见表5）。

表5 研究生学术阅读能力前后测的配对样本T 检验

（二）获取信息能力分析

为探究ChatGPT 提升研究生获取信息能力的效果，本研究对两组被试获取信息部分的成绩进行了描述性统计。实验组四次测验平均分依次为：7.35、8.20、4.20、7.30；对照组的平均分依次为：8.40、8.80、4.55、8.00。对照组的分数始终高于实验组，这说明对照组研究生获取信息能力较强。两组学生获取信息的均值变化趋势一致，说明获取信息难度变化趋势一致。其次，由于实验四次获取信息得分不服从正态分布（P=0.000<0.05），本研究采用Mann-Whitney U 检验考察不同阅读工具对研究生获取信息能力的影响。结果显示，实验组与对照组的四次获取信息得分（Sig>0.05）均不存在显著差异（见表6）。

表6 Mann-Whitney U 检验结果

上述结果表明，ChatGPT 类阅读平台提升研究生获取信息能力的效果不显著。学生论文阅读过程的视频分析结果表明，实验组和对照组的研究生都能主动关注并获取学术论文的基本信息和关键信息。可见，研究生获取信息能力的整体分值较高，且两组学生之间没有显著差异。第三次实验得分较低，主要是由于多选题数量较多，因部分同学少选或错选导致。

（三）理解理论能力分析

为探究ChatGPT 提升研究生理解理论能力的效果，本研究对两组学生理解理论部分的成绩进行了描述性统计。实验组学生四次测验平均分依次为：10.20、11.10、10.25、4.00；对照组学生平均分依次为：10.60、9.75、9.75、2.25。实验组第一次测试得分略低于对照组，后三次得分均都高于对照组。两组均分都较低，表明学生理解理论能力方面还不强。本研究还对理解理论部分得分进行正态性检验。由于得分均不服从正态分布（P<0.05），本研究采用Mann-Whitney U 检验分析数据。结果显示，两组学生的四次理解理论得分（Sig>0.05）均不存在显著差异（见表6）。

上述结果表明，ChatGPT 类阅读平台对研究生理解理论能力未产生显著影响，研究生得分整体较低。研究生学术阅读的视频和访谈记录显示，研究生对理论内容往往只是粗略了解或简单浏览，缺乏深入探究，导致该部分得分较低。第四次实验得分显著下滑的原因在于研究生不熟悉该篇阅读材料的理论内容。在访谈中，实验组研究生表示ChatDOC阅读平台可通过答疑的方式辅助理解理论。例如，实验组#11 研究生表示：“ChatDOC 不仅帮助我理解学术文献涉及的理论，还对理论进行拓展解释。”实验组#19 研究生表示：“ChatDOC 不仅可以对专业术语进行解释，还能说明统计结果和结论，帮助我跨越理解障碍。”

（四）探寻观点能力分析

为探究ChatGPT 类阅读平台提升研究生探寻观点能力的效果，本研究对两组学生探寻观点能力的成绩进行了描述性统计。实验组学生四次测验平均分依次为：15.90、15.90、15.70、20.45；对照组学生的平均分依次为：16.88、15.10、14.65、16.90。两组学生的平均得分显示，实验组前三次的均分波动较小，第四次均分显著提升；对照组四次均分整体较稳定。本研究还对探寻观点能力部分得分进行正态性检验。第一次探寻观点得分不服从正态分布（P=0.009<0.05），本研究使用Mann-Whitney U检验。第二、三、四次探寻观点得分服从正态分布（P>0.05）,使用独立样本T 检验。结果显示，实验组与对照组学生的第一次探寻观点得分（Sig=0.848>0.05）不存在显著差异。第二次（Sig=0.72>0.05）和第三次（Sig=0.68>0.05）探寻观点得分不存在显著差异，第四次（Sig=0.044<0.05）的探寻观点得分存在显著差异（见表6 和表7）。

表7 独立样本T 检验结果

上述结果表明，随着阅读次数的增加，实验组和对照组的探寻观点能力差异逐渐变得显著。ChatDOC 阅读平台的文献概括功能是辅助研究生探寻观点的利器。ChatDOC 可以在总结作者核心观点的同时将参考内容进行定位引用，方便研究生考证。对照组#10 研究生表示“理解作者的观点和理论有时比较困难，只能通过翻译去理解猜测”。实验组#15 研究生表示：“ChatDOC总结能力很强，论据定位引用功能极大方便我了解作者观点，追问功能还能通俗易懂地解释观点，确实很方便。”

（五）发表观点能力分析

为探究ChatGPT 类阅读平台提升研究生发表观点能力的效果，本研究对两组学生发表观点部分的成绩进行了描述性统计。实验组学生四次实验平均得分依次为：22.90、25.10、32.35、37.00；对照组学生平均得分依次为：23.25、19.15、26.75、30.00。两组学生的平均得分显示，实验组第一次均分略低于对照组，之后均高于对照组。实验组均分一直呈上升趋势，且增幅逐渐加大。对照组整体也呈上升趋势，但增幅较平缓。这说明，实验组学生发表观点能力提升较明显。正态检验结果显示，第一、二次实验得分服从正态分布（P>0.05），可使用独立样本T 检验。第三、四次实验得分不服从正态分布（P<0.05），研究者采用Mann-Whitney U 检验。结果显示，实验组与对照组学生第一次发表观点得分（Sig=0.912>0.05）不存在显著差异，两组被试的第二次发表观点得分（Sig=0.040<0.05）存在显著差异（见表7）。同时，第三次（Sig=0.031<0.05）和第四次（Sig=0.015<0.05）发表观点得分均存在显著差异（见表6）。

上述结果表明，ChatGPT 类阅读平台提升研究生发表观点能力效果显著。本研究分析实验组的录屏时发现，研究生与虚拟助手在观点、内容、结论等方面展开了讨论。该过程对研究生发表观点能力有促进作用。访谈中，实验组#16 研究生表示：“与ChatDOC 交流互动很有趣，它的总结对我启发很大，不厌其烦的智能回复功能促使我敢于表达自己的观点。”对照组#2 研究生表示：“阅读工具只起到翻译的功能，遇到困难不知该与谁商量。同学也看不懂。导师也不能24 小时指导自己。”

五、反思与建议

总体而言，ChatGPT 类阅读平台在辅助提高研究生的学术阅读能力方面具有积极作用，特别是对探寻观点能力和发表观点能力促进作用明显。本文最后从研究问题出发，反思研究结论，并针对研究生如何使用此类平台提升学术阅读能力给出了相关建议。

（一）夯实专业知识，优化学术阅读习惯

专业知识水平是影响研究生学术阅读能力的根本因素。扎实的专业知识有助于研究生理解学术文献的专业术语、复杂理论和作者观点。而实验发现，部分研究生对学术文献的理论或统计方法理解困难，导致理解理论提升效果不显著。ChatGPT类阅读平台虽然能够辅助研究生提升学术阅读能力，但作用有限。因此，提高研究生学术阅读能力的根本，仍然需以厚实的专业知识、良好的阅读习惯作为基础。

基于此，本研究建议研究生夯实专业知识，优化学术阅读习惯。这包括：1）以专业前沿研究为基础，围绕具体问题构建专业知识图谱，通过ChatGPT 类阅读平台的知识交流功能，针对性学习相关理论和研究方法；2）涉猎不同领域文献，通过ChatDOC 的跨文献交流功能，综合不同文献的关键信息，形成对前沿研究的整体认识；3）强化良好学术阅读习惯，通过阅读平台中的高亮、标记、笔记等功能提取关键信息，结合聊天区讨论和笔记共享功能，增强交流表达能力。

（二）强化数字素养，善用AI 工具

数字素养是研究生在人工智能时代进行高效学术研究所必需的关键技能，较高水平的数字素养，有助于研究生形成掌控技术、善用技术的能力（廖湘阳等，2022）。然而实验发现，研究生对ChatGPT类阅读平台的使用能力欠缺，未能发挥AI 工具的最大价值，导致获取信息和理解理论能力的提升效果不显著。

基于此，本研究建议研究生学会使用AI 工具，提升自主学习能力，具体可从以下方面展开：1）使用ChatGPT 类阅读平台前，应认真阅读官方指导文件，结合官方使用案例，提高自身工具的使用能力。例如，尝试选中特定段落提问功能或跨文献提问查询功能，有针对性地获取关键信息；2）提升指令表达能力，实现AI 工具价值最大化。分析研究生使用ChatDOC 记录发现，大部分研究生与AI 的交互仅仅停留在简单交流的层面。例如，“请帮我解释一下术语”。强大的指令功能可极大提升研究生学术阅读效率。例如，“请按照关键点1、关键点2、关键点3 的顺序，整理论文的核心观点。3）强化自主学习能力。ChatDOC 的持续追问功能，为深化研究生理论理解提供了机会。研究生应在持续追问过程中，不断掌握基本理论和研究方法，提高自学能力。

（三）保持独立思考，培养批判性思维

华罗庚强调独立思考能力是进行科学研究和创造发明的必要素质。学术阅读过程中，独立地思考问题、观点和论证，而不只是被动地接受信息，有助于批判性、创新性思维的发展。研究结果显示，ChatGPT 类阅读平台能够促进研究生探寻观点和发表观点的能力，但由于该类平台底层为ChatGPT 大语言模型，在生成内容时会产生“AI幻觉”现象（Alkaissi & McFarlane，2023），导致平台有时生成的内容不可靠，容易产生信息误导。

因此，本研究建议研究生在使用ChatGPT 类阅读平台应保持独立思考，培养批判性思维，包括：1）广泛参考可靠信息来源，即对于存疑信息，要查阅原文，审核平台生成内容的准确性；2）学会研判内容来源的可靠性。研究生应了解语言模型局限性，理解生成内容的机制和可能产生的偏差，以更好地识别和纠正潜在的误导信息；3）加强学术交流与讨论，如与导师、同行和专家交流讨论，获取专业领域的不同见解和观点，培养批判性思维和学术辨析能力。