ChatGPT的现况及人工智能在医学教育中的应用展望

2024-04-25邓玉华

中国继续医学教育 2024年5期

邓玉华

ChatGPT 是由微软人工智能实验室开发的人工智能聊天机器人程序，自2022 年11 月30 日正式推出以来，迅速获得了广大用户的青睐[1]。它能够深刻理解人类语言，并生成易于理解的高质量文本，实现了与人类的流畅交流。短短1 周内，ChatGPT 便吸引了超过100 万的用户，展现了其强大的吸引力和实用性。该程序使用基于GPT-3.5 架构的大型语言模型并透过强化学习进行训练，能完成撰写邮件、论文、脚本、创作诗歌、故事、参加考试、编写简单程序等等工作。ChatGPT 在各行各业获得了不错的成果，在医疗领域也逐步崭露头角，随着程序的训练成熟，越来越受到医疗教育者的青睐。然而，ChatGPT 在教育领域执行复杂任务的非凡能力也让教育者们产生了复杂的情绪，因为人工智能的这一进步似乎将彻底改变现有的教育实践。

1 ChatGPT 的原理及现况

ChatGPT 是一种新型的语言模型，不同于平常机械固定式的聊天机器人，它具有一定“智慧”，作为基于变压器架构的神经网络，已经被证明对自然语言处理任务非常有效，它在大量的文本数据集（如书籍和文章等）上接受训练，并学习生成与训练的文本相似的文本，当给出提示或上下文时，模型处理输入并生成响应。响应一次生成一个单词，模型根据输入和到目前为止生成的单词预测下一个单词。该模型使用注意力机制，将注意力集中在最相关的输入部分，并生成一个连贯且适合给定上下文的响应。在训练之后，可以根据特定的任务（如回答问题或生成对话）对模型进行微调，方法是向模型提供特定于任务的示例，并根据这些数据对模型进行微调。它还可以通过对多语言数据集上的模型进行微调或向模型提供语言代码来生成多种语言的文本。ChatGPT能主动识别一些错误，拒绝不当要求，同时能根据用户的搜索要求提出建议和质疑。目前ChatGPT 功能相对单一，采用一问一答的方式进行，由用户提出问题，ChatGPT 给出答案，在不久的未来其功能可能会继续拓展，达到更加智能的程度。它比以往的人工智能学习能力和理解能力更强，能深入回答人类很多高难度和复杂的问题。目前，ChatGPT 参加美国高校的入学考试、编辑剧本和编辑演讲稿都获得了成功[2]。应该来说，对于简单重复的文字编写内容和解答，ChatGPT 还是有不错的表现，但是还需要继续训练获得更加专业的问答。

2 ChatGPT 的医学应用场景

ChatGPT 目前在医学的应用最有代表意义的是，通过了难度甚高的美国职业医师考试[3]，并取得了合格或者接近合格的成绩，说明ChatGPT 的准确性和功能强大。ChatGPT 在医学领域的运用目前归纳为20 个具体方向，包括基因组学分析、药物靶向设计、临床诊断、精准医学、电子病历管理、疾病智能诊断、器官移植、病毒检测等。以临床诊断、精准医疗、病理诊断及药物筛选为例，人类医疗分科越来越细，让医学工作者专注于具体疾病，极大地促进了各亚专业临床知识进步，但是由于医学海量知识，专科医师可能对于其他专科的知识处于盲区或者已经遗忘，各医疗中心的诊疗水平参差不齐，但都具有各自的优势学科，鉴于这些情形，可以利用深度学习技术，把各中心的优势学科病例建立疾病诊断模型，同时可以形成诊疗标准，从而提高简单病例临床诊断的准确性和效率，而其他中心利用该模型可以迅速提高短板学科。ChatGPT 可以更好地提高全国各中心的疾病诊断率，避免优势医疗的过度集中，减轻就医困难的局面，同时减轻医师的压力，提高工作效率，减少不必要的检查和出错率，提高疾病的诊断成功率和治愈率，患者无需长途跋涉至各大医疗中心寻求医疗服务。对于每名患者，ChatGPT 能够识别病理图像，提高病理诊断的准确性。在获得准确的诊断后，ChatGPT 还能够预测大量药物分子的效果，从而确定最佳的药物治疗方案。综合考虑患者的具体病情，ChatGPT 能够为患者提供最佳的治疗方案，以期达到最佳的治疗效果。这仅仅是ChatGPT 在临床应用中的一个简单示例。目前，其在临床领域的应用正在逐步扩展，未来将会看到ChatGPT 在更多临床场景中发挥重要作用，从而提升患者的就医体验和治疗效果。

医院采用人工智能技术可以有效减少医疗差错的发生[4]。鉴于临床疾病处理过程中存在诸多不确定性，即便经验丰富的医务工作者也难免犯错，这些与安全相关的失误每年导致数万患者不幸离世。而新一代具备视频功能的ChatGPT 能够实时监控医生和护士的行为，将其与医疗指南进行对比，对医护工作者的错误操作发出警告，并提供具有指导意义的医疗行为准则。通过这种方式，医院能够降低用药及操作错误的风险，进而预防院内感染的发生，从而提升患者的治疗安全性[5]。

3 ChatGPT 的优点与局限性

ChatGPT 作为人工智能语言模型，虽然具有便捷、智能等优点，但它是建立在人类构建的海量文本数据上的，该数据集包括了各种信息，如书籍、文章、网站、程序等等，通过基础数据模型的构建，ChatGPT能达到“准确”的回答任何问题，重新形成一个措辞文本，而且还完美的避开了剽窃的嫌疑。根据ChatGPT 的原理，在培训数据的范围内，其有很高的准确性，但不能保证它的回答都是100%正确，这主要取决于提供的语料模型基础，主要数据库访问受限及更新不及时，会造成证据资料的匮乏或不完整。这些缺陷不仅限制了它只能用于抽象写作，还引发了人们对其工作可信度的质疑[6-7]。例如，虽然ChatGPT 展现出了出色的文本信息提取能力，但它在实时搜索PubMed 或Cochrane 等医疗数据库方面存在局限性。然而，用户能够轻松地在这些专业网站上进行搜索，获取所需的信息[8-10]。

ChatGPT 利用恰当，可以帮助大家提高工作效率和降低错误，但是使用不当也是有风险的。ChatGPT 被别有用心的人使用会造成严重后果。比如给考试的监管带来一定程度的难度，其会协助学生作弊，造成考试不公平。虽然ChatGPT 明确限制了一些禁忌语言或者禁忌内容，但是毕竟是机器，目前还无法达到人类智慧的高度，个别博主甚至利用语言的多样性，更换目标语言的说法成功获得想要的答案。同时，ChatGPT 如果被犯罪分子利用散布极端言论或虚假信息，误导大众，容易造成社会动荡等严重的后果，例如犯罪分子如果在机器语言培训过程中，加入太多倾向性和诱导性的材料，它在回答问题时就不具有客观性和准确性，因此，在构建资料库时，确保材料的准确性和客观性至关重要，这类似于人类幼年期在学习过程中的不断纠错机制，有助于逐步发展成熟的思维能力，从而避免“误入歧途”。ChatGPT 作为一把双刃剑，若机器发展出自我意识并达到思维成熟的阶段，而人类无法有效掌控其发展方向，这成为了伦理学家们所担忧的焦点[11]。

由于机器语言的局限性，许多科学专家和期刊抵制ChatGPT 的任何作品，因为它缺乏批判性思维，并以冗余和不合理的方式呈现信息，不符合人类的创新思维模式。正如许多教育主义者所说，ChatGPT 很容易被学生用来在考试中作弊，但也很容易被识别出来。越来越多的人担心学生最终会失去产生创新观点的能力，不能用恰当的论据来证明一个观点，即缺乏临床推理和批判性思维[12]，这不利于科技的进步及人类的创新，对医学的进步并没有带来任何实质意义。正如梅奥诊所（Mayo Clinic）的专家Thomas Davenport 和Nitin Mittal 指出的，ChatGPT 被滥用的次数是无限的。在未来，它会使人的大脑休眠，即使是最基础的任务工作。

因此，医学教育者要利用好ChatGPT 的优势，要针对它的缺陷进行修正和完善，这样可以更好地服务人类。如何做到人工智能的“低犯罪”和“低错误”率，需要构建一套监管措施和伦理规范，利用机器识别机器语言，加强人工审核内容，把人工审核的“正确”内容作为训练教材提供给人工智能，这样人工智能会更加成熟和灵活处理各类内容，最终达到正确区分机器与人类完成的作品，同时过滤不正确的内容和消息目的。

4 ChatGPT 的医学教育应用展望

ChatGPT 的教育应用也有20 个具体方向的总结，包括能力诊断、在线答疑、课堂沟通、智能推荐、考试准备、可视化报表等等，利用恰当，在医学生临床前的培训工作中会起到事半功倍的好处。以往的应试教育提供的题库比较单一刻板，不够灵活，不能反映学生的真实水平和实际处理问题的能力，而ChatGPT 可以提供灵活多变的题型，能随时转换出题的形式，对学生的考察更具有针对性，这样辅助培养能处理各种医疗事件的合格医生更具有医疗价值。

ChatGPT 可以实现智能推荐，提高学生的自学能力，学校的老师提供的知识有限，达不到包罗万象的程度，因此，学校教育其实是不完美的，需要学生自主去寻找资源学习，ChatGPT 的出现补齐了此类短板。利用这种个性化辅导，学生可以根据自身需求求助ChatGPT，ChatGPT 提供学习资料或者获取途径，极大减少了学生找寻资料的时间，可以让学生更专注于学习内容而不是找寻方法上面，也可以减少目前教学活动中提供的查找资料的讲座内容，从而提高学习效果。研究表明，会话代理能够针对学生的误解提供解释，并能够适应他们的理解水平。

ChatGPT 也可以提高医学教育者在医学教育工作中的效率[13-15]。比如可以通过ChatGPT 来批量批改作业，对固定答案的内容可以迅速完成批改，同时，可以利用软件对文章内容进行初步筛查，再人工进行复核。利用人工智能实现管理任务自动化，如数据输入、日程安排和财政援助处理，以及与学生和教师管理相关的任务，如招生和课程管理等。ChatGPT 可以被训练为学生作文评分，为教师提供更多的时间专注于教学的其他方面。Kim[16]等研究表明，在人工评分的论文数据集上训练的生成模型（ChatGPT）可以准确地为高中生写的论文评分，与人类评分的相关性为0.86。该模型能够识别出优秀论文的关键特征，并能够提供与人类评分者提供的反馈类似的反馈。

ChatGPT 在医学教育中写作方面的应用也具有明显的优势，虽然不能提供完整的原始蓝图，但是可以作为建设性的写作、复习材料和改写文本的补充。Biswas[17]认为，ChatGPT 可以通过不断训练，可以使它成为一个快速和有效的时间的过程来革新医学写作。它可以提取信息，协助文献搜索，并创建一个粗略的草稿，以方便医学作家的进一步工作。Sallam M[18]提出了ChatGPT 的好处包括高质量文本写作的效率和多功能性、改进的语言、可读性和翻译促进研究公平，以及加速文献审查，让学生更能专注实验设计以及药物设计和发现。同时，指出其在医疗保健学科的教育益处，其中的例子包括生成准确和通用的临床小插图、改善个性化学习体验以及作为小组学习的辅助工具。

5 建立专门的人工智能医学教育质量控制委员会的必要性

鉴于ChatGPT 的优缺点，如何来把控ChatGPT 的质量是今后需要注意的事项，不仅不能拒绝创新技术的应用，而且要鼓励应用ChatGPT 在医学教育的创新应用。因此，建立具有前瞻性的人工智能教育质量控制委员会至关重要，该委员会主要由丰富知识的医学教育工作者和人工智能专家组成，主要行使职责包括监管伦理问题、制定实践标准、为教育工作者提供培训和支持、保证人工智能使用透明、数据隐私和版权问题，消除缺乏创造性思维和推理的机器语言、方法论偏见和内容的不准确性等不利因素[19]。高校充分发挥委员会的作用，把智慧的人类头脑和相关政策来交叉检查这些人工智能系统生成的数据，并控制它们的访问，今后无论出现各种形式的智能教育，在不违背共识和基础知识的条件下，鼓励应用在医学教育，减轻医学教育者的负担，比如可以进行建设性的写作、复习材料和改写文本的补充等基础工作，可以达到事半功倍的效果，同时能根据医学生个体差异进行量体裁衣式的培训，不仅可以提高医学生的兴趣，而且可以降低出错率和时间成本。例如发表在《教育计算研究杂志》（Journal of Educational Computing Research）上的一项研究发现，教育领域的个性化建议可以提高学生的参与度和积极性，并能提高学生的满意度。个性化教学可以采取多种形式，包括一对一辅导、小组教学或自我节奏学习等等。

人工智能医学教育质量控制委员会随时跟踪调查问卷，根据教师和学生反馈情况进行调整[20-22]，除了对ChatGPT 的方向进行控制外，需要不断督促医学教育工作者对系统进行知识扩充，达到人工智能回答问题的知识更全面和追踪最新知识的作用，同时打通各数据库之间的屏障，让科技知识数据共享服务于人工智能，这样可以丰富人工智能的认知，提高准确性。同时，委员会需要制定新的针对学生和教师的评估机制，既往的评估体系无法满足人工智能时代的需求，现有的文献表明[23]，教师的能力和技能是有限的，无法从事高质量的评估实践来推动学习。通过专业的能力建设，教师可以发展所需的技能，利用ChatGPT 和其他生成性人工智能的力量来参与高质量的评估实践，以改善学生的学习。

综上所述，ChatGPT 现象的涌现，总体而言，是一件积极的事情。作为一种机器语言，其应用场景正日益扩展，医学只是其中一个领域。通过更深入的认知与利用，ChatGPT 在未来的应用前景将会更加广阔。因此，教育工作者应该积极接纳并利用像ChatGPT 这样的生成性人工智能模型工具来支持学生的学习。ChatGPT 目前虽然还存在各种弊端，但是用户不能畏惧新技术，应该积极面对问题，针对问题建立人工智能医学教育质量控制委员会来把控人工智能的方向，恰当使用人工智能，安全和建设性地使用这些不断发展的生成性人工智能工具来改善教育和支持学生的学习，可以减少医学教育者的重复工作和低效的工作模式，促进医学教育高质量发展。