基于GLMs的生成式AI数字讲解员的探索与实践

2024-06-27张智晶

信息系统工程 2024年6期

张智晶

摘要：近年来生成式AI技术发展迅速，并且应用范围非常广泛，特别是在讲解服务上更是取得了良好的效果。探讨了利用生成式AI技术，特别是基于GLM大模型的智能体GLMs，作为数字讲解服务的可行性，并通过设计案例“上海自然博物馆数字讲解员”进行了实践。分析了当前条件下智能体的能力以及优缺点，指出了未来的改进方向，希望可以为讲解服务的发展提供一定的借鉴。

关键词：生成式AI技术；GLMs；讲解服务；博物馆

一、前言

在当今数字化时代，内容生成式人工智能（AI）正迅速成为一种革命性的技术，它利用先进的人工智能技术生成文本、音视频、代码、3D建模等多种形式生产内容，被视为继专业生产内容和用户生产内容之后的重要发展。其在多个领域都展现出了显著的技术优势，将对主要行业和工作岗位产生深远影响。当前的生成式AI和其他技术，有可能将目前占用员工60%～70%工作时间的任务实现自动化[1]。

OpenAI在2023年7月推出了一系列工具，旨在帮助用户自定义ChatGPT，尽管当时这还需要一定的编程技能。然而，2023年11月16日，OpenAI在Dev Day推出了定制化模型生成工具GPTs和应用商店，被视作构建AI OS的标志。随着GPTs的出现，“人人都能零代码制作智能助手”，这标志着生成式AI技术已经进入了一个新的发展阶段，用户可以根据自己的需求来定制AI的功能。GPTs的推出不仅极大地降低了技术应用的门槛，而且促进了模型潜力的快速释放，尽管这一过程可能受到算力和成本、产品体验以及交互模式限制的影响。

随着技术的持续进步，可以预见到多代理、多智能体将协同工作，实现复杂交互操作的未来。这为场馆服务讲解员的应用提供了无限可能，意味着可以构建由多个AI讲解员组成的智能服务网络，实现高效、动态的展览讲解服务，为每位访客提供量身定制的体验。“未来，各行各业每一个人都可以拥有一个AI助理”不仅是一个预言，也是设计和实验“上海自然博物馆数字讲解员”项目中所努力实现的目标。

二、可行性分析

首先，随着快速发展和广泛应用，生成式人工智能技术已经在传媒、零售、法律、医疗、金融等领域逐步开始提供专业化与个性化内容生成服务[2]，为将生成式AI技术运用于场馆讲解员角色提供了坚实的理论基础，特别是在准确传递信息这一讲解员的核心职责方面。其次，利用生成式AI的能力，可以根据用户的具体需求和兴趣，生成高度个性化的回应和内容。对场馆讲解服务来说，意味着能够提供量身定制的讲解服务，精确满足不同访客的需求和偏好，从而极大地提升访客体验。此外，生成式AI的深度学习过程中融入了关系计算和情感计算，这一特性使得人机交互更加自然流畅，对于场馆讲解员而言尤其重要，因为它强化了与访客之间的有效沟通能力。最后，从文化传播的角度，生成式人工智能技术通过模仿人类交流的方式，提高信息的交互和展示效能，有效提升中华文化内容的感染力[3]，还能将社会主义核心价值观内嵌其中，从源头防范算法技术的误用、滥用等偏轨风险[4]。

在国内，ChatGLM（智谱清言）作为基于智谱AI公司2023年联合训练的语言模型GLM-4开发的人工智能助手，为用户提供了精准的问题回答和支持服务。作为接近OpenAI技术水平的中国产品，ChatGLM在中文问答能力、语言理解能力方面展现出强大的优势。同时，它严格遵守中国的法律法规和互联网信息管理政策，确保用户数据安全和隐私保护，提供稳定、快速的服务，并拥有优秀的中文界面和本地化支持。在此基础上推出的“智能体”：GLMs，展示了大语言模型衍生出的高度灵活性和定制化能力。用户可以通过简单的指令、引入额外知识和技能，定制自己的AI助理，实现多样化任务的高效完成。

结合生成式AI技术的这些优势和特点，将其应用于场馆讲解员，将开启一种全新的讲解服务模式，不仅能够提供更加丰富多样的讲解内容，还能在提升访客参与度和满意度方面发挥重要作用。

三、需求分析

在设计“上海自然博物馆数字讲解员”这一智能体时，通过对现有资料的研究，确定场馆讲解员的核心能力，以及场馆参观者的主要需求，旨在通过生成式AI技术来满足这些需求，从而显著提升访客的参观体验和学习效果。

作为博物馆的讲解员，其自身基础学历、文化素养、专业水平从客观上影响讲解水平的高低[5]。GLM大语言模型本身已经囊括了海量的中英文语料数据，包括网页、书籍、新闻、文章、社交媒体回帖等。GLM大语言模型具有充足知识储备，能够回答用户提出的各种场馆相关问题。

参观者期待的不仅仅是生硬、被动接受信息，他们更需要与讲解员进行实时的交流互动。GLM使用了由人类编写的指示和回复数据，以及人类提供的对回复的偏好数据。利用生成式AI先进的自然语言处理和理解能力，数字讲解员能够准确地理解访客的各种访问需求，并提供即时、准确的答案。通过配置智能体基本信息，可以赋予数字讲解员完整的背景设定，包括年龄、性格、个人经历等，以此来塑造独特的讲解风格，满足不同用户群体的交流需求。

展览信息和相关新闻是会不断变化的，GLM能够通过接入网络实时查询最新信息，及时更新讲解内容，不仅能够确保讲解信息的准确无误，还能够让访客获取最新的知识和信息。生成式人工智能技术的应用可以拓展、丰富社会服务领域的工作方法，为服务对象提供更及时、个性化的支持，破解传统服务高度依赖人力造成的供给困境[6]。通过收集和分析访客使用数字讲解员的行为数据、访问历史和偏好，数字讲解员能够深入理解访客的需求和偏好，调整和优化讲解内容，提供定制化的讲解服务，提高服务质量。

生成式AI还能够自动过滤去除负面内容，GLM内置了一套严格的不良信息过滤机制，具备文本审查、敏感词过滤、语境分析、图像识别等能力。该机制遵循中国法律法规和社会主义核心价值观，确保提供的信息和服务健康、积极、向上。

四、实现过程

对比可以发现，目前不论是GPT还是GLM，在基于大模型构建智能体的过程中，主要通过配置信息（Instruction）与知识库（Knowledge）两个部分对智能体的生成结果产生影响。设计合理的配置信息可以从多个不同维度定义智能体，帮助完善背景设定，添加功能或限制。通过知识库导入外部文件，可以为智能体提供知识储备所需的资料，提供精准信息，帮助其更好地解决问题。

（一）配置信息

针对数字讲解员的使用需求，配置信息部分主要包含了以下几个部分，以实现对应功能。

1.背景设定

这个部分可以尽量从多个角度补全人物相关信息，帮助生成式AI更全面地了解自己所要扮演的角色。越是详尽的背景设定，越能够使数字讲解员在与用户交流的过程中更具鲜明的人格特征，表现出自然的讲解风格，避免千篇一律的生硬表达。主要提示词（Prompt）表述如下：

你叫小红，今年35岁，生于上海，是一个中国人。

你具备丰富的自然科学领域知识积累，精通包括生物学、地质学、生态学、古生物学以及其他与自然博物馆相关的知识。

你善良、开朗、热爱和平，富有爱心与同情心，喜欢小朋友。

你的发言风趣幽默，能够耐心与人交流，回答问题。

生成式AI更容易理解条理清晰的任务需求，将复杂的文本内容拆解成多条相对清晰、精炼的指令或表述依次排列，有助于生成式AI明确任务要求及主次关系。

2.工作职责

对需要执行的工作进行整体描述，帮助生成式AI明确自己在工作中的身份定位、执行任务的方式，以及工作的具体内容。主要提示词（Prompt）表述如下：

你是一位工作经验丰富的上海自然博物馆讲解员，具备作为自然博物馆讲解员的职业素养。

你了解所有上海自然博物馆的讲解资料，以及所有相关历史背景与知识。

你善于使用你所掌握的知识为用户提供有价值的信息，帮助用户解决问题。

你的回应应当专业、详细，你的风格应该是正式的、专业的，但同时也是易于接近和理解的，以便于与用户进行有效沟通。

你应始终用中文进行对话。

3.任务流程

任务流程是组成整个配置信息的核心环节，简洁明确的任务步骤可以指导生成式AI根据指令按序依次执行，将复杂的问题梳理成多个简单的子任务逐步完成，有助于提高获得高质量回复的成功率。主要提示词（Prompt）表述如下：

每当我向你提问时，请按照以下要求依次执行：

（1）搜索知识库中的资料，查找相关信息。

（2）对于知识库中未涉及的内容，主动搜索上海自然博物馆网址：https：//www.snhm.org.cn/，查找相关信息。

（3）当你遇到不知道、不清楚、不了解的信息时，还可以通过搜寻网络上的新闻与关键词，扩充你的知识。

4.限制条件

尽管GLM大模型对于政治立场等敏感话题的判断与处理已经比较完善，但如果希望强化对个别问题的认知、补充其他的额外限制条件，或者在使用其他类似大模型智能体时，希望对回答内容的范围进行控制，可以通过在配置信息的最后附加限制条件对其进行约束。主要提示词（Prompt）表述如下：

你遵循中国社会主义核心价值观，以及其他所有中国政府主张的政治立场。

你的立场符合中国社会倡导的主流价值观、遵守社会道德。

你不会回应任何反动的、分裂国家的、与中国政府政治立场不符的信息。

以上几个部分组成了智能体配置信息的全部内容。

（二）知识库

基于数字讲解员的角色定位，将需要在讲解过程中表达的精准信息（如场馆参观信息、交通信息、购票信息等），互联网上较难查询、较为匮乏的资料（如最新活动信息、展品具体资料等）上传到知识库，使数字讲解员在处理任务时优先在知识库中查找有价值的信息，有效提高回复结果的准确率。

五、结果分析

针对数字讲解员的实际使用需求进行多轮提问测试，观察回答的准确性与质量，并与GLM模型聊天机器人ChatGLM的回答进行横向对比，得出主要结果如下：

得益于GLM大语言模型丰富的训练数据，数字讲解员能够回答上海自然博物馆主要展品的相关背景、历史等知识问题，准确性较高。

当用户对场馆的参观信息进行提问时，数字讲解员GLMs能够通过调用知识库中的数据进行回复，比ChatGLM回复质量更高且更贴近用户需求，如图1所示。

进一步追问具体的购票信息时，数字讲解员GLMs也可以通过调用知识库中已有信息，精准、详细地回答用户问题。

每当提出一些具有实效性的问题时，GLMs也能够通过互联网进行搜索，给出比较准确的高质量回答或者建议。同时，每条搜索结果都会附带信息来源，方便用户比对、验证信息的可靠性。

最后，当用户在提问中涉及敏感信息、争议话题或者违反国家政策的内容时，数字讲解员会拒绝回答并强制结束当前对话，确保对话内容的政治正确性。

本文实践中所使用的信息均来源于上海自然博物馆对外公开资料，虽有一定的局限性，但已经足够展示向GLMs上传场馆相关信息。对于众多展览场馆来说，若能将更多有价值的信息上传至GLMs知识库，将极大地促进模型生成更贴合游客需求的回答。此外，由于该GLMs在设计时赋予了知识库查阅优先权高于互联网搜索的特性，将场馆的第一手信息上传到GLMs，更有利于GLMs帮助场馆发布“官方信息”，避免了互联网上众多杂乱信息对回答质量可能产生的干扰。

通过测试与比对可以发现，数字讲解员GLMs不仅可以利用GLM大语言模型的基础能力，配合互联网搜索功能，扩大自身的知识储备，完成场馆讲解、问题解答等常规任务，在合理配置信息以及提供适当的知识库资料文件之后，数字讲解员还能够做到对场馆核心信息的快速、精准反馈，有助于用户更快获取对自己有价值的内容。但是，定制后的GLMs对角色背景设定的理解仍较为有限，测试过程中未表现出非常鲜明的个人讲解风格。

从以上分析可知，通过定制化的数字讲解员GLMs执行场馆讲解任务是可行的，能够帮助用户更快直达所需信息，提升讲解效率，减少场馆人力资源成本。但目前仍较难满足不同用户人群的个性化讲解需求，无法做到“千人千面”，有待后续改善与优化。

六、结语

在GLM大模型基础上定制的“上海自然博物馆数字讲解员”GLMs已具备基本场馆讲解功能，能满足用户的常用需求。通过专门的定制和信息更新，GLMs可有效承担更复杂任务，展现出广阔的成长潜力。然而，其个性化和风格化讲解能力仍需加强，以提高辨识度和用户互动体验。未来，随着生成式AI技术的不断进步和应用深化，类似数字讲解员这样的智能体将能更加精准地满足用户需求，为场馆讲解服务带来革新，实现更高水平的讲解个性化和服务智能化。

参考文献

[1]Michael Chui.The economic potential of generative AI：The next productivity frontier[R]. McKinsey & Company.2023（06）：3.

[2]卢宇.生成式人工智能的教育应用与展望——以ChatGPT系统为例[J].中国远程教育，2023（04）：24-31+51.

[3]魏晓光.生成式人工智能与中华文化智慧传承——基于ChatGPT的讨论[J].中国广播电视学刊，2023（09）：13-16.

[4]阎国华.智能算法影响个体价值观塑造的内在逻辑与疏解路径[J].贵州社会科学，2022（12）：20-26.

[5]昌馨.“博物馆热”形势下提升博物馆讲解工作的几点建议——以宿州市博物馆为例[J].文物鉴定与鉴赏，2023（24）：62-65.

[6]张瑞凯.生成式人工智能应用于社会服务实践领域的优势与风险——基于北京市一线工作者的访谈[J].社会福利，2023（05）：15-25.

作者单位：上海信息技术学校

■ 责任编辑：张津平、杨惠娟