APP下载

基于大语言模型的翻译AI智能体项目的构建与应用

2024-05-30林美蓉

无线互联科技 2024年7期
关键词:项目组助手文本

林美蓉

(海南科技职业大学,海南 海口 570203)

0 引言

在全球化的背景下,不同语言之间的沟通成了日常生活和国际业务的重要组成部分。传统翻译服务受限于人力资源和时间成本,难以满足即时、大量的翻译需求。智能翻译技术的兴起,利用人工智能的强大计算能力和大数据分析的深度挖掘能力,为解决这一难题提供了可能[1]。基于大语音模型的翻译AI智能体通过大模型学习大量的文本数据,理解词汇、句法和语义,针对特定任务进行训练,可以进行语音识别、机器翻译和情感分析等。项目组在本文中基于大语言模型构建了翻译AI智能体,可以实现对用户输入的识别、多语言翻译和情感分析。

1 相关技术

1.1 大语言模型

大语言模型(Large Language Model,LLM)是通过训练具有庞大参数空间的深度学习模型来理解和生成人类语言的方法。这些模型通常基于变换器(Transformer)架构,利用自监督学习在大规模未标注文本数据上预训练,以捕捉语言的内在规律和语义信息。预训练完成后,模型可以通过指定的任务、特定的数据进行微调,以适应各种自然语言处理任务,如文本分类、命名实体识别、情感分析、机器翻译、问答系统和文本摘要等[2]。大语言模型的应用已经渗透到多个领域,包括客户服务自动化、智能搜索引擎、个性化推荐系统以及辅助编程等。它们的发展推动了人工智能与人类交流的界限,使得机器能够更加流畅和自然地理解和生成语言。

1.2 AI智能体

AI智能体,即人工智能智能体(Artificial Intelligence Agent),是指能够在某一特定环境中自主感知、决策并采取行动,以实现特定目标的实体或软件系统。这些智能体可以通过算法和模型模拟人类的学习、推理、规划等智能行为,在多种场景中应用,如智能家居、自动驾驶汽车、虚拟助手等,是当前大模型落地业务场景的主流形式之一。大语言模型是AI智能体的核心大脑,实现将复杂任务拆解成可以实现的子任务,构成具备自主思考决策和执行任务的智能体。

1.3 提示词

在人工智能和自然语言处理中,提示词(Prompt)是引导模型理解和执行特定任务的文本片段。它们在与模型的输入交互中扮演关键角色,能够显著影响模型的行为和输出结果。精心设计的提示词可以激发模型潜在的知识和能力,提高其对复杂任务的处理效率和准确性。专业的提示词工程不仅涉及单个词汇的选择,而且包括整个短语、句子结构乃至上下文环境的构建。高效的提示词设计可以帮助模型更好地理解用户意图,提升用户体验,在数据生成、文本分类、问答系统及机器翻译等领域发挥至关重要的作用。

2 系统设计与实现

2.1 系统工作流程

为了对AI智能体进行更加深入的研究和分析,笔者基于ZeLinAI平台进行了智能体的创建和应用。ZeLinAI是一款定位于零代码构建企业AI应用的平台,帮助用户快捷、安全、高效地接入大模型。该平台使用不同智能体,通过调试提示词和各个智能体参数,训练自定义的训练集,达到稳定输出的效果,助力打通大模型落地的最后一公里。项目组在详细需求分析的基础上明确本项目需要完成的主要功能,确保为用户提供智能翻译服务。本研究主要依托ZeLinAI平台进行开发,可以根据需求对自建的数据集进行训练,将训练后的数据集与创建的智能体关联,提高智能体数据的准确性。将翻译AI智能体部署到H5应用,分享智能体,用户可通过手机端和电脑端使用该AI智能体,反馈使用过程中的问题和建议。项目组根据反馈持续优化翻译AI智能体。整个项目流程如图1所示。

图1 项目流程

2.2 系统实施过程

2.2.1 智能体创建

首先注册并登录ZeLinAI平台。以创建“翻译小助手”智能体项目为例,进入ZeLinAI平台后,选择平台左侧列表的“智能体”。进入智能体界面后,点选“创建智能体”按钮即可进行智能体的定制和创建。“创建智能体”界面的参数有很多。定制最基础的智能体可以不关注其他参数,只需要配置“智能体名称”“模型型号”和“角色定位”,其他参数默认即可。

智能体名称配置。用户自定义智能体的名称,例如“翻译小助手”,也可以使用简洁且寓意深刻的命令和朗朗上口的名称,如“智译灵”“译通天下”“译智轩”等。

模型型号配置。模型型号是从下拉菜单中选择。目前,ZeLinAI平台支持的模型包括微软-3.5、微软-4、文心一言、讯飞星火、MJ画图、SD画图、DALLE3等大语言模型。不同的大语言模型由于算法的不同对智能体返回的结果会产生不同的效果。用户测试时,可对不同大语言模型的选择进行调试,如智能体返回的结果不理想可以通过更换模型来优化。

角色定位配置。角色定位定义了智能体的角色(提示词),即项目组需要写的 Prompt。Prompt是智能体的重中之重,务必准确定义,才能有符合项目组需求的输出。项目组在“翻译小助手”中定义的Prompt如图2所示。通常,这个步骤需要反复迭代。如果智能体返回的结果不理想,那么可以通过不断反复迭代优化定义的Prompt来实现更符合需求的输出。

图2 翻译小助手定义的提示词

智能体测试。完成“智能体名称”“模型型号”和“角色定位”的配置后,点击“确认”,完成“翻译小助手”智能体的创建。在窗体右下侧输入栏输入需要翻译的内容,智能体可以按照输入内容进行翻译和情感分析,如图3所示。

图3 翻译小助手智能体测试

2.2.2 优化提示词

项目组对翻译AI智能体的提示词进行了结构化的优化。结构化的提示词有各种各样的模板。项目组选择了知名的 CRISPE 框架。CRISPE框架强调了迭代的过程,每个步骤都为下一步骤打下基础,有助于系统地探索和利用模型的潜在能力。优化后的翻译AI智能体从角色的主要工作任务、角色的工作背景、角色在互动中必须遵循的限制条件、角色的主要目标、角色的主要技能、角色的语气风格、符合角色身份的价值观、角色的工作流程结构化等多个方面进行递归定义[3],如图4所示。

图4 优化后的提示词

2.2.3 引入训练集

为了使智能体更加匹配项目组自身的业务,本研究还需要引入训练集,通过精准的投喂训练集,将智能体和训练集关联起来,提升翻译AI智能体的准确性和流畅性。目前,ZeLinAI平台的训练集支持文本、图片、视频、多媒体库等多种形式。

创建训练集。选择平台左侧列表的“训练”,进入训练窗口。可以创建智能训练集和普通训练集两种训练集。智能训练集支持录入内容的收敛和发散两种训练方式,而普通训练集则是Q&A的问答形式。文本训练直接输入训练的内容。文档训练采用拖拽的形式将需要训练的文档加入训练集。目前,平台支持.txt、.docx、.pdf3种格式的文档。添加训练集后,点击“完成”即可。

创建智能体并关联训练集。创建智能体的步骤与之前创建基础智能体完全一致。本研究需要关注的是新建智能体与训练集的关联。点击添加训练集按钮,在新弹出的窗口中勾选新建的训练集名称,完成后,点击确定,返回新建智能体的状态。点击训练集,此时在“角色定位”框中自动添加训练集,完成了自建训练集与智能体的关联。引入自建训练集的智能体创建完成后,在窗体右下侧输入栏输入需要了解的培训相关的内容,智能体可以按照输入内容进行问题解答。解答的下方标注引用训练集的段落。

3 智能体应用

智能体创建之后,项目组希望把它分享出来给更多的用户使用,需要把创建的智能体打包为AI应用。目前,平台支持创建3种方式的应用:H5应用、API应用、BOT应用。在本次项目中,项目组采用了H5应用的方式。H5应用可以在电脑以及手机端打开直接使用。

创建应用。选择平台左侧列表的“应用”,进入应用窗口后,选择“创建H5应用”,进入H5应用窗口。在此窗口输入应用名称、应用图标、应用介绍和选择智能体4个必填项,完成应用创建。在内容设置栏,选择需要分享的智能体——翻译小助手,实现应用与智能体的关联后,点击“完成并分享”进入分享应用的窗口。

分享应用。分享应用窗口有链接分享、二维码分享和海报分享3种分享方式。手机端扫描海报或二维码可以登录并使用智能体。

4 结语

通过智能体项目的创建和应用,项目组深切感受到智能体项目的关键核心在于提示词。良好的提示词可以让模型正确地理解用户需求并给出符合预期的结果,提示词的质量决定了智能体输出的质量。下一步,项目组一是持续优化提示词,通过多学习、多实践,尽可能地编写语义明确、逻辑清晰、结果合理的提示词,引导大模型的高质量回应;二是引入更多自定义训练集,根据用户的偏好和历史数据来调整翻译风格和词汇选择。翻译AI智能体将更加注重个性化服务,同时将具备更强的适应性,能够在不断变化的语言环境中持续学习和进化。

猜你喜欢

项目组助手文本
CSCO生物统计学专家委员会RWE项目组简介
Association between estradiol levels and clinical outcomes of IVF cycles with single blastocyst embryo transfer
基于数字化平台的项目组管理实践
在808DA上文本显示的改善
基于doc2vec和TF-IDF的相似文本识别
小助手
文本之中·文本之外·文本之上——童话故事《坐井观天》的教学隐喻
灵感助手表彰大会(二)
灵感助手表彰大会(一)
如何快速走进文本