基于生成式人工智能的涉海翻译:优势、挑战与前景
2024-05-15周忠良
摘 要:涉海翻译关涉国家海洋形象的构建和国家海洋话语的全球化传播,是国家对外传播中国海洋文化、中国海洋发展方案,推动“一带一路”倡议的重要手段。ChatGPT作为一种新型生成式人智能,拥有强大的语义解析能力、语境理解能力、知识生成能力和多语言支持能力,因此具有优越的自动翻译性能,应用于涉海翻译具有多方面优势。以ChatGPT为例,研究生成式人工智能在涉海翻译方面的应用,分析其翻译机理、优势、挑战和前景,旨在为国家涉海翻译能力建设提供参考。
关键词:生成式人工智能;ChatGPT;涉海翻译;国家翻译能力
中图分类号:H315.9文献标识码:A文章编号:1672-335X(2024)02-0012-09
DOI:10.16497/j.cnki.1672-335X.202402002
涉海翻译是一切与海洋相关的文本翻译的总称。从内容类型看,其翻译对象包括与海洋相关的政治、经济、文化、法律、外交、国防、科技等领域的文本。从翻译方向看,既指向以域外知识引进为主要目标的译入活动,也指向旨在对外传播中国海洋文化、构建中国海洋强国形象的译出活动。海洋是国家发展的战略空间,党的十八大从国家战略高度提出维护国家海洋权益,建设海洋强国工作部署。习近平总书记在致2019中国海洋经济博览会的贺信中指出,“海洋是高质量发展战略要地。要促进海上互联互通和各领域务实合作,积极发展‘蓝色伙伴关系”。[1]2022年4月,习近平总书记在考察海南时强调:“建设海洋强国是实现中华民族伟大复兴的重大战略任务。”[2]在此背景下,涉海翻译对于国家海洋知识体系的构建、国家海洋文化的全球化传播、中国参与全球海洋治理等,具有重要意义。以美国OpenAI公司开发的语言大模型ChatGPT为代表的生成式人工智能具有强大的交互能力,用户可使用自然语言以对话的形式与ChatGPT进行交互,使之完成自动问答、自动文摘、知识整理、资料收集、聊天对话、多模态信息识别等多种自然语言理解和内容生成任务。这些能力使ChatGPT表现出卓越的翻译能力,作为涉海翻译工具具有广泛的应用前景。有鉴于此,本文以ChatGPT为例,就生成式人工智能应用于涉海翻译的优势、挑战和前景进行分析,以期推动学界关注其对涉海翻译的变革性影响。
一、ChatGPT翻译原理及应用优势
ChatGPT结合编码器-解码器结构和自注意力机制,通过多层堆叠的Transformer单元实现文本翻译任务。ChatGPT拥有强大语言处理和内容生成能力,应用于涉海翻译,较之于人工翻译或传统机器翻译模式具有独特的优势。
(一)ChatGPT翻译原理
ChatGPT是一个基于Transformer架构的语言模型,使用编码器—解码器结构以及自注意力机制实现翻译。在翻译过程中,ChatGPT将待翻译的文本作为输入,经过编码器进行编码,然后将编码后的表示传递给解码器。解码器根据编码的表示生成翻译后的文本。同时,使用注意力机制帮助模型在生成翻译文本时关注输入文本中的关键信息。具体而言,编码器负责将待翻译的文本序列转换为一系列隐藏表示向量。它通过多层的自注意力机制捕捉输入文本中各个词之间的依赖关系和重要信息。自注意力机制可以帮助模型在编码过程中同时考虑输入文本中所有位置的信息,以更好地表示文本语义和结构。解码器接收编码器生成的隐藏表示向量,并根据这些表示逐步生成目标语言的文本序列。解码器同样使用自注意力機制,但在生成过程中还会结合编码器的隐藏表示和目标语言部分已生成的单词来决定下一个单词的生成。在编码器和解码器中,自注意力机制用于计算每个词与其他所有词之间的注意力权重。通过自注意力机制,模型可以根据输入文本中不同词之间的相关性动态调整每个词的表示,从而更好地捕捉文本的上下文信息。在解码阶段,模型通过逐步生成目标语言的文本,并结合注意力机制来输入文本的不同部分进行关注,从而生成连贯且准确的翻译结果。
ChatGPT作为一个通用语言模型颠覆了传统的机器翻译模式,表现为:第一,主要采用无监督预训练方式,不再区分双语数据或者单语数据,也不再区分语言种类,极大降低了数据获取成本,并且可以通过深度学习机制获得面向多语言的翻译能力;第二,其核心模型是单向生成式解码器,实质上就是基于文本前缀预测下一个词语,可利用任何类型的文本数据(包括代码数据等)进行训练,从而能够学习到更加丰富、更加通用的语言知识和模式,因此具有更强的语言和领域泛化能力;第三,无监督学习方式和巨大的上下文窗口使其可以学习到更丰富的上下文信息,从而在翻译时具有更强的上下文理解能力,能够更加准确地翻译含有歧义或复杂结构的句子;第四,表现出更强的理解能力,生成的译文更容易让用户接受,翻译结果更加流畅、更加准确;第五,不再局限于仅接收用户待翻译输入然后输出译文结果,更擅长遵循用户交互意图进行实时修改和更新,实现了更加拟人的翻译过程。
(二)ChatGPT应用于涉海翻译的优势
ChatGPT强大的语义解析能力、语境理解能力、内容生成能力和快速响应能力赋予其卓越的自动翻译功能,应用于涉海翻译具有多方面优势。
1.有助于提高翻译准确性
2020年面世的ChatGPT-3参数量高达1750亿。谷歌开发的Switch Transformer模型的参数量首次超过万亿。[3]北京智源研究院研发的预训练模型“悟道2.0”参数量超过1.75万亿。基于巨量数据的预训练使ChatGPT类的新型生成式人工智能具有优良的内容生成能力、强大的语境析读能力和自我学习能力,拥有丰富的知识面。指令微调机制使ChatGPT能忠实地响应人的指令,类人对齐机制使之能避免输出有害内容和拒绝响应知识范围之外的提示,保证输出的内容符合用户的期望。在翻译过程中,ChatGPT基于自身海量预训练数据,利用深度学习技术,自动学习和理解源语言文本,获取源文本的语义和语法结构,并对上下文进行推断和理解,捕捉语言的复杂性,因此在处理长句子、复杂语境和多义词时表现良好。为验证翻译的准确性,抽取2023年《中华人民共和国和菲律宾共和国联合声明》第十三条内容输入ChatGPT,并指令“将本段翻译成英文”。原文为:
两国元首就南海局势深入坦诚交换意见,强调南海争议不是双边关系的全部,同意妥善管控分歧。双方重申维护及促进地区和平稳定、南海航行和飞越自由的重要性,同意在《南海各方行为宣言》以及《联合国宪章》和1982年《联合国海洋法公约》基础上,以和平方式处理争议。
译文为:The heads of the two countries had a thorough and candid exchange of views on the South China Sea situation, emphasizing that the South China Sea dispute is not the whole of bilateral relations, and agreeing to properly manage differences. The two sides reiterated the importance of maintaining and promoting regional peace and stability, freedom of navigation and overflight in the South China Sea, and agreed to peacefully resolve disputes on the basis of the Declaration on the Conduct of Parties in the South China Sea, the United Nations Charter, and 1982 United Nations Convention on the Law of the Sea.
分析上文可知,译文的语法正确,句法自然,文件标题翻译准确。整体上,译文语言流畅地道,符合英语表达习惯。
2.有助于提高翻译效率
ChatGPT是一个自动化翻译工具,可以快速响应人的翻译需求。在执行涉海翻译任务时,ChatGPT庞大的预训练数据就会自动成为背景性知识库、语料库、术语库、信息库,为生成准确译文提供语言和专业层面的支撑。ChatGPT翻译的底层逻辑主要基于Transformer模型,是一种基于自注意力机制的深度神经网络架构,可快速准确地计算出原文和译文之间的语义对应关系,从而高效地完成翻译任务。与传统人工翻译相比,可极大节省时间和人力成本,提高翻译效率。与百度翻译、有道翻译、谷歌翻译、DeepL等翻译软件相比,ChatGPT的微调机制赋予其更强的交互性,使之能在人的指令提示下调整译文词汇、句法、风格特征,更能适应多样化的涉海翻译场景需求。
3.有助于提升翻译工作体验
ChatGPT以对话形式进行翻译,易于操作,具有极高的用户友好性。译者可直接与ChatGPT交互,输入需要翻译的内容,一键即可获取翻译结果。在这一过程中,译者无需付出太多的知识成本、注意力成本、时间成本。其次,ChatGPT基于大规模预训练模型开展工作,可通过迭代和持续学习不断改进和优化翻译效果。随着时间推移,可从用户反馈和相关数据中获得更多信息,在此基础上自我调整模型参数,帮助译者提升翻译质量。ChatGPT的训练语料涵盖广泛的领域、多种语篇类型和多种语言,因此具有很强的多样性和灵活性。这使得ChatGPT与传统的机器翻译软件或系统相比,拥有更高的泛化能力,可以更好地适应不同语言、文化、专业背景,为译者生成更为准确的翻译结果。此外,ChatGPT表现出很强的可扩展性,可与谷歌、New Bing等搜索引擎集成,还可提供插件服务,以获取最新信息,运行计算,使用第三方服务。例如,基于GPT-4,微软发布了Copilot智能助手,大幅度提升了Office、GitHub等工具的智能水平和服务能力。良好的可拓展性,有利于译者有效整合不同类型的翻译服务工具,改善工作体验。
4.有助于提升国家涉海翻译能力
ChatGPT支持多种语言对之间的互译,包括中、英、法、德、西、阿、日等常用的国际语言,也可进行荷兰语、芬兰语、乌克兰语、蒙古语等小语种的互译。过去十年,国家大力推动“一带一路”倡议。截至2023年8月,中国已同152个国家和32个国际组织签署200余份共建“一带一路”合作文件。[4]“海上丝路”合作共建国家众多,涉及的语言具有多样性,对我国涉海翻译能力提出了新挑战。ChatGPT的多语言翻译功能突破了人工翻译的语种数量局限,有助于我們拓展翻译文本的语言对象,为复语、多语涉海翻译提供助力,提高国家涉海翻译能力。
二、ChatGPT涉海翻译面临的挑战
如前所述,较之于谷歌翻译、DeepL、Trados等翻译软件和翻译平台,以及人工翻译,ChatGPT具有无可比拟的优势,有助于提高涉海翻译质量,提升译者工作体验,提高国家涉海翻译能力,因而在国家涉海翻译领域具有广阔的应用前景。任何事物都有两面性,应注意到,ChatGPT用于涉海翻译也潜藏着风险。
(一)翻译准确性欠缺
ChatGPT翻译具有较高的准确性。语言具有复杂性,不同语言之间的表达方式和习惯用法可能存在差异。这可能导致ChatGPT的翻译结果发生意义偏移或遗漏,影响翻译的准确性。其次,ChatGPT虽具有强大的语境理解能力,但毕竟是机器,语言感知能力、理解能力和逻辑思维能力无法与人相比,也不具备专业译者的能动性,因此在翻译中处理具有多义性的词汇、结构复杂的句子或内涵丰富的语境时,可能忽略或误解一些重要的上下文信息,导致翻译结果不准确或不连贯。第三,语言是文化的一部分,特定的文化背景和语言习惯可能给翻译造成困难。ChatGPT可能无法理解文化异质性因素,也就难以译出文化负载项如典故、谚语或隐喻的原义。此外,ChatGPT翻译的准确性还受制于预训练语料。如果预训练语料没有涵盖特定领域的专业术语和行业特色词汇,翻译时就可能出现术语翻译错误。
为验证涉海术语翻译的准确性,将《中华人民共和国领海及毗邻区法》第二条第二段内容输入ChatGPT进行翻译,原文为:
中华人民共和国的陆地领土包括中华人民共和国大陆及其沿海岛屿、台湾及其包括钓鱼岛在内的附属各岛、澎湖列岛、东沙群岛、西沙群岛、中沙群岛、南沙群岛以及其他一切属于中华人民共和国的岛屿。
译文为:
The land territory of the People′s Republic of China includes the Chinese mainland and its coastal islands, Taiwan and its associated islands including Diaoyu Island, the Pescadores Islands, the Pratas Islands, the Paracel Islands, the Macclesfield Bank, the Spratly Islands, and all other islands belonging to the People′s Republic of China.
分析可得,澎湖列岛、东沙群岛、西沙群岛、中沙群岛、南沙群岛的译文均非中国官方译文,如不经审核加以采用,可能严重损害国家主权利益。
(二)翻译伦理隐患
语言承载社会意识,是社会价值观的反映。ChatGPT大规模利用通用语料作为基底数据训练模型,这些语料不可避免地承载着人类社会的道德观念、规范标准、伦理价值。ChatGPT拥有自主深度学习能力,大量数据通过无监督式深度学习进入训练数据库。“无监督式学习的输入和输出均为未知,使机器拥有更多的自主性,但这种方式极易将数据库推进更深的‘黑箱”,[5](P95)难以规避计算偏见问题。以性别偏见为例,国內有研究表明,ChatGPT在算法层面存在性别歧视倾向。研究者在使用GPT-2进行模型预测时,其算法有70.59%的概率将教师预判为男性,将医生预测为男性的概率也高达64.03%,女性被认为上述职业的概率明显低于男性。[6]国外也有研究发现,使用带有性别偏见的语料训练模型,可能导致训练后的词向量具有性别歧视,例如,man与honorable的语义距离显著地小于woman,woman与submissive的语义距离小于man。性别偏见在机器翻译等自然语言处理任务中也普遍存在。[7]语言模型的偏见问题很大程度上是由训练数据中存在的偏见所导致的。语言模型的数据偏见会对其算法产生影响,容易使算法习得偏见,最终影响其内容生成的决策。在执行翻译任务时,ChatGPT的输出是基于其在训练数据中获得的信息。如果训练数据中存在不当、歧视性或有害性的内容,就可能生成类似的翻译结果。当翻译的内容涉及宗教、种族、性别、文化、政治等敏感问题时,数据偏见会损害用户权益,影响社会和谐和国际关系。在ChatGPT中提问“ChatGPT翻译是否存在偏见”,得到的回答是:
ChatGPT是一种基于大规模训练数据的机器翻译模型,本身并不具有偏见。但是,在训练数据中存在一些文化、社会和语言上的差异,这可能会导致模型产生某种形式的偏见。例如,现有的数据集中可能存在性别或种族方面的偏差,这可能会影响到ChatGPT生成的翻译结果。另外,模型也可能因为语言表达形式的差异,而产生某些误解或误译。此外,由于模型的训练数据取自于互联网或特定领域,对于一些场景的翻译可能缺乏相关知识或背景信息,因而导致一定程度的偏见问题。
可见,ChatGPT自身并不否认翻译偏见发生的可能性。ChatGPT产生于美国,根植于西方的社会文化土壤,其底层语料不可避免地带有西方意识形态烙印而对中国存在政治、文化、价值观偏见。在使用ChatGPT对外翻译中国“海洋强国”“人类海洋命运共同体”“一带一路”倡议等国家涉海核心话语时,要强化政治审核,避免翻译偏见损害国家形象、国家利益。
(三)翻译安全风险
翻译安全研究是“从安全论视角审视翻译、研究翻译,对翻译中的种种现象进行安全剖析;或从翻译研究角度审视安全、研究安全,对安全中的种种现象进行翻译及翻译研究方面的剖析”,[8](P233)关注翻译在国家安全中的作用、地位和影响。ChatGPT作为一种具有高交互性智能化翻译工具,现在已经日益介入翻译行业,表现出广泛的应用前景。经由ChatGPT翻译的内容在国家的对外传播中发挥着越来越重要的作用。在这种语境下,讨论其翻译安全问题十分重要。ChatGPT拥有海量的语言数据并且学会了人类的言说方式,在翻译中不仅可以产生准确的内容,也可能因自身数据、算法、知识、理解力等方面的局限产生偏见性、负面的内容。ChatGPT涉海翻译的安全问题包括翻译内容安全、翻译语言安全、翻译话语安全和翻译数据安全。翻译内容安全指向翻译的准确性,涉及源文本信息、知识、立场、态度、情感等方面内容的忠实表达,衡量的标准为是否忠实地传达了原文意图表达的内容。误译漏译越多,翻译的内容安全性越低。翻译语言安全涉及语言使用规范,衡量的标准就是ChatGPT翻译所用的语言是否对译入社会的语言习惯、规范、标准造成损害。翻译话语安全涉及国家海洋话语翻译的准确性问题。“中国特色海洋话语是经由国家产生、被国家认定、为国家所用、体现国家权威、具有中国本土气质的海洋话语”,是国家海洋治理理念的核心内容。[9](P23)翻译话语安全要求译者准确传达国家海洋话语的内涵,实现国家涉海话语对外传播和国家海洋形象构建目的。如将“一带一路”倡议翻译成“Belt and Road” Strategy,就有违源话语的本真意图,对国家形象造成不利影响。ChatGPT从用户提供的输入数据中获取潜在的个人信息、机构业务信息或国家涉密信息,因此确保用户的隐私信息和数据安全至关重要。《中华人民共和国数据安全法》中第三条将“数据安全”定义为通过采取必要措施,确保数据处于有效保护和合法利用的状态,以及具备保障持续安全状态的能力。涉海翻译数据安全即确保涉海翻译数据得到有效保护和合法利用的能力,包含翻译数据本身的安全和翻译数据防护的安全,防止“翻译数据泄露、滥用、数据异化”,[10](P14-15)危害国家翻译安全。
针对上述问题,可从多方面入手建立涉海翻译质量保障体系,提高国家涉海翻译水平。
可从ChatGPT的运行逻辑切入解决ChatGPT翻译准确性问题。一方面,在ChatGPT预训练数据中注入涉海语料,将有关中国海洋话语的知识、信息、术语、数据等纳入语言模型,使之获得巨量的不同语种、不同内容类型、不同语言风格的涉海文本,增强基底数据的专业性,从而增强ChatGPT涉海专业文本的语义解析、语境识别能力,提高翻译准确性。另一方面,优化模型的反馈机制,设置合理的再训练策略,推动ChatGPT的自我学习机制正向运行,使之能持续改进和优化翻译品质。此外,建立人工涉海翻译质量保障体系,加强译审工作,经由人工的质量管理体系,确保翻译准确性。
采取综合性措施防范ChatGPT翻译伦理风险。一方面,在模型的训练数据上,强化筛选和清洗,避免使用涉及种族、性别、宗教、政治、文化偏见方面的内容,通过“去偏化”,实现基底数据的价值中立。同时,对用户提供的涉译数据进行保密,防止泄露隐私。强化知识产权保护,确保涉译数据的透明、合法使用。构建適当的模型监督机制,开发翻译伦理管理软件、工具,构建生成式人工智能翻译伦理指南,使涉海翻译有规可依。
OpenAI采用6种方法提高ChatGPT的安全性:从预训练数据中去除有害的文本内容,如规模庞大的色情内容等;通过指令微调方法约束模型对不安全问题的回复,避免模型产生有害回答;通过奖励器给模型回复进行偏好评分,并通过强化学习对安全内容加以奖励;通过分类器给模型回复进行基于安全规则的评价;通过人类专家进行对抗测试,不断找出安全薄弱环节,不断迭代加强模型;线上实时检测生成回复的有害性,若意外生成有害回复则提示用户或终止回复。[11](P1666-1667)我们也可借鉴这种思路用于解决涉海翻译安全问题。此外,有必要强化翻译安全研究,探究ChatGPT广泛应用于涉海翻译语境下,翻译内容安全、语言安全、话语安全、数据安全问题的发生机制、典型特征和解决路径,构建系统的涉海翻译安全观,实现观念层面的革新。另一方面,要建立“国家翻译安全审查体系”,[12](P7)从国家安全高度界定涉海翻译的安全问题,形成涉海翻译安全监理机制,提高翻译治理能力和水平。
三、ChatGPT涉海翻译研究前瞻
基于ChatGPT的涉海翻译表现出独特的优势,也面临着各种挑战,有必要从译语、译者、翻译管理和ChatGPT本身切入,强化生成式人工智能语境下的涉海翻译研究,以提升国家涉海翻译能力。
(一)译语特征研究
基于涉海翻译具体场景,采用平行对比方式,系统分析ChatGPT翻译与人工翻译的语言特征。在语法、词汇、语块、句法、篇章、语用、修辞等层面对比二者异同,归纳译语风格特征,分析ChatGPT译语表达的流畅性、地道性、适切性,考察ChatGPT的译语表达能力及其形成机制。翻译语言是翻译研究的重要对象,研究基于ChatGPT的涉海翻译语言特征,对于提升国家涉海翻译水平具有重要意义。
(二)译者行为研究
采用ChatGPT从事涉海翻译,译者需面对的全新工作语境衍生出大量值得研究的课题。例如,在生成式人工智能翻译情景中,译者行为有何特征?译者的翻译认知发生何种变化?译者的翻译伦理与传统翻译模式存在哪些差异?新的翻译模式对译者的知识结构、能力结构提出了什么要求?译者的翻译决策过程与传统翻译模式有何差异?译者对ChatGPT翻译持何种态度,采用ChatGPT翻译的动机是什么?译者是涉海翻译的主要行动者。研究生成式人工智能翻译模式下的译者行为、认知、能力、态度、伦理、心理等,有助于揭示翻译行为的发生过程和机制,助力译者提升涉海翻译能力。
(三)翻译管理研究
生成式人工智能在涉海翻译中的广泛应用,对翻译管理提出了新的挑战。ChatGPT改变了翻译业态和模式,使涉海翻译工作更加依赖语言模型、算法、大数据、人工智能、云技术等。因此,翻译技术管理的重要性日益凸显,其研究议题包括基于生成式人工智能翻译的技术规格、技术标准的研制,翻译工具、平台、数据、资源的开发,翻译质量保障体系的建设,翻译伦理、翻译安全的维护,翻译人才培养体系的改革,翻译产品对外传播体制机制建设,等等。翻译技术管理需要着力做好两个方面的工作,即加强对翻译技术的管理和强化翻译管理的技术,前者强调管理能力,关键在于管理层面的制度化建设,后者注重技术能力,关键在于提升翻译管理的“软技术”和“硬技术”。[13](P59)强化翻译管理研究,有利于提高国家涉海翻译管理水平。
(四)生成式人工智能翻译本体研究
译语特征、译者行为、翻译管理属于外围研究。ChatGPT作为翻译手段和平台,本身蕴含诸多研究议题。
1.ChatGPT翻译能力提升路径研究
语言模型的性能与模型参数量、数据量、训练时长之间存在着一种规律性的关系,即模型的性能随着参数量、数据量、训练时长的指数级增加而呈现出线性提升。因此,要提升ChatGPT的翻译能力,需要进一步增大模型规模,增加训练数据。同时,优化数据结构,提升数据质量,增强数据的专业化特征,提高语言模型翻译的专业适应能力。模型的规模对其知识表示能力、语义解析能力、抽象概念理解能力、内容生成能力有直接影响。现有模型大都以自回归方式生成内容,难以处理连续的、结构化输入,成文本生成的长度受限。因此有必要通过优化模型架构,提升其持续对话和长文本生成能力,进而提升翻译能力。
2.ChatGPT翻译应用场景研究
ChatGPT等新型人工智能拥有强大的语言理解能力、知识求解能力、命题写作能力、翻译能力,这些能力可触发更多的涉海翻译应用需求。基于ChatGPT运行逻辑和工作机制,探索涉海翻译新的应用场景,将成为相关研究的重要议题。例如,(1)翻译信息求解,在涉海翻译过程中,译者遇到专业术语、概念、知识问题时,可通过与ChatGPT的多轮对话,获取相关专业知识,形成专题知识图谱,解决背景知识问题,提高翻译的准确性。微软的Bing搜索已集成ChatGPT能力并进入公测阶段,搜索引擎与生成式人工智能的有机融合,能极大提升译者的翻译信息求解能力。(2)虚拟译审,ChatGPT通过深度学习机制学习了大量领域性知识和通用语言知识,二者的结合使其具有超越人类译者的翻译能力。在涉海翻译过程中,译者通过系列指令可调动ChatGPT利用其多方面能力审校涉海翻译文本的语言、专业问题,充当虚拟译审的角色。(3)翻译资料库建设,利用ChatGPT的内容生产功能,构建涉海翻译的知识库、数据库、案例库、术语库、语料库等,形成专业的翻译资源支撑体系,服务国家涉海翻译能力建设。
3.ChatGPT多模态翻译能力研究
模态是指人类通过感官(如眼睛、耳朵等)跟外部环境(如人、机器、物件、动物等)之间进行互动的方式。用单个感官进行互动的叫单模态,用两个的叫双模态,用三个或以上的叫多模态。[14](P3)多模态语义识解、多模态情感分析、多模态信息处理是当前大数据、大模型、强算法等人工智能研究的热点。微软已提出能够感知语音、语言和视觉信息的多模态大模型Kosmos-1。OpenAI最新发布的GPT-4已经能准确理解图文多模态的输入。多模态翻译关涉不同语言文化背景的声音、图像、文字信息的识别与翻译,对语言模型的算法、架构、数据提出了更高的要求。海洋气象、海洋工程、海洋管理、海洋开发、海洋生态等涉海文本往往具有融文字、声音、图片、视频于一体的多模态特征。开发生成式人工智能的多模态翻译功能是人工智能语言能力研究的前沿性热点。
4.ChatGPT个性化涉译服务
个性化技术在搜索、推荐和对话系统中已经有广泛应用。购物平台搜索引擎可根据用户的搜索历史,推测其购物偏好并推荐商品。Facebook、微信、微博等内容分发平台根据用户的内容消费习惯,构建精准的用户画像,并利用算法推荐机制为用户推送个性化内容。个性化技术突出个体需求和精准服务,体现“以人为本”的原则。生成式AI如ChatGPT目前尚不具备个性化服务能力,仅能在一轮对话内部进行上下文学习。随着个性化技术的更新迭代,未来ChatGPT有能力根据用户使用记录进行建模,准确描绘用户画像,并为用户提供个性化的内容生成服务。对于涉海翻译而言,ChatGPT可基于译者翻译过的文献、检索词、阅读过的材料,形成译者个性化兴趣向量,构建更为准确的译者画像,提供更优质的翻译、信息、知识服务,提高译者工作效率。
5.ChatGPT翻译安全性研究
ChatGPT的内容生成结果受其算法影响。算法不具备人的逻辑能力、理解能力、认知能力,因此不可能保证ChatGPT产出的内容完全准确。ChatGPT内容生产的准确性还受制于其预训练语料的知识范围。当前以ChatGPT为代表的生成式人工智能还存在一些问题,如幻觉生成、信息错误、逻辑冲突、刻板偏见等,表现为“一本正经地胡说八道”。随着ChatGPT在各领域的应用日益广泛,其影响力将越来越大。ChatGPT生成的知识、价值观错误可能引发严重后果。就涉海翻译而言,对国家关键涉海话语的误译和对外传播,容易损害国家海洋文明形象,不利于国家海洋话语权的构建。未来基于生成式人工智能的翻译安全性研究一方面将聚焦翻译知识安全、语言安全、话语安全、文化安全问题,另一方面将更多地关注意识形态安全问题。前者属于显性问题,后者则更为隐蔽。涉海翻译的意识形态安全关涉国家翻译利益,对之进行研究的重要性不言而喻。此外,ChatGPT翻译的语义解析、译本生成过程中的安全保障机制仍存在大量待解“黑箱”,目前还没有令人信服的理论和方法揭示ChatGPT通过什么样的方法保障翻译的安全性,因而其翻译安全保障机理也是一个值得探索的议题。
四、结语
生成式人工智能深度介入涉海翻译给学者带来诸多启示。在涉海翻译实践方面,国家层面应出台相关政策、制度推动基于人工智能技术的涉海翻译能力建设,强化翻译技术创新和应用,同时研制生成式人工智能翻译技术规范和标准,确保技术使用符合规范,保障翻译安全;译者应直面人工智能给翻译行业带来的挑战,主动学习、应用新技术,充分利用新技术带来优势,提升翻译效能,适应新的翻译模式。在涉海翻译研究方面,要重视新技术引发的翻译业态变革,研究生成式人工智能对翻译模式、翻译心理、翻译语言、翻译过程、翻译传播、译者行为等方面的影响,基于涉海翻译的新场景、新需求、新挑战,发现新趋势、新问题,构建新概念、新理论,解决新问题。总之,基于生成式人工智能的涉海翻译作为一个研究领域,蕴含丰富的研究议题,因此有必要整合人工智能、翻译学、语言学、传播学、海洋科学等学科进行深入理论研究。
参考文献:
[1] 秉承互信互助互利原则,让世界各国人民共享海洋经济发展成果[EB].https://baijiahao.baidu.com/s?id=1647497189121418815&wfr=spider&for=pc,2022-10-16/2023-10-29.
[2] 严赋憬,陈炜伟.习近平在海南考察时强调,解放思想开拓创新团结奋斗攻坚克难,加快建设具有世界影响力的中国特色自由贸易港[EB].https://politics.gmw.cn/2022-04-13/content_35657312.htm,2022-4-13/2023-10-29.
[3] Fedus W,Zoph B,Shazeer N.Switch transformers:scaling to trillion parameter models with simple and efficient sparsity[J].2021,ArXiv:2101.03961.
[4] 我國已与152个国家、32个国际组织签署共建“一带一路”合作文件[EB].https://baijiahao.baidu.com/s?id=1766233317036923747&wfr=spider&for=pc,2023-8-24/2023-10-29.
[5] 李昭熠.智能传播数据库偏见成因与规制路径[J].当代传播,2020,(1):93-97.
[6] 邹开亮,刘祖兵.ChatGPT的伦理风险与中国因应制度安排[J].海南大学学报(人文社会科学版),2023,(4):74-84.
[7] Bolukbasi T,Chang K W,Zou J Y,et al.Man is to computer programmer as woman is to homemaker?Debiasingword embeddings.Lee D D et al.(eds).Proceedings of the 30th International Conference on Neural Information Processing Systems[C].NY, United States: Curran Associates Inc.,2016:4356-4364.
[8] 许建忠.翻译安全学·翻译研究·翻译教学[A].发挥社会科学作用促进天津改革发展——天津市社会科学界第十二届学术年会优秀论文集(上)[C].天津:天津市社会科学界联合会,2017.
[9] 周忠良,任东升.基于语料库的中国特色海洋话语译传研究:框架、内容与原则[J].中国海洋大学学报(社会科学版),2022,(4):23-31.
[10] 王华树,刘世界.大数据时代翻译数据伦理研究:概念、问题与建议[J].上海翻译,2022,(2):12-17.
[11] 车万翔,窦志成,冯岩松,等.大模型时代的自然语言处理:挑战、机遇与发展[J].中国科学:信息科学,2023,(9):1645-1687.
[12] 任东升,高玉霞.国家翻译实践学科体系建构研究[J].中国外语,2022,(1):33-42.
[13] 任东升.国家翻译实践工程初探[J].上海翻译,2022,(3):56-60,95.
[14] 顾曰国.多媒体、多模态学习剖析[J].外语电化教学,2007,(2):3-12.
Generative AI-based Ocean-related Translation: Advantages, Challenges and Prospects
Zhou Zhongliang
(College of Foreign Languages, Ocean University of China, Qingdao 266100, China)
Abstract: Ocean-related translation has a great impact on the construction of China's maritime image and international communication of its state maritime discourse. Therefore, translation functions as an important means for China to disseminate its maritime culture and maritime development plan and facilitate the Belt and Road Initiative. As an emerging generative artificial intelligence, ChatGPT has a high semantic parsing, contextual understanding, knowledge generation, and multilingual support capability. Thus, it has superior automatic translation competence and boasts various advantages if applied to ocean-related translation. Taking ChatGPT as an example, the paper studies the application of generative AI in ocean-related translation, analyzes its translation mechanism, advantages, challenges, and prospects, hoping to shed some light on the construction of state ocean-related translation competence.
Key words: generative artificial intelligence; ChatGPT; ocean-related translation; state translation competence
责任编辑:王 晓
收稿日期:2024-01-04
基金項目:2021年度全国翻译专业学位研究生教育指导委员会教育研究项目“《涉海法律英语》教学案例库”(MTIJZW202149)
作者简介:周忠良(1981- ),男,江西上饶人,中国海洋大学外国语学院博士研究生,专业方向为国家翻译实践和国家话语对外传播。