海洋科技名词规范化与ChatGPT:应用前景、困境和建议
2024-07-04吴进冯劭华张展昝栋
吴进 冯劭华 张展 昝栋
摘 要:海洋科技名词规范化工作对于海洋科学研究具有重要意义。文章通过将海洋科技名词规范化的工作方面与ChatGPT的技术要点进行结合分析,探讨ChatGPT在海洋科技名词规范化工作中的应用前景,探究应用困境,并给出应用建议。
关键词:海洋科技名词规范化 ChatGPT 应用
中图分类号:H083;TP391.1 文献标识码:A
文章编号:1004-4914(2023)06-227-02
一、引言
2022年11月30日,美国OpenAI公司发布了一款聊天机器人程序ChatGPT。ChatGPT作为AIGC人工智能生成内容技术突破式发展的产物,凭借技术优势迅速风靡全球。2023年3月15日,基于GPT-4的最新版ChatGPT正式推出,性能进一步提升。面对高科技发展成果,国家有关部门于2023年7月10日联合发布了《生成式人工智能服务管理暂行办法》[1](以下简称《暂行办法》),《暂行办法》第五条明确指出:“鼓励生成式人工智能技术在各行业、各领域的创新应用,生成积极健康、向上向善的优质内容,探索优化应用场景,构建应用生态体系。”各行业领域积极响应政策号召,纷纷开展学习研究,探讨ChatGPT如何影响自身发展。
按照学科门类进行科技名词的规范化建设和推广,对相关学科的建设发展具有重要意义。科技名词反映着科学研究的成果,且具有很强的时代性特征。近些年,随着经济的发展、科技的进步和研究的开展,海洋科学研究的深度和广度都在不断拓展,相关科技成果不断涌现,出现了大量新的海洋科技名词。习近平总书记强调:“发展海洋经济、海洋科研是推动我们强国战略很重要的一个方面,一定要抓好。”2007年出版发行的《海洋科技名词》(第二版)亟需进行补充修订工作,以适应海洋科学学科建设发展工作,这也是服务海洋强国建设的应有之义。本文旨在探讨海洋科技名词规范化工作应用ChatGPT的前景和困境,并给出应用建议,以期利用科技发展成果赋能海洋科技名词规范化工作,促进科技名词规范化工作在新时代、新征程不断高质量发展。
二、海洋科技名词规范化应用ChatGPT的前景
作为人工智能生成内容技术突破式发展的代表性成果,ChatGPT自身具备诸多技术优点,结合海洋科技名词规范化工作特点进行分析,ChatGPT可在如下两大方面赋能科技名词规范化工作。
(一)ChatGPT赋能海洋科技名词提取
1.协助处理海量文献。“自然科学的成果是概念”[2]“科学认识的成果都是通过制定各种概念来加以总结和概括的。”[2]自2007年《海洋科技名词》(第二版)出版发行以来,海洋科技领域的科学研究迅速发展,大量新技术、新设备和新研究方法不断涌现并被应用于科研过程中,科研成果大量出版发表,其中,海洋科学领域的SCI发文量逐年攀升。科学家、学者通过科学抽象和创造性思维,不断总结形成新的科学理论。海洋科技名词规范化的一项重要基础性工作就是对相关科研论文进行大量收集,根据文献内容提取主要主题词。高质量的海洋科技名词规范化工作需要做好文献的深度阅读工作,文献阅读质量的高低与工作人员的学科知识背景和阅读精细度密切相关。海量的文献与有限的人力之间的矛盾成为科技名词规范化工作无法回避的主要矛盾之一。
ChatGPT作为一款聊天机器人程序,在自然语言处理技术上实现了突破式发展运用,实现了自然语言处理的技术飞跃[3],用户与ChatGPT进行交流时甚至觉察不到正在与机器对话[4]。同时,经过良好预训练的ChatGPT具备优秀的总结生成能力,且GPT-4模型的文字处理能力较GPT-3.5大幅提升,上述两大技术优势可以极大赋能文献阅读工作。工作人员只需将收集好的海洋科技类文献输入ChatGPT,ChatGPT即可对海洋科技领域的专业术语进行识别,并通过学习和分析大量的海洋科技文献,理解海洋科技主题词的使用方式和语境,从而生成并输出相关规范化的主题词信息。
2.ChatGPT赋能多语种文献信息处理。目前OpenAI尚未明确公布ChatGPT掌握的语种数量。但是,通过OpenAI官方网站公开的相关信息可以确认ChatGPT至少掌握了26种语言[5]。高质量的海洋科技文献以SCI收录文献为主,辅之部分中文、德语、法语等其他语种文献。多语种文献的人工处理严重依赖于工作人员的第二语言素养,语言不通的情形下,无法有效提取文献主题词信息。ChatGPT具备的多语种优势可以有效赋能多语种的海洋科技文献处理工作,使海洋科技名词规范化工作无需受制于工作人员的第二语言素养。
(二)ChatGPT赋能海洋科技名词推广宣传
海洋科技名词规范化的一个重要作用是统一学术词汇表达,避免各科研人员使用不同的学术表述,从而利于学术交流。如何做好海洋科技名词的推广宣传工作,确保科研人员了解、掌握并使用规范化的海洋科技名词具有重要的现实意义。ChatGPT可以从两大方面助力海洋科技名词推广宣传工作。一是可以借助ChatGPT生成推广宣传文案。海洋科技名词规范化工作完成后,工作成果不能束之高阁,面向广大科研工作者的推广宣传工作随即成为工作重点。基于高质量预训练的ChatGPT具备出色的文字生成能力,可以帮助相关管理部门生成行之有效、特色鲜明的推广文案,助力海洋科技名词规范化工作成果的宣传推广。二是助力海洋科技名词普及。将规范化的海洋科技名词输入ChatGPT进行针对性训练,可以让ChatGPT掌握最新的海洋科技名词。基于ChatGPT庞大的用户数量,ChatGPT在回答用户海洋科技领域的提问时使用标准有效的主题词进行信息组织输出的过程也是将主题词广泛推广普及的过程。同时,ChatGPT还可以对用户输入的信息进行非标准术语的识别和纠正,从而帮助科研人员避免使用不准确或非标准的术语,这也是将最新的海洋科技名词进行有效宣传推广的途径。
三、海洋科技名词规范化应用ChatGPT的困境
ChatGPT在凭借技术优势赋能海洋科技名词规范化的同时,还因自身存在的技术缺陷给海洋科技名词规范化工作应用ChatGPT带来一定的挑战。
(一)信息安全与保护问题
2023年4月28日,中共中央政治局召开会议,会议提出要重视通用人工智能技术的发展,并防范风险[6]。海洋科技名词规范化工作应用ChatGPT也存在信息安全与保护的风险。相关管理部门将新版海洋科技名词输入ChatGPT后,基于ChatGPT的RLHF人类反馈强化学习训练方式,仍存在用户恶意调试、误导ChatGPT的可能。被误导后的ChatGPT会给海洋科技名词的推广、普及工作带来负面消极影响。应用ChatGPT进行海量文献处理的过程中亦存在不合理提取不特定组织或个人信息,并在后续信息生成过程中被不合理使用的问题。
(二)信息准确性
有学者指出,“人的难题对于人工智能来说很容易,人的简单问题对人工智能来说很难。”莫拉维克悖论在ChatGPT上依然成立[7]。对于1000是否大于1062这样的简单数理逻辑问题,ChatGPT仍会给出错误回答[7]。这一技术缺陷存在投射到海洋科技名词规范化工作中的可能性,造成ChatGPT在生成海洋科技名词时出现错误或不准确的情况。
四、海洋科技名词规范化应用ChatGPT的建议
(一)打造定制化的海洋科技名词规范化ChatGPT
定制化的用于海洋科技名词规范化工作的ChatGPT可以从两方面着手,一是构建海洋科技名词专题语料库。《海洋科技名词》已发行2版,目前已积累了大量标准化的海洋科技主题词,将现有的海洋科技名词汇集成专题训练语料库在技术上是可行的。专业化的语料库可以对大语言模型进行针对性训练。二是进行定制化预训练。定制化预训练需要联手研发企业,各自发挥专长进行训练模型的设计和研发。基于专题语料库和专业预训练的ChatGPT会更加适合处理海洋科技领域的大规模数据和信息,用于生成海洋科技名词时具备更高的可靠性。
(二)结合专家审核,提高海洋科技名词规范化质量
ChatGPT可以提供自动化处理海洋科技信息和生成海洋科技名词功能,将ChatGPT应用到海洋科技名词提取工作中可以显著提高主题词规范化工作效率。但是目前的ChatGPT仍存在一定的技术不足,在处理一些复杂语境,识别用户隐含意图方面,仍存在一定误差和不准确的可能。将专家复审融入海洋科技名词规范化工作体系,可以纠正人工智能的错误,提高海洋科技名词规范化工作质量。
(三)构造合理的监管体系
2023年8月15日之前,我国尚未出台监管人工智能生成内容技术的法律法规,对于人工智能生成内容的监管更多依靠行业自律及参照现行的法律法规规定。8月15日之后,《暂行办法》正式生效,《暂行办法》对生成式人工智能服务提出了分类分级监管的要求,并对提供和使用生成式人工智能服务应遵守的方面给出了五条具体规定。多元化的监管体系除了政策和法规外,还应考虑其他方面:一是开发和使用先进的技术手段和算法监控工具,对人工智能生成内容的过程进行实施跟踪,以及时发现和纠正生成内容中可能存在的问题和错误。二是加强公众教育。《暂行办法》明确鼓励生成式人工智能技术在各行业领域的创新应用,探索优化应用场景,构建应用生态体系。未来生成式人工智能会更加融入生活场景,公众是否具备良好的信息素养成为生成式人工智能能否有效发挥效用的关键。通过多种手段加强公众信息素养,提高公众对人工智能生成内容的判断、评价能力,可以让生成式人工智能技术更好地为人民所用。三是加强合作。企业、行业组织、教育和科研机构、公共文化机构、有关专业机构等应在生成式人工智能风险防范方面开展密切协作,发挥各自优势,将应用风险降到最低。
五、结语
科技浪潮呼啸而至,科学技术是第一生产力。面对新科技发展成果,可取的做法是积极加强研究,深入探讨新技术是否可以融入并赋能各自的业务领域。海洋科技名词规范化作为众多业务领域之一,面对ChatGPT这一生成式人工智能技术最新发展成果,无疑也需要加强融合研究,以期在新时代利用新技术发展成果赋能海洋科技名词规范化工作高质量发展,为中国式现代化新征程上我国海洋科技事业发展贡献力量。
参考文献:
[1] 生成式人工智能服务管理暂行办法.[EB/OL].[2023-8-1].https://www.gov.cn/zhengce/zhengceku/202307/content_6891752.htm.
[2] 吴笃卿.科技名词规范化的重要意义[J].中国科技术语.
[3] 朱光辉,王喜文.ChatGPT的运行模式、关键技术及未来图景[J].新疆师范大学学报(哲学社会科学版),2023,44(04).
[4] 徐继敏,严若冰.论大语言模型材料的证据属性——以ChatGPT和文心一言为例[J].四川师范大学学报(社会科学版)
[5] OPENAI.GPT-4[EB/OL].[2023-8-1].https://openai.com/resea
rch/gpt-4.
[6] 新华社.中共中央政治局召开会议分析研究当前经济形势和经济工作,中共中央总书记习近平主持会议[EB/OL].[2023-8-1].https://www.gov.cn/yaowen/2023-04/28/content_5753652.htm.
[7] ZHOU J, KE P, QIU X, et al. ChatGPT: potential, prospects, and limitations[J].Frontiers of information technology & electronic engineering,2023.
[基金项目:中央高校基本科研业务经费“基于科技论文的海洋科技名词整理与筛选研究”(项目号:202364012)]
(责编:若佳)