APP下载

电动汽车国际标准汉英平行语料库构建研究

2021-07-12栾亚玟马杨倩

探索科学(学术版) 2021年3期
关键词:国际标准语料国家标准

栾亚玟 马杨倩

南京工程学院 江苏 南京211167

引言

自2017年,全球电动汽车市场方兴未艾,电动汽车(EV)销量首次突破100万台,2021年可能成为一个持久的电动未来的开端。去年,财富建立在化石燃料基础上的挪威成为全球首个电动汽车销量超过汽柴油及混合动力汽车的国家;中国也一马当先,2020年中国市场新能源车销量超过125万辆,占全球市场约40%左右。在全球清洁能源科技,以及人工智能的发展带动下,再加之政府所出台的一系列相关支持政策的刺激下,电动汽车乃是大势所趋。

在新电动汽车的国际贸易蓬勃发展之际,有关新能源电动汽车领域信息呈爆炸性增长,这也意味着出现大量新的领域术语,电动汽车相关语料库正逐步完善。权威性电动汽车安全标准相关文件具有实用性和时效性,是体现科技信息价值的载体之一,并且文件的更新也体现了电动汽车产业的革新发展趋势。进出口商品的安全标准要求准确性、严谨性,但汽车电动车法规标准的翻译这一方面,相关语料库还极不成熟,主要表现为各大车企翻译版本众多,术语不一致,从而容易造成各地信息不对等,业务上容易出现经济损失问题等等。我们研究的电动汽车国际标准汉英平行语料库,能使欧盟电动车安全标准相关合规人员与译者的工作更加便捷、规范,促使安全标准语料库的研究与发展;为国内外新能源汽车标准化建设提供参考,提升行业整体安全水平;同时也能帮助国内众多电动汽车企业更好了解欧盟规则,进而更熟悉国外市场,进军海外。(张亚梅2018)

1 电动汽车平行语料库现状

1.1 语料库以及计算机辅助翻译目前的发展情况

我国语料库研究始于20世纪70年代末。尽管起步较晚,但发展速度很快。平行语料库研究是近年来语料库横向发展的大热门,但我国目前尚无专门以电动汽车安全标准为基础建立的平行语料库,汽车行业内的相关语料库也没有完整的体系。

1.2 目前电动汽车语料库存在的问题

2020年5月,我国电动汽车领域的首批强制性标准国家标准发布。这3项强制性国家标准的出台,为新能源电动车划定了安全线,可以更好地保障消费者的权益。关于电动汽车安全标准的制定有如下几个特征:

第一,国行标的制定周期相对很长,程序复杂。国家标准、行业标准从制定到发布,需要2—3年,甚至更长时间。

第二,制定标准要拿捏好保障电动汽车安全的平衡点。既要发挥引领作用,又要避免阻碍技术发展、造成不必要的浪费。各国鼓励国家标准、行业标准、团体标准以及企业标准建设百花齐放,在安全国家标准这一基本准入门槛基础之上,各企业被给予充分的自主权。

第三,许多国家及地区在标准化建设上都存在滞后问题。在新兴产业电动汽车的标准化建设上,由于没有新的实践成果,难以制定出更高要求的安全标准。(卢奇秀2020)

以上三点特征也意味着,与电动汽车安全标准等具体方面的规定有关的研究少、更新慢,针对电动汽车安全标准等具体方面的研究更是屈指可数,进而导致了电动汽车平行语料库存在一定的滞后性,更无法基于文本以构建时效性的语料库。如此,构建出一套覆盖性广且实时性强的电动汽车国际标准语料库是十分必要的。

2 电动汽车国际标准英汉语料库的构建

2.1 语料采集

构建语料库第一步是采集语料。国内外电动汽车安全相关标准主要有:ISO 标准、欧盟标准、美国标准(SAE标准FMVSS 标准)以及日本工业标准(JIS标准)。(曾庆想2015)

为保证语料的穷尽性,本课题收集了大量权威性电动汽车安全标准相关文件,譬如ECE(欧洲经济委员会汽车法规)、SAE(国际自动机工程师学会)、GB(中国国家标准)等等。采集语料时,项目组将与电动汽车安全标准评估息息相关的性能试验方法文件也纳入了语料库中,同时也参考了由中国国家标准化管理委员会发表的国家标准和相关行业标准,删除内容重复的语料和语料中的图表,并使用SDL Multiter m Extract进行语料自动提取。

2.2 语料整理

扫描识别获得的文本存在各种不合规范的符号、格式等。如果不经过降噪(清洗)会影响后续的使用和检索结果,其中常见错误类型有语料信息缺失冗余,格式、内容错误,逻辑对应错误。针对这些问题,项目组借助计算机软件对文本进行了规范化处理。得益于软件的替换功能,语料中的所有全角字符和半角字符得到了统一,删去多余的空格和全部乱码,语料的行文格式也有了一定的规范。

2.3 语料导出

英文原文与中文译文的句子对齐以一一对应为主,但也允许“一对多”、“多对一”、“多对多”等特殊情况存在。本语料库的语料提取采用“自动提取+人工审查”的方式进行。

各国规定的检查方法、效果的评定及限值要求不尽相同。通过构建完成的语料库,各类技术人员可轻松查阅特定信息,追溯文件来源,但更加直观清晰的比较各地区不同的电动汽车安全标准,同时也能够接触吸收其他地区前沿成果。

3 研究过程中出现的问题与对策

本研究基于欧盟电动车国际标准小型英汉语料库的研究,尤其是ECE(欧洲经济委员会汽车法规)-R100的语料研究——1368条语料中出自ECE-R100文件的语料总共有1268 条。但ECE 文件以R1、R2,……,R100,R101,……,R131进行编号,分类细致且覆盖性强,从车辆状况、灯光技术、噪声、乘员保护装置等各个方面制定法规。

所以在本次研究的基础上,可引入英文语料库垂直搜索引擎,通过从互联网中周期性地抓取相关网页并及时动态的更新语料数据,及时更新其修订的内容,并不断扩充基于国际安全标准的不同区域间安全标准,如加入一些国内外主要相关标准,如ISO、JIS、GB、联合国电动汽车安全全球技术法规(UN GTR)等等.与更多地区的电动汽车安全标准接轨。(朱鹏2015)

同时,还可以丰富语料库的检索功能,可借鉴参考ECE分类方式,通过提示用户搜索范围、引导用户分类搜索,从而提高搜索效率。

4 总结

电动汽车国际标准汉英平行语料库的建立,有助于启示国内各行业与术语译名的规范化建设,一定程度上可推动电动汽车的国际化发展。我国目前已经建立起较为完善的新能源汽车标准化体系,通过语料库的不断扩充更新,电动汽车安全系列标准正逐步完善,进一步推动技术进步,让行业整体安全水平得到提升,人民群众的生命和财产安全获得保障。

猜你喜欢

国际标准语料国家标准
国际标准ISO 22992-2:2020正式发布
近期发布的相关国家标准(2019年12月10日)
近期发布的相关国家标准(2019年12月31日)
近期发布的相关国家标准(2020年03月06日)
近期发布的相关国家标准(2020年03月31日)
CTTC中纺标:国际标准诞生记
基于语料调查的“连……都(也)……”出现的语义背景分析
华语电影作为真实语料在翻译教学中的应用
我国参与编制多项光伏逆变器国际标准
《苗防备览》中的湘西语料