跨境电商产品翻译类比语料库建设与词汇特征研究
——以路跑鞋类目为例
2024-04-24■杨霓
■杨 霓
(福州工商学院,福建 福州 350715)
近年来,跨境电商行业迅猛发展,其中产品文本作为产品相关信息的主要文字媒介,对于“一带一路”发展,中国产品顺利“出海”具有举足轻重的作用。在产品详情页中,翻译精良的产品页文本有助于顺利传达产品信息、建立品牌形象,提升买家购物意愿,进而推动产品转化率的提升。
而值得注意的是,目前国内外关于跨境电商产品文本语料库的构建及翻译研究远远滞后于跨境电商行业的发展,该领域的研究尚处于起步阶段,且使用语料库方式进行相关的研究并不多,已知Liu Jing[1]主持研制了跨境电商运营英语语料库用于探讨英语专业教材的编制,但其研究所建立的语料库仅仅为目的语原创产品文本单语语料库,更多用于教材的编写上,并未将研究焦点聚焦于产品文本翻译研究;杨娟娟[2]通过收集阿里巴巴裙子类目产品标题,自建跨境电商日语裙子类目产品标题语料库,但其语料收集规模较小,同时结论未见定量数据的支撑。笔者的研究旨在能够探索跨境电商类比语料库建设的可行方案,建立一个相较于产品标题,语料收集范围更为扩大的中国卖家产品翻译文本与外国卖家产品原创文本的英语类比语料库,并通过尝试自建亚马逊路跑鞋类目类比语料库,探究亚马逊跨境电商路跑鞋类目翻译词汇在词汇难度、变化程度、具体运用上是否相较于原创文本具有较大的差异?在下文中将从总体词汇和具体词汇两个层面进行假设与量化论证研究。
一、语料库设计与建库
(一)语料库设计
在语料库的设计之初,主要针对了语料来源的跨境平台、语料的类目选择、语料的产品文本来源进行探讨。跨境电商平台众多,各平台的产品详情页面组合不尽相同,为了初步探讨跨境电商产品文本语料库的建立,本研究基于亚马逊平台在跨境电商行业的知名度、专业度、文案的详尽度,选取了此平台美国站作为案例平台。而亚马逊平台产品种类繁多,各类目中每个大类目中还有数个子类目,不同类目的产品文本若是统一归到一个语料库中进行对比,对于具体语言词汇的研究很难达成效果。在参考亚马逊平台大类目的划分后,我主要设计跨境电商产品文本语料库由以下几个大类目子语料库组成:Clothing,Shoes,Jewelry & Watches;Books;Movies,Music & Games;Electronics;Computers;Smart Home;Home, Garden & Tools;Pet Supplies;Food & Grocery;Beauty & Health;Toys, Kids & Baby;Handmade;Sports;Outdoors;Automotive&Industrial;Industrial and Scientific跨境电商产品详情页中分设不同的文本功能区,以亚马逊平台为例,其产品详情页中分为以下几块功能区域:产品标题;短描述/五点描述;长描述;A+页面文字部分。其中,短描述/五点描述的展示位于产品图片右侧,以五个大圆形项目符号为起始,不要求完整的句子,要求能突出产品的五个重要的特性。产品的A+页面以图文形式更加生动形象的展现产品内容,在提升产品转化率中均扮演着重要的作用。故本研究认为语料库的建设应以文本功能区的不同分设几个子语料库。
(二)语料收集与可比性分析
为了初步探讨跨境电商语料库建设的可行性,笔者选取所在省份跨境电商出口较多的路跑鞋品类为案例,同时,鞋类产品名称在英文表达中具有复数性,性别属性等特点,对于该类产品文本词汇特征的研究还能够有效类比到其他具有类似属性的产品。本研究语料来自于亚 马 逊 Clothing,Shoes,Jewelry&Watch〉Woman/Man〉Shoes〉Athletic〉Running〉Road Running 子类目,依据平台中卖家公司地址来确定中外卖家身份,中国卖家主要来自福建省(泉州与莆田等地)、四川省、广东省,外国卖家以美国卖家为准,收集数据如附表1 所示。
附表1 亚马逊路跑鞋类目“中国卖家翻译产品文本”与“美国卖家原创产品文本”语料收集情况
在语料收集过程中,基于本品类中国卖家数量的限制,无法收集到更多语料,造成在总体字符上无法形成对等。但本研究可比性是基于产品详情页条目数量而非字符数,故此角度符合语料可比性要求。
二、词汇特征分析
(一)词汇总体特征分析
按照Baker[3]的解释,简化是指译者在目标语文本中对源语文本的语言信息下意识地进行简化处理的倾向。故笔者提出路跑鞋类目翻译词汇相较于原创英语词汇是否具有“简化”的特征?
为了获知两个语料库的总体词汇特征情况,在语料的选取上将标题、短描述、A+页面文本各子语料库相集合,对中外卖家整体的产品文本进行对比。通过WordSmith 软件分别计算两个语料库的TTR、STTR(计算基数为1000)、平均词长。“类符型符比是衡量语料用词量的因素之一”[4]。从表1 中可知,由于同样条目产品的形符类符值不大一致,故参照STTR 值,从表中可知,中国卖家翻译文本STTR 值为37.01,小于外卖原创文本,由此可见,外国卖家原创产品文本用词更加丰富,同时也能在某些程度证明中译英翻译文本词汇具有“简化”趋势的假设。
表1 中国卖家产品翻译文本与外国卖家产品原创文本总体词汇特征情况
平均词长是指特定文本中所有单词的字母总数与型符总数的比值,词长标准差表明单词长度在平均词长左右浮动的程度。以往的语料库研究显示,平均词长是反映文本文体正式程度和用词难度的重要指标之一[5]。从表中可知,两个语料库平均词长相等,均为5,词长标准差差距并不悬殊,考虑到两语料规模和语料库软件精度的影响,故该数据可能无法证明文本翻译“简化”的假设。
词汇密度同样也是衡量文本词汇难度的另一重要指标,通过使用ClAWS5 对文本进行词性标注,并通过AntConc 软件分别对实词进行检索,得出表2。
表2 中国卖家翻译文本与外国卖家原创文本词汇密度情况
从总体来看,翻译文本词汇密度略微高于英语原创文本,这与翻译“简化”假设不符。其中翻译文本动词使用密度明显高于外卖原创文本,推测“翻译文本在翻译过程中受到汉语侧重动词结构,而英语侧重名词结构”[6]的影响。
(二)具体词汇分析
“对目的语典型词汇的研究可以深入了解源语和目的语之间的转换规律和译者所采用的翻译策略”[7]。基于跨境电商产品文本的特点,覆盖面较广,语料类型丰富的语料库无法进行有效分析,应该以各部分子语料为基础,进行数据分析与探讨,进而为各部分的语言翻译提供参考。
1.产品标题主题词分析
“语料库对比中的主题词指在两语料库中的频数有显著差异的词。”[9]本研究通过在AntConc 软件中以中卖标题子语料库和美卖标题子语料库互为参照语料库和观察语料库的方式得出表3 和表4。
表3 外国卖家产品标题主题词表
表4 中国卖家标题主题词表
从表3 和表4 中可分析得出:内容表达上,中国卖家在产品标题的撰写中趋于对产品的功能与特性进行描述,而美国卖家则更趋向于对产品的品牌和型号进行描写。原因由于中国卖家是自有品牌,大部分品牌知名度不高且品牌内部路跑鞋并无系统的型号标识,故为了搜索流量,更偏向翻译产品的特有功能、特性、使用场景,而在选取美国卖家语料时,所选语料均来自美国热销榜单,除产品名称和性别外,相比于中国卖家标题,更多涉及到的是品牌与型号内容。
2.关于复数名词类商品翻译
语体风格上,从表3 中看到外国卖家标题主题词中排名第一的是商品的单数名称表述Shoe,从而提出假设:在表达鞋类品类词时,翻译词汇是否与原创词汇存在差异?笔者通过索引两个语料库中Shoe 和Shoes 的频数得出表5。
表5 中国卖家标题与外国卖家标题子语料库中鞋类名称情况
注:外国卖家标题中有16 个shoes,均来自ASICS品牌,经调查,虽店铺位置位于美国,但ASICS(亚瑟士)是日本一家跨国运动品牌公司,并非本土英语国家公司;另一个为HOKA ONE ONE 起源法国的公司。
分析表5 得出:对于英语日常生活中通常以复数描述的物品shoes,外国本土卖家偏向于从单个产品的角度去描述,而中国卖家在翻译产品名称时,受英语语法规则的的规训而忽视了不同的文化视角,可以从数据看到,原创文本在描述产品名称时,基本上偏向从双数产品的角度去描述。
3.关于商品同义词的表述
通过观察表4 中国卖家排名第三主题词sneaker,检索得出表6。
表6 中国卖家标题与外国卖家标题子语料库中鞋类同义词sneaker 情况
在商品标题的翻译中,考虑到顾客可能使用到的产品搜索关键词能够为产品带来更多流量,进而提高转化率家可能用到的搜索词。在标题中运动鞋的替代叫法中,中国卖家普遍使用sneakers 来作为路跑鞋的替代产品名称,sneaker 指得是日常穿着的便宜耐穿的鞋子,用法较为日常。而美国卖家则较少使用此词语,一方面可能受语料来源均选自美国大牌运动鞋有关,另一方面也体现了美卖在路跑鞋产品名称使用的正式化程度更高。
4.关于商品性别适用的表述
通过表7 外国卖家标题主题词排名第二的“s”的观察,通过使用AntConc 软件的检索与定位,发现“s”是用于表达产品男女适用性的应用,故可表明翻译文本在路跑鞋男女适用性的词汇表达上与原创文本存在差异。通过检索可能使用到的产品男女适用性情况,得出表8,通过数据对比,发现英语原创文本表达路跑鞋产品适用性别特征中,极大程度都偏向于使用男女复数名词加上's所有格形式来反映路跑鞋产品的性别所属关系。其中,womens/mens 显然为错误文字表达,值得注意的是,翻译文本有近三分之一频率出现此类错误表达,数量之多,不容小觑。而看到英语原创文本标题中也出现少数类似错误,经查发现出现此类错误2 处来自品牌名为HOKA ONE ONE 的运动鞋品牌,该公司虽然总部设立于美国,但起源于法国的一家运动鞋设计与销售企业。另一处可能为标题编辑错误;另外根据表4 发现外国卖家主题词中排序10 中出现Neutral(中性)一词,经检索发现均来自美国本土品牌Brooks,除了反映品牌的产品线之外,也能从侧面反映美国文化中去性别差异化的一面。
表7 中国卖家标题与外国卖家标题中男女所有格情况
表8 翻译标题语料库中for 搭配情况
虽然产品标题描述并不属于真正意义上的句子,但是标题除了具有搜索功能性外,还具有产品信息性,方便顾客直观获取商品信息。这就要求标题中词语间的搭配在逻辑上需具有可读性。“词簇指的是在语料文本中反复出现的两词或两词以上结构。”[9]根据表4 中排名13的虚词for 提出假设:在翻译文本中for 的使用与原创文本具有差异的原因可能是翻译文本中使用for 用于适用性方面的表述。
以中国卖家翻译主题词中排名第13 的虚词for 为中心词,使用AntConc 软件的Cluster 功能,词簇长度为2到3 词,最低频数为2 次,搜索词位置位于左边,得出表9:
同样的条件对于外国卖家标题并无得出任何数据,分析得出:相比外国卖家,中国卖家使用介词for 来表达路跑鞋所适用的性别和用途,而非都将其放在产品词前作为修饰语。
三、结语
本文初步探讨了跨境电商产品文本语料库的设计与建设,通过自建小型路跑鞋类目类比语料库,本研究探讨了中国卖家翻译文本与外国卖家原创文本的词汇特征分析,并得出以下的词汇特征结论。
在总体词汇特征的数据中,两个语料库的标准类符型符比,可以在一定程度上证明翻译“简化”的假设。但是也得注意到从平均词长的角度和词汇密度的角度可能无法对假设做出有力的论证。在对翻译“简化”进行论证的同时,研究者需意识到翻译文本的“多样性”与“发展性”。
在具体词汇的对比研究中,建议译者在编译带有复数属性的产品名称时,遵照英语国家思维,从产品单数的角度进行翻译描述;在表达产品的性别适用性时,使用复数名词属格的形式,即women's/men's 对产品名词进行修饰,将更加符合英语国家的表达方式;在文本同义词的选择上,注意将产品与同类型、同定位的产品进行对照,防止同义词中隐含的负面含义对销售造成影响。
通过语料库分析的方式探讨翻译文本和原创文本的使用情况,对于跨境电商行业从业者以及相关领域的教学以及教材编撰具有一定指导性作用。跨境电商大型语料库的建设需要大量的人力、物力,且该行业中标题等内容会随着市场的变化而发生改变,故语料库在建设过程中应不断更新调整。