基于技术语言标准的高校英文网页特征分析
——以重庆市高校英文网页为例
2019-06-18汪顺玉陈萍胡宇
汪顺玉,陈萍,胡宇
随着国际化进程的加快,英文网站发挥着越来越重要的国际传播作用。高校英文网页如何更有效地在自我形象塑造、招生宣传、国际交流等方面发挥国际传播作用,是一个亟待研究的重要课题。
一、有关研究文献概述
近十年来,国内学者发表了90余篇关于高校网页翻译的相关文献。例如,张新军和杨慧[1]、张珺莹[2]、王菲[3]探索了中国高校英文网页建设问题;路玉[4]、赖小春和刘煜[5]、孙劼和崔洁[6]、游凤艳[7]、井春燕[8]、许蓓和刘韶方[9]、周彦君[10]从翻译理论和翻译技巧视角,分析了河南、湖北、甘肃、辽宁、广东、陕西、江苏、贵州等省部分高校英文网页翻译中存在的问题,运用的解释理论有目的论、顺应论、功能主义3个方面。雷沛华[11]从修辞学视角、任孝瑜[12]从传播学视角审视了高校网页的翻译问题。这些研究为认识和发挥高校英文网页功能,提升英文网页质量提供了有益的理论指导。但是,纵观以往的研究仍然存在一些不足:一是研究大多属于主观印象式的研究,所参考的理论与所列举的材料之间缺少中间元素(具体语境或翻译规范),理论和实践脱节。二是将高校英文网页语言局限在翻译这个领域来进行讨论,限制了研究和解决问题的视角和路径。实际上,英文网页存在的问题不仅仅是翻译问题,还涉及英文网页的功能、目标、内容、设计、写作、用户体验等问题。三是讨论英文网页翻译缺乏具体的标准,如译入语到底该怎么翻译还不明确。四是研究缺乏实证依据。
本研究在介绍欧美关于网页语言相关标准的基础上,提出相关的量化分析框架,对重庆市高校英文网页文本进行量化分析,并以美国两所高校的英文网页文本为对照,指出我国高校英文网页文本在语言特征和内容方面存在的问题。
二、欧美网页的语言标准及分析框架
在欧美国家,网页的设计和内容不仅是一个语言学和翻译学问题,更是一个技术传播问题。相应地,技术传播、技术写作、网页设计、网页可用性分析成为了技术传播专业的主要课程。以用户为中心是第一准则。为了广大英语使用者能够准确而轻松地理解文本信息,欧盟和美国出台了相应的语言标准,规范政府和企业的广告语言,要求其向公民或客户发布的文本要内容清晰、语言简洁、体验轻松。下面简要介绍欧盟的《ASD-STE100 简化技术英语》[13]、美国的《联邦简易英语指南》[14]和《基于研究的网页设计与可用性指南》[15]。
(一)欧盟的《ASD-STE100简化技术英语》
欧盟的《ASD-STE100简化技术英语》又称“简化英语”,原名为“受控语言”,源于欧洲航空工业机械维护手册的一套语言规范。这套语言规范包括一组有限的词汇和写作要求,目的是基于这组词汇和写作要求而产生的技术文档要具有可读性和一致性,并能快速且无歧义地进行文档的多语转换。词汇部分提供了一套词性和词义都确定的词汇;写作部分对语法和风格进行了规定。目前,《ASD-STE100简化技术英语》的最新版本为2017版,其在欧美主要国家的工业界得到了广泛应用,已经成为了使用受控语言开发技术文档的国际标准。
(二)美国的《联邦简易英语指南》
美国政府认为,政府网站面向所有公众,网站内容应该尽可能地直白易懂。美国简易语言行动与信息网络委员会从20世纪90年代就开始起草《联邦简易英语指南》,并进行了不断更新。目前的最新版本是2011发布的,内容正文有5章共112页。其中,第4章包括词汇、句子、段落、清晰写作和其他建议4个方面;第6章为“网页写作”,列出了网页写作的9个标准。总体要求是使用简单易懂的词句,内容更容易查找和理解。该指南对所有联邦政府网站的写作具有约束力。如果使用修辞语言以及法律、商务和技术上的行话,那么,将导致意义模糊和误读,从而失去用户的信任。
(三)美国的《基于研究的网页设计与可用性指南》
《基于研究的网页设计与可用性指南》是由美国健康与人文服务部及美国通用服务局共同编写的,由最初的187条发展到目前的209条,每条指南的背后都有学术研究的依据作为支撑,具有很高的权威性。该指南自2003年问世以来,已被美国政府部门和私立机构以及学界广泛使用,并被翻译成多种外语版本在其他国家使用。
(四)分析原则及框架
以上讨论的语言标准可以概括为如下几个原则:(1)网页设计和写作要以用户为中心。(2)提供用户期待的有用内容。内容是网页最重要的元素,网页提供的内容必须是用户需要的、相关的和恰当的信息。(3)使用简易语言。简易语言对受教育程度低和受教育程度高的网页用户都能够明显提升阅读理解和通过网页信息完成任务的能力。使用高频词汇、简单句式、短段落(每段 6~8行,每行 8~10个单词,每句不超出20个单词)。(4)使用口语语体。使用正式而偏口语风格的语体,多使用用户的语言;代表单位多使用“我们”,向用户讲话多使用“您”“你们”。(5)避免使用专业术语、专有名词、缩略语、文化负载词。这些词汇会增加读者阅读理解的难度。(6)表达事实避免使用无实际意义、夸张宣传的词语。用户阅读网页是需要有用的信息,夸张宣传会降低信息的权威性和可靠性。(7)信息分布使用倒金字塔结构。在提供新信息前,首先提供最重要的信息。(8)长段落分化为短段落,并为每个小段落增加小标题。
基于上述标准和原则,下面从内容适合度、可读性指标、文本复杂度(形符、句子长度、段落数、避免使用词汇)、人称视角、夸张表述、倒金字塔结构、段落信息分布几个方面对所研究的文本进行分析。
三、研究设计
(一)研究问题
本次研究我国高校英文网页文本的问题包括:(1)语言特征指标(形符数、句子数、平均句子长度、平均段落字数、缩写词及专业术语、数字、文化负载词)分别是多少?中美高校英文网页在这方面的差异如何?(2)文本的可读性指标(Gunning Fog指标、Flesh Reading Ease易读性指标、4 000英文词族的文本覆盖面)如何?中美高校英文网页在这方面的差异如何?(3)文本语体风格偏口语还是正式书面语?中美高校英文网页在这方面的差异如何?(4)我国高校英文网页文本讨论了哪些主题类型?
(二)研究材料
本次研究以重庆市高校英文网页中的“学校介绍”为研究文本。在重庆市的高校中,仅13所高校有英文网页,其中一所高校的英文网页打不开,另一所高校的材料不能下载,因此,实际供研究的只有11所高校的英文网页文本。其中,“985”高校一所,(重庆大学,简称“重大”),“211”工程大学一所(西南大学,简称“西大”);二本高校7所,分别是四川外国语大学(简称“川外”)、重庆邮电大学(简称“重邮”)、重庆理工大学(简称“重理”)、重庆师范大学(简称“重师”)、重庆工商大学(简称“重工”)、重庆医科大学(简称“重医”)、重庆交通大学(简称“重交”);三本高校2所,分别是重庆工程学院(简称“工院”)和重庆移通学院(简称“移通”)。作为对照的是美国麻省理工学院(简称“麻工”)和乔治华盛顿大学(简称“乔大”),其英文网页文本下载的时间是2018年12月上旬。
(三)研究工具
文本中的数字、缩略语与专业术语、文化负载词的数据通过人工统计得到,语言特征指标包括形符数、句子数、平均句长、Gunning Fog指标和Flesh Reading Ease易读指标都是利用在线分析平台www.Online-Utility.org进行分析;4 000词族的词汇覆盖面指标通过Paul Nation教授开发的Range软件进行分析;文本风格通过语义挖掘软件Trope进行分析;网页文本主题类型通过文本挖掘软件T-Lab2019pro进行分析。
(四)研究结果与讨论
1.文本语言特征
研究中涉及的几个术语:形符数是指文本的全部单词数;句子数是指文本包括的句子数量;平均段长是指文本每段所包括的平均句子数;数字是指文本中涉及数量的数字。从表1和表2看出,“学校介绍”文本最长的是川外,最短的是重大。重庆市高校英文网页文本的平均形符数是美国高校英文网页文本的平均形符数的3.2倍。平均句长最长的是西大;重庆市高校英文网页文本的平均句长是美国高校英文网页文本平均句长的2.6倍。重庆市高校英文网页文本平均有23个数字,美国高校英文网页文本则没有数字方面的信息。重庆市高校英文网页文本中有大量的缩写词和专业术语,而美国高校英文网页文本中基本没有缩写词和专业术语。
表1 中国高校英文网页文本语言特征描述统计表
表2 美国高校英文网页文本语言特征描述统计表
下面分析几个长句:
例 1:They work hard in various areas, fully utilizing their knowledge in specific areas and contributing to regional and national economic development,foreign exchanges,as well as playing a crucial role in developing the friendship between the Chinese people and the people in other countries and regions.(川外46个单词)
例 2:With the motto of“broad tolerance to produce magnificence,and inheriting the past excellence to open a future”, the university will vigorously carry forward the college spirit of“uniqueness over the Southwest and academy reaching the world”, hold on to the cultivation of moral personality,adhere to the path of connotative development with an open attitude towards educational operation,continually deepen the internationalization of talents cultivation actively strengthen the communication and cooperation with overseas universities,institutes of education and research centers, enhance the internationalization of the teaching staff and solidly promote the degree of internationalization of the university.(西大98个单词)
类似上面的句子比较多,主题不明确,内容晦涩、空洞,句式复杂,使用多重排比或从属结构。这种语言信息不符合网页用户的阅读习惯,读者不易读懂。除了句子复杂、语义晦涩外,重庆市高校英文网页文本中还有大量的专业术语、缩写词和文化负载词汇。
从分析看出,重庆市高校英文网页文本没有把用户需要什么信息、提供的信息能否读懂、阅读体验是否轻松等因素进行认真考虑。文本中的句子长、段落长、专业术语和文化负载词多,这些都是与网络信息传播背景下的信息设计要求和用户体验相违背的。
2.文本可读性指标
本研究主要从3个方面进行文本可读性指标分析:一是Gunning Fog指标。该指标代表在美国理解具体文本需要接受正式教育的年限(从6“容易”到20“难”)。二是被美国学界和政界广泛使用的Flesh Reading Ease指标。这个指标是文本难度水平指标:0~29 表示“非常混淆”、30~49 表示“难”、50~59 表示“比较难”、60~69 表示 “标准”、70~79 表示 “比较容易”、80~89 表示“容易”、90~100 表示“非常容易”。 三是词汇频率和文本覆盖面指标。这个指标运用Paul Nation教授团队研究的基于Range平台的词频和文本覆盖面进行分析。研究表明,如果文本中95.0%的词汇不是新单词,那么就能够理解。
从表3和表4看出,4 000英文词族(约6 000词汇量)占美国高校英文网页文本的93.9%,可以读懂全部信息;而对重庆市高校英文网页而言,4 000英文词族只占84.8%的文本覆盖面,无法读懂全部信息。读懂美国高校英文网页文本平均需要9.3年的教育时间,而读懂重庆市高校英文网页文本则平均需要18.7年的教育时间。
表3 中国高校英文网页文本可读性统计表
表4 美国高校英文网页文本可读性统计表
(1)易读性指标方面。美国高校英文网页文本“比较难”,而重庆市高校英文网页文本则“非常混淆”。
(2)风格方面。运用Trope语义挖掘软件分别对重庆市高校英文网页文本的语料和美国两所高校英文网页文本的语料进行分析,结论是前者属描写型,后者属记叙型。
(3)主题内容方面。由于美国高校英文网页文本太短,不能满足分析软件对文本量的最低要求,因此,内容分析方面只分析重庆市高校英文网页文本。内容分析的目的是探讨高校在英文网页文本中呈现了哪些信息类型。运用T-Lab文本挖掘软件进行主题类型分析,结果如下:
主题1的占比为12.0%,包括“百万”“图书馆”“书”“设备”“元”“价值”“人民币”“教学”“实验室”“建筑”“校园”“医院”等关键词。这些词聚焦于学校的“办学条件”方面。
主题2的占比为19.6%,包括“学院”“基地”“培训”“美国”“英国”“澳大利亚”“德国”“建立”“合作”“孔子”“国家”“地区”“交换”等关键词。这些词聚焦于“交流合作”方面。
主题3的占比为38.0%,包括“本科”“奖学金”“学科”“专业”“硕士”“管理”“经济”“学生”“学院”等关键词。这些词聚焦于“学科办学”方面。
主题4的占比为30.4%,包括“水平”“中心”“省级”“实验室”“研究”“社会”“奖”“优秀”“国际化”“部级”“重点”等关键词。这些词聚焦于“特色属性”方面,主要用于描述“学校办学”的教学属性。
与美国高校英文网页文本的“学校介绍”内容相比,重庆市高校英文网页文本聚焦的主题过多,包括对“办学条件”“办学层次”“国际交流”“各类奖项”的堆砌;而美国高校英文网页文本主要介绍独特的“育人理念”“校园环境”,言简意赅,一目了然。
四、研究结论与建议
通过研究得出如下结论:一是语言特征方面。重庆市高校英文网页文本的字数过多、句子和段落偏长、专业词汇和文化负载词偏多。二是可读性方面。重庆市高校英文网页文本“非常混淆”,4 000英文词族只有84.8%的文本覆盖面,文本太难,可读性很差,平均需要经过18.7年的教育时间才能读懂。三是体裁风格方面。重庆市高校英文网页文本属描写型,美国高校英文网页文本属记叙型,其材料更加有趣、易懂。四是内容聚类方面。重庆市高校英文网页文本聚焦于“办学条件”“交流合作”“学科建设”和“特色属性”4个主题,占比分别为12.0%、19.6%、38.0%和30.4%,内容过多,有不少空洞夸大的描写。
本研究与以往研究存在诸多不同:一是研究所依据的语言标准是欧美对技术英语和网页设计有约束力的规范;二是使用文本量化方法,让数据说话,所得出的结论说服力强;三是首次对重庆市高校英文网页文本进行主题研究,其结论都有实证依据。当然,研究也存在一些不足,主要是对应参考的美国高校英文网页文本的数据偏少。
对今后我国高校英文网页设计和评估提出两点建议:一是设计方面。要明确设置英文网页的目的和目标群体的需求是什么?网页提供的内容是否能满足用户的需要,用户的体验如何?在搞清楚上述问题的基础上,坚持以用户为中心来设计英文网页。二是评估方面。英文网页的评估不单要考虑语言学或者译文的质量问题,还要将它作为产品或者服务来进行评估。评估的侧重点是在技术传播标准下对文本内容的可用性进行分析评价。总之,英文网页的设计与评估不仅是一个文本问题,更是一个技术问题。在我国还没有英文网页设计标准的情况下,可以参考和借鉴欧盟和美国的政府标准和行业标准,从而更好地发挥我国高校英文网页的国际传播功能。