语言与国家安全的多维度思考
2018-01-04盛静
盛静
摘 要 十九大后,“国家安全”成为当前研究的热点。语言战略作为维护国家安全的重要组成部分与国家总体安全观不可分割。通过话语理论和以数据库为代表的定量研究之间结合的案例可以看出语言与世界政治研究结合的可操作性,同时也可看出海外对于中国问题的关注点,以及他国是如何针对中国的热点问题,形成和建构中国形象的。以民族志和案例分析为代表的定性研究方法,则有助于分析话语在其在地化过程中对于主体的国家和文化等多种身份认同产生的影响,有助于更深入地挖掘和描摹语言与身份认同之间形成的关系。深度学习和神经元理论下的情绪情感识别的结合,则在语言科技维度延伸了国家安全领域的视角,对未来国家安全事件的预判起到积极的作用。
关键词 语言 国家安全 话语 身份认同 情感识别
一、 引言
自1992年“国家安全”首次出现在党代会上到2017年十九大报告,习近平主席55次提到“安全”,而其中18处是“国家安全”,“国家安全”已逐渐成为当前各种研究的热点。尽管语言并未出现在我国国家总体安全的政治、国土、军事、经济、文化、社会、科技、网络空间、生态、资源及核安全这十一个板块中,但语言是承载安全话题的重要容器,任何安全问题的探讨,都不应脱离对语言的研究。尤其是近年来,随着我国海外利益的拓展和在全球治理、国际事务中的能力和影响力的不断增强,语言文字在与国家安全相关的各种领域,包括政治合作、法律条文签署、企业的海外商务谈判、NGO组织、全球治理等发挥着越来越重要的作用。也正因为语言与不同领域和话题之间的交叉性和跨学科性,语言与国家安全已经在语言的战略和战备资源(李宇明2008;赵蓉晖2017)、语言权力(刘跃进2014)和舆情分析等多个维度有了重要的理论和实践成果,而未来语言与国家安全的研究,还可在现有基础上,继续与多种理论和学科相结合,探寻语言与国家安全之间的可切入点。而本文也将围绕目前语言与国家安全相关的话语、身份认同和情绪情感三个维度,尝试继续在理论和方法论上探究语言与国家安全相结合的可操作性。
二、 语言是世界政治的晴雨表
语言是言语内容的重要容器,是“组成知识的方式、是社会实践、是内化在知识中的个人主体性和权力之间的关系”(Foucault1972)。当语言脱离了其中性的言语内容,体现观念形态,并与权力关系挂钩的时候,Foucault称之为“话语”。“话语”强调,语言不是普遍的客观规律,而是蕴含着现实的、具体的、政治性的特定利益和价值体系,蕴含着多元权力关系的互动、妥协和对抗。(Parker1992; Burr1995; Gee2005; Fairclough1997)话语承载着群体意识,并对标准进行规约。在语言生活中,话语无处不在,彼此依赖而又零散分布。零散的话语无形中建构知识、社会主体、身份和认同形式、社会关系及概念框架。也正因为话语体现着权力及权力之间的博弈,我们才可以透过语言形式来剖析话语及其潜在的权力斗争。这也从理论和方法上为语言与世界政治之间的结合提供了契机。随着话语理论的不同,话语内涵的阐释和方法论也有所不同。Fairclough(1997)将“话语”定义为“社会实践中蕴含的零散事件及諸要素在该事件的情境、机构和社会结构之间的对话关系”,把话语与社会紧密结合,强调了话语实践在构建宏观话语,实现权力关系转化过程中的重大作用。当前,Fairclough的这一定义也与数据库方法紧密结合,成为探究话语与世界政治的重要入口。以下我们将结合Corpus of Contemporary America English(以下简称COCA),即美国当代英语语料库[1]中的相关数据,查找自1990年至2017年美国英语中与中国(China)最为相关的名词,探讨这些语言所建构的话语对中国形象的塑造及其影响。
截至2017年12月,COCA语料库共有56亿词。通过COCA数据库的“collocates”功能,笔者在数据库中查找到自1990年到2017年间与China关系最为紧密的高频词,并按照这些高频词的体裁(口语、小说、杂志、报纸和学术),每5年为一时间段进行排列。同时,笔者还分段提取了每一时间段的高频词与近20年的高频词进行对比。比对过程中删去了Peoples Republic of China, year, years, percent, parts等“中国”的音译及表示量化的名词。总体来讲,以下六组词语体现了美国对于中国相关话题的关注。
第一组是国土安全,即边疆问题,尤其是南海问题。该组词语涵盖了sea, border。其中sea在1990年到2017年的高频词中一直稳居前20位。在2015年到2017年间,该词更是位居首位。与该词相关的句子如下:
(1) He also called Chinas moves in the South China Sea a taking, building islands in international waters. (SPOK: SUNDAY MORNING FUTURES)
(2) With Donald Trump in the White House, a whiff of gunboat diplomacy in the South China Sea and a rush of European elections in 2017... (MAG: MarketWatch)
(3) The sun rises over North Korea and the Yalu river which forms the border between China and North Korea, as seen from Dandong, in Chinas northeast Liaoning province.
第二组是经济问题。与此相关的名词包括: trade, economy, growth, business, market, war, bank, companies, wall (street), markets, exports, currency, manipulator, interests, money, imports, goods, trading, products。值得一提的是,war与trade和economic紧密相关。Currency虽然排在第60位,但该词是2010年到2014年间新出现的词汇,在这一时间段中排名第15位。因为中国常常被称之为currency manipulator(货币操纵者),因此该词与当年排名第76位的manipulator相关。Currency在2015年到2017年间排名第37位。
(4) But guess what, hes threatening a trade war with China.
(5) Who believe that we ought to declare and these are nationalists, economic war against China because of the economic war they have declared against us in terms of what they...
(6) The ‘golden age for business in China is drawing to a close, a recent report by the European Union Chamber.
(7) As a result, the iPhones market share in China reportedly fell from 16% in 2015 to less than 13% in 2016.
(8) 90 percent of North Korean oil imports come from China?
(9) Members of one of the advisory groups urged the president not regard China as a currency manipulator.
这一组词在1990年到2017年间一直高频出现,居于排行榜前20位。可见美国对中国经济的持续关注。自2010年以来,代表金融的词语“货币、银行”都进入了高频词汇,体现了中美两国之间金融战争愈演愈烈。尤其是近五年来,世界经济动力不足,经济和金融成为威胁世界经济安全的最大风险之一。金融领域也可能是未来影响我国国家安全最重要的板块。
第三组是能源问题。与此相关的名词包括oil, energy, imports, exports。
(10) Japan and South Korea will remain completely dependent on oil imports. # China has already surpassed the United States as the largest consumer of energy worldwide, heightening...
(11) Nearly 70 percent of Chinas oil imports come from the Gulf and China is Irans largest trading partner.
该研究结果也吻合翟石磊(2014)所提到的,西方媒体使用中国“‘锁定(locked-in)世界有限资源”“不负责任的能源进口大国”“吞噬全球能源的巨龙”等话语来建构中国不负责任的负面形象。而这些话语又常常与中东石油问题和恐怖主义问题相关联,在国际舆论场域中固化中国负面国家形象,影响中国国家安全。
第四组是中国威胁论。与此相关的词语主要是threat。China threat出现在诸多句子中,成为专有名词。而“中国威胁论”也成为重要的影响中国形象的话语。该词主要出现在2000年到2009年间,直到2010年到2017年间慢慢退出高频行列。
(12) The argument goes, the threat from China is not so imminent, so great, or so multifaceted that it can push.
(13) The fear of a “China threat” to the economic welfare of other economies.
第五组是民主和人权问题。与此相关的词语包括democracy, rights, women, (adopt) children。其中,儿童领养问题(children adoption)与中国关系紧密。
(14) Help improve the human rights situation and pave the way for democracy in China.
(15) Even when it came to the international human rights regime, China attended the necessary meetings and filed the necessary reports on time.
(16) Similarly, 7-year-old children adopted from China scored 101.47 on a combined receptive and expressive language composite on the CELF4.
(17) Most adoptive families do bring their children back to China.
(18) We studied the sexual behaviors of young, unmarried women living in rural China with a special focus on sexual debut, sexual risk-taking behaviors, and reproductive health.
由以上例證不难看出,自20世纪90年代至今,与中国相关的主要话题的变化脉络通过语言得以反映。边疆问题(尤其是南海问题)、经济问题、能源问题、中国威胁论及民主和人权问题等一直是美国关注的焦点。在话语建构方面,中国被称为货币操纵者、巨大的石油输入国。儿童领养和女性地位问题也常成为中国在民主和人权方面负面形象的关键。
三、 “语言安全”的内涵与身份认同
长期以来,在语言与安全结合的过程中,我国通用语言“不因各种内外因素的干扰而发生本质性变异(即保持纯洁性)”,是定义“语言安全”内涵的重要元素。(寇福明2016)然而随着全球化进程中我国逐渐迈向世界舞台中心,以及语言资源观和语言战略观的逐渐兴起,越来越多的研究证明通用语的绝对纯洁性和通用语的语言能力并不能成为判定语言是否安全的标准和表征(Hagood2010)。近年来海外华裔儿童中诸多双语学习的案例说明,尽管他们在海外长大,汉语书写能力有限,但他们仍可能对中华民族产生强烈的认同,这也成为他们之后学习中国文化的动力来源。如Flickr上的一位香港青少年与同伴用英文聊天时,当谈到中国“福”文化时,也会立刻将英文转换为汉字,似乎只有汉字才能更好地展现他对中国文化的理解。(Barton2013)因此,在语言生活中,对于语言或语码转换,方言变体及其后现代语言符号所代表的身份和认同感的探究,是未来“语言安全”概念的重要切入点。
首先,多语言使用是多元身份和认同的展现。尤其是在文化全球化背景下,英语、日语、韩语和其他国家语言以不同的形式在中国人民的生活中起着重要的作用。《世界语言地图》(López2015)显示,在中国,使用较多的几个外语语种分别是: 英语(第一位)、日语和韩语(第二位)、法语和德语(第三位)。随着中国多语言使用情况的复杂化,越来越多的语码转换,已经成为世界家庭的日常。
(19) 父: A quelle heure vas tu venir demain, petit cochon?
子: Après le déjeuner?
父: Quand tu veux. Tu vas rester combie de tempici?
子: Tu es la “home”?
父: Bien sur.
父: Mais parce-que tu vas venir, je veux aller a autre endroit-je te naime pas.
子: Après le dner.
父: Oh speak English, twonk-face! When are you coming and when are we you buggering off again?
子: Thats great! I will arriving there after my luch and backing after the dinner.
……
子: Wow you have good grammar.
父: I think your French is probably better than your English...
父: It couldnt be worse!
子: 那还是说中文吧。
子: 明天见啦老爸~早上不想跟一堆人挤……所以大概十点半左右吧!
父: 你的中文好不了哪儿去。
子: Your Chinese is worse than your Spanish.
子: But better than your Japanese.
子: Ok see your tomorrow.[2]
以上是中国一个世界家庭中,继父和儿子的微信对话。继父是英国人,毕业于英国剑桥,在中国教汉语。儿子是地道的中国人。继父可以说英语、法语、汉语、西班牙语和日语。儿子可以说法语、英语和汉语。父子都会说法语。可以看出,语言学习在他们之间的对话中完全占据次要地位。父子之间使用语码转换更多是在表达对多重语言所代表的多元文化的喜爱。语码转换展现了他们的多重身份和文化认同。
其次,多种语言和语码转换也可能会成为未来我国阶层划分的重要标准。近年来,随着我国中产阶层的崛起,区别于大众文化和精英文化的中間层文化兴起。这种文化虽处于中间层,却依据不同的喜好而聚居成为不同的“言语社区”。正如哈金(2015)所述,我们的生活曾经一度被主流市场上的大企业所主宰,过去人们的很多文化消费习惯被大的商业巨头所控制,我们的品位也无限制地被定义。然而现在情势正在逐渐转变,没有产品可以讨好所有人,中间市场正在陷落,小众群体正在崛起。零散分布的各种小众群体将成为未来市场的购买主力,利基市场,即由小众主宰的市场正在形成。红酒、咖啡、摄影器材、装帧精美的书籍、家具和漫画等都成为这些社区聚居的标准,而他们认同的特定的话语和说法方式,包括其他国家的语言和语言变体,也会成为这些社区和阶层重要的评价指标。
(20) Jennifer.
译为: 简妮福。人名。
Led by beauty。
译为: 由美丽引领。
(21) 。
译为: 相爱吧。
。
译为: 和自己喜欢的人看天亮。
(22) 凤凰院凶真
落とした涙がこう言うよ。こんなにも汚れて醜い世界で出会えた奇跡にありがとう。
译为: 落下的泪水这样说: 在如此肮脏丑陋的世界中还能相遇,感谢奇迹。
以上三个案例来源于三个微信。每个案例的第一条是微信用户名,第二条是个性签名。例(20)来源于一名在华尔街工作多年,又回到中国定居的女士的微信。例(21)来源于一名大学四年级学生,“和自己喜欢的人看天亮”来自韩剧。例(22)来源于一名高三学生。凤凰院凶真是日本动漫中的人物。微信是自我身份和认同展示的最佳平台。在这三个案例中,除了例(20)的用户可以熟练使用英语外,例(21)和例(22)的用户事实上都只能简单地使用韩语和日语。这些签名并不说明他们具有相应的韩语和日语能力,而只是他们使用韩语和日语展现自我、身份和认同的手段。而一定要使用其他国家的语言来作为自己身份的表征,也说明了这几位微信使用者对于这几种语言及其所代表的文化的认同。
四、 语言与情绪情感
语言不仅与话语和身份认同关系紧密,它也是公众观点、情绪和情感的重要表征。在当前網络空间和大数据概念下,言语与文本所承载的观点、情绪和情感,在市场预测、舆情监控和金融预测领域起着极其重要的作用。
EI技术的发展正在帮助机器朝着“移情”能力迈进。通过声音,机器可以识别5种基本情绪,即高兴、悲伤、害怕、愤怒和无感情,准确率为70%—80%。(EI: 语音识别让机器感知你的情绪,2013)声音识别情绪的技术通过对政治人物(例如特朗普)讲话的分析,预测和推断他们的政治决策与倾向,为国家安全提供最有利的语言学指标参照。在美国,美国情报高级研究局所建立的“语言隐喻库”,业已利用各种公开语言信息来洞察不同文化背景的人的思维模式、心理特征和现实行为。随着当前微信、微博等网络平台的广泛使用,以计算的方式,通过语言或文本来判断情绪和情感,是语言应用于国家安全领域的重要途径。
而就学术研究领域方面,笔者通过Google N-gram[3]软件,对public opinions, emotion recognition, sentiment analysis, speech emotion这4个词汇进行搜索,考察当前英文出版的书籍中对于“公众意见(舆情)、情感识别、情绪分析、言语情感”的关注程度,从学术研究角度更好地了解这四个领域的发展速度和状况。
通过以上的Ngrams显示图可以看出,自1800年以来,公共观点(舆情)一直是众多学术研究关注的焦点。相较而言,情绪识别研究始于1970年前后,至今已有了长足的发展。而情感分析,尤其是言语情感分析,尚处于起步阶段。
即便如此,近年来随着深度学习和神经网络技术的不断发展,言语中的情感识别功能已经非常精准。Papakostas等(2017)基于三组不同数据库的语言对两种不同的神经元网络SVM和CNN进行了实验。其中,EMOVO数据库包括6个说意大利语的演员演示的14个句子,情绪展现为“厌恶、害怕、愤怒、高兴、惊讶和悲伤”。SAVEES数据库是更大的数据库,除了EMOVO中的数据,还包含4个英语男性说话者用EMOVO中的情绪说出的15个TIMIT数据库中的句子[4]。EMODB是德语数据库,包括5位男性和5位女性言语说的493句话,包含有“愤怒、无聊、厌恶、恐惧、幸福、悲伤和中性”。尽管神经元网络CNN的表现不够出色,两个数据库在多语言处理方面也存在着挑战,但神经元网络SVM可以在EMOVO数据库中达到45%的准确率,在EMODB数据库中达到80%的准确率。此外,斯坦福大学发明的深度学习的新算法NaSent(Neural Analysis of Sentiment)可以将准确率提高到85%(Hernandez2013)。通过情感识别情绪是复杂而艰巨的工程,该技术在多语言情感识别过程中仍然有很长的路要走,然而该项技术的进步和发展无疑可以在判定说话人的思维模式,从而快速有效地对国际局势进行预判,维护国家安全方面起到重要的作用。
五、 结语与启示
自十九大以来,“国家安全”成为国家战略的重中之重。而语言战略是国家安全的重要支撑。语言和国家安全的结合,可以在理论和方法论层面多维度地展开。
首先,话语、语言与政治的结合能够有效地拓展国家安全研究的理论空间。尽管语言和政治的理论结合早已在西方展开,然而其在中国本土化的理论实践尚处于探索和起步阶段。理论的整理和整合呼唤实证研究,并呼唤能够实现理论深化的研究结果。从话语分析的研究方法来讲,以量化为基础的语料库的建设和开发有助于通过语言了解其他国家对于我国问题的关注点,探究他国如何通过话语建构和塑造我国的国家形象。而目前以定性研究为基础的会话分析和民族学方法论也在该领域中流行开来。
其次,语言与身份认同,尤其是国家认同和身份认同之间的结合也是未来语言与国家安全结合的重要维度,是话语分析的重要延伸。话语层面的语言建构固然重要,然而“人”才是话语的接收者,话语也只有通过人才能产生作用与影响。因此,Gee(2005)把话语与认同紧密结合,把话语定义为“某个特定时间、地点和情境下,通过文本、言语、图像和行为表达出来的主体、态度和价值”。从这个意义上讲,在更为细致的旅游、商业谈判、政治协商等不同的社会情境中,在多重社会范畴中探究话语对于身份认同的形成轨迹的影响,意义重大。在这一维度,以质性研究为基础的民族志研究和案例研究,有助于把研究中的人放置于社会大背景和不同的文化情境中,描摹语言与身份认同感结合的流程,从微观的层面和多元的视角来看不同言语社区中,多种语言符号和变体与其他文化元素间的整合关系。
最后,语言与科技是国家安全的重要组成部分。情感和情绪识别技术,尤其是人工智能带来的深度学习和神经元之间的结合,则可以使研究者通过语言了解到说话人的情感和情绪,通过计算的方式判断语言中体现出来的情绪和情感,根据其特定的国家安全形势进行预判,这也是语言应用于国家安全领域的重要途径。
附 注
[1]美国当代英语语料库是目前最大的免费英语语料库,也是第一个大型的语料平衡的美国英语语料库。口语、小说、流行杂志、报纸和学术性问题在语料库库容中各占20%。该语料库由美国杨百翰大学的Mark Davies教授主持创立,并在2008年正式上线。该语料库每年增加2亿词,每年更新一到两次。美国当代英语语料库被认为是用来观察美国英语当前发展变化的最合适的英语语料库。(周韵2013)
[2]翻译: 父: 明天你几点来,小猪猪?子: 午饭之后?父: 可以呀。准备待多久?子: 你在家吗?父: 当然。父: 但明天,我想去一个别的地方。子: 晚饭之后。父: 说英语吧,笨蛋!你什么时候来?我们什么时候再闲聊?子: 太好了。我晚饭来,饭后走。子: 你的语法很好。父: 我觉得你的法语比你的英语要好。父: 你的英语不能更糟糕了!子: 那还是说中文吧。子: 明天见啦老爸~早上不想跟一堆人挤……所以大概十点半左右吧!父: 你的中文好不了哪儿去。子: 你的汉语比你的西班牙语要差。子: 但比你的日语要好。子: 好的。明天见。
[3]Google Books Ngrams是对Google图书中的文本统计词频的算法。Google Books Ngrams View可以画出输入的任何词或词组的词频统计结果。到2013年4月,已经有超过三千万册书被纳入Google Books。
[4]TIMIT全称The DARPA TIMIT Acoustic-Phonetic Continuous Speech Corpus,是由德州仪器(TI)、麻省理工学院(MIT)和斯坦福研究院(SRI)合作构建的声学音素连续语音语料库。TIMIT数据集的语音采样频率为16kHz,一共包含6300个句子,由来自美国八个主要方言地区的630个人每人说出给定的10个句子,所有的句子都在音素级别(phone level)上进行了手动分割、标记。70%的说话人是男性,大多数说话者是成年白人。
参考文献
1. 寇福明.语言安全界定之批判思考.外语学刊,2016(5): 74-77.
2. 李宇明.语言与国家安全——从美国的国家安全战略谈起,2008.(https:∥wenku.baidu.com/view/70617bd03186bceb19e8bbae.html, 20170810)
3. 刘跃进.为国家安全立学: 国家安全学科的探索历程及若干问题研究.长春: 吉林大学出版社,2014.
4. 翟石磊.国际涉华能源话语与中国话语体系构建.对外传播.2014(1): 45-47.
5. 詹姆斯·哈金.小众行为学: 为什么主流的不再受市场喜爱.北京: 北京时代华文书局出版社,2015.
6. 赵蓉晖.语言社会功能的当代理解.中国社会科学,2017(2): 159-171.
7. 周韵.基于美国当代英语语料库的自主写作模式研究.英语教师,2013,13(7): 57-63.
8. Barton D, Lee C. Language Online: Investigating Digital Texts and Practices. London and New York: Routledge, 2013.
9. Burr V. An Introduction to Social Constructionism. London: Routledge, 1995.
10. Chilton P. Analysing Political Discourse: Theory and Practice. London: Routledge, 2004.
11. EI: 語音识别让机器感知你的情绪,2013. (https:∥www.yicai.com/news/2916026.html, 20170812)
12. Fairclough N. Analysing Discourse: Textual Analysis for Social Research. London: Routledge, 1997.
13. Foucault M. The Archaeology of Knowledge and the Discourse on Language. New York: Pantheon Books,1972.
14. Gee J P. An Introduction to Discourse Analysis: Theory and Method (2nd ed.). New York: Routledge,2005.
15. Hagood M C. Literacies and Identities for All. In Miller S, Kirkland D E. (eds.) Change Matters: Critical Essays on Moving Social Justice Research from Theory to Policy New York: Peter Lang Publishing Inc,2010: 89-95.
16. Hernandez D. These Guys Are Teaching Computers How to Think Like People, 2013. (https:∥www.wired.com/2013/10/nasent-deep-learning/, 20171210)
17. López A L. A World of Languages,2015. (http:∥www.scmp.com/inforgraphics/article/1810040/infographic-world-languages?page=all&comment-sort;=recommended.
18. Parker I, Shotter J. (eds.) Deconstructing Social Psychology, London and New York: Routledge, 1990.
19. Papakostas M, Siantikos G, Giannakopoulos T. et al. Recognizing Emotional States Using Speech Information. GeNeDis, 2017,89(2): 155-164.
20. Wodak R, Meyer M.(eds.) Methods of Critical Discourse Analysis. London: Sage, 2005.