APP下载

国际社交媒体中的中国文化形象呈现特征
——基于网络文本的内容挖掘*

2015-11-05

关键词:词频帖子热点

徐 翔

(同济大学艺术与传媒学院,上海201804)

国际社交媒体中的中国文化形象呈现特征
——基于网络文本的内容挖掘*

徐 翔

(同济大学艺术与传媒学院,上海201804)

对国际社交媒体选取若干种具有重要性和典型性的媒体进行抽样,通过网络爬虫和文档预处理软件进行网页采集和字段处理,在社交媒体中采集、过滤、选取具有高传播热度的帖子,结合内容挖掘方法和工具进行词频分析、共现词分析、语义网络分析以及多元统计分析,以考察国际社交媒体热点传播内容中的中国文化形象呈现特征和策略。国际社交媒体的热点内容中对中国文化形象的呈现具有关注历史文化、日常文化等若干共同特点,而不同的社交媒体热点内容也有其不同的侧重,这对我国加强和改进国际社交媒体新语境下的中国文化对外传播也提出着启示和要求。

社交媒体;国际传播;中国文化形象;文化走出去

中国文化“走出去”和国际传播是关系到我国软实力发展和文化强国建设的重要组成部分。国际传播视野中的中国文化形象,是我国国家形象的主要构成部分,也是我国着力推进的战略和政策路径。随着近年来以Twitter、YouTube等社交媒体(socialmedia)在全球范围内的迅猛崛起和纵深推进,国际传播的格局和特征也发生着重大变化和转型,Web2.0式的网络社交媒体在全球传播领域具有着越来越显著的地位和作用。美欧等国所致力的“推特外交”(Twitter Diplomacy)或“You-Tube外交”、西亚北非等地的“社交媒体革命”和“茉莉花革命”、国家之间的社交媒体舆论战、《江南style》和《The Fox》等全球性的文化事件及传播,诸多新的国际政治、社会、文化现象都可见到社交媒体的深刻烙印。全球社交媒体的传播给国家文化战略带来重要冲击,也给中国在全球化、网络化时代背景下的对外文化传播、E外交和国家形象的建构带来新的挑战和契机。

一、研究设计与方法

本研究选取Twitter、YouTube、Tumblr、Google+、Flickr、Reddit等具有代表性和典型性的国际社交媒体作为抽样对象,以其具有高点击量或受众评论、反馈量的“热帖”为样本,研究中国文化形象国际传播效果的构成和呈现特征,并提出对策建议。选取的这些社交媒体在全球都具有居于前列的影响力,并且各自具有特点。Twitter是微博类社交媒体,YouTube是视频类,Tumblr是轻博客类,Google+是近年来迅速崛起的综合性社交网络,Flickr是图片性的网络社交媒体,Reddit则是新闻类的自媒体。根据GlobalWebIndex基于32个国家和地区的17万网民的全球社交网络市场调查报告,就社交平台的渗透率而言,YouTube、Google+、Twitter分别居于第2、3、4位,Tumblr位居第10位,Reddit居于第12位;WeAreSocial发布的《2015数字、社交和移动报告》显示,在不包括即时通讯和聊天工具的社交网络平台中,Google+排第3,Twitter排第5,Tumblr排第6。在2014年8月11日的Alexa全球网站排名数据中,YouTube位列全球第3位,Twitter居第7位,Tumblr居第39位,Reddit居第50位,Flickr居第102位;而在2015年2月21日的Alexa全球网站排名数据中,YouTube、Twitter、Reddit、Tumblr、Flickr依次分别居于第3、8、26、31、127位。总体来看,本研究所选取的媒体都是在全球有重大影响力的网站,在各自的细分领域也具有重要性和典型性。

抽样过程是在上述每种社交媒体的首页以“china”和“culture”为复合关键词搜索帖子,并加以软件辅助的自动采集。所有抽样获得的内容,不包括其中的视频、图像、音频等多媒体内容,只限于文字文本部分。Twitter的首页搜索结果,按最相关顺序排序,得到2014年7月4日至2015年1月11日的推文共计6 699条,按照转推数+收藏数的等权处理和标准化处理,得到转推数和收藏数复合指标居于前400的帖子;YouTube在2015年1月28日被检索,得到的首页检索结果,依据视频被点击观看的次数进行排序,去除重复内容和广告内容后得到643条,根据研究需要取前400条,其中观看次数最多的达到90多万次,最少的达到1 018次;Tumblr的抽样方法是每天晚上11点在首页检索最新更新的帖子并抽取20条,自2014年8月6日至2015年2月5日,为期半年,过滤删除其中的重复帖子后得到1 560条,按照note的人数排序,选出其中最热的前400条帖子;Google+是在首页检索出按时间顺序更新的帖子,得到2011年6月30日到2015年2月5日的内容,删除重复选项后得到4 671条帖子,依据为此帖子点加的人数、评论条数、分享人次三个指标进行等权处理和标准化后,再按传播热度排序,选取居于前400的帖子;Flickr在2015年1月23日进行最热门照片内容的首页检索,得到最热门的帖子3 827条,过滤掉照片说明文字为空的帖子之后,选取观看次数为前400的帖子;Reddit是在2015年1月21日进行首页检索,由系统返回最热门的帖子852条,依据帖子本身的point指标和评论条数做等权、标准化处理,过滤出居于前400的热门帖子。

本研究的抽样所得帖子样本根据分析软件的需要,进行文本预处理,包括把英文的大写字母一律转为小写、中文的繁体字一律转化为简体字,以便于分词和词频统计、内容挖掘等。研究中采取ROSTContentMining软件进行分词处理,用ROST NewsAnalysis Tools进行中英文的词频统计和词语挖掘,用NetDraw进行语义网络分析,用SPSS进行对应分析。其中,在用ROST ContentMining和ROST NewsAnalysis Tools分析时,针对所得的样本内容,构建了中英文词库并设定了中英文过滤词。

二、热点内容的高频词分析

社交媒体传播中出现的高频词体现着传播的重点构成内容。通过对每种媒体400条帖文的抓取和整理,结合ROSTNewsAnalysis Tools软件进行词频统计分析,得出6种全球性的社交媒体各自前50的高频词(见表1,其中加粗体的词是在不同的媒体中重复出现的词)。由于本研究中全部帖文抓取的关键词是china和culture,因此在词频表中,china、chinese、中国和culture、cultural、文化都具有高频词,且缺乏不同媒体之间的差异性,应在所列的词频序列中予以剔除。此外,对一些无明显意义且在不同媒体中都共同出现的高频词予以剔除,包括by,in等介词,i,you,they,we等人称代词,please,because,must,then,while等连词和虚词,以及一些无意义的字符如rt,htm l等,而主要留下名词、形容词、动词等。每种媒体的词频表中去掉自身的网站名称,如Twitter的词频分析中把Twitter关键词去掉,YouTube的词频统计结果中则去掉YouTube,以此类推。在YouTube的词频分析中,电视台、频道等词经查主要用于标注媒体来源,而和中国的文化内容无关,因此予以剔除。在具体分析的文本对象中,Twitter词频分析的对象是推文正文,没有标题;YouTube词频分析的对象包含标题和正文;Tumblr的词频分析中包含标题、正文和标签词;Google+分析的为帖子正文;Flickr为标题和正文;Reddit为标题和正文。通过上述处理,能够更好地考察在国际社交媒体热帖中的中国文化形象呈现特征。

表1 不同社交媒体的前50位高频词

续表

从高频词分析表1中可以看出,各种社交媒体中重复出现也即出现次数大于1次的词(表1中为加粗字体标出的部分),在300个词中占到了153词次,比例达到51%。这些共同的高频词或侧重于历史文化传承,如history,ancient;或关注艺术文化和语言文化,如art,language;或侧重地域和地理文化,例如city,shanghai;或关注社会生活文化,如festival,family,food,life;或涉及国际间的文化视野和文化关系,如world,japan,korea,western。

不同的社交媒体在对中国文化的呈现感知上具有一定程度的差异。Twitter中的文化内容与政治性的关联相对较大,tibet,tibetan,peaceful,propaganda,institutes等词的词频居于前列。YouTube的内容与中国的传统文化关系较大,traditional、中国历史、诗人、music、性文化等词汇具有比较强的历史文化传承特征。Tumblr关注中国的历史文化如dynasty,history,tea和现当代文化如mao,movement等。Google+的热点内容涉及艺术、历史、工艺、语言等多方面,language,history,art,city,pearl,bonsai等都是其关心的高频词。Flickr作为一种图像社交媒体,比其他社交媒体更多地聚焦在景观、城市、风土等方面,temple,buildings,roof,hill,macau,shanghai等词显著地居于前列。Reddit的词中与其他媒体重复出现的词较多,自身也有的高频词较少,其热点内容特征主要反映在时政、国际等方面,japan,ameirica,asian,western,government,war等所占比重较大。

三、热点内容的共现词分析

单个词频如果还不足以充分反映媒体的内容特征的话,那么,二元的共现词则可以更进一步呈现出主要的关注对象和文本内容。在上述分词的基础上,剔除过滤词后,并将china,culture等搜索的主题词包含进来,则得到上述6种媒体的共现词频,按出现的频次高低依次取前50组,详见表2所示。

表2 不同社交媒体的前50组高频共现词

续表

从表2所示的高频共现词来看,Twitter中关于tibet,freetibet等地域政治类的话题依然占据了较大比重,而peaceful,beautiful等修饰词也占有较大比例,beautiful,freetibet,peaceful甚至kill都具有较多的共线性,其政治色彩也相对浓厚。在YouTube中,历史与传统文化占到多数部分,ancinet culture,art chinese,culture traditional等众多共现词组都体现了这一点,对中国文化呈现的正面和积极色彩也较浓,比如culture grat,chinese great这样的共现词组都是高频词组。通过高频共现词的分析可以看出,Tumblr的热点内容中同样也侧重于中国的历史文化呈现,china history,chinesedynasty,art people等诸多共现词都是这方面内容的反映;Tumblr对中国文化的关切还被置于邻国乃至亚洲范围内更大的国际文化关系背景下,因此asian china,asian culture,cultural korea,cultural exchange等具有比其他社交媒体更为显著的呈现。同时,culture red,chinese red,art red等与red相关的共现词在50组中占到了6组,这与中国现当代的红色文化以及文革文化有关。Google+对艺术文化涉及较多,art culture,art chinese,art use,art people等与art相关的高频共现词组在50个中出现了11次。从共现词组来看,Flickr的热点帖文其内容对象侧重于地点和地方文化空间,a-ma temple和妈祖文化是其中突出的重点热词,city,place这样与地点有关的词出现频次也较多。Reddit的热点帖文与纯粹的艺术、文化内容关联度较弱,而与国际关系、国家或政治行为相关的词较多,例如japan japanese,american go等。

四、热点内容的语义网分析

在前文所进行的高频词和共现词频分析的基础上,通过NetDraw软件对ROST得出的共现词VNA文件进行语义网络构建分析,进一步呈现中国文化在国际社交媒体中的传播效果特征。

从图1的Twitter语义网可以看出,围绕china和culture的中心节点,是tibet,freetibet,peaceful,stop,kill,western等构成的子节点群落,体现了在较为复杂的国际国内背景下的文化传播和接受格局。

图1 Twitter语义网络示意图

从图2 YouTube语义网络可以看到,围绕china、chinese、culture、文化、中国这几个核心词汇,是中国历史、art、ancient、history、great等次核心节点,以及music,festival等出现频次较多的词,这与高频共现词的分析结果是吻合的。

图2 YouTube语义网络示意图

结合图3的Tumblr语义网络,我们可以更清楚地看出,Tumblr的热点内容中,除了较为广泛分布的art,dynasty,history,tea等代表的中国历史文化以及asian,korea,exchange等所凸显的国际间文化交流外,red居于一个比较重要的次核心节点地位,而与此相关的有revolution,mao等,从而体现出Tumblr传播效果中对于中国的一些现当代历史文化元素的关切。如何利用和发挥好毛泽东等现代文化要素的作用,仍是一个具有时代性和现实性的问题。

图3 Tumblr语义网络示意图

通过图4 Google+的语义网络图可以看出,art居于中心地位,这是不同于其他几种社交媒体的地方,凸显出Google+的传播效果生成和受众回馈比较重视艺术文化方面的内容。

图4 Google+语义网络示意图

在图5的Flickr语义网络中,ma处于核心节点地位,与其他几种社交媒体显著不同;place,city,building等的相对重要性也体现出Flickr热点传播内容对空间、地方、景观等方面的侧重。

图5 Flickr语义网络示意图

图6 Reddit语义网络

五、关键词与媒体类型的对应分析

结合图6 Reddit语义网络图能看出,Reddit偏向于时政性或行为性较强的词,甚至在前述几种媒体中共同较普遍出现、较具有中心节点地位的art等词,在这里也几乎不具有主要性。总体而言,Reddit较少出现直接与软性文化或历史、艺术相关的词,这也体现出文化传播在软和硬不同层面的内涵与差异。

把前述6种社交媒体所有的样本汇总,去掉过滤词后得到总的词频表,取出现频次排序前50位的关键词,根据它们在不同社交媒体中出现的概率进行加权处理,再把这50个不同的词作为行变量,把媒体来源的差异作为列变量,利用SPSS软件计算不同的关键词和社交媒体的对应分析情况。分析结果如图7所示。

图7 关键词与社交媒体的对应分析图

通过对应分析图7可以看到,各种社交媒体以及各种热词之间存在着一定程度的差异。Google+、Reddit、Tumblr的特征较为接近,主要关涉到american,japanese等国家以及people,history,language等诸多方面,覆盖多数热词范围。Flickr在剩下的其他三种社交媒体中,与上述Google+、Reddit、Tumblr这三种社交媒体差别最为显著,其比较特殊的传播热词包括temple,ma,hall,place,city等词,对空间、地点的文化内容的侧重得到充分凸显。Twitter也与Google+、Reddit、Tumblr有较大的差别,主要体现为与china,culture的高度关联,以及与ancient,western等的关联。YouTube与Google+、Reddit、Tumblr的差别没有Flcikr和Twitter那么显著,但是YouTube对于food的传播热度是其他社交媒体难以比拟的,也较多地涉及中国、western等视野下的文化传播。

六、结 语

在全球社交媒体场域和“公共空间”中,中国文化形象的呈现和传播效果的获得,具有其特定的内容特征。总体而言,多数社交媒体中取得良好传播效果或显著的受众反馈的热点内容,与以下因素呈现出较普遍的关联和共性特征:一是热点传播内容的传统性,也即与中国历史文化、传统、艺术等元素之间具有较紧密的关系,在此比较视野下,现当代文化元素的呈现还需要进一步加强;二是热点传播内容的日常性,这些热帖中关注的多是与百姓、人民生活相关的元素,例如饮食、地方、建筑、节庆等;三是热点传播内容的政治性,多数热帖在一定程度上具有与国际政治和文化意识形态的关联,例如在西方视野乃至萨义德式的“后殖民”文化霸权下对于中国文化的审视甚或“重构”,例如对于中国内部文化问题,如西藏、文革的关注聚焦,例如在国际关系、国内外各种政治势力背景下的中国文化报道和呈现。在这些共同特征之外,不同的社交媒体在其热点传播内容中也呈现出各自的一些倾向与侧重:Twitter的呈现具有较强的时政和国际敏感性,与西藏文化等关联较多,也与西方的文化审视、中外之间的文化关系具有较强关联,这是我国在国家的网络文化安全和网络意识形态安全中需要重视的方面;You-Tube的热点内容传播中,中国的历史文化、传统文化出现较多,涉及到艺术、文学、音乐、社会生活的诸多方面;Tumblr的呈现与中国的现当代文化要素具有较其他几种媒体更为紧密的关联,例如mao,red culture等;Google+的热点内容中,艺术文化具有与其他媒体相比更显著的中心性,政治化、历史化内容则相对较低;Flickr的突出特征是其空间化和地理化的文化呈现,这与它的图像传播的手段是具有内在约束性和吻合性的;Reddit的热帖中纯粹的文化、艺术内容偏于弱化,而更突出文化内容的时政性和国家政治内涵。

根据国际社交媒体热点内容中的中国文化形象呈现特征,针对我国的国际传播战略和国家对外文化战略,提出如下加强全球社交媒体中的国家文化形象传播的对策建议。一是明确重点内容,把中国历史传统文化和艺术文化传播作为体现中国国家文化形象与特质的主要部分,尤其要注意避免从国内主观导向出发而推出一些自认为很有中国特色、但实际缺乏传播热度和认同效果的传统文化符号,在国际受众接受效果的实证基础上加强对“中国文化符号”加以去粗取精的提炼和推广,打造富于力度、适于社交媒体传播的精品内容。二是加强日常传播,注重中国对外文化传播中的生活化和民众化视角,以日常文化形成对精英文化和经典文化的有力平衡,例如对于中国当代文化生活元素、百姓的娱玩器用行的平民化审视和融入,强化中国文化内容、文化价值在国际社会和国际受众中的接受与传播。三是对一些不利的“社交舆论”倾向及时发现、反馈,建立有效的引导和疏导机制,例如对于当前国际社交媒体中在西藏文化、pm2.5和px项目等环保文化上的问题,加强对典型负面舆论的澄清以及正面话语的主动传播,建立良好的国际社交舆论生态。四是注重城市和地方文化的呈现和推广,city以及shanghai等与地方文化相关的词在国际社交媒体中有着较为共同的高热度传播,这一方面要求地方的文化遗产和文化生活、文化魅力在网络社交媒体中得到更丰富立体的海外传播,另一方面也要求从主体机制上加强国际社交媒体的城市化和地方化推进,可以鼓励和探索上海、北京、澳门等重点城市和地区设立“文化北京”、“上海印象”等官方主导下的国际社交媒体账户,与国内文化管理部门、媒体机构、文化机构形成综合联动,加强社交媒体中的互动化传播及其与其他外宣和媒介渠道的整合营销传播。

Characteristics of Chinese Cultural Im age in the Content of G lobal Social Media:Based on the Content M ining of W eb Text

XU Xiang
(College of Communication and Art,Tongji University,Shanghai201804,China)

By sampling of importantand typical global socialmedia,computer-aided crawling and pretreatment of large scale web,this paper filters and selects postswith high level communication in every kind of sampled socialmedia,doesword frequency analysis,co-occurrence word analysis,semantic network analysis and multivariate statistical analysis,to survey the feature and strategy of Chinese culture figured in hotspotof globalsocialmedia.Differentsocialmediahot spot contenthas its different focus,which appeals for our improvementof international cultural communication in global socialmedia.

socialmedia;global communication;Chinese cultural image;culture outgoing

G206.3

A

1673-8268(2015)04-0124-08

10.3969/j.issn.1673-8268.2015.04.021

(编辑:李春英)

2015-03-04

国家社会科学基金项目:中国文化对外社交媒体传播机制研究(13CXW050);上海市促进文化创意产业发展财政扶持资金课题:文化创意产业对提升城市人居环境质量的分析研究(2014020072);同济大学2014人文社会科学青年基金项目:中国城市国际社交媒体传播效果优化研究;北京市哲学社会科学规划项目:首都媒体“社交化”发展研究(13ZHC023)

徐 翔(1983-),男,江西上饶人,副教授,硕士生导师,博士,同济大学新闻与传播学科委员会委员、全球城市文化传播中心研究员,主要从事城市文化、文化传播研究。

猜你喜欢

词频帖子热点
热点
热点
结合热点做演讲
25年来中国修辞研究的关键词词频统计*——基于国家社科与教育部社科课题立项数据
暴力老妈
词频,一部隐秘的历史
以关键词词频法透视《大学图书馆学报》学术研究特色
热点
汉语音节累积词频对同音字听觉词汇表征的激活作用*
高手是这样拍马屁的