APP下载

互联网技术在海外华文网站研究中的应用

2011-11-26郑文标

关键词:海外华人华文华人

○郑文标

(华侨大学 华侨华人研究院,福建 厦门 361021)

海外华文网站指的是以海外华人为服务对象,以中文为界面的互联网网站。随着全球互联网的日益普及,海外华文网站不断涌现并获得大量网民的访问,为华人的信息交流建立了便捷的平台。只要有华人聚集的地方,就会有针对当地华人的互联网网站,如英国地区的英华园、北美地区的北美华人E网、澳洲地区的喂喂网、泰国地区的泰华网等。这些网站内容主要包括地方新闻、商业资讯及社区论坛等,聚集了当地华人及想要前往当地的准移民,逛网站泡社区已经成为其生活中不可缺少的一部分。另外,华侨华人通过互联网的使用,消除了地区间沟通的障碍,使跨地区甚至全球性的华人交流平台的建立成为可能。社区化、跨国化的海外华文网站搭建起了华人在互联网时代工作生活的崭新环境,对这一环境的跟踪研究,将有助于更好地掌握华人社会的现状及发展趋势。

同时,互联网也为海外华人研究提供了良好的技术条件,以华人互联网为主题的研究正受到研究者越来越多的关注,不少论文探讨了以互联网为工具开展海外华人研究的方法。如新加坡国立图书馆李金生先生的《海外华人研究的新工具:互联网》[1]一文,将海外华文网站分为电子数据库、资讯网站、网站指南导航等三类,探讨传统的研究工具与互联网工具的优缺点。另外,暨南大学发表的华侨华人文献信息资源建设的系列文章,也探讨了互联网在华侨华人研究中的应用,如徐云副教授的论文《网络环境下华侨华人文献信息的开发与共享》[2],提出并尝试运用互联网技术整合全球华侨华人文献信息资源。以华人互联网使用及华文网络媒体为研究对象的论文较少,已发表的论文主要集中在新加坡《联合早报》网站的研究上,如温晔发表的论文《解读联合早报网下的<中国早点>》[3],该文以联合早报网《中国早点》栏目中发表的涉及中国内地的文章为研究对象,分析其叙事角度及言论特质。另外,美国华裔学者李大玖出版的《海外华文网络媒体——跨文化语境》[4],较为系统地介绍和分析了海外华文网站的历史与现状,并探讨了海外华文网站的兴起对全球华文媒体发展的影响。

从已有的研究成果看,运用互联网技术开展华侨华人研究大致有两种类型的方法,一种是结合网络技术开展传统调查研究方法,如电子问卷法、网络远程访谈法、网站内容观察法等。另一种是在线数据分析法[5],是运用网络流量监测系统及浏览跟踪系统,获取网民的行为数据,对网民的网络行为进行统计分析的方法。其中,第一种方法运用较多,运用网络技术对散居在世界各地的华人开展问卷、访谈等,可以提高效率,减少成本,在短期内获得大量跨区域的华人样本数据,并且在自动统计软件配合下,迅速完成标准化的统计分析工作。在线数据分析方法则是基于互联网技术的数字化特点,对华文网站及华人网民行为数据进行收集与分析,相对于通过问卷获得的数据更真实,更容易掌握华人的真实想法和侨情动态。

本文主要介绍运用在线数据开展华侨华人研究的几种方法,并以海外华文网站的研究为例,收集流量排名前60名的华文网站数据,在对这些网站的基本数据进行分析整理的基础上,形成对海外华文网站的现状概述,并探讨运用互联网技术研究华侨华人的方法所面临的问题。

互联网的数字化特征,使数据的收集与分析工作更容易进行,网民在网络上的所有行为,都可以以数字的形式进行跟踪记录。不论是华文网站,还是华人网民,都有大量数据记录存在,这些数据记录对华人动态的研究,具有重要的参考价值。从已使用的在线数据跟踪技术来看,网络数据主要可从三个位置获得:首先是网民所访问的网站,由网站记录网民的访问行为;其次是网民所使用的客户端,包括浏览器或者电脑等终端设备;再次是网民所经常使用的搜索引擎,由搜索引擎记录网民行为数据。按获取数据位置的不同,可以将在线数据分析法分为网站流量监测法、网民行为跟踪法及搜索引擎关键词统计法三种主要方法。

网站流量监测是在网站服务器端安装统计分析软件,对来访网民的网络行为进行监测。通过流量监测可以获得访问者概况及其访问内容的数据,包括访问者的来源地、访问浏览量、访问时长、访问网站的具体内容等。通过安装在华文网站上的流量监测代码,可以获得华人网民的基本数据,并且能对华人网民的行为进行全面的记录和统计,其性质属于非参与式观察,有利于获得可靠的数据。如美国华文网站锦绣中华网(http:∥www.chinapage.com/)在网站上公布了2003年以来统计的网站每月访问数量,其中2009年的页面总访问量达1千7百万,每月的访问量均超过百万。该网站的访问数据还显示,每年的春节所在月,网站的访问量也达到最高,体现了春节期间海外华人对中国文化的浓厚兴趣。

网民行为跟踪法是利用网民安装在浏览器或客户端电脑上的第三方统计软件,对网民的网络访问行为进行跟踪记录。目前不少互联网数据分析公司都运用此类方法开展调研,如Alexa运用网民安装在浏览器上的插件对网民行为数据进行收集统计分析,统计数据公开可查。以下海外华文网站的排名表,即根据Alexa的流量排名获得,可以看到排名前十的华文网站在世界的平均排名为5000名左右,每万人次的访问到达率为4.16,具备较高的影响力。网民行为跟踪法比网站流量监测法的应用范围更广,运用这些数据,可以对不同行业和不同网站进行数据对比分析,因此受到更多的关注。本文第二部分将以Alexa提供的数据,对流量排名前60的华文网站的数据开展分析。

表12010年12月海外华文网站Alexa排名前十名

搜索引擎关键词统计法是百度、谷歌等搜索引擎提供的网民搜索关键词的统计分析,如百度指数、谷歌趋势和热榜等。以谷歌趋势(http:∥www.google.com/trends)为例,通过分析Google全球用户海量搜索行为的记录与统计分析,可以直观地展现人们关注热点的变化。图1显示了2004年至2010年全球网民使用“留园网”作为搜索关键词的变化情况。从图中可以看到创办于2003年的英国华文网站留园网受全球网民关注的逐年变化情况。同时Google Trends提供的数据还显示,关注留园网的网民来自世界各地,新加坡使用留园网作为搜索关键词的网民数量最多,其次为中国,排在前十名的国家和地区依次还有韩国、中国香港地区、新西兰、日本、马来西亚、澳大利亚、俄罗斯和加拿大。

图1 2004年至2010年全球网民以“留园网”作为搜索关键词的变化曲线*资料来源:Google Trends, http:∥www.google.com/trends.

以上三种方法是目前较为常见的几种在线数据分析方法,除此之外,一种基于搜索引擎技术的舆情分析方法也正在受到关注,这种技术对现存的网页页面的数字信息进行收集分类和整理,以形成一个面向侨情的互联网主题信息采集系统[6]95-101。互联网以数字形式存储和运行的特点,使人们以数字的方式获得研究资料成为可能,从而为华人研究提供了新的工具。随着海外华文网站的进一步普及,华人互联网使用的不断深度化,网络研究方法也将成为华人研究的重要方法。

上述三种在线数据方法中,网民行为跟踪法是较受关注的方法,以下以此方法为例,介绍其在华侨华人研究中的具体应用。根据Alexa提供的全球网站的流量数据,对华文网站按流量进行排序,可以获得前60位的海外华文网站排名。在Alexa提供的访问量、访问来源地区、访问人群等详细数据基础上,配合网站的基本状况的数据收集和分析,形成海外华文网站的现状描述。这60个网站是海外华文网站中最主要的网站群,分布于北美、西欧、亚洲及大洋洲的13个国家和地区中,其访问量占据全球网民每日访问量的0.06%,即全球每万次网络访问将有6次到达这些网站。由于全球华文网站的数量成千上万,无法统计这60个网站在全球华文网站中所占的准确份量,但保守估计这60个网站获得的华人访问比例占全部华文网站流量的80%以上。这60个网站在Alexa世界流量排名平均在5万名以内,相对于全球数量达几千万的网站来说,可算具备较高影响力。网站创建的时间以2000年及2000年以后为主,占网站总数的80%,网站提供的信息服务最主要的形式为论坛,其次是本地商务信息,其后依次分别为新闻信息、购物信息、博客服务、移民留学信息以及交友信息。

从60个主要华文网站的分布状况来看,华文网站出现在华人聚集的地区,当地华人聚集的人口密度越高,华文网站的人气越盛。数据显示,60个海外华文网站中,主要为北美及西欧地区华人提供服务的网站数量达38个,所占比例高达63.3%。另外,从各个网站的定位及访问群体的状况来看,60%的网站以所在国的华人为主要服务对象,40%的网站则具有跨国性的区域化及全球化特点,其服务对象超出了国界,以区域性华人甚至全球华人为服务对象。如欧洲华人及留学生之家网站分别设立了东欧、西欧、北欧、南欧等地区分站,用户通过该网站可以获取欧洲华人相关信息,网站促进了欧洲各国家间华人的交往。因此,从华文网站的分布状况来看,海外华文网站具有全球化的特征,便利的网络工具和共同的语言去除了沟通障碍,塑造了遍布全球的华人互联网网络环境。

从网站的类型来看,海外华文网站的形式主要以提供新闻、博客、论坛、本地广告商务服务等综合类网站为主,此类网站占比为56.7%,由海外华文媒体主办的华文网站也占据部分比例,达30%。华文网站中提供网络论坛服务的网站占比达73.3%,大部分论坛都活跃着海外华人网民,表达海外生活的见解和交流意见,形成互动频繁的网络社区。另外,83.3%的网站为海外华人提供了当地化的社区服务,如超级多伦多网为当地华人提供了组团、居家、搬运、理财、法律、保健等全方面服务项目,既获得了商业收益,也方便了当地华人,有助于华人网络社区的形成,并通过组织线下的活动,进一步推动了当地华人社区的成熟。从网站的类型特点来看,网站为华人网民提供全面的信息服务,促进了网民对华文网站的深度使用,网站的便利性造成了网民对网站的依赖性,访问网站成为华人生活中不可缺少的部分,这也决定了这些华文网站能够反映当地华人的现状。

从网站与中国的关系角度来看,网站的访客来源中,主要以海外华人为主,超过一半的网站拥有比例高于90%海外华人访问流量比例,说明了海外华文网站对当地华人的吸引力和影响力。同时,中国大陆地区的网民也占据一定比例,平均占比为29.4%,新加坡联合早报网访客中,更有近90%来自中国大陆,显示了联合早报对中国大陆地区较强的影响力。另外,55%的网站向中国网民提供了留学移民咨询与代理服务,如新西兰天维网专设一个留学移民栏目,设置留学动态与移民资讯等板块,提供了租房、打工、医保、教育等类型的信息,使网民能够一站式地全面获取相关资讯。除此之外,在排名前60的华文网站中,有2个网站总部设在中国大陆,它们分别是服务海归人员的海归论坛、为全球华人提供大陆地区商品代购的商务网站,这些网站扮演着海内外华人信息交流的重要角色。因此,从网站与中国的关系角度看,海外华文网站搭起了大陆与海外华人之间沟通的桥梁,成为全球华人信息交流的重要途径。

总体而言,海外华文网站的兴起与海外华人生活社区的成熟相互推动,共同造就了海外华人共同分享的网络交流平台。通过Alexa提供的网站流量数据,在对网站基本数据的收集分析与整理基础上,可以形成对海外华文网站基本状况的描述,为了解海外华人的生活现状提供了便利。

从已有的研究来看,运用互联网技术开展华侨华人研究,特别是海外华文网站的研究,目前仍处于起步阶段,面临着诸多困难和问题,主要有以下几个方面:

首先是效度问题,即华文网站的访客能否代表华人群体?从目前的网络普及现状来看,不同地区的网络普及率不同,也决定了不同地区华人接触华文网的比率不同。另外,不同网站类型的访客特征不同,如一些以新闻为主的华文网站,其访客年龄偏高,如华夏文摘网的访客中,45岁以上的用户占大多数,而时尚社区类的华文网站则访客年龄偏低,如旅游类网站穷游网的访客中,18-35岁的用户比例超过90%。此外,样本的代表性也受制于网站的流量,相对于流量较小的华文网站,网站的流量监测数据不一定具备代表性,往往只能反映某一地区某一群体的华人信息,难以反映全体华人网民的行为特征。通过电子问卷开展调查也面临回收率较低的问题,难以有效控制样本的分布。可见,开展华文网站的研究,需要对样本进行有效性的甑别,使其更具有代表性。

其次是信度问题,即经过网络获取的信息能否保证准确性?网络发布的信息具有的匿名性和随意性,这与传统媒体不同,传统媒体经过撰稿人、编辑、主编的重重把关,其真实性能够得到其采编及发布机制的保障。网络媒体中尤其是网络论坛,访客可以不经过审核直接发布信息,信息发布者可能有意或无意发布虚假信息,一些未经验证的信息容易得以发布,并经由各网站相互转载,造成虚假信息快速传播,极有可能掩盖事实。数据显示,在排名前60的海外华文网站中,专业性的媒体网站有18个,占比为30%,而提供新闻信息服务的网站比例则是80%,也就是说,有50%的非媒体类的网站提供了新闻信息服务,这些网站通常没有职业的采访人员,新闻来源渠道匮乏,往往不加审核地发布一些具有“轰动效应”的新闻,这些新闻有助于提升点击率,其可靠性却难以保障。因此,对网络获取的信息进行真假鉴别具有必要性,也是开展华文网站研究的一个难题。

除此之外,海外华文网站的研究还面临着一个不确定性的问题,不少网站的主办者为公司甚或个人,网站的兴办与撤销经常带有不可预测性,从排名前60名的网站数据中可看到,有12个网站是2007年之后创办的,这些网站能够在短时间内迅速崛起,相对地,也有部分网站突然消失,在追踪排名前60名的华文网站过程中,有不少在2009年排名较前的网站目前已经彻底无法访问,相关资料无据可查,这些不确定性为持续性的研究带来了些困难。总之,海外华文网站的研究的开展,面临困难也蕴含着价值,机遇总是伴随着挑战,网络时代的来临,为华人研究提供了新的研究对象和方法,而真正获得有价值的研究成果,需要不断的积累和创新。

参考文献:

[1] 李金生.海外华人研究的新工具:互联网[EB/OL]. (2002-01-18)[2009-11-10].http:∥www.lib.nus.edu.sg/chz/chineseoverseas/oc_research_materials.html.

[2] 徐 云.网络环境下华侨华人文献信息的开发与共享[J].学术研究,2003,(11).

[3] 温 晔.解读联合早报网下的《中国早点》[J].东南传播,2009,(11).

[4] 李大玖.海外华文网络媒体——跨文化语境[M].北京:清华大学出版社,2009.

[5] 郑文标.基于在线数据的网络调查研究方法[J].重庆邮电大学学报:社会科学版,2010,(3).

[6] 许 鑫,黄仲清,邓三鸿.互联网侨情信息采集系统设计与实现[J].现代图书情报技术,2010,(7/8).

猜你喜欢

海外华人华文华人
海外华人如何欢度“中国年”?
何为“华人”?
“和而不同”的华文教育
海外华侨华人咏盛典
当前广府籍海外华人统战工作研究
华侨华人庆“国庆”度“中秋”
华文教育中的汉字文化教育
华文智慧教学探索
海外华人寻偶众生相
杭州特产