基于内容分析法的网络信息污染演变研究
2016-05-14刘雪艳王在宇袁野
刘雪艳 王在宇 袁野
〔摘 要〕网络信息污染成为网络社会一个不容回避的问题,但目前研究中对这一问题的定性描述,难以让公众形成正确的认知。为了解信息污染的分布和变化趋势,本研究基于内容分析法,以12321互联网不良与垃圾信息举报中心9年间发布的70份报告为分析样本,从网络信息污染的来源、类型和变化趋势等方面进行了比较分析和统计检验。研究结果显示,来自移动终端的恶意手机APP已经成为网络信息污染中的突出矛盾。在此基础上,提出信息污染治理的工作重心应当向移动互联网倾斜等政策建议。
〔关键词〕网络信息污染;内容分析法;方差检验;12321举报中心
DOI:10.3969/j.issn.1008-0821.2016.07.009
〔中图分类号〕G203 〔文献标识码〕A 〔文章编号〕1008-0821(2016)07-0045-06
网络信息技术在带来便利的同时也引发了一系列的负面影响,使得人们在信息消费的过程中也遭受着信息污染的危害。垃圾短信、骚扰电话、垃圾邮件、不良网站、恶意手机应用横行,个人信息泄露事件发生得越来越频繁。12321举报中心发布的《2015年中国网民权益保护调查报告》显示:近一年,我国649亿网民因为垃圾信息、个人信息泄露或网络诈骗等现象,导致平均遭受的经济和时间上的损失分别达到124元和254小时。日益恶劣的信息环境已经在干扰我国居民的正常信息消费活动。
追溯相关文献发现,信息污染一词是随着信息生态学的研究发展而来[1]。信息污染这一概念最早是由德国学者拉斐尔普罗在其1989年发表的论文《信息生态学进展》中首次提出[2]。在随后的研究进程中,国内外学者对信息污染这一研究主题的理解存在一定差异。
国外学者主要研究信息生态环境中的信息过载问题。例如,著名咨询公司的Jakob Nielson博士[3](2003)认为,信息污染是信息过载带来的极端表现,他认为在需要我们决策的事情以外,任何吸引我们注意力的东西都可以称为信息污染。过量的信息如工作环境中的电子邮件、电子通知、即时消息、Tweets、Facebook等推送信息,只会分散人们的精力,导致无法管理信息[4],这已经成为现代社会普遍存在的问题,社交媒体和微博平台上的信息正以超过用户认知能力的速度源源不断地出现。一项针对英国Facebook,Linkedln和Twitter用户的在线调查[5]结果表明,2/3的Twitter用户都觉得自己收到了太多的贴子,超过一半的微博用户认为自己需要一个工具来过滤无关的帖子。在充满信息污染的网络环境中,人们的注意力变得碎片化,造成时间的浪费,这不仅会使得我们不快,甚至会扼杀我们的创造力[6]。国外学者认为信息过载导致人们决策困难。Rodrigue M.& Gummadi K[7](2014)评估了过量的信息对社交媒体网站Twitter的负面影响。Van VL.,Beaujean D J.et al[8](2013)指出应用程序的超载使得医疗人士和公民很难找到合适的健康管理和医疗保健应用,信息和功能过于分散的应用程序,限制了这些应用程序的推广。Kristof C.& Michael A[9](2015)认为在线购物网站上由用户反馈的大量正面或负面信息,已经令营销人员束手无策。
与国外学者的关注重点不同,我国学者一般认为信息污染是指媒介信息中混入的有害、有毒,具有欺骗性和误导性,甚至超过公众道德底线的信息,其危害表现在会对人类精神文明的传播造成破坏和不良影响[10-14],概念范围相较国外学者更广。除对信息污染的定义的理解外,国内学者认为信息污染产生的原因包括[11,15-16]:①信息源的可伪性和发散性;②信息媒介及从业人员的行业自律不良;③信息消费者自身的素质高低不齐。信息污染的表现形式可以分为以下几类[17-19]:①有害和有毒信息,如色情、暴力信息;②冗余和非主动请求信息;③虚假和伪劣信息,如垃圾短信、骚扰电话、恶意APP等。信息污染对社会有其负面影响,曾剑秋等[20]对“端口”类垃圾短信进行分析后,发现广告类垃圾短信数量占比最大,而诈骗、色情等违法短信社会危害最大。
研读已有文献发现,现有文献大多从定性的角度分析信息污染的概念、成因以及危害,鲜有关于信息污染的来源分布的定量研究,公众因此对信息污染缺乏正确的认知。本文基于内容分析法,对12321互联网举报中心发布2008年5月至2016年2月的70份统计报告进行分析,探析我国网络信息污染的来源、类型和变化规律。
1 研究设计
内容分析法产生于第二次世界大战期间,美国情报人员用这种方法从报纸上获取了德国纳粹的大量情报资料[21]。此后,美国学者贝雷尔森等人将这一方法系统化[22],现在已经成为社会科学研究领域被广泛使用的一种方法。
内容分析法可以用于研究任何文献或有记录的交流传播事件,如某个特定话题、焦点事件、某份特定报纸或一系列报纸[23],这一方法为信息分析工作提供了一套可靠的方法和工具。内容分析法一般需遵循以下几个步骤[24]:(1)提出研究问题或假设;(2)抽取研究样本;(3)选择分析单元;(4)建立分析类目;(5)定量处理与计算。本研究基于12321每月举报受理播报,采用EXCEL和R语言开放平台(312版本)作为数据统计和分析工具。
11 提出研究问题
在一定程度上,网络信息环境中的信息污染问题是随着信息技术的发展而产生的。近年来,信息技术发展十分迅速,信息环境不断变化。针对信息污染等新问题,相关部门也采取了必要的监管措施。但信息污染的变化呈现何种规律,监管工作有没有取得显著的效果,这些问题都是需要我们思考的。笔者以“不良与垃圾信息”为研究对象,探讨如何采用内容分析法对其进行客观、系统的研究,以期引导公众对信息污染问题产生正确认识,共同创建良好的信息消费环境。
12 研究样本
12321网络不良与垃圾信息举报受理中心是中国互联网协会受工业和信息化部委托设立的举报受理机构,主要负责互联网、移动电话网、固定电话网各种形式信息通信网络及电信业务中不良与垃圾信息内容的举报受理、调查分析以及查处工作,其网站上公布的受理范围和举报方式等信息。
网站显示,该举报平台目前进行了以下几个方面的受理情况播报:①《反垃圾邮件报告》,从2005开始,至2014年第四季度为止,每季度发布,但2009年以前的报告均无法下载;②《手机短信状况报告》,从2009年开始至2014年,每年进行两次调查,2010年底开始改为每半年进行一次;③《网络不良与垃圾信息举报受理情况播报》,从2008年5月开始,每月公布垃圾邮件举报受理情况,至本文写作之日已更新至2016年2月版本;④《网民权益报告》,现已发布2014年版和2015年版。网站上可以获取到的各类资料情况如表1所示:
考虑时间跨度、更新频率和内容覆盖等因素,本研究以《网络不良与垃圾信息举报受理情况播报》(以下简称《月报》)为分析样本,共收集到样本70份,以期对近几年我国信息污染情况进行客观、系统、定量的研究。需要说明的是,2012年1月和2月、2015年3月和4月以及2015年6月和7月的样本是合并在一起的,2012年7月至2014年1月间以及2014年5月、2015年12月的样本缺失。
《月报》样本共分为“受理方式”、“本月举报受理情况总结”、“本月处理情况”和“网络不良与垃圾信息举报受理中心举报”等几大部分。其中2008年5月至2012年6月的样本中,“本月处理情况和网络不良与垃圾”部分设置“互联网”、“移动电话网”、“固定电话网”三大不良与垃圾信息来源,如表1所示,样本容量为49;而2014年2月至2016年的样本对该部分作了调整,分为“垃圾邮件”、“不良网站”、“垃圾类短信”、“涉嫌违法类短信”“垃圾彩信”、“骚扰电话”和“手机应用安全问题(APP)”7个子类,即将来自移动电话网和固定电话网的骚扰电话举报进行合并统计,将不良与垃圾短信细分为垃圾类短信和涉嫌违法类短信。同时,新增手机APP安全问题举报类目,取消对互联网恶意软件的统计。
根据样本特征,本研究将70份样本划分为两组,即将2008年5月至2012年6月的样本划分为第一组,2014年2月至2016年2月的样本划分第二组,样本容量分别为49和21。
13 选择分析单元和类目
为了解各种不良与垃圾信息的分布,本研究选取“本月举报受理情况”分析单元,在该分析单元下,选择各污染信息来源作为进一步分析类目,第一组样本分析类目如表2所示:
IVR:语音增值业务,与固定电话声讯台类似,提供语音交友、语音点歌等服务。
第二组样本分析类目如表3所示:
按照以上规则,对样本进行分析,统计各类受举报的信息污染来源数量,保证了研究过程的可重复性,也不会使研究者产生歧义。
14 结果信度分析
由于12321不良与垃圾信息举报受理范围并不是完全一致的,内容分析方法中,需要研究者按照相同的维度对样本进行分析和记录。为了使数据统计结果更加准确,需要开展信度分析,以判断两个以上的研究者评判的一致性,一致性越高表明研究者对分析单元和类目的认识越统一,研究的可信度也越高。信度分析的计算公式[25]:
R=nK1+(n-1)K
其中,R为信度;K为研究者间的平均认同度;n为研究人员数目。研究者间的平均认同度K可由以下公式计算得出:
K=2MN1+N2
其中,N1、N2为两个研究人员独立分析的类目数,M为一致认同的类目数。若有两名以上人员参与研究,研究信度可取两两研究人员间的信度均值。信度检验是科学研究中的重要环节,一般认为信度值在07以上才可被接受[26]。本研究由一名研究人员时隔一周分两次进行,分别分析的类目数N1=N2=18,M=17,经计算得到R=K=09444,满足信度要求。
2 数据分析与结果
21 第一组样本数据分析
将该组样本按信息污染来源进行统计,横轴num代表样本编号,纵轴value代表举报数量,结果如图1所示。
图1 2008年5月-2012年6月不同信息污染来源统计
从图上可以看出,在第一个样本中,来自移动电话网的污染信息有一个异常值,达到近40万起不良信息举报,远远高于其他时间段内的污染信息举报数。查阅2008年5月的《月报资料》显示,这是由于2008年“512”汶川大地震后,不法分子趁机散布虚假消费,骗取钱财。经公众举报后,12321举报中心和公安机关的努力,不法分子得到相应的处罚,移动互联网和互联网上的污染信息得到了一定程度的控制;在春节前1个月会出现峰值,而在正月却下降,一是由于节日期间有关部门加大了监管力度;二是人们将注意力放在过节上,降低了举报频率。固定电话网上的污染信息相对较小。
为判断3种信息污染来源差异是否显著,需要进一步作方差检验,检验步骤如下:
Step 1:bartlett检验,考察方差齐次性:
p-value<22e-16,方差齐次性条件满足。
Step 2:方差检验:
由方差检验结果p-value=943e-13,接近于0,说明3种信息污染来源数量差异显著。
Step 3:多重比较:
多重比较结果显示P值均小于001,3种信息污染来源间均存在非常显著的差异。
Step 4:计算均值
即3种信息污染来源中,来自移动电话网(mean=573482653)的信息污染最多;其次是互联网(mean=347518980);再次是固定电话网(mean=9672449)。
22 第二组样本数据分析
如图2所示,恶意手机APP举报数量在这一阶段迅速下降。这是由于在未将其纳入监测范围之前已经肆意横行,将其纳入监测范围后采取措施才得以控制。随着移动智能终端的应用普及,来自移动互联网的信息污染问题也开始突出。从2014年2月开始,12321举报中心与网秦、腾讯、金山毒霸等安全引擎合作,以加强对污染信息的监控,在此之前对引发手机安全问题的APP并没有纳入监管范围。举报受理中心据此,要求各应用商店对恶意APP进行强制下架等处理方式,有效地控制了此类信息污染的持续增长。
图2 2014年2月至2016年2月不同信息污染分类统计
经统计检验,恶意APP与其他6种污染类型的数量具有显著差异,其均值为mean=1586867143,远高于其余6种污染类型。
23 两组样本合并分析
由于两组样本在统计上存在一定差异,为了能够将两组样本进行进一步比较,需要统一口径。本研究选择将第二组样本中的垃圾短信(B3)和违法短信(B4)合并,将第一组样本中的来自移动电话网(A22)和固定电话网(A31)的骚扰电话进行合并,同时保留两个样本中相同的变量,即恶意网站、垃圾邮件,合并后的数据表格如图3所示:
图3 2008年5月-2016年2月信息污染源分类统计
从两组样本合并后的情况来看,2008年“512”地震后来自移动电话网上出现的大量信息污染主要是不良与垃圾短信。
经方差检验,不良与垃圾短信与其余3种类型的污染信息之间差别显著,且不良与垃圾短信的数量(mean=4590149)显著大于其他3种类型的信息污染。
24 网络信息污染变化趋势分析
由于将两组样本合并后分析时,以两组样本共有类目为基础,并没有对恶意手机APP和不良与垃圾短信的比较。为判断2014年2月至2016年2月间,恶意手机APP和不良与垃圾短信数量之间是否存在显著差异,需要进一步将第二组中的“垃圾短信(B3)”和“违法短信(B4)”进行合并后与恶意手机APP(B7)进行对比分析。经统计检验,恶意手机APP举报数量(mean=15868671)显著高于不良与垃圾短信数量(mean=2173357)(p-value=174e-05 ),如图4所示。
图4 2014年2月-2016年2月恶意手机APP和不良与垃圾短信统计
3 结论及建议
本研究基于内容分析法,以12321互联网不良与垃圾信息举报中心发布的《网络不良与垃圾信息受理情况月报》共计70份样本进行了分析,并根据样本特征将所有样本分为两组,主要得出以下结论:
(1)第一组样本统计了来自互联网、移动电话网和固定电话网3种不同来源的污染信息,统计结果显示,来自移动电话网的污染信息数量最多,来自固定电话网的污染信息最少,来自互联网的居其间;
(2)对第二组样本统计了7种不同类型的污染信息之间的差异,结果显示2014年2月以来,被举报的手机恶意APP数量显著高于其他类型的污染信息;
(3)经两组样本共有类目对比分析,结果显示来自移动电话网的不良与垃圾信息数量显著高于其余几类污染信息的数量;
(4)将恶意手机APP举报数量和不良与垃圾信息数量对比,2014年2月至2016年2月,恶意手机APP数量显著超过不良与垃圾短信数量,已经成为网络信息污染中突出问题。
据此,提出以下政策建议:一是加大对移动电话网中信息污染源的监测力度。随着移动互联网时代的到来,手机已经成为新时代公民的标配,信息成为一种重要的资源,但信息的质量却也因为信息过载等信息污染问题而大打折扣。监管部门有义务规范信息消费市场,为公众营造一个良好的信息消费环境,可以尝试建立曝光制度,以威慑不良行为主体。二是加强信息污染防治全民宣传工作,提升公众信息素养。12321举报受理中心现已开通电话、微博、微信和安卓手机客户端等举报方式,却鲜为人知。建议通过招募志愿者加强此类宣传工作,同时引导公众养成良好的消费习惯,不传谣不信谣。三是建议12321举报中心在受理不良与垃圾信息举报时,增加危害评级,以方便对此类案件的分类治理。现有资料显示中心仅在2014和2015两年分别做过一次《网民权益调查》,如果只是每年调查一次还远远不够。由于污染信息的数量和因此而造成的损失不一定成正比,某些污染信息可能举报数量少但给公众造成的危害大。如不法分子通过电话骗取农村空巢老人等案件,社会负面影响大,但受骗当事人并不懂得如何举报,会导致此类案件的举报偏少。如果单从数量来看的话,可能给不法分子提供可趁之机。
参考文献
[1]韩子静.信息生态学与信息生态系统平衡研究[D].杭州:浙江大学,2008.
[2]周庆山,李瀚瀛,朱建荣,等.信息生态学研究的概况与术语界定初探[J].图书与情报,2006,(6):24-29.
[3]Jo T.BBC NEWS|Technology|Web guru fights info pollution[EB/OL].http:∥news.bbc.co.uk/2/hi/technology/3171376.stm,2016-01-10.
[4]Hemp P.Death by information overload[J].Harvard business review,2009,87(9):83-89.
[5]Bontcheva K,Gorrell G,Wessels B.Social media and information overload:Survey results[J].arXiv preprint arXiv,2013,(1306):813.
[6]Dean D,Webb C.Recovering from information overload[J].McKinsey Quarterly,2011,(1):80-88.
[7]Rodriguez M G,Gummadi K,Schoelkopf B.Quantifying information overload in social media and its impact on social contagions[J].arXiv preprint arXiv:1403.6838,2014.
[8]Van V L,Beaujean D J M A,Van G J E W.Why mobile health app overload drives us crazy,and how to restore the sanity[J].BMC medical informatics and decision making,2013,13(1):23.
[9]Kristof C,Michael A.Managing Information Overload:the Case of Online Product Review Categorization[M].Springer International Publishing,2015:548.
[10]邵培仁.传播学[M].北京:高等教育出版社,2003.
[11]李键菲.基于信息生态链的信息污染及主体防范策略[J].情报资料工作,2010,(3):98-101.
[12]吕润宏.浅谈网络信息污染的治理策略[J].河南图书馆学刊,2010,(5):107-109.
[13]郭宇.微博媒介生态环境中的信息污染问题探析[D].保定:河北大学,2014.
[14]胥爱芳.互联网社区问答平台上基于“众包”的信息污染:测量、分析与防治[D].合肥:中国科学技术大学,2015.
[15]黄晓芳.论我国信息污染及治理对策[J].惠州学院学报:社会科学版,2003,(1):91-95.
[16]Koroleva K,Krasnova H,Günther O.‘STOP SPAMMING ME!-Exploring Information Overload on Facebook:AMCIS,2010[C].
[17]彭锐.论信息污染与信息控污[J].科技情报开发与经济,2003,(4):19-20.
[18]王璐.新焦点:关注网络时代的信息污染[J].现代情报,2004,(8):205-206.
[19]周淑云.信息污染及其控制[J].现代情报,2009,(2):68-70.
[20]曾剑秋,杨光永,董豪.垃圾短信分类治理对策研究[J].北京邮电大学学报:社会科学版,2015,(6):39-44.
[21]朱亮,孟宪学.文献计量法与内容分析法比较研究[J].图书馆工作与研究,2013,(6):64-66.
[22]李明.定量内容分析法在中国大陆新闻传播研究中的运用——以2003-2012年CSSCI收录的新闻传播类来源期刊论文为例[J].新闻与传播研究,2013,(9):50-64.
[23]邱均平,余以胜,邹菲.内容分析法的应用研究[J].情报杂志,2005,(8):11-13.
[24]吴世忠.内容分析方法论纲[J].情报资料工作,1991,(2):37-39.
[25]周艳,李青.我国智能玩具研究现状述评——基于2002-2014年中文文献[J].北京邮电大学学报:社会科学版,2016,(1):113-120.
[26]刘伟.内容分析法在公共管理学研究中的应用[J].中国行政管理,2014,(6):93-98.
(本文责任编辑:郭沫含)