论微博信息的长期保存价值
2014-02-12郑建程
刘 超,郑建程
论微博信息的长期保存价值
刘 超,郑建程
微博是最受欢迎的社交媒体之一,庞大的微博用户群体生产了大量有长期保存价值的微博信息,然而与之相关的研究、实践却十分匮乏。文章分别论述了微博信息的长期保存价值,以及对微博信息长期保存价值的质疑,指出并建议国内外相关学者、机构应对微博信息保存开展更加全面而深入的研究。
微博 微博信息 长期保存 保存价值
0 引言
Web 2.0时代,人们不仅可以浏览信息,还可以利用各式各样的社交媒体工具发表观点、分享经验,参与到信息的创建、利用和修改活动中。微博作为最受欢迎的社交媒体工具之一,其用户生产了大量有价值的信息,这些信息是当代数字信息的重要组成部分,应该得到妥善的保管。2010年4月,美国国会图书馆与Twitter签订了一项协议,协议要求自签订日起Twitter向国会图书馆捐赠自该公司成立以来所有公开的Twitter信息,并且今后会持续地为国会图书馆提供Twitter信息归档[1]。国会图书馆以实际行动证明了微博信息具有保存价值。另外,OCLC董事会主席Larry P.Alford也指出学术图书馆的其中一个使命就是要“探索收集社群(会)媒体及其他当代数据信息”[2]。为此,学术图书馆有必要认识到微博信息的长期保存价值,主动承担起相应的保存使命。
1 微博概述
微博(又称微博客)是一种允许用户及时更新简短文本并可以公开发布的微型博客形式,一些微博也可以发布多媒体信息,如图片、flash、音/视频等[3]。手机、Pad微博客户端的出现和普及,以及单条微博140个字数的限制,使得微博的信息传播成本极低,用户能够随时随地分享所见所闻、所感所思。Twitter是最早也是最著名的微博,2006年一经推出,便迅速获得了全世界广大网络用户的欢迎,目前其网站的访问量位居世界第11位[4]。2009年微博开始在我国流行,CNNIC(中国互联网络信息中心)《第32次中国互联网发展状况调查报告》的数据显示,截至2013年6月底,我国使用微博的网民规模已经突破了3.3亿,微博在网民中的使用率达到了56%,目前微博已经成为网民获取信息的重要途径之一[5]。
微博一词既可以指代微博这种社交媒体平台,也可以指微博用户在微博平台上发布的短消息,在平时的使用中人们多不加以区分。本文所要研究的对象为后者,故在本文中使用“微博信息”一词以示区分。
2 微博信息的长期保存价值
2.1 微博信息的科学研究意义
美国国会图书馆认为[6],Twitter信息的价值体现在三方面:(1)为一些因Twitter而引发的事件提供了最直接的第一手资料;(2)Twitter可视作一个主要信息源(如路透社、纽约时报等)的动态聚合器,并且为公民新闻提供了一个发布、传播的公共平台;(3)Twitter上忠实地记录了普通人的生活,可为后代提供一个了解现代人们生活状况的窗口。所有这些都可以作为国会图书馆现有文化遗产收藏的有益补充。在其发布的“Twitter存档现状的白皮书”中提到[7],虽然目前该存档还无法对研究者开放,但已经从全世界收到了400条访问的请求,而且研究者们关注的主题非常广泛。其实微博信息潜在的研究价值早已突破了网络信息环境的限制,如卡内基梅隆大学的Jacob Eisenstein教授认为Twitter一类的数据将使得语言研究的“游戏规则”发生实质性的改变,他通过研究发现,美国不同区域的微博语言甚至发展出了不同的“方言”[8]。
国内的微博相较于Twitter更像是一个微媒体,在微博打拐、贪腐举报、公益募捐等活动上,微博均发挥了不可替代的作用。另外,由于汉语是当今世界上信息量最大的文字符号系统,同样140个字数的限制,中文微博往往能包含更大的信息量。从这些方面来看,国内本应对微博信息的保存投入更多关注,然而,笔者在研究过程中发现,目前针对微博信息长期保存的中文文献极为有限[9-10]。
从以上可以看出,西方国家对微博信息的科学研究价值已有所认识,并正在积极地对其进行保存。具有语言优势的中文微博信息的长期保存更有必要引起重视,以保障当前及未来科学研究的需求。
2.2 微博信息的社会记忆作用
记忆是人的一种生理和心理机能,但从社会学角度来讲,纯粹的个体性记忆是不存在的,记忆所依赖的语言、逻辑和概念都是在社会交往中实现的。著名社会学家 Maurice Halbwachs认为[11]:存在着一个所谓的集体记忆或记忆的社会框架,它决定着个人记忆能否被回忆起、以什么方式被回忆起。所以,个人记忆实际上是客观世界经社会记忆映射而呈现的镜像。从这个意义上来讲,社会记忆对人们的认知和观念的形成具有重要影响作用,某种程度而言,甚至可以影响社会发展的进程。
社会记忆是人类在世代生活生产活动中传承下来的经验、教训、智慧、知识的集合,通常表现为书面记录信息,而随着数字化信息技术和网络的出现与发展,网络信息也成了社会记忆的有机组成部分。微博是互联网进化的产物之一,其庞大的用户群体在微博平台上发布了大量有价值的信息内容,这些内容正是当代社会记忆不可或缺的一部分。人们通过微博这种社交媒体所发布的内容,既有对生活状态的记录,更重要的是有对社会事件的关注和点评,以及对新闻线索的披露和挖掘。相较于传统媒体而言,微博信息通常具有民主性、及时性等特点,在一些社会科学的研究中被当作第一手资料使用,其价值甚至超越了传统的信息源。
然而,社会记忆如不妥善保存也会被“遗忘”。由于网络的特点,微博信息这部分记忆的被“遗忘”速度会更快。所以,数字化网络化时代的图书馆更应主动担负起保存这些社会记忆的重任,以发挥和完善其社会记忆功能[12]。
2.3 微博信息是人类数字遗产的一部分
国内有部分学者认为,数字遗产应界定为具有一定审美价值和文化价值,并且能够起到文化传承作用的原生数字资源,是数字资源的下位概念,数字遗产的特点有内容形式的多样性、快速增长性、易消失性、数字形式唯一性以及富有价值性等[13]。从上文的分析中可以看出,微博信息完全符合数字遗产的定义及特点。联合国教科文组织于2003年颁布的《保存数字遗产宪章》中指出:“无论何种形式遗产的消逝都是全人类遗产的损失,……由于软、硬件迅速淘汰,维护和保存这类遗产的资金、责任与方法的不确定,以及缺少相关的立法等原因,世界上的数字遗产面临着消失和失传的危险。……应优先保存‘原生数字'资源。”[14]有学者指出,图书馆应在充分认识数字遗产与数字资源的区别以及数字遗产价值的基础上,构建以图书馆为中心的数字遗产合作保存网络,制定合理有效的数字遗产保存策略,以履行图书馆保存数字遗产的使命[13]。
3 对微博信息长期保存价值的质疑
3.1 对微博信息内容的质疑
虽然大部分人都承认微博可以提供一个真实、客观的新闻平台,甚至能在许多重大突发事件的报道和事件的后续发展中发挥重要作用,但也有人对此并不认同,如MarketWatch网站科技专栏作家John C.Dvorak就总结了Twitter作为新闻源有报道片面、“记者”不专业、易受操纵、用户爱搞恶作剧、缺乏获取新闻线索途径、缺乏分析、主次颠倒等七大不足[15]。研究机构Pearanalytics对Twitter短消息的抽样调查显示[16],有40.5%的信息属于“没有价值的无聊话(Pointless Babble)”,如“我现在正在吃一个三明治”,而且令人意外的是,尽管Twitter在新闻事件中的高引用率,但具有新闻价值的消息只占到全部Twitter内容的3.6%。随着微博在国内的普及,越来越多的网友将其当作首选的信息获取渠道和意见表达平台,但对它的质疑也越来越多。《广州日报》载文称,“微博已经从传播信息、交互式交流平台沦落成‘公共厕所',是许多垃圾信息、八卦、恶搞甚至谣言的集散地。”[17]央视《朝闻天下》栏目也曾以《微博的伦理底线在哪里》为题报道了“微博造假”现象,引发了网民热议。
从以上可以看出,对微博信息内容的质疑主要体现在两方面:一是微博信息内容质量良莠不齐;二是微博信息内容琐碎、枯燥。而这些质疑也容易令人对微博信息的保存价值产生疑问。
针对第一种质疑,首先应指出的是,互联网只是社会生活的一个缩影,不能把网络当作现实社会问题的替罪羊。“恶搞”和“谣言”并非微博独有的现象,而是互联网的通病,可通过建立网络文明公约、强化言论管理等措施得到有效遏制。而且,包括微博资源在内,保存任何一种资源都需要接受评价、遴选等程序的检验,造假与不实消息一旦被发现将会被剔除出去。其次,对于微博信息内容中“公民新闻”不专业、主观片面等的质疑,我们应该看到这些由微博用户原创的内容与传统媒体互相补充的意义。美国网络新闻学的创始人Dan Gillmor提出[18],应该用公平、详尽、准确和公开四项新原则来替代新闻界历来所崇尚的客观性原则,因为人与生俱来会带有主观性倾向,完全客观是个不可能实现的目标,相比较而言,他认为网络环境下更容易实现以上提到的四个新目标,从而产生高质量的新闻。传统媒体虽然在信息的采集、加工、传播等环节严格把关,但往往由于过分追求客观性的目标,反而容易使得媒体观点僵化,显得千篇一律。尽管微博上的“公民记者”没有经过专业的训练,但他们往往更敢于发表不同的见解和观点,这无疑有助于丰富公众对某一社会事件的认知,与传统媒体相互补充;也将有助于后人更客观、全面地还原历史真相。
而针对第二种质疑,事实上,早期博客的长期保存价值也曾经受到过类似的质疑,但随着人们对博客的认识逐步加深,一些原先将博客排除在外的网络资源保存项目也将博客纳入归档范围内,如澳大利亚国家图书馆启动的PANDORA项目[19]。正如历史学家Dan Snow所说,“也许正是(博客中记录的)那些琐碎、枯燥的细节对几百年后的人们来说才具备特别意义。”[20]而且由于微博打破了固定互联网和移动互联网之间的限制,且多数微博将字数限制在140个以内,有人从“生产成本”降低这点推算有意愿写有价值微博的人是博客的4倍,加上“消费成本”的降低,认为微博的传播力是博客的200倍[21]。从这个意义上来说,由博客进化而来的微博甚至应比博客具有更大的保存价值。
或许未来的人们会好奇二十一世纪人们的日常生活面貌,未来的相关专家、学者会迫切需要了解历史上某一事件的客观全貌,以及普通大众的看法,那么微博就是一个不能绕开的主题。所以,我们要用长远的眼光客观辩证地看待微博信息的保存价值。
3.2 对微博信息用户需求的质疑
评价一种资源是否具有保存价值要看用户是否对这种资源有需求,而用户需求不仅体现在当下,更重要的是体现在未来。微博信息的保存价值就更多地体现在用户的未来需求中。但这种未来需求存在着诸多不确定因素,使得当前的人们无法估测微博的保存价值。兴许有人会据此提出质疑,认为只有出现明确需求时,才有必要对一种资源进行保存。然而,如果当前不进行保存,当需求发生时,内容已经消失,由此带来的损失将无法弥补。
对此,有人提出对于保存价值不确定的数字资源,可采取“购买时间”(经济学术语)的保存策略[22],即当前投入少许资金将这些数字资源仅仅存贮在安全的物理介质中,而不投资进行其他形式的长期保存管理活动,当未来出现明确需求时,再有选择地对这些数字资源进行全面保存管理并提供服务,从而避免不可逆转的损失。不过需要注意的是,对于微博来说,这种保存策略虽然能够暂时使保存价值不确定的微博信息免于消失的风险,但由于每天都会有新的社会事件产生,用户每时每刻都在生产微博信息,如此规模巨大且不断增长的数据量,对存贮的物理介质提出了更高的要求,加上日常维护的费用,前期投入的资金规模也是不容小觑的,这就需要相应的保存机构提前做出缜密的安排和计划。
4 结语
微博资源是网络信息资源的重要组成部分,其中大量有价值的信息内容也是人类数字遗产的一部分,需要引起保存机构的重视。与网络信息资源一样,微博信息的保存也面临着来自技术、法律、经济以及责任体系等方面的挑战。相较于一般的网页信息,微博信息的动态性、数据的海量性、格式的多样性、信息间的关联性以及用户版权与隐私问题的复杂性会增加问题的解决难度。在微博信息长期保存的价值获得普遍认可后,国内外学者和机构对微博信息保存技术等各方面的研究也应加快步伐。
[1][7]Library of Congress.Update on the Twitter Archive At the Library of Congress[EB/OL].[2014-01-04].http://www.loc.gov/today/pr/2013/files/twitter_report_ 2013 jan.pdf.
[2]Larry P.Alford.把握当下:为学术图书馆的未来而定义[J].严丹,钱卓珺,编译.图书馆杂志,2013(7):4-8.
[3]维基百科.微博[EB/OL].[2014-02-12].http://zh. wikipedia.org/wiki/%E5%BE%AE%E5%8D%9A.
[4]Alexa.Twitter.com Site Info.[EB/OL].[2014-02-12]. http://www.alexa.com/siteinfo/twitter.com.
[5]CNNIC.第32次中国互联网络发展状况统计报告[EB/OL].[2014-02-12].http://www.cnnic.net.cn/ hlwfzyj/hlwxzbg/hlwtjbg/201307/P020130717505343 100851.pdf.
[6]Library ofCongress.The Library and Twitter:An FAQ [EB/OL].[2014-02-12]. http://blogs.loc.gov/loc/ 2010/04/the-library-and-twitter-an-faq/.
[8]BBC News.You have a regional dialect even on Twitter[EB/OL].[2014-02-12].http://www.bbc.co. uk/news/technology-12381912.
[9]廖璠,刘国敏.微博长期保存的可行性研究——基于德尔菲法的调查报告[J].图书馆论坛,2013(3):45-49.
[10]黄新荣,吴建华.政务微博档案化保存初探[J].档案与建设,2012(4):4-6.
[11]莫里斯·哈布瓦赫.论集体记忆[M].毕然,郭金华,译.上海:上海人民出版社,2002:68-69.
[12]黄晨,虎娇玫.图书馆发挥社会记忆功能的思考[J].图书馆建设,2013(8):8-10.
[13]谢欢,郑永田.数字遗产保护:图书馆义不容辞的使命[J].图书馆论坛,2012(7):15-20.
[14]UNESCO.Charter on the Preservation of the Digital Heritage[EB/OL].[2014-02-12].http://portal.unesco. org/ci/en/files/13367/10700115911Charter_en.pdf/ Charter_en.pdf.
[15]MarketWatch.The seven flaws of Twitter[EB/OL]. [2014-01-04].http://www.marketwatch.com/story/ as-news-source-twitter-has-seven-deadly-flaws.
[16]Pearanalytics.Twitter Study[EB/OL].[2014-02-12]. http://www.pearanalytics.com/wp-content/uploads/ 2012/12/Twitter-Study-August-2009.pdf.
[17]李光焱.微博还能搏动多久?[N].广州日报,2011-03-23(C12).
[18]Dan Gillmor.The End of Objectivity(Version 0.91)[EB/OL].[2014-01-04].http://dangillmor.typepad. com/dan_gillmor_on_grassroots/2005/01/the_end_of_ obje.html.
[19]谢春枝.博客长期存取的国外研究与实践[J].情报研究,2009(4):50-53.
[20]ALA.Thousands blog for British Library[EB/OL]. [2014-02-12].http://www.ala.org/Template.cfm?% 20Section=news&template=/ContentManagement/ ContentDisplay.cfm&ContentID=140832.
[21]刘洁.微博在电视新闻节目中的运用[J].视听界,2011(3):61-63.
[22]周献红.基于案例分析的数字资源保存价值研究[J].图书馆论坛,2011(6):81-83.
On the Long-term Preservation Value of Microblog Information
LIU Chao,ZHENG Jian-cheng
Microblog is one of the popular social networking tools.There is a large number of information,deserving of long-term preservation,produced by its colossal user groups.However,studies and practices on it are scarce.This paper discusses the long-term preservation value of microblog,which,as the authors suggest,is worth doing more research intensely and deeply by scholars and institutions at home and abroad.
microblog;microblog information;long-term preservation;preservation value
格式 刘超,郑建程.论微博信息的长期保存价值[J].图书馆论坛,2014(6):101-105.
刘超(1989-),男,中国科学院国家科学图书馆2012级硕士研究生;郑建程(1957-),男,中国科学院国家科学图书馆研究馆员,硕士生导师。
2014-01-07