APP下载

微博的界定及其管理与利用

2016-06-05周金元周天羚陈

图书情报研究 2016年1期
关键词:信息源文献信息

周金元周天羚陈 刚

(1.江苏大学科技信息研究所 镇江 212013;2.复旦大学软件学院 上海 200433)

微博的界定及其管理与利用

周金元1周天羚1陈 刚2

(1.江苏大学科技信息研究所 镇江 212013;2.复旦大学软件学院 上海 200433)

从定义、加工集约程度、特征三个方面将微博和传统信息源进行比较。分析当前微博发展面临的主要问题,提出微博信息甄别的三阶段:机构甄别、机器过滤、人的主观甄别。就微博信息的管理和利用提出自己的几点思考:微博的标准和法律规范的设立,扩展微博互动和微博问政制度,进一步挖掘微博的商业价值。

微博 信息源 信息甄别 信息管理 信息利用

微型博客(Microblog),简称微博,是一个通过用户间互相关注来传播信息、分享信息的实时广播式社交网络平台。用户可以在任意的时间和地点通过网页、计算机和手机等各种客户端创建其喜爱的个人社区,并通过不超过140字的文字内容来发布或更新信息,同时实现即时分享。2006 年6月Twitter的诞生标志着微博客的诞生[1],2007年国内首款微博“饭否”也向公众开放[2]。随着微博的快速发展,微博已经深入到人们的日常生活和工作中,同时也引起了研究者的关注,产生了一些研究成果。

微博作为当前第一信息源[3],将微博与传统信息源进行比较,分析当前微博发展面临的主要问题并提出解决思路,具有一定的学术意义和现实意义。

1 微博与传统信息源的比较

1.1 定义比较

信息源的定义是“蕴含信息的一切事物”。信息源内涵丰富,可按不同的分类标准分为不同类型[4]。所有产生、生产、贮存、加工和传播信息的源泉都是信息源。

网络信息源是指通过计算机网络可以利用的各种信息资源的总和,即所有以电子数据形式把文字、图像、音频和视频等多种形式的信息内容,存储在光磁等介质的载体中,并通过因特网或手机等终端方式展现出来的一种资源。微博是一种文字、图片、音频或者视频的信息资源,通过网络形式进行存储以及传播,通过计算机技术在微博终端(包括手机、电脑等互联网设备)展现的网络信息资源,同时微博作为一种平台,也是微博内容的信息来源地和信息机构。因此,微博是信息的生产、加工、贮存和传播的源泉,符合信息源的定义,可以看作是网络信息源的一种表现形式。

1.2 加工集约程度比较

根据信息源的加工集约程度,可将信息源划分为一次信息源、二次信息源、三次信息源和四次信息源[4]。

一次信息源是指直接由作者进行原创,没有经过任何的后期加工而得来的信息,它是作者在参与科学研究或者社会生产过程中产生的最原始的思想、数据、原理或者结论的信息情报源,也是作者首次利用一定的载体保存起来的情报源内容。微博作为在互联网上传播的信息,数量巨大、种类繁多,原创微博具有新颖性和独创性,可被其他人评论、加工、转播、利用。显然,原创的微博信息可以被认为是一次信息源。

二次信息源是通过对一次信息源的内容再加工、整理和提炼获取的信息源,它是一种感知信息源。微博中有“话题”板块,即包含在“##”中的内容。微博话题可以作为关键字来描述本条微博信息的内容,是对一次微博信息源进行再加工和整理所得到的结果,与二次信息源的定义相吻合。用户可以点评或转发他人的微博,还可以收藏别人发表的微博信息并进行组织加工,形成自己的微博资源。

三次信息源则是再生信息源或工具书,它是利用二次信息源的汇集功能,对信息源进行检索、筛选,并加以分析加工而编写出来的第三个层次的信息源。这种信息源可以看做是目录的目录,表现为百科全书、专题报告、辞典、手册、年鉴等。例如,上海交通大学每年发表《中国微博年度报告》对本年度的发展特点进行概括,并展望微博在未来的发展趋势,新浪微博自2011年起对我国政法微博进行总结而发布的《全国政法微博发展报告》,都属于三次信息源。

四次信息源也称集约型信息源,是文献信息源和实物信息源的集约化,如图书馆、档案馆、数据库、博物馆等。而目前微博领域还没有微博图书馆、微博数据库这种四次信息源,微博中的信息依然呈零星、分散而又不规则的状态。

微博信息既可以原创,也可以被他人进行转发和评论,并加上自己的见解和分析,归类成一类话题,形成类似于二次信息源的一种形式,用户可以通过话题中的列表快速定位到原始博文(一次信息源)。同样的,利用所有的微博话题信息,包括对话题中的原创微博和转发微博进行有效的检索和筛选,形成微博报告这样的三次信息源形式,用户通过关键字或者目录进行检索对应的微博,可以认为是微博的搜索引擎和目录的目录。因此,微博和传统信息源一样,也可以根据加工集约程度进行划分。

1.3 特征比较

主要的传统信息源包括:图书、期刊、科技报告、专利文献、学位论文、会议论文、政府出版物、标准文献、产品样品和档案文献,被称为“十大文献信息源”,这些信息源都具有各自的特点。

图书是有定价并取得版权保护的出版物,能帮助我们系统地学习和了解相关领域的技术知识,具有信息量大、系统而完整、成熟、稳定可靠、阶段性和总结性等特性[5];期刊又名连续出版物,是具有数字或者年月顺序标号的出版物,特点是出版速度快、灵活性、及时性、连续性和持续反映[5];科技报告是科研生产单位在研究和生产过程中进行总结报告形成的特种文献,具有技术性强、完整性、可靠性、高情报价值等特征[6];专利文献是一切与专利制度有关的专利文件,基本特点有专有性、地域性和时间性[6],同时由于特有的优先权原则,发明人往往在发明完成的第一时间提交申请并立刻出现在专利文献中;学位论文包括高等院校和科研机构为申请学位而撰写的学术论文,特点有先进性、创新性、实用性、独创性和专业性等,其参考文献多而全面,一般不公开出版[7];会议论文是在各类学术会议上形成的资料以及出版物,由于其信息传递及时且注重学术交流,因此具有及时性、专业性、新颖性、时效性的特点;政府出版物是各国政府部门及机构出版的文献,其内容具有权威性和导向性;标准文献是按照规定程序而且经过权威机构认证,在特定活动领域必须执行规格和要求的技术规定的文件形式,具有成熟性、约束性、严谨性、系统性和时效性的特点,是了解世界各国工业发展情况的重要科技情报源之一[8];产品样品一般指制造商为推销产品而发出以介绍产品性能为主的出版物,其内容成熟,数据可靠,具有直观性、完整性;档案文献是科学研究生产过程中对具体事物对象的技术文件、图表、图纸、照片及原始记录的总称,一般仅供内部使用,具有客观性、可靠性、保密性的特点。十大文献信息源的特征如表1所示。

内部控制的目标有多种,包括保证企业经营管理合法合规,资产安全,财务报告及相关信息真实完整,提高经营效率和效果,促进企业实现发展战略,[3]但是其根本目标都是促进经济发展。例如,对于规模较小的中小型企业来说,设立审计委员会及要求所有不相容职务相分离会带来巨大的成本,而带来的收益也是有限的。所以应当结合企业的需求和实际情况,不能盲目规范。

表1 十大文献信息源的特征

微博作为一种网络信息源,具有良好的知识性、新颖性、连续性、独创性和及时性等特点,与学术研究相关的微博信息又包含系统性、实用性、可靠性、技术性、高情报价值、权威性和专业性的特点。微博与图书、期刊、学位论文以及会议论文一样,都是具有知识价值的文献,学术微博与专利文献类似,代表了某领域的最新研究成果。通过以上特征比较,笔者发现微博的特征与主要传统文献信息源的特征有着高度的相似,都是工作生活以及科学研究领域的重要信息源。不仅如此,与传统的图书、期刊、学位论文等相比,微博还具有实时性、前瞻性及便利性等优点,可以弥补传统信息源存在的不足。

2 微博信息源面临的问题及其甄别

2.1 当前微博发展面临的主要问题

近年来微博发展十分迅速,2013年中国互联网络信息中心(CNNIC)发布的《第32次中国互联网络发展状况统计报告》中显示,到2013年6月底,我国的微博用户数和网民微博使用率都达快速增长。其中微博用户数比2012年底增长了7.2个百分点,增长用户数2 216万;网民中微博使用率较上年增长1.3个百分点,达到了56.0%[9]。同时,微博作为一种新兴的网络资源,还与其他类型的互联网资源相融合,进一步扩大了其影响范围。

尽管微博覆盖范围极广,但如何对其进行良好的管理和利用将决定微博的进一步发展。微博的出现大大提高了信息的传播速度,其核心功能是实时信息的发布与获取[10],若不加以系统高效的管理,虚假滞后的信息迅速传播后,造成利用不当。当前微博的发展主要面临以下问题:

一是微博中充溢着各种虚假信息,频繁出现各种恶意炒作事件[11]。微博以其自媒体的特性以及使用门槛低、可随时发布自己所见所闻的特点,吸引了大量用户的加入。而这些信息在发布之前,往往都无法判断信息的真实性、准确性、严谨性。在基本没有任何限制的情况下,虚拟世界中的畅所欲言往往会导致一些假信息的泛滥,造成一些不必要的误解和恶意事件的发生。

二是网络版权问题凸显,智慧成果亟待保护。许多发布的微博信息都无法判断其内容是否来自原作者,转发评论大都未得到原作者的授权。而许多匿名发布的信息,使得用户的身份被隐藏,人们的行为也因此失去了有效的监督,对于那些有效的微博信息源很不公平。

三是微博互动和微博问政制度较为混乱。我国正处在微博问政的实验阶段,相关的政策制度和法规都不明确。利用微博进行政务工作的公布和互动,广大群众无法核实内容的有效性,对有疑问的信息内容也无处征询意见。

2.2 微博信息源甄别的三阶段

上述问题的根源在于微博信息的真伪性判断缺失。只有通过信息甄别才能除去信息源中的各种污染,对微博来说更是如此。无法判断微博信息源的真伪性,很难体现微博整体所具有的知识价值,也会妨碍微博的进一步发展。微博的信息甄别,是对微博的发布、传播和获取等多个方面进行全方位的信息过滤和判断,涉及的主体包括微博本身、监督机构以及使用者个人。

根据微博信息的处理流程,可以从以下三个阶段对微博信息进行不同方式的甄别。

第一阶段:机构甄别。机构甄别主要是在微博发布之初,需要类似国家互联网信息办公室的相关管理机构从源头开始甄别微博信息的真伪性。机构甄别可以通过作者的认证信息、作者信用以及关键字过滤等方式,来甄别信息的可信度,并交由权威的人员和部门进行鉴定。目前我国的网络信息治理机构出台的政策主要有全国人大审议通过的《关于加强网络信息保护的决定》和国家互联网信息办公室《互联网用户账号名称管理规定》等。

第二阶段:机器过滤。微博信息源经确认发布之后,人们可以通过微博应用程序(如新浪微博的客户端、网页端等)获取微博信息。这时候可以通过机器过滤微博信息,验证微博信息的真伪性。当前国内外针对各种不良网页的过滤软件有多种技术,其中包括有网址库过滤(IP库、URL库)技术以及智能内容理解过滤技术等[12]。

第三阶段:人的主观甄别。通过计算机技术可以过滤掉大部分的虚假信息,但是还有许多微博信息无法根据计算机算法自动过滤掉,这些信息会最终展现出来。这个时候需要利用人的主观意识来进行人工的过滤。这个甄别过程因人而异,个人通过其感官、思想、认知等方式,通过一定的技能来对微博信息源进行甄别。同时,人们可以通过向他人征询意见和网络上检索信息的方式来辅助自己的甄别。具体来说就是对信息的来源、时效性以及价值取向、情感成分以及实用性等方方面面,通过对比、归纳等一系列方法来对信息的价值进行判断整序,依照的标准有简单聚类法和知识树法等。

微博信息甄别的流程如图1所示。

3 微博信息源的管理和利用

在国外,Gayo-Avello[13]提出可以利用微博中现有的有价值信息作为信息来源;Chae等人[14]认为微博等社交网络服务提供的信息带有准确的时间与空间的定位数据,对于当地事件的态势感知与发展有巨大的帮助。在国内,王淼和刘友华[15]也提出通过关注竞争者、搜索信息等几种微博情报获取方法,来给微博的情报工作拓展思路;余波[16]从微博在信息传播、信息空间共享、人际关系网络和信息生态治理等几个方面,来探索微博信息的情报学意义;袁纳宇[17]认为微博可以作为获取、共享、交流、传递及应用信息的平台,通过图书馆对微博引进的价值分析,利用微博来对现有的图书馆服务方式进行创新。

图1 微博信息甄别流程图

我国针对微博管理相关的法律制度也在逐渐完善,2015年2月4日颁布的《互联网用户账号名称管理规定》对用户账号名称制定有关规定,涵盖微博、博客等最新的网络信息源。以新浪微博为例,新浪出台了《个人信息保护政策》对个人信息的收集和管理、保护等内容都进行了详细的规定[18]。但是,国家层面的法律法规和机构的政策规定没有形成一个有机的整体,没有统一的微博信息源规范也导致了微博发展中的混乱现象。

微博作为当今最为重要的社交网络平台和新型网络信息源,其中含有的大量图文、音频以及视频信息受到了研究者的关注。如果将微博信息加以规范系统的管理,形成有效可信的信息源,有利于弥补当前网络信息源发展的不足。

为了能更好的利用微博进行信息传播,并且有效的提取、归档和利用,从以下三个方面对微博的发展进行展望和前景分析。

第一,加强对微博信息源的标准设定和法律规范。相关部门和单位首先要规范微博信息源的发布,从微博浩瀚的信息中提取有用的微博信息源,过滤伪信息及无效信息。同时还需要规范微博中的各类信息来源,在微博的有效信息源的范畴内,利用最新的计算机技术进行提炼和数据库录入等,从而形成一类高效且真实微博网络信息源,供研究者以及民众使用。

第二,扩展微博互动和微博问政制度。微博互动机制以及微博问政仍旧处于萌芽阶段,没有形成良好的微博信息源反馈机制。我们可以扩展微博的“私信”机制,微博用户可以通过私信方式,将意见建议传达给对方,对方可以利用爬虫、数据抓取等方式,定期收集用户意见并反馈给用户。我国早有匿名信举报信等机制来进行政务互动,同样,我们可以利用微博“匿名私信”的方式,来实现政府机关同普通民众之间的政务互动。

第三,进一步挖掘微博的商业价值。当前大多数企业都设立了企业认证微博,通过微博发布企业公告以及产品广告。但相对发达国家,我们在利用微博信息源进行企业信息管理以及微博竞争情报的获取方面,仍然存在较大差距。针对企业内部,可以通过将微博服务嵌入企业内部网站,实现企业微博信息管理共享;针对外部客户,企业可以利用Web2.0的特性,采集相关标签和博文,来发掘用户的兴趣社区和相关的热门产品话题等,更好的贴近和了解用户[19]。通过微博获取的情报信息,总结用户行为,用类似提供个性化产品和服务的方式,增强企业的竞争力。

4 结语

通过前文对微博和十大传统文献信息源的异同比较,可发现微博不仅具有传统信息源的特征,而且其实时性、前瞻性以及整理的方便性等优点还可以弥补传统信息源存在的不足。本文结合当前微博发展面临的问题,探讨出其根源在于微博信息源的真伪性判断缺失,提出微博信息甄别的三阶段流程,并且提出加强微博的规范化管理、扩展微博互动和微博问政制度及挖掘微博的商业价值等发展方向,以期从一定程度上解决目前微博面临的发展问题,探索更好的微博信息源的管理和利用方法。

[1]孟令俊.突发事件中的微博传播与舆论引导[D].武汉:华中师范大学,2011.

[2]张 琳.我国微博的发展研究[D].南昌:江西财经大学,2012.

[3]微博成为第一信息源[EB/OL].[2015-03-30].http://dsb. gzdsw.com/html/2012-04/15/content_93901.htm.

[4]孙建军.信息资源管理概论[M].南京:东南大学出版社,2003:130.

[5]王民学.科技图书与期刊的信息特点及流通管理[J].科技文献信息管理,2001(1):30-32.

[6]傅晓光.特种文献资源概述[J].沈阳农业大学学报(社会科学版),2003(2):176-177.

[7]葛郁葱.学位论文的特点及其检索方法[J].现代情报,2003(9):161-162.

[8]葛郁葱.标准文献的特点及其检索方法[J].情报杂志,2009 (S2):166-167,160.

[9]CNNIC第32次互联网报告:交流沟通[EB/OL].[2015-03-30].http://tech.163.com/13/0717/13/9407BUV900094NSI_4. html.

[10]喻国明.微博价值:核心功能、延伸功能与附加功能[J].新闻与写作,2010(3):61-63.

[11]石木舟,叶 馨.微博发展所遇问题及对策研究[J].商场现代化,2012(26):354.

[12]彭昱忠,元昌安,王 艳,等.基于内容理解的不良信息过滤技术研究[J].计算机应用研究,2009(2):433-438,447.

[13]Gayo-Avello D.Nepotistic Relationships in Twitter and their Impact on Rank Prestige Algorithms[J].Information Processing&Management,2013(6):1250-1258.

[14] Chae J,Thom D,Jang Y,et al.Public behavior response analysis in disaster events utilizing visual analytics of microblog data[J].Computers&Graphics,2014(38):51-60.

[15]王 淼,刘友华.微博客的情报特征及其获取方法[J].现代情报,2013(1):158-161.

[16]余 波.微博的情报学意义探讨[J].图书情报工作,2010 (22):57-60.

[17]袁纳宇.图书馆应用微博客的价值分析[J].图书与情报,2010(3):104-106.

[18]微博个人信息保护政策[EB/OL].[2015-05-05].http:// weibo.com/signup/v5/privacy.

[19]汤丽娟,章成志.基于微博挖掘技术的企业产品信息监测研究[J].图书情报工作,2012(16):37-41.

(责任编校 田丽丽)

Definition of Microblog and Its Management and Utilization

Zhou Jinyuan1,Zhou Tianling1,Chen Gang2
1.Institute of Science and Technology Information,Jiangsu University,Zhenjiang 212013,China;2.Software School,Fudan University,Shanghai 200433,China

The present article makes comparison between microblog and traditional information source in their definitions,information processing and intensity as well as their features. By analyzing the main problems that microblog is faced with currently,it puts forward three stages of microblog information screening,namely institutional screening,mechanical screening and human subjective screening.Several reflections are made on the information management and utilization of microblog,including establishing microblog standards and specifications,extending microblog interaction and advice-seeking system and further excavating its commercial value.

microblog;information source;information screening;information management; information utilization

G252

周金元,男,1965年生,研究馆员,江苏大学图书馆副馆长,硕士生导师,发表论文20余篇,主编教材4部;周天羚,女,1991年生,2012级图书情报与档案管理专业硕士研究生,发表论文1篇;陈 刚,男,1990年生,2012级软件工程专业硕士研究生。

猜你喜欢

信息源文献信息
睡眠者效应
Hostile takeovers in China and Japan
新媒体时代,记者如何正确使用信息源
Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
订阅信息
The Role and Significant of Professional Ethics in Accounting and Auditing
展会信息
美国智库对华军事研究的信息源分析——以兰德公司2000~2013年报告的引文分析为例
与信源保持距离—体育记者如何协调与信息源的关系