APP下载

图情博客评价实证研究

2016-01-04王一华

现代情报 2015年11期
关键词:社会网络分析博客发展趋势

摘 要〕作者以图书情报圈子里的32个博客为例,选取博文数、总访问数、热度值、程度中心度、中介中心度等指标,使用Ucinet软件进行社会网络分析,并采用SPSS进行聚类分析,以实证评价图书情报博客的情况。这是运用社会网络分析的一些指标和传统的一些指标评价博客绩效。未来还可从内容、利用等多方面,采用人工评价与自动评价相结合的方式进行综合评价。

〔关键词〕博客;评价;社会网络分析;发展趋势

DOI:10.3969/j.issn.1008-0821.2015.11.002

〔中图分类号〕G203 〔文献标识码〕A 〔文章编号〕1008-0821(2015)11-0013-05

Empirical Evaluation of Blog About Library and Information

Wang Yihua

(Institute of Scientific and Technical Information,Zhengzhou University,Zhengzhou 450001,China)

〔Abstract〕The paper selected 32 individual blogs in the LIS blogosphere as an example,used five indicators(post number,total number of visits,the heat value of the degree of centrality,betweenness centrality degree),and obtained an empirical evaluation of the performance of LIS blog using Ucinet software for social network analysis and using SPSS for cluster analysis.There is the use of social network analysis indicators and some traditional performance indicators to evaluate the blog.In the future,adding other aspects of blogs such as the content,the use in evaluating the blogs,the paper can make the best use of comprehensive evaluation combined with subjective evaluation and automatic evaluation.

〔Key words〕blog;evaluation;social network analysis;development trend

博客分组织博客、个人博客。博客评价可促进写博的积极性,提高博客的质量。在CNKI进行以主题“博客”+主题“评价”检索,采用当时武汉大学(目前在清华大学任教)沈阳博士的ROST软件进行语义网络分析。

语义网络分析是“博客评价”的概念地图,能刻画出“博客评价”的内涵。如图1所示,主要词簇是“模型”、“方法”、“用户”、“影响力”,它们围绕“评价”分布。中文比较有代表性的文献有:朱丽、吕本富、彭赓采用AHP法对个人博客影响力从博客日志质量、博客作者权威性、博客的互动性进行评价[1]。邱均平、徐蓓、李江基于PageRank算法从实质性链接的角度对博客进行评价[2]。邱均平、于长福、马瑞敏采用社会网络法探求图林博客圈中的核心博客[3]。张晓阳、李晓亮采用类h指数对科学网博客影响力进行评价[4]。常娥、魏彬以图情博客为例构建了网络原生数字资源评价指标体系,包括文章总数、浏览次数、回帖数、链接情况、发文频率等8个指标[5]。严炜炜采用9个维度25个指标构建微博客服务质量评价模型[6]。

对外文文献采用以主题“Blog evaluation”在Web of Knowledge检索,采用ROST英语词频统计软件进行词频统计,然后以ROST CM标签云的形式展现。

标签云(Tag Cloud)字号的大小一般是根据单词的出现频率相关,单词的出现频率越高则字号越大。从上述标签云图2可知,博客评价的热点在于retrieval(检索)、extract(抽取)、internet(因特网)、software(软件)、cluster(聚类)、semantic(语义的)、wiki(维基)、algorithm(算法)、splog(垃圾博客)、spam(垃圾信息)、blogosphere(博客圈)、rss(信息聚合)、forum(论坛)、criteria(标准)、vlog(视频博客)。也就是说,主要围绕博客评价的标准、

博客评价的算法、博客评价的工具而展开的。

外文比较有代表性的文献有:Li Jianjiang基于文本观点分析构建博客热度模型。该模型不仅考虑了博客主题的有关综述和评论的数量以及出版时间,而且还侧重于评论的倾向[7]。Tan Luke Kien-Weng、Na Jin-Cheon、Theng Yin-Leng通过博客特征分析,内容分析和社区标识检测帖子在博客圈的影响[8]。Nakajima Shinsuke基于博客的知识水平进行以信誉为本的博客排名[9]。Juffinger Andreas、Granitzer Michael、Lex Elisabeth通过利用已验证的内容对博客按可信度排名。具体做法是首先比较博客和参考语料集的数量结构;然后,分析每一个单独的博客内容,检查与核实的新闻语料的相似性。根据内容相似值的差异,作者对博客进行排名[10]。endprint

1 实证研究

e线图情是北京雷速科技有限公司的产品,是面向图情界和个人提供集数据库服务、深度研究、专业咨询于一体的专业网站,下设海外、国内、学者、热点、专题、论文等多个版块,栏目内容丰富,有20多个,如风云人物、行业聚焦、国际动态、图情要闻、e线速递、行业协会、图情机构、理论技术、研究报告、图书馆建设等(http:∥www.chinalibs.net/jieshao.aspx)。笔者从“e线图情”中博客导航(http:∥www.chinalibs.net/bkjh/Index.aspx)选择部分有代表性的个人博客,并参考有关专家的建议,最终确定图书情报圈子里的32个博客作为分析样本(参见表1)。这些图情博客的博主大部分是图情教师或图书馆工作人员。这些比较有名的博客来自于新浪博客(http:∥blog.sina.com.cn/)、科学网博客(http:∥blog.sciencenet.cn/)、百度空间(http:∥hi.baidu.com/)、博客网(http:∥www.bokee.com/)。其中,新浪网博客是2005年开放,是全国主流、人气颇高的博客频道之一(http:∥baike.baidu.com/),其上的图林博客圈非常有名(http:∥q.blog.sina.com.cn/library/);科学网博客是中国科学报社主办的综合性科学网站科学网(http:∥www.sciencenet.cn)下属的一个频道,主要是针对科学家的实名博客(http:∥bbs.sciencenet.cn/);百度空间是一个轻松记录、分享生活的内容社区;博客网是方兴东发起成立的知识门户网站,因成立于2002年时间早,号称“中国博客的发源地”。

本文以图书情报圈子里的这些个人博客为例,探讨图书情报博客的情况,以便促进图书情报界博主博客写作的积极性,提高博客的质量。以当年还在写博文的博客、有访问量统计的博客为例研究,因此一些名博如平凡博客、图谋不轨、老槐因关博而未进行统计。

因为5个指标的“量纲不同”,因此需要进行归一化处理。某指标得分归一值=该指标得分值/该类数据中该指标的最大值。

基本原理:

(1)热度值=总访问数/博文数

(2)中心度[11-12]:程度中心性(Degree Centrality)与中介中心性(Betweenness Centrality)是计算一个人在一个团体网络中最重要的两项指标。程度中心性衡量一个人作为中心人物的能力,中介中心性衡量一个人作为中介性的能力。

标准化程度中心度:

CD(ni)=∑jXjig-1

(1)

Xji是0或1的数值,代表i与j是否有关系。g代表此网络中的人数。

标准化中介中心性:

CB(ni)=2∑jkgjk(ni)/gjk(g-1)(g-2)

(2)

gjk代表j达到k的捷径数,gjk(ni)代表j达到k的快捷方式上有i的快捷方式数,g代表此网络中的人数。

本文使用Ucinet(http:∥faculty.ucr.edu/~hanneman/net)进行社会网络分析,分析图情博客各个博主之间的社会网络关系。分析结果见图3。

(3)聚类分析

采用SPSS进行聚类分析。最后聚类4类:许培扬、赵星各一类、武夷山、图谋、沧浪水为一类、其余为另一类(见图4)。

说明:①有的博客搬了几次家,以新家为准。所以,统计数据仅供参考。②有的博主有几个博客,这里以其中的一个进行介绍。比如,在本文仅对图谋的博客网上的(http:∥libseeker.bokee.com/)进行了分析。③把某博客与其他博客直接链接的,规定为1,否则为0。④这是以这些博客为例计算的中心度,如果样本数不同,也许结果会有所差异。⑤这些博客服务商分别为新浪博客(http:∥blog.sina.com.cn/)、科学网博客(http:∥blog.sciencenet.cn/)、百度空间(http:∥hi.baidu.com/)、博客网(http:∥www.bokee.com/)。

2 小结与体会

第一,链接工具对于博客评价非常重要。在评价博客甚至网站时,如果有一个或者一些好的评价工具,这对评价而言实用而高效。在文献调研中,发现以前一些文献中采用的链接工具如AllTheWeb已不存在(雅虎于2011年4月4日关闭搜索引擎AlltheWeb),有的软件如测试可访问性的Bobby软件因为研发该软件的公司被兼并,它现在已经消失了。此外,现存的自动评价工具还不完善,结果不很稳定,效果也不太理想。总之,比较稳定可靠的搜索引擎对于博客评价是非常重要的。

第二,本文仅是起一个抛砖引玉之作用。本文未考虑如下因素:博客评论、博客留言、链接访问、链接篇数、文章访问、反向链接(是指其他网站指向本网站的链接)、被推荐贴等等因素。再者,未分原创还是转载。将来还可从内容、利用等方面进行综合评价,综合采用人工评价与自动评价相结合。并可用百叶窗图进行可视化显示,某博客的某一优劣势一目了然。比如分析几个博客内容如武夷山与许培扬、书间道与图谋等等。

第三,本文以博文数、总访问数、热度值、程度中心度、中介中心度五项指标采用聚类评价,也就是说,运用社会网络分析的一些指标和传统的一些指标来评价博客的绩效,是一次有益的尝试和探索。评价是一个“仁者见仁、智者见智”的问题。在参考有关文献的基础上[13-15],可以说比较好的方法是定性方法和定量方法相结合。如何更科学合理的评价博客还有很大的探索空间,尚有许多方面有待在今后的深入研究中继续补充和完善。

参考文献

[1]朱丽,吕本富,彭赓.基于AHP法的个人博客影响力评价方法研究[J].数学的实践与认识,2008,(15):109-117.endprint

[2]邱均平,徐蓓,李江.BlogRank算法及其在图书馆博客中的应用[J].图书情报知识,2008,(1):68-71,77.

[3]邱均平,于长福,马瑞敏.图林博客的社会网络分析[J].图书情报工作,2008,(11):6-9.

[4]张晓阳,李晓亮.科学家博客h指数评价及其相关性分析[J].图书情报工作,2010,(2):66-69.

[5]常娥,魏彬.网络原生数字资源优选与评价研究[J].情报杂志,2012,(2):163-167.

[6]严炜炜.用户满意度视角下微博客服务质量评价模型研究[J].图书情报工作,2011,(18):53-56.

[7]Li Jianjiang;Zhang Xuechun;Weng Yu;等.Blog Hotness Evaluation Model Based on Text Opinion Analysis[J].Eighth IEEE International Conference on Dependable,Autonomic and Secure Computing,Proceedings,2009:235-240.

[8]Tan Luke Kien-Weng;Na Jin-Cheon;Theng Yin-Leng.Influence detection between blog posts through blog features,content analysis,and community identity[J].Online information review,2011,35(3):425-442.

[9]Nakajima Shinsuke;Zhang Jianwei;Inagaki Yoichi etal.Blog Ranking Based on Bloggers Knowledge Level for Providing Credible Information[J].Lecture Notes in Computer Science,2009,5802:227-234.

[10]Juffinger Andreas;Granitzer Michael;Lex Elisabeth.Blog Credibility Ranking by Exploiting Verified Content[J].WICOW 09,2009:51-58.

[11]Borgatti,SP.,Everett,MG.and Freeman,LC.Ucinet for Windows:Software for Social Network Analysis[M].Harvard,MA:Analytic Technologies,2002.

[12]罗家德.社会网分析讲义(第2版)[M].北京:社会科学文献出版社,2010.

[13]王一华.国内外网站评价研究综述[J].情报科学,2013,(11):125-132.

[14]王一华.基于超效率DEA的网站绩效评价[J].情报科学,2012,(9):1371-1375,1384.

[15]郝晓玲,杜沁怡,黄海量.企业家微博影响力的综合评价研究[J].情报科学,2015,(3):95-101.

(本文责任编辑:孙国雷)endprint

猜你喜欢

社会网络分析博客发展趋势
基于社会网络分析的我国微课研究探析