APP下载

图情博客评价实证研究

2015-07-12王一华

现代情报 2015年11期
关键词:图情网络分析博客

王一华

博客分组织博客、个人博客。博客评价可促进写博的积极性,提高博客的质量。在CNKI进行以主题“博客”+主题“评价”检索,采用当时武汉大学 (目前在清华大学任教) 沈阳博士的ROST软件进行语义网络分析。

语义网络分析是“博客评价”的概念地图,能刻画出“博客评价”的内涵。如图1所示,主要词簇是“模型”、“方法”、“用户”、“影响力”,它们围绕“评价”分布。中文比较有代表性的文献有:朱丽、吕本富、彭赓采用AHP法对个人博客影响力从博客日志质量、博客作者权威性、博客的互动性进行评价[1]。邱均平、徐蓓、李江基于PageRank算法从实质性链接的角度对博客进行评价[2]。邱均平、于长福、马瑞敏采用社会网络法探求图林博客圈中的核心博客[3]。张晓阳、李晓亮采用类h指数对科学网博客影响力进行评价[4]。常娥、魏彬以图情博客为例构建了网络原生数字资源评价指标体系,包括文章总数、浏览次数、回帖数、链接情况、发文频率等8个指标[5]。严炜炜采用9个维度25个指标构建微博客服务质量评价模型[6]。

对外文文献采用以主题“Blog evaluation”在Web of Knowledge检索,采用ROST英语词频统计软件进行词频统计,然后以ROST CM标签云的形式展现。

标签云 (Tag Cloud) 字号的大小一般是根据单词的出现频率相关,单词的出现频率越高则字号越大。从上述标签云图2可知,博客评价的热点在于retrieval(检索) 、extract(抽取) 、internet(因特网) 、software(软件) 、cluster(聚类) 、semantic(语义的) 、wiki(维基) 、algorithm(算法) 、splog(垃圾博客) 、spam(垃圾信息) 、blogosphere(博客圈) 、rss(信息聚合) 、forum(论坛) 、criteria(标准) 、vlog(视频博客) 。也就是说,主要围绕博客评价的标准、博客评价的算法、博客评价的工具而展开的。

图1 中文博客评价的语义网络分析

图2 英文博客评价词频标签云

外文比较有代表性的文献有:Li Jianjiang基于文本观点分析构建博客热度模型。该模型不仅考虑了博客主题的有关综述和评论的数量以及出版时间,而且还侧重于评论的倾向[7]。Tan Luke Kien - Weng、Na Jin -Cheon、Theng Yin-Leng通过博客特征分析,内容分析和社区标识检测帖子在博客圈的影响[8]。Nakajima Shinsuke基于博客的知识水平进行以信誉为本的博客排名[9]。Juffinger Andreas、Granitzer Michael、Lex Elisabeth通过利用已验证的内容对博客按可信度排名。具体做法是首先比较博客和参考语料集的数量结构;然后,分析每一个单独的博客内容,检查与核实的新闻语料的相似性。根据内容相似值的差异,作者对博客进行排名[10]。

1 实证研究

e线图情是北京雷速科技有限公司的产品,是面向图情界和个人提供集数据库服务、深度研究、专业咨询于一体的专业网站,下设海外、国内、学者、热点、专题、论文等多个版块,栏目内容丰富,有20多个,如风云人物、行业聚焦、国际动态、图情要闻、e线速递、行业协会、图情机构、理论技术、研究报告、图书馆建设等 (http:∥www.chinalibs.net/jieshao.aspx) 。笔者从“e线图情”中博客导航 (http:∥www.chinalibs.net/bkjh/Index.aspx) 选择部分有代表性的个人博客,并参考有关专家的建议,最终确定图书情报圈子里的32个博客作为分析样本 (参见表1) 。这些图情博客的博主大部分是图情教师或图书馆工作人员。这些比较有名的博客来自于新浪博客 (http:∥blog.sina.com.cn/) 、科学网博客 (http:∥blog.sciencenet.cn/) 、百度空间 (http:∥hi.baidu.com/) 、博客网 (http:∥www.bokee.com/) 。其中,新浪网博客是2005年开放,是全国主流、人气颇高的博客频道之一 (http:∥baike.baidu.com/) ,其上的图林博客圈非常有名 (http:∥q.blog.sina.com.cn/library/) ;科学网博客是中国科学报社主办的综合性科学网站科学网 (http:∥www.sciencenet.cn) 下属的一个频道,主要是针对科学家的实名博客 (http:∥bbs.sciencenet.cn/) ;百度空间是一个轻松记录、分享生活的内容社区;博客网是方兴东发起成立的知识门户网站,因成立于2002年时间早,号称“中国博客的发源地”。

本文以图书情报圈子里的这些个人博客为例,探讨图书情报博客的情况,以便促进图书情报界博主博客写作的积极性,提高博客的质量。以当年还在写博文的博客、有访问量统计的博客为例研究,因此一些名博如平凡博客、图谋不轨、老槐因关博而未进行统计。

表1 博客列表

因为5个指标的“量纲不同”,因此需要进行归一化处理。某指标得分归一值=该指标得分值/该类数据中该指标的最大值。

基本原理:

(1) 热度值=总访问数/博文数

(2) 中心度[11-12]:程度中心性 (Degree Centrality) 与中介中心性 (Betweenness Centrality) 是计算一个人在一个团体网络中最重要的两项指标。程度中心性衡量一个人作为中心人物的能力,中介中心性衡量一个人作为中介性的能力。

标准化程度中心度:

Xji是0或1的数值,代表i与j是否有关系。g代表此网络中的人数。

标准化中介中心性:

gjk代表j达到k的捷径数,gjk(ni) 代表j达到k的快捷方式上有i的快捷方式数,g代表此网络中的人数。

本文使用 Ucinet(http:∥faculty.ucr.edu/~ hanneman/net) 进行社会网络分析,分析图情博客各个博主之间的社会网络关系。分析结果见图3。

(3) 聚类分析

采用SPSS进行聚类分析。最后聚类4类:许培扬、赵星各一类、武夷山、图谋、沧浪水为一类、其余为另一类(见图4) 。

图3 图情博客社会网络分析

图4 聚类图

说明:①有的博客搬了几次家,以新家为准。所以,统计数据仅供参考。②有的博主有几个博客,这里以其中的一个进行介绍。比如,在本文仅对图谋的博客网上的(http:∥libseeker.bokee.com/) 进行了分析。③把某博客与其他博客直接链接的,规定为1,否则为0。④这是以这些博客为例计算的中心度,如果样本数不同,也许结果会有所差异。⑤这些博客服务商分别为新浪博客 (http:∥blog.sina.com.cn/) 、科学网博客 (http:∥blog.sciencenet.cn/) 、百度空间 (http:∥hi.baidu.com/) 、博客网 (http:∥www.bokee.com/) 。

2 小结与体会

第一,链接工具对于博客评价非常重要。在评价博客甚至网站时,如果有一个或者一些好的评价工具,这对评价而言实用而高效。在文献调研中,发现以前一些文献中采用的链接工具如AllTheWeb已不存在 (雅虎于2011年4月4日关闭搜索引擎AlltheWeb) ,有的软件如测试可访问性的Bobby软件因为研发该软件的公司被兼并,它现在已经消失了。此外,现存的自动评价工具还不完善,结果不很稳定,效果也不太理想。总之,比较稳定可靠的搜索引擎对于博客评价是非常重要的。

第二,本文仅是起一个抛砖引玉之作用。本文未考虑如下因素:博客评论、博客留言、链接访问、链接篇数、文章访问、反向链接 (是指其他网站指向本网站的链接) 、被推荐贴等等因素。再者,未分原创还是转载。将来还可从内容、利用等方面进行综合评价,综合采用人工评价与自动评价相结合。并可用百叶窗图进行可视化显示,某博客的某一优劣势一目了然。比如分析几个博客内容如武夷山与许培扬、书间道与图谋等等。

第三,本文以博文数、总访问数、热度值、程度中心度、中介中心度五项指标采用聚类评价,也就是说,运用社会网络分析的一些指标和传统的一些指标来评价博客的绩效,是一次有益的尝试和探索。评价是一个“仁者见仁、智者见智”的问题。在参考有关文献的基础上[13-15],可以说比较好的方法是定性方法和定量方法相结合。如何更科学合理的评价博客还有很大的探索空间,尚有许多方面有待在今后的深入研究中继续补充和完善。

[1]朱丽,吕本富,彭赓.基于AHP法的个人博客影响力评价方法研究[J].数学的实践与认识,2008,(15) :109-117.

[2]邱均平,徐蓓,李江.BlogRank算法及其在图书馆博客中的应用[J].图书情报知识,2008,(1) :68-71,77.

[3]邱均平,于长福,马瑞敏.图林博客的社会网络分析[J].图书情报工作,2008,(11) :6-9.

[4]张晓阳,李晓亮.科学家博客h指数评价及其相关性分析[J].图书情报工作,2010,(2) :66-69.

[5]常娥,魏彬.网络原生数字资源优选与评价研究[J].情报杂志,2012,(2) :163-167.

[6]严炜炜.用户满意度视角下微博客服务质量评价模型研究[J].图书情报工作,2011,(18) :53-56.

[7]Li Jianjiang;Zhang Xuechun;Weng Yu;等.Blog Hotness E-valuation Model Based on Text Opinion Analysis[J].Eighth IEEE International Conference on Dependable,Autonomic and Secure Computing,Proceedings,2009:235 -240.

[8]Tan Luke Kien-Weng;Na Jin-Cheon;Theng Yin-Leng.Influence detection between blog posts through blog features,content analysis,and community identity[J].Online information review,2011,35(3) :425-442.

[9]Nakajima Shinsuke;Zhang Jianwei;Inagaki Yoichi et al.Blog Ranking Based on Bloggers' Knowledge Level for Providing Credible Information[J].Lecture Notes in Computer Science,2009,5802:227-234.

[10]Juffinger Andreas;Granitzer Michael;Lex Elisabeth.Blog Credibility Ranking by Exploiting Verified Content[J].WICOW 09,2009:51-58.

[11]Borgatti,S.P.,Everett,M.G.and Freeman,L.C.Ucinet for Windows:Software for Social Network Analysis[M].Harvard,MA:Analytic Technologies,2002.

[12]罗家德.社会网分析讲义 (第2版) [M].北京:社会科学文献出版社,2010.

[13]王一华.国内外网站评价研究综述[J].情报科学,2013,(11) :125-132.

[14]王一华.基于超效率DEA的网站绩效评价[J].情报科学,2012,(9) :1371-1375,1384.

[15]郝晓玲,杜沁怡,黄海量.企业家微博影响力的综合评价研究[J].情报科学,2015,(3) :95-101.

猜你喜欢

图情网络分析博客
数字时代图情档学科教育的数据化创新
新文科建设背景下的图情档学科建设(笔谈)“新文科”呼唤图情档成为“硬”学科
聚青年学者之睿智 窥图情档学科之未来
——写在《图书与情报》“图情档青年学者专辑”出版之前
铁路有线调度通信的网络分析
2016年社交网络分析
中国盲人数字图书馆服务情况及展望
大班幼儿同伴交往的社会网络分析