学术社交网络信息传播特征与规律研究
2013-10-28缪健美姜华强
缪健美,姜华强,,项 洁
(1. 杭州师范大学科技处,浙江 杭州 310036;2. 杭州师范大学杭州国际服务工程学院,浙江 杭州 310012)
学术社交网络信息传播特征与规律研究
缪健美1,姜华强1,2,项 洁2
(1. 杭州师范大学科技处,浙江 杭州 310036;2. 杭州师范大学杭州国际服务工程学院,浙江 杭州 310012)
分析学术社交网络信息传播的特征,构造了一个学术社交网络信息传播模型.然后,通过编程提取了学术社交网络——研究之门网站中的用户数据,构造一个用户关系网络数据集.根据对随机内容的传播情况统计,绘制出信息传播的趋势图,同时还计算了该网络中信息传播的概率,形成了信息在网络中的传播规律.
学术社交网络;信息传播;传染病动力学;信息传播模型
学术社交网络是在文献数量呈指数型增长,社交网络网站迅速发展的背景下,为加强学术信息交流,提高研究效率建立起来的一种基于网络的交流平台[1].学术社交网络借助互联网,通过提供学术科研的辅助工具和服务,汇聚人们在进行学术研究过程中的沟通需求,其主要受众是教师、学生、科研工作者等.通过学术社交网络不但能建立起科研人员的人际联系,增强沟通效率,更能够通过学术推荐提高信息获取过程中的速度和准确率,更好地促进学术成果的传播和影响.
1 学术社交网络信息传播特征
相对于传统的学术信息传播模式, 学术社交网络中的信息传播具有以下特征:
1.1 真实性的信息传播环境
学术博客、WIKI等网络学术信息传播方式[2]主要在非特定人群中进行信息传递,对信息被谁获取、获取后有何反应等等一律不予控制.而学术社交网络通过熟人或者建立信赖关系的学术研究个体间进行交流,在身份确认的前提下进行“一对一”或“一对多”的双向沟通.这种环境保证了学术观点和理论的真实性和可靠性,提高了学术信息传播的有效度.
1.2 多维度的信息传播方式
在传播方式上,学术博客和WIKI采用的是“一对一”或“一对多”的传播模式[3].由一个信息发布者向不明规模与特征的受众发布信息,信息发布者与受众没有确定性联系,无法了解信息何时被接收,被何人接收,有何意见.学术信息只是被广播了一次,与传统的学术期刊的传播模式类似.学术社交网络则兼具“一对一”和“一对多”的传播形态.通过学术社交网络,用户可以向某一个好友进行一对一的传播,也可以向整个熟人学术关系网络进行广播.用户可以向追随者传播信息,而追随者可以根据自身的判断选择转发或评论,实现信息的又一次传播,通过人传人的方式,最终形成“一对多”、“一对一”、“多对多”和“多对一”的信息传播方式.
1.3 即时交互式的传播特点
传统的学术信息交流文档一般篇幅较长,同时受信息发布渠道的限制,学术信息往往比较滞后,而且读者的不固定性也决定了学术信息传播过程中的互动性不强[2].基于学术社交网络的传播模式,其信息具有简短性,因而降低了信息发布渠道的门槛,通过绑定移动设备便可以做到信息的生产和发布同步.通过一对多的人际关系网络,可以快速进行实时交流.
1.4 多元化的信息传播途径
学术社交网络上的信息具有多元化的特征,具体表现为媒介方式、传播功能、语言表达的多元化.学术社交网络以声音、表情、肢体语言为主体的人际传播与以文字、视觉图像为主体的大众传播于一体,运用多元化传播符号,使得信息达到了高度逼真的还原.
2 信息传播模型
学术社交网络摆脱了传统学术信息传播过程中以学术内容为中心的传播模式,而是以用户为主导, 依靠人与人之间的关系进行信息的传播,有助于学术信息的传播.通过对学术社交网络信息传播模型的研究,有助于更好地了解信息的传播过程,分析学术研究趋势,认识学术传播行为,创新学术成果评价方式.
2.1 学术社交网络信息传播过程
社交网络的发展使学术信息生产、出版、传播、评价等各个环节都发生了变化. 通过用户、内容、关系和工具构成的学术社交网络,使科研人员(用户)能够简单方便地发布科研信息(内容), 又通过工具的订阅机制实现各种关系运营, 形成滚雪球式的反馈.以目前全球最大的科学社交网路服务网站研究之门(http://www.researchgate.net/)为例,它包括实时反馈(live feed)、讨论主题(topics)、出版物(publications)、项目(projects)等功能.根据信息传播的过程可以分解为关注过程、提问过程、回复(评论)过程、跟踪过程.关注过程,用户u通过个人简介、系统推荐(一般为同一机构的同事)或讨论主题提问引起感兴趣的用户f关注,这时用户f成为了用户u的追随者(“粉丝”),这一过程不需要得到受关注用户的同意,之后用户u更新的所有消息便会同步出现在用户f的实时反馈页上.提问过程,用户可以随时随地在讨论主题页提出问题或发布消息(限制在150字),但可以附加说明文字、论文、超链接等.回复(评论)过程,用户可以对任何一个问题(或消息)进行回复评论,同样也可以附加说明文字、论文、超链接等.跟踪过程,用户对感兴趣的问题可以使用关注问题功能进行跟踪,被跟踪的所有内容都会更新到实时反馈页.
由此,消息在学术社交网络上的传播过程可以简述如下:
(1)用户u通过讨论主题页发布消息;
(2)用户u的追随者通过其实时反馈页上的内容提醒或主动访问u的活动(activity)页获知消息;
(3)用户u的追随者中对消息感兴趣的追随者f可能会对该消息进行回复、评论、跟踪,或者使用共享功能将信息进行再次传播.
(4)如此重复过程(2)和(3).
2.2 学术社交网络信息传播模型描述
根据学术社交网络信息传播规则的分析,我们把用户定义为节点,个体之间的关注关系抽象成节点之间的边,信息只沿着边传播.由于一个用户发布的消息会被其追随者看到,并以一定的概率分享、传播,当然,也有一部分追随者对其内容不感兴趣成为“免疫者”,信息到该追随者将不再传播.为此,我们把网络中的节点分为三类: 传播节点、未感染节点、免疫节点.传播节点表示该节点接受了来自其邻居节点的信息,并具有一定的传播能力,即有概率传播;未感染节点表示该节点没有接受过来自其邻居节点的信息,并有机会接受信息,即有概率被感染;免疫节点表示该节点已经接受了其邻居节点的信息,但是不具有传播能力.
基于上述分析, 建立一个学术社交网络信息传播模型[4], 描述学术社交网络中信息传播随时间变化的过程.
首先定义如下基本条件:
(1)定义总节点数为N,未感染节点、传播节点、免疫节点三类,三类人在总节点N中占的比例分别为s(t) ,i(t)和r(t),t为传播时间.
(2)一个传播节点与一个未感染节点接触,则未感染节点会以概率λ转变成为传播节点.
(3)一个传播节点与一个免疫节点接触,则传播节点会以概率μ转变成为免疫节点.
记初始时刻的未感染节点比例为s0(s0>0),传播节点比例i0(i0>0),免疫节点比例r0=0 ,得初始值
模型方程无法求出解析解,可以通过仿真数值解法求出s(t),i(t)和r(t)的数值解.
图1 研究之门网站部分人际关系图Fig. 1 Part of social network of research gate
3 模型验证与分析
为了验证本文所建立的信息传播模型,以学术社交网路研究之门(http://www.researchgate.net/)为研究对象,展开信息传播规律的研究.
3.1 实验数据获取
首先,建立学术社交网络用户关系结构图.我们使用Python 语言编写了一个网络爬虫脚本,通过一个注册用户的身份进行页面抓取,采用滚雪球的采样的方法,执行广度优先搜索(BFS)算法提取用户信息[8-9].从指定的用户开始,获得用户的追随者和关注人列表,加入队列中,再以该用户的追随者和关注人为操作对象,进一步获得其追随者和关注人列表,加入队列,如此逐层获取,直至达到预期的用户数量为止.这一生成的网络结构是研究之门网站社交网络的一个子网络,该网络是个有向图,记为G=(V,E),其中节点v∈V表示一个用户ID,有向边(u,f) ∈E表示用户f是用户u的追随者,信息从u流向f.所获取的子图的节点数N=702,边数E=1 391,平均度= 3.963,使用Cytoscape工具绘制该关系图,如图1所示.
然后,在网络中选择节点度0~5的用户问题10个,节点度6~10的用户问题10个,节点度>11的用户问题10个,对它们的传播路径进行跟踪和采集,收集问题发布后一个月内所有内容传播的时间、用户ID等.
3.2 验证结果与分析
通过上述方法得到的数据可以统计每日传播节点、未感染节点的数量,计算传播节点、未感染节点、免疫节点三类在总节点中的占比.图2给出了节点度0~5、6~10、>11的用户传播节点i(t)随着时间变化的趋势图.图3给出了未感染节点s(t)随时间变化的趋势.
图2 传播节点i(t)变化趋势Fig. 2 Infected node trend
图3 未感染节点s(t)变化趋势Fig. 3 Not infected node trend
从图2和图3可以看出,由于学术社交网络的高连通性,信息在网络中传播的门槛几乎为零,即使初始节点的人际关系很少,问题信息也可以传播出去.当初始传播节点的度较大时,信息在网络中的传播速度较快.相反,当初始传播节点的度较小时,信息的传播具有滞后性,即信息从没有传播到开始传播需要一定的时间.
表1 信息传播模型传染概率λ和免疫概率μ值
为了更精确地分析该网络中信息传播的规律,把i(t)和s(t)的值带入模型方程,计算网络G的传染概率λ和免疫概率μ,如表1所示. 从中可以看出,节点度高的节点,信息传播出去的概率要高,而免疫概率差距不是很大.这与我们的设想较一致.
4 总 结
文章研究了一种学术社交网络中的信息传播模型,通过定义3个传播规则,并结合复杂网络和传染病动力学理论,建立了微分方程组.通过编程获取了研究之门学术社交网站中的一个人际关系子网络数据集,然后,分析了该网络中不同度的传播节点的传播行为.实验结果表明:由于学术社交网络的高连通性,信息在网络中传播的门槛几乎为零;初始传播节点的度越大,信息越容易在网络中迅速传播,中心节点具有较大的社会影响力.经初步分析,学术社交网络确实可以进一步密切科研人员的关系,具有正相关性.
[1] Tang Jie, Zhang Jing, Yao Limin,etal. ArnetMiner: extraction and mining of academic social networks[C]// Proc. of 14th Intl. Conf. on Knowledge Discovery and Data Mining (SIGKDD 2008). Henderson, Nevada,2008:990-998.
[2] 刘佳.基于网络的学术信息交流方法与模式研究[D]. 长春:吉林大学,2007.
[3] 郭海霞.新型社交网络信息传播特点和模型分析[J]. 现代情报,2012(1):56-59.
[4] 张彦超,刘云,张海峰,等.基于在线社交网络的信息传播模型[J].物理学报,2011(5):66-72.
[5] Newman M E J. The structure and function of complex networks[J]. SIAM Review,2003,45(2):167-256.
[6] 曾璠.基于小世界网络的危机信息传播模型研究[D].合肥:中国科学技术大学,2009.
[7] 余雷,薛惠锋,李刚.传染病传播模型研究[J].计算机仿真,2007(4):57-60.
[8] 赵丽,袁睿翕,管晓宏,等.博客网络中具有突发性的话题传播模型[J].软件学报,2009(5):1384-1392.
[9] 郑蕾,李生红.基于微博网络的信息传播模型[J].通信技术,2012(2):39-41.
CharacteristicsandLawsofAcademicSocialNetworkInformationDissemination
MIAO Jianmei1, JIANG Huaqiang1,2, XIANG Jie2
(1. Science and Research Department, Hangzhou Normal University, Hangzhou 310036, China;2. Hangzhou Institute of Service Engineering, Hangzhou Normal University, Hangzhou 310012, China)
This paper analyzed the characteristics of academic social network information dissemination, constructed an academic social network information dissemination model, extracted the user data from the ResearchGate website by programming, and created a network dataset of users’ relations. Through the statistics of random contents, the paper drew the trend of information dissemination, calculated the probability of information dissemination, and summarized the laws of dissemination.
academic social networks; information dissemination; epidemic dynamics; information dissemination model
2012-08-29
浙江省教育厅科研计划项目(Y201018887).
缪健美(1958—),女,副研究员,主要从事科技管理研究.E-mail:mjm@hznu.edu.cn
10.3969/j.issn.1674-232X.2013.01.014
G350.7
A
1674-232X(2013)01-0070-05