在线知识社群中的意见领袖识别模型研究
2019-06-11童莉莉李荣禄闫强
童莉莉 李荣禄 闫强
摘要:在线知识社群是近年兴起的虚拟学习组织,意见领袖对社群的活跃度、持续性都有着重要影响。该文进一步考虑意见领袖的自身传播属性和社交媒体环境下的分享行为,构建了用户影响力算法,在此基础上提出了在线知识社群意见领袖识别模型。采用用户影响力算法中的影响力特征值作为聚类向量,基于K-means聚类算法进行聚类,获得各个聚类子类的影响力均值,提取理论意义上的意见领袖。最后通过在线知识社群实证研究,验证理论模型的科学性。用户的自传播属性和受激属性对于识别出意见领袖有着较好的先导作用,所得到的意见领袖群体有一定的代表性,进一步根据分析结果提出研究优化方向和相应管理建议。
关键词:意见领袖识别;在线知识社群;影响力;聚类算法
中图分类号:G434 文献标识码:A
一、引言
互联网、云计算、大数据等技术的发展,使教育信息化的形式不断推陈出新:网络课程、翻转课堂、MOOCs、远程教学、微课、直播课程等相继产生,在线知识社群已经成为有共同内容偏好的学习者聚集在一起建构知识、交流情感的有效学习环境。与此同时,在线学习的效果还有待推进,以MOOCs为例,研究表明完成全过程的学习者比例仅为3%到15%。剖析在线知识社群成员的行为轨迹不难发现,其获取知识的途径一般集中表现为个人认知、相互分享、指导者引领等方式。有学者发现,意见领袖往往能通过在线交流形成的直接或間接的社会关系,对其他用户造成波及效用。国内对于意见领袖的识别研究目前集中在论坛、微博等方面,而对在线知识社群中意见领袖的有效识别还有较广阔的研究空间。
本文基于作者在网络环境教学中的经验,从社会网络信息传播的角度,探索在线知识社群中的意见领袖识别方法,并就意见领袖对于在线知识社群的活跃度、知识传播效率和社群生命周期的影响做实证研究。
二、意见领袖识别模型研究与影响力算法综述
(一)意见领袖识别模型
意见领袖作为在线知识社群中“信息的加工和扩散者”“学习的监督与指导者”,对于在线知识的传播具有重要的促进作用,能够提升传播范围、传播速度和传播深度。例如卢潇以“学习科学与技术”教育虚拟社群为例,通过发帖类型、发帖量、浏览量、发帖内容等行为或内容数据筛选出意见领袖,进一步发现意见领袖能增强成员的元认知能力,激发成员的思考。
目前对于在线知识社群意见领袖识别的相关研究以复杂网络的角度为主流,基于S3模型、基于社会网络分析法、基于聚类算法、基于用户影响力算法等识别方法构成了当前的主要成果。颜榴红等着眼于学习共同体的意见领袖识别,将评分数据纳入意见领袖识别的关键环节——影响力分析,提出了一种满足S3(社交性、扩展性和安全性)计算需求的协议模型;朱志国等先从用户网络中心性与用户自身活跃度两方面入手,选择7项测度指标——“度中心度”“接近中心度”“中介中心度”“特征向量中心度”“发帖量”“发出评论量”和“经验值”,提出了综合意见领袖测度模型;王珏等提出了7个网络意见领袖的特征值,并运用聚类算法筛选出意见领袖群体(如图1所示);吴渝等根据论坛帖子数据中提取的用户属性特征(用户的活跃度和用户的被关注度)形成影响值初步模型,再运用UI-LR算法计算用户最终的影响值,进而得到意见领袖(如图2所示);罗凌基于PageRank算法设计了基于学习者影响力的识别方法,可以更有效地识别出影响力较大的学习者作为意见领袖(如图3所示)。
(二)影响力算法
信息科学领域的学者们主要从拓扑结构、行为特征、内容特征这3个维度来度量影响力:一是给定社会网络结构数据,由用户之间的社会关系可以推测出影响力模式及其强弱;二是给定用户行为数据,由用户行为发生的时间先后次序推测出其影响力模式及其强弱;三是根据用户的信息内容特征如话题因素、用户观点等推测其影响力模式及强弱。
韩忠明等基于节点与邻居节点之间的三角结构提出了一种有效的节点影响力度量指标模型,该模型不仅考虑节点间的三角结构,同时考虑了周边邻居节点的规模。
吴渝等根据用户在网络论坛中的行为,提取用户属性特征值,进一步提出了网络论坛用户影响值模型(如图4所示),影响值计算公式如下:
郭宇等从情感分析和用户影响力入手,构建了基于情感分析的用户影响力模型,其中情感分析是从用户的评论信息内容提取情感信息。
(三)小结
在影响力算法设计上,本文借鉴吴渝和罗凌两位学者的用户影响力模型,其中吴渝对于用户影响力衡量指标采用的是活跃度和被关注度,活跃度主要指发帖数和回复数,被关注度主要指被回复数和被浏览数;罗凌对于用户影响力指标主要采用了用户在论坛、在线聊天和电子邮件这三方面的行为指标。在意见领袖识别模型设计上,本文借鉴罗凌、吴渝和王珏论文中的思路,综合考虑基于用户影响力的意见领袖识别方法和基于聚类的意见领袖识别方法。
综合对比以上在线知识传播环境下的用户影响力评价指标,本文将在借鉴前人成果的基础之上,在以下方面做持续改进:(1)增加考虑用户自身传播属性所带来的影响力;(2)增加考虑用户的一些自主行为带来的影响力,比如在线学习时长、作业完成情况等;(3)在网络环境下,用户分享所带来的潜在影响力不容忽视,本文还将兼顾考虑现今朋友圈、微博等传播的力量,融入新的分享意图类因素。
三、在线知识社群中的意见领袖识别实证研究
(一)基于影响力算法的意见领袖识别模型设计
基于影响力算法的意见领袖识别模型主要借鉴了前人基于社会网络分析、聚类算法的分析理念。采用在线知识社群用户影响力模型中的特征值,基于K-means的聚类算法,提出基于影响力算法的意见领袖识别模型(如图6所示)。
1.用户影响力模型构建
本文在对学习者的自身属性和在线学习行为分析的基础上,把用户影响力分为用户自身影响力和用户行为影响力,进一步设计了用户影响力初步模型(如图7所示)。
(1)用户自身影响力:由用户自身属性所形成影响力
节点自传播属性:节点在不受激励情况下,传播信息时的意愿值;
节点受激传播属性:节点在受到激励时,传播信息时的意愿值;
节点受激接收属性:节点在受到激励时,接收信息时的意愿值。
(2)用户行为影响力:用户在线学习行为所产生的影响力
根据用户行为是否由合作产生,将行为影响力分为自主行为影响力和协作行为影响力。
自主行为影响力:主要指在线学习时长、作业成绩、考试成绩;
在线学习时长:线上登陆学习的时间,来衡量日常的学习态度;
作业成绩:平时的作业成绩,来衡量日常学习表现;
考试成绩:期末作业考核成绩,来衡量知识获取、分析、整合和应用的能力;
以上三者能很好的衡量在线自主学习行为所产生的影响力。
协作行为影响力:主要指在线互动次数、在线留言次数和在线分享次数;
在线互动次数:在线学习课程中和老师或学生互动的次数;
在线留言次数:在在线课程论坛留言的次数;
在线分享次数:在朋友圈或微博等网络媒介上推荐在线课程的意愿值。
(3)用户影响值的计算
根据用户影响力模型,可得用户影响力值Influence计算公式如下:
2.基于K-means的聚类算法
聚类算法分为划分法、层次法、基于密度的方法、基于网格的方法、基于模型的方法(如SOM、EM、COBWEB)、模糊聚类方法等。本文采用划分法中的K-means算法,其基本思路和步骤如下:(1)随机或按某种策略从n个对象中选择k个对象作为初始的类中心(Centriod,Mean Point);(2)计算每个对象与这k个类中心的距离;(3)将每个对象划分/分配到与其距离最近的类中心所在的类中;(4)回到第2步,直到和前一次划分,分配结果无差异,停止。
3.在线知识社群意见领袖的选择
意见领袖应该是活跃于在线知识社群中具有较大影响力的中心人物,一般来说他们是一个很小的群体,那么这个群体的用户影响值的均值都比较大。为了筛选出意见领袖,得到各个聚类子类后,将成员数量较少的子类作为潜在的意见领袖群体,进一步计算出各个子类的影响值均值,影响值均值大的群体为意见领袖群体。
(二)实证研究
1.数据采集
本文从作者所教授的《电子商务》课程中随机抽取200人进行问卷调查,该课程为高校在线课程中参与人数较多的网课之一,具有较好的数据抽样基础。
2.数据分析
本文先对在线知识社群成员的自身属性和在线行为作描述性统计,得出初步的分析结论;接下来采用聚类分析的方法对在线知识社群的学员进行分类,试图从聚类的结果中找出意见领袖群体。
(1)描述性统计
为了解在线知识社群成员的自身属性和行为属性的特点以及在线知识社群活跃度对社群成员的影响,我们研究了学习者的自传播属性、自身受激属性(受激传播属性和受激接受属性)、自主行为属性(在线学习时间、作业成绩、期末考试成绩)、协作行为属性(互动次数、留言次数、主动推荐课程意愿)、社群成员活跃度对社群的影响等,具体结果如表1所示。
通过初步的描述统计分析,可以看到这一在线知识社群成员的典型特征:
从自身属性来看,自身传播信息能力较弱(一个月左右更新社交平台朋友圈的占48.72%),自身受激传播信息的能力较强,且多从身边人角度考虑(奖励是朋友需要的会转发信息的占64.10%)。
从行为角度看,分自主行为和协作行为两个维度进行观察。从自主行为来看,在线学习时间较长(一周一般学习5-7小时占43.59%),平时成绩非常好(90分以上的占38.46%,80-90分占28.21%),期末成绩良好(80-90分占56.41%);从协作行为看,比较愿意互动(在线课程中互动1-3次及以上的占比61.51%),不太喜欢课后的留言(一般不喜欢留言的比例占48.72%),会主动向身边人推荐好的在线课程(占比61.54%),如果在线知识社群活跃,社群成员感到对学习很有帮助,愿意参与(占比58.97%)。
(2)聚类分析
利用Rapidniner软件进行聚类分析,将影响力模型中的9个典型特征值作为聚类的变量。
a.选择最佳的聚类中心数
对于最佳聚类中心数的选取,可以参考DBI值(Davies Bouldin值)。一般来说,DBI值越小,所对应的聚类效果越好,选择此时的聚类中心数,如表2所示,可知K=8是最合适的聚类中心数。
b.聚类结果
将Clustering算子中K的参数调至8,运行整个流程,得到聚类结果(如表3所示)。
由表3知,成员数量较少的聚类子类是cluster_0,cluster_1,cluster_3,cluster_6,cluster_7,可进一步计算各子类的平均影响力值来确定意见领袖。
(3)基于影响值确定意见领袖
由在线知识社群用户影响力模型得到的各特征值的权重指标如下:(节点自传播属性,节点受激传播属性,节点受激接收属性,在线学习时长,作业成绩,考试成绩,在线互动次数,在线留言次数,在线分享次数)=(0.125,0.0625,0.0625,0.15,0.075,0.15,0.15,0.15,0.075)。根據用户影响力值Influence计算公式得到各聚类中心的平均影响力值(如表4所示)。
由计算结果可知,Cluster_0的影响力均值最大,是最适合的意见领袖群体人选,该群体的特点是:基本每天都会发朋友圈或微博;有奖励措施且相关信息是朋友需要的会转发;所在虚拟社群活跃的话,接收信息的能力强;一般能够接受的在线学习时长是7小时以上;在线互动次数1-3次;有同学在论坛里提问的话会留言自己的看法;平时作业在80-90分左右,期末成绩也在80-90左右——这一类人群的成绩不是特别拔尖;遇到好的在线课程一般倾向于向身边人推荐。
四、基于意见领袖识别的在线知识社群管理建议
(一)意见领袖的发现和培育机制
当在线知识学习社群内的意见领袖存在时,可以通过多种方法识别出来,本文的研究结论发现:用户的自传播属性和受激属性对于识别出意见领袖有着较好的先导作用。当在线知识学习社群内的没有显著意见领袖时,培育和激发潜在的意见领袖群体可以从以下着手:
1.创建良好的交互学习环境,培育潜在的意见领袖群体
作者调研发现,当所在学习社群成员之间积极互动时,会对学习者积极性产生促进作用(占比58.97%)。意见领袖一般是在讨论、交互中产生的,为此要提供一个良好的交互学习环境:一方面建设好在线知识学习社群所能利用的交互工具如网络论坛、在线聊天室及朋友圈、微博、短视频等传播媒体,为交互提供良好的物理环境;另一方面,规划好在线知识学习社群的学习活动和任务,创造积极的氛围,为意见领袖特质的形成提供良好的人文环境。
2.形成有效的激励和评价机制,激发意见领袖群体的动机
本文实证研究发现的意见领袖群体受激传播属性强,当“有奖励措施且相关信息是朋友需要的会转发”,我们可以利用好这一特点,通过激励手段和评价方法激发潜在意见领袖的动机。作为虚拟社群,在线知识社群更多考虑精神上的激励,激励机制的设定可以参考三种机制——点数、徽章和排行榜。比如点数,当学员在论坛留言、在线上课程中互动等,给予一定的积分,当达到一定的分数时,给予奖励,比如平时作业的成绩。
(二)意见领袖的管理和引导措施
当识别出在线知识社群的意见领袖后,要注意引导,发挥其重要作用,提高社群的活跃度和学习效果。意见领袖的管理和引导,重点在于社群组织者对意见领袖在社群中的定位。推荐的措施包括:利用意见领袖的二次传播能力,传播教师认为重要的知识和信息;把意见领袖纳入在线教学的重要组织者,发挥其舆论引导能力,引导社群内的讨论方向,营造良好的氛围;利用意见领袖的特质如知识能力帮助社区内成员解决问题。
五、结语
本研究根据用户影响力算法提出了在线知识社群意见领袖识别模型,具体过程如下:将用户影响力算法中的影响力特征值作为聚类向量,获得各个聚类子类的影响力均值,据此提取出意见领袖。在变量设计时,充分考虑到用户自身属性所产生的影响力,以及当下微博、朋友圈、短视频等热门社交媒介的影响。文章基于《电子商务》网络课程进行实证研究,所得到的意见领袖群体有一定的代表性。
本文目前的研究进展中尚有一定的局限性:如在变量设计时,没有考虑用户的信息内容特征,再比如实证研究时的样本量规模还可以进一步扩大。在下一步工作中,将进一步完善影响力算法和变量选取,并在更大的社群中进行实证研究。同时,笔者也希望深入研究在线知识学习社群中意见领袖对知识传播效率的影响机制,更好地发挥意见领袖在知识传播过程中的作用。
作者简介:
童莉莉:副教授,碩士生导师,研究方向为复杂网络与信息传播规律、现实与虚拟场景下的行为数据分析(13810008892@139.com).
李荣禄:在读硕士,研究方向为现实与虚拟场景下行为数据分析、信息传播效率(291616793@qq.com)。
闫强:教授,博士生导师,研究方向为信息网络与信息安全、数据智能分析系统。