APP下载

基于PCA和CA的高校官方微博影响力评价与比较研究

2018-09-10于洋洋袁珈琳朱周熠刘婷

中国商论 2018年25期
关键词:评价模型聚类分析主成分分析

于洋洋 袁珈琳 朱周熠 刘婷

摘 要:本文以25家“985”高校官方微博为研究对象,在分析用户行为特征之后从微博覆盖度、用户活跃度和交互性3项一级指标进行考量,选取了微博数、粉丝数、关注数等10项二级指标构建微博影响力综合评价模型,并利用主成分分析(PCA)和聚类分析(CA)对高校官方微博影响力进行比较研究。微博影响力水平可通过互动反馈主成分、用户活跃度主成分、原创品牌主成分综合反映,并建立了微博影响力综合评价模型。利用聚类分析将样本划分为了6大类型,即强势领先型、综合落后型、粉丝主导型、均衡发展型、综合领先型以及全面落后型,接着分析总结了每类特点并给出了相应建议。该研究对高校官方微博影响力提升具有重要的参考意见。

关键词:高校官方微博 影响力 评价模型 主成分分析 聚类分析

中图分类号:F069 文献标识码:A 文章编号:2096-0298(2018)09(a)-167-06

2006年由博客技术先驱blogger创始人埃文·威廉姆斯(Evan Williams)创建的新兴公司Obvious推出了大微博服务,最早提供微博业务的平台—— Twitter由此诞生。2005年从校内网起家的王兴于2007年5月创建了饭否网,微博这一理念由此引入中国。李开复[1]在《微博改变一切》中认为微博是一个可以自由表达自身观点,传播思想,更方便快捷的与人交流的一个每次发布限制在140个文字以内的微型博客。据第38次《中国互联网发展状况统计报告》显示,截至2016年6月,微博月活跃人数已达到2.97亿。由此可见微博发展规模不断增大,已从快速增长期发展过渡到成熟期。

当前高校的学生成长于信息化高速发达的互联网时代,而微博凭借着操作简单、方便快捷、信息丰富等优势已成为学生日常生活中必不可少的信息获取工具之一。为了适应时代的发展,紧跟学生的网络使用步伐,全国越来越多的高校开通了官方微博,通过微博进行信息发布与交流,对学生进行网上舆情引导、思想政治教育等工作,搭建了一个集信息交流、思想引导、咨询沟通等为一体的高效便捷的服务平台。高校开通微博不仅方便了广大学生对信息的获取、分享与评论,也在一定程度上提高了高校的社会认知度,拉近了高校与大众的距离,有助于促进高校自身形象的提升。

《现代汉语词典》中对影响力的定义是“对别人的思想或行动所起的作用,对人或物所起的作用”。微博影响力则是指微博用户在微博平台上的信息传播范围、影响范围的能力,微博用户的某个行为对他人的行为、思想等产生了影响,这种影响范围越广,涉及人数越多,那么我们就认为此用户的影响力越大。高校官方微博影响力的大小在一定程度上直接影响到高校对大众舆论引导的方向和能量。一般来说,高校官方影响力水平越高,信息传播的范围就越广,也越能引领舆论的发展方向,发挥出高校对广大学生的思想政治教育、價值观念引导等作用。因此,如何提高高校官方微博的影响力,迫切需要分析影响微博影响力的因素,构建影响力评价指标模型。通过对官方微博影响力的研究,为高校官方微博的运行管理和规范机制提出意见,提升微博的影响力,使官方微博发挥出它应有的作用,为广大学子提供更优质、更全面的服务。

1 相关研究述评

通过查阅文献发现,有关微博影响力评价与比较方法的研究,主要有以下三种类型。

(1)以交互行为为研究重点的沈徽[3]认为个人或单元在网络中的影响力可由在网络虚拟世界中的好友数量、信息传播能力以及激发他人产生交互行为的能力所决定,在微博平台中影响力大小则表现为发布的微博信息或转发的内容被他人转发、评论、回复、点赞等使信息进一步传播的行为的数量多少。原福永等[4]给出了用户活跃度计算公式、微博影响力计算公式,将两者以适当的权重相结合得到了用户的影响力的计算公式。将用户被关注度融入用户活跃度和微博影响力的计算中,再结合用户的行为提出了一种使用基于Page Rank和用户行为权值相结合的微博用户影响力模型。

(2)以个体属性为研究重点的林琛[4]重视个体类型对评价指标表征能力的影响,选取粉丝数(Fn)、被转发数(Rn)、被评论数(Cn)、平均被转发数(ARn)和平均被评论数(ACn)五类指标对官方媒体、专业网站、军事人物3种不同类型的微博个体的信息传播影响力进行了评价,还进一步揭示了5种传播影响力评价指标之间的相关性,分析了相关性的影响因素。M.Cha[5]等以用户的3种个体属性为研究出发点,即被关注、被转发和被提及,选取用户粉丝数、消息被转发次数、消息被提及次数三个指标对传播影响力进行研究分析,通过研究数据发现粉丝数不能完全决定用户的影响力,它仅能够代表个体受关注的程度。而被转发次数和被提及次数则在一定程度上更能反映个体影响力。

(3)以网络拓扑结构为研究重点的Chen Xu[6]等人在基于Rage Rank算法模型计算微博用户影响力的基础上提出了Personal Rank算法,Kwak H[7]等人用Rage Rank算法对用户影响力进行了分析,并对转发数、粉丝数指标进行了相关性分析,发现二者之间存在弱相关性。谭思妮[8]对发布、关注/被关注、转发/被转发、评论/被评论、发私信、提及、发起话题/参与话题讨论七个特征进行归类整理,提出了蛛网态微博关系网络中基于用户质量的微博用户影响力评估模型UIEM-CRM。

综上所述,有关微博用户影响力的研究主要集中在以交互行为、个体属性、网络结构等侧重点进行研究。本文以“985工程”高校官方新浪微博为例,基于微博的关注、信息发布、转发、评论、提及、点赞等功能,通过对用户行为特征进行全面分析后选取合适指标,提取相关数据,用主成分分析和聚类分析对高校官方微博的影响力进行实证研究。通过分析提出有效提升高校官方微博影响力建议,以期为高校微博改进运营管理机制和内容建设模式提供参考意见,促进高校微博的发展。

2 高校官方微博影响力评价指标构建

传统的单以微博用户的粉丝数来衡量用户影响力的方法已经失去了信服力,微博用户的影响力指标的选取应根据微博的基本功能全面考虑。经过分析研究用户行为特征发现,微博用户的影响力可以从微博的覆盖度、用户活跃度以及交互性三方面进行指标的构建。其中微博的覆盖度包括是加V认证、微博数、粉丝数、关注数四类指标;用户活跃度包括日均微博数、微博原创率、文章数、评估期内日均微博数四类指标;交互性包括平均每条点赞数、平均每条评论数、平均每条转发数三类指标。

3 高校官方微博影响力评价及比较研究设计

3.1 数据来源

“985工程”高校共39所,据统计,目前37所高校均已开通新浪官方微博,60%以上的官方微博在2010年开通,据调查显示2010年是微博发展的春天,微博用户数量如雨后春笋迅猛增长。因此,2010年被称为微博元年。其中华中科技大学开博时间(2009年11月24日)最早,华南理工大学开博时间(2015年3月18日)最晚。国防科学技术大学与北京理工大学至目前为止尚未开通大学官方微博,但有其他微博,如北京理工有北京理工大学学生会的官方微博。据了解,通过了新浪微博的加V实名认证的官方微博更为可靠,调查显示,37所大学的官方微博都已通过加V认证。其中复旦大学官方微博设置了评论权限,不允许他人评论;北京航天航空大学官方微博于2014年12月27日开通微博,但一直未发布过微博,于2017年3月19日正式发布微博。这两所大学的数据不具代表性,故剔除复旦大学和北京航天航空大学的数据后共计35所大学官方微博符合要求。其中综合性大学20所,理工类大学10所,农业类院校2所,师范类2所,民族类院校1所。利用分层抽样的方法抽取25所大学作为研究样本。交互性指标的时间评估期为2018年1月1日—2018年3月31日,数据调查时间为2018年4月10日—4月16日,数据来源于新浪微博官方授权的数据服务提供商——微博风云和通过爬虫工具采集获取。

3.2 研究方法

(1)主成分分析法它通过对原有变量的属性与特征进行线性变换,提取反映事物本质的新变量,同时去除冗余,达到降维的目的。本文通过主成分分析,将10个指标进行降维,把多变量的信息压缩成几个综合变量,提取出有效的主成分,从而构建出高校官方微博影响力水平综合评价模型。

首先,主成分分析的数学模型在主成分分析中所提取的主成分分为原始变量的线性组合,其模型公式表示如下:

(2)聚類分析法聚类分析又别称为群分析,是根据给定一组对象的描述信息,将具有相似或相近特征的对象构成簇。其基本原则是:同属一个簇的对象相似度高,而不同簇的对象相似度低。本文运用系统聚类(系统聚类的基本原理是计算所有的样本两两之间的距离,根据距离的远近将样本进行分类)研究分类合适的类别数,将25家高校微博进行分类,分析样本之间的联系与区别,分析同簇之间的共性以及不同簇的个性。

4 高校官方微博影响力评价及比较实证研究过程

4.1 主成分分析过程

为了保证计算结果的准确性,利用SAS 9.2软件对数据进行分析(由于所有的高校官方微博都已加V认证的,分析时去除A1指标)。分析如表2所示。

(1)观察相关系数矩阵通过相关系数矩阵可以看出主成分分析的各变量之间的相关性。

从相关矩阵可以得出,粉丝数与点赞数、评论数、转发数、相关性高,说明粉丝数越多博主与粉丝互动的可能性越高,相反,评论、转发、点赞等互动行为也可以促进博主人气的提升,从而增加更多粉丝。文章数与其他所有指标的相关性都不高,可能是因为文章内容质量不高,相关内容不能吸引用户;也可能是因为文章过长,其他博主不愿花过多时间浏览。

(2)提取特征值矩阵主成分分析相关系数的特征值矩阵包括特征值、特征值的方差、特征值所占所有特征值的比重、特征值的累计比例,如图1、表3所示。

(4)主成分命名主成分载荷是反映主成分与原变量指标的相互关联程度,载荷越大,关联程度越高。从表4中可以看出粉丝数、平均每条点赞数、平均每条评论数、平均每条转发数在第一主成分上有较大的载荷,微博数的载荷也相对较大,这些指标都反映了博主与其他用户之间的互动交流,所以这一主成分命名为互动反馈主成分;日均微博数与评估期日均微博数在第二主成分上载荷较大,这两个指标代表了用户的活跃程度,所以命名为用户活跃度主成分;微博原创率、文章数分别在第三、第四主成分上占有较大载荷,由于微博原创率与文章数反映的是博主的原创情况,在一定程度上可以体现博主个人的创作水平、价值观念等,这两个指标越大,微博用户越容易树立自身的品牌形象,增大影响力。所以第三、第四主成分可命名为原创品牌主成分,如表4所示。

4.2 基于主成分分析结果的聚类分析过程

(1)确定聚类数目在主成分分析的基础上,通过聚类分析,找出同一个簇中的对象之间的相似性,而不同簇间的对象的相异性。进一步研究高校官方微博影响力之间的差异。本文根据主成分分析的4个主成分作为自变量对25家高校官方微博运用SAS 9.2进行系统聚类分析(聚类方法采用中间距离平均法),通过R2统计量(R2统计量用于评价聚类的效果,值越大说明聚类的效果越好)的观察分析发现,将其分为6类时的聚类效果最好。

(2)聚类结果分析通过聚类分析将样本数據分为6类,聚类分析结果分类,如表6所示。

根据各类所包含的高校官方微博成员,总结每类微博的特点,对每类微博进行进一步剖析,发现其中共同性。现对每类微博分析如下。

第一,强势领先型,此类微博成员只有东北大学一个,东北大学除了在互动反馈主成分的排名处于中等偏下以外,其他三个主成分的得分排名均为第一,遥遥领先其他微博成员。这表明东北大学活跃度很高且大多微博内容属于自身原创,微博原创数量多,发表文章数较多,内容建设具有自身不可取代的特点,较好的树立了自身的品牌形象,辨识度较高。但是在互动反馈主成分上处于中下游水平,说明虽然大部分内容属于原创,但原创的内容可能不符合粉丝的兴趣胃口,无法引起粉丝的共鸣,此类微博应在这方面有所改进,进一步提高综合排名。

第二,综合落后型,此类微博成员包括同济大学、西北工业大学、湖南大学和东南大学。这几家微博在原创品牌主成分上占有较上游的主导地位,但是其他几个方面都处于劣势,再加上原创品牌主成分在影响力综合计算公式上所占的权重不高,所以对综合排名影响力不大。这类微博应将重心放在互动反馈以及用户活跃度主成分上的提高上,可以通过多发布能吸引粉丝的微博,回答一些具有争议性的问题以加强与粉丝的互动等方式来提升综合影响力。

第三,粉丝主导型,此类微博成员包括清华大学、武汉大学、厦门大学。这三家微博在互动反馈主成分上优势较大,其他成分上优势不明显,而互动反馈主成分主要是粉丝与用户之间的互动行为主导,粉丝忠实度较高,每次的博文能得到较好的反馈,用户的博文能引起大众的共鸣,转发数、评论数、点赞数较多。通对这几家微博的观察发现,此类微博成员注重微博内容的建设,博文内容质量高、形式多样、主题有趣,博文内容已发展成为自身品牌树立的标志之一。但此类微博成员也应注重全面发展,努力提升微博活跃度。

第四,均衡发展性,此类微博成员包括电子科技大学、重庆大学、山东大学、北京师范大学、西北农林科技大学、中南大学、四川大学、华中科技大学、南开大学,共九家高校官方微博。从表6主成分得分以及排名情况分析可以看出这几家微博各方面的发展几乎都处于中等水平,有个别相对突出,但对综合排名影响不太。这类微博应在稳步发展的基础上有所创新,通过改进质量、创新微博内容及发布方式等方式来进一步建设起具有自身特点的微博。

第五,综合领先型,此类微博成员包括北京大学、上海交通大学。这两家微博在互动反馈主成分上具有领先优势,只是在第三主成分上排名略微偏低,但是由于第三主成分所占权重较小,在其他主成分的得分又相对较高,表现出较大的优势,所以综合得到的总分处于领先地位。这类微博应注重全面发展,北京大学需在文章发表上下功夫,上海交通大学则需在原创微博上投入时间精力。

第六,全面落后型,此类微博成员包括南京大学、大连理工大学、中山大学、华南理工大学、中国科技大学和中央民族大学。这类微博在各个指标上的排名处于偏中下游水平,整体影响力不高,亟需从各个方面全面发展提高微博影响力。目前,新媒体建设已成为高校提高舆论领导能力、扩大宣传范围的重要途径,而微博平台已成为新媒体的主导力量,高校应重视微博平台的建设,在微博的运营发展上投入更大的精力,以发挥微博平台的信息传播、舆论引导以及思想形态建设等方面的重要作用。

5 结语

本文以25家“985”高校官方微博为研究对象,在分析用户行为特征之后从微博的覆盖度、用户活跃度以及交互性三方面进行一级指标的构建,选取了是否加V认证、微博数、粉丝数、关注数、日均微博数、微博原创率等10项二级指标进行微博影响力综合评价模型构建。通过主成分分析和聚类分析对高校官方微博影响力水平进行了比较研究,首先通过主成分分析得出了评价微博影响力水平的4个主成分(第三、第四主成分综合命名),即互动反馈主成分、用户活跃度主成分以及主成分,通过各主成分的方差贡献率占总解释方差贡献率的比重作为权重构建影响力综合评价模型,计算得出各主成分及综合得分和排名情况。然后以4个主成分的得分为自变量,进行聚类分析将样本分为强势领先型、综合落后型、粉丝主导型、均衡发展性、综合领先型、全面落后型6类,并对每一类进行了具体分析。

通过对25家高校官方微博影响力水平的综合分析,发现存在一些问题。

(1)不同高校之间影响力参差不齐,第一名与最后一名综合得分相差4.099分,差距十分悬殊。对于占有领先优势的微博应在稳步发展的基础之上,加快发展相对弱势的方面,学会不断创新,做到齐头并进、全面领先。而相对于成绩不太理想的高校微博,管理者应加强反思,增强影响力。

(2)低影响力的高校微博占的比重较大,相对落后型的微博个数达到了40%,高影响力的微博所占比重较小,强度领先型中有一个,综合领先型两个。整体呈现出发展不均衡的现象。应增加高层影响力微博的数量,均衡高校官方微博影响力的发展水平。

在互联网和新媒体快速变化的今天,如何打造各种新媒体资源,打造更接地气、更有价值的信息和服务平台,是高校宣传工作的重中之重。而微博则是众多新媒体平台之一,因此微博的建设与运营应得到高校的重视。目前高校已认识到微博对于自身形象宣传、品牌塑造等方面的重要性,但是对于微博平台的建设总体上仍处于一个探索发展阶段,还未达到成熟化,需要一定的规范管理来进一步提高微博的影响力水平。

高校应重视官方微博管理团队的培养,组建一支具有高媒介素质的管理团队,专门负责微博日常的运营维护。培养三方意见领袖加强舆论引导,三方意见领袖包括校领导、专家教授意见领袖,辅导员、生活老师意见领袖以及优秀学生干部、优秀学生意见领袖,通过多方影响来加强信息的正确传播与舆论的引导,加强思想形态的建设。同时加强内容建设,高校应注重自身品牌的建设,构建能突出自身特色的专项内容体系,内容建设應融入现实中粉丝的生活中,提供及时、可靠、丰富、有实用价值且具有亲近感的信息,通过多种形式的创新以避免内容建设的刻板化、单一化。

其次,高校应增加与粉丝之间的互动交流,及时回应具有争议性的评论,发起搏人眼球、贴近生活的活动以吸引更多的粉丝,扩大粉丝规模。设置公共话题或大众热门话题,以赢得大众的关注与认同,通过微博系统与社会系统的连接,实现与大众之间的共鸣与振动。对于能力、资源不足的学校还可借助其他学校的资源,与其他高校微博平台合作,学习借鉴优质微博平台的建设运营模式,通过整合资源、互相交流学习等方式达到多方受益。

参考文献

[1] 李开复.微博改变一切[M].上海:上海财经大学出版社,2011.

[2] 沈徽.基于微博的一种用户影响力度量方法研究及实现[D].燕山大学,2015.

[3] 原福永,冯静,符茜茜.微博用户的影响力指数模型[J].现代图书情报技术,2012(6).

[4] 林琛.微博个体信息传播影响力评价指标分析[J].图书情报工作,2014(1).

[5] Cha M,Haddadi H,Benevenuto F,et al.Measuring User Influence in Twitter: The Million.Follower Fallacy[C]. Proceedings of the 4th International AAAI Conference on Weblogs and Social Media. Washington,2010.

[6] Chen Xu,Wang Pengfei,Qin Zheng,et al.HLBPR:a hybrid local bayesianpersonal ranking method[C]. Proc of International Conference Companion on World Wide Web.International World Wide Web Conferences Steering Committee,2016.

[7] Kwak H,Lee C,Park H,et al.What is Twitter,a social network or a new media[C].Proceedings of the 19thInternational Conference on World Wide Web.New York: ACM Press,2010.

[8] 谭思妮.蛛网态微博关系网络中用户影响力评估研究[D].广东工业大学,2015.

[9] 李彤.大学微博影响力评价及其应用价值研究[D].哈尔滨工业大学,2015.

[10] 杨柳.高校官方微博发展现状及管理策略研究[D].重庆大学,2013.

[11] 伏琰.图书馆微博影响力评价指标体系研究——以“985工程”大学为例[J].图书馆学研究,2015(15).

[12] 孙江华,张殊.基于主成分分析和聚类分析的传统报纸微博影响力研究[J].现代传播-中国传媒大学学报,2015,37(4).

猜你喜欢

评价模型聚类分析主成分分析
基于学业质量的增值性评价系统的分析与构建
基于产业集群的技术创新风险评价模型构建
主成分分析法在大学英语写作评价中的应用
农村居民家庭人均生活消费支出分析
江苏省客源市场影响因素研究
基于熵权法的西安市外向型经济发展综合评价研究
SPSS在环境地球化学中的应用
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究