“985工程”高校图书馆微信公众号研究
2017-03-25周海晨陆和建
周海晨+陆和建
摘要从“985工程”高校图书馆微信公众号推送文章及其相关数据出发,采用基于Python语言的爬虫程序获取36所高校推文数据作为样本数据,使用Tableau绘制有关图表,并结合微信传播指数(WeChat Communication Index,WCI),分析“985工程”高校图书馆微信公众号推送文章的特征及规律,由此提出改进建议。
关键词 高校图书馆 微信 爬虫程序P ython WCI
1我国高校图书馆微信服务研究综述
微信服务在高校图书馆中的重要性逐渐上升,有关其应用情况的研究逐渐被专家学者所重视。其中包含大量对高校图书馆微信服务现状的分析研究。2014年,张秋等从微信号开通情况、开通时间、发帖量以及发布内容等几个角度,分析发展现状,提出对策。叶佩珍则从平台建设、运营状况、服务内容及宣传推广等方面对我国高校图书馆微信服务状况进行调查,分析其发展状况及存在问题,并提出相应对策。张骏毅等选取“211工程”高校图书馆作为研究对象,分析微信在图书馆中的应用率、服务内容的深度与广度以及关键词与互动咨询模式等存在的不足,在此基础上提出微信服务发展建议。陈雨雪则对“985工程”高校图书馆微信公众号的名称、类型、是否认证、首条推送消息等细节进行记录,并统计微信号提供的服务情况。
同时,也有部分针对实践经验、营销策略等方面的研究。2013年,王静等从新媒体环境下对高校图书馆如何开展微博、微信相结合的微营销展开论述,作者指出,高校图书馆可以通过整合运营模式设立营销团队、细分粉丝群体来将二者进行整合,提高传播效率。史梅以南京大学图书馆作为研究对象,分析经营策略,总结成功经验:如积极运用微信OpenAPI接口,嵌入馆藏查询、书刊续借等实用功能。徐彩霞等提出加强高校图书馆间的合作交流,跳出微博思维,分配专职运营人员等建议。
然而,上述研究多围绕应用现状、实践经验、营销策略等展开,鲜有对高校图书馆微信服务效果的定量分析研究,特别是采集长期、海量微信推送文章作为研究对象的成果更是少见。万慕晨等通过对“985工程”高校图书馆微信数据中阅读推广相关信息的提取,结合微信传播指数WCI进行实证研究。刘晓莉等则将互动性引入图书馆学研究领域,构建出高校图书馆微信公众平台的用户满意度影响机制模型。
文章通过构建基于Python的爬虫程序系统,从新媒体指数平台——清博指数(www.gsdata.cn)中收集2015年8月1日至2016年7月31日“985工程”高校图书馆微信号所发布的推送文章、阅读量、点赞数等相关信息作为原始数据,结合微信传播指数WCI与数据可视化分析软件Tableau分析,找出当前“985工程”高校图书馆微信服务存在的优缺点,并据此提出实质性改进建议。
2研究过程
2.1数据来源
清博指数拥有目前国内最大的第三方“两微一端”(微信、微博、APP)数据库,旗下的微信传播指数WCI、微博传播指数BCI(Micro-blog CommunicationIndex)因其独特权威的算法公式已成为行业领域标杆。目前已有超过1.9万家单位使用该平台来制作榜单。选择该平台作为研究数据来源的原因如下:①来源领域权威专家;②收录完整推送文章;③独创量化分析标准。微信传播指数WCI(计算公式如表1所示)通过微信公众号推送文章的传播度、覆盖度及账号的影响力,来反映微信整体热度发展趋势。
2.2数据采集
为了使得数据采集过程更为清晰,同时获得更为规范、结构化的原始信息。文章以Python语言为基础构建出一套针对性的网络爬虫(如图1所示)。整体采集流程可以分为五个步骤。
第一步,查找39所“985工程”高校图书馆微信公众号,手工收集开通微信公众号且有推送文章的ID(如厦门大学:xmulib)。经过筛选,排除电子科技大学(开通,目标时间段内未推送文章)、国防科技大学(开通,目前尚未投入使用)、中国农业大学(未开通),共获得36个高校图书馆微信ID。
第二步,将36个ID放入爬虫列表内,启动推文链接爬虫,爬虫便会依照程序遍历所有ID,并爬取每个ID下2015年8月1日至2016年7月31日内的所有推文标题、阅读量、点赞数、摘要、链接、发布时间、发布者名称,以字典形式插入到非关系型数据库MongoDB中的URL-list集合中储存。
第三步,从URL-list集合中抽取所有推文链接地址,得到推文链接列表。
第四步,启动推文详情爬虫,遍历所有推文链接并抓取公众号推文中的文本、标题、链接等。
第五步,以字典形式插入到MongoDB中的In-fo_list集合,完成采集、以待调用。
在数据处理前,需先将MongoDB数据库中的数据导出为CSV格式文件,分别命名为wechat-url.CSV与wechat info.CSV。
2.3数据处理与分析
使用Excel进行数据去重、字段格式规范化等功能进行数据处理。如利用文章URL是否相同作为筛选标准,剔除重复的数据记录,得到wechaturl.CSV含5782条记录,且最终得到wechat info.CSV含5681条记录。其中记录缺失的主要原因为:①推文因抄袭被举报或涉及敏感内容而无法查看;②推文被删除,无法采集。
数据分析阶段,首先利用Tableau(一款无需用户编写自定义代码、数据可拓展性强的可视化工具,能帮助使用者挖掘海量信息中的内在关联。)以所有数据为对象绘制图表,并依据WCI进行“985工程”高校图书馆微信公眾号排名,对36个公众号运营情况产生初步了解。随后,深入分析,以几所特色高校为对象绘制图表,并将数据处理后得到的两个CSV格式文件导入Tableau,匹配拥有相同URL的记录,最终得到5778条记录(数据格式如表2所示)。
3讨论与分析
3.1WCI指数排名
WCI指数评价合理全面,能科学体现各微信公众号整体运营情况。同时该指数按照日、周、月为周期进行统计。为体现“985工程”高校图书馆微信运营整体最佳实力,选取推送文章数最多的4月作为统计月。因4月23日是世界读书日,各高校图书馆开展微信推送服务的意愿与实际行动能得到良好体现。同时,根据清博指数相关数据可知,4月是热文数量与阅读量最高的月,分别为875篇热文与36万以上阅读量。从清博指数总榜单中,将2016年4月作为统计区间,选择36所高校图书馆微信公众号作为统计对象,其中东北大学、西北农林科技大学未纳入统计(二者微信号开通时间均在6月)。同时,因中央民族大学、电子科技大学与中国海洋大学在4月没有推送文章,故最终得到31所“985工程”高校图书馆微信WCI排名(见表3)。
分析可知,“985工程”高校图书馆WCI存在轻微程度的两极分化,排名第一为重庆大学(489.49),排名最末为北京理工大学(88.18),二者相差401.31;WCI平均值为315.4,19所高校图书馆高于平均水平,12所低于平均水平;指数在400以上有重庆大学、清华大学、武汉大学、厦门大学图书馆。
3.2微信推文、平均阅读量、平均点赞数统计
通过WCI排名分析“985工程”高校图书馆微信整体营运水平,可更加直观地识别具有参考价值的高校图书馆微信号,通过数据挖掘与分析,尝试提出具有实际意义的建议。
使用Tableau进行统计分析,将高校图书馆作为行参数,推送文章数、平均阅读量以及平均点赞数作为列参数,按照推送文章数量多少排列(如图2)。
推送文章数指2015年8月1日至2016年7月31日微信公众号所推送文章数目总和。从图中可知,山东大学、湖南大学、浙江大学图书馆的推文数遥遥领先,分别为530、507与484。而WCI排名为9、15、7,较推文数量排名较差。
平均阅读量的计算方法是将所有推文的阅读量求和后取平均值。不难发现,四川大学、厦门大学及大连理工大学图书馆平均阅读量最高。
平均点赞数是将所有推文点赞数求和后取平均值。排名前3位的高校图书馆微信公众号为:四川大学、大连理工大学、武汉大学。WCI排名分别为5、13、3,整体靠前。另外,这三所高校的平均阅读量排名靠前,由此可推知,平均点赞数与平均阅读量可能存在一定的关联性,即平均阅读量越多,平均点赞数多的可能性更大。
根据差异可将高校图书馆分为两类:第一类拥有较多推文数量,阅读量与点赞数却只处于平均水平,即推文数量排名远高于平均阅读量、点赞数排名。这类高校图书馆以山东大学、湖南大学及浙江大学最为典型。第二类高校图书馆推文数量处于或低于平均水平,却拥有较高的平均阅读量与点赞数,即推文数量排名远次于平均阅读量、点赞数排名。第二类以四川大学、厦门大学及大连理工大学为代表。围绕以上两类图书馆,结合Python爬虫采集的相关数据,尝试分析出形成差异的主要原因。
3.3推文内容分析
基于第一类、第二类共6所高校图书馆推送的1923篇微信推送文章,筛选出阅读量大于3千次的文章,按照微信公众号进行罗列(见表4)。四川大学以12篇文章高居榜首,其次是大连理工大学为11篇文章,厦门大学与山东大学分别是4篇与2篇。
推送的28篇文章按照内容可划分为:公告通知、问卷投票、趣味推荐、实用技巧、数据可视化等。主题涵盖的范围并不全面,例如没有信息素养讲座、主题展览、图书活动等常见主题,但这28篇文章产生高阅读量之原因仍值得深入分析。
根据企鹅智库发布的《2016微信影响力报告》,在投票“向朋友圈或好友转发文章时你的决策理由是”中排在前三名的答案是:内容有价值(48.8%)、内容有趣(39.2%)及情感触动(38.6%)。
四川大学图书馆在微信号运营上取得了“低投入、高回报”的效果,即推送文章数量上略低于“985工程”高校图书馆微信公众号的平均水平,但其平均阅读量与平均点赞数均排名第一,可谓微信运营成本低投入、高产出的最佳范本。在两类高校图书馆微信公众号筛选出的28篇文章中,四川大学占了12篇,接近43%。从内容角度分析这12篇文章,充分说明了趣味性和情感触动是引发阅读、转载的重要因素。
《江安闭馆音乐大放送无论何时,惟愿你听歌如见我》一文的阅读量惊人地达到了近3.7万次,远超阅读量排名第二位的清华大学图书馆的《北馆有些啥》(阅读量1.8万次)。观其内容,只是发布了图书馆的闭馆音乐,并告知其名称,结果却形成海量阅读与传播。其原因包括:(1)触动受众内心情感。闭馆音乐伴随着开馆10年的每一天,由于流传久远,优美的音乐已成为无数川大学子心中关于大学时光的最好印记,成为川大人共同的回忆。许多毕业或在读的川大学子在阅读到这篇文章的第一时刻便进行转载,引发大量关注;(2)满足受众迫切需求。由于闭馆音乐本身的优美,使得许多学子心存好奇,想探其究竟。在了解到这一潜在需求后,川大图书馆便以怀旧抒情的风格创作了该推文,满足了大部分订阅者这份存在已久的好奇。
《毕业数据大放送你有一封来自图书馆的不二情书》取得了近1.2万次阅读的成绩,是少数破万阅读量的文章。该文以一封私密情书的形式,展示了大部分毕业生第一次到馆时间、当天天气、大学4年借书名单及拥有时间最长的书籍。许多毕业已久的川大学子,纷纷关注微信号并阅读该文章,相互转发,掀起一股怀旧风潮。该文章的成功同样离不开对服务对象需求的把握:(1)在该文前发布的《这些年,我在川大读过的书——致2015届毕业生》,由于在去年取得了良好的反响,不少校友纷纷留言希望能看到自己当年的到馆或借阅图书情况。在了解到这一需求后,川大图书馆今年专门将2005年后入学的校友数据整理出来,一并放送;(2)在该文发布后,大量校友留言找不到當年的学号,无法看到属于自己的不二情书。川大图书馆便迅速制作并推送了《忘记卡号毕业生如何找回和绑定当年卡号(小游戏)》一文,用游戏通关的方式获得学号,充满趣味性,再次获得了大量关注,成为川大所推送文章中超越不二情书并排名第二的推文。
同时川大图书馆还结合当下热点:如《芈月传如何优雅而专业地八卦》利用当时正在热播的电视剧作为切入点,演示如何利用图书馆资源进行学术检索,生动有趣地完成一次信息素养培训。《2016情人节特别篇图书馆爱神,请赐予我力量!》一文则结合情人节,推荐了文学世界中的情侣及其爱情名言,并附书籍序列号。该文巧妙地将热点话题与阅读推广相结合,获得了3220次的阅读量。
大连理工大学、厦门大學以及山东大学图书馆在28篇文章中分别占有11篇、4篇与2篇,占总比重的39%、14%以及7%。大连理工大学上榜文章主要为公告通知,体现了图书馆微信公众号作为第一手消息发布的重要功能。除此之外,结合生活中的痛点、热点进行创作也能取得良好的效果。大连理工大学的《你才不是借书不还的女同学》一文,将替人借书不还这一不少人的遭遇作为切入点,用充满无奈、自嘲的口吻表达了借书人的不满,同时给出相关建议,最终获得3796次的阅读量。厦门大学的《圕·时光:给毕业生的一份礼物》与四川大学的“不二情书”有着异曲同工之妙,此处不再赘述。
上榜名单中,第一类高校图书馆(山东大学、湖南大学、浙江大学图书馆)只有山东大学的2篇文章在列,且均为活动投票类文章。其阅读量并不能充分反映出文章的受欢迎程度。基于第一类高校普遍高投入、低回报的情况,需从文章的“质”入手,而非一味地大量产出。
4“985工程”高校图书馆微信号运营建议
4.1结合指数,客观评价
结合前文分析,可以发现“985工程”高校图书馆在运营水平与能力上参差不齐,每所高校图书馆所面临的运营问题也不尽相同。亟待一套能将微信运营量化的指标,以便各高校图书馆能获得及时、客观的评价,并与其他同类微信号或历史情况比较,清楚当前自身所处位置。如前文所述,WCI很好的满足了高校图书馆这一需求,高校图书馆结合WCI,定期分析相关指数,结合具体评价指标,发现并解决问题(如发现某类主题推文平均阅读量持续走低,则可减少该类主题推文数量),而非凭感觉、随意制定运营计划。
4.2走出误区,质量兼顾
统计可知,部分高校拥有高推文量的同时未能取得良好的效果反馈。高推文数反映了该微信公众号拥有较为积极的态度,笔耕不辍。但推文数量与推文的影响力并不存在显著相关性,量变未必引起质变。同时,存在部分高校图书馆推文数量远低于平均水平,折射出图书馆并未对微信服务引起足够重视。这两类微信公众号均需在文章的质量与数量上取得平衡,做到质量兼顾。
4.3形式活泼,聆听反馈
对比分析两类图书馆微信公众号,可以发现,期望创作出高阅读量、高点赞数的优质文章以下四点可作为参考:
(1)提升文章趣味属性。高校图书馆微信公众号受众主要为在校学生,轻松活泼的行文风格更易吸引该类受众,可选拔一批幽默活泼善于表达的同龄大学生参与创作。如四川大学、大连理工大学在语言风格上紧贴网络潮流,灵活运用表情包、热门段子等网络素材,拉近与服务对象的距离,保持用户粘性。
(2)结合当下热点话题。热点话题是某段时间及区域内被广泛讨论的话题,有突发事件(如《芈月传》热播)也有节假日等固定事件。创作者要善于观察,灵活地结合时下热点话题进行推文创作,吸引受众眼球,以达到推文本身所期望的目的(如结合情人节推送文学大家著作的阅读推广推文)。
(3)重视受众需求反馈。2014年末,微信文章开通评论功能,该功能的开启使得公众号运营者有了重要的文章效果反馈渠道。运营者需要重视评论、深入了解受众需求,针对受众需求进行创作才能取得更好的传播效果。
(4)挖掘受众情感痛点。每类受众都有自身所特有的情感痛点。高校图书馆微信公众号的推送对象以学生为主,瞄准该类对象的情感需求,往往能取得不错的效果。如四川大学图书馆针对应届和往届毕业生对过往大学岁月的追忆与怀念的情感痛点,使阅读量轻松过万,且获得许多校友的关注。