基于文本挖掘的社交网络图书馆公众形象感知研究
——以新浪微博为例
2019-03-20
0 引言
图书馆公众形象是特定时空范围内读者对图书馆服务活动的总体感知和情感倾向的综合评价,它是图书馆综合实力的体现[1]。图书馆公众形象承载了社会公众对图书馆所持有的共同信念和基本共识,对图书馆的生存和发展至关重要:良好的图书馆公众形象能提升社会公众对图书馆的认同感、信任感、满足感,提升图书馆的社会影响力,使图书馆更好地产生社会效益。
社交网络(SocialNetwork Service,SNS)是Web2.0时代以来人类信息交流方式的重大变革,用户不仅是信息的被动接受者,也是信息的主动创造者、分享者、交流者。以“微博”为代表的各种社交网络工具,弥补传统媒体的“被动、非交互性和难接近性”[2],在虚拟的网络空间形成了规模可观的公共讨论场域,一定程度上消弭了传统媒体和草根用户之间的现实区隔,实现了传统传播媒介的“去中心化”和舆论话语权的向下转移。因此,社交网络的新环境也给图书馆的形象管理带来了新的挑战和机遇:一方面图书馆的形象好坏将更加依赖于社群舆论而不是传统媒体,同时其形象会经由社交网络迅速传播,甚至产生“放大镜”效应;另一方面社交网络提供的海量信息源能更加真实、及时地反馈图书馆的公众形象,以便于图书馆进行有效、及时的形象管理。
本文以“新浪微博”为社交网络信息获取来源,使用网络信息采集工具爬取以“图书馆”为关键词的文本型微博记录,并通过内容分析、文本挖掘,揭示当前图书馆在社交网络中的公众形象,以期为未来图书馆改善服务,提升公众形象提供可供参考的决策依据。
1 文献回顾
国内外学术界对于图书馆形象的研究已有数十年的历史。早在1920年代,Wheeler便提出了图书馆形象的概念及其组成部分[3];自1970年代以来,国外图书情报领域不断产出图书馆形象的有关研究。国内对图书馆形象的研究始于1990年代[4],自此陆续有研究图书馆形象的论文发表,并在1990年代初及2008年左右形成两个研究高峰。近年来有关图书馆形象的研究成果可以从研究内容和研究方法两个角度进行总结。
1.1 图书馆形象的研究内容
国内外有关图书馆形象的内容主要可以分为图书馆形象概念、图书馆形象构成、图书馆形象感知和图书馆形象管理四个方面。
对图书馆形象概念的探析旨在明确图书馆形象的概念内涵和外延,厘清图书馆形象与其他相近概念的分野。大部分学者都认为图书馆形象是一种“公众评价”[5]或“公众印象”[6];还有研究者将图书馆形象从宏观和微观的角度进行划分,如刘瑞华认为图书馆形象应包括“公共图书馆个体的具体形象以及公共图书馆事业的整体形象”[7]。在众多研究中,还有学者提及图书馆形象相似的概念,如“公关形象”[8]“品牌形象”[9]“社会形象”[10],并进行了概念对比辨析。
图书馆形象构成是有关图书馆形象研究的热点,解决的是图书馆形象的组成部分和构成因素问题。总体而言,有关图书馆形象的构成要素可以从形象的塑造者和形象的感知者两个方面进行区分。Fitsimmons则认为图书馆形象取决于馆长(Director)形象[11]。Kim针对高校图书馆公众认知进行了实证研究,聚类了信息与服务、阅读与学习、休闲三个主要因素[12]。Sternheim认为图书馆形象与馆藏建设和资源可用性相关[13]。国内学者对图书馆形象构成的研究较为细致,如周九常将图书馆形象划分为建筑、服务、馆员、管理、文化、知识资源、基础设施、综合形象八个方面[14];朱红涛针对省级图书馆社会形象提出其关键要素包括建筑形象、职能形象和文化形象[15];许加明认为高校图书馆的服务形象从主体、客体、主客体关系三个方面组成[16]。
图书馆形象感知研究是图书馆形象的实际情况。就信息来源来看,大体可分为传统媒介上和社交媒体上图书馆形象感知。传统媒介中的图书馆形象感知研究主要利用报纸、杂志、期刊等传统纸质出版物作为获取图书馆媒体形象的来源。就研究结果而言,部分研究者对图书馆形象持正面看法,如彭亚飞对新闻报道的分析[17]和2011年联机计算机图书馆中心(OCLC)的图书馆公众感知报告[18]。部分研究则对图书馆形象持中性看法,如林强的研究表明图书馆的媒体形象仅是“看书的场所”“休闲娱乐的场所”[19];杨迎春的研究表明新闻中图书馆形象以中性和正面报道为主,但报道缺乏深度[20];刘兹恒等人研究则表明图书馆形象大多为正面报道,但是少部分负面报道产生的影响较大[21];Galluzzi对欧洲的图书馆媒体形象进行研究,发现不同人群对图书馆评价的差异性和不同国家对图书馆关注点的异同[22]。在新媒体时代,少数学者将视野转向了社交媒体,李斯等[23]、肖雪等[24]、张耀坤等[25]人选取了部分图书馆微博账号或微博记录进行研究,分析了图书馆在社交媒体中尝试展现的社会形象。
图书馆形象管理研究是提升图书馆形象的战略和策略选择。学者针对图书馆业务方面提出了改进建议,如从馆员队伍、服务、管理等方面改进图书馆工作[26]。还有研究着眼于将企业品牌建设与图书馆形象管理结合,如采用企业形象识别系统(CIS)理论[27]、采用视觉传达技术[28]、品牌市场营销[29-30]等手段完善图书馆形象,提高图书馆地位。此外,少量研究关注了如何应用新媒体改善图书馆形象,如丁冬指出要“打造个性的品牌形象,关注舆情,及时消除负面因素影响”[31];刘静则提出图书馆的“公关形象的整体运作要依靠微博等网络媒体,抓住宣传机遇”[32]。
综上可知,对图书馆形象概念、构成方面的研究已较为成熟;同时对于传统媒介下图书馆的形象感知研究也较为透彻。而在社交网络环境中的研究不仅数量不多,而且选取的研究对象为图书馆自身,缺乏从用户角度获取真实的公众意见进行的图书馆形象感知研究。
1.2 图书馆形象的研究方法
学者对图书馆形象的概念、构成和管理三方面研究主要以质性研究为主,研究者根据实践经验、文献回顾或主观判断发表看法。而国外有关研究则更多地采用了问卷调查、访谈、案例分析等方法。而对于图书馆形象的感知研究,在传统媒介方面,大多数研究者都以搜集报纸、期刊、杂志中的新闻报道或其他纸质出版物为主,采用了定性定量研究结合的方法进行问题探究。整体而言,对于图书馆形象的研究缺乏定量研究和实证研究,一定程度上制约研究的科学性。此外,的确有部分国外研究者使用问卷及访谈调查的数据进行形象感知的研究,但是根据有关数据统计,该类“自陈式”量表的可信度值得商榷[33]。对社会化媒体中图书馆形象感知的研究中,普遍存在样本数量较小的问题。如关于高校图书馆微博形象的研究[34],仅选取了33个图书馆微博并对其主页设计进行了归纳总结;而另一对微博公众形象的研究[35]仅采集了10个图书馆微博的318条用户记录进行研究。综上所述,在图书馆形象的研究方法上,目前研究存在缺乏定量、实证研究,且已有实证研究代表性一般。
2 研究设计
结合文献综述,本文针对目前学界研究较为薄弱的社交网络中的图书馆印象感知为研究视角,选取社交网络中的用户,作为图书馆印象的来源,采用内容分析法、文本挖掘进行社交网络图书馆形象感知。
2.1 数据来源与采集
本文选取新浪微博作为内容分析和文本挖掘的数据来源。根据CNNIC(中国互联网络信息中心)于2017年发布的《中国互联网络发展状况统计报告》,微信朋友圈、QQ空间、新浪微博是中国互联网使用率最高的社交网络应用[36]。微信朋友圈和QQ空间的社交网络相对封闭、私人化,且QQ空间受众较为低龄,其代表性欠佳。微博是基于社交关系、共同兴趣组织产生的社交网络,更能反映公共的集体舆情,因此,本文以新浪微博为研究的社交网络平台。
本文使用火车头采集器(Locoy Spider)进行数据收集,通过参数设定将搜索结果页面Html代码节按需保存。由于微博搜索结果页面有50页显示的限制,经过人工实验可知以“图书馆”为关键词微博每8小时的微博量与50页结果显示页面能展示的微博总量基本吻合,因此,以8小时为单位对每日产生的微博进行3次采集,每次采集50页,采集的时间段为2017年1月1日至2017年6月30日。
2.2 数据清洗与预处理
使用开源的数据清洗软件Open Refine对采集数据进行清洗,去除不含“图书馆”的无效记录,清洗后的数据情况如表1所示。经去重后得到157728条记录,使用基于Python的第三方自然语言处理库jieba库进行中文文本的分词处理,除了使用该库自带的预设词库外,笔者还整理了图书馆常见语词载入用户自定义字典,以保证专业用语不会被错误地分割,最后形成分词文档。
表1 采集的微博数据情况 (单位:条)
3 数据分析与形象感知
本文对于社交网络中图书馆形象的分析分为三部分:第一部分对所有数据进行整体分析,统计高频词汇;第二部分对图书馆形象主要组成部分进行分面研究;第三部分对各组成部分形象进行情感倾向分析。
3.1 图书馆公众形象整体感知
对分词处理后的文本进行频词统计,去除无意义语词及部分,取前30个高频词结果如表2所示。
表2 整体高频词排名前30 (单位:次)
由表2可知,“图书馆”被提及数量远远超过其他语词,而除此之外,词频排名前30名中与图书馆直接相关的语词(如“学习”“书”)较少,说明社交网络用户往往只是针对“图书馆”整体发表看法或在描述其他事物时一带而过,并未对图书馆本体包含的具体下属概念进行较多针对性的评论。在词频排名前1000的语词中整理与图书馆直接相关的语词并进行聚类得表3。
表3 高频语词中的图书馆相关语词 (单位:次)
由表3可知,社交网络中用户主要发表的是有关个人在图书馆的活动(读书、打卡、借阅、自习、捐赠、培训),图书馆馆藏资源(图书、杂志、古籍),图书馆基础设施与管理(闭馆、座位、占座、开门、阅览室、预约)。值得注意的是,语词中出现了几对对应或相近概念。相对于“开门”用户更关心“闭馆”;相对于“杂志”用户对“图书”兴趣更大;用户在社交网络中对“市图书馆”的关注大于“省图书馆”也大于“国家图书馆”,这可能与各类型图书馆数量与覆盖面有关。根据词性,对高频名词、动词、情感词进行分类排序,得表4。
表4 各类高频词排序(按词频降序)
从表4可知,对名词而言,社交网络上提及图书馆的用户大多为学生,通常在讨论“大学”“学校”的图书馆情况;谈论的场景富有生活气息(如“宿舍”“生活”),这一定程度上体现出图书馆成为大学生与图书馆之间的紧密联系,是大学生活的一部分,图书馆的形象富有生活气息。由动词高词频词语可知,更多社交网络用户将图书馆作为“学习”“读书”“看书”“写”的场所,与传统图书馆的功能与职能相符,而对于图书馆网络化、智能化等新变化没有明显感知。同时高频词语中出现“泡”这一词,也体现出社交网络中图书馆意见发布群体的用词习惯偏向年轻化、潮流化。由表情词转义的文本看出,社交网络用户对图书馆的情感态度是复杂多样的,混杂了正面与负面词语。但总体而言,社交网络用户对图书馆更多形象是正面的,高频词中的正面词汇(7个)大于负面词汇(3个)。但值得注意的是“摊手”(表无奈)的词频最高;“悲伤”也处在高词频列表前半部分,这也反映出有相当一部分用户对图书馆的消极形象感知。
图1 基础设施形象语义网络
3.2 图书馆公众形象组成部分感知
本文主要采用周九常对图书馆形象的解构理论[37],结合实际情况将图书馆形象划分为基础设施形象、馆员形象、管理形象、文化形象、馆藏资源形象、馆舍及位置形象、服务形象七部分。
3.2.1 基础设施形象
基础设施形象包括图书馆的基础设施服务,包括桌椅、冷暖调节、网络服务等。通过关键词筛选,获得该分类记录11873条。使用NetDraw绘制高频词共现词语义网络,以程度中心度(Degree Centrality)为标准,标签越大中心度越高,同一中心度的语词颜色相同(下同),最终得图1。
由图1可知,基础设施形象有关记录中,形成了以“图书馆”为中心的共现语词网络。其中还形成以“桌子”“落地窗”“座位-空调”等为中心的若干子集群,显示社交网络用户对图书馆基础设施的主要讨论话题。其他有关设施的高频关键词,如“暖气”“电梯”“系统”“沙发”等仅与“图书馆”结点形成关联,而没有与其他评价性语词或描述性语词关联,这说明用户仅在微博中提及这些设施或对这些设施的评价离散程度较大。
筛选与基础设施形象紧密相关的语词,使用Ego Network功能重新构建个体网络,并以K-Core指标进行语词聚类(下同),得图2。由图2及有关数据可知,“落地窗”“桌子”形成同一聚类,这一类表明用户心目中对图书馆基础设施的基本概念。在用户感知中,图书馆的桌子大多体现出“古式”“棕色”“多层”的形象。“设计师”“弯曲”“深色”聚合为一类,代表了对桌子的描述。“桌子”一词的中介中心性(Betweenness)除“图书馆”外最大,这说明“桌子”的传播力大,用户由“桌子”产生较多讨论。“落地窗”被用户认为是“大大”的,用户“透过”落地窗“欣赏”风景。“空调”“大学”“座位”等词形成一聚类,说明用户还关心“大学”或“学校”图书馆的“座位”和“空调”问题。“书架”“图书”“阅览室”“电子”形成一类,这一类代表了对阅览室内基础设施的话题讨论。综上可见社交网络用户主要感知的是图书馆的环境物理基础设施;而对图书馆的群体现代设施,如自助借还书机、打印机等没有过多关注。
图2 基础设施形象语义网络关键语词聚类
图3 馆员形象语义网络
图4 馆员形象语义网络关键语词聚类
3.2.2 馆员形象
馆员形象是“有关馆员的内在气质、专业素养、职业道德、外在形象等的一种综合形象”[38]。通过关键词筛选,获得该分类记录1999条。
由图3可知,除“图书馆”外,“人员”“图书”“管理员”也形成了中心度较高的集群;而“馆员”一词中心度较低,这说明在社交网络中用户倾向于将图书馆员认为是“图书馆管理人员”或“图书管理员”,这体现了用户对图书馆员的认知偏差。此外,“大叔”“阿姨”也成为外围高频词,体现了社交网络群体对图书馆工作人员的性别和年龄感知。此外,“门旁”“勇气”“提起”“眼神”等语词形成了中心度相近,词间联系紧密的集群,这说明可能有关“图书馆管理员”的有关人物特征的微博得到大规模讨论或转发。
由图4可知,“管理员”“图书”“勇气”“门旁”等人物描写词划分为一类,经查实为某条对图书管理员的深情告白微博形成热点而得到转发。“学生”“借书”“服务”形成一大聚类,说明图书馆管理人员在社交网络用户中形成为学生借书提供服务的形象。“学校”“老师”“人员”被划分为一类,说明公众对高校馆馆员的称呼也为“图书馆老师”“图书馆工作人员”。
3.2.3 管理形象
图5 管理形象语义网络
管理形象主要指图书馆的各种规则、制度、条例及具体管理实务,如开闭馆、办证等规则。通过关键词筛选,获得该分类记录13657条。由图5可知,对于社交网络用户对于图书馆的管理形象感知主要集中在“闭馆”“开放”“管理”“回家”几大主题。同时网络中出现了“学院”“学校”“大学”等语词依然说明讨论的主题主要为学校图书馆。这几大主题形成的集群包含的高频语词较少,个体网络较小,这说明用户对于图书馆管理感知并未形成较明显的讨论话题。
由图6可知,“闭馆”“开放”及有关时间的语词形成一个聚类,且“闭馆”的中介中心度除“图书馆”外最高,这说明社交网络用户关心的话题是图书馆的开闭馆时间问题,且关于“闭馆”引发了大量讨论,如“下午”和“晚上”的闭馆时间。第二个聚类为“管理”“管理员”“音乐”“学习”,这说明社交网络用户还对图书馆“音乐”产生印象,并且关注图书馆管理与“学习”之间的联系。
图6 管理形象语义网络关键语词聚类
图7 文化形象语义网络
图8 文化形象关键词聚类情况
3.2.4 文化形象
文化形象是图书馆所展现出的气质风貌,包括图书馆的建筑巧思、CIS战略构建、馆内标识标语等。通过关键词筛选,获得该分类记录685条。
由图7可知,除“图书馆”外,社交网络用户对文化形象的感知还形成了“风格”“文化”“形象”“阅读”四大中心,用户对这四大话题的关注度较高。此外,对于“排列-组合-物品-百科全书”之间还形成了一个联系紧密的群组。
由图8可知,图书馆形象的“文化”与“宣传”“标识”“建设”等语词关系紧密,并体现出“公益”的文化形象特征。“元月”与“宣传”之间的联系紧密,可能体现了图书馆的新年宣传活动受到较多关注。“大学”“学院”“老师”形成的聚类可能代表社交网络中图书馆的形象主要与学校图书馆有关。此外,“图书馆”与“公共”“阅读”“中心”的连接意味着图书馆在用户心中的形象可能与服务于公众的阅读中心相关。公众对于图书馆服务于“阅读”的文化形象,可能与“百科全书”书籍的“排列”“组合”情况有关。
3.2.5 馆藏资源形象
馆藏资源形象是图书馆拥有或可获取的纸质馆藏与数字馆藏的各种属性,包括资源的种类、内容、结构等。通过关键词筛选,获得该分类记录7243条。
由图9可知,社交网络上的图书馆馆藏形象主要围绕“书籍”“阅读”“图书”“手册”等关键词;而“数据库”“网页”“数字”等语词中心度较低,处于边缘位置,这说明社交网络中用户对图书馆馆藏资源的感知主要还是集中在传统纸质资源。此外,除“书籍”外,“地图”“菜谱”“手册”等较为独特的文献资料的中心度也较高,这说明社交网络用户对图书馆中这三种文献的讨论度较高。
图9 馆藏资源形象语义网络
图10 馆藏资源形象关键语词聚类
由图10可知,用户在社交网络上常讨论“阅读-读书”话题时常提到“读书会”,这说明图书馆的读书会对用户感知的重要性。此外,阅读还会与“孩子”“儿歌”产生联系,这说明亲子阅读在社交网络上的关注度较高。此外,“名著”“地图”“菜谱”等特定种类的文献与“使用”形成聚类而不是“阅读”,这说明该类资源的独特性及其在图书馆形象中的关键作用。
3.2.6 馆舍及位置形象馆舍及位置形象主要指图书馆的物理形态及其有关附属属性,如图书馆的位置、馆舍情况、建筑形象、楼层建设等。通过关键词筛选,获得该分类记录10857条。
图11 馆舍及位置形象语义网络
由图11可知,对于图书馆馆舍的感知涉及到的主要概念有“建筑”“设计”等,高频词中还大量出现了学校相关场景,如“宿舍”“校区”“寝室”“学院”,这说明大部分高校图书馆的读者会在社交网络中发布有关学校图书馆的看法,且关于馆舍及位置的看法通常与校园内地点一同提及。语义网络中还出现了数个形容词,这说明图书馆在社交网络用户心目中的形象多为“高大”“安静”“阳光”的正面形象。与服务形象组类似,馆舍与位置形象组的语词之间的绝对中心度差异较大,同时使用K-Core聚类仅划分出两个层级,这也同样显示出用户在讨论图书馆位置时内容分散,没有形成话题讨论。
由图12可知,对于图书馆馆舍及位置形象的讨论大多围绕在“大学”图书馆的“建筑”和位置(“校区”),而对着两者的讨论没有形成较为统一的高频语词,也没有集聚成较为明显的话题。其他得到关注的还有图书馆“大厅”“楼梯”“报告厅”等位置。此外,图书馆的地理区位上,“北京”“成都”两地得到相对较多关注,成为高频语词。
图12 馆舍形象语义网络关键语词聚类
3.2.7 服务形象
服务形象包括抽象的图书馆服务理念到具体的图书馆各类服务工作如借阅服务、参考咨询服务等。通过关键词筛选,获得该分类记录10824条。
图13 服务形象语义网络
由图13可知,除“图书馆”外,还形成了以“服务”“讲座”“图书”“借阅”等中心语词,这说明社交网络对图书馆服务的关注集中在图书借阅服务、讲座服务。而其他中心度低的高频服务类语词,如“展览”“组织”等,得到的关注相对较低。同时,高频词中还出现了“免费”“公益”“公共”“志愿者”等服务理念类词语,说明社交网络中用户感知为图书馆的服务是免费的、公益的、带有志愿属性的公共事业;但这些语词中心度、中介度均较低,处于网络外围,说明获得的关注相对较低,传播力也较低,并未引发较多讨论。此外,服务形象组的语词之间的绝对中心度差异巨大,“图书馆”一词的中心度之于本组其他语词的中心度之差比其他形象组的语词之差更显著,因此,其他语词的标签较小,这显示出在讨论图书馆服务时,用户对服务的讨论深度较浅,形成的子集群较小。
由图14可知,图书馆被认为与“公共”“图书”“讲座”“借阅”等服务有关。在各项具体服务中,较为突出的为“借书”的“时间”以及“大学”图书馆的“讲座”。服务感知中涉及的服务实务主要体现出公共图书馆的服务情况,而高校图书馆的助研性服务,如科技查新等并没有在社交网络中获得较多关注;涉及的服务理念也大多体现的公共图书馆的特征,而不是高校图书馆辅助教学科研的理念。
图14 服务形象语义网络关键语词聚类
3.3 情感倾向分析
文本情感倾向分析又称意见挖掘,是针对观点持有人对某产品、事件或人物等的评论,进行倾向性的研究[39]。本文使用Python第三方库SnowNLP进行情感倾向分析。SnowNLP是针对中文文本开发的自然语言处理库,具有情感分析的功能,能分析记录为积极情感概率。在进行情感分析之前,选用了知网(HowNet)情感词典进行语料库训练。正式进行情感倾向分析后,以0.4和0.6作为中性情感和积极情感的标准,对图书馆各形象记录中消极、中性、积极的占比数进行统计(条形图),合并各形象积极的平均概率(折线图),整理得图15。
图15 图书馆形象组成部分的积极倾向概率分布及平均值
就积极倾向概率平均值而言,所有形象的概率均在0.7以上,这说明社交网络用户对于图书馆的形象各组成要素情感倾向主要持积极态度。图书馆形象各组成要素中,积极倾向概率最高的为文化形象(0.846),最低的为基础设施形象(0.778)。此外,馆员形象和管理形象的得分也相对较低,而馆藏资源形象与馆舍及位置形象得分也相对较高。
就不同概率的数量分布情况而言,馆舍及位置形象、服务形象、馆藏资源形象、文化形象获得的积极评论相对较多,基础设施形象和管理形象的中性评论较多;馆员形象、服务形象获得的负面评价相对较多。大部分形象的情感倾向分布均为积极评论最多,中性评论其次,消极评论最少;但是馆员形象和服务形象的消极评论占比比中性评论多,提示馆员形象和服务形象中有较多消极评论,两级分化程度较大。
对各种形象的消极评论进行人工查阅,获取各形象负面感知的具体情况。对于基础设施形象而言,经人工查阅(下同)主要出现的消极语词为“冻死”“发抖”“太热”等,这说明对于图书馆基础设施的负面感知主要来自于图书馆空调、暖气设备,抱怨温度不合适的问题。对于馆员形象问题,主要出现的消极语词为“赶人”“大声说话”等,这说明对于图书馆馆员形象的负面感知主要来自于图书馆馆员在管理图书馆事物方面缺乏人性化,而且存在打扰他人的问题。对管理形象问题,主要出现的消极语词为“偷”“丢”“吵”等,这说明对于图书馆管理方面用户常常抱怨的在图书馆存在物品丢失问题及图书馆环境吵闹问题。对文化形象,并未有过多消极描述,仅有部分用户提及图书馆标语“断章取义”“翻译错误”等现象。对于馆藏资源形象,主要出现的消极语词为“太少”“找不到”“涂改”“做笔记”“破损”等,这说明对于图书馆馆藏资源用户主要抱怨的是资源的种数少,还有部分读者抱怨的是特定资源书籍找不到;此外,图书的保护不当问题也引起了部分用户的负面感知。对于馆舍和位置形象,主要出现的消极语词为“太远”,这说明对于用户而言,图书馆的物理距离过远对用户产生了负面的印象;另外,有部分用户抱怨学校的图书馆过小,反映了部分高校馆舍面积对图书馆的印象的负面影响。对于服务形象,主要出现的消极语词为“借不到”“关闭”“不让借”等,这说明对于图书馆服务形象用户主要抱怨的是借阅服务问题,而且常常是检索得到但是借不到,对于部分资源图书馆不提供外借服务也引发了用户的负面感知。
4 结果与讨论
4.1 社交媒体中图书馆的总体形象
整体而言,图书馆在中国社交网络中的形象存在浅层次、偏向性,情感态度较为积极。首先,社交网络中用户对图书馆的整体讨论度不深,大多数社交网络用户仅简单提及图书馆本身,并未对各类服务作过于深入的探讨,这与彭亚飞对新闻中的图书馆形象有关研究相符[40]。这说明近六年以来社交网络中用户对图书馆的感知并未加深,图书馆在用户心目中的地位和重要性增长缓慢。其次,偏向性体现在社交网络用户对图书馆种类、服务等方面讨论的集中性。社交网络中用户讨论的图书馆主要为高校图书馆,用户画像以高校学生为主,这与社交网络的主要用户群体有关。用户对图书馆关注度较多的是在图书馆的活动、图书馆资源和图书馆基础设施情况;这与肖雪等在2014年对图书馆微博进行的形象感知结果相似[41],资源、设施和服务依然是社交网络中用户关心的重点问题,图书馆需要特别关注这三方面的建设以维持或改善自身形象。同时,社交网络中用户对图书馆印象感知总体是积极的、正向的,相对于传统媒体中图书馆的形象而言,用户中性评论更少、积极评论更多,但是负面评价也更多,且两极分化程度也更大。就各方面而言,社交网络中用户对文化形象和馆舍及位置形象评价相对较高;对基础设施形象、馆员形象和管理形象评价相对较低;与2014年肖雪等的研究基本相符[42],但对图书馆馆藏资源的负面评价有减少的趋势。这要求图书馆在进行形象管理要有的放矢、轻重有别地进行形象改造,尤其要注意用户负面评价较多的方面进行改善和提升,如馆员、基础设施。
社交网络用户对图书馆存在刻板印象。虽然社交网络用户在讨论图书馆时使用了较多网络词语和表情,相较于传统媒体的而言,其语言形式体现出新潮、活泼的特征。但是其意见内容偏向传统、守旧,依然体现出与传统纸质文献资源服务的高度相关,与传统图书馆的形象吻合度较高,对图书馆新变化、新技术、新服务的感知度较低。这与Hariff等[43]、Phillip等[44]的研究结果相似,公众对图书馆的变化感知依然存在滞后性、相对稳定性和刻板印象;与李斯等2014年对图书馆在微博中意图展现的形象结果[45]有一定差距,这说明图书馆不仅需要创新,更需要考虑创新的效果,要针对目标用户进行有针对性的创新,并且要注重宣传推广,使得图书馆创新落到实处,深入用户的潜在感知。
4.2 社交媒体中图书馆各方面的形象
就基础设施形象而言,用户讨论较多的有古色古香的桌子和高大的落地窗,这两个设施给用户留下较为深刻的印象。同时高校图书馆的座位空调和阅览室的书架等也是讨论的重点;其中高校图书馆的冷暖设施成为基础设施形象的负面感知主要来源。数据体现出用户对图书馆内温度的变化比较敏感,这要求图书馆加强对读者的关怀意识,要加强对温度的监控和调节,贯彻以人为本的服务理念,主动了解用户的实际感知,提供更人性化的服务,打造更舒适的阅读环境。
就馆员形象而言,用户仍然把图书馆员习惯性地认为是图书馆工作人员或图书馆管理人员,并且将其与大叔、阿姨等中年人形象相联系,馆员通常与借书服务相关,成为用户借阅服务的诉求对象。馆员的负面形象集中在素质较低,存在服务态度粗暴的问题和上班聊天吵闹问题,这要求图书馆加强图书馆员的管理和培训,提升服务水平,贯彻服务理念,减少用户对馆员的负面评价,从而避免其拖累图书馆的整体印象。
就文化形象而言,用户对其感知与阅读息息相关,图书馆通常被认为是公众阅读中心。同时图书馆内的标识、标语和宣传建设也对用户产生了印象。文化形象感知的负面评价较少,小部分用户提到了图书馆标语的措辞、翻译错误问题。这启示图书馆在保持现有的正面形象的同时,也要求新求变,破除用户对图书馆的过时成见和刻板印象,力求在用户心目中树立起知识服务中心的新形象。在文化形象建设的具体实践中,要注重专业性和严谨性,尽量避免在宣传材料中犯语法上的错误从而引发读者的误会。
就馆藏资源形象而言,用户讨论较多的为图书等传统纸质文献,而对数据库等数字资源的讨论相对较低;同时地图、菜谱、手册等特定类型的馆藏资源和少儿阅读也受到一定程度的关注。馆藏资源形象的负面主要来自于用户对图书馆数量过少的抱怨,同时有一定的用户抱怨图书馆的书籍存在损毁、污损的情况。在用户仍然重视纸质资源的情况下,图书馆需在做好纸质文献长期保存工作、满足读者纸质文献需求的同时推进数字阅读的推广工作;同时,图书馆还需监控舆情,根据读者的需要进一步完善馆藏资源结构,同时利用文献传递等服务促进信息资源建设的共建共享。
就馆舍及位置形象而言,社交网络用户主要以“高大”“安静”“阳光”等词进行形容,同时用户常常讨论图书馆与宿舍、校区的距离位置问题。就行政区划位置而言,北京、上海、成都等地的图书馆受到的关注最高。馆舍及位置形象中用户的负面评价主要来自于用户抱怨距离过远,在保持馆舍形象积极的同时,图书馆要拉近与读者的物理距离,通过加强分馆建设、提供馆外服务等方式主动走向用户和社区,使得读者使用图书馆的资源更为便利。
就服务形象而言,社交网络用户主要关注的有借阅服务和讲座服务;用户心中的图书馆服务是免费的、公益性的,这与公共图书馆的形象较为符合。对服务形象的主要消极评论主要集中于书籍借阅困难或不外借等问题。这说明对于借阅服务一方面依然是图书馆最基础的服务,也是最受到用户重视的服务,图书馆在拓展其他服务的同时不能降低对基础性服务的重视程度;另一方面它依然有可提升的空间,这需要图书馆努力减小开架借阅带来的负面影响,努力成为信息资源与用户之间的沟通桥梁,加强对图书馆资源的利用,争取实现用户对信息资源利用的最大化。
5 结语
社交网络是一个取之不尽的信息宝库,利用社交网络中的半结构、非结构化数据能为推进科学研究的“第四范式”提供宝贵的数据来源,也能为图书馆等信息机构改善实务工作提供珍贵的决策支撑。本文的不足之处有以下几点:首先,对于数据的清洗不够完善,仅通过关键词进行筛选无法判断用户记录的真实语义;其次,对于语料分词添加的附加词典不够全面,可能忽视了某些专有概念,未来的研究可以构建更完善的图书馆形象本体添加分词词典;再次,对于情感分析使用的SnowNLP库训练不足,且该库仅能作出积极的概率判断,而无法作出更准确的中性、消极定性判断,未来的研究可以考虑使用其他文本情感计算方法或者选用更多语料进行深度训练。