推荐系统的发展与公共图书馆个性化信息服务探讨
2016-05-17阮光册华东师范大学上海004上海图书馆上海0003
阮光册 夏 磊(.华东师范大学 上海 004;.上海图书馆 上海 0003)
推荐系统的发展与公共图书馆个性化信息服务探讨
阮光册1夏磊2
(1.华东师范大学上海200241;2.上海图书馆上海200031)
〔摘要〕文章探讨了推荐系统的发展,对目前国内外图书馆推荐系统发展的情况进行了总结,并对公共图书馆运用推荐系统为读者提供个性化信息服务提出了一些思考,以期为公共图书馆的数字化服务提供理论借鉴。
〔关键词〕推荐系统数字图书馆公共图书馆个性化信息服务
〔分类号〕G252
〔引用文本格式〕阮光册,夏磊.推荐系统的发展与公共图书馆个性化信息服务探讨[J].图书馆,2016(2):94-99
信息资源的迅速增长,给人们带来了“信息过载”问题[1]。虽然搜索引擎、门户网站、专业化的数据库可以为用户提供过滤信息,但是无法提供个性化的信息服务。推荐系统(recommender system)的本质是“信息发现”,被认为是解决当前信息超载问题非常有潜力的方法。推荐系统通过挖掘用户与对象之间(user-item)的二元关系,从大量数据中发现用户可能感兴趣的项目,并生成推荐列表以满足用户个性化需求。
2008年,中国图书馆学会年会颁发的《图书馆服务宣言》中明确提出,要保障全体社会成员普遍均等地享有图书馆服务。2012年《公共图书馆服务规范》中,也明确指出:公共图书馆服务对象包括所有公众。如何保证让全社会成员普遍均等地享有图书馆服务呢?笔者认为,公共图书馆从传统服务向数字服务转型将是必经之路,而数字服务的优劣将直接影响到读者对图书馆服务的满意度。我国公共图书馆数字化服务开始于国家图书馆“数字图书馆实验演示系统”的开发[2],经过近20年的发展,公共图书馆数字资源建设颇具成效。以上海图书馆为例,截至2014年底,共建设电子图书近30万种,电子期刊近1500种,电子报纸500余种,网络文学10000多种。
1 推荐系统概述
推荐系统的发展历经近 20 年的时间,但是迄今为止仍没有一个精确的定义。推荐系统作为一个独立的研究方向一般被认为始于1994 年明尼苏达大学GroupLens 研究组推出的 GroupLens 系统[3],该研究小组提出了推荐系统算法的同时,建立了推荐系统的一般模型,引领了未来十几年推荐系统的发展。目前,推荐系统涵盖了信息检索[4]、认知科学、管理科学[5]等众多的研究领域。
推荐系统的一般结构包括对象、用户、推荐算法三个要素[6]。推荐形式基本有两种:①系统采集用户信息和对象数据进行计算,建立模型向用户推荐;②用户向系统提供个人的相关信息并提出推荐请求,根据用户的相关信息系统进行计算得到推荐结果。推荐算法研究的中心问题是效用函数的计算,目前各类推荐系统均采用了不同的策略,设计不同的效用函数实现用户的信息推荐。推荐的算法是推荐系统的核心,算法的好坏决定了推荐系统类型和性能的优劣。目前常用的推荐算法有基于内容的推荐[4, 7, 8]、协同过滤的推荐[9-11]、组合推荐[12-14]、基于知识的推荐[15, 16]、基于上下文的推荐等。
随着社会化媒体的广泛应用和社交网络的快速发展,以SNS、Blog、 Mini-blog、IM、Email等一系列互联网信息传播工具为载体,巨大的信息量和复杂的社会网络关系为推荐技术的发展带来了新的研究方向——社交网络推荐。社交网络可获取的数据丰富多样,包括社会化标签和社交关系等,这使得社交网络的推荐模式不再是单一形式,除了一般的信息推荐,还包括组(一群用户)的推荐。
随着移动互联网的飞速发展,移动网络与计算机网络逐渐实现了融合,这种趋势使得互联网信息服务得到了延伸。移动推荐系统大多与用户的上下文环境密切相关[17],即用户在不同的时间[18]、地点[19, 20]、环境[21]下的个性化需求是不相同的。移动推荐目前已经取得了一定的研究成果。在新闻推荐领域、在线音乐[22]、在线视频[23]等方面获得了应用。此外,还有研究者通过获取Wikipedia上的知识来实现移动推荐[24]。
推荐系统的核心目标是“信息发现”,要完成这一目标需要具体解决预测和推荐两个主要问题。预测要解决用户(User)对每一个对象(Item)的喜好程度,常用的方法是从用户的历史信息来进行计算或构建用户的特征模型,以此来分析用户的行为和兴趣。预测的结果越准确,推荐的结果也将越精确。目前的很多研究都集中在预测环节,绝大多数研究都把精力放在如何构建推荐算法方面,希望推荐系统达到最佳的预测“准确度(accuracy)”[24-26]。推荐系统的预测准确度当然是评估的重要指标,但是“准确度”不是唯一的标准。目前,推荐结果的多样性[27]、推荐界面的设计[28]等也受到越来越多的关注。
2 国内外图书馆推荐系统的应用
随着信息技术和搜索引擎的发展,图书馆传统信息服务方式已渐渐不能满足读者个性化信息需求,正如美国图书馆学家罗伯特·奥里森所说:“如果图书馆在信息社会里没有竞争力,那么它将被新的信息机构所取代”。20世纪90 年代末,美国和英国图书馆开始对数字图书馆个性化服务系统进行开发和设计,并取得初步成果。1997年,MyLibrary系统开始在美国投入使用,该系统是站在图书馆的立场寻找一种个性化的视角,以解决信息过载和管理负担过重的问题,其后英、法、日、德、意等国也开始了这方面的研究。2010年谢菲尔德大学联合OCLC,开发基于用户要求与偏好的图书馆目录推荐系统[29]。目前,国外主要图书馆推荐系统、推荐算法、研究机构如表1所示。
表1 国外主要图书馆推荐系统应用
基于图表的数字图书馆推荐系统协同过滤与基于内容的混合推荐系统 美国Arizona大学图书馆SERF系统 系统过滤 美国俄勒冈州立大学图书馆Mevy 基于流通数据 加州大学图书馆
相对于国外图书馆推荐系统,国内图书馆个性化服务开始于1999年底国家科技部扶持的“中国数字图书馆示范系统”。2001年,我国开始了图书馆个性化信息服务的研究和应用。中国科学院国家科学数字图书馆根据北卡罗林那州立大学的MyLibrary系统成功开发了“我的数字图书馆”(MyLibrary)。
国内图书馆近几年在推荐系统中的取得了一些成果,如上海图书馆在“MyLibrary”系统中增加了畅销书推荐的功能。但依然有一些问题阻碍图书馆推荐系统的发展:
(1)资源特征描述存在困难
资源的特征描述与用户兴趣的匹配是推荐系统的主要工作,决定了推荐效果的好坏。然而,一些数字资源在特征描述上存在困难,如:老唱片等影像资料。
(2)获取信息不完全
图书馆在收集用户的兴趣特征时存在一定难度,由于很多图书资源缺少用户的评价,导致相似用户计算不够准确,因此在基于协同推荐算法中系统很难实施有效的推荐。
(3)缺乏信息的深度挖掘
图书馆的推荐系统缺乏对用户兴趣的全面分析,在构建用户模型方面也仅仅通过流通数据来完成,因此在针对不同用户时无法提供有差别的服务。
(4)提供的信息服务缺乏有效的服务集成
很多图书馆的个性化服务系统没有能够集成诸如在线参考咨询和全文文献传递等服务项目,由于缺乏有效的服务集成,因此很难提供定制推荐的服务。
3 公共图书馆提供个性化数字服务的思考
信息化时代,公共图书馆要将馆员-读者-资源这三要素有机的结合,为读者(到馆与非到馆)提供更有价值的个性化信息服务。现借鉴推荐系统的发展,提出如下思考。
3.1流通数据的“长尾”效应
信息时代,图书馆馆员除了是信息提供者外,还需具备信息挖掘的能力。流通数据是图书馆传统服务中最宝贵的财富。如2014年,上海市中心图书馆图书流通量超过5800万册。在图书借阅、信息推荐过程中,馆员需要向读者推荐他们感兴趣的读物,然而,不能只推荐流行的读物,这样对读者的体验并不好。因为读者很可能已经知道这些热销流行的读物,读者也不会认同这是一种“个性化”的数字服务。图书馆的个性化服务如果能够有更多推荐的类型,那么将大大激发读者对馆藏资源的使用兴趣。
OCLC 副主席 Lorcan Dempsey说:图书馆集聚了研究、学习和文化资源的长尾,我们需要做更多的工作来确保这一长尾能直接有效地提高我们的读者的工作和生活[30]。在电子商务领域,已经有推荐系统开始关注商品的长尾理论[31],研究将不是最热门的商品推荐给用户。如在亚马逊网络书店,管理人员将众多的图书赋予类型和关键词等特性,用户也可以贴上标签,这样为找到非热门读物提供了可能。Google则打破分类的概念,给用户提供足够广的选择空间,让用户在信息中找到自己所需。图书馆在个性化服务过程中,应该开发利用80%没有被读者“发现”的长尾资源,使读者能在海量馆藏资源中找到所需信息。目前,已有国外学者在查询推荐的长尾理论方面进行了研究[32],以提高Web搜索的效率。随着互联网应用的普及和深入,长尾理论的影响还在进一步深入,公共图书馆应该在个性化服务中借鉴该理论,对海量流通数据进行分析,为读者提供更加个性化的阅读推荐。
3.2结合社交平台数据的个性化推荐服务
图书馆对社交网络服务 (SNS)的研究已经取得了一定的成果,利用社交网络开展信息服务的图书馆也较多,通过社交网络平台,图书馆可以发布诸如:图书馆活动、讲座培训信息、新书通报、好书推荐、以及虚拟参考咨询服务等。已有文献[33, 34]描述了图书馆如何通过社交网络拓展服务的方法,如:为图书馆添加标签、为图书馆编辑条目、介绍图书馆员、图书馆导航、让用户提供个人信息(文本、图片)等,通过这些方式实现社交网络在图书馆中的应用。此外,在一些研究中[35]也探讨了如何通过用户在社交媒体上的交流来了解读者对信息需求的动态,并提醒图书馆员关注那些平时无法得到的信息。
虽然图书馆在社交网络中有一定的应用,但是将图书馆个性化推荐与社交网络结合还没有更多的研究。由于社会化网络中存在传递性、“小世界”效应、社区结构等特性[35],因此,合理利用社交网络将有助于提高图书馆推荐系统的准确度。有研究发现,通过社会关系的分析,将大幅提高科研文献的推荐准确度[36]。
在图书馆的虚拟参考服务中,很多图书馆根据读者咨询的问题,已经建设了相关的知识库。如果能将这些知识库信息和推荐系统相结合,根据读者的咨询问题,利用推荐系统向读者提供其所需要的信息,将大大满足读者的个性化需求。
3.3移动个性化推荐服务的研究
随着智能移动设备的普及,信息资源的获取变得更加方便,逐渐成为人们获取信息的重要平台。借助手机、PDA等移动终端,读者可以随时随地访问图书馆资源、阅读电子书、查询书目并接收图书馆服务。2010年OCLC组织专题讨论“图书馆的未来是移动,你准备好了吗?”(The Future is Mobile. Is Your Library Ready?)。2014年,IFLA在其研讨会“全球数字化的背景下公共图书馆的未来”(Public Library Futures In A Global Digital World)中,也讨论了公共图书馆移动服务的问题。目前,借助移动技术来促进图书馆服务已成为公共图书馆发展的契机。美国移动图书馆服务普及率相当高,仅高校图书馆的移动图书馆服务普及率就已经达到很高的比率[37]。我国自2003 年起陆续推行此项服务,目前已取得一定的成果。近几年,很多公共图书馆相继开展了微博、微信等移动服务。上海图书馆近几年来,已经推出了很多基于手机和平板终端的APP应用,更是自主研发了“爱悦读”数字阅读自助机,为读者提供在线阅读、图书下载的智能移动阅读服务。
移动推荐是近几年新兴的研究领域[38, 39]。由于移动用户的移动特性,可以随时通过移动通信终端接入网络,位置和时间成为推荐系统的一个重要上下文感知信息,使得信息推送更及时和有针对性[40]。图书馆推荐系统可以借鉴移动推荐的技术来分析读者短期和长期的兴趣,进而改进推荐效果,达到优化馆藏资源的目的。例如,通过移动设备当发现某读者在不同地点访问时,便可推荐其所在区域图书馆的特色资源等。
3.4优化用户体验
有的图书馆已经有了很好的技术、服务和资源,但因为缺乏良好的用户体验,所以不能吸引更多的读者利用图书馆资源,尤其是图书馆的电子资源。用户体验是衡量图书馆推荐系统的重要评价指标。好的用户体验不仅能使用户印象深刻,还能促使其与其他用户进行分享,提高推荐系统的粘性。个性化推荐结果的解释是用户体验的一个方面,用户在使用个性化推荐系统时,更希望了解系统如何给出的推荐结果,这对用户的体验非常重要[41]。亚马逊书店在商品推荐后会发送电子邮件告诉用户之所以向其推荐某书,是因为用户以前的购书行为进行的预测[42]。新浪微博、Google Reader也有类似的推荐解释。实际应用中,推荐系统的输出数据是一个结果列表,为了提高用户的体验,这张列表可以包含相关的解释信息,如:借过读过什么(历史的借阅数据)、浏览过什么(行为数据)、猜你可能喜欢什么(个性化预测)、个性化热门推荐(个性化的流行读物)等,每一类信息都有特定的解释,而不是简单的列表,这样为读者提供的体验将会非常不同。
良好的用户界面设计也能提高用户的体验,如,推荐结果在页面的位置也会给读者带来不同的感受。然而,对于用户界面设计,很难用理论模型和量化的方式解决。好的界面设计能够提高用户体验,但用户界面设计的准则可能大不相同,建立一个可以进行A/B测试的系统,将有助于积累重要的实验数据,为提供用户体验感觉提供理论依据。
在移动技术、电子商务技术飞速发展的今天,图书馆的读者可能会要求图书馆像商业机构一样提供卓越的用户体验,一旦他们觉得图书馆的服务无法达到他们的体验要求时,可能就不再愿意利用图书馆的资源了。因此卓越的用户体验对图书馆服务读者(尤其是非到馆读者)至关重要。
3.5个性化推荐和资源发现系统的有效结合
2009年1月的ALA( American Library Association)年会上,Series Solution 公司宣布即将发布全球第一个网络级资源发现系统——Summon,资源发现系统作为全新的学术信息发现工具引起了全球图书馆的关注。资源发现系统以“简单、快速、易用、有效”的检索体验,颠覆了传统的图书馆整合检索系统所带给用户的感受。目前,全球采用各类资源发现系统的图书馆及其他信息机构的数量已超过1300 家。就国内而言,很多高校图书馆和公共图书馆这几年也都纷纷开始了资源发现系统的研究和实践。
资源发现系统可以通过对海量数据的分析,揭示出隐含的、有潜在价值的信息和知识。面对海量的数据集合,覆盖多个学科、跨越十年甚至几十年的学术出版物可以带给我们许多新鲜的发现,基于特定需求分析海量数据,可以得到信息之间的关联和学术发展趋势。这将使得图书馆为教学科研提供细颗粒度的、高度粘合和个性化的服务成为可能,同时赋予这个海量数据无穷的活力[43]。
4 结语
推荐系统是解决信息过载的有效方案,可以为用户提供个性化的信息服务。随着需求信息多元化时代的到来,公共图书馆如何将数字化资源推荐给到馆和非到馆的读者,是促进图书馆个性化数字服务的发展目标。虽然图书馆推荐系统已有一定的应用,但是也存在一些问题,文章分析了推荐系统的发展现状,结合公共图书馆的现状,对图书馆个性化数字服务进行了思考,以期为我国公共图书馆的数字化服务提供理论借鉴。
(来稿时间:2015年7月)
参考文献:
1. Lazer D., Pentland A., Adamie L, etal. Computational social science [J]. Science, 2009, 323:721-723
2. 赵红杰.试论我国档案馆、图书馆、博物馆的协作与共建[D].武汉:湖北大学硕士论文, 2009
3. P. Resnick, N. Iacovou, etc. “GroupLens: An Open Architecture for Collaborative Filtering of Netnews”, Proceedings of ACM Conference on Computer Supported Cooperative Work[J]. CSCW, 1994:175-186
4. Baeza-Yates R, Ribeiro-Neto B. Modern Information Retrieval[M]. New York: Addison-Wesley Publishing Co., 1999
5. Murthi BPS, Sarkar S. The role of the management sciences in research on personalization[J]. Management Science, 2003, 49 (10):1344-1362
6. Resnick P, Varian HR. Recommender systems [J]. Communications of the ACM, 1997, 40(3):56-58
7. Somlo G, Howe A. Adaptive lightweight text filtering. In: Proc. of the 4th Int’l Symp. on Intelligent Data Analysis[M]. Berlin, Heidelberg: Springer-Verlag, 2001:319-329
8. Zhang Y, Callan J, Minka T. Novelty and redundancy detection in adaptive filtering. In: Proc. of the 25th Annual Int’l ACM SIGIR Conf[M]. New York: ACM Press, 2002:81-88
9. Breese JS, Heckerman D, Kadie C. Empirical analysis of predictive algorithms for collaborative filtering. Technical Report, MSR-TR-98-12[R]. Redmond: Microsoft Research, 1998
10. Hofmann T. Collaborative filtering via Gaussian probabilistic latent semantic analysis. In: Proc. of the 26th Int’l ACM SIGIR Conf[M]. New York: ACM Press, 2003:259-266
11. Marlin B. Modeling user rating profiles for collaborative filtering. In: Proc. of the 17th Annual Conf. on Neural Information Processing Systems[M]. Cambridge: MIT Press, 2003:627-634
12. Balabanovic M, Shoham Y. Fab: Content-Based, collaborative recommendation[J]. Communications of the ACM, 1997, 40(3):66-72
13. Basu C, Hirsh H, Cohen W. Recommendation as classification: Using social and content-based information in recommendation[M]. In: Proc. of the AAAI’98. Menlo Park: AAAI Press, 1998:714-720
14. Melville P, Mooney RJ, Nagarajan R. Content-Boosted collaborative filtering for improved recommendations. In: Proc. of the 18th National Conf. on Artificial Intelligence[M]. Menlo Park: American Association for Artificial Intelligence, 2002:187-192
15. Burke R. Knowledge-Based recommender systems[J]. Encyclopedia of Library and Information Systems, 2000, 69(32):180-200
16. Middleton SE, Shadbolt NR, de Roure DC. Ontological user profiling in recommender systems[J]. ACM Trans. on Information Systems, 2004, 22(1):54-88
17. Dey AK. Understanding and using context[J]. Personal and Ubiquitous Computing, 2001, 5(1):4-7
18. Lee TQ, Park Y, Park YT. A time-based approach to effective recommender systems using implicit feedback[J]. Expert Systems with Applications, 2008, 34(4):3055-3062
19. Ricci F, Rokach L, Shapira B, Kantor PB. Recommender Systems Handbook[M]. Berlin: Springer-Verlag, 2011:1-842
20. Zheng Y, Zhang L, Ma Z, Xie X, Ma WY. Recommending friends and locations based on individual location history. ACM Trans[J]. on the Web (TWEB), 2011, 5(1):1-44
21. Abdesslem FB, Henderson T, Brostoff S, Sasse MA. Context-Based personalised settings for mobile location sharing. In: Proc. of the RecSys 2011 Workshop on PeMA 2011 [EB/OL]. [2015-07-13]. http://pema2011.cs.ucl.ac.uk/papers/pema2011_ benabdesslem.pdf
22. Lee SK, Cho YH, Kim SH. Collaborative filtering with ordinal scale-based implicit ratings for mobile music recommendations[J]. Information Sciences, 2010,180(11):2142-2155
23. Wang YX, Qiao XQ, Li XF, Meng LM. Research on context-awareness mobile sns service selection mechanism[J]. Chinese Journal of Computers, 2010, 33(11):2126-2135
24. Goren-Bar D, Kuflik T. Off the beaten track: A mobile field study exploring the long tail of tourist recommendations. In: Proc. Of the Human-Computer Interaction with Mobile Devices and Services (MobileHCI 2010)[M]. New York: ACM Press, 2010:209-218
25. Herlocker JL, Konstan JA, Terveen LG, Riedl J. Evaluating collaborative filtering recommender systems. ACM Trans[J]. On Information Systems, 2004, 22(1):5-53
26. Yang Y, Padmanabhan B. Evaluation of online personalization systems: A survey of evaluation schemes and knowledge-based approach[J]. Journal of Electronic Commerce Research, 2005, 6(2):112-122
27. N. Hurley, M. Zhang. Novelty and diversity in top-N recommendation-analysis and evaluation[J]. ACM Transactions on Internet Technology 10 , 2011:14
28. R. Hu, P. Pu. Enhancing recommendation diversity with organization interfaces, in: Proceedings of the 16th international conference on Intelligent user interfaces[M]. New York:ACM Press, 2011:347-350
29. 谢菲尔德大学和 OCLC获得开发图书馆推荐系统的资助[J].现代图书情报技术,2010, 197(9):83
30. Lorcan Dempsey. Libraries and the long tail: Some thoughts about libraries in a network age [EB/OL]. [2010- 07-18]. http: / /www. dlib. org/dlib/april06/dempsey/04dempsey. html
31. Truong, K.Q., Ishikawa, F., Honiden, S.Improving Accuracy of Recommender System by Item Clustering, IEICE TRANSACTIONS on Information and Systems[Z]. E90-D-I, 2007
32. Goel S, Broder A, Gabrilovich E, Pang B. Anatomy of the long tail: Ordinary people with extraordinary tastes//Proceedings of the ACM international conference on Web search and Data Mining[C]. New York, USA, 2010:201-210
33. Donna F E. Location, location, location: Making foursquare work for your library[J]. Computers in Library, 2010(9)
34. Brow N A. 2013 social networking in libraries trends [EB/OL]. [2013-01-02]. http://socialnetworking librarian. com/2013/01/02/2013-socia-networking-in-libraries-trends/
35. Newman MEJ. The structure and function of complex networks[J]. SIAM Review, 2003, 45(2):167-256
36. S. Y. Hwang, C. P.Wei, Y. F. Liao. Coauthorship networks and academic literature recommendation[J]. Electronic Commerce Research and Applications, 2010(9):323-334
37. 高春玲. 解读美国移动图书馆发展的昨天、今天和明天[J].数字图书馆论坛, 2010(11):25-32
38. Modsching M, Kramer R, Hagen KT, Gretzel U. Effectiveness of mobile recommender systems for tourist destinations: A user evaluation. In: Proc. of the Intelligent Data Acquisition and Advanced Computing Systems: Technology and Applications 2007[M]. Washington: IEEE Computer Society, 2007: 663-668
39. Miller BN, Albert I, Lam SK, Konstan JA, Riedl J. Movielens unplugged: Experiences with an occasionally connected recommender system. In: Proc. of the Intelligent User Interfaces (IUI) 2003[M]. New York: ACM Press, 2003:263-266
40. S. Scellato, A. Noulas, C. Mascolo, Exploiting Place Features in Link Prediction on Location-based Social Networks, in: Proceedings of the 17th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining[M]. New York: ACM Press, 2011:1046-1054
41. R. Sinha, K. Swearingen, The role of transparency inrecommender systems, in: Proceedings of the CHI’06 Conference on Human Factors in Computing Systems[J]. New York: ACM Press, 2002:830-831
42. G. Linden, B. Smith, J. York, Amazon.com recommendations: item-to-item collaborative filtering[J]. IEEE Internet Computing 7,2003:76-80
43. 窦天芳, 姜爱蓉. 资源发现系统功能分析及应用前景[J].图书情报工作,2012(7):38-43
The Development of the Recommender System and the Public Library Personalized Information Service
Ruan Guangce1Xia Lei2
( 1. East China Normal University;2.Shanghai Library )
Abstract〔〕This paper discusses the development of the recommender system, then summarizes the application of recommender system in libraries at home and abroad. At last, the author proposes some suggestions to put forward the personalized information service with the recommender system in order to provide the theory reference of digital service in public library.
Keywords〔〕Recommender systemDigital libraryPublic libraryPersonalized information service
〔作者简介〕阮光册(1976-),男,博士研究生,华东师范大学商学院信息系副教授,硕士生导师,主要研究方向:信息分析,文本挖掘;夏磊(1978-),女,硕士研究生,上海图书馆副研究馆员,主要研究方向:公共图书馆服务。