APP下载

基于推荐系统的网上书城的研究进展综述

2023-05-30许捷琚森超

电脑知识与技术 2023年2期
关键词:推荐系统互联网

许捷 琚森超

关键词:推荐系统;网上书城;互联网

中图分类号:TP311 文献标识码:A

文章编号:1009-3044(2023)02-0063-03

1 引言

在书籍线上销售发展的二十年里,从前10年起步阶段占据线上销售主要份额的两大电商当当和亚马逊,到近10年随着京东、天猫等电商的加入,以及进行传统线下图书售卖的国营新华书店和民营渠道开始增添线上业务,线上书籍销售的总额及占比逐年增长。2015年的线上销售金额占书籍总销售金额的45%,2016年线上销售金额占比超过50%,高于传统线下销售渠道。到2017年,线上销售的增幅达14.55%,销售规模突破400亿元[1]。由此可见,线上书籍销售已经成为了书籍销售的主要方式。因此,一套完备的网上书城系统是一个线上书籍销售平台的立身之本,本文就将针对现有的网上书城系统,根据系统的组成部分进行总结。

2 网上书城系统构成

随着网络电商的数量逐渐增加,每个电商的网上书城系统也都不同,但是基本上都包括前端和后端两个部分[2],主要包括用户使用的个人账户、书籍选购以及管理员使用的书籍销售、系统管理,如图1所示。

个人账户部分用来储存每个用户的个人信息,包括登录用的账号密码、交易过的订单等,该部分支持用户自己对相关信息进行删除修改以及非用户进行注册等操作。书籍选购部分是建立用户个人与书籍商品联系的模块,用户可以通过相应的界面搜索并浏览网上书城系统中书籍商品数据库里自己想要的相关信息,对于信息符合自身需求的书籍可以进行加入购物车或是购买等操作,并且在进行支付操作后将相关信息传递给书籍销售模块。而书籍销售模块就是根据用户选购的书籍种类,建立此书籍的库存位置与用户的收货地址等信息之间的联系,把构建的联系信息传递给书籍管理人员进行出库运送等一系列的后续操作。最后一部分系统管理模块相对独立,可用于管理人员对网上书城上架的书籍信息进行更新整理,并对异常的用户账号或是交易情况进行合理的监管。

以上四个模块是一个网上书城系统必备的基础条件,因此接下来先根据这四个模块来介绍相关的技术现状。

3 网上书城系统技术现状

3.1 个人账户技术现状

个人账户模块涉及的主要是用户信息数据库的建立和注册登录等功能的实现。孟冬青(2016)[3]将数据库分为概念数据模型和逻辑数据模型,使用Ora?cle10g来管理数据概念数据模型部分按照用户的观点来对现实世界中存在的事物进行建模,不依赖于具体的数据库,也并不涉及信息在计算机中的具体表示,逻辑数据模型则是用来实现概念模型中描述的实体。而注册登录则是通过Java语言中RegisterService类的User_Reg()方法和LoginService 类的PassW-Check()方法实现,并且利用UpdateUserinfoService 类中的Upda?teUser()方法实现用户个人信息的修改。魏榴花和王辉(2014)[4]则是利用MySQL开发网上书城系统的数据库,并使用结构化查询语言进行数据库中用户个人信息的增删改查操作,对应到系统中也就是用户的注册登录以及修改。罗边伍各(2009)[5]基于ADO.NET使用Connection、Command、DataSet、DataAdapter 和Da?taReader等对象对数据库进行处理。在ADO.NET提供的平台互操作性和可伸缩的数据访问功能的基础上,建立联系模型(ER图)实体来描述用户个人信息数据库的概念。

3.2 书籍选购技术现状

孟冬青(2016)[3]对网上购书平台的选购模块的设计与开发进行了梳理,选购模块是由查询选购订单信息,保存选购订单,修改收货人信息,增加选购订单信息,更新选购订单信息这些子模块组成,是系统的重要组成部分。孟冬青(2016)[3]开发的书籍选购模块由checkBookService 类中的QueryBook()方法来实现,通过QueryBook()方法将用户的个人信息尤其是姓名与地址两个关键信息与用户选购的书籍种类联系起来。选购产生的订单信息则是使用OrderFormService类中的SearchUsers()方法,可以根据用户名得到用户的基本信息,SaveOrderForm()则是实现了把数据存入数据库的概要订单表中。OrderFormUpdate类中UpdateU?serinfo()可以实现收货人信息的修改,orderFormUpdate 类中InsertOrderForm()方法中实现了将该订单插入购物车的功能。这两个功能模块的具体实现如图2 所示。

庄跃腾[6]基于SQL SERVER 2012开发的书籍选购模块添加了图书分类、搜索查询(查询和高级查询)和显示搜索结果几种功能。其中高级查询的实现比较复杂,高查询主要有标题,作者,ISBN,详细定位查询价格范围。系统为用户提供图书搜索功能,方便用户查找自己的图书,从主页的图书信息查询系统,这种形式只为完成系统提交图书和图书分类信息。

3.3 书籍销售模块

刘立月等(2006)[7]采用了服务器IIS5.0(InternetInformation Server 5.0)和SQL Server 2000数据库技术开发的书籍销售模块的工作模式如图3所示。

可以看出该模块的主要工作流程为,用户支付选择的书籍的款项后生成订单信息,服务器根据用户的订单信息从数据库中调取相应书籍的各种信息,包括库存数量、存储地等,再根据这些信息与用户的收货人、地址等信息生成发货通知传递给配送中心,由配送中心根据发货通知将用户选购的书籍派送到正確的地址与收货人。在支付方面,刘立月等(2006)[7]选择了CyberCash和VISA系列中Master card的SET,一种基于数字信用卡的典型支付系统,来作为网上书城的交易系统,保证支付过程中的安全。

3.4 后台管理模块

后台管理是相对于前台而言的,后台管理模块为网上书城系统提供强有力的支撑。孟冬青(2016)[3]开发的后台管理模块主要有四个部分,包括图书管理、订单管理、统计管理和密码管理四大模块。图书管理部分通过AddBook Service、Delete Book Service、Check?Book Service 和CorrectBookService 四个类完成网上书城系统图书展示中书籍的添加、删除、查询和错误信息更正功能,订单管理则是用Check Order Form Service 类完成了订单的查询删除等功能,统计模块可以把书籍的销售统计通过柱形图等方式展示给管理员,密码修改模块是提供给管理人员的密码修改接口。这四个部分属于一个网上员对整个网上书城管理的基本需求。

4 书籍推荐系统

作为一种书籍购买方式,四大基础模块已经足够完成一整套流程,但这样的网上书城只能算是一个死板的书籍购买平台,要让这个书城变得“有血有肉”,就需要一些更加人性化的功能。有时在实体店中,顾客并不清楚自己想要的是哪种确切的商品,此时就需要销售人员有针对性地为顾客推荐相应的商品,方便目标不明确的顾客能够更快地找到符合自己要求的心仪商品。因此,一个优秀的推荐系统不仅能够为网上书城增加销量,也能够提升用户的消费体验感,本章针对书籍推荐系统研究现状进行总结概述。

胡至洵等(2021)[8]设计了一套基于用户兴趣分类的书籍自动推荐系统,通过离线模块对海量历史存储数据采用分离处理,使系统运行效率更高,减少系统资源过多占用及提高系统推荐性能;通过在线模块建立用户推荐集数据库子模块,采用用户兴趣分类的协同过滤推荐算法进行用户推荐,该算法只需利用用户浏览行为信息数据、网络历史日志信息即可完成书籍自动推荐,能够完成向并发用户进行有效书籍推荐的需求。通过与基于Web挖掘的图书馆个性化推荐系统进行实验对比,胡至洵等(2021)[8]设计的网上书城书籍推荐系统用户满意度更高,相较于前者70%左右的满意度,后者的用户满意度达到了91%以上。

孙晓娟等(2017)[9]则是设计了一套基于协同过滤算法的IT书籍推荐系统,整个系统主要分为基于用户和基于物品的两种协同过滤算法。基于用户的协同过滤算法的基本思想是兴趣相似的用户可能会对相同物品感兴趣。因此, 当要给某一用户个性化推荐物品时,可以先找到与其有相似兴趣的其他用户,然后把那些其他用户购买过、而该用户没有浏览过的物品进行推荐。基于物品的协同过滤算法的基本思想是,通过分析用户的行为记录,计算物品之间的相似度,把与用户感兴趣或是购买过的商品相似度高的商品推荐给用户。与孙晓娟等(2017)[9] 类似,陈思思(2016)[10]也同样是基于协同过滤算法进行书籍推荐系统的设计开发。该系统分别实现了基于读者和基于书籍的协同过滤推荐,能根据相似读者的信息为当前读者推荐其他与他相似的读者曾经借阅过的书籍,也能根据相似书籍的信息为当前读者推荐与他曾借阅过的书籍相似的书籍。而由于协同过滤推荐算法存在无法为新读者推荐书籍和无法将新书籍推荐给读者的问题,所以陈思思(2016)[10]还融合了非个性化推荐技术,用以解决这些问题。此外,与孙晓娟等(2017)[9]开发的系统不同的是,陈思思(2016)[10]还实现了专家推荐功能,专家可以将经典书籍、畅销书籍、优秀的书籍等推荐给读者。协同过滤推荐算法选取的参数(如相似度函数的选取、最大邻居数的选取、最大推荐书籍数目的选取)不同,推荐性能也会不同。本系统还实现了不同参数设置下的性能测试分析。通过比较分析了加入阈值的余弦相似度公式、使用余弦相似度的协同过滤推荐和使用Jaccard 公式的协同过滤推荐的性能,基于读者的协同过滤推荐的准确率和召回率要高一些,对于基于书籍的协同过滤推荐,使用余弦相似度,其推荐效果与使用加入阈值后的余弦相似度推荐性能类似。而使用基于读者的协同过滤推荐算法,并使用Jaccard 公式计算读者之间的相似度,限制每个读者的最大邻居数为2,限制最大推荐书籍数目为20的情况下可以获得较优的准确率和召回率。总体来说,基于读者的协同过滤的推荐效果会比基于书籍的协同过滤推荐效果好。

5 总结

互联网的发展带来了很多改变,人们的消费方式发生了很大变化,网上购书变成一种新的消费模式,随时随地满足人们的购书需求。除了以上四个基本模块和书籍推荐系统以外,随着网上书城的发展和各种技术的革新,各个电商也不再满足于上述四个基本模块的开发,为方便用户选购自己心仪的书籍,更有针对性地分析目标用户,结合大数据、人工智能以及其他新兴技术的功能也逐渐进入大众视野。除此以外,電子书因其携带阅读的便利性,也慢慢开始在书籍市场占有一席之地。所以作为人类精神文化的载体之一的书籍,在当今的信息时代仍然有着巨大的发展潜力与良好的科技经济前景。

猜你喜欢

推荐系统互联网
基于用户偏好的信任网络随机游走推荐模型
“互联网+”环境之下的著作权保护
“互联网+”对传统图书出版的影响和推动作用
从“数据新闻”看当前互联网新闻信息传播生态
互联网背景下大学生创新创业训练项目的实施