APP下载

在线商品虚假评论信息治理策略研究

2015-09-08陈燕方谭立辉

现代情报 2015年2期
关键词:评论者商家消费者

陈燕方 谭立辉

(华中师范大学信息管理学院,华中师范大学湖北省电子商务研究中心,湖北 武汉430079)

随着互联网和电子商务的迅速发展,在线商品评论开始产生,消费者可以在网上自由发布对已购买商品的评论信息。随着这些在线商品评论信息商业和公众价值的不断提升,同时由于存在法律的缺失以及网络监管措施的不到位和评论的非结构化等因素,促使虚假评论开始出现在人们的视野。在线商品虚假评论即指那些会误导消费者做出错误购买决策的评论,他们常常通过“乔装掩饰”成正面有用的评论,从而诱使消费者购买过分吹捧的劣质商品,或是阻止消费者购买蓄意诋毁的正常商品,以达到自己的非法目的。虚假评论使潜在消费者无法做出正确的选择,让商家处于恶性竞争的环境中,造成在线商品交易平台的评论信息鱼龙混杂。由此可见,在线商品虚假评论信息的治理策略研究具有非常的必要性和紧迫性。

目前国内外对于在线商品虚假评论治理研究中,多停留在从文本处理角度出发的虚假评论识别研究中,然而虚假评论作为一个具有极强主观性的非结构化数据文本,无论是其识别还是治理过程都需要对其整个形成过程中的行为主体、路径节点有一个系统的研究,才能更全面地挖掘虚假评论文本的特点以进一步提升识别模型的准确率和计算效率,同时也使得法律监管体制有更加明确和清晰的方针政策。因而,本文作为“在线商品虚假评论识别及其治理研究”课题研究成果之一,继《在线商品虚假评论形成路径研究》之后系统地阐述了在线商品虚假评论信息治理策略[1],针对当前研究中存在的不足之处,从治理目标的重组、治理对象的明确以及治理途径的丰富和完善3 个方面完整地指出了在线商品虚假评论信息的治理策略。

1 重组治理目标

在线商品虚假评论不仅会误导消费者做出错误的购买决策,引起在线商家之间的不正当竞争,更在极大程度上降低了在线商品评论的可信度,给电子商务评论体系带来了前所未有的挑战。不少学者试图从法律角度解决虚假评论、信用泛滥等问题[2],但一味依赖法律保障并不能取得良好的预防效果,一方面这些对策建议很难立法实施;另一方面法律只能事后制裁却很难及时预防。

由于虚假评论检测技术已逐渐成为国内外研究热点,学者们通常将虚假评论识别视为一个二分类问题,通过选取一定的测度指标和测度技术来鉴别虚假评论。但当前研究往往局限于某一商品类型(如酒店类[3]、图书类[4]),缺乏检测通用性。同时,二分类的检测方式难免过于武断,评论信息主观性强,虚假评论者作弊手段高,评论信息难辨真伪,任何检测技术都很难达到100%的准确率。

因此笔者认为,要达到发现虚假、严惩虚假的目的,必须以完善的信用体系制度、健全的法律制度作为外在辅助,以高效的检测模型作为内在动力才能更有效地治理虚假评论。法制监管需要明确在线商品虚假评论形成过程中的各个行为主体,才能有的放矢地对其加以管制。检测模型要采用合适的测度指标,具备一定的普适性,并将原有的二分类识别方法进行改进,以达到以评论可信度进行排序的识别方法,而不是仅仅给出“真”或是“假”的判断。

2 明确治理对象

2.1 虚假评论内容

在以往对虚假评论二分类的研究中,往往将检测定义为虚假的评论信息直接过滤删除,但在本文提出的以评论可信度进行排序的检测模型设想中,则要求按照某一规定阈值,将可信度较高的评论展现给用户、而可信度较低的评论则存储起来,等到下一条评论进入时,再将所有评论全部调用计算。这样就尽可能地降低由于检测误差而导致判断失真的可能性。如:某一商家请大量亲朋好友真实购买,并做出十分逼真的好评,而真实的消费者交易后给出的差评很可能会被误判为虚假,而接下来大量的消费者均给出差评时,此时便可很快得出前面的好评都是虚假的。

2.2 虚假评论者及虚假评论中介

虚假评论者分为正常评论者、一般虚假评论者以及职业虚假评论者。正常评论者指那些由于个人“过度完美”或“过度宽容”的评论风格,或者当时处于极端的情感状态,而产生的由过强主观性导致的不真实评论信息。此类评论者只能通过可信度排序尽量将其评论排后,并通过规范化评论内容来尽量减小由个人主观情感带来的偏差。一般虚假评论者很可能是受到商家的利益诱使或骚扰。一方面,交易平台需要进一步细化交易信用规则,倘若商家销售中以及旺旺聊天中频繁出现“好评返利”等字样,均将其信用度适当降低;另一方面,消费者需加强维权意识,当遇到不正当骚扰时,应积极向平台客服申诉。而职业虚假评论者,大多是与职业虚假评论中介相依相存的。虽然有些平台规定将被发现的职业虚假评论炒作者处以封号等严惩[5],但在百度等网站仍随处可见虚假评论中介的广告宣传。因此只有法律的明文禁止与严惩才能有效地杜绝职业虚假评论中介和职业虚假评论者的存在。2013 年7 月23日全国首例恶意差评师案在杭州宣判,被告杨某为首的12名“恶意差评师”团伙被以敲诈勒索罪判刑[6],同样,对于刷信用平台的不正当商业竞争也亟待法律的制约。

2.3 虚假炒作商家

在线商家的虚假炒作一直是电子商务在线交易平台的顽疾,虚假方式分为正面炒作和负面炒作。正面炒作使得电子商务交易信用积累不再依靠真实的交易途径,而是对电商长期有序竞争环境的破坏,已经严重侵犯了电商的公平竞争权,长此以往,必将导致劣币驱逐良币效应,最终致使市场失灵。而负面炒作,在主观上带有诋毁同行的意图,已构成反不正当竞争法中诋毁商誉的行为,是一种恶性的商业竞争行为,应承担相应的赔偿责任。面对虚假炒作商家,某平台曾多次重拳出击,打击方式包括:下架商品、降低商家的信用等级、查封店铺等。但仅少量网站的微薄之力,很难改善整个电商的竞争环境。需根据虚假炒作的特点有针对性地建立法律规范,完善在线交易信用体系。使商家的虚假炒作得到严惩。

3 完善治理途径

3.1 监管虚假评论形成路径的基本要素

在线商品虚假评论形成路径的基本要素包括:在线销售商家、虚假评论中介、消费者以及在线商品交易平台四个部分。要达到监管和控制基本要素的目的,一方面,需要有效地利用法律力量严惩虚假炒作商家以及虚假评论中介,以儆效尤。必须通过宣传教育,使消费者加强维权意识。平台需对真实客观的评价和积极举报揭发者给予一定的奖励。另一方面,对于在线商品交易平台,虽然开放型平台并没有参与销售,但平台的利益仍与交易量有着直接的关系,而自营型平台会直接参与销售盈利。因此,惟有第三方信用监管平台才能以一个更公正的身份,通过认证中心(CA)向商家发放数字证书,并定期对其进行信任认证和评级,为消费者提供一个更加真实可信的电商购物平台。

3.2 减弱虚假评论形成路径的促进因素

在线商品虚假评论信息的诱导因素主要在于交易主体具有不可见性以及评论内容的主观性。此外,现有信用评价体制在评价的权威性、细化度等方面的缺失也培育了虚假评论信息滋生的温床。

一条完整的评论包含消费者ID,消费者信誉、评论时间、商品打分、有用性投票、评论内容等。其中,评论内容为自由文本(非结构化数据),极易滋生虚假的类似“满意”、“宝贝不错”等空泛的评论或其他无关评论。因而,可采用半结构化评论文本来提高制造虚假评论的时间成本和人力成本,将在一定程度上减弱虚假评论的形成。例如:根据服装类商品属性,设置是否合身,是否存在色差等选项,并通过奖励来促进消费者尽量完善半结构化评论内容,提升评论内容的可信度。同时,可在现有信用体系的基础上,建立第三方信用评价机制,针对虚假评论产生的因素,增加虚假评论的发布代价,使得消费者、商家、在线商品交易平台都自动规避风险,遵守信用规则。

3.3 激励正常消费者做出真实有用的评论

根据目前在线商品评论信息的收集显示,由于非结构化文本对评论者没有太多的束缚,所以大多数的正常消费者做出的评论很多都是类似于“很好”、 “还不错”、 “还行”等之类的空泛性评论,这对潜在消费者在购物决策上并没有太大的帮助。正是由于正常消费者没有做出中肯的评论才让虚假评论者有机可乘,促使这些虚假评论员通过详细的叙述商品的信息,以及商品的体验,来诱使或者阻止消费者做出购买决策。

综上,一方面建议商家可以通过奖励的方式来鼓励消费者发表包含商品信息以及体验商品之后的心得等方面的真实有用的评论,然后通过潜在消费者自愿为评论者发表的评论进行投票选择“有用”或“无用”,最后以票数作为依据,通过赠积分、送红包、增加会员特权等方式定期为票数高的评论者给予奖励;另一方面建议电商网站平台建设者构造更具有结构化的评论体系,以减少评论者的“惰性行为”或主观性的影响。

3.4 优化虚假评论识别模型的鉴别准确率

虚假评论识别技术是协助法律监管和第三方信用评定机制的一个有效工具。当前的虚假评论检测技术一般是建立在文本分类的思想上进行处理,其完整识别及验证过程如下:首先通过网络爬虫,获取一定规模的数据集,并构建适量的样本训练集,然后从不同角度通过实验或观察分析提取虚假评论的相关特征,并根据这些特征建立适当的机器学习模型(如logistic 回归、SVM、贝叶斯等),最后用余下数据作为测试集测试模型的准确率和召回率。

但在以上识别过程中,主要存在以下两个难题:

3.4.1 样本训练集获取难

样本训练集的获取将直接影响模型验证的准确率和召唤率。在以往的研究过程中,大多数研究者通过采用人工标注方法进行处理,但误差往往较大。Liu 等[7]则通过采用杰卡德相似度比较评论内容,检测出重复评论,并将重复的评论作为正向的训练集建立logistic 回归模型来识别虚假评论,无疑遗漏了许多非重复的虚假评论。Ott 等[8]请Mechanical Turk 充当虚假评论者对20 家酒店做出虚假评论作为训练样本集。由于虚假仿真度难以保证,更无法模拟出真实的网络购物评价环境,但这仍为样本数据集的获取提供了新思路。

3.4.2 虚假评论信息模式鉴别难

当前研究分两个方面:

(1)基于评论内容的信息模式研究。包括文本相似度检测[7],基于产品特征概念层重复的检测[9],以及基于情感分析的检测模型[10]等。

(2)基于评论者行为的识别,包括评论者的打分行为偏差[11]、评论者反常行为模式的评论模型[12]等。

以上研究以文本挖掘为基础,多采用自然语言处理技术。然而,在线商品评论信息属于一个特殊的短文本信息,评论内容有其独特的特点。比如,其情感词汇语料就不同于自然语言文本,类似“好评”、“宝贝不错”的字样都是在线商品评论文本独特具备的。而消费者的行为研究则更有待于从评论时间、评论停留时间、评论者社交网络关系等方面进行探索。因此通过优化文本识别技术、加强消费者行为研究来提高鉴别准确率是迫切需要的。

4 结 语

本文分别从重组治理目标、明确治理对象和完善治理途径三方面,对在线商品虚假评论信息治理策略进行了定性分析,详细阐述了在线商品虚假评论信息针对不同治理对象的法律监管制度以及今后识别模型的优化方向,从而达到切实可行的发现虚假、严惩虚假的目的,以形成一个竞争有序的电商购物环境。而宏观法律层面的治理策略,包括对虚假评论行为主体的监管与惩处体系等仍有待完善。而对本文提出的优化检测模型策略将是课题小组下一步的研究重点与难点。

[1] 陈燕方,娄策群. 在线商品虚假评论形成路径研究[J]. 现代情报,2015,(1):49-53.

[2] 王小燕. 电子商务中的信用炒作行为法律规制研究[D]. 中国社会科学院,2013.

[3] Yoo K H,Gretzel U. Comparison of deceptive and truthful travel reviews [M] ∥Information and communication technologies in tourism 2009. Springer Vienna,2009:37-47.

[4] Hu N,Bose I,Gao Y,Liu L. Manipulation in digital word-of-mouth:A reality check for book reviews [J]. Decision Support Systems,2011,50 (3):627-635.

[5] 淘宝网. 淘宝规则[EB/OL]. http:∥rule. taobao. com/detail-62.htm,2014-03-10.

[6] 新华网. 首例差评师案告破[EB/OL]. http:∥news. sina.com.cn/o/2013-07-04/050927571266.shtml,2014-03-10.

[7] Jindal N,Liu B. Opinion spam and analysis [C] ∥Proceedings of the international conference on Web search and web data mining.ACM,2008:219-230.

[8] Ott M,Choi Y,Cardie C,Hancock J T. Finding deceptive opinion spam by any stretch of the imagination [J]. arXiv preprint arXiv:1107. 4557,2011.

[9] Algur S P,Patil A P,Hiremath P S,Shivashankar S. Conceptual level similarity measure based review spam detection [C] ∥Signal and Image Processing (ICSIP),2010 International Conference on. IEEE,2010:416-423.

[10] 彭庆喜,钱铁云. 基于量化情感的网店垃圾评论检测[J].山东大学学报:理学版,2013,(11):7-11.

[11] Lim E P,Nguyen V A,Jindal N,Liu B,Lauw H W. Detecting product review spammers using rating behaviors [C] ∥Proceedings of the 19th ACM international conference on Information and knowledge management. ACM,2010:939-948.

[12] Jindal N,Liu B,Lim E P. Finding unusual review patterns using unexpected rules [C] ∥Proceedings of the 19th ACM international conference on Information and knowledge management.ACM,2010:1549-1552.

猜你喜欢

评论者商家消费者
中国人不骗中国人
人工智能技术的电子商务虚假评论者检测
消费者网上购物六注意
商家出售假冒商品,消费者获十倍赔偿
基于D-S证据理论的电子商务虚假评论者检测
知识付费消费者
悄悄偷走消费者的创意
基于情感特征和用户关系的虚假评论者的识别
悄悄偷走消费者的创意
基于评论关系图的垃圾评论者检测研究