APP下载

电商平台商品信息组织机制研究*

2015-08-31北京大学信息管理系北京100871

图书馆建设 2015年6期
关键词:商品信息卖家分类

周 妍 王 军(北京大学信息管理系 北京 100871)

电商平台商品信息组织机制研究*

周妍王军(北京大学信息管理系 北京 100871)

借鉴分面分类等传统信息组织理论与方法,以女装类商品为例,设计出的电商平台商品信息组织机制的分层结构包括以下内容:概念层描述商品信息组织中涉及到的实体与关系;元数据层对概念模型进行映射转换,形成结构化的商品相关信息描述规范,并运用阮冈纳赞的分面分类理论对商品基本属性进行完整的分面表示;应用层借助元数据方案来增强类目筛选的层次性、辅助搜索及推荐。[关键词]电子商务信息组织分面分类本体元数据

1 引 言

近年来,中国电子商务发展迅速,规模急剧扩张。2013年,中国网购市场交易金额达到1.85万亿元,同比增长40.9%,网络零售市场交易总额占全国社会消费品零售总额的7.9%[1]。截至2013年12月,我国网购用户规模达到3.02亿,较2012年增加5 987万,增长率为24.7%,使用率从42.9%提升至48.9%[1]。各电商平台上商家和商品数量激增,导致以淘宝为代表的C2C电商平台上出现严重的商品和服务同质化现象。截至2013年10月,淘宝网卖家数量达到900万,其中活跃的有300多万家,每天的在线商品数超过8亿件[2]。如何帮助买家在众多的商品和店铺中进行选择,使其发现想要的商品,成为C2C电商平台面临的迫切问题。这一问题的解决有赖于电商平台前台的类目、搜索、推荐等商品发现机制。然而,目前电商平台的商品发现机制存在类目筛选缺乏层次、对语义搜索缺乏支持、推荐的粒度不够丰富等问题,这使得买家难以发现想要的商品,在面对诸多同质化的商品和服务时不知如何选择。因此,电商平台亟需优化其商品发现机制,以使卖家和买家之间实现精确的供需匹配。

商品发现机制的优化不仅包括对类目导航、搜索策略和推荐算法的改进,还要依靠商品信息组织的完善。商品信息组织对于解决商品发现机制存在的问题至关重要,这是因为电商平台后台的商品信息组织机制是前台实现目录导购、搜索、推荐等商品发现机制的基础。电商平台需提供合理有效的商品信息组织机制,使卖家能够在后台恰当、详细地描述自家商品。目前,C2C电商平台聚集了众多卖家,这些卖家文化水平参差不齐,能力、素质各异,许多卖家未必具备恰当描述自家商品的能力。因此,电商平台应该提供合适的商品分类与描述方案,使得卖家无论个体条件如何,都能恰当地描述自家的商品,以展示自家商品的特色,从而为自家商品找到合适的买家。然而,目前电商平台缺乏有效的元数据支持,各卖家对自家商品的分类和描述较为随意,导致买家在搜索和定位想要的商品时十分困难。这使得电商的长尾市场优势难以发挥,无法实现供求的精确匹配,各商家难以建立自身的独特竞争优势,往往只能以压低价格作为主要竞争手段,形成恶性循环。

传统信息组织领域中的文献分类法、书目元数据等研究成果,对于互联网环境下电商平台的商品信息组织具有重要的借鉴与启发意义。本研究从电商平台组织商品的现实需求出发,借鉴分面分类法等传统信息组织领域的理论与方法,设计C2C电商平台后台的商品信息组织机制。本文的研究结果印证了分类法、元数据等传统信息组织理论与方法在网络环境下发展与应用的有效性,对电商平台商品信息组织具有实践参考价值。

2 相关研究综述

2.1电子商务商品信息组织研究现状

在电子商务商品信息组织方面,国内外相关研究主要分布在商品描述、电子产品目录、商品分类三个方面。

在商品描述方面,相关研究主要讨论的是利用语义网技术构建商品描述元数据模型或产品本体,以解决目前电子商务存在的多站点间商品信息缺乏统一描述规范、异构分散的产品描述难以集成、跨站点检索效率低下等问题。利用语义网语言可以实现电子商务中数据描述的统一性、通用性及互操作性,形成电子商务核心语言的分层结构[3]。基于RDF/XML的商品元数据描述模型可以实现商品信息的多站点检索[4]。电商网站的商品信息多以表格形式组织描述,因而可以结合表格处理技术实现半自动产品本体构建[5-6]。也有少数研究关注电商网站为商家提供的商品描述与分类标引机制[7]。

电子产品目录指的是互联网上买家与卖家之间交互的、多媒体的接口,支持产品的表示、搜索与分类,并且与诸如订单、支付等其他市场业务之间也存在接口[8]。相关研究主要涉及电子产品目录的语义表示[9-15]、核心功能及应容纳的信息[8]、主要查询及索引建立[9]、产品列表在用户界面上的呈现方式对用户决策及认知负担的影响[16]等方面,强调通用电子产品目录构建[12-13]和多源电子产品目录集成[15,17]。

在商品分类方面,相关研究主要集中在通用产品分类标准及其应用[18]以及商品分类体系与用户心智模型匹配[19-21]两个方面,为海量商品自动或半自动分类、更符合用户心智模型的网站信息组织体系构建提供参考。

可见,国内外学者对电子商务商品信息组织的研究已取得一些具有启发性的成果,但也存在以下两方面的不足:(1)在商品描述方面,侧重强调便于计算机处理的标准化商品描述方式和语义网技术的应用,较多关注机器对产品信息的识别和理解以及不同系统之间的互操作性,但对概念层面商品描述本身的关注不够充分。(2)对传统信息组织领域相关研究的借鉴不足,对传统信息组织理论与方法在商品信息组织中的应用缺乏深入的探讨。

本研究以女装类商品为例,充分分析商品描述本身的概念模型,设计具体的商品信息组织机制。同时,运用分面分类等传统信息组织理论与方法,发挥其在电商平台商品信息组织中的借鉴与应用价值。

2.2分面分类法研究与应用现状

印度图书馆学家阮冈纳赞在编制与修订综合性分面分类法《冒号分类法》的过程中发展并完善了分面分类理论[22]131。该理论的核心在于“分析兼综合”原则,即文献主题的复杂概念可以通过单元概念的组配加以表达。根据这一需要,阮冈纳赞提出五个基本范畴:本体、材料、动力、空间、时间[23],认为所有基本概念均可归入这五个基本类型之中。此外,阮冈纳赞还制定了完整的分面指示符号系统,以支持对文献主题的充分揭示。

冒号分类法提出的分面分类理论思想,对世界分类法的发展具有巨大影响[22]131,这种影响持续至今。2014年4月,信息管理咨询组织Taxonomy Strategies与美国物理协会(American Physical Society,简称APS)的合作项目“物理学领域分面分类模式构建”说明分面分类法至今仍在被加以利用[24]。尽管作为一个实用的分类工具,但冒号分类法的使用仅限于印度的一些图书馆[22]131,这主要是因为分面分类法不适合实体文献资源组织的排架需求[25]。然而,在网络信息环境下,分面分类法因其良好的扩展性、分面的互斥性、引用次序的灵活性等优势,具有巨大的实用价值[26]。其中,最突出的应用是分面导航,即允许用户从多个维度对搜索结果进行筛选,从而快速获取想要的信息[27]。目前,分面分类法广泛应用于淘宝、京东、当当、卓越亚马逊、国美电器、苏宁易购等各大电商网站的类目导航体系中[28]。

分面分类法除了应用于类目导航体系外,其五个基本范畴的理论对于梳理商品繁杂多样的属性也具有潜在适用性。五个基本范畴的概念虽然相对抽象,但经过合理的阐释与运用,可以有效解决商品属性的分类问题。本研究通过引入阮冈纳赞的分面分类理论框架,对女装类商品繁杂多样的属性进行了分类与整序。

3 研究方法

本研究的目标是以女装类商品为例,设计合理有效的C2C电商平台后台的商品信息组织机制,该机制满足如下两方面的要求:(1)可以使卖家恰当、充分地描述自家的商品,易于卖家理解,方便卖家对自家商品的组织;(2)容纳了买家在查找和挑选商品过程中可能会使用到的各方面的商品属性,便于买家发现想要的商品。

为此,本研究分为两个步骤:(1)对电商平台组织女装类商品信息的现实需求进行分析,通过网站调研,界定商品信息组织的范畴,提取、整理需要描述的商品属性、相关对象及其关系。(2)借鉴传统信息组织理论与方法,设计商品信息组织机制的分层结构。

3.1女装类商品信息组织机制设计的需求分析

在需求分析阶段,本研究首先界定女装类商品信息组织的范畴,通过对目前电商平台上女装类商品类目体系的分类与筛选维度的整理以及对商品信息组织中涉及到的对象及其关系的分析,提炼出需要描述的商品属性、相关对象及其关系。

在研究范围上,本研究聚焦于电商平台的核心对象,即平台卖家、平台买家和商品,这是电商平台的直接交易主体。而其他参与电商交易、提供各种支撑服务的相关组织,如物流公司、平台卖家的供应商(即供应商的供应商)、金融机构、第三方支付机构、认证机构、软件公司等,暂不在本研究的考虑范围之内。

笔者通过对淘宝平台上女装类目体系的分类与筛选维度进行汇总和整理,得到需要描述的女装类商品属性,具体包括:价格、品牌、尺码、风格、元素、衣长、袖长、领型、腰型、服装版型、图案、材质、面料、成分含量、工艺、穿着方式、厚薄、款式、上市年份与季节、适用季节、适用场合等(见表1)。如何对这些繁杂多样的商品属性进行分类和整序,是本研究的一个重要子问题。

3.2女装类商品信息组织机制的分层结构设计

表1 女装类商品的描述维度汇总表

在需求分析的基础上,本研究设计了一个商品信息组织机制的分层结构,自底向上依次为概念层、元数据层和应用层。分层结构设置的依据如下:

(1)类似的分层思想已在传统信息组织领域中得到实践,如DC(Dublin Core)就分为抽象模型(DCMI Abstract Model)、描述集合规范档(Description Set Profile Specification)、应用文档(Application Profiles)等多个层次[29]。

(2) 分层结构提供清晰的逻辑模型,下层是上层的基础,有助于人们对组织机制的理解。

(3) 不同层次信息的抽象程度、存储结构以及精确度不同,分层结构便于计算机在实现该机制时进行必要的差异化处理和操作。

在概念层,笔者利用本体构建的方式对电商平台商品信息组织相关的关键实体及其关系进行归纳,绘制女装类商品信息组织的概念模型。元数据层对概念模型进行映射转换,形成结构化的商品相关信息描述规范。在这一层面,笔者借鉴阮冈纳赞的分面分类理论,对女装类商品的基本属性进行分类与整序。应用层以元数据方案为基础为前台商品发现机制提供支持,如增强类目筛选层次性、辅助搜索及推荐等。

4 商品信息组织机制分层结构

4.1概念层

笔者对电商平台商品信息组织相关的关键实体及其关系进行归纳,以矩形表示实体,以菱形表示关系,以椭圆形表示实体的属性,并对关系的类型进行标注,得到如下E-R图(见图1)。

图1 电商平台商品信息组织相关的关键实体及其关系

在C2C电商平台环境下,有三类关键实体:商品、买家、卖家。三类实体之间的关系是:“卖家”销售“商品”、买家”购买“商品”、“卖家”与“买家”相互评价,且这些关系都是多对多关系。为了销售商品,卖家还需在销售之前对自家商品进行描述,并在销售之后记录商品交易的情况。买家为了购买商品,首先会有一个查找、挑选商品的过程,而购买之后还会对商品进行评价。买家除了对商品进行评价,也会对卖家进行评价,而卖家也会对买家进行评价。此外,商品还具有各种各样的属性,如品牌、价格、材质、款式、风格、工艺、适用场景、适用季节等。

因此,电商平台后台的商品描述元数据方案需支持以下四方面信息的表示:

(1) 商品的各方面属性。对商品基本属性的描述是完整反映商品特征的基础。所需描述的商品属性既与商品本身的性质有关,又在很大程度上取决于买家如何查找、挑选商品。也就是说,卖家描述的商品属性应当与买家搜寻商品的角度、筛选商品运用的属性相匹配。这便需要一个有效的框架来对繁杂多样的商品属性进行分类与整序。

(2) 商品交易情况。商品销售情况需要得到准确记录,这是买家选择商品的重要指标,也是电商平台提供热门商品推荐的依据。

(3) 评价情况。以往买家对商品以及店铺的评价信息可以作为潜在买家挑选商品与店铺时的参考依据,而卖家对买家的评价则有助于屏蔽少数恶意买家对正常评价结果的干扰,因此我们有必要对买家与卖家之间的相互评价信息进行记录。

(4) 店铺信息。C2C电商平台存在严重的商品与服务同质化现象,买家即使选定了某款商品,也很可能进一步面临选择卖家的问题。这就要求对店铺信息进行全面的记录,以便买家对卖家的选择。店铺信息既包括店铺名称、所在地区等基本信息,又包括随着销售情况、用户评价而动态变化的等级、口碑、信誉度等信息。

4.2元数据层

在元数据层,笔者对概念模型进行映射转换,形成结构化的商品相关信息描述规范,其中一个关键问题就是对商品属性的梳理。由于女装类商品的属性多样而繁杂,因此需要一个合理的框架对其进行组织。对于这一问题,阮冈纳赞的分面分类理论提供了一个有效的思路。阮冈纳赞认为,可以将所有的基本概念归纳为五个基本类型:本体(Personality)、材料(Material)、动力(Energy)、空间(Space)、时间(Time)[23]。其中,本体表示事物对象或事物种类;材料表示与主题对象有关的材料;动力表示对事物对象的操作和处理;空间与时间则表示资源对象发生的空间位置和时间概念[22]132。尽管五个基本范畴理论的目的在于揭示文献资源的复杂主题,但其对于商品属性的揭示同样具有适用性:本体可对应商品种类;材料可对应反映商品本身性质的一些属性;动力可对应对商品的处理;空间可对应商品的适用场景;时间可对应商品的季节属性。通过借鉴阮冈纳赞的分面分类理论,笔者对女装类商品的各种基本属性进行分类、梳理和整序,形成较为完整的商品属性分面表示(见表2)。

表2 女装类商品属性的分面表示

笔者进一步比较商品信息组织与文献资源信息组织中的相关实体及关系,认为可以将“商品品牌”类比“文献作者”、将“店铺”类比“出版社”,设计相应的信息组织机制。除此以外,后续研究还将对商品价格、商品交易信息、评价信息等动态信息的组织机制进行设计。最终,将形成一套完整的元数据描述方案。

4.3应用层

类目、搜索、推荐是电商平台前台为用户提供的重要的商品发现机制。本研究提出的商品描述元数据方案在这三个方面都能提供有效的支持:

(1) 类目。商品类目体系的形成是以后台的元数据描述为基础的。通过对商品的各方面属性进行分类和描述,电商平台前台的商品类目体系可以根据不同维度有层次地展开,用户在浏览类目体系的过程中可以充分理解商品的各方面情况,并方便地根据自身关心的属性对商品进行筛选,有效缩小选择范围。基于元数据的描述方案还可以根据不同情况灵活生成动态类目,如根据“适用季节”属性挑选出适合特定季节穿着的服装,从而专门为用户提供应季商品的类目体系。

(2) 搜索。基于概念层的本体结构以及元数据层的规范化描述,搜索能够更准确地捕捉用户检索式背后的真正意图,即增强对语义搜索的支持,返回更符合用户需求的搜索结果。例如,当用户输入关键词进行搜索时,搜索系统可以首先判断关键词的类型(如是属性名称还是属性值),然后提供有针对性的搜索提示和搜索结果。当用户输入“连衣裙 小清新 蕾丝”时,搜索系统可以便捷地筛选出商品种类为“连衣裙”、风格为“小清新”、元素包括“蕾丝”的商品并返回给用户。进一步推测用户可能比较关注服装的风格和元素,那么当用户在搜索其他类型的服装时搜索系统可提供一些风格属性词或元素属性词作为搜索提示词,并在搜索结果及类目体系中将“风格”、“元素”两个筛选维度排在类目体系的靠前位置。

(3) 推荐。在充分描述商品属性和店铺信息的基础上,推荐可以覆盖商品属性、商品、店铺等多种不同粒度。例如,热门推荐不仅可以提供“爆款”,还能够进一步揭示出当前的热门风格、元素、款型等。在个性化推荐方面,通过分析用户浏览与购买过的商品的属性特征,可以分析出用户对于材质、风格、元素等商品属性的偏好,从而提供更精准的个性化推荐。

可见,借助本研究提出的元数据方案对商品相关信息进行描述,可以增强类目筛选的层次性、支持语义搜索、丰富推荐的粒度,从而有效地支持与优化前台的商品发现机制。

5 总结与讨论

本文以女装类商品为例,提出了一个C2C电商平台的商品信息组织方案,自底向上依次为概念层、元数据层和应用层。本研究印证了分类法、元数据等传统信息组织理论与方法在网络环境下发展与应用的有效性,对电商平台上的商品信息组织具有实践参考价值。

后续研究面临的关键问题有两个:

(1) 完整的元数据方案设计。目前的研究在运用阮冈纳赞分面分类理论的基础上形成了商品基本属性的分面表示,实现了对繁杂多样的商品属性的分类和整序,但除此以外还需对商品品牌、店铺信息以及商品价格、商品交易信息、评价信息等动态信息设计描述与组织机制,从而形成完整的商品描述元数据方案。

(2) 商品信息组织机制的验证。目前研究尚未对所设计的商品信息组织机制的合理性、有效性进行验证,笔者计划在完整的组织机制设计完成后,开展用户实验,对比淘宝平台当前为卖家提供的商品描述与分类标引机制以及本研究所设计的商品信息组织机制,考察所设计的组织机制对用户完成典型任务的效果,从而对本研究中的机制进行验证。基于用户实验的验证将是下阶段商品信息组织机制研究的重点。

[1]2013年中国网络购物市场研究报告(2014年4月)[EB/OL]. [2014-10-04]. http://wenku.baidu.com/link?url=LBfgBTRkhJ2H 9iocigTr3_AA-KN3Ge7_bu-q82X4O7YO763IK-XRoHax_ UBvE7MkPTLi5p MCYKRnC7KqtnNnt6u36 GKTcYZTK s0FwvveeZa.

[2]2013淘宝网开店店铺数量(卖家数量最新数据)[EB/OL]. [2014-10-05]. http://www.9982.cc/a/778.html.

[3]陈鹤杰, 孟祥武. 应用于电子商务的语义 Web 核心语言分析[J].计算机应用研究, 2004,21(1):79-81.

[4]彭代毅, 尹德辉, 李炳法. 一种有效的电子商品描述模型和多站点检索机制[J]. 计算机应用, 2005,25(2):472-474.

[5]Nederstigt L J, Aanen S S, Vandic D, et al. FLOPPIES: A Framework for Large-Scale Ontology Population of Product Information from Tabular Data in E-commerce Stores[J]. Decision Support Systems, 2014,59(1):296-311.

[6]刘丹, 谢庆生, 顾新建. 电子商务环境下产品本体构建技术研究[J]. 计算机应用, 2007,27(3):752-755.

[7]鲁晓明, 王博文, 詹刘寒. 淘宝网商品信息组织分析[J]. 图书情报工作, 2013,57(2):244-248.

[8]Stanoevska-Slabeva K, Schmid B. Internet Electronic Product Catalogs: An Approach Beyond Simple Keywords and Multimedia[J]. Computer Networks, 2000, 32(6): 701-715.

[9]Ozgur A, Gundem T I. Efficient Indexing Technique for XMLBased Electronic Product Catalogs[J]. Electronic CommerceResearch and Applications, 2006,5(1):66-77.

[10]Kong S C W, Li Heng, Liang Yong, et al. Web Services Enhanced Interoperable Construction Products Catalogue[J]. Automation in Construction, 2005, 14(3): 343-352.

[11]Domingue J, Stutt A, Martins M, et al. Supporting Online Shopping Through a Combination of Ontologies and Interface Metaphors[J]. International Journal of Human-Computer Studies,2003, 59(5): 699-723.

[12]余波. 基于 XML 的商品信息描述标准[J]. 情报杂志, 2006,24(11): 83-84.

[13]谢山, 孙莉. 基于 XML 的企业电子商务交易平台目录系统的设计[J]. 计算机应用研究, 2002,19(5):125-126.

[14]陈冬林, 李晓菲, 张军. 客户视角的电子目录本体元模型[J].计算机应用, 2010,30(2):129-131.

[15]陈冬林, 张军, 李晓菲. 电子目录语义集成与智能服务系统研究[J]. 情报杂志, 2010,29(12):129-133.

[16]Schmutz P, Roth S P,Seckler M, et al. Designing Product Listing Pages—Effects on Sales and Users' Cognitive Workload[J]. International Journal of Human-Computer Studies, 2010,68(7): 423-431.

[17]Aanen S S, Vandic D, Frasincar F. Automated Product Taxonomy Mapping in an Ecommerce Environment, Expert Systems with Applications (2014) [EB/OL]. [2014-10-04]. http://dx.doi.org/ 10.1016/j.eswa.2014.09.032.

[18]杨秀丹, 乔莹. UNSPSC 在电子商务网站中的应用分析[C]// Proceedings of the 2010 International Conference on Information Technology and Scientific Management. Tianjin: Scientific Research Publishing, 2010.

[19]朱晶晶. 电子商务网站分类体系理解的用户心智模型研究[D].南京: 南京理工大学经济管理学院, 2010: 36-53.

[20]张红, 甘利人, 薛春香. 基于标签聚类的电子商务网站分类目录改善研究[J]. 现代情报, 2012,32(1):3-7.

[21]钱敏, 甘利人, 孙蕾, 等. 基于符号表征理论的用户心智模型与网站表现模型研究: 以商品分类使用分析为例[J]. 情报学报, 2012, 31(10): 1110-1120.

[22]马张华. 信息组织[M]. 3版.北京: 清华大学出版社, 2008.

[23]Ranganathan S R. Philosophy of Library Classification[M]. Bangalore: Sarada Ranganathan Endowment for Library Science,1989:56.

[24]Thurner T. American Physical Society Taxonomy-Case Study [EB/OL]. [2014-09-24].http://blog.semantic-web.at/2014/04/02/ joseph-a-busch-case-study-on-an-american-physicalsocietys-taxonomy.

[25]施国良. 国内外分面分类法基本理论研究述评[J]. 图书馆学研究, 2009,30(12):2-5.

[26]张振森, 程灏, 李丽. 网络信息分面分类体系的理论与应用研究[J]. 情报杂志, 2009,28(8):62-66.

[27]Papa S. The Faceted Navigation and Search Revolution[J]. KM World, 2006,15(4):6-7.

[28]李敏, 王振蒙, 闫晨刚. 分面分类法在电子商务网站中的应用调查分析[J]. 图书馆研究, 2013 (1): 55-58.

[29]Dublin Core Metadata Initiative. Metadata Basics[EB/OL]. [2014-11-09]. http://dublincore.org/metadata-basics.

周 妍 硕士研究生,现工作于北京大学信息管理系。王 军 教授,现工作于北京大学信息管理系。

Study on the Product Information Organization Mechanism for the E-Commerce Platform

By utilizing the experience of traditional knowledge organization theories and methods, this paper designed a multi-layered structure of female clothing product information organization mechanism for e-commerce platform: the conceptual layer captures relevant entities and relationships within the product information organization field; the metadata layer transforms the conceptual model into a linear and structured scheme to standardize the description of the product information, and we introduced Ranganathan's faceted classification scheme to arrange various basic properties of products; the application layer strengthen the hierarchy of the category selection, the assisted search and the recommendation based on the metadata scheme.

E-commerce; Information organization; Faceted classification; Ontology; Metadata

G254 [文献标识码] B

*本文系国家自然科学基金项目“面向电商平台生态平衡的目录导购机制研究”的成果之一,项目编号:71373015。

2015-01-04 ]

猜你喜欢

商品信息卖家分类
中国商品信息服务平台
卖家秀与买家秀
商品信息
分类算一算
卖家秀与买家秀
买家秀和卖家秀
不会吃蟹腿的买手 不是好卖家
分类讨论求坐标
备战双十一
数据分析中的分类讨论