APP下载

基于电商数据的产品知识图谱构建研究综述

2020-12-16王雯

农村经济与科技 2020年20期
关键词:构建

[摘要]伴随着互联网商贸行业的发展,对电商的产品数据进行分析,通过引入产品知识图谱,来解决当前电商产品信息与动态评论的关联问题。运用产品数据知识图谱的构建,能够将产品的数据进行分析、挖掘、展示和存储。借助产品知识图谱来提出相应的关系,帮助电商购物平台改善产品对比和搜索机制。因此,本文主要对基于电商数据的产品知识图谱构建进行研究分析,旨在通过对电商产品数据知识图谱关系进行详细阐述,构建新型的产品知识图谱,为电商用户提供更好的产品服务,促进我国经济的稳定发展。

[关键词]电商数据;产品知识图谱;构建

[中图分类号] F590

[文献标识码]A

在我国当前的互联网发展中,市场网购消费的发展愈发明显。在当前的产品销售中,线下与线上融合的销售模式让电商平台积累了大量的数据资源。在当前的电商平台中,如何运用产品数据进行挖掘分析,进而提升消费者在电商平台的网购体验和服务效率。在电商数据中,构建产品知识图谱,将产品的信息数据进行挖掘分析,通过产品的信息动态与静态的结合,从而完善产品知识图谱,帮助电商平台改善产品的关联对比与搜索,促进电商平台具备更好的服务。

1 电商数据服务平台现状

在当前的电商产品的数据利用中,其主要面临着电商产品信息与销售数据之间缺乏合理的运用。同样电商数据服务平台对产品的数据缺乏标准规范管理,由于当前的购物平台的搜索引擎往往知识针对消费者关键词的检索,商家对产品的不同表述往往会影响消费者对产品的查找效率,严重时候导致消费者不能够寻找到合适的产品。因此针对当前的电商数据平台的构建,需要运用和采纳个别知识图谱将产品搜索和产品对比加入到电商产品服务平台当中,从而改善消费者的购物体验和效率。

2 电商数据的产品知识图谱构建

在当前的电商数据的产品知识图谱构建中,需要融合产品的静态信息与动态评论。其中产品的静态信息主要来源于行业信息、官网信息和百科信息等三种来源;动态评价主要来自于行业信息与电商信息等两个信息源。

2.1 产品知识图谱框架设计

在电商数据的产品知识图谱构建中,其主要的框架设计采用由上到下的构建形式。电商数据产品的知识图谱框架需要先搭建产品知识图谱的模式层,在其约束下填充相应的数据层,最终形成结构化的产品知识图谱。因此其实际电商数据的产品知识图谱的逻辑框架、一般过程和构架流程如图1所示:

2.2 产品知识图谱模式层构建

2.2.1 术语获取。在模式层构建中,由于模式层相当于产品知识图谱的支架,那么对其构建是建立在现有的结构框架上进行。属于获取是电商数据的产品知识图谱从专业权威的信息员,借助产品的说明和广泛网站等信息源进行获取,其重要的价值体现在于,方便电商服务平台方便用户理解。属于获取的信息通常借助表格或者表单的半结构化呈现,其产品知识图谱模式层的属于需要从网页采集或者表单解析进行获取。

2.2.2 概念获取。在产品知识图谱的模式层构建中,其概念获取主要是产品的概念数量有限的特点中,需要采取高可信度的信息源进行结构或者半结构的信息获取相关。同样在产品知识图谱的模式层概念获取中,需要从专业性高的信息员进行获取,同样也能够服用其的领域资源,进一步保证产品知识图谱模式层的全面性和严谨性。

2.2.3 关系定义与抽取。在产品知识图谱的模式层构建中,其产品功能与市场流通的信息主要体现在关系定于当中,由于存在四种关系:因此,其采取的抽取方法也不相同。其中同义关系主要指概念上相同或者相似的表达,那么其同义关系的抽取目标为发现字面表示的不同,对同一个概念或者实体进行抽取;其中上下关系主要是根据范围确定概念与子概念,同样由于上下这种层次关系的数量有限,从抽取的效率上,其主要依赖于百科网站的上下层次关系,利用百科网站进行分类体系,获取上下关系的概念抽取;其中整体与局部的关系,主要存在于产品的组成当中,由于產品部件与整体之间存在的关系,需要利用百科网站进行和智能体部分概念抽取;其中属性关系为产品与产品特征之间的抽取,往往需要从开放式衔接数据库和半结构网页中抽取。

2.3 产品知识图谱数据层构建

在电商数据的产品知识图谱数据层构建中,主要分为抽取和融合两个阶段。其中,数据层抽取阶段主要以图谱的模式层为基础开展试题抽取和属性收取,在融合阶段主要是同义词为基础,在数据集上进行实体或者属性抽取衔接,从而达到实体关系、属性关系、同义词等,进而完成产品知识图谱的数据层构建。

2.3.1 实体抽取。在电商数据的产品知识图谱数据层构建中,实体抽取,主要能够抽取实体的名词和属性、图片预计同义词等。同样实体抽取由于具备产品知识图谱的更大领域,其实际的产品知识图谱数据抽取信息源具备更高的领域性和权威性,同样实体抽取包含大量的领域实体,可以直接用于产品知识图谱的数据仓,因此数据层的实体抽取需要从产品的官网和结构化网站上进行抽取,以便提高产品领域的中文分词的精准,同样抽取的规则为依次抽取,实现产品命名实体的抽取。

2.3.2 属性抽取。在电商数据的产品知识图谱数据层构建中,如果实体所属概念含有属性,只需抽取属性值,如果不存在概念,需要抽取属性与属性值。同样竖向抽取的主要针对数据层的关心关系的收取,其包括属性值范围和信息,同样在数据层的构建中,需要运用部分数据进行抽取,当前最为有效的属性抽取方法为采用结构化和半结构化进行信息资源抽取,同样借助电商产品相关的高质量网站,属性抽取可以借助网站的半结构化信息,直接获取实体信息与属性值。

2.3.3 评价对象与评价词抽取。在产品知识图谱的数据层构建中,评价对象与评价词抽取,主要是产品的性能和洗属性以及流通方向下进行抽取。评价对象和评价词抽取主要是在传感否不发的关系上进行,同样评价词或评价对象的抽取主要是对句中的关系距离与语法进行抽取,与句子相比较,评价词和评价对象抽取需要根据句子的路径和磁性进行归纳抽取。

2.3.4 实体关系抽取。在电商数据的产品知识图谱数据层构建中,实体关系抽取主要是上下为关系和整体部分关系的复用抽取。鉴于数据层的实体具备的属性与评价往往来源不同的信息源,因此在抽取中需要重视上下位关系与整体部分关系的复用抽取,以构建的模式层为基础,完成数据层中的关系抽取,通过具体,将数据层实体进行模式层对应,采用复用概念来实现整体部分关系抽取。同样实体关系抽取需要重视同义关系与属性关系抽取。由于模式层的同义词关系具有一定的数量限制,因此起用部分概念间的同义词外,需要从属性抽取的过程获取。

2.3.5 属性衔接与实体衔接。在电商数据的产品知识图谱数据层构建中,属性抽取和实体抽取主要分为表述灵活的实体同义和规范的实体对象,同样在已抽取的评价对象中,根据数据涟源。信息载体和语言习惯等相关因素,进行产品知识图谱的属性衔接与实体衔接。根据产品知识图谱中个实体与属性具备较高的领域性,那么借助实体衔接与属性衔接能够从统计的角度进行抽取。

2.4 存储设计

在电商数据的产品知识图谱构建中,为了保障其适用于各个大电商平台和行业网站,需要存在市场占用率高且稳定的节点存储图谱数据,通过节点、关系与属性的存储结构,将产品的存储知识图谱进行完整的转换,从而实现其存储的关系一一对应。产品知识图谱的实体往往是独立存在的队形,实体作为存储关系的节点,通过关系、节点与属性的衔接,实现电商产品的存储。同样将产品的属性作为一个节点进行存储,能够实现产品的属性抽取和附属关系的表达。产品知识图谱中的一个实体产品往往关联着多个评价词,新颖的评价属性通过词表进行存储,实体词与属性词作为实体衔接与属性衔接的基础,其数据庞大,通常需要在产品知识图谱存储与绘制的过程中进行多次调用,依照键值对应的方式存储到文件当中。

3 电商数据的产品知识图谱实例生产分析

在当前的电商数据的产品知识图谱构建中,以笔记本电脑进行实例分析,通过按照框架设计、模式层构建、数据层构建等,可以生产笔记本电脑类产品知识图谱进行相应的应用。笔记本电脑知识图谱的生产需要电商网站和笔记本电脑行业测评网站上的笔记本静态信息与动态评价,其中静态信息采用树结构进行抽取,同台信息运用异步传输抽取。同样对于抽取的初始数据进行集中清洗与预处理,将夜色的字符过滤,对其中的中文冯恩超和词性进行标准。同样笔记本电脑产品知识图谱需要是涉及品牌、上市时间、代言人、外观、硬件、软件等等。对于笔记本电脑知识图谱的数据层进行生成,借助相应的方法进行抽取与衔接,运用实体抽取,展开评价词和评价对象抽取,运用句法分析的评价词与评价队形进行抽取,借助过滤和实体衔接来保证笔记本电脑知识图谱数据的准确性,通过基于获取的笔记本电脑领域的同义词比对,完成笔记本电脑知识图谱上的实体衔接与属性衔接,生产笔记本电脑知识图谱的数据层,最后借助节点存储笔记本电脑的知识图谱。同样由于笔记本电脑更新快和评价变化较大等特点,需要生产商通过研发与完善产品的基础,实现分析不同信号的笔记本电脑知识图谱,不仅加强产品之间的哦关联,同样也对产品升级的属性进行评价反馈,从而不再局限于客观属性与属性值的对比,让产品进一步联系到用户评价,从而将笔记本电脑客观属性和用户评价进行管理,通过产品知识图谱来进一步分析笔记本电脑属性与属性之间的管理,从而发现属性差异对于用户评价造成的影响,能够实现笔记本电脑的优化设计和提升购买者的购买效率与满意度。

4 结语

由此可见,在电商数据的产品知识图谱构建中,注重框架设计、数据层和模式层构建,从而实现运用产品数据进行挖掘分析,进而提升消费者在电商平台的网购体验和服务效率。在电商数据构建产品知识图谱,将产品的信息数据进行挖掘分析,通过产品的信息动态与静态的结合,从而完善产品知识图谱,帮助电商平台改善产品的关联对比与搜索,促进电商平台具备更好的服务。

[參考文献]

[1]李原昕,周松涛.线上线下结合的电商超市新零售运营模式研究[J].电子商务,2020 (07).

[2]刘嫒嫒.浅议大数据下跨境电商平台选品策略[Jl.商讯,2020 (20).

[3]徐涛.基于大数据的中小型电商企业精准营销研究[J].中国商论,2020 (04).

[4]闵亨慧子大数据背景下电商企业网络营销存在的问题及对策[J].现代经济信息,2019 (23).

[5]丁晟春,侯琳琳,王颖.基于电商数据的产品知识图谱构建研究[J].数据分析与知识发现,2019 (03).

[作者简介]王雯(1987-),女,湖北武汉市人,硕士,讲师,研究方向:电子商务多媒体。

猜你喜欢

构建
以学生为中心视角下的新型师生关系构建
基于工作任务的高职院校英语课程评价体系构建研究
浅析企业文化管理的重要性与构建
创建《数控自动编程》优质核心课程
浅析汽车维修专业一体化专业课学生评价体系的构建
动车组检修基地与动车检修分析
环境生态类专业大学生创新创业能力培养体系的构建与实践
构建游戏课堂加强体育快乐教学的探究
共情教学模式在科学课堂的构建与实施研究