APP下载

家用吸油烟机知识图谱的构建研究

2022-02-14杜文强滕宇东顾新建

成组技术与生产现代化 2022年3期
关键词:吸油烟机家用术语

杜文强,滕宇东,顾 复,,顾新建

(1. 浙江大学 工程师学院,浙江 杭州 310027;2. 浙江大学 机械工程学院,浙江 杭州 310027)

家用吸油烟机是一种安装在炉灶上部,用于收集、处理被污染空气的电动器具[1]。家用吸油烟机的设计与生产涉及空气动力学、金属加工制造、电子电气等学科知识。该产品相关知识的数据资源丰富。以“吸油烟机”作为关键词,按2000年到2021年的时间段检索发现,大为专利网站上约有4万份公开专利,中国知网数据平台上约有2万篇论文,国家标准公共平台上有11份相关标准,企业标准备案公共平台上约有100份标准。

家用吸油烟机产品在生命周期的不同阶段,对相关人员的的知识要求是不一样的。举例来说:工业设计师在研发过程需要融合各种知识,设计出让用户有更好体验的产品;工业工程师需要融合各类知识,以最小的消耗实现最大的产能;销售员工需要融合各类知识,销售更多的产品,创造最大的利润;售后服务工程师需要融合各类知识,更好地提供产品维修服务,最大限度地减少投诉;企业管理者需要融合各类知识,对产品生命周期各环节及部门的知识进行高效集成和利用,提高企业的经营管理和决策水平。对家用吸油烟机产品的各种知识进行高效和精准的融合、集成、利用,离不开知识图谱的支持。

查阅相关文献可知,目前知识本体技术、知识图谱技术等在家用吸油烟机设计和生产上的应用还是空白。本文将基于Neo4j图数据库研究家用吸油烟机知识图谱的构建问题,以提高对家用吸油烟机知识管理的水平,提升知识搜索的完整率、准确率和效率,提高企业的产品研发和设计能力。

1 知识图谱构建中的问题和对策

知识图谱通过节点和边实现关系结合[2]。其节点和边的关联形式(图1)有两种:①描述实体之间的某种特定关系,如“家用吸油烟机-隶属于-厨房家电”;②描述实体与其属性值之间的某种特定关系,如“家用吸油烟机-功率是-360 W”。

图1 知识图谱中节点和边的关联形式

知识图谱的早期理念来自语义网[3],Google公司为优化其搜索引擎返回的结果,改善用户搜索的质量和体验,提出了知识图谱的概念[4]。随着社会发展,知识图谱技术在智能问答等应用方面逐渐发挥了重要作用[5]。目前,知识图谱已经应用于许多领域,如支持产品创新的用户需求分析[6]、机电产品创新设计[7]、产品工艺成本的快速估算[8]、数控设备的故障诊断[9]等,能够有效提高知识管理的水平。

知识图谱在家用吸油烟机上的应用,就是实现“家用吸油烟机产品-关系-家用吸油烟机知识文档”的图谱化构建,将产品、零部件与家用吸油烟机生命周期中的知识文档关联起来。例如,家用吸油烟机的集烟罩在设计时需要使用某专利文献,在测试时需要使用钣金件的零部件标准,在制造时需要使用集烟罩制造的工艺流程单,在维修时需要使用集烟罩的维修指导书。这些知识一般分散在产品生命周期所涉及的各个部门。在集烟罩知识图谱中,集烟罩是主线,各相关知识文档由各部门围绕集烟罩的设计、制造和服务的全生命周期来提供。来自企业不同部门的家用吸油烟机知识资源如图2所示。

图2 来自企业不同部门的家用吸油烟机知识资源

知识图谱的构建会遇到一些问题,必须有针对性地加以解决。

(1) 知识集成问题。在技术上,知识图谱可以实现分散于各部门的知识集成,提高企业的产品开发设计能力,因此知识图谱中的知识集成是一种有效益的工作。但要让企业内各部门积极将自己的知识贡献出来,需要一种机制,让员工能从知识集成获得的效益中受益,使知识贡献者得到公平合理的激励。只有这样,知识集成才可持续。对于不同企业之间的知识集成问题,要按照知识贡献所产生的效益进行公平合理的激励,难度会更大,更需要基于新一代信息技术的透明、公平的知识集成环境来确保知识共享各方的利益[10]。

(2) 知识有序化问题。知识图谱应是高度有序的,即知识节点、属性值和边的名称应是统一、规范、准确和完整的。这种知识图谱的有序化工作要求各部门相关人员积极认真参与,需要基于新一代信息技术来构建透明、公平的知识有序化环境[10]。而知识本体技术的应用有助于知识图谱有序化的实现,例如民用航空维修数据有序化[11]、学科知识有序化[12]、文物知识有序化[13]等。在构建知识图谱的三元组结构时,需要利用知识本体技术,使知识图谱有序化。例如原料药知识图谱[14]、民用航空维修知识管理平台[15]等,均采用了知识本体技术路线。

2 家用吸油烟机的知识梳理

(1) 互联网公开知识。它包括与家用吸油烟机产品相关的国家标准、专利、论文、网文、用户意见和评论等。这类知识很多,构建知识图谱时需要从大量的、杂乱的知识中找到有价值的内容。

(2) 企业内部公开知识。它包括日常工作中产生的文档资料、企业内部使用的内控标准、设计手册、测试报告等。这是企业内部要求公开的知识,通常较容易获取。

(3) 企业内部隐性知识。它包括员工的经验诀窍,诸如手感、质感、分寸感、节奏、时机、火候、度的把握能力等,往往属于员工个人的核心价值范畴[10]。这类隐性知识可以显性化,但需要员工及时总结和发布。构建知识图谱中获取这部分知识时,需要建立透明公平的激励机制。

3 家用吸油烟机知识图谱的构建

3.1 家用吸油烟机知识图谱模型的构建过程

构建家用吸油烟机知识图谱模型的过程如图3所示。由于Neo4j图数据库具有查询便利、可拓展性强等优势[16-17],因此本文构建家用吸油烟机知识图谱模型时采用了Neo4j图数据库。

图3 家用吸油烟机知识图谱模型的构建过程

3.2 家用吸油烟机的知识本体

知识本体主要用于解决描述同一概念的知识名称术语及关系的多样化问题,以提高知识搜索的完整率、准确率和效率。产品知识本体包括知识的名称术语本体和名称同义本体。家用吸油烟机知识本体的构建过程主要是:①汇总家用吸油烟机相关知识的名称术语;②识别名称术语的相似性,建立知识名称术语本体和知识名称同义本体表;③建立知识名称术语的关系本体。这里以滤网为例来说明。滤网的知识名称同义本体包含平面网、环形网、双层网、塔形网。以滤网为例的产品知识本体如图4所示。

图4 以滤网为例的产品知识本体

家用吸油烟机的知识名称术语本体主要来自以下方面:①叙词表、领域字典、设计手册等;②相关知识标题、知识内容、关键词等;③相关专业人员。家用吸油烟机集烟罩的知识名称术语本体库主要内容见表1。

表1 集烟罩的知识名称术语本体库主要内容

3.3 家用吸油烟机的知识关系本体

知识关系本体规范了知识之间的关系,在知识图谱中表现为知识名称术语本体之间的关系。在图5所示的家用吸油烟机知识关系本体中,知识名称术语本体是“节点”,由“节点”可链接具体的知识文档;知识关系本体是“边”,“边”描述了这些知识文档间的关系。

图5 家用吸油烟机的知识关系本体

(1) 产品的内部关系。它主要是一种包含(隶属)关系,可采用类似于物料清单的整机、组件、零件之间的关系。

(2) 产品与其他知识文档之间的关系。它主要包括:①设计引用、测试依照(研发)关系(用于表示产品或零件在设计应用、测试依照中的知识文档);②工艺指导、制造参考(生产)关系(用于表示为产品或零件提供工艺指导、制造参考的相应知识文档);③维修参考(售后)关系(用于表示产品或零件的维修所需要参考的知识文档);④市场营销参考关系(用于表示产品市场营销策略对应的知识文档);⑤人员管理关系(用于企业人员的能力评价,关联其文凭、资格和培训证书、所获奖项、所发知识文档等)。

(3) 知识文档的内部关系。它主要是引用或被引用的关系。

家用吸油烟机知识图谱中的主要关系之例见表2。

表2 家用吸油烟机知识图谱中的主要关系之例

3.4 家用吸油烟机知识图谱的知识获取流程

家用吸油烟机的知识文档主要分为非结构化、半结构化以及结构化3种。非结构化知识文档如产品图片、产品维修视频等,其信息抽取的准确度较低;半结构化知识文档如产品在销售网页上的数据、百度百科介绍等;结构化知识文档如生产报表数据、测试结果等,这类知识文档的信息获取准确度较高。

在构建家用吸油烟机知识图谱时,获取相应的知识文档后,需要依靠广大员工协同进行知识图谱中知识文档节点的属性标注。家用吸油烟机知识图谱的知识获取流程如图6所示。目前,知识节点的属性标注需要人工完成,要求员工积极认真、主动参与。知识节点的属性标注之例见表3。

图6 家用吸油烟机知识图谱的知识获取流程

表3 知识节点的属性标注之例

3.5 家用吸油烟机吸烟组件的知识图谱

构建家用吸油烟机知识图谱时,需要将获取的知识以统一的格式存储下来。它主要有RDF 格式存储方式和图数据库存储方式[17]。家用吸油烟机知识图谱可采用Neo4j图数据库的方式进行知识存储。本文构建的家用吸油烟机吸烟组件知识图谱的相关产品节点有19个、边有18个;知识文档节点有57个、边有92个。基于Neo4j图数据库生成的家用吸油烟机吸烟组件的知识图谱如图7所示。

4 家用吸油烟机知识图谱的应用性能评价

家用吸油烟机知识图谱的应用性能评价包括:①知识图谱内容和使用情况的评价(如果没有一定的内容、使用数量以及增加量,那么知识图谱就是一个“死库”,就没有价值可言);②知识图谱质量的评价(它与知识的有序化水平有关,主要通过知识搜索准确率和完整率这两个指标进行评价);③企业部门的知识共享度和员工的知识参与度评价(它是基于知识图谱的内容来源、本体来源的分析,目的在于建立一种透明、公平的知识图谱协同共建环境,促进更多的人参与,使知识图谱得到可持续的发展)。

4.1 知识图谱的内容和使用情况评价

知识图谱的内容和使用情况评价的主要指标有产品知识名称术语本体数量、知识关系本体数量、知识文档数量及相应的增加量,此外,还有查找知识时间的缩短量。

研究发现,从家用吸油烟机知识图谱平台可行性验证阶段到平台的试运行阶段,平台用户数量以及参与知识共享共建的人数显著增加。其效果是产品知识名称术语本体、知识文档的数量越来越大,知识的日均浏览量快速上升(图8)。

图8 家用吸油烟机知识图谱平台的数据量

对于家用吸油烟机的知识图谱来说,平台应用前后查找知识文档的时间对比情况如图9所示。

由图9数据可算出,与无知识图谱技术应用相比,家用吸油烟机知识图谱平台试运行阶段查找知识文档的时间缩短了近70%。查找知识文档时间的缩短有利于工作效率的提升,也让员工更愿意使用知识图谱。

图9 平台应用前后查找知识文档的时间对比

4.2 知识搜索准确率和完整率评价

知识搜索的准确率和完整率是家用吸油烟机知识图谱平台应用性能评价的主要指标。根据文献[18],家用吸油烟机知识搜索准确率A为从知识图谱平台中成功搜索特定家用吸油烟机知识的概率。其计算式为:

(1)

式中:T为从家用吸油烟机知识图谱平台中搜索到的正确样本数量;F为从家用吸油烟机知识图谱平台中搜索到的错误样本数量。

家用吸油烟机知识搜索完整率B为从知识图谱平台中成功搜索理想结果的概率。其计算式为:

(2)

式中,X为家用吸油烟机知识图谱平台中存在的正确样本数量。

本文对采用知识图谱技术前后搜索家用吸油烟机知识的准确率和完整率进行了统计。不同搜索分类的搜索结果如表4所示。显然,知识图谱的应用使知识文档的搜索准确率和完整率得到了有效提升。

表4 不同搜索分类的搜索结果

4.3 企业部门的知识共享度和员工的知识参与度评价

企业部门对家用吸油烟机知识图谱的知识共享度评价用于激励部门之间竞争,提高企业各部门管理者对知识图谱构建和使用的重视程度。企业部门的知识共享度能够客观反映部门的知识共享绩效。企业内部各部门之间的职能不同,对产品知识名称术语本体以及知识关系本体的共享能力存在差异。企业部门对家用吸油烟机知识图谱的知识共享度评价(例如图10),可直接用知识文档的数量来体现。

图10 企业部门对家用吸油烟机知识图谱的知识共享度评价之例

由图10可以看出:产品开发部的知识共享数量最多;市场营销部的知识共享数量最少。通过评价企业部门对家用吸油烟机知识图谱的知识共享度,可以激励各部门的知识共享行为,建立透明公平的知识共享环境,促进知识图谱的完善。

员工对家用吸油烟机知识图谱的知识参与度评价用于公平公正地展现各员工的知识共享情况,可按照评分制度给出每个员工的知识参与度。设定评分制度时应考虑员工协同共建的产品知识名称术语本体数量、知识关系本体数量、知识文档数量,以及员工知识共享行为在同事中的影响。对员工的知识参与度评价,有利于员工之间的相互学习,也有利于所构建家用吸油烟机知识图谱的完善。

5 结 论

知识图谱能够帮助制造企业对分散于各部门的知识进行集成。它以产品零部件为主线的管理模式,摒弃了传统知识管理中以知识文档为出发点的管理模式,避免了产生“死库”的知识存储现象。本文通过构建家用吸油烟机知识图谱,解决了一些关于家用吸油烟机产品全生命周期的知识管理问题。

(1) 家用吸油烟机的知识图谱是什么?以家用吸油烟机产品零部件生命周期为主线,确定来自不同部门的知识;知识是通过节点和属性描述的,知识之间的关系是用“边”描述的;知识之间的关系有多种,并且可通过属性描述实现多维度管理。

(2) 如何实现家用吸油烟机知识图谱的有序化?将家用吸油烟机的产品知识名称术语本体化;建立产品与知识文档的节点和属性;采用人工标注方式将家用吸油烟机的各类知识转换成结构化的数据文档,在建立产品与知识文档关系后实现可视化关联。

(3) 如何解决知识图谱集成难和有序化难的问题?企业知识图谱中的知识来源很广泛,不仅有公开的知识,还有员工的隐性知识,这部分知识对于企业尤其重要;知识很杂乱,名称术语很多,需要利用本体技术实现知识的有序化,这些工作的完成都离不开广大员工主动参与的精神和认真负责的态度。

(4) 家用吸油烟机知识图谱的评价指标是什么?家用吸油烟机知识图谱的应用性能评价要考虑:①知识图谱数量指标,没有数量就没有质量;②知识图谱质量指标,主要是知识搜索的准确率和完整率;③企业部门的知识共享度和员工的知识参与度。通过家用吸油烟机知识图谱的应用性能评价,可建立一种透明公平的知识图谱协同共建环境,促进知识图谱的快速完善,实现较好的社会效益和经济效益。

猜你喜欢

吸油烟机家用术语
吸油烟机产品选购指南
打造隐形家用音响系统 Polk Audio定制安装系列
家用对讲机的概述
传祺GM6:家用MPV新进阶
关于家用电热水器的安装及使用
中国/吸油烟机
消费舆情
数据在线
有感于几个术语的定名与应用
从术语学基本模型的演变看术语学的发展趋势