企业级通用知识库构建技术研究与应用
2023-11-16梁满仓姚玲玲
张 博,白 翱*,梁满仓,姚玲玲
(1.中国工程物理研究院机械制造工艺研究所,绵阳 621900;2.中国工程物理研究院科技信息中心,绵阳 621900)
0 引言
缺乏有效的知识管理会导致一系列问题,例如:知识资产得不到有效地积累沉淀,知识资产随着少数人的离职或退休而流失;知识资产得不到充分共享利用,导致重复劳动时有发生,浪费了大量的人力、物力和时间;知识过于分散,查找费时,影响工作效率;新人成长缓慢;企业产品或服务质量因人而异等。目前,我国正在建设创新型国家,从国际分工的外围进入核心,从产业链的下游进入上游。为迎接这一挑战,企业必须借助知识管理增强其核心竞争力。近年来,随着“十三五”规划落地,许多大型组织、行业协会陆续推动知识管理。
知识库作为企业存储、管理知识的重要载体,对于促进企业知识资产的积累沉淀和共享应用具有重要意义,构建知识库通常是企业实施知识管理首先要做的事情。近年来不断有学者对专业知识库的构建展开研究,例如刘宏新面向联合收获机设计应用需求对联合收获机谱系图、知识库系统架构、农机装备设计知识表达与分析进行了研究[1]。陈思涛对面向航空制造企业的工艺技术知识管理进行了研究,构建了工艺技术知识体系框架和知识系统[2]。张明宝认为通用知识库的构建不面向具体应用,强调通用基础知识基的实现[3]。唐标研究了基于知识图谱技术的电力系统异常检测,涉及到电力系统知识图谱框架的构建[4]。赵昌葆以拉伸零件为例,研究了冲压零件试制过程知识库构建方法[5]。李瑞以支撑工装快速设计为目标研究了工装知识库的构建过程[6]。刘伟杰基于制造过程数据采集实现了工序制造案例知识库的自动构建与优化[7]。吴兴杰以支撑快速工艺设计为目的对基于MBD的工艺知识库构建和应用进行了研究[8]。通过调研发现有很多企业还没有构建真正意义上的知识库,更进一步的知识管理更是无从谈起。由此可见构建知识库并不容易,实际中还会遇到不少问题。构建能够对不同类型知识进行有效管理的、适用范围相对较广的企业级通用知识库对于企业知识资产的积累沉淀往往能够起到支撑作用,但通常会面临以下三方面具体问题:
首先,企业通常具有许多不同类型的知识,例如专利、论文、交流培训课件、二维图纸、三维模型文件、工艺文件、技术总结等,这些不同类型知识所具有的属性字段和内容格式不同,对不同类型知识进行录入、存储、检索和浏览的方式也有所差别;
其次,合理的知识分类对于知识的管理和应用均非常重要,糟糕的知识分类既不便于对知识进行管理和维护,也不便于知识的查找利用。知识管理的范围越广,对知识进行有效分类的难度就越大;
此外,如何避免企业重要、敏感知识资产不被非法获取或随意散播在企业实施知识管理的过程中不容忽视。
在知识分类方面,郑鑫雨[9]对基于树形知识分类的知识构建与查询应用进行了研究。罗鹏程[10]对如何利用聚类信息构建标签树进行了研究。LIU C[11]面向英文信息资源高效检索需求对基于循环神经网络的英文文本分类方法进行了研究。王振海[12]结合设计知识使用特点提出了四维知识分类体系,并基于超图及广义表对其进行了表达和描述。陈华为[13]搭建了基于语义知识共现技术与反馈网络的产品模糊知识聚类集成模型。翟文忠[14]介绍了知识分类表,并讨论了知识分类表在知识管理中的应用场景和主要作用。在知识访问控制方面,李亚芳[15]提出了针对新产品研发知识共享的访问控制模型,在传统RBAC模型基础上提出了T-RBAC模型,将知识访问控制与工作任务统筹考虑。在具体技术实现层面,韩斌[16]对知识图谱存储系统并发访问控制方法进行了研究。以上研究工作对于知识管理工作的实际开展、信息系统构建过程中单点技术的实现具有一定的参考和借鉴意义。
本文针对企业级通用知识库构建过程中涉及到的知识类型繁多、知识难以分类和维护、重要敏感信息泄露三方面问题分别提出了知识模板定义与应用框架、分层主分类与多维标签相结合的知识分类方法、具有一定普适性的知识访问控制方法。
1 知识模板定义与应用框架
企业通常具有较多不同类型的知识,一方面这些不同类型知识具有的属性字段不完全相同,另一方面不同类型知识的内容格式也可能不同,以专利类知识和交流培训类知识为例,其类型对比如表1所示。
为满足对不同类型知识进行有效管理的需求,本文提出了知识模板定义与应用框架,支持通过定义知识模板便可实现对不同类型知识的录入、存储、检索和浏览。知识模板定义与应用框架构成如图1所示。
图1 知识模板定义与应用框架
1.1 知识模板定义
通过对不同类型知识进行对比分析,抽象出知识模板的概念。知识模板由基本属性、扩展属性和控件三部分构成,知识模板构成如表2所示,信息系统中的知识模板如图2所示。基本属性是所有不同类型知识都具有的属性字段,在定义知识模板时会默认继承。扩展属性是不同类型知识特有的属性,如交流培训类知识的交流对象/主讲老师、交流日期/培训日期、交流地点/培训地点均属于扩展属性。控件用于上传知识内容主体,不同控件用于上传和浏览不同类型的知识内容,例如文档控件用于上传文档类知识,相册控件用于上传图片类知识,三维模型控件用于上传三维CAD模型文件。知识模板可以有一个或多个不同的控件。
图2 信息系统中的知识模板
表2 知识模板构成
定义知识模板时需指定扩展属性字段的名称、类型、是否必填项、是否索引项、是否显示等。属性的类型可以是文本、文本域、超链接、下拉框、日期、单选框、多选框、对象框等。属性的类型决定了属性内容的录入方式和属性数据类型。当扩展属性被指定为显示项时,用户浏览该类型知识内容时会看到对应的属性内容,反之则不可见。
知识模板的基本属性字段在数据库中不作存储,通过在系统中定义对象类一次性固化。知识模板的其余信息可分为知识模板、知识模板扩展属性和模板控件关联三部分存储在数据库中。知识模板记录了具体知识模板的总体信息。知识模板扩展属性记录了具体类型知识的所有扩展属性构成,每一个扩展属性产生一条记录。其中内容长度适用于文本和文本域类属性,日期格式适用于日期类属性,选项列表适用于单选框、多选框类属性。模板控件关联记录了具体知识模板关联的所有控件。知识模板模型如图3所示。
图3 知识模板模型
1.2 基于模板的知识创建与存储
知识内容可分为知识基本属性、知识扩展属性和知识附件三部分存储在数据库中。用户创建知识时需依次选择知识模板、填写知识基本属性、填写知识扩展属性、添加知识内容主体。知识模型如图4所示。知识基本属性记录了知识的名称、关键词、摘要等总体信息。知识扩展属性记录了不同类型知识所有扩展属性内容。知识内容主体通常作为知识附件存在。知识附件记录了具体知识的所有附件信息,包括作为知识内容主体的文档、图片、三维模型等。
图4 知识模型
当用户基于知识模板创建知识时,系统依据固定对象类产生知识基本属性字段,用户录入基本属性值后存储至知识基本属性表。系统依据知识模板扩展属性产生知识扩展属性字段,用户录入扩展属性值后存储至知识扩展属性表。用户通过知识模板提供的不同类型控件上传不同类型的知识附件。知识附件上传后物理文件可加密存储至服务器特定目录下,路径等信息存储在知识附件表。知识模板与知识之间的对应关系如图5所示。信息系统中的知识上传界面如图6所示。
图5 知识模板与知识对应关系
图6 知识上传界面
1.3 基于模板的知识检索与浏览
不同类型知识基于不同的知识模板以不同的结构存储在数据库中,对不同类型知识进行检索的方式也有所差别。本文提出了如图7所示的基于模板的知识多条件检索方法。
图7 基于模板的知识检索
当用户基于知识的基本属性检索知识内容时仅需在基本属性对应输入框中输入属性值后执行检索,通过匹配知识基本属性表可获取检索结果;当用户基于知识的扩展属性检索知识时需依次选择知识模板、选定扩展属性字段并输入扩展属性值后执行检索,通过联查知识扩展属性表和知识基本属性表可获取检索结果。实际应用中用户可通过组合知识基本属性和知识扩展属性进行知识检索。知识检索界面如图8所示。
图8 知识高级检索界面
不同类型知识具有不同的扩展属性和内容主体,当用户浏览知识详情时系统对不同类型知识的呈现形式也不同。知识的基本属性和扩展属性区分展示。系统依据知识内容主体格式自动选择对应的控件进行加载显示。知识内容分区显示对应关系如图9所示,知识内容分区显示效果如图10所示。
图9 知识内容分区显示对应关系
图10 知识内容分区显示效果
2 知识分类方法
恰当的知识分类对于知识的管理和应用均非常重要。从管理方面来看,合理的知识分类有利于明确管理责任主体、分解管理任务;从应用方面来看,合理的知识分类能够使得用户更加方便地获取和利用知识。
企业级通用知识库一般覆盖知识范围广,涉及用户较多。实际在构建知识分类时会面临以下问题:一方面从不同维度对知识进行分类其结果往往存在较大差异,另一方面知识分类规模较大时其维护难度很大。针对以上问题本文提出了分层主分类与多维标签相结合的知识分类方法,如图11所示。
图11 知识分类方法
首先,结合实际需求确定构建知识主分类的维度,分类的维度可以是业务域、组织、项目、产品、阶段、人员等。一级分类和二级分类可由一级管理员进行维护,三级及以下分类可由多个二级管理员进行维护。例如某制造企业从业务域维度构建知识主分类,一级主分类作为领域板块存在,包括人事财务、生产管理等;二级主分类作为知识主题存在,例如生产管理领域板块包括计划管理、物料管理、工艺管理、设备管理等主题。一级知识管理员负责领域板块和知识主题的创建与维护,确保知识主分类整体的规范性;二级知识管理员负责三级及以下分类目录的创建,一般由对相关领域较为熟悉的人员担任。以上方法有利于明确知识管理的责任主体和工作任务的分解。
其次,除知识主分类外还可从产品、专业、项目等多个维度构建知识标签,用户创建知识时可向知识添加标签,支持用户基于知识主分类或知识标签导航浏览知识。知识标签可依靠人工进行梳理,也可基于知识聚类方法自动产生[10]。知识标签的加入使得知识分类从单纯基于树形的知识主分类扩展成网状分类结构,使得知识之间的关联关系表达更加丰富。知识主分类与知识标签共同构成了多维知识分类体系,克服了从单一维度分类的局限性,能够更好地促进知识的共享应用。知识库中的领域板块、主题展示如图12所示。
图12 知识库展示
图13 知识访问控制
3 知识访问控制
知识管理的主要目的之一是通过促进知识的共享应用为组织带来价值,然而并不是所有的知识内容都适合被广泛地共享,组织内部较为敏感的知识内容通常仅限特定范围内人员知悉,否则可能会严重损害组织利益,例如企业的商业秘密等。因此,在促进知识共享利用的同时对知识的访问控制不容忽视。以下从知识创建与发布、知识检索与浏览、知识下载三个方面对知识访问控制进行说明。
如果知识名称包含敏感信息,在创建知识时需设定知识别名。用户检索知识时信息系统将检索条件与知识的真实名称进行匹配从而获取检索结果,但在检索结果列表里仅呈现知识别名。有权限的用户查看知识详细信息时应能够看到知识的真实名称。知识别名可在不影响知识共享利用的同时避免敏感信息通过知识名称泄露。
当用户创建可能含有敏感信息的知识时可设定知识的可见范围,指定哪些人可以查看当前知识内容。可支持基于部门、角色或个人设定知识的可见范围,该方式相比纯粹基于角色的访问控制更加灵活。对基于角色或部门设定的可见范围信息系统应实时获取对应人员列表,避免当人员角色或所在部门发生变化时给知识访问控制带来纰漏。实际应用中可对知识分类设置可见范围,分类下的子分类和知识默认继承父分类的可见范围,这能够在很大程度上提高工作效率。不在知识可见范围内的用户应不能够直接查看知识详细信息。信息系统提供借阅功能,使得原本不在知识可见范围内的用户能够通过借阅审批流程申请查看知识详细信息。
为避免用户通过计算机截屏的方式获取知识详细信息并散播,在信息系统中显示知识详细内容时应添加能够标识当前用户信息的水印,便于管控追溯。
必要时可通过审批流程对知识的发布进行控制,只有通过发布审批的知识对于其他用户是可见的。通过发布审批流程一方面可对知识可见范围与下载范围设定是否合理进行审查,另一方面可对知识内容是否适合发布、知识内容是否规范完善、知识归类是否合理等进行审查。
知识一旦被用户下载后就脱离了信息系统的管控,可以被任意散播,因此对知识下载的控制应受到重视。与知识可见范围类似,应设定知识的下载范围,只有在知识下载范围内的用户能够直接下载知识内容,信息系统应同时记录下载日志便于管控追溯。不在知识下载范围内的用户应不能够直接下载知识内容。信息系统可提供下载申请功能,使原本不在知识下载范围内的用户能够通过申请下载知识内容。
对于知识访问控制要求更为严格的企业,例如涉及国家秘密的企业,还可基于知识密级与人员涉密等级做更进一步的访问控制,在此不再叙述。
4 结语
本文提出的知识模板定义与应用框架、分层主分类与多维标签相结合的知识分类方法、知识访问控制方法均应用于某机械制造企业通用知识库构建。通过对知识模板定义与应用框架进行研究和应用,满足了该企业对45种不同类型知识进行有效管理的需求,该方法具有较好的灵活性和可扩展性;通过对分层主分类与多维标签相结合的知识分类方法进行研究和应用,既便于该企业对知识进行分级管理,也满足了基于主分类导航知识和基于标签多维度检索知识的需求,覆盖了10个领域板块、90余个知识主题、近10万条知识内容;通过对知识访问控制方法进行研究与应用,在不影响该企业知识共享应用的同时能够降低重要、敏感知识资产被非法获取和散播的风险。