APP下载

集团企业研发设计资源语义模型研究

2022-09-14赵振刚杜丽峰

锻压装备与制造技术 2022年4期
关键词:维度资源模型

赵振刚,杜丽峰,王 磊

(1.天津大学 机械工程学院,天津 300350;2.天津市天锻压力机有限公司,天津 300232)

在工业4.0 背景下,全球制造业正朝智能化、服务化的方向发展,产品更新换代加快,竞争更加激烈,这对企业的产品创新能力有了更高要求。硬件、软件和信息等研发设计资源作为集团企业的核心资产,是产品创新的重要支撑。然而集团企业研发设计资源有着地理上分散、形式上异构以及存储上分布的不足,这些不足对于产品创新的速度有一定的阻碍。同时,资源在集团企业内部及合作伙伴间得到最大范围共享、高效共享和安全共享也对产品创新有着很大影响。但是现有的研发资源主要是根据各自专用的专家信息系统来实现,企业不同的部门之间实际共享研发资源困难[1]。因此构建统一的研发设计资源组织体系,对分散异构的资源统一集成管理显得尤为必要。

本文对集团企业研发设计资源的内涵和特性进行了深入研究,结合相关研究成果对研发设计资源进行分类,构建了基于语义的集团企业研发设计资源信息模型,并利用XML 格式对该信息模型进行了描述。

1 集团企业研发设计资源

1.1 研发设计资源内涵

传统的制造资源有着广义制造资源和狭义制造资源之分[2],狭义制造资源主要指加工一个零件所需要的物质元素,是面向制造系统底层的制造资源,例如机床、刀具、工装等。广义制造资源是完成产品整个生命周期的所有生产活动的软、硬件元素,包括了设计、制造、维护等相关活动过程中涉及的所有元素[3]。

研发设计资源属于制造资源,没有明确定义,可以认为研发设计资源是广义制造资源的子集,是在云制造环境下用于产品设计阶段的资源要素的总和[4]。文献[5]认为设计资源是产品设计活动的元素,为产品设计活动提供帮助及支撑。本文对研发设计资源定义如下:研发设计资源是构成产品设计活动最基本的要素,一般指所有能够为产品设计活动提供支撑的资源总和。

1.2 研发设计资源分类

从资源提供者的角度,按照资源的属性、用户需求、使用方式以及在制造活动中发挥的作用,可以将制造资源分为人力资源、制造设备资源、技术资源、物料资源、应用系统资源、服务资源、用户信息资源、计算资源和其他相关资源[6]。依据设计资源的存在形态及其之间的形成关系,将设计资源分为有实体的设计资源和无实体的设计能力,其中有实体的设计资源进一步分为智力、知识和工具资源,而无实体的设计能力包括用于产品设计阶段的需求分析、方案选择、概念设计、结构设计和实体设计等方面的能力[4]。从管理角度,可以将资源分为人力资源、生产资源、财务资源、市场资源以及开发设计资源[7]。通过集团企业不同的设计活动和资源本身的内涵和特性,可以在多种维度下对资源进行分类。根据研发设计资源的内涵以及对资源统一管理和共享的需求,本文从以下5 个维度对资源进行分类:资源在集团企业中的功能、资源所属的专业名称、资源所在的业务活动、资源的权属和资源的生命周期。图1 为集团企业研发设计资源的多维度分类模型,其中功能维度作为资源分类的主维度,专业领域、业务活动、权属、生命周期等为辅助维度。

图1 研发设计资源多维度空间信息模型

(1)资源在集团企业中有各自的功能,既有联系也有区别。根据功能的不同,研发设计资源可以划分为软件资源、硬件资源、人力资源、场地资源、技术资源和信息资源等6 类。其中,软件资源是支撑集团企业设计过程管理与协同以及设计、仿真、分析、实验等主要设计活动的软件及系统,包括管理软件、协同与通讯软件、设计软件、仿真软件、分析计算软件;硬件资源是指支撑集团企业设计过程管理与协同以及设计、仿真、分析、实验验证、试制等主要设计活动的设备,包括生产试制设备、计算机与服务器、网络设备、实验设备、检测设备、物流与运输设备、办公设备等;人力资源是参与到集团企业设计活动中工程技术人员、管理人员、服务人员和其他人员;场地资源是支撑集团企业设计过程管理与协同以及设计、仿真、分析、实验验证、试制等主要设计活动的场地、车间、实验室等,包括实验场地、加工制造装配场地、测试场地、存贮场地等;技术资源是指集团协同设计过程中支持设计过程管理、设计、实验、分析验证的资源总和,包括标准、规范、模板、规则、方法、模型、经验等;信息资源是集团协同设计过程中形成的以多种介质、媒体形式存在的信息综合,包括市场信息、设计研制信息、制造信息、运维信息、质量信息等。图2 为集团企业研发设计资源功能维度下的信息模型框架。

图2 资源功能维度信息模型框架

(2)集团企业中包含各个专业领域的资源,按照资源的专业名称,从各个专业领域中提取出代表性的术语集合,作为资源分类的特征词集,形成各专业资源的分类标准。此维度下资源可划分为控制、液压、制造、动力、结构、电气、测试、管理等类别。

(3)集团企业中的资源应用到不同的业务活动中。对全部业务活动进行归类,根据业务活动的类型、性质等将研发设计资源划分为需求分析类、研发设计类、仿真预测类、试验测试类、生产制造类和行政管理类。

需求分析类资源包括与装备及各分系统的指标论证、技术分析、方案设计、定型设计等活动相关的资源;研发设计类资源包括与装备部件研发、信息系统开发、软件开发等活动相关的资源;仿真预测类资源包括与装备性能参数的仿真、系统性能的仿真等活动相关的资源;试验测试类资源包括与装备的试验、系统测试等活动相关的资源;生产制造类资源包括与装备的部件加工、批量生产、设备制造等活动相关的资源;行政管理类资源包括协同设计过程中涉及到管理、协同、绩效等相关活动的资源。

(4)构建研发设计资源信息模型的目的之一是便于资源共享,进而提高产品研发创新的效率。从资源共享的角度出发,定义资源的权属维度,以描述资源的可共享性和共享的基本规则。资源权属维度下的资源包括资源持有者、共享范围、共享级别、共享对象、共享方式和共享期限等类别。

(5)作为集团企业中的研发设计资源,无论是实体资源还是非实体资源,都有其本身的生命周期。从资源生命周期维度出发,可以将资源划分为购买日期、已使用年限和资源有效期等类别。

1.3 研发设计资源属性

研发设计资源种类繁多,各资源均有若干属性。本文结合面向对象的思想,将各资源看作独立对象,各对象属性既有共性也有差异,同时还应有其他维度的相关信息。综合以上因素,研发设计资源的属性可以划分为基本属性、能力属性、状态属性、继承属性和维度属性。表1 为研发设计资源的属性信息。

表1 研发设计资源的属性

2 研发设计资源信息模型定义与描述

资源模型通过定义资源之间的逻辑关系和资源的属性,来描述资源的结构及结构之间的逻辑关系[8]。文献[9]提出了面向云制造系统的制造资源数据模型。文献[10]结合语义知识和Web 技术,建立了加工设备资源信息模型并用XML 进行描述。文献[11]提出了基于资源功能的网络化制造资源模型,并且采用Web 服务进行封装。文献[12]提出一种基于语义的云制造资源建模与服务化封装方法,将制造资源抽象为制造能力,采用本体建模技术构建了基于语义的云服务结构模型。文献[13]基于XML 的研究,描述了制造资源模型的数据元素、资源库等多个内容。文献[14]提出了一种基于双层规划的资源优化配置模型。文献[15]以检测时间为约束,总成本为目标函数,建立了检测资源分配模型。

2.1 研发设计资源模型定义

基于面向对象的思想,总结研发设计资源的属性,以资源的功能维度为主维度,将资源的共同属性抽象出来,并考虑资源的不同点,加入其他属性,实现资源维度、属性和描述的动态扩展及自动继承。

定义1 研发设计资源

RDDR(Research &Development and Design Resources)={ Sw_R,Hw_R,HR_R,Tech_R,Info_R,Field_R}。

其中RDDR:研发设计资源(Research &Development and Design Resources)

Sw_R:软件资源(Software_Resources),

Hw_R:硬件资源(Hardware_Resources),

HR_R:人力资源(HumanResource_Resources),

Tech_R:技术资源(Technology_Resources),

Info_R:信息资源(Information_Resources),

Field_R:场地资源(Filed_Resources)。

软件资源、硬件资源、人力资源、场地资源、技术资源和信息资源的定义相同。本文以软件资源为例,给出软件资源的定义及属性,其他资源的定义同软件资源,在属性值上根据资源类型的不同而有所差别。

定义2 软件资源

Sw_R(Software Resources)={BasicProp,A-biliProp,StatuProp,InherProp,DimProp},其中BasicProp 是基本属性;AbiliProp 是能力属性;StatuProp是状态属性;InherProp 是继承属性;DimProp 是维度属性。

定义3 基本属性

BasicProp={name,brand,FBuyDate,FCost,FManagerUse,FVersion,FSoftType,FInstallModel,License,FLicNum,FKeyWord,FFromInfo,FCountry,FNecornot,other},其中name 为资源名称;brand 为资源品牌;FBuyDate 为资源购置日期;FCost 为费用;FManagerUse 为资源负责人FVersion 为软件资源版本号;FSoftType 为资源类型;FFieldUrl 为资源文件存储位置;FInstallModel 为软件资源安装方式;License 为资源许可证;FLicNum为License数量;FKeyWord 为资源的关键词;FFromInfo 为资源的来源信息,包括来源系统、来源数据库、来源表和来源URL 等;FCountry 为国别;FNecornot 为是否必须;other 为可扩展的属性,根据实际情况进行扩充,以适应资源的柔性变化。

定义4 能力属性

AbiliProp={FAbility,FParameter,FRange,FPurpose,FObject,FFiletype,FTecIndex,FTech},其中FAbility 为资源的专业技术能力;FParameter 为资源的能力参数;FRange 为资源的能力范围;FPurpose 为资源根据其能力可以完成的任务,与资源的能力属性值是一对多的关系,随任务和时间的变化而变;FObject 为资源能力对象;FFiletype 为软件资源的文件类型;FTecIndex 为技术指标;FTech 为资源涉及到的技术。

定义5 状态属性

StatuProp={status,FValidityDate,FNote,FItem},其中status 为资源的状态信息,包括资源的使用状态、任务状态、维护状态等;FValidityDate 为资源的使用有效期;FNote 为资源的说明备注,根据企业实时状态进行修改;FItem 为所属项目。

定义6 继承属性

InherProp 是资源的继承属性,将资源看作独立对象,继承属性描述了该资源与上层资源的继承关系。以运动仿真软件为例:运动仿真继承了仿真系统及其属性,仿真系统继承了软件资源及其属性。

定义7 维度属性

DimProp={FFunction,FBusiness,FFiled,FOwnership,FCycle,other},其中FFunction 为资源功能属性;FBusiness 为资源业务活动属性;FFiled 为资源专业属性;FOwnership 为资源权属属性,包括来源信息、资源持有者、共享范围、共享级别、共享对象、共享方式和共享期限等;FCycle 为资源生命周期属性,包括购买日期、已使用年限和资源有效期等;other 为资源维度属性补充信息,允许维度属性动态可拓展。

2.2 研发设计资源信息模型描述

集团企业研发设计资源信息是一种非结构化数据,本文以某企业SolidWorks 软件为例,用半结构化的XML 语言进行描述。图3 为资源的XML 格式描述。

图3 研发设计资源信息模型XML 描述

3 基于语义分析的资源属性提取

随着产品多年的设计、生产、维护和更新换代,集团企业积累了各种各样的海量研发设计资源信息,包括产品设计文档、产品模型、各类知识库等等,这些形式各样的资源包含了资源的分类和属性等大部分信息。在众多信息的形式中,资源文本信息占比最大,因此其中包含的研发设计资源信息最多。传统的依靠人工方法阅读资源文本获取资源信息效率低,严重制约了产品的创新,因此高效、有针对性地提取资源文本中的资源属性信息变得越来越重要。基于对上文已经定义的研发设计资源信息模型的分析,本节以某企业软件资源文本为语料,在python 环境下利用TF-IDF 算法对某企业软件资源语料进行预处理,对生成的语料库进行分析,提取软件资源属性值,实现对资源的信息模型应用与验证。

3.1 基于TF-IDF 的文本信息预处理

术语频率逆文档频率(TF-IDF)是在术语频率统计方法的基础上改进的特征词加权方法,用以评估词条对于一个文件集或一个语料库中的其中一份文件的重要程度。TF 为词频(Term Frequency),指的是某一个给定的词语在该文件中出现的次数,IDF 为逆文本频率指数(Inverse Document Frequency),是一个词语普遍重要性的度量,代表了词条与文本的负相关关系。TF-IDF 能过滤掉一些常见的无关紧要的词语,同时保留影响整个文本的重要词语。其词频TF、逆文本频率指数IDF 和两种频率统计方法之后的新权重公式如下所示:

式中:tf 为词频,词条在文档中出现的次数;idf 为逆文本频率;D 为语料库文档总数;D(x)为包含词条的文档数,对数中D(x)+1 是为了保证分母不为0。

对于给定的某企业软件资源清单文本,提取资源属性的具体步骤如下:

(1)企业软件资源清单文本作为原始资料保存到文本数据库中,以便后续处理。

(2)将分词工具无法识别的机械行业领域内的行业术语词汇添加到分词数据库中,保证分词结果的完整性和准确性。

(3)使用分词工具对软件资源清单文本进行分词处理,将文本从文本粒度降低到词粒度,通过停用词表去除语义表达无效的词,将这些词作为文本的基本特征。

(4)通过TF—IDF 统计方法,对分词后的语料库进行训练,对具有区分能力的特征词赋予更多的权重,得到TF—IDF 模型。

(5)整理TF—IDF 模型输出的数据,并结合人工辅助进行无关联词的去除,从中提取出软件资源的各属性值。

本文所用工具为Spyder 软件,程序界面及输出结果示例如图4 所示。

图4 资源信息属性提取程序及输出

输入企业的软件资源文本信息“AutoCAD 2010是Autodesk 公司出品的CAD 软件,借助AutoCAD,你可以安全、高效和准确地和客户共享设计数据。您可以体验本地DWG 格式所带来的强大优势。DWG是业界使用最广泛的设计数据格式之一,您可以通过它让所有人员随时了解您的最新设计决策。借助支持演示的图形、渲染工具和强大的绘图和三维打印功能,您的设计将会更加出色。”,经过预处理得到结果。表2 为整理后的某企业软件资源清单中AutoCAD 软件资源的TF-IDF 预处理结果,该输出结果为二元组的形式,在二元组中,第一位是词条,第二位是词条的权重值(保留5 位小数)。

根据表2 中AutoCAD 软件资源文本信息预处理的输出数据,按照词条的权重将提取出的词条进行排序,按词条权重从高到低的顺序的排序结果为:DWG、三维打印、数据格式、格式、渲染、演示图形、设计数据、设计决策、绘图、Autodesk 公司、AutoCAD、设计、共享、决策、图形、CAD、数据、软件。可以看出,该软件资源信息预处理可以很好地去除资源文本信息中的无关词条,同时给资源属性赋予较高的权重,为后续企业的软件资源清单的属性提取提供了很大的便利。不过该方法无法全部去除无关词条,仍有少量无关词条残留,这是算法的不足之处。所以经过预处理后还需人工辅助进行少量无关词条的去除处理。

表2 软件资源文本预处理结果

3.2 提取结果分析

本文以某企业软件资源清单文本为语料进行属性提取,其中包含59 个软件资源,每种软件资源的提取结果中包含了资源的属性值和少量无关词语,经过人工辅助过滤,去除无关词语,将资源的属性值提取并整理出来。由于篇幅限制,表3 仅列出了其中10 个软件资源的属性值提取结果。根据表3 中的数据,将资源的属性值按照定义好的各种属性进行归类整理,得到软件资源的属性值并存储在属性库中,以供后续使用。

表3 资源属性提取结果

经过对提取结果的分析,本文所采用的方法对软件资源文本提取出的资源属性比较完整。按照已经定义的资源属性,提取出的属性值如下:

ANSYSMechanical:FAbility(机械分析、结构力学分析、热分析、耦合分析、声学分析、压电分析、热/结构耦合分析、热/电耦合分析),FObject(金属材料、橡胶、泡沫、岩土、非金属材料);

AutoCAD 2010:FPurpose(共享设计数据),FFiletype(DWG),FAbility(绘图、三维打印、渲染、演示图形);

AutoForm:FObject(金属板材),FAbility(冲压成形、仿真分析),FSoftType(CAE 模拟软件);

capp 成组技术编辑系统:FTech(成组技术),FAbility(capp 工艺编制、PDM、数据统计);

Pro/Engineer:FTech(CAD/CAM/CAE 一体化、参数化技术),FSoftType(三维软件),FAbility(三维造型),FPurpose(产品设计);

SAP:FAbility(FI 财务会计、TR 财务管理、CO 管理会计、EC 企业管理、IM 投资管理、PP 生产计划、MM 物料管理);

SINOVATION:FTech(CAD/CAM 一体化),FAbility(混合型建模、参数化设计、特征造型、CAM 加工,冲压模具、注塑模具),FObject(汽车、汽车零部件、机床、通用机械、模具及工艺装备、)FPurpose(设计及加工);

PDMLink:FFromInfo(参数技术公司(PTC)),FAbility(PDM 解决方案),FTech(基于Web、基于Java),FSoftType(产品数据管理平台),FPurpose(信息共享、集中存储、集中管理、保障数据安全);

山大华天WIT-CAPP:FRange(工艺流程、工艺设计、工艺管理);

无锡制造业服务网:FRange(企业供需信息、新闻动态、企业招聘、资料下载)。

4 结论

研发设计资源是集团企业的核心资产,是产品创新的重要支撑。本文依据研发设计资源的内涵和特性,基于语义知识构建的集团企业研发设计资源信息模型,对集团企业组织内外部资源进行了统一有效的分类和定义,实现了对模型维度、属性、描述的动态可扩展及自动继承。在下一步工作中,将以研发设计资源的语义模型为基础,进行集团企业设计资源的空间模型研究。

猜你喜欢

维度资源模型
适用于BDS-3 PPP的随机模型
自制空间站模型
理解“第三次理论飞跃”的三个维度
认识党性的五个重要维度
我给资源分分类
浅论诗中“史”识的四个维度
资源回收
做好绿色资源保护和开发
模型小览(二)
离散型随机变量分布列的两法则和三模型