基于特征属性的工作流推荐技术研究
2018-10-13付高财夏杰金超
付高财,夏杰,金超
(武汉理工大学机电工程学院,武汉430070)
0 引言
近年来,随着流程管理概念的提出,企业的管理模式正逐渐向流程导向型转变,流程管理成为企业发展的重要驱动力之一。其本质是构建出高效且符合业务逻辑的流程,来提高组织业务效率[1]。
在实现流程快速准确推荐的方法上,国内外已有不少研究成果。文献[2]建立了JTangaWFR工作流推荐系统,提出一种基于图距离计算方法的流程推荐方法,该方法通过寻找参考流程和流程模式上游子图的最大公共子图和最小公共超图的图距离进行相似度计算。文献[3]提出一种基于流程规整矩阵的流程推荐方法,该方法通过计算流程规整路径距离获得满足流程匹配度要求的候选流程最终通过候选流程的匹配层次分解产生推荐路径。文献[4]提出了一种互联网环境下面向最终用户编程的计算业务与结构相似度的方法,用来解决业务流程推荐的准确性。
上述文献对于流程推荐技术的研究的重点在于为流程建模人员提供一个合理有效的流程,然而流程的管理、运作,其核心是以人为本。针对的特定对象不仅是制定流程规则的企业高层管理人员,还包括广大中层管理人员和基层普通员工。从普通员工的角度来说,在选择流程模板时,会遇到如下问题:①普通员工需要从公司制定的繁多流程模板中选出合适的流程;②对于新员工进行人工选择流程时,由于业务逻辑的不熟悉,存在选错流程模板和选择困难等问题。这些问题都造成了流程的不确定性和精准度不高,并且耗时长。面对业务流程繁多且复杂的公司而言,对于基层的普通员工或新入职员工来说,在选择流程模板时,若工作流系统可以自动根据文档特征推送出合适流程,可以减少人工的出错率。从工程项目的方面来说,一个工程项目有众多的文件,并且这些文件对应着不同的工作流。当项目文档进入PDM的工作流系统时,就不需要人工去选择不同的流程模板,系统会自动推荐与工作文档相对应的流程,提高工作效率。
因此,为了提高业务流程的工作效率和准确性,针对企业的业务复杂度和新员工不熟悉业务的情况下,在工作流管理理论的基础上,分别对业务流程所涉及的特征和工作文档的特征进行结构建模与提取,提出一种基于特征信息的相似度算法,在工作流的管理中进行流程推荐,来实现业务流程的智能选择功能。
1 工作流管理系统概述
1.1 工作流
工作流是为了完成某项任务,按照一定顺序动态完成一系列工作的过程,能够有效地反映该项任务的业务逻辑。文献[5]指出,每一项工作都有一个过程,在其工作过程中可以分解为各个工作步骤,每个工作步骤完成若干个操作。各个工作步骤之间,根据所要完成的任务性质,有一定的先后顺序,并指明工作步骤的启动和终止条件、所要完成的工作任务、完成任务的人员以及完成任务的先后顺序。
1.2 工作流管理系统
工作流管理系统(Workflow Management System,WMS)是指在计算机环境下,运行在工作流引擎上用户定义、执行和控制管理工作流运行的一套系统,与工作流执行者进行交互,推进工作流实例的执行,监控工作流的运行状态,并进行有效管理[6]。
工作流管理系统不仅要提供工作流程定义工具,把企业的业务流程转化为计算机可以识别的格式,还需要对工作流程运行的状态进行监控,对流程运行中的活动进行管理和调度。将应用逻辑与过程逻辑分离,在不修改具体功能的情况下,通过修改过程模型改变系统功能,完成对生产运作部分过程或是全过程的集成管理,可有效地把人、信息和应用工具合理组织在一起,发挥系统的最大功效。
2 特征模型构建
2.1 流程特征结构建模
一般情况下,活动是指流程执行过程中可被工作调度的最小工作单元,要求有人或机器参与[7]。活动节点的基本特征属性有很多,如名称、描述、用户、期限、启动条件,等等。在研究某铁路电气有限公司的业务流程的基础上,以公司流程库为数据集,使用特征提取的方式,将整个数据集所具有的特征提取并呈现,构建所需的特征结构模型,如图1所示。
定义:工作流程由若干个节点构成,节点由若干特征组成,形式化定义为:WF=
其中:Name(名称):表示流程在该节点所要执行的任务类别,如设计、校验、审核等。
User(用户):指访问或操作计算机信息系统中数据、界面、客户端页面菜单等资源实体的主体。
Condition(条件):为了对工作流活动执行情况以及活动路径进行控制,在工作流过程模型设计中为节点和连接弧增加相应的控制条件。
Deadline(限制):限制是个时间段,表示流程开始后,这个节点的活动必须在这个时间段内完成。
Description(描述):对业务流程内容的表达,如:企业的NPAINO20180604流程是用于公司申请外购件物料代码,QJDNO20180608流程是用于公司员工请假。
图1 业务流程特征结构模型
流程特征模型主要提取节点对象的特征属性,具有以下几个特点:
(1)与传统工作流模型不同,不考虑活动间的控制顺序,主要对流程节点进行细分,更能清晰表明各流程需要完成的活动项;
(2)特征结构层次清晰。业务流程库中存在大量的数据属性,节点的特征项较多,主要提取活动的名称,完成活动的用户角色、限制条件(或是需要完成的作业)等重要项。以实际应用的企业流程为主,在此模型基础上,可以扩充节点的特征属性。
特征结构模型建立后,将结构模型用XML(Exten⁃sible Markup Language,可扩展的标记语言)来表示。XML即是运用标记的方式来描述结构化数据的纯文本格式语言,其优势有:①使结构模型存储方式多样化,查询与搜索的效率显著提高;②无论何种工作流系统,都可以通过通用的交换格式进行转换。考虑到XML文件的特殊性,从活动的特征属性对模型文档进行量化[8]。
将XML文档中的每个节点的结构单元看作一个向量b={b1,b2,...,bm}(bm示流程节点的特征),这样整个XML文档则被量化为一组向量,以一个矩阵来表示即B={B1,B2,...,Bn}(其中Bn为工作流程中的各活动节点)。
2.2 工作文档特征模型建立
工作文档是指即将进入到PDM系统中需要工作流进行管理的文档。文档的表示模型由特征词来建立,常用的表示文档特征的模型有:布尔逻辑模型(Boolean Model,BM),向量空间模型(Vector Space Mod⁃el,VSM)[9]。由于文档的多异性,采用向量空间模型对文档的特征建立模型,从文档中提取的特征词(特征项)组成余弦空间的一个向量,每一个特征项对应一个特征权重,以此表示特征词在文档中的重要程度。形式化定义为:d={d1,d2,...,dk} ,其中 dk(k=1,2,3,…)分别表示文档的特征属性。
构建文档特征模型的步骤:
(1)基于频繁项的特征属性的提取:工作文档特征项遵循文本聚类的方法,文本聚类是分析未知类别的文本文档,提取出能表现出主题特征的标志,例如特征词集等,利用频繁项算法,把符合算法的频繁项呈现给用户[10]。在基于频繁项的Apriori算法的基础上,采用逐步频繁特征词语集,同时压缩寻找范围[11]来提取工作文档的特征属性。采用Apriori算法的原因:①针对中小企业的工作文档,需要考虑的项集数不多,数据集小,遍历搜索空间小;②算法可靠,信息检索目的性明确,更为精准达到用户的目标。具体做法是:首先找出频繁1-项集,记为L1;然后利用L1来产生候选项集C2,对C2中的项进行判定挖掘出L2,即频繁2-项集;不断如此循环下去直到无法发现更多的频繁k-项集为止[12]。
根据步骤(1),对某铁路电气公司的大量项目文档的各特征属性和组织结构进行研究,根据频繁项算法,为了方便计算,选取前5项的工作文档特征属性与流程关联,即工作文档的特征属性=<类别,文档名称,文档所属部门,持续时间,文档描述>。
(2)属性映射:建立工作文档信息与流程活动的特征属性映射关系。按照属性映射关系[13],映射关系如图2。将所提取的工作文档特征信息传递给流程库,同时在工作文档和流程活动对象间创建链接对象,并将信息存入到工作流管理数据库中,在工作流管理系统中注册信息文件。
图2 工作文档与业务流程文档特征属性映射关系
3 基于特征的相似度算法
3.1 基于特征的相似度计算
特征项之间的相似程度与它们所包含的信息有关:如果两个特征所共同拥有的信息越多,它们越相似;反之,它们的相似度就越小。本文将特征项集都表示成了向量空间的形式,因此基于特征的相似度计算实质就是计算每两个特征向量间夹角的余弦值。
定义:假设工作文档特征集合d={d1,d2,...,dk}和业务流程的节点特征集合为b={b1,b2,...,bm} ,其中bk和dm代表特征项,为了方便配比,选取特征项的时候,应使得m=k,选择m个属性作为比较条件,wbi和wdi为第i个特征项在流程文档和工作文档的权重系数,记文档和节点间的特征相似度为Sim(b ,d ),即:
同时,若要计算文档与文档间的特征相似度:
则业务流程与工作文档间的相似度为各节点与文档特征相似度的加权和:
3.2 特征属性权重系数确定方法
文档间进行相似度量时,所选择的各特征属性所起的作用是不同的,在计算两个产品相似度时使用重要的特征属性对结果影响较大,而次要的特征属性对结果影响较小,得出的结果才能更加客观地反映特征信息的相似程度。
权重计算的方法有很多,如层次分析法、DelPhi法、墒权法、标准差法等。层次分析法[14]就是在建立有序递阶的属性系统基础上,通过对特征属性之间的相互配对比较,得到特征中各指标的优劣评判,并利用这种评判结果来综合计算各特征属性的权重系数。确定步骤如下:
(1)抽取部分特征属性样本,根据矩阵标度及其定度表,得到特征属性的判断矩阵;
(2)计算判断矩阵的最大特征向量跟特征矩阵,进行一致性检验,若通过,进入下一步;反之,调整矩阵重新计算;
(3)通过的矩阵进行归一化处理,即可得到权重指标系数。
4 流程推荐技术的应用
根据对公司业务逻辑和业务实际情况进行分析,提出以下流程智能推送模式:
(1)通过对业务流程中各活动和工作文档进行预处理,提取特征项并建立结构化模型;然后以关联的特征项进行相似度匹配分析,即计算Sim(B ,d),将相似度超过某阈值的业务流程推送给用户。
(2)以待流转的工作文档作为参照对象,分别与某流程中已存在的项目文档的特征属性进行匹配,即计算Sim(d ,d'),若在该流程中相似度高的文档较少,则提示用户在推送的流程范围内是否选择正确。
具体实现流程推荐技术的框图如图3:
图3 流程推荐技术流程图
以某铁路电气公司的工作流管理系统为研究对象,重点研究了工作文档在进入系统时选择流程模板的功能。在对工作流管理系统的研究过程中,引入业务流程管理的思想,即在保证流程定义、流程实例化与流程监控等功能实现的前提下,通过对系统进行二次开发,如图4所示,为普通员工自动选择流程模板。
图4 工作流管理模块
对工作文档的特征进行了提取时,为了保证推荐出最佳的流程,合理利用有效资源,提取5个重要的特征属性项,如图5所示。普通员工不熟悉公司的相关流程,但是熟悉负责的技术文档。我们针对这一现象,进行了工作文档的特征提取,系统会自动识别到创建者和文档名称,普通员工只需要选择所属部门、文档类型和持续时间,对文档进行相应的描述即可。
在运行工作流程实例前时,系统会根据之前的工作文档,自动识别到该工作文档所对应的工作流程模板,如图6所示。在新建流程实例时,我们可以在节点列表中查看流程的节点,也能查看到流程图和具体的任务列表。
5 结语
本文在分析业务流程和项目文档的属性基础上,提出了一种基于特征属性的流程推荐方法。该方法是对业务流程以及工作文档的特征属性进行提取与分析,建立相应的矩阵空间模型,通过计算特征向量间的余弦,进而得到特征属性相匹配的流程。同时在PDM系统的基础上,运用流程推送技术开发业务流程推荐模块,当工作文档进入到系统中,可以自动匹配特征属性相似性较高的流程,提高流程选择的准确性和效率性。该技术对于业务流程复杂且繁多的企业来说,有很大的实用价值。未来工作将围绕如何提高该方法的效率以及完善特征模型展开研究。
图5 工作文档特征提取
图6 新建流程实例