基于Petri网行为轮廓从事件日志中挖掘隐变迁的方法
2016-05-30王晓悦方贤文曹芮浩
王晓悦 方贤文 曹芮浩
摘要:隐变迁是指一些存在于过程模型中,但没有出现在日志序列中的变迁。这样的变迁会大量存在于现实的模型中。从事件日志中寻找挖掘隐变迁的方法是过程挖掘技术的一个重要的难题。目前针对自由选择网有一些解决办法,但是对于复杂的过程模型有一定的局限性。本文提出了基于Petri网行为轮廓寻找隐变迁的方法。首先根据发生频率最高日志序列得出源模型,再根据剩余的日志序列一步步优化源模型从而找到隐变迁,最后通过评价指标来判定模型的合理性。
关键词:事件日志;行为轮廓;隐变迁;过程模型
在近几年,随着计算机的发展,各大企业都在寻找一种不但可以满足客户要求还可以通过提高业务水平节约成本的办法,换句话说就是用更短的时间生产更多的产品给客户提供更好的服务,从而提出了业务流程挖掘这项技术。但是挖掘业务流程模型的过程中往往会出现一些存在于过程模型中,但没有出现在日志序列中的变迁,同时这样的变迁又大量存在于现实的模型中。从事件日志中挖掘隐变迁可以很好的还原模型,提高操作的运转效率,既而达到高效率的生产及服务。
在日志中挖掘不可见变迁最开始是由W.M.P.van der Aalst等人提出来的,他分析了不可见任务产生的原因。在文献中提出了Petri的相关概念。在文献中有提到不可见任务在哪几种情形下产生。在过程挖掘中常常会因为类似的原因出现一些存在于过程模型中,但没有出现在日志序列中的变迁。这样的变迁称之为隐变迁。然而从事件日志中挖掘隐变迁在流程挖掘中是一个巨大挑战。文献中提出了判定日志与模型一致性的分析方法,通过日志序列在模型中重放来计算其合理性和适当性。国外学者van derAalst已经做了很多关于不可见任务挖掘的文章,文献中给出了Petri网的相关知识。文献讲述了有关流程挖掘的方法。文献先介绍了行为轮廓的相关概念,之后Weidlich.M等人又提出因果行为轮廓的概念,因果行为轮廓是行为轮廓的一个补充及扩展在原来的三种关系基础上添加了共生关系。在文献中基于流程挖掘提出了一种新颖的方法去解决异常的事件日志,这种方法能够形成一个与源模型相关的新的进程模型,最后基于新的进程模型重新执行事件日志。在文献中把流程挖掘的技术运用到社会网络服务中检测异常行为的出现,使得社会网络服务系统更加完善。
在流程挖掘方面,文献中给出了日志的相关概念。在文献里给出了一个新的建模方法,此建模方法支持精确流程建模。文献提出了一种与Web服务的相关的挖掘。文献将流程挖掘技术运用到现实的结账过程中,结果会对其产生影响并取得进步。文献说明了流程挖掘这项技术可以运用在医疗方面,介绍了基于过程挖掘这项技术来分析门诊的流程,并对其数据进行集成、探索和分析。提出了PALIA算法,把流程挖掘这项技术运用到卫生保健的设计和质量控制的流程。文献在挖掘过程中分别从用户、时间的角度来对比方法的可用性。文献将流程挖掘技术运用在现实教育中,通过对学生行为的分析来促进流程比较。
本文主要通过行为轮廓的关系来挖掘事件日志中的隐变迁。通过发生篇频率最高的且最长的日志序列得出源模型,再通过剩余的序列一步步优化。最后通过计算合理性及适当性得出所挖掘出模型的完备性。这种方法能够方便快捷的挖掘出日志中的隐变迁,从而使得模型更加完备。
1.研究动机
在本文的介绍中,已经提到了挖掘隐变迁的重要性,并且介绍了挖掘隐变迁的算法。在实际生活中,不乏存在不可见任务的业务流程日志。本节中利用一个简单的例子来证明隐变迁的存在性及挖掘隐变迁的重要性。下面给出了一个操作记录的日志序列 L:{ABCEDFGHJ,ABEDFGHJ,ABJ,ABCEGHJ,ABEGHJ,ABCDEFGHJ,ABDEFGHJ,ABDCEFGHJ,ABDFCEGHJ,ABCEGDFHJ,AB-CEDGFHJ,ABCDEGFHJ,ABDCEGFHJ}
a算法挖掘出来的模型如图1、图2所示。
分析图1与图2可知,这两个模型的合理性与行为适当性的值偏低。在运转的过程中会出现死锁的情况。而且它们产生的日志轨迹并不符合过程挖掘的准则。在过程挖掘中所得到的模型必须完全覆盖所有的日志轨迹。在本文的第四部分就介绍了基于行为轮廓挖掘日志中的隐变迁的合理性。
2基本知识
这部分介绍了petri网的相关概念。