油气长输管道风险管理的数据管理

2013-07-08李小洪

石油矿场机械 2013年5期

李小洪

（中石化管道储运分公司武汉输油处，武汉 430077）

风险评价，特别是对跨越很长距离的长输管道进行评价，实际上就是一个数据密集的过程，它将所有可用的数据合成为新的信息——风险值（相对风险值或绝对风险值），必须经过处理后，风险值才能变为一种信息。在风险评价过程中所提到的风险模型，实际上就是一套确定风险大小的运算法则。

1 风险管理流程

通常利用一般电子表格和桌面数据库的软件工具进行风险评价。进行风险评价时，要确保能够以某种格式去获取相关的有用信息。利用风险评价程序，首先要能以固定的风险属性进行分段，并给出这些风险段的风险分值。

1.1 风险模型

管道风险评价模型就是一套使用有用的信息和数据关系去确定管道沿线风险水平的算法。根据需要，管道风险评价模型可以从一些存在的模型中选，也可以购买一些可用的商业模型，或者根据现有模型定制。为计算风险分值，需要建立可以直接利用数据库中数据的算法。

1.2 数据准备

准备的数据或因系统条件产生的数据将被调入风险评价模型，并被风险评价模型使用。准备数据包括缩减或者补充数据，以使其适应区域内的影响、类别等。

1.3 分段

沿着一整条管线，由于风险值几乎不可能是恒定不变的，所以首先以某个确定的风险属性对管线进行分段是十分有利的。随着数据的改变，每次都会引起管线分段的改变。

1.4 风险评估

一旦准备好数据、选定好风险模型之后，就可以对管道沿线的风险进行评估。将选好的风险评估模型用到每个管段，为各管段提供一个确定的风险值。得到的各段风险数值可以被转换为管线累积风险值或者绝对风险值。

从关注整体风险状况过渡到关注管道各个部分的微小细节是十分必要的。此时，需要一个能将管道信息快速制成表格，并能在地图上快速生成管线的软件。同时，泄漏介质的流动路径、扩散模型、土壤渗透性及确定危险区域都是更智能地进行风险评估的方法。

1.5 风险管理

对管线的各个管段完成风险评估后，就进入关键性的风险管理阶段。在风险管理过程中，重点是强调决策支持，要为风险管理者提供优化配置资源的工具。这一过程通常包括5个步骤：

1）分析数据（图形、表格及简单的统计数据）。

2）计算累积风险值和风险变化趋势。

3）提出一个综合的风险管理策略。

4）找出减缓方案。

5）进行“what－if”假设分析，即假设发生某种事故，提出处理方案。

2 数据准备

2.1 数据的收集和格式

有关风险的各种数据来自各种渠道，—些早期的数据通常以纸介质保存，可能需要将其变成电子形式。通常是找出许多不同的识别系统，识别系统会使标识符变得很复杂，因此信息应该以标准的格式存在。所有输人数据都应该用一个具有通用字段名的标准数据格式来存储。在对数据进行存储或者重新指定格式时，都应该对所采用的标准数据格式进行定义。

2.2 点事件和连续的数据

描述特定的1个点的数据与描述沿一定长度管线上连续状况的数据有区别。连续数据有起始和终点里程数。描述一段距离缓慢变化的状态就是连续数据。点事件数据有起始点里程数，但没有终点里程数，即没有长度的事件。点事件数据例如：测量的管地电位、特定点土壤的pH值、覆盖层厚度（实测时）、高程数据等。连续数据例如：管材的规格、覆盖层厚度（估计时）、培训分值、维护分值、水域穿越、沼泽地穿越等。

由于风险模型要求变量具有沿管道连续变化的特征，因此所有的数据最终必须是连续的格式，可以利用专门的软件程序将点属性数据转换为连续数据，也可以手工将数据进行转换。

2.3 去掉不必要的管段

沿着较长的管段，以一定间隔收集的数据通常没有改变或者变化很小。例如管地电位值、覆盖层深度、土壤pH值等，在较近的2个测量点之间几乎没有改变。一连串的相对一致的测量值可以被当作1个数据段，而不是单独的多个相互分离的短数据段。为一些微小的变化就划分出新的风险段会降低处理的效率，实际上，风险模型本身也无法识别太小的数据变化。

2.4 为测量的数据划分等级类别

为减少在属性段之间插入不必要的分界点，可以采用程序分类的方法对测量读数进行分类。根据使用的类别数，就可以大量减少分段数。操作人员通过选择类别数量和各类的范围设定将管段级别分开。对实际数据进行统计分析，加上对测量数据差别的理解，可以进行典型的分类。

2.5 设定影响区域

将离散点数据转换为连续数据的一个关键就是设定影响区域。一些数据具有很强的地域性，并给出了管段附近的一些信息。这些数据与抽样数据是有区别的，因为关注的事件不是抽样测量，而是代表管道上一个特定点的属性，有时还代表管道给定点两边一定距离范围内区域的状况。以泄漏或破裂数据为例，泄漏仅影响管道上几米的地方，但根据泄漏类型的不同，有时也对临近的管段产生影响。因此，一个影响区域，即泄漏点两边影响范围的距离应合理确定。在影响区域内的整个管段将保守地被当作发生泄漏或者有可能将来发生泄漏。

2.6 可计数的属性

一些点事件可能不是作为采样值而是作为可计数的属性，此时应该关注这类事件的数量或密度，而不是关注一个具体的影响区域。每个区段的这些事件的次数被转换成密度。然而，在分段之后的密度计算可能会错误，因为在动态分段模式下管段长度是一个变化很大的量。因此，密度需要预先确定，并在分段之前作为属性使用。

2.7 数据质量／不确定性

任何的管线风险评估有很多不确定性，一部分不确定性来自数据本身，按数据的质量和使用期限来描述收集数据的特性会影响到风险评价人员的理解，进而影响风险模型。数据使用期限即数据“衰退速率”。考虑到衰退影响，要区分收集数据的出处和可信程度。

解决数据质量差异对风险影响的1个方法就是“修正”那些不是由直接测量或观察得到的风险变量。数据质量调整系数如表1。

表1 数据质量调整系数

续表1

3 分段

将相似属性的管道进行分段的方法有固定长度分段和动态分段2种。预先确定长度的管段被当成1个评估单体，按此长度确定每个管段，不考虑管道特征的变化。按固定长度分段的方法，一般每个管段的属性都不相同，例如管材壁厚、土壤类型、覆盖层深度、人口密度等沿该管段都是变化的。由于该管段是作为个单独的整体评估的，因此不相同的属性必须消除，常用的方法就是取平均值，或者是取整个管段最坏的情况。

动态分段是一种高效的风险评估方法，因为同一管段只有相类似的属性，当同性改变时，就划分出1个新的管段。由于风险变量测量的是沿管段唯一的状态，可以将它看成1个信息重叠的带。动态分段时，一旦管道属性改变就划分出新的管段，所以每一个管段都有区别于相邻管段的确定的1组属性。管段的长度取决于管道属性变化情况，当管道属性改变很大时，最短的管段仅几米长，当管道的属性改变很缓慢时，最长的管段长度可以达到数百米甚至数公里。

4 评分

算法和方程是通过输入数据计算出风险值的“规则”。一般情况下，最好将算法明细表列出，这样可以清楚地看到各方程间的关系，以及跟踪方程的变化。在考虑到其他的规则时，要检查和调整现有的规则。如果调整了权重，应该统一检查所有的权重；如果改变了运算法，要建立重要位置的算法明细表，以反映算法随着时间的进展。有可以选择的运算法则时，应该将其列在现有法则的旁边，并进行比较。应经常定期检查算法，既作为风险评价效能测量循环过程的一部分，又可在有新的可利用信息或者新的信息利用方式时，适时调整风险模型。

在某些情况下，在给定点关于一件特定事件没有可用的信息（例如：经常遇到在1条较旧的管道的很多位置上无法得到确切的覆盖层深度），这就是1个数据缺口。在计算风险分值之前，尽可能多地填补这些数据缺口很必要，否则会对决策产生影响。

沿管道上的每一个点、每一个事件都应该对应有一个给定的属性值。如果缺少数据，就无法完成风险评价计算，除非给缺少的数据1个值。缺省值就是在没有其他信息时给定的值，选择缺省值需要很多推断，应该建立综合风险评估缺省值体系。