数据信息校对决策中的最优停止时间

2020-12-30高嘉瞳王一迪韩瑞迪

东北电力大学学报 2020年6期

高嘉瞳，王一迪，韩瑞迪

(1.东北电力大学经济管理学院，吉林吉林 132012；2.南开大学金融学院，天津 300000)

在决策过程中，决策信息的搜集和整理工作是整个过程的基础，而工作的质量好坏会对最终决策的质量造成影响[1].在最初搜集到信息以后，对其进行进一步的整理需要耗费大量的时间和精力，所以在日常工作中，特别是对数据的信息量较大的决策问题来说，校对工作则更要求对人力和费用的大量投入，以确保数据的真实可靠，从而得到高质量的决策[2-6].在对数据信息进行校对时，假如增加校对次数，则可以使数据更加准确，同时也会提升决策的质量，使决策者获得一定的利益，并且信息整理的费用，也会随之增多.反之，假如削减校对的次数，这时会伴随着费用的减少，但是决策的质量也会随之下降，而且，决策的损失也会因为错误的信息而增多[7-8].本文以考虑到对错误数据校对工作给决策带来的利益，以及花费的费用这两方面因素为前提，将最优停止理论作为理论基础，提出了数据校对的最优停止次数，并把数据信息的校对问题视为随机的过程来构建一个定量化随机模型，有助于决策者在信息搜集整理工作中提出最佳决策.

1 模型的提出

假设出现M处错误在某项决策问题所搜集到的数据信息里，M是一个非负的随机变量，M的期望值EM<，即错误的个数不是无限的.为了使数据更加精确，可以采取m次校对来寻找和修改数据信息里出现的错误，如果每次找到的错误都可以修改正确，同时有助于提高决策的质量，那么就可以得到一定的收益，假设每次找到一个错误后修正可以获取的收益为α，每次校对需要消耗一些费用，假设第w次校对工作需要的费用为δw(δw>0，w=1，2，3，…).设经过w次校对以后，将找出的每个错误对决策造成的损失看作zw(zw>0，w=1，2，3，…).同时假设，即剩下的每个错误在经过w次校对后所造成的损失为zw，同时zw里最大的一个损失小于无穷大.将zw看作第w次校对中找出的的之前w-1次没找到的数据错误个数，

以给出M作为前提，通过x1，x2，x3，…，xw-1次的校对之后，第w次所找出的数据错误的个数xw，服从二项分布的条件概率，即

(xw/x1，x2，x3，…，xw-1)～B(Nw-1，pw)，

根据以上的假设条件，经过了w次对决策数据信息的校对，可以得到的收益

(1)

2 模型求解及最有解存在的条件

2.1 一般解的条件

设概率空间(Ω，F，P)，M是F可测的.Fm=σ(x1，x2，x3，…，xm)，Fm⊂F.假设对随机变量ψ来说，∀ψ=m(m=1，2，…)∈Fm，那么称ψ为停时.

2.2 Poisson分布情形下解的条件及最优解

当搜集到的信息中的错误数据信息的个数M的概率分布，服从参数为P(λ)的Poisson分布时，设

pm=p，zw=z<，m=1，2，…，0

令n0=inf{m≥1，(α+z)λp(1-p)m≤Cm+1}，对任意的w≥n0时，

那么σ=m0，σ就是最优停时.

即假设错误数据信息的数量符合Poisson分布，最优的校对次数则能够通过上式中的σ确定，σ是正整数，则为最佳校对次数.

2.3 二项分布情形下解的条件及最优解

于是上述的收益函数序列(1)式变成

令

通过得出的结果可以看出，就错误信息数量符合二项分布的问题来说，能够通过σ1唯一确定最佳的校对次数.

3 实际应用中的计算步骤

在解决实际问题过程中，以上给出的数学模型约束条件都符合要求，所以此模型拥有一定的实用价值.一般来说，数据信息的总数，在模型中是一定的，随机的变量则是错误数据的数量，因此能够使用极限逼近法，或者截尾法对模型的进行计算和求解，使问题获得最佳结果.具体计算和操作过程是：

步骤一：检验模型的约束条件是否符合要求，并将模型里的错误数据信息的概率分布确定.在解决实际问题过程中，Poisson分布和二项分布，通常能够对问题的情况进行较好的描述，所以依据实际的问题，选择其中之一对错误信息的概率分布进行描述，同时为了更好的解决实际中的问题，也可以采用抽样的方法，就其分布，进行假设检验.就模型中的约束条件来说，错误的个数需要小于无穷多个，每一次的校对所消耗的费用都会随着校对次数的增多而递增，错误对决策造成的损失，则需要小于无穷大，所以，都可以通过简化实际问题而使其获得满足.

步骤二：依据实际的问题，估计和预测模型中的参数.

可以采取抽样假设估计模型里错误数据信息出现的概率，而因校对对决策取得的收益，则根据数据的重要程度来确定.

步骤三：给出起始的错误校对次数m0，迭代计算的步长看作z，同时，把它放到收益函数(1)式中，并计算出收益值GMo和Gmo+z，如果Gno>Gmo+z，转至步骤四，假设Gmo

步骤四：使m0=m0+z，转至步骤三.

步骤五：采用后退归纳法进行求解，终止计算.

4 结论

以考虑到对错误数据的校对工作给决策带来的利益，以及花费的费用这两方面因素为前提，上述模型能够较好的概括问题的本质，并且发现最优停止时间，即最优的校对次数，同时此模型拥有较为广泛的应用领域，其思想能够用以解决有关信息加工的其他决策问题当中去，并且可以将其作为定量化依据，从而做出数据信息整理工作的最佳决策.