APP下载

基于离散时间最优控制的在线信誉评价模型*

2018-11-23张超宁徐应涛

关键词:变差最优控制信誉

张超宁, 张 莹, 徐应涛

(浙江师范大学 数理与信息工程学院,浙江 金华 321004)

0 引 言

随着电子商务的迅速发展,传统消费模式发生了巨大变化,C2C的消费模式已经逐步取代传统的实体经济消费模式,电子商务是目前最具有发展前景的商业模式.在线交易凭借便利、自由等优势,吸引了大批的消费者.然而,不同于传统消费模式,C2C电子商务消费模式的交易双方需要在在线信誉评估数据结果和期望的信誉值之间作出衡量,最终决定是否继续交易或者放弃交易.

因此,信誉评价对在线交易的成功起到了关键性的作用.到目前为止,针对基于C2C平台的信誉评价模型,众多学者进行了一系列研究与完善.文献[1]通过对现有信誉评价模型的分析,概述了当前信誉计算的主要方法,同时提出了信托和信誉系统;文献[2]考虑到在线业务互动的不确定性,通过对定性和定量指标的全面计算处理,结合层次分析和集对分析给出了信誉评估;文献[3]着重于信誉模型的风险分析,认为个别交易参与者会利用先前累积的高信誉值进行欺诈行为,为了阻止这些不良行为的发生,提出了在信誉计算模型中引入“移动时间窗口”的概念,利用2个时间窗口分别计算交易参与者的平均信誉值和当前信誉值;文献[4]考虑了交易双方在相互评分过程中会存在一定情感误差,增加了E-Spores模型中对交易价值的考虑,有效避免了一些投机用户通过销售低价产品获得累积的高信誉值,进而进行高价交易的诈骗牟利行为.

在众多相关文献中,研究者大多侧重对信誉系统的定性分析[5],在一定程度上忽略了对信誉系统的定量分析.

针对目前信誉评价的不完整性,本文着力于信誉系统的定量分析,综合考虑交易者在交易过程中的信誉投入,并对系统模型进行扰动分析,通过引入全变差函数,提出基于离散时间最优控制的系统信誉评价模型,保证系统信誉的稳定性;最后,进一步分析交易双方各自的信誉比重,提高信誉系统的可信度.

1 模型建立

(1)

式(1)中:k代表离散时间点;M为终端时间点;k=0,1,…,M-1;αi∈R,βi∈R(i=1,2)是既给的常数.

(2)

在交易过程中,可能会出现交易一方通过恶意操作产生虚假的高信誉值,对另一方隐含极大的交易风险.简而言之,在目标函数中,系统信誉为达既定期望,可能会产生极大脉冲能量.为了阻止此类风险的发生,引入最大信誉增幅约束:

(3)

式(3)中,δ(k)代表k时刻系统的增幅上限.通过数据分析可知,当0≤δ(k)≤0.5时,被认为满足稳定性条件,本文取δ(k)=0.2.

综合以上分析,可以构建基于离散时间最优控制的在线信誉评价模型.

对于最优控制系统(1),求解最优信誉投入策略u*使之满足约束条件(3),并且使性能指标(2)达到最优.

由于最优控制系统(1)中全变差项是非光滑的绝对值函数之和,现有优化方法无法直接求取最优解,所以下面将对此模型进行理论分析与求解.

2 理论分析

为了求解上述既给模型,首先考虑以下离散时间动态模型:

x(k+1)=f(k,x(k),u(k)),k=0,1,…,M-1,x(0)=x0.

(4)

首先令U={v=(v1,v2,…,vr)∈Rr;αi≤vi≤βi,i=1,2,…,r},U是Rr上的紧凸子集.记u=(u(0)T,u(1)T,…,u(M-1)T)T,其中u(k)∈U,k=0,1,…,M-1,称这样的u为容许控制变量,由所有这样的u组成的集合为容许控制变量集,记为U.在不引起歧义的情况下,将容许控制变量简称为控制变量.若序列{x(k|u),k=0,1,…,M-1}满足系统方程(4),则称x(k|u)为对应于控制u∈U的系统的解.

定义1令ui(k)代表在时间k下的第i个控制变量分量,ui(k)的变量差表示为

同时,定义u(k)的全变差公式为

(5)

注2由式(5)全变差表达式的定义知,若u为固定常量,则式(5)的值始终不发生改变,说明全变差为0;若控制变量u未固定,则式(5)的值会发生改变,且改变量越大,说明全变差越大;反之,相反.

下面假设该系统满足以下终端状态约束:

φj(x(M|u))=0,j=1,2,…,Ne.

(6)

式(6)中:φj(x(M|u))∈Rn(j=1,2,…,Ne,Ne为等式约束个数,1≤Ne≤N)是给定的实值函数,且同时考虑关于状态和控制变量的all-time-step不等约束

hj(k,x(k|u),u(k))≤0,k=0,1,…,M-1,j=Ne+1,Ne+2,…,N.

(7)

式(7)中,hj(j=Ne+1,Ne+2,…,N)是已知的Lipschitz可微实值函数.

定义2所有满足约束条件(6)和(7)的控制变量u∈U记作F,称F为可行控制集,称F上的变量为可行控制变量.

下面给出约束条件控制下的离散时间最优控制问题:

问题1选择可行控制u∈U⊂F,满足

(8)

式(8)中:α≥0表示一个加权常量;Φ0:Rn→R是一给定的实值函数;f(k,5,5)在Rn×Rr上是连续可微的,k=0,1,…,M-1.

由于J1中的全变差项是通过一系列非光滑的绝对值函数构成,所以无法使用现有的标准梯度优化算法解决.下面将通过一种新型的转化方式,将非光滑问题1转化为等价的光滑问题.

2.1 等价问题的转换

首先,构建如下控制变量转换函数:

代入原系统方程(4),可得新的系统方程

y(k+1)=f(k,y(k),ψk(ξ)),

(9)

则∀ξ∈R(2M-1)r,式(9)有相对应的解y(5|ξ),除此之外,有以下约束:

Φj(y(M|ξ))=0,j=1,2,…,Ne;

(10)

hj(k,y(k|ξ),ψk(ξ))≤0,k=0,1,…,M-1,j=Ne+1,Ne+2,…,N.

(11)

令X={ξ∈Z|Φj(y(M|ξ))=0,j=1,2…,Ne;hj(k,y(k|ξ),ψk(ξ))≤0,j=Ne+1,Ne+2,…,N,k=0,1,…,M-1},可得新的最优控制问题2:

问题2对于系统方程(9),寻找一个ξ∈X,满足

同时满足约束条件(10)和(11).

定理1假设u*=(u(0)*,u(1)*,…,u(M-1)*)T∈F是问题1的最优解,则ξ*是问题2的最优解,其中ξ*=(u(M-1)*,ν0,*,ν1,*,…,νM-2,*,ω0,*,ω1,*,…,ωM-2,*).

(12)

综合引理2和定理1可知,问题1的最优解是问题2的最优解;反之亦然.有以下推论:

推论1问题1与问题2等价.

由于问题2的目标函数是光滑的,所以相对于问题1更易取得最优解.基于推论1,若要对问题1进行最优分析,则只需对问题2进行求解.针对于问题2,其受限于终端状态约束及all-time-step不等约束,为了方便梯度的计算,下面对问题2作近似转换.

2.2 近似问题的转换

对∀j=Ne+1,Ne+2,…,N,问题2的不等约束等价为

(13)

考虑到式(13)是非光滑的,故构建如下约束条件的光滑形式[7]:

(14)

显然,它是光滑的.

问题2′ 寻找一个ξ∈Xε,使得

引理3若ξε是问题2′的可行控制变量,则ξε也是问题2的可行控制变量.

证明 易证.故略.

(15)

(16)

(17)

推导整理式(15)可得

(18)

(19)

根据引理3和定理2,问题2′可看作是问题2的近似问题.当∀ε≥0且ε→0 时,问题2′的解就是问题2的解.下面考虑利用罚函数法对问题2′优化求解.对任意ε>0,θ>0,引入罚函数构造问题2′的增广目标函数

Jε,θ=J2(ξ)+θgj,ε(ξ).

(20)

式(20)中,θ>0代表惩罚因子.

针对上述问题,具体算法如下:

C-E算法:

给定初始数据:θ>0,L>1,k=1和εk>0;ξ=(γ,ν0,ν1,…,νM-2,ω0,ω1,…,ωM-2).

步骤1:利用梯度算法求解Jε,θ的解,记作x*.

步骤2:将x*代入式(20)检验是否满足约束条件.若满足,则移到步骤3;否则令θ=Lθ,重回步骤1.

步骤3:若εk在既给的边界内,则停止计算;否则,令εk+1=εk/L,k=k+1,重回步骤1.

最终,通过C-E算法可得非线性规划问题的最优解.

3 模型求解

本文提出的信誉评价模型符合问题1的形式,根据理论分析,可采用相应的算法求解.下面所给算例均在MATLAB R2013b环境中,通过结合C-E算法和DMISER3软件进行计算分析.

为了提高系统的准确性,考虑淘宝网上大流量店铺的信誉评价,本文以“Sleepy Bunny瞌睡兔”这一商家为例,整理分析其2012—2015年信誉变化趋势,利用线性回归方法,得出了以下系统方程:

k时刻交易完成后卖家和买家的信誉函数如下:

为了防止某些商家为了提高信誉值进行的恶意操作,将最大信誉增幅上限设置为δ(k)=0.20,进而将交易双方的信誉值代入,得到以下信誉增幅约束条件:

为了扩大约束可行性,通过对大量数据分析,引入扰动因子Δ=0.05,得到最终约束

其中,k=0,1,…,M-1.利用本文提出的方法,可得到关于交易双方信誉值变化曲线及最优执行策略,如图1和图2所示.

卖家信誉函数;买家信誉函数

图1 交易双方信誉值变化曲线

图2 交易双方信誉投入变化曲线

取M=30,通过C-E算法,当α=0.01时得到系统最优值g0=6.075 294.通过计算及图形分析,表明本文提出的信誉评价模型能有效抵抗信誉风险,动态体现双方信誉变化.

猜你喜欢

变差最优控制信誉
以质量求发展 以信誉赢市场
献血后身体会变差?别信!
一类带指数权最优控制问题的Turnpike性质
基于单片机MCU的IPMI健康管理系统设计与实现
具非定常数初值的全变差方程解的渐近性
基于增益调度与光滑切换的倾转旋翼机最优控制
条件平均场随机微分方程的最优控制问题
信誉如“金”
江苏德盛德旺食品:信誉为翅飞五洲
考虑再生制动能量利用的高速列车节能最优控制仿真研究