单变量回归确定移动平均权重算法在话务量预测中的应用研究
2015-11-01严宇平吴广财江疆
严宇平,吴广财,江疆
(广东电网有限责任公司信息中心广东广州510620)
单变量回归确定移动平均权重算法在话务量预测中的应用研究
严宇平,吴广财,江疆
(广东电网有限责任公司信息中心广东广州510620)
话务量是客服中心运营管理的重要方面,呼叫中心的高效率运作是电网系统客户满意度以及大规模停电预警及突发状况处理的重要保证,而坐席人员排班又是呼叫中心运作的重要问题。科学合理的坐席安排能更好地提高呼叫中心的运作效率,不仅降低了呼叫中心的运营成本,从而提升电力呼叫中心的服务水平。本文提出在移动平均法中引入加权,利用预测期与历史各期的单变量回归,将系数作归一化处理作为权重,进行话务量的预测。文章以真实场景中的实验结果证明了本文所提方法的有效性。
话务量预测;单变量回归;加权移动平均;权重计算法
客服中心作为客户与企业直接联系的枢纽,其利用通信手段和计算机技术,为客户得到企业更完善服务,为企业获得更广泛的客户接触,宣传企业形象提供了高效直接的服务手段。为了客服中心以最有效地运营成本提供最优质的服务水平,高效、科学地控制座席排班作为常见的客服中心运营管理手段,已经成为客服中心行业的一个共识。而座席排班管理是基于话务量预测的。合理准确的话务量预测不仅为排班管理提供量化基础,还能及时了解业务发展趋势,降低因呼损带来的企业形象的损失。
因此,根据话务量历史及相关业务场景对客服中心话务量的变化趋势进行预测,对企业运营管理来说显得尤为重要。
预测方法一般可分为定性预测与定量预测。定性预测是利用经验、直觉做出的猜测,带有较大的主观性。定量预测是指运用统计方法建立统计模型,对历史统计数据进行分析,从而对未来做出预测。过往对话务量的研究主要采取神经网络时间序列[1-3],本次研究提出在加权移动平均预测法中,引入一种以单变量回归计算权重的方法,以此作为加权的权重。
1 话务量预测的一般方法
在客服中心管理体系中,一般采用时间序列或占比测算等方法预测话务量,两者的首要考虑因素是用户量及其发展趋势。
占比测算方法的基本原理是预测年末用户数,以当前用户发展趋势逆向推测各月的用户数,结合历史用户拨打率作为参考,据此估算各月话务总量。而预测“天”-“时段”等不同时间粒度时,则是以历史各天、各时段占全月话务总量的比例,并结合用户拨打率的变化趋势加以微调,最终得出不同时间粒度下的话务量预测。
时间序列方法,一般仅考虑往前N期的话务量,并结合历史同期等因素作为建立话务量预测模型的基础。时间序列预测模型是预测话务量常用的方法,主要有时间序列回归预测法、移动平均预测法等。回归预测是将话务量的历史数据看作时间序列,利用数理统计方法进行回归处理,拟合统计模型,预测未来发展趋势;移动平均预测是利用加权平均数对话务量的时间序列进行平滑修匀,增强近期作用,并适当考虑远期影响。
2 单变量回归权重的话务量预测法
基本思路:以历史前7期的话务量作为移动平均预测法的输入,利用预测期与历史各期的单变量回归模型,输出其回归系数,最终将7期的回归系数归一化作为加权移动平均预测法的权重,加以考虑实际话务量变化中周末与工作日的周期性,最终作为话务量预测值。
2.1历史前7期的选择
历史话务中明显地表现出按星期为周期的话务量变化(见图1):周六、日两天的话务量明显比一般工作日(周一~周五)的低,从中位数看仅约一半。
图1 一周各天的话务量变化趋势图Fig.1Each day of a week traffic trend chart
因此在考虑历史前7期的选择时,有意识地将前7期按照星期值从小到大排序(周日~周六分别用1~7表示)。得到的前7期对应星期值的权重,最终作为加权移动平均预测的权重,公式为:
其中:xi表示对应星期值的话务量,i=1,2,…,7,分别表示周日~周六;ωi表示对应星期值的权重,i=1,2,…,7,分别表示周日~周六。
2.2单变量回归方法计算初始权重
确定加权移动平均的输入变量后,利用历史话务量数据及单变量回归方法计算回归系数。
单变量回归公式为:
其中:xi表示对应星期值的话务量,i=1,2,…,7,分别表示周日~周六;表示对应星期值归一化后的权重,i=1,2,…,7,分别表示周日~周六。
利用普通最小二乘估计(Ordinary Least Square Estimation,OLSE),得到的参数估计:
2.3初始权重归一化并计算话务量预测值
为使初始的回归系数作为权重输入加权移动平均方法,需要对权重进行归一化处理。
归一化公式:
其中:ωi表示最终的权重值计算得到权重后,应用公式(1)计算话务量预测值。
2.4周期调整
由于话务量存在明显的星期性周期,因此在周末、工作日分别乘以调整因子,得到最终的话务量预测。
其中:mweekdauy表示历史所有工作日的话务量中位数;
mweekend表示历史所有周末的话务量中位数;
mall表示历史所有话务量记录的中位数。
3 实例研究
以某电力企业的历史话务量数据对上述方法进行模型建设,并以后续一个月的话务量进行验证。其实验步骤如下:
1)选取2013年1~10月份,共10个月的每日话务量数据作为建模样本数据,选取2013年11月的数据作为验证数据;
2)经数据处理,形成以每日话务量数据为因变量,往前7天的数据作为自变量的数据宽表;去除1月1日-1月7日的数据(不足“前7天”数据);
3)应用单变量回归模型,获取回归系数;重复多次,获取多次回归系数,取多次平均值作为输出;
4)应用归一化算法,计算前7天的权重;
5)计算所有数据的中位数、周末的中位数、工作日的中位数,计算星期调整因子;
6)应用预测算法,计算2013年11月的话务量预测值。
结果如图2、3所示。
图2 2013年11月的话务量趋势图Fig.2In November 2013 traffic trend chart
图3 2013年11月话务量预测误差百分比示意图误差平均值:-3.5%Fig.3In November 2013,traffic prediction error percentage schematic diagram Error:the average-3.5%
从结果来看,算法较好地拟合了星期周期的规律。然而在部分日期出现突降或突增时候,算法不能及时预测到变化,存在一定的局限性。
经研究分析认为,这是由于种种不可预见的原因,包括但不限于政策变化导致的话务量激增、突发天气事件导致的故障停电等造成的数据急剧波动,这类数据对于模型的预测精度造成较大影响。在模型验证过程中,对数据的处理包括:
1)平滑因政策原因导致的话务量激增,使其在政策开始2)剔除因突发天气事件等引起的故障停电事件的话务记录。
实施阶段造成的话务量激增平滑到实施一段时间后较稳定的趋势;
4 结论
本次研究提出单变量回归权重计算法,并利用归一化的思想计算出加权移动平均预测法的权重,较好地处理了话务量在不同时间段(工作日与周末)的变化关系,计算速度快,易于理解。但研究中发现,算法尚未考虑用户行为习惯的变化、停电事件的发生、天气和突发天气事件、未办结业务等对话务量造成的影响,导致算法对于话务量发生剧烈波动时的灵敏度不足。后续的工作与研究中,将采用回归预测、模糊预测、神经网络预测等算法研究突变事件等对话务量的影响。
[1]杜守国,姜锋.大型电话咨询中心来电量预测模型和分析[J].计算机应用与软件,2012(9):126-128.
[2]邓波,李健,孙涛,等.基于神经网络的话务量预测[J].成都信息工程学院学报,2008(9):518-521.
[3]董云耀,杨望书.基于时间序列趋势模型的研究与应用[J].杭州电子科技大学学报,2008(1):64-68.
[4]刘童,孙吉贵,张永刚,等.用周期模型和近邻算法预测话务量时间序列[J].吉林大学学报:信息科技版,2007(3):239-245.
[5]杨帆,王志坚,娄渊胜.时间序列趋势分析方法的一种改进[J].计算机技术与发展,2006(5):82-84.
[6]彭宇,雷苗,郭嘉,等.基于先验知识的移动通信话务量预测[J].电子学报,2011(1):190-194.
The research of the application in teletraffic prediction using weighted moving average method based on univariate regression
YAN Yu-ping,WU Guang-cai,JIANG Jiang
(Guangdong Power Grid Limited Liability Company,Guangzhou 510620,China)
Teletraffic is an important part in operation management of the call center.Forecasting of the teletraffic is an effective way to improve service levels of the call center.In this paper,we propose to use weighted moving average for teletraffic forecasting.The coefficients are calculated by univariate regression on data from predictive and historical period,and then these coefficients are normalized for teletracffic forecasting as weights of weighted moving average method.Experiments on real world data show the effectiveness of our method.
teletraffic forecasting;univariate regression;weighted moving average;weighting method
TN99
A
1674-6236(2015)22-0044-03
2015-01-16稿件编号:201501125
严宇平(1985—),男,广东韶关人,硕士,工程师。研究方向:电力信息系统建设与管理、电力数据分析及应用。