APP下载

铁路运输企业呼叫中心话务量预测方法研究

2014-08-01张伯驹

铁路计算机应用 2014年10期
关键词:话务量折线图概率密度函数

张伯驹

(中国铁路总公司 运输局, 北京 100844)

铁路运输企业呼叫中心话务量预测方法研究

张伯驹

(中国铁路总公司 运输局, 北京 100844)

本文结合概率论与数理统计理论,运用抽样统计的手段,采用对数正态分布拟合,对呼叫中心的话务量进行预测。这种方法可计算出呼叫中心话务量的概率分布,从而得知话务量在某区间内的概率。论文使用的研究方法与已有的呼叫中心话务量预测方法的区别是引入了概率特性,它为铁路运输企业呼叫中心实际运营管理提供了理论与参考价值。

呼叫中心;话务量预测;对数正态分布;抽样统计

为满足人民群众和企业客户对铁路运输服务质量越来越高的要求,各铁路局和专业运输公司需要进一步提高呼叫中心的运营管理水平,其中一项基础工作就是如何在现有条件下合理安排人力、优化现场管理,确保客户服务水平。而话务量预测是呼叫中心座席排班的前提,呼叫中心可以针对不同的话务量安排对应的座席班组,在满足呼叫中心服务水平的前提下,实现其人力资源的最优配置。

本文通过对呼叫中心话务量特征的研究,采用对数正态拟合思路,以中铁快运“95572”呼叫中心为例,提出了一种铁路运输企业呼叫中心话务量预测的方法。

1 呼叫中心话务量历史数据分析

呼叫中心话务量特征研究是预测的基础,没有对话务量特征的详细研究,很容易导致预测值不准,造成预测结果的不稳定。对呼叫中心话务量的研究要基于一定长度历史统计数据,同时去除历史数据中由各种原因而产生的异常点,使取得的样本为普通样本。为保证预测方法和结果更适用于实际运营情况,本文所用的业务数据样本均采用中铁快运“95572”呼叫中心某地区话务量的实际数据。

1.1 模式研究

为研究呼叫中心话务量规律,选取2010年3月~2011年7月期间的17个月的历史统计数据,做折线图如图1所示。

根据折线图可以获得该呼叫中心话务量如下特征:

(1)具有明显的周期性。该呼叫中心话务量以一周为一个循环周期,周一话务量较高,周二~周五话务量较为平稳,双休日话务量呈下降趋势。

(2)具有异常点。异常点包含两类:a.随机异常,这种异常数据通常无法预测,不能确定造成这种异常的主要原因;b.可预料异常,这种异常通常由某种明显原因造成,例如节假日、新品上市、产品促销等。

图1 呼叫中心话务量历史数据折线图

(3)不具有明显的上升趋势。根据折线图可以看出,该呼叫中心在这17个月中不具有明显的上升趋势,对于短期预测来说,可以忽视这种上升趋势,认为该呼叫中心的话务量是稳定的。

1.2 抽样统计

统计抽样法又称“随机抽样法”、“数理抽样法”,是应用概率论与数理统计的原理,遵循随机原则,从被查总体中抽出样本进行检查,并根据对样本的检查结果推断总体的一种抽样检查方法。随机性(即等可能性)原则是抽样推断正确性的一个重要前提条件,随机抽样排除了人的主观影响,使样本总体具有充分的代表性。

呼叫中心话务量问题是一个总体未知,通过总体的一部分来推断总体分布的问题,因此采用抽样统计的方式分析呼叫中心话务量分布是适当的。

抽样要遵循两个原则:

(1)抽样具有代表性,每一个个体应当以同等的机会被抽到,样本(X1, X2, …, Xn)中每个分量 的分布应当与总体分布相同。

(2)抽样具有独立性,样本(X1, X2, …, Xn)中每个分量X1, …, Xn应是相互独立的随机变量。

1.3 异常点分析

依据话务量折线图分析,对于第1类异常点,由于随机异常属于小概率事件,因此在对总体分布进行推断时,可以将这些随机异常点剔除。

对于第2类异常点,话务量明显受到某一种或几种因素的影响,此时的样本不符合一般时间话务量总体分布,即违背抽样要具有代表性的原则,因此将这一类异常点也剔除。同时,这类异常点也具有统计研究的价值,即研究在某一种或几种主要影响因素下,呼叫中心话务量特征。

2 基于对数正态拟合的话务量预测方法研究

2.1 对数正态分布及其拟合

2.1.1 对数正态分布

对数正态分布定义:设X是取值为正数的随机变量,若lnX~N(μ, δ2),则称X服从对数正态分布,并记作X~ln(μ, δ2) 。

设ln(μ, δ2)的密度函数是P(X) ,则有

2.1.2 对数正态分布拟合方法

根据公式(1)可知,对数正态分布的概率密度函数具有两个参数:μ决定了位置, δ2决定分布的幅度。

由最大似然估计法可得:

2.1.3 参数计算

由于极大似然估计是无偏的,因此利用极大似然估计值对参数进行估计:

2.2 模型的应用研究

2.2.1 样本选择

根据抽样的代表性和独立性原则,同时考虑数据更接近真实值,选择2010年3月~2011年7月的数据。剔除异常数据,包括2011年1月~2月以及节日放假,共得样本419个,由于呼叫中心话务量具有很强的周期性,因此将周期内数据分开预测,取得样本数量如表1所示。

表1 呼叫中心话务量样本抽样统计数量

2.2.2 确定参数

根据样本值,由公式(2)和(3)计算对数正态分布的两个参数,如表2所示。

表2 拟合参数

由位置参数μ可知,星期一的话务量可能最大,而星期日的话务量可能最小。

2.2.3 曲线拟合

根据参数值确定对数正态分布曲线,拟合函数如表3所示。

表3 概率密度函数

根据拟合函数作图如图2所示。

图2 概率密度函数图像

由于概率密度函数图像与x轴围成的面积为概率值,因此对于对数正态分布作为概率密度函数来说,图像越高耸,则说明在等长度范围的情况下出现在峰值附近的概率越高。

因此由图2可以看出:

(1)根据峰值位置可知,星期一的话务量最大在2 500左右,星期二~星期五的话务量呈平稳态势,星期五稍微偏高,双休日话务量则明显下降。

(2)根据图像形态可知,星期日的话务量分布更为集中,其次为星期五,星期一和星期二分布相对分散。

2.2.4 预测分析

根据拟合结果,可得对数正态分布峰值如表4所示。

表4 对数正态分布峰值

从表4中可以看出,该呼叫中心星期一的话务量最高,在2 400上下,星期二~星期五的话务量基本持平,维持在2 000上下,双休日话务量下降趋势明显,分别维持在1 600和1 400上下。

根据概率密度函数特性,如图3所示,星期一的话务量在2 200~2 600的可能性为42%,而在2 000~2 800之间的可能性达73%。星期二~星期五的话务量在1 800~2 200的可能性分别为41%、45%、47%、50%,在1 600~2 400之间的可能性为72%、77%、79%、81%。星期六的话务量在1 250~2 050的可能性达81%。星期日话务量维持在1 438上下的可能性最大,话务量在1 200~1 600之间的可能为55%,在1 000~1 800之间的可能为85%,而在1 000~2 000的可能高达94%。

图3 星期一~星期日话务量峰值示意图

3 结束语

本文运用概率论和数理统计理论与方法,提出了基于统计抽样和对数正态分布拟合的呼叫中心话务量预测方法,建立了拟合模型,应用该模型对呼叫中心话务量进行了实证研究。结果表明该方法取得的预测值比较合理,符合呼叫中心的实际情况,为铁路运输企业呼叫中心进一步做好话务量预测提供了理论和案例参考。

[1]张帼奋.概率论数理统计与随机过程[M].浙江:浙江大学出版社,2011.

[2]扎库拉•戈文达拉玉卢.抽样理论与方法[M].北京:机械工业出版社,2005.

[3]牟 颖,王俊峰,谢传柳,夏正洪.大型呼叫中心话务量预测[J].计算机工程与设计,2010,31(21).

[4] 董哈微,叶先一.基于时间序列的呼叫中心话务量预测[J].闽江学院学报,2008,29(5):27-30.

[5]张志国,曹 洋,孙 平.对数正态分布参数的精确估计及其应用[J].辽宁科技大学学报,2008(Z1).

责任编辑 陈 蓉

Method of forecasting traff i c for call center of railway transport enterprise

ZHANG Boju
( Transport Administration, China Railway, Beijing 100844, China )

This paper combined probability theory and mathematical statistics theory, and used the statistical sampling methods and lognormal distribution fi tted to the call center traff i c forecasting. The paper also used a new research method which was different from the existing method by introducing probabilistic characteristics, and this was expected to provide a more comprehensive theoretical and case reference for the actual operations management of call center.

call center; forecast on traff i c; logarithmic normal distribution; sampling statistics

U285∶TP39

A

1005-8451(2014)10-0001-04

2014-05-07

铁道部2011年度科研计划课题(2011X019-I)。

张伯驹,高级工程师。

猜你喜欢

话务量折线图概率密度函数
幂分布的有效估计*
数据增加折线图自动延长
基于神经网络的话务量预测模型
基于时间序列模型的异常话务量分块建模和预测
让折线图显示在一个单元格中
已知f(x)如何求F(x)
基于变构模型的概率密度函数的教学探索
再多也不乱 制作按需显示的折线图
美化Excel折线图表
多基站调度网话务量模型