SSAS神经网络算法在呼叫中心运营中的预测应用
2014-03-20叶晓波
王 松,叶晓波,杨 昌
(楚雄师范学院计算机信息管理中心,云南 楚雄 675000)
1.引言
随着计算机应用技术和网络技术的不断发展,各种业务系统在给商家管理方便的同时,也积累了海量的电子数据。随着数据挖掘技术和数据挖掘工具的不断发展,对业务应用产生的数据可从更多方面进行“挖掘”,Microsoft SQL SERVER Analysis Services(SSAS)以其容易上手、快速、便捷等特点得到广泛应用。若事先对业务数据没有任何期望,可利用此工具的SSAS神经网络模型知道是否会有任何值得关注的发现,探查可能的相关性,分析多个输入和输出之间的复杂关系,使业务团队可以用来理解数据中的趋势。本文主要介绍数据挖掘中的神经网络算法在对某呼叫中心数据进行预测分析中的应用,用一个实际案例说明用SSAS神经网络算法建立的用于呼叫中心运营中的预测分析挖掘模型。
2.SSAS神经网络算法
Microsoft神经网络使用由最多三层神经元 (即“感知器”)组成的“多层感知器”网络 (也称为“反向传播Delta法则网络”)。这些层分别是输入层、可选隐藏层和输出层。
输入层:输入神经元定义数据挖掘模型的所有输入属性值及其概率。
隐藏层:隐藏神经元接收来自输入神经元的输入,并向输出神经元提供输出。隐藏层是向各种输入概率分配权重的位置。权重说明某一特定输入对于隐藏神经元的相关性或重要性。输入所分配的权重越大,则输入的值越重要。权重可为负值,表示输入抑制而不是促进某一特定结果。
输出层:输出神经元代表数据挖掘模型的可预测属性值。
SSAS神经网络算法可描述为:
图1 SSAS神经网络算法
图2 集合N
实际的做法:
3.实例分析
3.1 实例概述
本文以某呼叫中心反映工作效率的指标信息为数据依据,原始数据包括某个月内呼叫中心的运转情况。原始数据主要包括如下属性:FactCallCenterID(数据导入到数据仓库中时创建的一个任意键)、DateKey(呼叫中心的运营日期)、WageType(指示当天是工作日、周末还是节假日)、Shift(指示为其记录呼叫的轮班时间,此呼叫中心将工作日划分为四个轮班时间:AM、PM1、PM2和Midnight)、LevelOneOperators(指示值班的一级接线员的数量)、LevelTwoOperators(指示值班的二级接线员的数量。员工必须达到一定数量的工作小时数后,才有资格成为二级接线员)、TotalOperators(此轮班时间内存在的接线员的总数)、Calls(此轮班时间内收到的呼叫数)、AutomaticResponses(完全通过自动呼叫处理来处理的呼叫数)、Orders(由呼叫产生的订单数)、IssuesRaised(由呼叫产生的需要后续操作的问题的数量)、AverageTimePerIssue(应答一次来电所需的平均时间)、ServiceGrade(指示此轮班时间的“挂断率”)。挂断率是呼叫中心经常使用的一个指标。挂断率越高,说明客户的满意度越差,因此丢失潜在订单的可能性也就越大。挂断率是按轮班时间计算的。数据跟踪每个班次的操作员人数、呼叫数和订单数、响应时间和基于“挂断率”(能够反映客户失望度)的服务等级标准。使用神经网络算法生成一个模型,用来理解数据和其中的趋势。并尝试解决哪些因素会影响客户满意度,呼叫中心如何能够改进服务等级这两个问题,根据结果,生成可用于预测的逻辑回归模型。使用该预测来帮助规划呼叫中心的运营。
3.2 部分属性柱形图
图 3 IssuesRaised、Shift、LevelOneOperators、ServiceGrade、Calls、TotalOperators柱形图
3.3 挖掘模型中趋势的透视图
图4 按Shift(班次)来进行筛选所生成的AverageTimePerIssue的透视图
图5 按Shift(班次)来进行筛选所生成的LevelTwoOperators的透视图
以图形方式显示由模型发现的响应时间和服务等级之间的相关性。
3.4 分析可能会影响呼叫中心运营的因素
从挖掘模型分析可知,首要影响因素是AverageTimePerIssue,AverageTimePerIssue介于44—70分钟之间时,60.6% 的事例发生在具有最高服务等级(0.030—0.072)的班次内,8.30% 的事例发生在具有最低服务等级 (0.126—0.210)的班次内。可得出结论:较短的呼叫响应时间(44—70分钟)会严重影响较好的服务等级 (0.03—0.07)。
3.5 创建预测的挖掘模型
除了分析可能会影响呼叫中心运营的因素之外,还需要就员工如何提升其服务等级提供一些具体的建议。在此任务中,将使用生成探索模型时所使用的挖掘结构,并添加一个用来通过使用逻辑回归模型创建预测。
3.5.1 生成大容量预测查询的输入数据
使用数据源视图设计器创建一个T-SQL语句的命名查询,用于大容量预测的源数据的聚合视图。生成大容量预测查询输入数据的T-SQL代码如下:
3.5.2 预测每个班次的服务标准
表1 每个班次的示例结果
3.5.3 预测呼叫时间对服务等级的影响
表2 三个不同响应时间用作预测查询的输入时的结果
4.总结
通过上述对SSAS神经网络算法的讨论,以及利用基于SSAS神经网络算法建立的挖掘模型应用到一个具体实例,通过分析神经网络算法挖掘模型所发现的模式,得出了对顾客分类的结果。根据结果,生成可用于预测的逻辑回归模型,使用该预测来帮助规划呼叫中心的运营。
[1]JIAWEIHAN MICHELINE KAMBER.Data Mining:Concepts and Techniques,2nd ed [M].Beijing:China Machine Press,2006.
[2]郭丽.SQLServer2005构建数据挖掘解决方案 [J].计算机与现代化.2007(5):1.
[3](美)陈封能,(美)斯坦巴赫,(美)库玛尔著,范明等译.数据挖掘导论 (完整版)[M].北京:人民邮电出版社.2011.
[4]谢邦昌.商务智能与数据挖掘Microsoft SQL Server应用 [M].北京:机械工业出版社.2008.
[5](美)迈克伦南,(美)唐朝晖,(美)克里沃茨著,董艳,程文俊译.数据挖掘原理与应用 (第2版)—SQL Server 2008数据库 [M].北京:清华大学出版社.2010.