基于CDL话单的高铁无线网络分析
2014-12-26叶冠武
叶冠武
【摘 要】通过提取高铁站点的所有CDL话单,根据高铁列车上通话的特点,探讨高铁话单的筛选规则,用以筛选出在高铁上通话的话单,借由话单分析得到更为广泛和精确的高铁用户行为及网络数据,以此进行高铁无线网络的优化。
【关键词】高速铁路 CDL话单 用户行为
中图分类号:TN929.5 文献标识码:A 文章编号:1006-1010(2014)-22-0003-05
Analysis on High-Speed Rail Wireless Network Based on CDL Bill
YE Guan-wu
(China Youke Communication Technology Co., Ltd., Fuzhou 350007, China)
[Abstract]
According to the characteristics of the high-speed rail calls, all CDL (Call Detail Log) bills in high-speed rail station are extracted. The filtering rules of high-speed rail are discussed to filter the bills of high-speed rail. By analyzing bills, the comprehensive and precise high-speed rail users behaviors and network data can be derived to optimize high-speed rail wireless network.
[Key words]high-speed rail CDL bill single user behavior
1 引言
高铁无线网络一般采取针对高铁线路覆盖的专门站点和大网站点相互结合的覆盖方式,但这并无法避免专门站点覆盖到高铁周边的其他区域,无法通过后台提取的站点KPI指标得到准确的高铁网络运营状况,因此需要进行大量的测试。由于较高的车速导致高铁无线网络复杂多变,随机异常事件频发,上车测试得到的采样数据有限,所以通过测试得到的网络整体状况不够准确,同时又需要耗费大量的人力物力。
通过系统提取CDL(Call Detail Log)话单,可以得到大量的通话记录,从中筛选出用户在高铁上的通话记录,从而得到海量的高铁通话数据,再对这些数据进行分析,得到更为准确的高铁用户行为和网络状况,以便进行市场分析,同时也为上车测试提供新的方向,缓解了高铁优化工作对上车测试的需求。
2 基于CDL话单的高铁无线网络分析
2.1 话单提取
通过网优平台或基站设备厂家网优工具,提取足够数量的话单样本以作分析。
2.2 话单筛选
针对提取的样本话单,根据高速动车上通话的特点拟定一定的原则进行筛选,再根据不同线路高铁动车的不同情况,拟定相应的筛选规则。以下筛选条件适用于大多的高铁通话,可作为日常应用参考。
各条件存在先后顺序,需要删除的话单标记为0,待保留的标记为1:
(1)S1:保留起呼小区和释放小区均为高铁覆盖小区的话单,删除其余话单。
(2)删除确定非高铁通话的话单:
◆D1:删除非高铁运营时间内的话单。若列车趟次较少,可精确至每趟列车通过时间;若趟次较多(如下例中的福厦线),先删除运营时间外(通常为夜间至凌晨)的话单。
◆D2:删除大网IMSI的话单。如同一时段在同一小区多次起呼的IMSI可以判定为大网IMSI。
◆D3:删除起呼小区相同但呼叫时长大于通过该小区覆盖范围所用时间的话单。
◆D4:其他。根据各地高铁网络现状自定义筛选原则。
(3)保留确定和不确定是高铁通话的话单:
◆A1:短话单。以单个小区平均覆盖1km计算,若高铁以200km/h的时速通过该小区大约需要18s,建议以18s作为短话单判定标准,保留200km/h时速下运营的动车线路上的通话短话单。
◆A2:释放小区为相邻地市小区的话单。以中兴设备为例,其跨地市的话单会被分为两条,存在于相邻地市的两个BSC上,不易判断,暂作保留,而本地市的跨BSC话单仍为一条话单。
◆A3:高铁站点小区话单。只覆盖高铁而吸收不到高铁周边话务的小区的话单,如无人山区或无外引信号的隧道洞室等。
◆A4:其他。根据各地高铁网络现状确定符合各自情况的原则进行筛选。
(4)对可能是高铁上通话的话单参考高铁通话的特点用相关条件进行筛选,删除不符合条件的话单:
◆F1:根据起止距离(起呼位置到终止位置的距离,部分网优平台可提取,也可根据话单字段得到,若粗略估计可以用起止小区经纬度代替)和理论通过距离(通话时长乘以动车行驶速度)进行比较,预留一定裕量,删除两者差别较大的话单。
◆F2:其他。根据各地高铁网络现状确定符合各自情况的原则进行筛选。
综合上述各项原则及其之间的优先级,得到如下筛选公式:
K=S1*product(D1,D2,D3,D4…)*[sum(A1,A2,A3,A4…)+
product(F1,F2…)] (1)
若K值等于0,则删除该话单;若K值不为0,则保留该话单,判定其为高铁上通话话单。
2.3 话单分析方法
根据上述筛选出的话单可以进行由宏观到微观、由整体到细节的分析,从大量话单中找出高铁网络的整体规律、话务模型,为高铁网络建设、运营、优化找出方向,并提供依据,再从单个小区话单、单个用户话单的细节分析为高铁优化提供帮助。
(1)对提取的大量样本话单进行统计,根据话单相关字段的统计对用户行为进行分析,得到用户在高铁上的一些行为,如长话比例、通话时长等,用以帮助市场分析。
(2)对话单通话情况进行统计得到高铁网络的话务模型,如高铁网络话务忙时、闲时等。
(3)通过分析得到高铁上通话的整体指标情况,如高铁上通话的接通率、掉话率等,该结果相比较上车DT测试所得由于其采样数据量大,更能客观反映整体指标。另外,部分高铁站点需要同时兼顾大网,故这些高铁站点的KPI指标包含对大网通话情况的统计,无法得到其在高铁上的网络情况,通过对这些高铁站点话单的筛选可以得到它们对高铁的覆盖情况。因此,高铁话单分析出的结果相对网管KPI指标更能准确反映高铁网络质量,找到高铁网络的真正短板。
(4)通过上述对话单统计得到高铁整体网络情况之后,针对网络短板,对相应的话单进行更加有针对性的分析。如上述统计得到高铁掉话严重的小区,可以针对该小区的掉话话单逐条分析掉话相关字段,得到该小区内掉话的情况,再结合路测数据或网管信令跟踪情况进行优化。
3 某高铁话单分析优化示例
3.1 某高铁用户规模预估
每个基站设备厂家话单字段有所不同,本次优化选取某高铁沿线连续3个同厂家的本地网(依次为A/B/C这3个地市)路段作为分析对象进行分析优化。
优化路段全程约200多公里,高速铁路车程约70分钟,沿线高铁扇区近200个。该段高铁运营时间为每日首班车06:30出发,末班车由C地市出发到达A地市的时间为23:05左右。根据高铁客运情况和运营商市场占有率情况,对该段高铁的CDMA用户规模进行预估,用以判断筛选结果的合理性,并结合话单分析市场用户行为。预估情况如表1所示:
表1 高铁优化路段用户规模预估
全程公里数/km 273
平均每列乘客/人 700
每日往返列车数/对 45
上座率/% 90
合计乘客/人 56 700
手机普及率/% 95
市场占有率/% 25
每日动车CDMA用户数/人 13 466.25
每趟动车平均CDMA用户数/人 149.625
根据上述估计,每日约有1.3万个CDMA用户经过该段高铁,而平均每列动车上约有150个CDMA用户。
3.2 话单筛选
网优平台提取高铁沿线地市A到地市C基站一周的数据,起呼和释放小区均为该段高铁沿线覆盖小区的话单,累计90多万条,作为采样样本进行筛选。
参考上述筛选原则,并结合福厦线高铁的情况,根据下列条件对样本话单进行筛选:
(1)D1:删除大网IMSI话单1。同一时段在同一小区起呼次数3次及以上的IMSI判定为大网IMSI,删除该IMSI在该时段的话单;同一天在同一小区有3个时间段有起呼记录的IMSI判定为大网IMSI,删除该IMSI在当天所有话单。
(2)D3:删除起止小区相同但呼叫时长大于动车通过该小区覆盖范围所用时间的话单。以每小区通过时间为18s计算,即呼叫时长大于(18s*该小区同PN小区数),车站A和车站B各停靠2分钟,因此比较时加上停靠时间。
(3)A1:保留18s内的短话单。
(4)A2:保留终止小区为边界小区的话单。
(5)F1:呼叫起止距离与理论通过距离比较,删除理论距离大于起止距离2倍以上的话单(为防止起止距离误差,预留一定裕量),删除理论距离小于起止距离较多的话单,此处差值以(起止小区的同PN小区数之和/2*1km)为判定标准。
筛选公式如下:
K=D1*D2*(A1+A2+F1) (2)
若K值为0则保留,判定为高铁话单作为下文分析之用。
由该筛选方法从90多万条话单中得到83 627条话单。
3.3 用户行为分析
对筛选出的83 637条话单进行统计,结果如表2所示:
表2 高铁话单筛选结果
累计话单数 83 637
累计话务量/Erl 651.28
累计通话IMSI数量 54 586
日均话单 11 948.14
日均话务量/Erl 93.04
日均通话IMSI数量 7 798.00
每IMSI产生话单数 1.53
平均每趟列车通话IMSI数 86.64
平均每趟列车产生话单 132.76
平均每话单通话时长/s 28.03
主叫话单比例/% 51.24
被叫话单比例/% 47.26
已知IMSI归属地话单 59 388
各本地用户 28 416
漫游话单比例/% 52.15
各本地用户主叫话单 13 354
各本地用户主叫长途比例/% 10.84
从表2可知,根据话单结果该段高铁动车上日均产生11 948条语音话单,日均话务量约为93.04Erl。由上述预估每趟列车有天翼用户数150人,其中地市A至地市C约有86人产生语音通话话单,平均每2人拨打3次电话,每次通话时间约为28s,主叫和被叫比例约为1:1。
由于平台数据库无法得到所有IMSI的归属地,从采样结果中仅得到59 388条话单的IMSI归属地,对此进行的统计结果看到,本地用户仅占不到一半,漫游话单比例达52.15%,而本地IMSI的主叫话单中,长途主叫的比例有10.84%,比例较高。
筛选出的话单按照时间段统计,由于仅提取一周数据,每日全天话务走势不具有代表性,仅统计每天各时段话务分布,结果如图1所示:
图1 该段高铁小区每日各时段话务情况
由图1可以看到,每日各时段的分布中,09:00—10:00和17:00—19:00最多,最忙时为17:00,这与传统的语音晚忙时19:00明显不同,因此后续对该高铁的优化建议多参考沿线站点17:00时段指标。继续深入分析每个高铁扇区的忙时,能更准确地对每个高铁小区话务模型进行分析优化。
3.4 掉话情况分析
采样结果的83 637条话单中有642次掉话话单,语音掉话率达0.77%。由于呼叫时长小于18s的短话单无法很好的区分是否是在高铁上起呼,而大于18s的话单可以通过其他条件筛选,得到更贴近高铁通话的话单,因此将话单区分为18s内的短话单和18s以上的长话单,分别统计掉话率,得到结果如表3所示:
表3 该段高铁掉话情况
呼叫时长/s 掉话次数 掉话率/% 占比/%
≤18 160 0.35 24.92
>18 482 1.29 75.08
由表3可以看到,该段高铁上大于18s的通话掉话率达1.29%,掉话率较高。可以对掉话率高的小区进行TOPN进一步分析。分析结果与各小区网管掉话率指标相比更具指导意义,也可与上车DT测试结果进行比较分析,根据基站厂家的话单字段含义得到掉话原因值如表4所示:
表4 该段高铁掉话原因
失败原因值 掉话次数
SDM_Link_Fail_RevTooManyBadFrm 550
ERR_SPS_RLSA_BSSAP_UnexptMsg_RcvOrgnInSessionState 71
ERR_SPS_RLSA_BSSAP_UnexptMsg_RcvRegInSessionState_Others 18
由表4得到主要的掉话原因:“SDM_Link_Fail_RevTooManyBadFrm”,该原因的掉话次数有550次。引起该失败值掉话的原因有很多,主要是无线环境恶化导致BSC侧在一段时间内收到大量坏帧,从而引起掉话。另外掉话较多的失败原因是失败71次的“ERR_SPS_RLSA_BSSAP_UnexptMsg_RcvOrgnInSessionState”,根据这些掉话原因,进一步对掉话的话单进行详细分析。
3.5 其他情况分析
根据以上的分析方法,还可以对高铁上CDMA用户的接入情况、切换情况等指标进行分析,进一步了解高铁沿线基站的覆盖质量、用户的使用行为。
4 结束语
本文针对高铁的特点,设定一定的规则对话单进行筛选,得到较为符合高铁列车上的通话话单。文中所列的筛选条件仅作参考,不同地市或不同的高铁线路应根据各自的特点采用不同的条件进行更精确的筛选,如根据动车的运营时间、通过每个站点的时间,根据该时间筛选话单可得到更精确的结果。
本文仅对CDMA语音话单中的一些主要字段进行分析,得到该段高铁CDMA语音网络的部分用户行为及网络情况。CDL其他字段也可供优化人员进行分析,以获得更多高铁网络信息,再根据整体分析得到问题点,对问题话单的相关字段进行更深入的分析。不同基站设备厂家有其各不相同的话单字段,为优化人员提供了通话过程的各种信息,通过对海量高铁话单的分析,得到更准确的高铁用户行为和无线网络状况,帮助市场分析和网络优化。
随着经济的发展,我国将建设更多的高速铁路,越来越多的用户将通过高铁出行,高铁网络的优化工作也变得更加重要。本文通过CDL话单定位分析高铁无线网络状况,为今后的高铁优化工作提供了一个较为便捷有效的优化手段。
参考文献:
[1] 张传福,李梦迪,王刚. 高速移动环境下组网方案[J]. 电信工程技术与标准化, 2009(4): 75-78.
[2] 张敏,李毅,舒培炼. 高速铁路列车车厢穿透损耗应用探析[J]. 移动通信, 2011(2): 21-25.
[3] 中兴通讯股份有限公司. 系统呼叫失败原因和掉话解释(1X业务分册)[Z]. 2009.
[4] 李蔷薇. 移动通信技术[M]. 北京: 北京邮电大学出版社, 2005.
[5] 中国电信集团公司. 2009年中国电信高速铁路CDMA网络建设指导意见(试行)[Z]. 2009.
各本地用户主叫话单 13 354
各本地用户主叫长途比例/% 10.84
从表2可知,根据话单结果该段高铁动车上日均产生11 948条语音话单,日均话务量约为93.04Erl。由上述预估每趟列车有天翼用户数150人,其中地市A至地市C约有86人产生语音通话话单,平均每2人拨打3次电话,每次通话时间约为28s,主叫和被叫比例约为1:1。
由于平台数据库无法得到所有IMSI的归属地,从采样结果中仅得到59 388条话单的IMSI归属地,对此进行的统计结果看到,本地用户仅占不到一半,漫游话单比例达52.15%,而本地IMSI的主叫话单中,长途主叫的比例有10.84%,比例较高。
筛选出的话单按照时间段统计,由于仅提取一周数据,每日全天话务走势不具有代表性,仅统计每天各时段话务分布,结果如图1所示:
图1 该段高铁小区每日各时段话务情况
由图1可以看到,每日各时段的分布中,09:00—10:00和17:00—19:00最多,最忙时为17:00,这与传统的语音晚忙时19:00明显不同,因此后续对该高铁的优化建议多参考沿线站点17:00时段指标。继续深入分析每个高铁扇区的忙时,能更准确地对每个高铁小区话务模型进行分析优化。
3.4 掉话情况分析
采样结果的83 637条话单中有642次掉话话单,语音掉话率达0.77%。由于呼叫时长小于18s的短话单无法很好的区分是否是在高铁上起呼,而大于18s的话单可以通过其他条件筛选,得到更贴近高铁通话的话单,因此将话单区分为18s内的短话单和18s以上的长话单,分别统计掉话率,得到结果如表3所示:
表3 该段高铁掉话情况
呼叫时长/s 掉话次数 掉话率/% 占比/%
≤18 160 0.35 24.92
>18 482 1.29 75.08
由表3可以看到,该段高铁上大于18s的通话掉话率达1.29%,掉话率较高。可以对掉话率高的小区进行TOPN进一步分析。分析结果与各小区网管掉话率指标相比更具指导意义,也可与上车DT测试结果进行比较分析,根据基站厂家的话单字段含义得到掉话原因值如表4所示:
表4 该段高铁掉话原因
失败原因值 掉话次数
SDM_Link_Fail_RevTooManyBadFrm 550
ERR_SPS_RLSA_BSSAP_UnexptMsg_RcvOrgnInSessionState 71
ERR_SPS_RLSA_BSSAP_UnexptMsg_RcvRegInSessionState_Others 18
由表4得到主要的掉话原因:“SDM_Link_Fail_RevTooManyBadFrm”,该原因的掉话次数有550次。引起该失败值掉话的原因有很多,主要是无线环境恶化导致BSC侧在一段时间内收到大量坏帧,从而引起掉话。另外掉话较多的失败原因是失败71次的“ERR_SPS_RLSA_BSSAP_UnexptMsg_RcvOrgnInSessionState”,根据这些掉话原因,进一步对掉话的话单进行详细分析。
3.5 其他情况分析
根据以上的分析方法,还可以对高铁上CDMA用户的接入情况、切换情况等指标进行分析,进一步了解高铁沿线基站的覆盖质量、用户的使用行为。
4 结束语
本文针对高铁的特点,设定一定的规则对话单进行筛选,得到较为符合高铁列车上的通话话单。文中所列的筛选条件仅作参考,不同地市或不同的高铁线路应根据各自的特点采用不同的条件进行更精确的筛选,如根据动车的运营时间、通过每个站点的时间,根据该时间筛选话单可得到更精确的结果。
本文仅对CDMA语音话单中的一些主要字段进行分析,得到该段高铁CDMA语音网络的部分用户行为及网络情况。CDL其他字段也可供优化人员进行分析,以获得更多高铁网络信息,再根据整体分析得到问题点,对问题话单的相关字段进行更深入的分析。不同基站设备厂家有其各不相同的话单字段,为优化人员提供了通话过程的各种信息,通过对海量高铁话单的分析,得到更准确的高铁用户行为和无线网络状况,帮助市场分析和网络优化。
随着经济的发展,我国将建设更多的高速铁路,越来越多的用户将通过高铁出行,高铁网络的优化工作也变得更加重要。本文通过CDL话单定位分析高铁无线网络状况,为今后的高铁优化工作提供了一个较为便捷有效的优化手段。
参考文献:
[1] 张传福,李梦迪,王刚. 高速移动环境下组网方案[J]. 电信工程技术与标准化, 2009(4): 75-78.
[2] 张敏,李毅,舒培炼. 高速铁路列车车厢穿透损耗应用探析[J]. 移动通信, 2011(2): 21-25.
[3] 中兴通讯股份有限公司. 系统呼叫失败原因和掉话解释(1X业务分册)[Z]. 2009.
[4] 李蔷薇. 移动通信技术[M]. 北京: 北京邮电大学出版社, 2005.
[5] 中国电信集团公司. 2009年中国电信高速铁路CDMA网络建设指导意见(试行)[Z]. 2009.
各本地用户主叫话单 13 354
各本地用户主叫长途比例/% 10.84
从表2可知,根据话单结果该段高铁动车上日均产生11 948条语音话单,日均话务量约为93.04Erl。由上述预估每趟列车有天翼用户数150人,其中地市A至地市C约有86人产生语音通话话单,平均每2人拨打3次电话,每次通话时间约为28s,主叫和被叫比例约为1:1。
由于平台数据库无法得到所有IMSI的归属地,从采样结果中仅得到59 388条话单的IMSI归属地,对此进行的统计结果看到,本地用户仅占不到一半,漫游话单比例达52.15%,而本地IMSI的主叫话单中,长途主叫的比例有10.84%,比例较高。
筛选出的话单按照时间段统计,由于仅提取一周数据,每日全天话务走势不具有代表性,仅统计每天各时段话务分布,结果如图1所示:
图1 该段高铁小区每日各时段话务情况
由图1可以看到,每日各时段的分布中,09:00—10:00和17:00—19:00最多,最忙时为17:00,这与传统的语音晚忙时19:00明显不同,因此后续对该高铁的优化建议多参考沿线站点17:00时段指标。继续深入分析每个高铁扇区的忙时,能更准确地对每个高铁小区话务模型进行分析优化。
3.4 掉话情况分析
采样结果的83 637条话单中有642次掉话话单,语音掉话率达0.77%。由于呼叫时长小于18s的短话单无法很好的区分是否是在高铁上起呼,而大于18s的话单可以通过其他条件筛选,得到更贴近高铁通话的话单,因此将话单区分为18s内的短话单和18s以上的长话单,分别统计掉话率,得到结果如表3所示:
表3 该段高铁掉话情况
呼叫时长/s 掉话次数 掉话率/% 占比/%
≤18 160 0.35 24.92
>18 482 1.29 75.08
由表3可以看到,该段高铁上大于18s的通话掉话率达1.29%,掉话率较高。可以对掉话率高的小区进行TOPN进一步分析。分析结果与各小区网管掉话率指标相比更具指导意义,也可与上车DT测试结果进行比较分析,根据基站厂家的话单字段含义得到掉话原因值如表4所示:
表4 该段高铁掉话原因
失败原因值 掉话次数
SDM_Link_Fail_RevTooManyBadFrm 550
ERR_SPS_RLSA_BSSAP_UnexptMsg_RcvOrgnInSessionState 71
ERR_SPS_RLSA_BSSAP_UnexptMsg_RcvRegInSessionState_Others 18
由表4得到主要的掉话原因:“SDM_Link_Fail_RevTooManyBadFrm”,该原因的掉话次数有550次。引起该失败值掉话的原因有很多,主要是无线环境恶化导致BSC侧在一段时间内收到大量坏帧,从而引起掉话。另外掉话较多的失败原因是失败71次的“ERR_SPS_RLSA_BSSAP_UnexptMsg_RcvOrgnInSessionState”,根据这些掉话原因,进一步对掉话的话单进行详细分析。
3.5 其他情况分析
根据以上的分析方法,还可以对高铁上CDMA用户的接入情况、切换情况等指标进行分析,进一步了解高铁沿线基站的覆盖质量、用户的使用行为。
4 结束语
本文针对高铁的特点,设定一定的规则对话单进行筛选,得到较为符合高铁列车上的通话话单。文中所列的筛选条件仅作参考,不同地市或不同的高铁线路应根据各自的特点采用不同的条件进行更精确的筛选,如根据动车的运营时间、通过每个站点的时间,根据该时间筛选话单可得到更精确的结果。
本文仅对CDMA语音话单中的一些主要字段进行分析,得到该段高铁CDMA语音网络的部分用户行为及网络情况。CDL其他字段也可供优化人员进行分析,以获得更多高铁网络信息,再根据整体分析得到问题点,对问题话单的相关字段进行更深入的分析。不同基站设备厂家有其各不相同的话单字段,为优化人员提供了通话过程的各种信息,通过对海量高铁话单的分析,得到更准确的高铁用户行为和无线网络状况,帮助市场分析和网络优化。
随着经济的发展,我国将建设更多的高速铁路,越来越多的用户将通过高铁出行,高铁网络的优化工作也变得更加重要。本文通过CDL话单定位分析高铁无线网络状况,为今后的高铁优化工作提供了一个较为便捷有效的优化手段。
参考文献:
[1] 张传福,李梦迪,王刚. 高速移动环境下组网方案[J]. 电信工程技术与标准化, 2009(4): 75-78.
[2] 张敏,李毅,舒培炼. 高速铁路列车车厢穿透损耗应用探析[J]. 移动通信, 2011(2): 21-25.
[3] 中兴通讯股份有限公司. 系统呼叫失败原因和掉话解释(1X业务分册)[Z]. 2009.
[4] 李蔷薇. 移动通信技术[M]. 北京: 北京邮电大学出版社, 2005.
[5] 中国电信集团公司. 2009年中国电信高速铁路CDMA网络建设指导意见(试行)[Z]. 2009.