APP下载

基于云瞰的沿街商铺覆盖评估研究

2023-07-08李皓杰

科技与创新 2023年12期
关键词:商铺楼宇气压

曾 进,李皓杰

(中国联合通信股份有限公司重庆市分公司云网接入网运营中心,重庆 401121)

沿街商铺是众多商铺形式中的一种,指毗邻街道、拥有临街铺面、经营与老百姓衣食住行相关产品和服务的商业铺面,通常分布在街道两侧楼房的底层。随着现代社会发展,沿街商铺已经成为人们日常生活中不可或缺的一部分,对城市的经济发展、社会繁荣和生活质量的提高具有重要作用。对于网络运营商来说,沿街商铺场景具有用户停留时间长、网络使用度高、人流密集、用户价值高、区域代表性强、口碑效应明显等特点,存在广阔的市场空间,对推进公司基础业务领域创新发展具有重要意义。但是,有别于大型商场和超市,沿街商铺由于纵深大、规模小、数量多、分布密,往往没有针对性的部署室内分布系统,仅仅依靠室外宏站无法满足用户深度覆盖需求,存在商业区和住宅区之间不平衡问题,严重影响城市居民生活质量。对运营商来说,如何精准洞察沿街商铺覆盖问题、以点带面提升用户体验是亟待攻克的难题。本文通过研究基于华为云瞰系统的沿街商铺覆盖评估方法,为洞察商铺网络覆盖问题提供了新的思路,也为城市治理和公共服务提供了一些有价值的参考。

1 现有网络覆盖评估方法技术特点

当前行业对于沿街商铺覆盖主要有3种评估方法,如表1 所示。其中“CQT(Call Quality Test)遍历测试评估”和“基于DT(Drive Test)路测的虚拟评估”均需要依靠人工测试来完成,耗时耗力、效率低、成本高,同时“基于DT 路测的虚拟评估”不能反映用户室内真实网络体验,准确性不足。“基于MR(Measurement Report,测量报告)数据评估”技术评估周期长,同时评估精度受数据质量、地图精度等因素影响,普遍精度不高。因此当前迫切需要一种评估手段,能反映用户真实体验的同时节省人力资源投入,进一步提升沿街商铺深度覆盖率和用户感知。

表1 沿街商铺现有三种网络覆盖评估技术特点对比

2 华为云瞰系统简介

华为通过整合行业OTT(Over The Top,通过互联网向用户提供各种应用服务)和终端性能管理数据,开发出“云瞰”服务解决方案,它具备竞对公正、3D定位精准、覆盖评估无损、语音体验地理化精准评估等关键能力,如图1 所示。云瞰系统可将采集的楼宇MR 覆盖信息与终端进入楼宇时的当前Wi-Fi、气压等信息进行关联,形成增强型MR,并上报至终端云数据平台,支撑运营商对整体、楼宇、道路等场景以进行网络质量和体验的洞察分析。

图1 华为云瞰系统整体流程

3 基于云瞰的沿街商铺覆盖评估方法

本文研究探索了基于华为云瞰楼宇级覆盖数据的二次定位方法,构建了从云瞰楼宇数据清洗→沿街商铺数据定位→沿街商铺三维建模→沿街商铺覆盖评估模型构建与校正的覆盖评估体系,具体实现思路如图2所示。首先对云瞰楼宇数据进行清洗,将不包含商铺特征信息的OTT 数据筛除,并对该部分数据进行算法定位,得到沿街商铺增强型MR 采样信息;结合爬取的商铺POI 信息构建沿街商铺3D 模型,对落入3D 模型的采样点进行覆盖评估;最后引入线性回归算法,将未落入模型的样本根据影响因子赋予相应权重,用以校正评估模型,大大提升了覆盖评估效率和精准度。

图2 基于云瞰的沿街商铺覆盖评估思路

3.1 楼宇商铺数据清洗

基于华为云瞰系统,可以采集全重庆楼宇级MR采样数据,其中包含商场、商铺、写字楼、停车场等数据。利用云瞰系统数据进行二次清洗,将云瞰楼宇级采样点中包含商铺特征的视为有效采样点,其余数据视为脏数据,清洗出楼宇级内的商铺有效样本。云瞰楼宇商铺数据清洗流程如图3 所示。

图3 云瞰楼宇商铺数据清洗流程

云瞰楼宇商铺数据清洗过程如下:①对云瞰原始楼宇数据数据进行采集和存储。此步骤收集的原始采样点数据包括楼宇区域内高层、商铺、地下车库等全部区域,数据内容包含用户MR 覆盖信息及业务特征信息。②收集沿街商铺特征。沿街商铺特征信息主要体现在用户被动采集的数据中是否包含面向商户的微信/支付宝支付信息。③对采集的数据进行清洗。提取原始数据中包含商铺特征信息的采样点,通过此特征筛除非商铺采样点。④商铺数据存储。通过本地数据库存储包含商铺特征信息的采样点[1]。

商铺数据清洗采用莱茵达准则(3σ准则),在95%或99.7%的置信概率下,以采集数据标准偏差的3 倍作为误差判断的标准进行判断,如果数据大于该标准,则判定为误差较大的数据不在随机误差之内。这类误差较大的数据即为系统中的异常数据,需要在清洗时进行删除,具体算法如下:对于采集到的数据x1、x2…x n,先计算其算数平均数和误差vi=xi-可以求得标准差为1;当时,认为xi为异常值,即不包含商铺特征信息的值,应剔除;当xi为正常数据,进行保留,经过清洗便得到包含商铺特征信息的采样点数据[2]。

3.2 沿街商铺数据定位

清洗好云瞰采样点数据后,需要进一步完成高度定位以满足后续沿街商铺内覆盖评估精确度要求。根据现场调研,重庆沿街商铺主要分布在道路两旁楼房底层,楼层数量为1—2 层,平均高度为10 m,考虑MR 采样点数据误差,对数据定位设置5 m 高度偏置,即认为15 m 以上的商铺采样点属于无效商铺采样点。采用的主要定位算法有2 种:①基于位置指纹的Wi-Fi定位算法,该算法定位准确度较高,为优先使用的定位算法;②基于气压信息的定位方法,在没有Wi-Fi 信息时,使用终端自带气压传感器信息完成数据高度定位[3]。

3.2.1 基于位置指纹的Wi-Fi 定位算法

设备在开启Wi-Fi 的情况下,即可扫描并收集周围的AP(Access Point,接入点)信号,无论是否加密、是否已连接,甚至信号强度不足以显示在无线信号列表中,都可以获取到AP 广播出来的MAC(Media Access Control,硬件位置)地址。基于位置指纹的Wi-Fi 定位算法如图4 所示。将采样点中这些能够标示AP 的信息(包含终端Wi-Fi 的多径结构及接收功率等信号特征)与云瞰平台Wi-Fi 信号位置信息指纹库进行比对,可以确定采样点在楼宇内的相对高度,进一步筛选出沿街商铺的有效采样点。

图4 基于位置指纹的Wi-Fi 定位算法示意图

采样点数据位置指纹获取:从采样点数据中分离Wi-Fi 定位的关键字段形成位置指纹。

采样点数据定位:通过加权KNN(K-Nearest Neighbor)算法进行指纹匹配定位,在位置指纹数据库中选择多个(K≥2)合适的离线位置指纹[4],求多个(K≥2)离线位置指纹的横纵坐标,并求平均值,得到带高度的采样点定位信息,即:

3.2.2 基于气压信息的定位算法

依据大气压值会随海拔高度增加而减小的物理规律,建立气压高度模型,如图5 所示。通过不同气压值的高度变化,可以计算终端采样点在楼宇内的相对高度,进一步筛选出沿街商铺的有效采样点。

图5 基于气象信息的定位算法示意图(单位:hPa)

采样点气压信息获取:从采样点数据中分离气压传感器信息关键字段,形成气压信息。

采样点海拔高度计算:根据接采样点中的气压信息,使用标准大气模型来计算用户的海拔高度,在具体应用中使用的公式为具体实现算法,即:

式(2)中:h为待定位目标的海拔高度;h0为基准点海拔高度;tm为2 个等压面P0和P之间的平均摄氏温度;P0为基准点气压;P为待定位目标所在位置的气压;t0为基准点温度;t为测量的温度。

地面气压分布一般在970~1 040 hPa,将P0赋值为1 000 hPa,h0为云瞰平台收集的基准点海拔高度,t0为20 ℃,则计算采样点海拔高度的表达式变为:

采样点相对高度计算:根据计算得到的采样点海拔高度度信息h,结合云瞰系统采集的每个楼宇底层海拔高度h1,可以计算得出到每个采样点相对于楼宇的相对高度h2,并将带相对高度的采样点定位信息存储于云瞰服务器[3],可得h2=h-h1。

3.3 沿街商铺三维建模

通过高德地图API(Application Program Interface,应用程序接口),爬取重庆市商铺级POI 信息,生产重庆沿街商铺二维平面图层,结合重庆沿街商铺平均高度10 m 进行三维切片建模,具体实现步骤如图6 所示。

图6 沿街商铺三维建模流程

POI 数据爬取:首先,使用高德地图提供的API接口,以GET 方式请求商铺数据,然后将返回的JSON(JavaScript Object Notation,一种轻量级的数据交互格式)数据解析为Python(计算机编程语言)对象,使用json.loads()函数将JSON 数据解析为Python 对象,生成POI 信息表。

解析JSON 数据:提取所需的POI 信息。使用Python 的json 模块处理JSON 数据,提取所需的POI信息,如名称、地址、类型、评分等。

POI 数据解析和存储:使用BeautifulSoup 库对HTML(超文本标记语言)文档进行解析,提取商铺信息,将提取的POI 数据存储到本地数据库中。

沿街商铺三维建模:使用云瞰平台的E3DX 模块,将商铺级POI 数据以及上文分析得到高度进行3D 建模渲染,得到如图7 所示的商铺级3D 模型。

图7 沿街商铺三维建模渲染示意图

3.4 沿街商铺覆盖预评估

基于重庆主城区商铺级3D 模型,结合沿街商铺数据清洗和定位结果,构建沿街商铺覆盖评估模型,如图8 所示。落入商铺3D 模型的采样点为有效采样点,对该部分有效采样点的网络覆盖情况加权平均得到商铺覆盖情况,基于这种方法可以对沿街商铺进行覆盖评估。

图8 沿街商铺有效采样点示意图

由于沿街商铺移动网络无线环境复杂,为验证该覆盖评估方法的准确性,研究小组在重庆主城9 区各抽选350 个,共计3 150 个研究商铺进行人工CQT 遍历测试。

将模型评估结果与人工测试结果进行对比,若同一商铺2 种评估方法得到的覆盖差异在±5 dB 内,则认为该商铺覆盖评估准确,反之则不准确,最后统计评估准确商铺的数量占比,目标要求达到90%以上。具体检验过程如表2 所示。

表2 沿街商铺覆盖预评估准确率比较试验内容表

试验统计结果如图9 所示,覆盖评估准确的沿街商铺共有1 958 个,评估准确率仅为62.16%,与预期目标要求差距较大。

图9 3 150 个沿街商铺覆盖评估结果统计

3.5 沿街商铺覆盖评估校正

为进一步校正调优覆盖评估模型,消除差异,提升评估精准性,对3 150 个沿街商铺预评估结果进行分析,评估准确率低的主要原因如下:①预评估模型中只将落入商铺模型的采样点作为有效评估采样数据,其余数据一刀切为无效数据,很大程度上减少了评估样本量;②高德地图爬取的POI 也存在一定误差,导致约23%的商铺有效采样点在3D 模型以外,使得该评估方法与实际有较大差异。

因此,通过线性回归算法对沿街商铺覆盖评估模型进行校正,对沿街商铺的采样点赋予影响因子,如图10 所示。将商铺场景模型内的采样点影响因子权重设置为X0,将场景模型外的采样点根据到场景边框的不同距离β设置影响因子权重为X1、X2…XM,从而扩大有效样本量,提升评估精准度。

图10 沿街商铺覆盖评估MR 采样点校正示意图

具体线性回归校准步骤如下。

3.5.1 线性回归模型选择

采用的线性回归模型函数表达式为:

式(3)中:y⌒为模型输出的预估值,即实际覆盖评估值;β0…βm为预测系数,即模型外采样点数;m为所使用自变量x的总数。

3.5.2 线性回归模型训练

在线性回归算法中,拥有多个模型评估的判断指标,在对覆盖模型校正时,主要使用均方误差(MSE,Mean Squared Error)以及决定系数(R2)的值进行最终线性模型准确度的评估,以确定相关联自变量x的选择与使用。该过程主要分为以下3 步。

第一步:计算决定系数(R2),它是一种用来反映因变量的波动有多少百分比可被自变量的波动所描述,决策系数(R2)值越高则表明模型越好,应用所有的自变量,依据(R2)值选择最优的自变量进行线性回归模型的搭建,最终得到最优自变量为采样点到模型距离,计算表达式为:

第二步:计算均方误差,它是反映估计值与被估计值之间差异程度的一种度量,均方误差MSE 的值越小,表明模型所输出的预测值与实际值间的误差越小,准确度则越高。首先,基于得到的R2值,即采样点到模型距离,选择相对较优的自变量进行多元线性模型的搭建,计算均方误差MSE 值;其次,将应用所有的自变量到多元线性回归模型中,计算均方误差MSE 并与之前选取部分自变量的所得的MSE 值进行比较讨论[4],计算表达式为:

第三步:通过以上线性回归模型评估得到在3D 模型外的采样点区间影响因子的合理配置,具体结果如表3 所示。

表3 未落入沿街商铺模型内的采样点影响因子

3.5.3 模型校准效果检验

3.5.3.1 原试验场景评估检验

利用校准后的覆盖评估模型再次对之前选取的3 150 个商铺进行覆盖评估,如图11 所示。校准后评估准确率明显改善,评估准确的商铺增加了947 个,覆盖评估准确率由62.16%提升至92.22%,达到预期目标。

图11 校准后评估准确率分析图(原3 150 个商铺)

3.5.3.2 新场景评估检验

为确保评估方法同样适用于其余商铺,将评估范围扩展至整个重庆区域,共抽选了5 300 个沿街商铺重新进行覆盖评估和现场测试,如图12 所示。评估准确的商铺共有5 023 个,准确率为94.77%,同样达到预期目标。

图12 校准后评估准确率分析图(新的5 300 个商铺)

经过对8 450 个沿街商铺的评估结果对比分析,证明了基于云瞰的沿街商铺覆盖评估方法准确率能保持在90%以上,将此方法用于全重庆沿街商铺的覆盖评估是完全可行的。

4 结束语

通过对云瞰系统楼宇覆盖数据进行二次开发,构建沿街商铺覆盖评估的新方法,经验证其评估准确率达90%以上,采用高效且准确的商铺评估手段,大幅节约运营商人工评估成本,有效提升沿街商铺的深度覆盖水平,改善用户体验,达到提质降本增效目的。同时,为后续同类场景网络评估提供了更多可借鉴的选择,为攻坚深度覆盖难点提供了更多的解决方案。

猜你喜欢

商铺楼宇气压
通信生产楼宇建设项目造价问题分析
看不见的气压
商务楼宇治理中党建融入的逻辑与路径——基于广州S楼宇的观察与思考
压力容器气压端盖注射模设计
外销画中的十三行街道戏曲商铺考
沉浸式剧院——Dear So Cute商铺与咖啡馆
智美兼具的精品——评测君和睿通Homates H10楼宇对讲室内门口机
高层楼宇灭火装备
电渗—堆载联合气压劈烈的室内模型试验
STM32平台的MPL3115A2气压传感器的应用