基于路网和图像处理技术的卷烟商圈模型
2021-09-08刘佳
刘 佳
(陕西省烟草公司西安市公司信息中心,陕西 西安 710061)
商圈理论最早由德国地理学家克里斯·泰勒提出,在商圈理论提出后,就“商圈”这一名词,形成了三类传统商圈模型:第一类模型以单个零售店为圆心,辐射距离为半径规划出的圆形区域作为商圈,这类模型围绕单个零售户进行商圈分析。第二类模型将研究区域划分为边长很小的正方形单元格,结合商业网点数据,利用反距离加权表面建模技术识别并显示商圈分布,这类商圈的边界划分(较为粗糙)存在局限性。第三类模型将商业集群地的辐射影响区域作为商圈,这类商圈模型主要是围绕城市商业繁华地区构建商圈。现阶段随着我国人民生活水平和消费水平的提高、商业发展迅速,这一理论在地理系统和商业系统的交叉领域得到了广泛应用。
烟草行业零售户一直存在商圈字段,针对这一行业,学者们对商圈的定义比较模糊,同时也缺少与之相关的应用场景,传统商圈模型与烟草行业的适用性较低。我国烟草行业基于361个市级单位进行商业活动,零售户呈现城区密集分布、郊区稀疏分布的特点,其分布与路网的分布特征相似。路网由城镇管辖范围内的各不同功能干道和区域性道路组成,其构成了城市总体规划布局的骨架,城市基础建设与经济发展依托路网进行延伸。路网作为一个天然的屏障,将城市划分为一个个闭合的区域,这些闭合区域由于交通、地理位置等因素具有不同的消费环境及商圈价值。因此,将路网作为基础规划商圈就有着重要的意义。基于此,本文将路网引入图像识别算法构建商圈模型。
构建烟草行业商圈体系具有重要的战略意义,随着云计算、物联网等信息技术发展,各行各业正在快速推进信息空间到地理空间的映射和关联。全国烟草零售户达500多万户,时刻在生成大量销售数据,这些销售数据构成了庞大的信息空间。而商圈所表达的地理实体是所有社会经济活动的地理空间载体,将烟草信息数据关联到商圈地理空间维度中,能更好地进行统计、分析、可视化处理,进而运用更科学的算法模型挖掘有价值的业务信息。
1 方法与数据
1.1 研究方法
1.1.1 连通域模型
本文构建的商圈划分模型,是基于路网框架的连通域识别模型。连通域一般是指图像中具有相同像素值且位置相邻的前景像素点组成的图像区域。
像素相邻关系:4-领域(图1)、8-领域(图2),本文算法采用4-邻域(图1)模式。
图1 4-领域
图2 8-领域
连通域分析是指将图像中的各个连通域找出并进行标记。从连通域的定义可知,一个连通域是由具有相同像素值的相邻像素所组成的像素集合,因此可以通过这两个条件在图像中寻找连通域。对于找到的每个连通域,赋予其一个唯一的标识(label)以区别其他连通域。
连通域分析的基本算法如下所述。
例如,处理一张100*100像素的照片,首先将前景空白处像素值设为1,将背景道路和边界线处像素值设为0,再初始设置一个唯一标示(label)数值为1,作为第一次寻找到的连通域的唯一标示。
第二步,在100×100即10000个像素点中随机取一个点,若该点像素值为0,label数值保持不变,跳过该次循环。
第三步,继续从未处理过的点中随机取一个点,若该点像素值为1,将其像素值加上当前的label值代替当前像素值,然后继续判断该点上、下、左、右四个方向相邻点的像素值。
(1)若四个相邻点的像素值都为0,结束此循环,并将label值加1,作为下一次寻找到的连通域的唯一标示。
(2)若四个相邻点中有像素值为1的点,则将该点的像素值赋值为当前像素值1加上当前的label值,之后再寻找该点周围的相邻点,只要有相邻点的像素值为1,则将其像素值加上label值并继续沿着周围不断寻找并重新赋值,而像素值为0的相邻点,则不做处理,并停止寻找相邻点。直到没有相邻点的像素值为1时,结束此循环。此时,已找到一个连通域,且此连通域的唯一标示(label)值为当前的label值。
(3)将label值加1,作为下一次寻找到的连通域的唯一标示。
不断重复第二步和第三步操作,直到没有未处理过的点,则图像的连通域分析完成。
1.1.2 骨架算法模型
骨架结构化是目标图像被二值化后的一个关键问题。数学形态学是目标图像处理的一种有力工具,本文将Khalid Sheed的K3M形态学变换细化骨架算法在路网图像中实现,并讨论了这种算法的优越性和适用性。本文对原始路网图像数据集进行了预处理,为路网骨架的识别乃至细化都提供了有益的借鉴。
骨架图像可以看作是一种以图片中轴组成的图片,其有严格的数学定义,可认为是图像细化的产物。目前已经有许多细化算法,这些算法得到的骨架可能略有差异。本文实现了应用于路网细化的骨架算法。该算法属于迭代腐蚀边界类算法的一种,该类算法的思想是假定从二值图像中物体的边界处同时开始燃烧,物体就会被逐步细化,但在燃烧过程中要满足一定条件的点被保留或者被“烧掉”,以保证燃烧结束后剩下的最后一个像素宽的图像为图像的骨架。
一般来讲,为了满足计算的速度要求和算法的准确性,迭代中算法会对图像边界上某点的3*3邻域进行检查,判断是否满足要求。
算法简化流程图如图3所示。
图3 算法简化流程图
流程图过程:
Phase0:标记出图像的边界。
Phase1:如果该点的邻域中有3个点(非零点)相邻,删除该点。
Phase2:如果该点的邻域中有3或4个点(非零点)相邻,删除该点。
Phase3:如果该点的邻域中有3,4,5个点(非零点)相邻,删除该点。
Phase4:如果该点的邻域中有3,4,5,6个点(非零点)相邻,删除该点。
Phase5:如果该点的邻域中有3,4,5,6,7个点(非零点)相邻,删除该点。
Phase6:剩余的边界点取消标记,如果Phase5中没有点被修改,停止迭代,返回Phase0。
1.2 数据处理
网图层数据分为不同层级,第一层级主要展示国道,随着级别提升显示的道路精细程度递增。本文的商圈划分模型首先基于城市主要街道图层做连通域分析,又因面积过小的连通域缺少作为单位商圈的基本条件,需要通过规则与邻近商圈做融合处理。
融合处理规则:(1)分布于城市内主干道两侧的连通域不能融合,主要因为城市主干道对交通的阻隔程度较大。(2)区县边界两侧的连通域不能融合,烟草行业通常从区县层面出发统计分析数据,商圈划分模型同样应以区县为基础单位构建。
路网图像处理过程(图4-图9):(1)将路网RGB图像转为灰度图,对灰度图进行二值化处理。方法是分析图像灰度值分布范围,找到路网和背景的临界值,把小于临界值的数据替换成0,把大于临界值的数据替换成1。(2)将二值化后的城市主干道图层通过K3M算法进行处理,提取城市主干道骨架图。(3)将二值化处理后的城市主要街道路网图层叠加区县边界数据,导入商圈划分模型中,得到初始连通域。(4)叠加城市主干道骨架数据图层作为限定条件,对面积小的连通域进行融合处理,最终完成商圈的划分。
图4 路网灰度图
图5 城市主干道骨架
图9 商圈最终显示效果
2 烟草行业商圈体系应用
2.1 商圈与精准投放
近几年,烟草行业大力推进市场化取向改革,货源投放作为卷烟营销的核心组成部分,是维系零售户盈利水平及品牌健康发展的重要保障。因此,如何完善客户经营能力评价体系,构建面向市场的货源供应机制已经成为适应市场化取向改革的迫切要求。当前,货源投放采用的是V6模式,在该模式下,客户档位是评价零售户经营能力的最主要指标,由评测周期内零售客户的卷烟购进量、卷烟购进金额和自主品牌卷烟购进量三个维度进行加权评分后综合确定。货源管理员按照评定档位将卷烟货源分配至各档零售客户,同档位客户享受一致的货源分配策略。因此,现行投放模式虽然对客户经营能力进行了量化,确保货源分配有据可依,但由于档位评价维度较为粗放,且其中的购进量和购进金额指标具有较高的相关性,货源管理员难以通过客户档位细分零售户所面向的消费环境,制定各档位客户货源分配量时主要依据主观经验,容易造成部分规格低价销售和二次流通。
图6 区县边界数据
图7 初始连通域展示
图8 连通域融合处理
完善商圈字段后,可以采用档位+商圈的组合投放策略,通过对零售客户所在商圈消费环境和品规在各档位、各商圈的市场状态表现(上柜率、订足率、订单满足率等指标)进行分析,反复验证投放策略的精准性,动态调整投放策略。同时,研究基于销售、商圈、终端数据相似度的面向客户的品牌推荐,实现供应与需求、品牌与品牌、客户与客户状态相协调,提高精准投放水平。
2.2 基于商圈的GIS平台
随着信息化的不断深入,烟草系统积累了独有的丰富的烟草大数据,借助GIS技术能更形象地对这些数据进行可视化展示和数据挖掘分析。地理信息系统(Geographic Information System,简称GIS)是融合计算机图形和数据库于一体,用来存储和处理空间信息的高新技术。GIS作为一种空间信息输入、处理、存贮、管理、分析和输出的技术,其独有的空间分析功能和可视化表达功能,可以辅助进行各种管理决策。
GIS平台集成多维度大数据信息,分为四个可视化图层:地图层、商圈层、烟草数据层、非烟数据层。GIS的引入在精细化客户管理方面提供了一个直观的显示平台,如在电子地图上显示客户的分布,平台精准定位全市零售户的物理绝对位置,结合零售户销售信息和属性信息,图文并茂地实现对零售户多维度信息快速准确的展示和查询分析。以不同地图符号来表达客户的基本信息,客户的分类、销售状况、忠诚度、贡献度、生产经营状态等等都可以在地图上直观地反映出来。同时,对客户的统计信息如销售品牌的分布等,也可以在地图上以统计图的方式显示出来。在非烟数据层中,平台基于商圈位置关联主流房地产、旅游、交通、美食、生活服务网站的相关数据,可以建立覆盖全面、坐标相对精确、时效性好、属性内容丰富的商圈矢量数据,完善商圈画像并与烟草数据进行全方面对比。
GIS的优势主要体现在两个方面:一是建立在矢量化基础上的数据库,与系统中的相应程序模块可以建立一一对应关系,进而来分析现实中各对象之间的拓扑关系;二是基于可视化的终端使用设备,可以让操作简单化,使各种信息更生动地显示出来。
2.3 商圈与合理化布局
商圈饱和度反映的是商业供给和消费需求之间的动态关系。烟草行业商圈饱和度分析需从多维度出发,包括业态配比、交通状况、常住人口、旅游人口、商圈内商店关门情况、商圈内零售户盈利能力、商圈单位面积销售额、商圈内大户所占份额、商圈内零售户卷烟总购进金额和总营业面积的比值等。
在科学评价商圈的饱和情况后,明确商圈结构优化方向,进而可以促进烟草零售户合理化布局。对于处于失衡状态的商圈,应立足修正不良指标、优化良性指标,优化商圈业态结构、品牌结构、消费者结构,从多维度提升商圈的吸引力,促进商圈实现供求均衡状态。对于未饱和商圈,说明商业体量布局上仍存在潜力,可根据评价结果进行改善,引导更多零售户及业态入驻。对于商圈饱和程度高,甚至处于过饱和状态的,需要进行业态结构、商业空间布局的调整,同时加大宣传及交通等周边环境的改造,扩大客流量,让商圈从饱和状态向均衡状态发展。
3 结束语
随着行业高质量发展的不断深化,需要进一步明确高质量发展的内容,其中就包括零售户商圈字段的精准定义,商圈是零售户开展经营的环境基础,本文通过图像处理技术对城市路网进行分析,构建出了符合烟草行业高质量发展的商圈体系。
同一商圈内零售户的经营环境是相似的,商圈画像就是圈内零售户的市场画像,结合GIS和大数据技术将烟草营销数据在商圈层面进行展示,刻画多维度零售户市场画像。完善的市场画像能更好地统计出市场需求,以市场需求为出发点,发挥市场在行业资源配置中的作用,按需投放,达到精准投放的目的。商圈饱和度的分析能更好定义商圈内的经营竞争状态,根据状态做出针对性优化。