APP下载

基于出租车GPS轨迹和POI数据的商业选址推荐

2020-04-02冯慧芳杨振娟

计算机与现代化 2020年2期
关键词:兰州市商圈出租车

贾 冲,冯慧芳,杨振娟

(西北师范大学数学与统计学院,甘肃 兰州 730070)

0 引 言

商业选址对企业的重要性不言而喻,它不仅是影响企业效益的关键因素,而且直接关系企业的生存立足和长远发展。故商业选址成为了制定企业经营目标和经营策略的重要依据之一。企业进行商业选址考虑的因素主要包括交通情况、客流规律和客流量、周边商业环境、地形特征及城市规划要求等。古人常说“天时地利人和”是商业选址的首要原则。

传统的商业选址多依靠实地调查研究数据和经济统计分析数据,这种方法无法快速准确地获取预选位置的各类边界信息[1]。而移动互联网时代的日益深化和多源时空大数据的急速增长,为基于大数据的城市商业中心识别和商业选址提供了新的方法和思路。如今多源大数据已成为新时代的商业选址利器,不仅能够节省调研时间,而且可以使分析结果更加全面、精确,并能为商业选址提供更为科学的决策依据。

基于多源时空数据挖掘的研究是目前国内外城市大数据研究的热点之一。常用的多源城市大数据主要包括地图、兴趣点(Point of Interest, POI)数据、GPS(Global Positioning System)数据、客流数据、手机数据、位置服务(Location Based Services, LBS)数据、视频监控数据和环境与气象数据等[2-3]。文献[4]基于POI数据,应用设计科学研究方法提出一种考虑用户身体和心理因素的旅游推荐系统。任星怡等人[5]基于位置的社交网络的用户签到行为,提出了一种联合概率生成模型来模拟用户的签到行为,进而进行兴趣点的推荐,并用真实的大规模数据集验证了模型的效果和效率。通勤是城市生活的重要组成部分,文献[6]利用POI来估计人们的工作地点,并利用重力模型来研究上海市中心的区域间通勤特征,主要包括出行时空特征、区域之间的连通性、通勤距离等。文献[7]以零售业POI大数据为基础,应用核密度估计方法和空间自相关理论分别研究了沈阳市零售商业中心规模分布特征和零售业热点街区。文献[8]运用POI数据并结合地貌特征和文本信息融合方法,对城市各个层次的功能进行挖掘,建立功能区的评价指标,识别并分析城市的功能区分布情况。

出租车已成为城市交通系统中的重要组成部分,其运行状态、网络结构和活动空间分布对于揭示城市出行活动规律具有重要意义。出租车GPS数据具有分布范围广、精度高及实时性强等特点,被广泛应用于智能交通计算、城市计算、城市规划等领域。文献[9]根据出租车GPS数据建立了能够刻画出行需求、速度和出行线路方向等特征的城市移动模型,应用该模型可预测城区道路交通能力。陈世莉等人[10]结合广州市浮动车辆GPS数据提出了一种基于语义信息的城市功能区识别方法,可识别出城市不同类型的功能区,从一个新的视角揭示城市功能区的形成及其机制。付鑫等人[11]通过对西安市出租车轨迹网络结构复杂性与空间分异特征的研究,揭示了城市居民活动的空间特征、活动规律及其与城市功能空间布局之间的相互影响作用。也有一些研究者结合出租车GPS和POI进行数据挖掘研究,比如刘菊等人[12]基于多维数据的张量模型从时间尺度对出租车的上下车数据进行时空模式挖掘。并结合兴趣点信息,识别出租车用户出行特征。罗孝羚等人[13]从出行特征及乘客下车点所属的POI点类型2个方面,用决策树模型来确定乘客的出行目的。Kong等人[14]通过融合兴趣点和车辆轨迹进而对充电桩选址进行建模。Meng等人[15]通过GPS轨迹数据、POIS和社交媒体的地理标签等来对旅行目的地进行推断。文献[16]利用GPS、土地利用和POI数据建立了短期旅行行为的预测模型,并用真实数据验证了预测模型的有效性。文献[17]结合GPS和POI数据,探讨了城市出租车的客流特征及影响上下车点的各种因素。

目前,已经有一些研究人员开始尝试进行基于大数据的商业选址方面的研究。文献[18-19]借助用户的签到数据和社交网络,根据地理位置特征和用户移动特征建立商铺选址模型。出租车GPS数据和城市POI数据具有空间坐标和各种属性,且具有样本量大、时空粒度精细等特点,是时空大数据在城市空间结构、人类移动规律等研究中的重要数据源。本文将结合出租车GPS数据和城市POI数据,通过分析城市居民移动规律和城市POI分布特征,尝试提出一种新的城市商业选址的推荐算法,为商业选址决策提供快速有效的定量分析方法和科学指导

1 基础数据及预处理

1.1 POI的说明与分类

POI是指所有可用点要素来指代的研究对象,一个POI可以是一个餐厅、一个景点、一个车站等。POI一般由名称和坐标构成,对其进行分类后,POI信息又包含了类别(大)和分类(小)等信息。本文所用到的POI数据是在2016年11月利用爬虫技术从电子地图上获取的,兰州的POI数据共有9类,如表1所示。最终整理得到121103条记录,各类兴趣点分布如图1所示。从图1可知,兰州市POI中生活购物类、餐饮类等所占的比例较大,金融类、交通站点等所占的比例较小,这与事实情况也是相符的。

表1 POI的分类

POI类别POI分类金融类银行,ATM,保险公司,证券交易所休闲娱乐电影院,剧院,健身房,KTV,游乐场,网吧餐饮类中餐厅,西餐厅,快餐厅,酒吧,冷饮店,咖啡馆,茶艺室生活购物类超市,杂货店,专卖店,理发店,书店,服装店,药房,农贸市场,建材家居交通站点火车站,汽车站,机场,公交车站,地铁站单位企业市镇单位,公司企业,学校,医院公共设施公园广场,博物馆,图书馆,科技馆,景点,桥,寺院,教堂,地标,路口,公共设备住宿类酒店,宾馆,招待所,公寓,小区生活服务类水、电、煤气、暖气缴费网点,移动、联通、电信营业厅,医疗保险服务,汽修厂

图1 兰州市兴趣点的分类统计

1.2 出租车GPS数据预处理及地图匹配

本文采用的兰州市出租车GPS轨迹包含车辆ID、经度、纬度、瞬时速度、记录时间、车辆载客信息,车辆载客信息用“0”和“1”分别表示出租车空载和重载状态。轨迹点采样时间间隔为10~30 s。由于终端设备故障、传输故障等原因,使得直接采集的GPS数据有少量轨迹是不完整和不一致的,因此,需要对GPS数据进行预处理。本文通过MNTG(Minnesota Traffic Generator)[20]获取兰州市城区路网拓扑信息,采用几何特性的方法对出租车轨迹数据进行路网拓扑匹配,从而清理原始GPS数据中的离群点、缺失值、冗余值等。图2为兰州市区部分路网拓扑和一辆车部分GPS轨迹示意图,其中线表示路网,黑色点为出租车轨迹点。从图2可见,出租车轨迹与路网的匹配度很好。

图2 出租车轨迹数据与路网拓扑匹配

2 商业选址推荐模型构建

2.1 交通小区划分

2.2 OD矩阵生成

OD(Origin-Destination)矩阵是衡量以交通小区为单位的城市交通出行量分布特征的矩阵。OD矩阵的行坐标表示出行起始点的交通小区编号,列坐标表示出行终点的交通小区编号。记OD=(odij)N×N,其中odij表示从交通小区i上车到交通小区j下车的出行量,odji表示从交通小区j上车到交通小区i下车的出行量,故OD矩阵为非对称矩阵,且odii=0。

设出租车轨迹中每个上和下车点位置构成一个有序点对[(lonpick-up,latpick-up), (londrop-off,latdrop-off)],每一个点对表示出租车完成一次服务。如果上车点位置在交通小区i内,下车点位置在交通小区j内,即:

ilon-min≤lonpick-up≤ilon-max,ilat-min≤latpick-up≤ilat-max

jlon-min≤londrop-off≤jlon-max,jlat-min≤latdrop-off≤jlat-max

则交通小区i到交通小区j的出行量递加1,遍历所有有序对,就可计算任意2个交通小区之间的出行量,最终得到OD矩阵。

2.3 商业选址推荐算法

结合出租车GPS数据和城市POI数据,提出一种新的城市商业选址的推荐算法,该算法既考虑了每个交通小区中兴趣点特征,又考虑了交通小区之间的客流量。算法具体步骤如下:

Step1划分交通小区,结合出租车GPS数据计算OD矩阵。

Step6令F=(E1,E2,…,EK),求矩阵F的每行的最小值,并确定最小值所在的行和列,分别记为i,k,那么i,k表示交通小区i对第k类兴趣点的需求程度最大,因此,该交通小区可以规划建设包含这类兴趣点的商业活动,即推荐该交通小区为开设包含第k类兴趣点的商业活动的候选地址。

3 实验结果及分析

3.1 研究区域

本文研究对象为兰州市城区区域,包括城关区、七里河区、安宁区和西固区,如1.2节图2所示。首先以500 m长度和宽度的空间尺度,建立兰州市城市交通小区。由于兰州城市结构两山相夹、带状分布、组团布局,市区东西狭长约为35 km,南北狭窄约为2~10 km,南北群山对峙,东西黄河穿城而过,城市形态属于一种不紧凑的带状结构,典型的两山夹一河的河谷型城市。由于一些POI分布面积比较大,所以划分交通小区时长度L和宽度W的取值不应太小,另外,为了尽可能地避免一次出行活动的起讫点发生在同一个交通小区内,L和W的取值不能太大,本文选取L=W=500 m。按照2.1节中的方法划分交通小区后,所得到的网格单元总共有1769个,有许多交通小区为山区,故剔除落入山区的交通小区,只保留有城市路网覆盖的交通小区,最终得到的有效交通小区为757个。

3.2 POI分布特征分析

统计每个交通小区的POI总数和每个交通小区不同类别的POI个数。图3给出了兰州市区兴趣点的总体空间分布情况。从图3可知,与其他城区相比,城关区是POI密度比较大的区域。兰州市的核心商业区主要包括了城关区的西关商圈、南关商圈、东方红广场商圈、铁路局商圈和五里铺商圈,七里河区的西站商圈和小西湖商圈,安宁区的金牛街商圈,西固区的西固路商圈等。对每一类POI的分布密度分析可知每个城区的主要商圈内涵盖大量的休闲娱乐、餐饮类、生活购物类、住宿类等类型的兴趣点。与其他城区的商圈相比较,位于城关区的西关商圈、南关商圈、东方红广场商圈也包含了大量的公司企业。

图3 兰州市POI的总体分布情况

3.3 商业选址推荐

如果交通小区对住宿类、生活购物类、餐饮类或休闲娱乐等某个POI的需求程度最大,意味着该小区存在该类型POI的商机,那么交通小区就可作为其商业地址候选区域。图4给出了兰州市商业选址推荐图。例如,在安宁区莫高大道附近,北起刘沙公里南止建宁西路连续的4个交通小区,北滨河西路西起通达街东止宝石花路长约为1.7 km的交通小区,这些都对住宿类的需求最大。七里河区的南滨河路西起吴家园西路东止小西湖东街长约2.2 km,占地面积约1.75平方公里的小区对住宿类的需求最大,那么可以考虑在这里开设或经营宾馆、酒店等。城关区南环路和白银路交叉的区域内也推荐住宿类商业经营。从图4可知,生活购物类的商业选址推荐的最多,在每个城区都占最大的比例。以安宁区为例,兰州市安宁区大中专院校集中,区内有西北师范大学、兰州交通大学、甘肃农业大学等17所大中专院校,有省农科院等2所科研机构,有长风集团公司、兰州飞控仪器总厂等国有大中型企业21家。占地面积约80平方公里的区域内没有一家大型综合购物中心,只有几家生活超市。因此,将该区域推荐为生活购物类商业选址区域是合理的。从城关区的分布上来看,兰州市东部市场附近区域生活购物类商场分布比较密集,包括东部综合批发市场、兰新市场、王府井购物中心等,故该区域不再是生活购物类商业推荐的范围。南山路和白银路中间的区域内可推荐为生活购物类商业选址。

图4 基于交通小区的商业选址推荐

雁滩位于兰州城关区东北部,是国家级兰州高新技术开发区核心区所在地,主要布置新材料、生物工程与新医药、航天科技与电子信息等高新技术产业的管理、研发、公共服务。雁滩板块正在大力建设、发展中,且该区域人口密集,与其他类型的商业选址推荐相比较,该区域最适合作为餐饮类服务的商业地址推荐。另外,在七里河区马滩和金港城附近的区域,餐饮服务比较少,该区域也是餐饮类商业选址的候选区域。从图4可知,整个兰州市区休闲娱乐的商业推荐小区只有10个,这说明了休闲娱乐服务基本饱和,这与实际情况相符。棋牌室、KTV、网吧、养生馆等遍布了兰州市的大街小巷。

3.4 公共服务类选址推荐

随着社会经济的发展,城市居民对城市公共服务设施的需求和要求越来越大,城市公共服务设施空间布局问题受到了广泛的关注。本文中涉及社会公共服务的POI包括了生活服务类、交通站点、公共设施和金融类等,根据文中的推荐算法,可以为公共服务设施空间布局规划提供一种策略。图5为兰州市城市公共服务类推荐地址分布图。城关区的核心区域公共设施是相当完善的,所以在城关区的核心区域内公共设施的推荐也是很少的。城关区的东部区域公共设施和交通站点比较少,应该推荐在该区域内增加这类公共服务。西固区的西部区域比较偏远,该区域也应该增加公共设施类的服务,以方便居民生活。安宁区需要增加公共设施和交通站点的规划设计,七里河区晏家坪、兰州理工大学附近区域推荐增加公共设施的布局。

图5 基于交通小区的社会公共服务选址推荐

4 结束语

城市出租车GPS轨迹和POI数据蕴含着大量居民出行规律、城市功能识别、城市交通运行状态等时空语义信息,是城市计算的主要数据来源之一。本文以出租车GPS轨迹和POI数据为依托,以兰州市城区为研究对象,将兰州市城区区域划分为500 m×500 m的交通小区,采用历时一周的出租车GPS轨迹构建OD矩阵,揭示不同交通小区之间出租车用户出行特征,结合城市POI在交通小区中分布特征和蕴含的语义信息,提出了基于交通流量特征和POI数据相结合的商业地址推荐算法,并将推荐结果在交通分析小区尺度上进行可视化呈现。实验结果表明,该推荐算法不仅能够快速有效地推荐合理的商业选址,同时能够为城市公共服务设施空间布局规划提供决策依据,从而实现对兰州市基础设施的空间布局规划。

本文实证分析了出租车GPS轨迹和POI数据的商业选址的可行性。但仍有选址因素没有考虑,比如每个交通小区的人口、竞争性、相关性等。另外,本文提供的商业选址不太精细,下一步不仅要考虑利用选址因素的多样性,还要借用公交车GPS数据、居民出行刷卡记录、手机数据、基于位置服务LBS数据等城市大数据,期望提出更加精准的商业选址算法与策略。

猜你喜欢

兰州市商圈出租车
打造世界级文旅窗口 构建千亿级黄金商圈
机器学习在商圈运用管理中的应用
乘坐出租车
阳光少年的飞驰年华——兰州市第四十六中学轮滑社团活动掠影
《兰州市公共场所控制吸烟条例》实施效果分析
兰州市艺彩少儿美术作品选登
凭什么
农产品电商圈的“乌托邦”
开往春天的深夜出租车
李书福炮轰出租车