APP下载

基于城市大数据的城市数据画像构建

2019-08-23马超李纲

现代情报 2019年8期
关键词:城市竞争力用户画像

马超 李纲

关键词:三元世界;用户画像;城市竞争力;城市大数据;城市评价

随着工业化和城市化的快速发展,城市高速增长的人口、制造、交通导致了城市发展过程中的一系列问题,如人口过载、交通拥堵、环境破坏、失业问题和公共安全等“城市病”逐步凸显,而这只是城市化的副作用之一。政府在进行城市管理与调控的实施过程中面临的挑战也因此逐步复杂与艰巨。同时,自人类社会进入21世纪以来,在信息技术革命的推动下,以計算机、网络通信等信息通信技术逐渐融人日常生活中。同时以大数据、数据活化为代表的数据科学与技术开始受到人们的广泛关注,信息化建设逐步成为发展的重要环节。

与发达国家不同,极高的工业化与城市化水平为信息化建设提供了良好的基础与平台,而中国的信息化建设的发展路径则为信息化、城市化、工业化协同发展。这也为中国的城市管理者带来了更大的压力,寻求更加高效与科学的管理决策支持成为痛点。

随着数字中国建设的不断迈进,完善基础信息资源和重要领域信息资源建设的重要性,如何使大数据成为经济社会发展新的推动力成为科技领域关注的热点。而在城市化发展过程中,随着大数据和物联网的兴起,对于城市空间的认知已逐渐从原本的二元空间向三元空间转变.如图1所示,城市智能化发展成为趋势。因此,如何有效地利用大数据防治城市病,如何有效地利用大数据为政府提供城市管理所需要的建设性规划意见,为城市企业提供商业运营所需要的战略性决策支持,为城市居民提供更加便捷的生活服务.成为大数据应用和城市发展的重要结合点。

1城市数据画像的建设背景

1.1CPSS社会物理信息系统

CPSS(社会物理信息系统,Cyber-Physical-Social System)是在CPS(物理信息系统,Cyber-Physical System)的基础上发展而来,是由我国学者、中国科学院研究员王飞跃于2010年提出_3]。CPS分别代表了Cyber Space(信息空间)、Phvsi.cal Space(物理空间)和Society Space(社会空间),CPSS考虑了现实世界中社会和人的因素,是融合了物理空间、网络空间和社会空间的一个跨域系统。追本溯源,CPSS理论体现了奥地利哲学家波普尔“三元世界”的理念,即宇宙是由物理世界、精神世界以及观念世界3个相互作用的世界所构成。信息空间、物理空间、社会空间分别对应观念、物理、精神世界。3个空间相互作用和影响,并不是相互独立。

以CPSS为基础进行研究的主要目的,是将物理空间、社会空间中的元素或数据通过协同感知映射到信息空间,在信息空间进行信息集成与分析,以探求对物理空间和社会空间的反向导控路径。

1.2用户画像

交互设计之父Alan Cooper在1998年出版的《软件创新之路》中最早提出了用户画像这一概念。他认为用户画像是根据用户人口统计信息、社交关系、偏好习惯和消费行为等信息而抽象出来的标签化画像,是针对人的真实特征描绘,也是真实用户的综合原型。然而,早期用户画像并没有得到特别的关注,一方面是因为信息化程度有限,导致用户特征数据的获取难度较大;另一方面,企业营销方式较为传统,过多的进行用户的细化研究并不能为企业带来直接的利益。

随着大数据技术的深入研究与应用,以及企业的营销模式转型,企业的专注点日益聚焦于怎样利用大数据来为精准营销服务,进而深入挖掘潜在的商业价值。于是,“用户画像”的概念开始被再次研究。目前,关于用户画像的内涵和外延并没有广泛认可的权威定义,但有许多技术平台给出了用户画像的具体实施过程,对用户画像进行描述。构建用户画像的核心工作是对用户进行“标签化”处理。

从数据来源来说.这些标签中部分是可以直接获取的用户自身的属性数据,部分是通过一系列算法或规则挖掘获得。直接获得的数据一般都是用户的个人身份信息,例如电商平台要求用户上传的身份证、学生证、驾驶证、银行卡等,这样的数据准确性较高。通过算法和数据挖掘得到的标签则大多数来源于用户的行为,例如根据女性用户长期购买的生活产品,并结合其年龄等信息判定其是否为一个母亲,这样的数据实际意义更强。

从标签类型来说,一般而言.在构建用户画像实现过程中,目前主要包括用户的属性、用户流失和用户行为3类。用户属性特征主要针对用户的自然属性特征,如用户的年龄、性别、职业、学历、收入、籍贯等静态数据信息,如新浪微博用户画像中,主要从能力、兴趣、关系、亲密度和自然属性等角度进行刻画。

2城市数据画像的提出

2.1城市数据画像的设想

前文中提到,在用户画像构建过程中,数据可分为两大类。一类为直接获得的属性数据,一类为需要通过进一步进行数据挖掘或数据清洗的行为数据。以日常生活中的体检为例,我们需要测量身高、体重、视力等,这些数据往往是一个特定的数值,可以直接通过体检设备直接测量得出,这部分数据为感知数据。然而当我们检查心电图、脑电图时.直接通过体检设备得出的数据并不直观,需要对一段时间内的测量数据进行分析与观察,才能得出结论,这部分数据为认知数据。

感知数据与认知数据都有其特定范围内的价值。还是以体检为例,感知数据主要能够体现人的外在表征,我们可以直观地得出结论,如可以从身高、体重直接得出高矮、胖瘦等结论,因此感知数据多用于同类间横向比较。而认知数据主要体现人的内在状态,结论并不直观.需要通过分析与整合,最终得出结论,如从脉搏测量发现心率较快,要结合心电图检查观察心跳的变化情况,最终得出是否存在问题,因此认知数据多用于本身状态的描述。

将感知数据与认知数据的感念映射到城市层面,来进行城市数据画像的研究。结合前文中提到的城市大数据的分类,也可以对城市大数据进行感知数据和认知数据的分类.这与用户画像十分类似.其中感知数据反映城市的基本特征,而认知数据反映城市的运行状态。

城市数据画像是用户画像应用在城市层面的拓展,是借鉴大数据环境中用户画像思想应用在城市研究中的一种探索。用户画像的最终目的,是对目标用户进行潜在行为的分析,以此进行精准地服务与营销预测,而城市数据画像的最终目的,则需要考虑城市最主要的3种主体类型:城市管理者、城市企业以及城市居民,这样才能使最终得到的数据画像更加具有现实意义。

因此,城市数据画像是将城市发展过程中所包含的物理世界和人类社会所形成的大数据资源,通过信息组织与融合,在信息空间进行映射,结合综合标准与指标体系,进行分面建模,最终通过可视化等综合技术展现的一种技术建构。

2.2城市数据画像的目的

对城市进行数据画像的主要目的,是将城市发展过程中所形成的大数据资源通过可视化等综合技术展现给用户,保障城市运行安全平稳有序,提高城市突发事件快速反应能力.提升政府管理科学决策水平,提供方便快捷的用户服务,促进城市产业可持续发展。它的目标是通过大数据的支撑,在科学规划、实时监控、公众参与、社会监督和客观评价这些过程中,使城市的各方面都有更合理的规划依据;通过物联网、大数据以及互联网+的概念与技术,保证城市的管理人员能够把握城市的运行状态;依托准确的信息,实现精准治理,提出城市发展问题的智能解决方案和考核机制:通过城市数据画像的高效服务,向市民提供方便、精准和快捷的服务。

总结来说,就是面向政府的管理规划,面向企业决策支持,面向民众的便捷生活。例如,对于在政府的突发事件的处理管理.城市数据画像要能够做到时间上的多频次、空间上的多区域同步显示,综合利用视频监控、传感器协同、视频分析以及事件检测实现有效控制;对于企业的销售点的布局,城市数据画像要能够做到地理数据与自体经营数据、经营环境数据、人流分布数据的系统分析,综合利用实时反馈的商业流数据,为企业的决策做出直接建议和支持;对于城市居民的出行计划,城市数据画像通过实时动态的交通流检测与历史数据分析、道路特点分析,能够为居民直接提供出行计划建议。

3城市数据画像的构建

以城市大数据分类整合、城市智慧数据集成,城市分面数据模型构建、城市分面数据画像分类实现的路径进行城市数据画像体系的构建。

3.1城市大数据分类整合

城市大数据是由城市政府、公共机构、企业和个人,采用新一代的信息技术,收集与组织的来自于城市设施、组织以及个人的大量动态和静态的主体和客体数据。

城市大数据描述了城市中多样元素的实时状态,包括建筑、街道、管道、环境、企业、金融、贸易、产业、市场、文化、教育、交通、公共秩序等。因为数据量大、涵盖面广,在进行城市大数据研究过程中.往往对城市大数据从城市功能供给侧、市政服务需求侧以及城市大数据产生原因进行分类。

有学者将城市大数据分为城市传感数据、用户生成数据、政府管理数据、私人单元数据、媒体资料数据以及混合关联数据六大类,并列举了样例和数据用户群,如表1所示,以此为基础,进行城市数据画像数据集的数据采集与初步分类.形成统一格式,可供数据分析与挖掘的数据仓库。

城市大数据来自交换和整合众多的城市物理空间和人类社会空间中产生的数据,利用这些数据,可以用来判断各种设施的运行状况、工业和经济的发展趋势,以及城市居民健康、教育、科技和文化之间各种复杂的关系。因此,城市大数据不仅为理解整个城市提供了基本信息,而且在促进城市智能方面发挥着核心作用。

3.2城市智慧数据集成

智慧城市和城市大数据的提出为城市病的治理提供了一个富有潜力的新平台和多样化的方案。其中智慧城市提供蓝图与指导,而结合大数据处理技术,可以完成以下两部分工作。第一,将城市物理空间中的客体,如建筑、道路、车辆、城市管网等,进行数据化描述与感知;第二,将城市社会空间中的城市居民的社会行为,如行政管理、社交网络等,进行数据化提取与认知。两者在信息空间进行融合,构成城市大数据。李国杰认为,根据蜜蜂的价值,大数据所扮演的角色类似于“蜜蜂模型(H0neybee M0del)”,即蜜蜂通过采蜜的行为带来的对农业产量提升的价值,远远大于她所产生的蜂蜜的价值。和城市中所有其他人力资源和物质资源一样.城市大数据已经成为在城市智能化发展和政策导向方面重要的战略资源。

而对于数量庞大、来源广泛的城市大数据,除了进行数据分类整合等常规数据处理方法外,我们还需要对数据进行“智慧化”处理。城市数据画像的目的是进行城市基本特征和运行状态的可视化展现,最终对城市进行评价,需要标准体系与评价体系的支撑。通常采用智慧城市标准体系与城市竞争力评价体系作为参考.以此来将城市大数据整合为具有深层意义的城市智慧数据。

智慧城市是城市数据画像提出的重要理论基础之一,同时也对城市智慧数据集成提供蓝图与指导作用。自2012年以来,智慧城市成为主要国际标准化组织的热点工作。国家标准委于2014年1月正式印发《关于成立国家智慧城市标准化协调推进组、总体组和专家咨询组的通知》,加速推进了我国智慧城市标准化建设工作,并推出了完备的智慧城市标准体系,包含总体、支撑技术与平台、基础设施、建设与宜居、管理与服务、产业与经济、安全与保障7个维度。

城市竞争力是在社会环境、经济结构、价值体系、文化产业、管理制度等多个因素综合作用下创造和维持的。城市竞争力评价研究由來已久,这些研究成果最终多以城市排行榜体现。各类评价体系的设定主体主要包括政府部门、学术团队、媒体和企业等。

关于城市竞争力的研究.应该综合考虑各种因素对城市竞争力的影响,重点关注经济发展水平、科技创新能力、对外开放水平和经济结构等因素。湖南大学的李琳等从创新的视角提出了城市竞争力评价的指标体系。上海交通大学的刘新静等研究人员则从人口、经济、生活质量、文化和智慧化等5个一级指标出发,通过15个二级指标和38个三级指标构建了中国大都市城市竞争力评价体系,并利用《中国城市统计年鉴》和《中国城市年鉴》以及各个城市的统计年鉴和政府统计公报作为基础数据源进行了实证研究。

结合城市竞争力的相关研究以及智慧城市评价体系,对城市数据画像的内容范围进行了限定,在此基础上进行城市分面模型的构建。

3.3城市数据分面模型构建

综合上述研究,将城市数据画像从基础环境建设、经济产业状况、社会公共服务、城市创新能力4个方面.进行城市数据画像的模型构建,并按照4个角度,对分面进行细分,如图2所示:

基础环境建设:基础环境建设分面主要内容是对城市的基础设施、居住环境、交通设施等进行刻画,具体包括人居环境、地产环境、交通环境和自然环境。

社会公共服务:社会公共服务分面主要内容是对城市的基本社会职能以及基础服务体系进行刻画,具体包括教育状况、卫生医疗水平、文化艺术产业和政府公共服务水平。

经济产业状况:经济产业状况分面主要内容是对城市的基本经济状况、消费以及产业结构等进行刻画,具体包括基础经济水平、居民收入状况、居民消费支出水平和城市产业结构。

城市创新能力:城市创新能力分面主要内容是对城市的科技资源、创新创业水平以及信息化建设水平进行刻画,具体包括科技资源占比、创新产业水平、创业环境以及信息化程度。

以上4个分面基本覆盖了所有城市活动,同时围绕城市管理者、城市居民和城市产业为核心的城市主体建立观测点.是我们进行城市数据画像实际应用的基础。

3.4城市数据画像实现模式

城市数据画像可视化实现阶段,基于城市数据画像分面模型,选取合适的、直观的、有意义的方式进行可视化展示。

前文中提到,我们需要通过感知数据来描述特征与比较差异,通过认知数据来观察状态变化与异常发现。映射到城市层面,我们需要从时空视角对城市数据画像进行分类。

从地理结构上来说,一座城市可以近似看作一个基于经纬度坐标系的二维空间,通过城市内部各种层次的传感器,我们可以依据不同的传感数据,绘制出城市的二维特征图,如常见的区域热力图、监控分布图等,可以理解为一种城市数据视图。结合前文中城市数据画像的分面建模中设计的观测点,将城市数据视图进行叠加与处理,就形成了一种最基础的静态城市数据画像应用。

而当我们考虑时间因素时,来自于城市传感器的城市数据就可以看作对于二维城市空间的动态特性所进行的时间采样,最终形成的画像是连续变化的.可以看作是城市数据视图在时间维度上的连续函数,如图3所示,一段时间内静态画像的叠加,可以形成类似于动图形式的动态画像。

因此,根据城市数据画像的时间维度的不同,可以将城市数据画像分为静态画像和动态画像。静态画像的表现形式可以通俗的理解为一张基于数据可视化呈现的“位图”,而动态画像则可以理解为包含了多张静态图像的“动图”。静态画像是静态描绘城市的基本特征,围绕感知数据,用于城市间风格差异和特点比较,而动态画像是描述城市的变化规律,围绕认知数据.用于城市内变化观察和问题探究。

4城市数据画像的应用

4.1城市数据画像的3种应用模式

结合前文中所提到的城市数据画像所面向的对象为政府管理规划、企业决策支持、民众生活服务,因此城市数据画像应包含3种应用模式。

面向政府管理规划:面向政府管理规划的城市数据画像能够反映城市发展过程中的问题,如城市基础设施是否能够满足城市发展要求,现有路网建设水平是否达到饱和,如何进行高峰期交通分流及进行高峰预警等。

面向企业决策支持:面向企业决策支持的城市数据画像能够反映城市的综合社会属性,包括人居环境、经济发展水平、产能结构分布等,根据综合变化,为企业决策提供最为合理的决策支持。

面向民众生活服务:面向民众生活服务的城市数据画像能够反映城市的生活便利程度,如商业区和居民区的分布是否合理、居民出行交通是否便利等。

4.2以城市交通为例的城市数据画像应用

以构建城市数据画像之交通画像为例.城市数据画像应用如下:

首先,需要对交通大数据进行数据采集与分类。根据数据的来源及采集方式,可将数据分为车辆数据、道路数据、人居数据三大类。其中,车辆数据主要来源于用户生成数据,包含车辆类型、车辆参数等基础数据,以及行驶里程、行驶轨迹等运行数据。道路数据主要来源于基建传感数据,主要包含路网密度、公路里程数、交通设施密度等基础数据,以及高峰路段、潮汐现象路段、拥堵路段时段等运行数据。人居数据主要来源于政府管理数据和企业私人单元数据,主要包含性别、年龄、住宅、车辆等基础数据,以及出行时間、路程时间、通行方式等运行数据。

对数据进行分类整合后,结合城市交通相关的评价体系(如城市道路交通运行状况评价体系,城市综合交通建设评价体系.城市路网建设评价体系等)与标准体系(如道路运输标准体系,城市客运标准体系,公路交通工程设施建设标准体系等),以此为基础进行有效字段筛选,确定数据结构类型,形成交通画像数据集,构建分面模型。

根据反映城市交通状况的字段类型,进行时空维度分解,最终形成交通静态数据画像(如城市路网密度图,城市交通监控分布图,城市交通数据报告等)和交通动态数据画像(如城市交通流量图,拥堵路口通行状况展示,城市交通热力图等)进行展示,如图4所示。

5研究展望

面对信息时代城市化进程中复杂的城市病,智慧城市与城市智能化是实现城市可持续发展的关键路径。随着面向城市的地球空间信息学与物联网、云计算等技术持续发展,城市中的自然现象、人类活动与社会动态的观测能力不断提升,信息资源研究者获得了大量的城市信息。城市大数据已经成为城市问题研究与城市科学治理的重要战略资源。城市数据画像的相关研究是城市信息学的一种直观的、可视化的应用模式,以构建可持续发展的智慧城市为导向,对发现城市问题,优化城市管理,具有很高的研究价值与现实意义。

猜你喜欢

城市竞争力用户画像
宁波与长三角洲主要城市综合竞争力比较研究