智慧城市的“血脉”:数据智能化
2014-05-08居亚凯邵一骏
居亚凯++邵一骏
摘 要:智慧城市是未来城市的发展方向,建设过程中需整合、挖掘和利用各类数据,通过计算机技术中的数据挖掘技术,对城市的经济社会发展统计数据进行智能化处理,为政府的智慧城市建设提供决策参考。
关键词:智慧城市;数据;智能化
IBM提出“智慧的地球”概念,指出地球上几乎任何东西都可以实现数字化和互联,进而向整个社会提供更加智能化的服务。随后在“智慧的地球”概念基础上,IBM正式提出“智慧城市”愿景,其具备四大特征:全面透彻的感知、宽带泛在的互联、智能融合的应用以及以人为本的可持续创新。
智慧城市是未来的城市的发展方向,当我们把智慧城市比喻成一个巨人时,为这个巨人全身提供氧气、输送营养的血脉是大量的数据及整合、处理这些数据的智能化数据库。因此,如何构建这套智能化数据库,是智慧城市建设的重中之重。
一、数据背后的故事
“房屋租赁价格指数超过100,与人口流动指数超过100是否有关联?”“固定资产投资连续3年增长,是否与人口增长、财政收入增长和出口额下降有关联?”……经济社会发展统计数据背后隐含着丰富的、对决策咨询有重要意义的规律。
一方面,经济社会发展统计数据库能为各级党委和政府管理、决策提供基础数据支持,为各部门实现信息资源共享提供切实保障,如今各省、市、区级统计局基本建成了统计信息系统,基于不同的应用和数据库平台,基本实现了统计数据的网上直报、查询和下载等功能;另一方面,现有的统计系统中,录入、查询和统计作为普遍的功能,而对于存在着若干的规则与联系的大量数据缺乏利用,实质上这些规律背后蕴含着关键的发展趋势,为决策提供重要参考。
因此,将数据“智能化”从而适用于智慧城市应用体系,是有现实和长远意义的。
二、智能化的手段
要实现数据智能化,必须运用计算机领域的相关技术,依托数据库方面的决策支持技术,通过数据采集、模型构建、数据分析和方案设计等人机交互程序,为决策支持提供支撑[1]。
以某市智慧城市建设的数据库为例,分析智能化数据库的需求,在系统用例图和基于J2EE平台的系统架构设计基础上,对系统的功能、数据仓库和相关接口进行设计,并对内嵌的查询算法——FP-Growth算法进行编制,为开发“经济社会发展统计智能化数据库”提供设计框架。
该系统不仅实现登录、查询、录入等功能,最重要的是利用数据挖掘技术,从各类数据中挖掘出具有决策参考价值的数据集,比如“人口增长、财政增收”、“房地产投资减速、出口额增长”等有关联的数据集,为智慧城市建设提供参考。
三、智能化的设计思路
据了解,现有的经济社会发展统计数据库在分析数据、辅助决策等功能上尚存在缺憾,而在引进智能化数据库的相关技术后,对原有查询、录入的数据进行抽取、过滤和装载,形成数据仓库,利用相关数据挖掘技术,生成有参考作用的一系列数据项,形成一套智能化数据库系统。
图1 数据智能化的流程图
四、智能化的应用
在了解了设计思路和核心算法之后,如何实现数据智能化是关键,在下图(图1)中演示了实现关联规则挖掘的流程,也就是实现数据智能化的流程。
从流程图里可以对FP-Growth算法挖掘模块的使用过程进行了解,此模块的相关设计有以下几个考虑:1、有专供用户登录的数据挖掘主界面;2、有分别用以填写最小支持度和设置目标范围的统计数据下限值的输入框;3、有一段程序代码,用以按设置的下限值调用数据库中已有数据;4、有一段FP-Growth算法的程序代码;5、有一个页面,用以显示关联规则挖掘结果。
在关联规则挖掘模块中,有两个关键流程:设置最小支持度、设置经济社会统计数据下限。其中设置数据下限是关键步骤,是对符合条件的频繁项进行进一步删选,删除下限以下的频繁项数据类,剩下的数据类用以构建FP-Tree的项,最终挖掘出的频繁项集是具有决策参考意义的:在某数据值(如市级财政收入800亿元、区县级人均收入18000元和区县级新增企业数300家)以上的数据是有关联性的,可以同时选择。
五、结束语
数据智能化是一个逐步完善、长期坚持的过程,期间要经历数据共享规整、用户需求完善、系统效率提升等必要步骤。同时一旦智能化数据库设计、开发成功,随即而来的是统计数据的归口统一,这要求事先要理顺机制体制,将分散在全市各部门的数据进行规范统一上报。
[参考文献]
[1]史忠植 知识发现 北京:清华大学出版社 2002.
[2](加)J·Han,M·Kamber著,范明、孟小峰等译 数据挖掘概念与技术(Data Mining Concepts and Techniques) 北京:机械工业出版社 2004 29-36.
本文得到宁波大学科研基金的资助,特此致谢!
摘 要:智慧城市是未来城市的发展方向,建设过程中需整合、挖掘和利用各类数据,通过计算机技术中的数据挖掘技术,对城市的经济社会发展统计数据进行智能化处理,为政府的智慧城市建设提供决策参考。
关键词:智慧城市;数据;智能化
IBM提出“智慧的地球”概念,指出地球上几乎任何东西都可以实现数字化和互联,进而向整个社会提供更加智能化的服务。随后在“智慧的地球”概念基础上,IBM正式提出“智慧城市”愿景,其具备四大特征:全面透彻的感知、宽带泛在的互联、智能融合的应用以及以人为本的可持续创新。
智慧城市是未来的城市的发展方向,当我们把智慧城市比喻成一个巨人时,为这个巨人全身提供氧气、输送营养的血脉是大量的数据及整合、处理这些数据的智能化数据库。因此,如何构建这套智能化数据库,是智慧城市建设的重中之重。
一、数据背后的故事
“房屋租赁价格指数超过100,与人口流动指数超过100是否有关联?”“固定资产投资连续3年增长,是否与人口增长、财政收入增长和出口额下降有关联?”……经济社会发展统计数据背后隐含着丰富的、对决策咨询有重要意义的规律。
一方面,经济社会发展统计数据库能为各级党委和政府管理、决策提供基础数据支持,为各部门实现信息资源共享提供切实保障,如今各省、市、区级统计局基本建成了统计信息系统,基于不同的应用和数据库平台,基本实现了统计数据的网上直报、查询和下载等功能;另一方面,现有的统计系统中,录入、查询和统计作为普遍的功能,而对于存在着若干的规则与联系的大量数据缺乏利用,实质上这些规律背后蕴含着关键的发展趋势,为决策提供重要参考。
因此,将数据“智能化”从而适用于智慧城市应用体系,是有现实和长远意义的。
二、智能化的手段
要实现数据智能化,必须运用计算机领域的相关技术,依托数据库方面的决策支持技术,通过数据采集、模型构建、数据分析和方案设计等人机交互程序,为决策支持提供支撑[1]。
以某市智慧城市建设的数据库为例,分析智能化数据库的需求,在系统用例图和基于J2EE平台的系统架构设计基础上,对系统的功能、数据仓库和相关接口进行设计,并对内嵌的查询算法——FP-Growth算法进行编制,为开发“经济社会发展统计智能化数据库”提供设计框架。
该系统不仅实现登录、查询、录入等功能,最重要的是利用数据挖掘技术,从各类数据中挖掘出具有决策参考价值的数据集,比如“人口增长、财政增收”、“房地产投资减速、出口额增长”等有关联的数据集,为智慧城市建设提供参考。
三、智能化的设计思路
据了解,现有的经济社会发展统计数据库在分析数据、辅助决策等功能上尚存在缺憾,而在引进智能化数据库的相关技术后,对原有查询、录入的数据进行抽取、过滤和装载,形成数据仓库,利用相关数据挖掘技术,生成有参考作用的一系列数据项,形成一套智能化数据库系统。
图1 数据智能化的流程图
四、智能化的应用
在了解了设计思路和核心算法之后,如何实现数据智能化是关键,在下图(图1)中演示了实现关联规则挖掘的流程,也就是实现数据智能化的流程。
从流程图里可以对FP-Growth算法挖掘模块的使用过程进行了解,此模块的相关设计有以下几个考虑:1、有专供用户登录的数据挖掘主界面;2、有分别用以填写最小支持度和设置目标范围的统计数据下限值的输入框;3、有一段程序代码,用以按设置的下限值调用数据库中已有数据;4、有一段FP-Growth算法的程序代码;5、有一个页面,用以显示关联规则挖掘结果。
在关联规则挖掘模块中,有两个关键流程:设置最小支持度、设置经济社会统计数据下限。其中设置数据下限是关键步骤,是对符合条件的频繁项进行进一步删选,删除下限以下的频繁项数据类,剩下的数据类用以构建FP-Tree的项,最终挖掘出的频繁项集是具有决策参考意义的:在某数据值(如市级财政收入800亿元、区县级人均收入18000元和区县级新增企业数300家)以上的数据是有关联性的,可以同时选择。
五、结束语
数据智能化是一个逐步完善、长期坚持的过程,期间要经历数据共享规整、用户需求完善、系统效率提升等必要步骤。同时一旦智能化数据库设计、开发成功,随即而来的是统计数据的归口统一,这要求事先要理顺机制体制,将分散在全市各部门的数据进行规范统一上报。
[参考文献]
[1]史忠植 知识发现 北京:清华大学出版社 2002.
[2](加)J·Han,M·Kamber著,范明、孟小峰等译 数据挖掘概念与技术(Data Mining Concepts and Techniques) 北京:机械工业出版社 2004 29-36.
本文得到宁波大学科研基金的资助,特此致谢!
摘 要:智慧城市是未来城市的发展方向,建设过程中需整合、挖掘和利用各类数据,通过计算机技术中的数据挖掘技术,对城市的经济社会发展统计数据进行智能化处理,为政府的智慧城市建设提供决策参考。
关键词:智慧城市;数据;智能化
IBM提出“智慧的地球”概念,指出地球上几乎任何东西都可以实现数字化和互联,进而向整个社会提供更加智能化的服务。随后在“智慧的地球”概念基础上,IBM正式提出“智慧城市”愿景,其具备四大特征:全面透彻的感知、宽带泛在的互联、智能融合的应用以及以人为本的可持续创新。
智慧城市是未来的城市的发展方向,当我们把智慧城市比喻成一个巨人时,为这个巨人全身提供氧气、输送营养的血脉是大量的数据及整合、处理这些数据的智能化数据库。因此,如何构建这套智能化数据库,是智慧城市建设的重中之重。
一、数据背后的故事
“房屋租赁价格指数超过100,与人口流动指数超过100是否有关联?”“固定资产投资连续3年增长,是否与人口增长、财政收入增长和出口额下降有关联?”……经济社会发展统计数据背后隐含着丰富的、对决策咨询有重要意义的规律。
一方面,经济社会发展统计数据库能为各级党委和政府管理、决策提供基础数据支持,为各部门实现信息资源共享提供切实保障,如今各省、市、区级统计局基本建成了统计信息系统,基于不同的应用和数据库平台,基本实现了统计数据的网上直报、查询和下载等功能;另一方面,现有的统计系统中,录入、查询和统计作为普遍的功能,而对于存在着若干的规则与联系的大量数据缺乏利用,实质上这些规律背后蕴含着关键的发展趋势,为决策提供重要参考。
因此,将数据“智能化”从而适用于智慧城市应用体系,是有现实和长远意义的。
二、智能化的手段
要实现数据智能化,必须运用计算机领域的相关技术,依托数据库方面的决策支持技术,通过数据采集、模型构建、数据分析和方案设计等人机交互程序,为决策支持提供支撑[1]。
以某市智慧城市建设的数据库为例,分析智能化数据库的需求,在系统用例图和基于J2EE平台的系统架构设计基础上,对系统的功能、数据仓库和相关接口进行设计,并对内嵌的查询算法——FP-Growth算法进行编制,为开发“经济社会发展统计智能化数据库”提供设计框架。
该系统不仅实现登录、查询、录入等功能,最重要的是利用数据挖掘技术,从各类数据中挖掘出具有决策参考价值的数据集,比如“人口增长、财政增收”、“房地产投资减速、出口额增长”等有关联的数据集,为智慧城市建设提供参考。
三、智能化的设计思路
据了解,现有的经济社会发展统计数据库在分析数据、辅助决策等功能上尚存在缺憾,而在引进智能化数据库的相关技术后,对原有查询、录入的数据进行抽取、过滤和装载,形成数据仓库,利用相关数据挖掘技术,生成有参考作用的一系列数据项,形成一套智能化数据库系统。
图1 数据智能化的流程图
四、智能化的应用
在了解了设计思路和核心算法之后,如何实现数据智能化是关键,在下图(图1)中演示了实现关联规则挖掘的流程,也就是实现数据智能化的流程。
从流程图里可以对FP-Growth算法挖掘模块的使用过程进行了解,此模块的相关设计有以下几个考虑:1、有专供用户登录的数据挖掘主界面;2、有分别用以填写最小支持度和设置目标范围的统计数据下限值的输入框;3、有一段程序代码,用以按设置的下限值调用数据库中已有数据;4、有一段FP-Growth算法的程序代码;5、有一个页面,用以显示关联规则挖掘结果。
在关联规则挖掘模块中,有两个关键流程:设置最小支持度、设置经济社会统计数据下限。其中设置数据下限是关键步骤,是对符合条件的频繁项进行进一步删选,删除下限以下的频繁项数据类,剩下的数据类用以构建FP-Tree的项,最终挖掘出的频繁项集是具有决策参考意义的:在某数据值(如市级财政收入800亿元、区县级人均收入18000元和区县级新增企业数300家)以上的数据是有关联性的,可以同时选择。
五、结束语
数据智能化是一个逐步完善、长期坚持的过程,期间要经历数据共享规整、用户需求完善、系统效率提升等必要步骤。同时一旦智能化数据库设计、开发成功,随即而来的是统计数据的归口统一,这要求事先要理顺机制体制,将分散在全市各部门的数据进行规范统一上报。
[参考文献]
[1]史忠植 知识发现 北京:清华大学出版社 2002.
[2](加)J·Han,M·Kamber著,范明、孟小峰等译 数据挖掘概念与技术(Data Mining Concepts and Techniques) 北京:机械工业出版社 2004 29-36.
本文得到宁波大学科研基金的资助,特此致谢!