APP下载

大数据时代的空间数据挖掘分析
——华北计算机技术研究所

2016-04-14梁蕊

地球 2016年7期
关键词:数据挖掘时代空间

■梁蕊

(华北计算机技术研究所北京100000)

大数据时代的空间数据挖掘分析
——华北计算机技术研究所

■梁蕊

(华北计算机技术研究所北京100000)

大数据改变着我们的生活,改变着人们的工作方式,数据本身是没有价值的,需要运用技术,让数据变成信息。当前数据产业发展过程中,数据的产生速度已远超数据分析挖掘技术的提高速度。数据的共享和安全,成为整个产业未来需要解决的问题。本文将就大数据时代数据挖掘问题进行相关探讨和研究。

大数据 时代 空间数据 挖掘 分析

0 引言

从字面上理解,“大数据”就是海量数据。但实际上,人们日常所谈论的“大数据”并非数据本身,而是大数据挖掘。有人将大数据比作“原油”。大数据挖掘才是大数据的核心。它通过计算机将人脑无法记住的海量数据进行归纳、建模、分析,找到数据中的关联关系。大数据挖掘利用的不再是抽样的小部分数据,单台计算机已经无法满足存储和处理数据的需求,需要众多高性能计算机同时承担数据存储、数据处理、数据挖掘的工作,这便是云计算。如今,大数据挖掘必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。

1 大数据时代特点

大数据时代对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。中国公司目前对数据的开发,主要还是集中在精准定位目标客户上。

首先看社会环境。信息技术向融合、智慧、绿色的方向发展。大数据伴随云计算、移动互联网领域的发展,产生新的管理模式和商业模式,能够创造出更大的价值,提升社会的管理水平和效率。纵观产业经济发展史,带来应用的技术一定能够发展繁荣的产业。

再看政策环境。政府高度重视,发展战略目标清晰明确。近期发布了一系列促进大数据产业发展的政策。《十二五国家战略新兴产业发展规划》中指出,加强海量数据处理软件为代表的技术软件开发;《物联网十二五发展产业规划》中把大数据信息处理等作为4项关键技术创新工程;《国家发改委关于加强和完善国家电子政务工程建设管理的意见》强调,政府数据中心的建设注重顶层设计,向跨部门、跨区域的协同互动和资源共享转变。

市场环境。前景巨大,空间广阔。结合对中国相关市场的研究,IDC认为中国在大数据领域具有巨大的市场潜力。越来越多的IT供应商将中国作为大数据业务发展的热点。目前,中国已经是全球最大的PC和智能手机市场,并且中国的互联网用户和移动互联网用户数量也是全球最多,这些终端设备每时每刻都在互联网上创造数据。庞大的数据容量不但令众多国际厂商重视中国市场,也使得中国的大数据应用具备了不同于国外的特点,大数据的机遇就在我们面前。

2 空间数据挖掘和知识发现的概念

空间数据挖掘和知识发现主要是建立在空间数据库的基础上,其中包括空间的关联、特征、分类和聚类等规则及例外。它利用统计学方法、神经网络技术、机器学习、专家系统等方式,把数据集合起来。另外,空间数据挖掘和知识发现的主要对象就是空间数据库或空间数据仓库,与别的数据库比较,它主要增加了尺度维。同时,空间数据挖掘和知识发现具有广泛而重要的现实作用,比如信息融合系统、气象预报、医疗图像处理、导航、机器人等使用空间数据的很多领域。

3 大数据时代空间挖掘技术

3.1大数据行业发展

我们认为大数据行业的发展主要由三个因素决定:需求、数据以及产品。政府管理、公安反恐以及金融风控等领域的大数据处理需求一直存在,随着需求的拉动,数据开放与共享机制的完善,以及政府政策的推动,大数据行业将启动爆发。究竟什么样的数据才是有价值的数据?嫁接BAT、兼并收购是否是大数据变现的有效手段?去伪存真,哪些领域的大数据应用有望率先爆发?PM2.5监测、建筑和地下空间安全监控、病例的存储和研究……在我们日常生活中,几乎各行各业都涉及“大数据”。未来必然会迎来大数据时代的挑战,大数据在生活中的运用、技术发展的趋势以及产业变革浪潮中都有非常重要的作用。

3.2大数据挖掘和安全

大数据运用特定算法分析海量数据,从而得出事情发生的可能性。不过,它告诉人们的不是事物的因果关系,而是相关关系。换句话说,大数据能解决“是什么”的问题,但不会告诉人们“为什么”。这会让人们注意到很多以前从没有意识到的关联关系。打个比方,大数据会告诉商家客户喜欢什么,甚至可以精确到每一位客户的喜好,但它不会告诉你“客户为什么喜欢”。不过,对于商家而言,知道客户喜欢什么已经足够。

大数据其实无处不在。我们刷微博时,系统会自动将事件聚在一起形成热点事件的脉络;单身大龄“剩男剩女”登录交友网站时,网站会自动弹出一些精心挑选的单身异性资料;工作之余在购书网上挑选书籍,推荐栏里常常会有我们感兴趣的书籍,可以轻松下单购买;驾车时,智能手机会发送我们的位置信息以及车速,然后结合实时交通信息为我们提供最佳路线;大数据还能帮助我们了解自己,手腕上的一只智能手环或智能手表,实时记录我们的心率、睡眠质量等各项身体指标,通过后台数据分析,可以让我们了解自己身体的健康状况和改进方向。

“大数据”时代面临种种机遇的同时,在诸多挑战中,个人隐私是人们关注焦点。平衡信息共享与隐私保护的矛盾,是大数据发展的关键,亟需出台《信息公开法》和《信息保护法》,既要鼓励面向群体且服务社会的数据挖掘,又要防止侵犯个人隐私。

4 空间数据挖掘和知识发现的展望

随着信息量的增加及软硬件技术的发展,空间数据挖掘和知识发现将有更广泛的应用前景。在开发并实现空间数据挖掘和知识发现的应用时,不仅要研究多源空间数据的集成、多算法的集成、存储空间和计算效率的降低、人机交互技术、可视化技术等问题,还要充分借鉴和汲取数据挖掘和知识发现、人工智能、数理统计、可视化、地理信息系统、医疗、分子生物学等学科领域的成熟的理论和方法。

[1]马宏斌,王柯,马团学.大数据时代的空间数据挖掘综述 [J].测绘与空间地理信息, 2014,07:19-22.

[2]谢红.大数据下的空间数据挖掘思考 [J].计算机光盘软件与应用,2014,09:105+107.

[3]秦萧,甄峰,熊丽芳,朱寿佳.大数据时代城市时空间行为研究方法 [J].地理科学进展,2013,09:1352-1361.

[4]李涛,曾春秋,周武柏,周绮凤,郑理.大数据时代的数据挖掘——从应用的角度看大数据挖掘 [J].大数据,2015,04:57-80.

C37[文献码]B

1000-405X(2016)-7-161-1

猜你喜欢

数据挖掘时代空间
空间是什么?
探讨人工智能与数据挖掘发展趋势
创享空间
基于并行计算的大数据挖掘在电网中的应用
e时代
e时代
e时代
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究
QQ空间那点事