APP下载

基于ArcGIS的可拓住宅建筑设计数据库构建研究

2018-03-15高智慧邹广天

智能系统学报 2018年2期
关键词:属性数据基元数据挖掘

高智慧,邹广天

针对各行各业中积累的大量数据,从中挖掘出关于变换的知识,为处理矛盾问题的决策服务,我国学者于2004年提出了可拓数据挖掘理论[1],它研究用可拓学的理论和方法[2-3],去挖掘数据库中与解决矛盾问题的变换有关的可拓知识,并快速从单一理论向多学科融合方向发展,相关研究成果已被应用于数据挖掘和人工智能等领域。在信息化社会,充分有效地管理和利用各类信息资源,是进行科学研究和决策管理的前提条件[4]。对已有住宅建筑设计数据进行整合与集成,是研究可拓住宅建筑设计数据挖掘的起点。许多学者研究了数据库与可拓学之间融合的方法,并取得了突破性进展。曾维等[5]提出利用可拓学基元来描述知识中的信息单元及其联系,对可拓知识库进行查询、插入、删除、更新操作,实现人工智能构建可拓知识库;豆增发等[6]将可拓学方法应用于数据库建模中,对建模对象进行分析和推理以获得最优数据库模型,这样弥补了传统E/R图和面向对象建模依靠建模人员经验和能力的不足,使数据库建模趋向可推理、可优化及智能化;张铭等[7]提出城市轨道交通数据中心平台的分层框架和功能定位,结合某城市轨道交通数据中心建设案例,描述了基于数据仓库的搭建过程及相关业务的调用逻辑。谢颖等[8]撰写的《多媒体数据库研究》在总结多媒体数据库研究现状的基础上,讨论了多媒体数据库的关键技术,分析了多媒体数据库的结构,并阐述了此类数据库构建的关键技术,以此提供完善的多媒体数据检索及维护功能。但是以上知识库或数据库的构件方法只针对单一类型的数据,如关系型数据或E/R图等结构化数据或多媒体型数据的集成方法,并未涉及到针对多维、复杂的设计类数据的数据库构建方法。

住宅建筑设计数据所具有的非结构化、多源复杂性特征决定了在存储管理上的特殊性,而地理信息系统(geographical information system,GIS)具有较强的地理信息存储、管理能力与功能拓展的可能性。因此,本文针对住宅建筑设计综合数据信息存储需求,构建基于ArcGIS软件的可拓住宅建筑设计数据库,为计算机辅助管理和利用海量住宅建筑设计信息及后续的可拓数据挖掘提供数据支持。

1 可拓住宅建筑设计数据

可拓住宅建筑设计数据是运用可拓学的理论与方法对住宅建筑设计信息进行记载的基元符号或基元符号的组合。它是可以被计算机识别的、抽象的符号,这些符号不仅指数字,而且包括字符、文字、图形等。归纳起来,分为图像和属性数据(见图1)。

图1 可拓住宅建筑设计数据组成Fig. 1 Data composition of extension residential architectural design

1.1 图像数据表达

图像数据表示住宅建筑设计的地理位置及形态信息,包括位置、尺寸、形态及其特征等信息,同时具有定位、定量和空间关系描述等特征的二维工程图。通常以矢量结构(dwg文件格式的AutoCAD文件等具有点、线、多边形特征的图形)和栅格结构(以像素图块形式出现的照片、遥感图片、地图等)两种形式表达(见图2)。矢量数据解决数字化图形记录的精度问题;栅格数据解决建筑面状图形性质及直观形象等问题。

图2 图像数据类型Fig. 2 Graphic data type

1.2 属性数据建模

属性数据是从图形数据中得到的设计的语义信息,是对图像数据的描述与解释。包括声音、数值、文字等在内的居住区综合技术经济指标,包括各种类型的建设用地面积、居住户数、居住人口、总建筑面积、容积率、绿地率、建筑密度等信息;住宅建筑设计高度、层数、面积、结构形式、户型等信息以及含有评价信息的模糊数据。可拓学的基元模型作为联系建筑设计与数据挖掘的桥梁,从理论上把住宅建筑属性信息与可拓集的基元(复合元)对应起来,为后续的数据库系统设计工作提供从现实世界到信息世界的抽象方法。

1.2.1 物元表达住宅建筑的基本信息

以Om为对象,cm为特征,Om关于cm的量值vm的有序三元组作为描述住宅建筑M的基本信息,用n维物元表示住宅建筑多个特征及其对应的量值,即

对典型的模糊数据,应将这些数据转化为可拓集合(–∞,+∞)中的一个量值再进行存储,以便实现数据表达的一致性,满足量化挖掘比较。

例如,不同的家庭人口构成需要有不同的住宅套型设计与其相适应。住户评价信息从侧面反映了套型的需求。按照满意程度依次由高到低划分为5个等级,并逐次从个体样本中得到以评价信息为变量的评价数据。其中1表示“很差”,5表示“很好”,其余评价等级变量以此类推,将其转化为定量数据信息。

1.2.2 关系元表达住宅建筑的关系信息

例如,由F. L. Wright设计的流水别墅,位于美国匹斯堡市郊区的河畔。那里远离公路、高崖林立、草木繁盛,甚至有一溪瀑布缓缓流下。场地现状狭窄、条件复杂。正是在这样一种“恶劣”的场地环境条件下,赖特将别墅建于溪流之上,使溪水成为建筑的一部分,别墅如同生长在瀑布之上的巨石之间,使得建筑与溪水、山石、树木自然地结合在一起,成为现代建筑的杰作之一。这一构思用关系元模型描述为

为了叙述方便,对于复杂的数据信息,如人、事、物组合或复合的结果,需要使用物元、事元和关系元复合的形式来表达,统称为复合元。复合元的构成、运算和变换成为研究复杂问题的基础[6]。

基元是进行可拓分析和可拓变换的基础[9]。为了发挥可拓学的优势,获取并生成更多有意义的住宅建筑数据,利用事物变换的可能性,运用拓展分析与共轭分析方法,建立数据信息,使设计目标、设计问题的理解更为系统和深刻。对拓展后的基元进行评价,评价的标准从住宅建筑设计的目标出发,层层发散,直到找出对应的住宅建筑基础数据(设计条件)为止,且数据不可再分割;当数据缺失时,根据可拓学相关网理论由其他可知数据推导不可知数据,反之则删除这一属性信息。

图像和属性数据信息共同描述一个建筑实体,构建住宅建筑设计数据库要处理的不仅仅是图形信息,常常是多结构化的信息。对其数据信息的分类存储需要同时兼顾其图像要素和属性要素两个特征。

1.3 数据信息整理

作为体现建筑设计意图的重要载体,建筑图纸广泛流通于建筑设计、施工等不同阶段。文本和图片数据是进行数据挖掘的一个分支,也是住宅建筑数据的重要来源。如,住宅建筑设计投标方案文本、建筑设计说明、建筑设计资料集、策划书等,设计单位是这类数据的可靠来源。

1.3.1 图像数据整理

ArcGIS提供了空间拓扑分析功能,有去除冗余顶点、重复线、节点类型识别等[10];图面上有水平或垂直的直线条,以这根直线做参考进行矫正;对于地图的横、纵向误差,通过扫描图长宽尺度与地图实际尺寸相比较进行纠正;对于遥感影像在进行解译时,一般选用和遥感影像比例尺相近的地形图或正投影,做重合比对分别纠正。

1.3.2 属性数据整理

根据基元特征及量值的唯一性,进行匹配性校验。当数据之间的特征与量值完全相同,则只需合并保留一条数据,将多余数据清除;当数据中对象相同,而其对应的特征的量值不同,则需进一步确认真实性,保留可靠数据源,将其余删除;若中数据对象相同,特征不同,则应将该特征作为对数据源有意义的补充,予以保留;无法填补的缺失数据值删除忽略掉,并在数据表中删除与其对应的基元,以保证后续挖掘的准确性;若缺失发生在源数据中,则运用可拓分析方法,从相关数据网络中,根据可拓相关分析、可扩分析,由已知数据推导缺失数据值。

2 可拓住宅建筑设计数据库

可拓住宅建筑设计数据库(Extension residential architectural design database)是指长期存储在计算机内、结构化、大量的、可共享的可拓住宅建筑设计数据的集合。在计算机实现方面,以ArcGIS为软件平台,以基元符号为系统语言,以空间数据管理为核心,利用计算机技术、遥感航测技术和数据库技术,采用统一地理坐标系把各种住宅建筑属性信息与图形信息一起存储为计算机可识别数据,形成具有统一表现形式和结构的体系。

面向住宅建筑设计的可拓数据挖掘信息集合包括图像数据库和属性数据库两部分。图像数据库描述有关建筑对象的形态及位置的数据,如点、线、面、坐标等。而属性数据库描述建筑图形特征的有关信息,如名称、容积率、高度、户型及其组合等。针对不同的用户,无论是查询功能、管理需求或挖掘需要,数据库需要集中体现出在怎样的场地现状、住户要求等条件下,最终得出怎样的住宅建筑设计结果,归纳起来体现出设计条件和设计成果之间的联系。单就住宅建筑设计而言,数据库构建需求界定在设计条件与设计目标之间设计问题的解决,既包含住宅建筑设计的相关数据,又包含描述解决设计问题的途径、经验和方法(知识)。

可拓住宅建筑设计数据库的构建主要实现以下目标:

1)用可拓学语言描述建筑设计相关要素,整合数据并构建统一的表达语言,便于计算机识别;

2)形成高效的住宅数据存储平台,为可拓住宅建筑设计和后续的数据挖掘过程提供丰富的数据基础。

3 可拓住宅建筑设计数据库构建方法

3.1 逻辑结构设计

从用户的角度对住宅建筑数据进行建模,其任务以住宅建筑设计、规划与挖掘、决策所需数据为基础,描述住宅建筑工程实例的设计信息模式。根据住宅建筑设计数据的类型,划分为居住区信息、性能信息、设备信息、平面、立面、剖面信息。用住宅建筑设计图形和它的属性名称的抽象形式描述设计条件,一个住宅建筑需要多个属性来进行描述并反映属性之间的依赖关系(图3)。

图3 可拓住宅建筑设计数据建模Fig. 3 Model building of extension residential architectural design database

逻辑结构设计分为两步,1)图形结构设计,将不同类型、不同级别图形要素进行分层存放,每一层存放一种专题或一类信息。共分为3层:地图层,反映一定区域范围内的数据库构建边界;规划图层,反映居住区规模和住宅建筑分布状况;住宅建筑设计要素层,包括建筑的平面、立面和剖面等数据信息。2)属性信息组织形成过程:属性数据最终以数据表的形式来管理。

3.2 图像数据与属性数据的匹配

地图数据主要提供空间地理位置数据,包括地形图、行政区划图等。各种地图,经过数字化转换输入数据库后,地图上的信息转换为对应区域地理坐标。

根据地理信息系统特征坐标点的唯一性,进行图形数据与属性数据的匹配。在计算机实现方面,ArcGIS自带地图加载功能,该地图能实现定点查询经纬度,并通过位置坐标实现与AutoCAD拼接[11]。当地图下载完成,可生成所下载底图的经纬度,这一地理位置信息成为实现建筑平面坐标系与大地坐标系匹配的重要依据[12]。在ArcGIS软件平台基础上,图像数据中的AutoCAD矢量图形信息,将建筑场地内的平面坐标嵌入更大的地域坐标系中。属性信息汇总成二维表,连同调研、资料查询获取的图片、现状照片等存储为若干网页文件,将文件的存储路径写入属性信息统计表,完成图像信息和属性信息的匹配[13]。

4 实验与分析

为检验本文方法的可行性和有效性,以某居住小区内的住宅建筑为例展开试验性数据库构建。数据来源于建筑设计院设计图纸。

该项目(图4)为普通商住小区,其中高层住宅八栋,临街商业用房及配套公建四栋。设计院提供的数据包括AutoCAD图形、JPG图片与文本。

图4 某居住小区项目Fig. 4 The project of a residential district

首先,打开百度地图下载器,在行政区划菜单中确认市域范围内遥感地图作为底图。其次,在ArcGIS的工具栏中选择【Add Data】,选择导出的地图即可完整加载。此时地图上的信息转换为对应区域地理坐标。根据特征点:居住区北门、东门(125.166 396,43.828 142)位置坐标定位AutoCAD居住区平面坐标。

根据图3所示建模方法,构建该小区属性数据信息数据库。经过转换特征量值,删除冗余数据、补全缺失数据、修正错误数据后,利用物元模型描述居住区属性数据信息 (见图5(a))。

图5 ArcGIS软件中加载居住区住宅建筑数据信息Fig. 5 ArcGIS loaded residential area planning data information

以1#住宅楼为例(图5b),建筑面积为12 591.06 m2,一梯三户,共有两种套型,分别为两室两厅一卫和一室一厅一卫。数据中包含图纸与文本信息。其中CAD图形数据以建筑4个角点为依据,定位到地图中。连同平面属性信息嵌入1#住宅楼的1单元套型平面图中。文本信息转化为属性信息以基元形式存储。该套型单元用符号”来进一步表达户型图中的套型组合方式,分别记作M11、M12。

5 结论

在存储住宅建筑数据时,通过数据库实现多源数据集成是必然的选择。本文根据住宅建筑设计特点,针对图像及其属性信息集成问题,从交叉学科角度提出数据库构建方法,得出以下结论:

1)属性数据中存放的诸如场地、规模、面积、户型等数据信息以基元的形式表达,与以矢量结构描述的AutoCAD文件和以栅格结构描述的图片、影像等图形数据信息的匹配与互查,实现了对住宅建筑数据的组织、管理;

2)通过给出查询条件,即可列出数据库内相关的住宅建筑设计信息,开展数据的提取和分析;

3)可拓住宅建筑设计数据库给用户提供了充分的可扩展空间,通过增删叶节点来修改子数据,使数据结构更加丰富和合理。这也是目标–条件逻辑结构的优势。

可拓住宅建筑设计数据库解决了定量和定性数据与图像数据的集成问题,为可拓数据挖掘与住宅建筑信息的无缝衔接搭建了统一的数据平台。此外,通过建立可拓住宅建筑设计数据库,数据的查询、统计、可视化分析等应用更为高效,同时也为可拓住宅建筑设计提供了有力的数据支撑。

下一步研究将进一步提升居住区定位和居住区地形描述精度;提取其他相关数据信息改善挖掘性能,同时考虑评价量值的加载和优选问题及自动化抓取网络数据信息的能力。建筑师可以根据获取数据的深度和广度,推而广之到建筑设计其他方面的构建研究,为实现计算机辅助设计奠定基础。

[1]杨春燕, 李小妹, 陈文伟, 等. 可拓数据挖掘方法及其计算机实现[M]. 广东: 广东高等教育出版社, 2010: 25–32.YANG Chunyan, LI Xiaomei, CHEN Wenwei, et al. Extension data mining method and its computer implementation[M]. Guangdong: Guangdong higher education press, 2010:25–32.

[2]陈文伟, 黄金才. 可拓集与可拓数据挖掘[M]. 北京: 科学出版社, 2008: 37–41.CHEN Wenwei, HUANG Jincai. Extension set and extension data mining[M]. Beijing: Science press, 2008: 37–41.

[3]蔡文, 杨春燕, 何斌. 可拓逻辑初步[M]. 北京: 科学出版社,2003: 15–17.CAI Wen, YANG Chunyan, HE Bin. The preliminary exten-sion logic[M]. Beijing: Science press, 2003: 15–17.

[4]王珊, 萨师煊, 张俊. 数据库系统概论[M]. 北京: 高等教育出版社, 2014.WANG Sa, SA Shixuan, ZHANG Jun. Introduction of database system[M]. Beijing: Higher education press, 2014.

[5]曾维, 魏蛟龙. 可拓知识库的构建[J]. 船舶电子工程, 2004,3: 53–55.ZENG Wei, WEI Jiaolong. Extension repository designing[J].Ship electronic engineering, 2004, 3: 53–55.

[6]豆增发, 王保保. 基于可拓学的数据库建模方法[J]. 西安邮电学院学报, 2006, 9: 79–82.DOU Zengfa, WANG Baobao. The method of database modelling based on extension theory[J]. Journal of Xi’an university of post and telecommunications, 2006, 9: 79–82.

[7]张铭, 曹鸿飞. 城市轨道交通线网数据中心与评估决策平台[J]. 智能系统学报, 2017, 12(3): 1–9.ZHANG Ming, CAO Hongfei. The platform of data center and evaluation decision making of urban rail transit[J].CAAI transactions on intelligent systems, 2017, 12(3): 1–9.

[8]谢颖, 张毅, 操骏峰, 等. 多媒体数据库研究[J]. 重庆邮电大学学报: 自然科学版, 2017, S1: 134–137.XIE Ying, ZHANG Yi, CAO Junfeng, et al. Research of multimedia database[J]. Journal of Chongqing university of posts and telecommunications: natural science, 2017, S1:134–137.

[9]赵燕伟, 周建强, 洪欢欢. 可拓设计理论方法综述与展望[J]. 计算机集成制造系统, 2015, 5: 1157–1167.ZHAO Yanwei, ZHOU Jianqiang, HONG Huanhuan. Overview and prospects of extension design methodology[J].Computer integrated manufacturing systems, 2015, 5:1157–1167.

[10]李江, 周浩, 罗吴亮. ArcGIS空间数据库中拓扑错误的检查与批量处理方法[J]. 北京测绘, 2017, 2: 156–157.LI Jiang, ZHOU Hao, LUO Wuliang. Research on the conversion of DLG data to data factors of important geographical conditions[J]. Beijing surveying and mapping, 2017, 2:156–157.

[11]李潇潇. 简述ArcGIS在DEM数据格式转换及DEM、DOM数据质量检查过程中的应用[J]. 测绘与空间地理信息, 2015, 2: 5–8.LI Xiaoxiao. Described on the application of ArcGIS in DEM data format conversion, DEM and DOM data quality inspection process[J]. Geomatics and spatial information technology, 2015, 2: 5–8.

[12]孙霞, 曹刚, 王伟东. ArcGIS影像管理解决方案浅析[J].测绘与空间地理信息, 2017, 1: 175–176.SUN Xia, CAO Gang, WANG Weidong. Analysis of Arc-GIS image management solution[J]. Geomatics and spatial information technology, 2017, 1: 175–176.

[13]段正励, 刘抚英. 杭州市工业遗产综合信息数据库构建研究[J]. 建筑学报, 2013, 10: 47.DUAN Zhengli, LIU Fuying. Study on the comprehensive information database of industrial heritage in hangzhou[J].Architectural Journal, 2013, 10: 47.

猜你喜欢

属性数据基元数据挖掘
基于多重示范的智能车辆运动基元表征与序列生成
一款低频偶极子声源设计
探讨人工智能与数据挖掘发展趋势
数据挖掘技术在打击倒卖OBU逃费中的应用浅析
城镇地籍数据库建设过程中存在的问题和注意事项
基于GIS的房产测绘管理信息系统架构研究
无源多传感器综合数据关联算法研究
属性数据分析教学改革初探
人体细胞内存在全新DNA结构
基元树建筑物图像伪造组件检测算法