民国《西京市区》图的数字化、数据提取和应用价值*
2021-12-09双静如
张 萍,双静如
0 引言
数字地图是伴随计算机技术与地理信息技术发展而产生的新型地图形式,在计算机或电子屏幕上显示,信息量丰富,能提供正确及时的地理信息,修改、检索、传输方便。由于数字地图可以表示的信息量远大于普通地图,所以成为地图重要的发展方向。数字地图也是纸质地图的数字存在,纸质地图数字化成为处理早期地图的重要内容,特别是将古旧地图中的信息转化为GIS数据,制成数字地图,以提取更准确的地理信息,如历史时期的疆域范围、城市结构、聚落分布、山川形势、行政区划、交通网络等;将上述地理信息与今天的河流、山脉、政区、路网相叠加,可以直观地表达出该历史时期的地理特征,为后续研究提供数据基础。因此,近年古旧地图数字化成为历史地理学新兴的学科方向[1]。比如,利用古旧地图数字化提取,复原历史时期的政区边界[2-3]、重建历代土地利用格局[4-5]、复原古代交通道路[6-7]、研究生态环境演变[8-10]、探析地名演变[11-14]、分析区域经济[15-16],从而大大提升历史地理学研究精度。然而,古旧地图多以小幅呈现,且年代久远,在保存过程中会出现纸张变形、褪色、缺失、破损的现象,因此数字化过程的准备工作——地图的处理就显得十分重要。此外,进一步得到的GIS数据还受到数字化过程中地图测绘精度、仪器、数字化方法、采样要素等因素影响,存在一定的误差。针对这些问题,相关探讨在逐年增加[17-19]。
20世纪80年代末,美国国家地理信息与分析中心(National Center for Geographic Information and Analysis,NCGIA)召开空间数据库精度的专题研讨会,目的是为GIS数据误差研究拟定方向和立题,标志着系统研究GIS数据误差问题的开始[20]。目前古旧地图数字化的GIS数据误差大体可归为三大类:一是数据源误差,主要有控制点和地物点引入的误差及展绘点误差、地图投影变形误差、地图编绘/印刷/复制等误差、地图纸质材料变形的误差;二是数字化过程中产生的误差,即处理误差,主要包括数字化仪器精度误差和操作人员引起的误差[21]43-45;三是应用误差,主要指数字化的空间数据在使用过程中产生的误差。为避免GIS空间数据误差的传播甚至扩大,影响成果的可靠性,GIS空间数据的精度分析与质量控制对后续的研究尤为重要,国际上的GIS研究机构(如NCGIA和UCGIS)均把GIS中的精度分析与质量控制作为当代GIS研究的战略重点[21]1。
古旧地图数字化过程中,误差纠正最核心的步骤是针对第二类误差的修正,即如何选择最好的方法,将误差值降低到最小。它对专业技术人员的数字化技能提出更高要求。目前学界针对这一研究的成果包括:清代三大舆图——康熙《皇舆全览图》《雍正十排图》《乾隆十三排图》数字化方法探讨[22-23],民国1∶50 000、1∶100 000大比例尺地图的数字化与误差系数研究[15]。本文以民国《西京市区》图为例,探讨一万分一大比例尺城乡地图的数字化方法及其精度控制,探究作为史料的《西京市区》图其数字提取的价值、意义。
1 《西京市区》图的基本信息
与东部地区相比,西北地区的地图资源偏少,开展现代地图测绘工作的时间也较短,相关地图资源在历史研究中的应用还有待进一步开发。陕西省地处西北的东大门,地图测绘工作起步相对早些。大面积测绘地形图始于民国4年(1915),陕西省陆军测量局测绘1∶50 000地形图,测绘的范围大体集中于关中地区;但由于时局动荡,人才资金短缺,到民国36年(1947)只完成283幅,占应测图幅数45.3%[24]7。这期间,民国6年(1917)调绘陕西全省1∶100 000地形图,至民国18年(1929)基本完成地形图204幅,覆盖该省长城以南全部土地。
陕西省地图测绘工作最集中的时期是在抗战后。民国20年(1931)“九一八”事变爆发,东北、华北、东南相继沦陷,国民政府将经略目光转向西部,开始开发西北。民国21年(1932)3月国民政府打算以西安为陪都,定名西京,组织西京筹备委员会[25]6,民国23年(1934)成立西京市政建设委员会。本着“筹备西京,首重测绘”[25]196的认识,西京筹备委员会、西京市政建设委员会自行或委托陕西省陆地测量局、参谋本部航空测量队和参谋本部陆地测量总局测量、编绘、印制多幅有关西京城关、市郊的地形图。本文所述一万分一纸本彩绘《西京市区》图即是其中规模最大的西安城区全图,由西京筹备委员会组织,民国21-22年(1932-1933)间测绘,民国23-25年(1934-1936)间绘成。
《西京市区》图全图共计65幅,覆盖范围东抵灞河,南及樊川,西达沣河,北至渭河,约3,328方里①。每幅图幅面长、宽表示实际长7里、宽6.7里[25]159,且有完整的图廓(见图1)。图中居中标注分幅图名,左上角列出该图幅拼接表,右上角标注总图名称。其左外侧标注图例与图式,内侧注明勘测、清绘、制版、复制的时间与责任人;右侧标注标高;底部注比例尺及代印机构名称。根据标注内容可知,该套地图由西京筹备委员会测量队调查、清绘,参谋本部陆地测量总局代印,六色印刷,比例尺精度1∶10 000。该套图主要测图、清绘时间均为民国21-22年(1932-1933),集中于民国22年(1933),分别占总图幅的68%和66%;制版时间为民国23-25年(1934-1936),集中于民国23年(1934)、24年(1935),分别占总图幅的46%、48%。整套图无平面信息,参考《陕西省志·测绘志》记录可知,民国时期陕西省无大地测量基准点,平面和高程测量均采用局部系统,即假定系统,无统一起算点,只是按测区以天文点为准设立独立(假定)坐标系[24]13,标高是由建设厅建国公园(现陕西省西安市儿童公园)内水准点之结果推算,以海州(今连云港市西部,陇海铁路上)中等海水面为基面[24]14。
图1 《西京市区》图之“十里铺”图概览
受绘制时长及存放条件影响,该套地图各幅色彩显示轻重不同,部分图幅呈现发黄迹象。除钟楼西、钟楼东、七里铺、阁老门、灞桥原图破损,钟楼东、钟楼西、阁老门三图有粘贴痕迹,玉女门、鱼化寨、杏园头原图有明显褶皱,徐家湾、兴隆村、马蹄寨原图有污迹外,其余图幅基本保存良好(见图2)。图中水井、庙宇、河流水系、交通网络、等高线、城市、乡村聚落等信息尤为丰富,从地图学角度来审视,该地图信息量极大,为城市实体、乡村聚落、河流水系、网络交通的综合体,典型性较强,数据资源难能可贵。该图虽为大比例尺地图,但缺乏经纬度信息,这为地图数字化工作增加了难度。探讨这种古旧地图的数字化问题,对更精确地利用此类资源具有重要意义。
2 《西京市区》图的配准及数字化
2.1 基于在线无偏地图的配准
由于地图保存质量参差不齐,配准前应先对图幅进行一定处理:将65幅《西京市区》图分别扫描为宽9,975px,高7,376px,分辨率为400dpi的栅格图片。扫描过程中有些图幅会产生细微形变,因此在数字化前,采用软件Photoshop CS6对扫描的底图进行透视裁剪,对产生形变的底图进行镜头校正,去掉外图廓,并对底图进行颜色校正,以较好地保证图像质量,利于识别地图中的字体、标注等信息;然后,利用地理信息系统软件Arc GIS实施地理配准,赋予《西京市区》图空间位置信息。
该套地图没有经纬度参考,且民国21-22年(1932-1933)距今约90年,西安市貌变化较大,尤以城墙周围变化最为明显,因此配准是否精确直接影响到GIS数据的质量。在数字化数据前,对数据进行误差分析有着重大意义,可以避免数据误差逐级传递。
对《西京市区》图这样一套无经纬度坐标但有参考点的多幅大比例尺古旧地图进行数字化,可以依据可直接定位的图幅来得到其他图幅的经纬度,再进行地理配准,赋予原图空间位置信息;也可以先将所有图幅拼接起来,然后从现今无偏差的遥感影像选取至今未变化的地物进行配准;还可以小范围拼接后配准。
由于该套地图图幅较多,距今时间较长,而西安城市发展变化较大,按在线地图选取大量参考点比较困难,按经纬度配准或一次性大面积整体配准的误差也会增大。因此,本次配准选择适当的小范围,先拼接再配准。配准所参考的现今无偏差遥感影像为ArcGIS软件中SimpleGIS在线地图插件forArc MapV3.1下的Bing Maps②(无偏移)。
在配准前先将原图进行小范围拼接,再分区域选择参考点进行配准。每个区域选取参考点至少7个,并且要在图幅四周选取控制点,以避免造成地图外扩;同时,尽可能满幅均匀选取,以达到配准最高精度。本次配准按《西京市区》图的拼接表(见图2)将图分为3组,第一组为前两列(12幅),中间三列为第二组(24幅),最后三列为第三组(29幅)。
因清末至民国时期地图尚无精确的椭球参考基准,所以数字化赋予《西京市区》图的地理坐标系为WGS1984。选取的参考点主要是明城墙四顶点、四城门、大雁塔、小雁塔、钟楼等地标建筑,以及河流堤坝、桥梁等可明确定位、未位移的相关参照物,且这些地物均匀分布在地图的各个方位。因河流侵蚀会导致河床下蚀,且受气候等因素影响大,所以本项配准尽量避免选取河流作为参考点。配准过程中删除误差较大的参考点,用以调整变形较大的区域;适当参考配准好的地图边界处的特征点,以调整参考点较难选择的区域。最后,利用Arc Tollbox中的镶嵌工具,将65幅地图拼接成一个整体,从而方便后续的数字化。
2.2 图幅配准误差分析
将上述操作结果叠加到Bing Maps(无偏移)影像上,选取一定量的参考点作为评价配准精度高低的参照。由于《西京市区》图当中,聚落是以面状符号来反映,且民国时期至今聚落持续发展。因此,本文在该套图的每个区域选取至少10个聚落,并提取其中心点坐标与Bing Maps影像中对应聚落的中心点坐标进行比较,以两者位置误差值来反映配准结果的精度。这些聚落的选取应尽量遵循居住地较为集中、形态为方形的原则,以减小聚落中心点提取时的自身误差。本次共选取聚落31个,统计得到《西京市区》图聚落地理坐标与实际位置的差值及其偏移距离(见表1)。
上述统计发现,本次配准的《西京市区》图精度良好。大体来说,各区域间偏移程度不同:第一组聚落样本中心位置整体偏移程度较小,经度位置整体向西偏移,纬度位置整体向北偏移;第二组聚落样本中心点位置整体偏移程度稍大于第一组,经度位置整体向西偏移,纬度位置整体向南偏移;第三组是本次配准过程中误差较大的区域,整体上经度位置向东偏移,纬度位置向南偏移。这是因为第一组较第二、第三组图幅少。但对整套图来说,31个聚落样本中心点偏移的位置均较小,基本与实际位置偏移距离都保持在300m以下,整体上纬度位置偏移稍大于经度位置,但偏移方向和程度不同,聚落位置坐标经度整体向西偏移,纬度整体向南偏移,平均偏移距离约84m③。应该说,以上误差值在允许的范围内,此数字化地图可以为下一步的科研所利用。
表1 配准《西京市区》图聚落地理坐标差值及其偏移距离统计表
需要说明的是,选取样本具有随机性,而且民国以来西安周边社会经济变化大,聚落扩张的重心具有不确定性。本研究采用聚落中心点的位置偏移来探讨配准数据的精度,虽然会存在一定的误差,但从最终配准数据叠加到Bing Maps(无偏移)影像的结果看,民国时期的聚落区基本落在今天聚落区范围内,除兴隆村、高庙街图幅的渭河河道南偏明显外,其他河流基本与现今河床相差不大,因此上文所述统计误差所反映的地物整体偏移趋势可以作为参考。也就是说,在误差允许的范围内,可以认为利用参考点配准底图得到的结果与实际位置相差不大,可继续后续研究。在本研究中,除“钟楼西”图幅破损带来的原图少许误差外,GIS数据的精度主要受数字化过程中配准参考点的选取是否得当所影响。相较于依据定位的图幅获取地图经纬度实施地理配准,以及先将所有图幅拼接起来,然后从现今无偏差的遥感影像选取至今未变化的地物进行配准的结果来说,适当小范围拼接然后配准的结果更为精确④。
2.3 图幅的数字化
赋予《西京市区》图地理位置信息后,首先借助Arc GIS软件对该图进行数字化,然后通过点、线、面等数据结构,采用坐标形式对图中的地理实体进行表达,提取民国21-22年(1932-1933)西京市区各要素的几何位置和属性信息,建立《西京市区》图信息数据库。其中,点图层有坟墓、庙宇、水井、土地庙等地物,线图层有河流、城墙、土墙、交通路线等地物;面图层有湖泊、沙洲、居民区等,整个区域覆盖西京市城郊约832km2。每个图层均设计详细的属性表,方便查询与使用。
2.4 图幅数字化方法的探讨
民国一万分一大比例尺地图保存较多,多数为城市地图,部分城乡一体的图幅也采用该比例尺编绘,其间有所差异。针对这类图幅的数字化提取,建立多个时空界面的地理信息图层意义重大。然而,目前该比例尺图幅的数字化工作多未展开,《西京市区》图具有一定的典型性。它属民国一万分一大比例尺实测地图中图幅较多的一种,有参考点但无经纬度坐标。针对这样一套地图进行数字化,如何能得到最精准的定位、实现最精确的复原,方法非常重要。为与分区域选择参考点进行配准的结果进行比较,笔者曾选取与文中一致的31个聚落中心点,依据经纬度或整体拼接配准,发现误差值均会增大,依据经纬度配准的误差均值达510m,整体配准的误差均值为106m,比小范围分区域配准的误差明显要大,有些区域的误差甚至会成倍增加。以上实践可为相关地图的数字化提供参考。
3 《西京市区》图数字化的价值与意义
3.1 建立民国时期西京市区历史地理数据库
借助地图数字化得到民国21-22年(1932-1933)西京市自然与人文要素地理数据库,结合文献统计资料、当代遥感数据,为研究西安城市形态、人文景观以及环境变迁提供了资料支撑。西北地区文献、档案资料并不丰富,受经济技术限制,相关器测数据在民国时期存留少,且不成体系,有这样一套数字化地图资源,对复原民国年间西安市区的环境信息帮助极大。
3.2 助力西京市区历史地理专题研究
3.2.1 宗教寺庙的空间分布格局
《西京市区》图中很多要素比留存下来的统计资料更具体详实。比如,通过数字地图得到民国21-22年(1932-1933)西京市附近佛、道及其他民间信仰的寺庙建筑等共计2,268座,并初步统计出其空间分布特征(见图3-4)。从地图调查与绘制者认知角度看,西安城区传统寺庙大幅度减少,《西京市区》图仅对城区及四关内13座较大寺庙进行标注,而光绪十九年(1893)《陕西省城图》所绘西安城内各类寺庙、道观、清真寺共145座,前者所绘城内寺庙建筑尚不足后者十分之一。当然,民国时期的庙产兴学、新文化运动以及城市近代化发展,对传统文化景观冲击大,许多传统寺庙建筑荒废或改作它用,但保留下来的应该不只13座,只是由于城市标志性景观发生了重大转变,寺庙已不再是当时主流观念中的城市主体建筑。目前从地图数字化结果来看,这种转变在西安城区中表现得相当明显。相比之下,西安四郊各村落中的传统寺庙破坏较少,较大村落往往有八九座,一般村落平均也有四五座,仍为各村落的主要建筑与景观,与民国前相比变化不大。《西京市区》图中寺庙景观呈离散型分布特征。近代城乡二元结构进一步加大,是民国时期内陆省区城乡近代化进程的集中体现,也是该套地图数字化以后,对于理解近代城乡变迁的一个重要提示。
图3 西京周边庙宇点密度图
图4 西京周边庙宇核密度图
3.2.2 聚落与城市交通格局的变迁
《西京市区》图中聚落的位置、地名、规模、形态等信息十分完备,相较于文献中有关城乡聚落的简单记载,该套图所呈现的信息大大提高了聚落地理研究的精度。较早的现代RS数据可提取到近40年的聚落用地信息,而该套图可复原近90年前的聚落用地数据,延伸了聚落地理的研究时段。提取该套图中的聚落用地信息以及各个聚落的中心点,利用核密度空间分析法可研究西安城郊聚落的分布格局,进而指示该区域内人口与耕地大致的空间布局。另外,利用各个聚落的居住地信息可以重建民国时期西安城郊聚落用地规模以及各个聚落的空间分布形态。该套图所反映的西安城郊聚落形态存在着区域差异,并受河流地貌影响:靠近灞河河源处的聚落为狭长形,且木房、泥房、草房、小房分布较多,其他区域则大多是方形或者其他形状的砖瓦房,很多聚落还筑有土墙。基于Arc GIS软件,在Albers投影下,该套图中可提取的聚落居住地共计23km2,结合文献资料以及民国时期1∶100 000地形图所载的聚落人口数据,可进一步更精确地判定民国时期西安城郊900余村落的规模以及城镇化水平。民国32年(1943)陕西省地政局还测绘了陕西省县市镇地形图,将其与《西京市区》图中聚落居地信息做叠置分析,则可以研究民国时期相应聚落扩张的方向及规模,如相较于民国22年(1933)(图5),新筑镇民国32年(1943)(图6)的聚落规模整体呈扩张趋势,南部扩展趋势尤为显著。
图5 1933年新筑镇居住地分布图
《西京市区》图中还有耕地、水域及水利设施用地、其他土地等信息,通过解译图中的农用地、建设用地、未利用土地等地理要素,可以重建民国时期西安城郊的土地利用格局,开展西安地区民国以来土地利用变迁研究。
《西京市区》图中道路网络完备,有铁路、汽车道、县道、乡村路、小径,共6,628km。提取图中的道路数据,经过道路密度分析(见图7)可以发现,西安城郊的道路分布存在区域差异:靠近渭河区域的路网比较密集,小径居多;城墙东南方向靠近浐河区域的路网比较稀疏,且大多为小径;城墙周围的路网体系也较为发达,且以汽车道、乡村道路居多。利用该套图中的路网数据还可以探究近90年西安城郊道路体系及交通的变化状况,也可以探讨民国时期西安城附近各聚落与城区的道路关系,以及各聚落间的互动关系强弱,即聚落间交通的可达性,从而在一定程度上揭示西安城郊附近聚落间货物流通的网络结构以及经济发展水平的区域差异。
3.2.3 水资源的变迁及利用
《西京市区》图中河流、池藻等信息十分具体,各流域中的沙洲也清晰可见。该套图覆盖范围内有渭河、灞河、咸阳河、浐河、沣河等约19km2的水域,因比例尺较大,位置相对精确;与现今的遥感影像相对比,可以从河道位置、河流宽度、面积等方面分析民国以来西安城市水系的变迁。例如,该图所反映的渭河河道虽不完整,但也为清中期以来渭河北移速度明显[26]提供了强有力的支撑。此外,香积寺图幅有“滈河故道”“秦漆渠故道”的标注,尽管没有精确指出两条故道的边界位置,但从其周围等高线的位置可以推导出滈河故道以及秦二世为漆阿房宫城而修建的人工渠的位置,这无疑为今后河道的复原提供了更翔实的数据。
图7 西安城郊路网分布密度图
该套图中还有非常详细的浅层地下水资源——人工水井的分布。地图数字化后,提取“水井”共计2,797口,针对水井的密度分析可以看出民国时期西京市区居民对浅层地下水资源开采利用的强度。从西安城区范围来看,水井多集中于西部与西北部,四关及城内水井的密集度较大,这一点也与今天西安市的整体地貌特征相一致(见图8)。
图8 西安城区水井分布核密度图
3.2.4 陕西省地图测绘史进一步完善
民国时期在陕西进行地图测绘工作的有陕西省陆地测量局、陕甘测量总队、中共中央军委作战部一局测绘科、陕甘宁晋绥联防军司令部测量队等基本测绘机构,县土地测量队、陕西省土地测量队等勘测机构,以及西京筹备委员会、西京市政建设委员会等的测量队。各机构各有分工,测绘所选取的大地基准点、局部系统与高程系统等不尽相同。这些测绘留下了许多丰富的资料,探讨这些基本测绘信息为完善陕西省测绘史奠定了基础。
4 结语
本文将无经纬度参考的多幅民国大比例尺《西京市区》图,依据Arc GIS软件SimpleGIS在线地图插件下的Bing Maps(无偏移)影像进行小范围拼接,然后分区域选取至今未发生变化的地物作为参考点,使之与今天的西安城市地图绝对配准,实现古今地图的对照,并依据聚落中心点位置误差来分析配准的精度。研究发现,对于依据定位的图幅获取其他地图经纬度以及先将所有图幅拼接起来再选取参考点实施地理配准的结果来说,适当小范围拼接、然后配准的结果更为准确。它为民国其他区域同比例尺地图的数字化提供了参考,是该比例尺地图数字化的一个较好样本。
《西京市区》图很大程度上保留了民国时期西安地区的原始地理信息,精确解译图中的地理要素,对地图进行分层数字化,建立相应的属性表,可构建起基于该套图民国21-22年(1932-1933)西安城郊的历史地理数据库,覆盖范围东抵灞河,南及樊川,西达沣河,北至渭河,约832km2,包含坟墓、庙宇、土墙、水井、道路网络、河流水系、城乡居住区等信息,为西安市历史地理研究提供了便利。尤其是在聚落地理的研究上,可以通过数字化直接获取更为准确的聚落用地数据,提升结果的可靠性,也为研究聚落的规模、形态、用地的时空变迁以及聚落间互动关系强弱奠定了基础。同时,通过对该图的数字化,并将其与此后各个时期陕西绘制的相同地区的地图进行空间对比分析,可发现陕西不同地图测绘机构技术的异同,从而进一步完善陕西的测绘史。探讨《西京市区》图的数字化方法,不仅为相关地图的数字化提供了一个方法依据,也为以后此类地图的精准复原提供一个模版。
注释
①方里:面积单位,指长宽各0.5km的面积,即0.25km2。
②Bing Maps 又名LiveSearchMaps、WindowsLiveMaps 或WindowsLiveLocal,是微软推出的Bing 服务中一种相对成熟的网络地图服务,使用它可以观察到世界上的任意一个角落,有鸟瞰地图、三维地图等服务。
③距离的大小会受投影、点的经纬度小数位数的影响,本文的84m是在WGS1984的地理坐标系下利用ArcGIS中的测量工具量测所得,相比经纬度小数位数取9位,在等距投影下所求的88m误差相差很小。
④为与分区域选择参考点进行配准的结果进行比较,本文选取与文中一致的31个聚落中心点来反映依据经纬度配准及整体拼接选择参考点配准的误差,发现依据经纬度配准的误差均值达510m,整体配准的误差均值为106m,与小范围分区域配准结果比较,误差明显要大。