浅谈统计相关模型在地理建模中的应用
2018-06-30张亮霞刘利霞
张亮霞 刘利霞
摘 要:地理学的研究内容复杂,其要素相互联系,过程多为不可控制,不同于物理学和化学。定量的解释地理问题是地理学的发展趋势,运用统计相关模型来进行地理建模已经成为非常普遍的研究手段。该文通过概述植物响应气候变化、空气污染物与气象因子之间的关系、人口数据统计分析3个方面的应用,大致介绍了统计相关模型在地理建模方面的发展,同时由于统计模型优于数据分析而弱于逻辑推理,仍需不断改进完善。
关键词:统计模型;地理建模;动态变化;回归分析;多格网尺度
中图分类号 P208 文献标识码 A 文章编号 1007-7731(2018)05-0012-03
1 引言
地理学主要研究人地关系、空间格局、地理现象的时空演变等问题。这些问题覆盖多种因素,且多为不可控制,明显区别于物理学和化学[1]。针对这些问题,对应于具体实际问题,建立可解释的模型,对地理现象、地理机理与过程进行总结与表达,以实现地理模拟,为社会、经济的决策提供服务。地理建模是人类固有的、自然的、不可避免的活动[2-3]。地理建模通过运用逻辑分析法、物理学方法、统计分析法、模糊數学法、动态数据分析、空间数据分析等方法对不同问题进行分析,能够得到有效、合理的解释。统计相关模型是通过用实验数据和调查来替代具有随机不确定性的地理现象特征,运用统计学的数学方法,呈现出可视化、易分析的模型,结合实际问题,进行现象解释、变量间研究、预测及数据、结构简化等工作。统计相关模型通过定量的方法能够对一些地理问题进行建模和解释。随着研究的不断深入,定量模拟已成为地理建模的发展趋势。
2 统计相关建模应用
2.1 植物响应气候变化模拟 根据器测记录和过去一段时间的温度重建可知,全球变暖是目前人们公认的全球温度变化。关于温室气体的增温效应及幅度大小一直是研究的重点,其中植物对气候变化的响应成为了学者关注的热点[4-7]。目前的研究多数集中在植物生长状态及生物量、种群的构成成分及动态、群落结构及功能、植被分布范围和界限变化模拟等方面,主要的定量模拟方法包括统计模型、生物地理相关模型、生态响应面模型、立地模型、植物生理模型等。其中,统计模型中发展较为成熟的模型有元胞自动机及马尔科夫转移矩阵。第一种是元胞自动机,元胞自动机以动态形式联接离散时间、多维空间的空间位置,并同步其变化状态。不同元胞间的状态和转移函数将引起单个元胞发生改变。植物种及其周围种空间分布格局及其时间变化受到广泛重视,利用元胞自动机模型的原理和特点,可以模拟这种时空变化[8]。例如Dytham于1995年模拟了2种植物之间的共存;Loh和Hsieh于1995年模拟了萨王纳景观的演替。从过去的例子中,人们发现元胞自动机模型的转移函数过于简单,缺乏生物学和地学意义,因此还需进行反复改进。第二种是马尔科夫链模型,马尔科夫链模型可以通过计算生态系统成分,包括植被类型、年龄组、空间位置等的状态矩阵,来对草地、森林、珊瑚礁、景观及土地利用动态等动态变化进行模拟[9]。但由于单一的马尔科夫链模型仅适用于转移概率不随时间变化和状态不发生变化的系统,而群落演替过程中物种的种类和数量往往是不断发生变化的,因此,一些学者开始将空间维引入马尔科夫链形成时空的马尔科夫链模型(STMC),考虑了邻域状态对元胞动态的影响,这样就可以使数据同时具有时间和空间特征,解决了单一马尔科夫链模型不能模拟一些群落演替和预测变化的弊端[10]。
2.2 北京地区PM2.5模型 城市污染问题是城市生态发展中的一个重要部分。城市污染物中的汽车尾气、化工等排放的氮氧化物(NOX)、一氧化碳(CO)、二氧化硫(SO2)等都会危害人们的身体健康。污染物的维持、扩散与气象条件有密切的物理化学关系:根据大气扩散理论和研究表明,不同的气象条件下,同一污染源排放所造成的近地层污染物体积分数可相差几十倍乃至几百倍[11];北京地区NOX、SO2、CO和O3污染气体浓度变化气溶胶垂直分布廓线及其浓度峰值层次与边界层大气热力状况结构(逆温层特征)存在显著联系[12]。周丽等则利用北京白石桥的污染物观测资料和北京地区的气象常规资料,运用逐步回归的统计方法探讨了气象因子与气溶胶细粒子相互关系。在这项研究中指出,气象因子对气溶胶的浓度分布有很大的影响[13];北京地区PM10污染状况的变化与气象条件密切相关,其浓度的变化在稳定天气时与能见度、风速和气象条件呈反相关[14];风速和PM2.5的反相关特征十分明显,PM2.5高浓度的数值发生在小风或静风的时候,随着风速的增大,PM2.5浓度含量减小;气象因子与PM2.5有较好的相关关系。在建立回归模型过程中,自变量为风速(x1)、气压(x2)、气温(x3)、湿度(x4),样本数量为100个,进行8点平滑,拟合对象为PM2.5,拟合99个时次的PM2.5,并对4个自变量进行检验。结果表明,对污染物影响最大的是气压,其次是风速,两者与PM2.5的变化反相关,温度和湿度对PM2.5的影响不显著,气压和风速可以作为预测气溶胶细粒子浓度的重要参考因子;独立样本预报试验结果显示虽然预测的气溶胶粒子浓度与观测值不能完全吻合,但拟合曲线与观测曲线变化趋势相同,说明PM2.5粒子浓度的变化与大气动力结构及其近地层风场扩散能力密切相关[15-18]。
2.3 人口数据多尺度空间化模型 人类活动和人口增长是造成生态环境发生变化的重要驱动力之一。人口空间分布可以直观、便捷的反映人类活动。随着研究的进步和空间分析技术的发展,基于行政单元的统计型人口数据对行政单元内部的人口分布空间差异描述有限,时间可比性差,难以满足实际研宄和应用的需求。地理对象能够呈现出特有的时间、空间乃至时空尺度特征,应采用一定尺寸的地理格网描述统计型人口数据[19]。目前发展的人口数据空间化方法包括基于城市地理学人口分布理论规律的人口密度模型、利用面插值技术的人口空间化方法、以遥感和GIS空间分析技术为手段的人口数据空间化方法研究、基于空间数据挖掘理论的智能化人口数据空间化方法等方法[20-23]。有学者以安徽省为研究区域,利用遥感和GIS技术,通过多源数据融合处理,对该省2010年县级统计型人口普查数据进行了多格网尺度的空间化模型研究,依据人口特征二次分区结果分别进行基于土地利用类型的统计分析建模,引入夜间灯光数据进行分级,实现城镇用地再分类,使用多元统计回归分析方法和地理加权回归方法,进行了人口空间化模型研究[24]。获取了不同格网尺度的人口空间化数据,并结合县级、部分乡镇人口统计数据,运用统计分析和空间分析,对人口数据的空间化结果进行了误差比较和模型精度分析。研究结果表明:以1km格网尺度进行的分区建模的整体平均相对误差比整体建模误差相比下降了16.28%,大大提高了建模精度;引入夜间灯光数据,可以很好的表现经济发展水平和人口聚集程度的关系,使人口空间分布差异性难以区分的情况得到改善;研究分别获取了1km、5km、10km 3种格网尺度的人口空间化数据,通过直接精度验证表明,对于多元统计回归方法,模型精度随着尺度的增加而增加[25-29]。
3 结语
在地理学定量发展的驱使下,对实际问题的地理建模中,统计相关模型能够将地理现象、地理过程等定量的表述以便进行分析和解释。但单纯的统计模型则会使某些地理要素的作用弱化,更多情况下这种模型只适合一时一地一事的情况,在有些实例中,不能解释机理,参数之间缺乏逻辑性。对于不同地区、不同条件,往往可以得出多种统计规律,不能进行时间和空间的外推。可见,统计相关模型还需要不断完善,才能更好地利用在地理建模实例中,更合理的用定量方法解释地理现象和地理问题。
参考文献
[1]韦玉春,陈锁忠.地理建模原理与方法[M].北京:科学出版社,2005.
[2]陈旻,盛业华,温永宁,等.语义引导的图标式地理概念建模环境初探[J].地理研究,2009,03:705-715.
[3]Westervelt J.流域管理的模拟建模[M].程国栋,李新,王书功,译.郑州:黄河水利出版社,2004.
[4]Box E O,Crumpacker D W,Hardin E D.Predicted effect s of climatic change on distribution of ecologically important native tree and shrub species in Florida[J].Climatic Change,1999,41:213-248.
[5]Sykes M T,Prentice I C.Quantifying the impact of global climate change on potential natural vegetation[J].Climate Change,1999,41:37-52.
[6]Channell R,Lomolino M V.Dynamic biogeography and conservation of end angered species[J].Nature,2000,403:84-86.
[7]王紹强,罗承文.中国陆地自然植被碳量空间分布特征探讨[J].地理科学进展,1999,18(3):238-244.
[8]Woodward F I,Thomps on G F,McKee I F.The effects of elevated concentrated concentrations of carbon dioxide on individual plants,populations,communities and ecosystems[J].Ann.Bot.,1991,67:23-28.
[9]Childress W M,Crisafulli C M et al.Comparison of Markovian matrix models of a primary successional plant community[J].Ecological Modelling,1998,107:93-102.
[10]李双成.植物响应气候变化模型模拟研究进展[J].地理科学进展,2001,03:216-225.
[11]李宗恺,潘云仙,孙润桥.空气污染气象学原理及应用[M].北京:气象出版社,1985.
[12]徐祥德,丁国安,周丽,等.北京地区冬季大气污染动力——化学过程区域性三维结构特征[J].科学通报,2003,48(1):1-6.
[13]杨东贞,于海青.北京北郊冬季低空大气气溶胶分析[J].应用气象学报,2002,13(特刊):113-126.
[14]王淑英,张小玲.北京地区PM10污染的气象特征[J].应用气象学报,2002,13(特刊):177-184.
[15]徐祥德.城市化环境大气污染模型动力学问题[J].应用气象学报,2002,13(特刊):1-12.
[16]黄嘉佑.气象统计分析与预报方法[M].北京:气象出版社,1990,84-86.
[17]魏风英.现代气候统计诊断与预测技术[M].北京:气象出版社,2007.
[18]周丽,徐祥德,丁国安,等.北京地区PM2.5统计—相关模型[A]//中国气象学会.新世纪气象科技创新与大气科学发展——中国气象学会2003年年会“大气气溶胶及其对气候环境的影响”分会论文集[C].中国气象学会,2003:4.
[19]李双成,蔡运龙.地理尺度的转换若干问题的初步探讨[J].地理研究,2005,24(1):11-18.
[20]Gallopin G-C.Human dimensions of global change:linking the global and local processes[J].International Social Science Journal.1991,43(4):707-718.
[21]Clark C.Urban population densities[J].Journal of the Royal Statistical Society.Series A(General),1951,114(4):490-496.
[22]潘志强,刘高焕.面插值的研宄进展[J].地理科学进展,2002,21(2):146-152.
[23]王雪梅,李新,马明国.基于遥感和GIS的人口数据空间化研宄进展及案例分析[J].遥感技术与应用,2004,19(5):320-327.
[24]黄河清,王有亮,胡宝清,等.基于神经网络和GIS的广西都安县人口数据空间化研究[J].测绘与空间地理信息,2009,32(6):46-49.
[25]曹丽琴,李平湘,张良培.基于DMSP/OLS夜间灯光数据的城市人口估算——以湖北省各县市为例[J].遥感信息,2009,1:83-87.
[26]董春,刘纪平,赵荣,等.地理因子与空间人口分布的相关性研究[J].遥感信息,2002,4:61-64.
[27]Harvey J T.Estimating census district populations from satellite imagery:some approaches andlimitations[J].International Journal of Remote Sensing,2002,23(10):2071-2095.
[28]Martin D.Mapping population date from zone centroid locations[J].Transactions of the Institute of British Geographers,1989,14(1):90-97.
[29]王珂靖.统计型人口数据多尺度空间化模型研究[D].上海:华东师范大学,2015.
[30]仝慧杰.森林生物量遥感反演建模基础与方法研究[D].北京:北京林业大学,2007. (责编:张宏民)