基准地价评估中异常样点剔除方法研究
2012-06-03王令超宋艳华
王令超,杨 欣,宋艳华,樊 鹏
(1.河南省科学院 地理研究所,郑州 450052;2.平顶山学院,河南 平顶山 467002)
0 引言
基准地价是指在城市规划区范围内,对现状利用条件下不同级别或不同均质地域的土地,按照商业、居住、工业等用途,分别评估确定的某一估价期日上法定最高土地使用权区域平均价格[1]。
从基准地价的定义可以看出,基准地价是特定用途的土地使用权区域平均价格,这就要求区域内样点地价应分布在合理区间,为了满足这一要求,必须对个体样点数据进行检验,剔除样点地价中异常值。所谓异常值,是指同一级别或同一均质区域内同一土地利用类型样点中,由于某些特殊因素而造成地价明显高于或低于其他样点的地价数据,此类样点不能反映其所在土地的实际地价水平。另外,在外业数据调查过程中,同类近似宗地的调查样点数目往往过多(如商业门面房出租样点)、不同区域交易发生的密度相差较大或外业采点的人为倾向,也往往会造成地价样点价位以及价格在空间分布上不合理。为了使基准地价能够合理的反映一个区域的实际情况,必须对这些异常样点进行检验、剔除。
基准地价评估中,在测定样点总体分布类型后,需要用合适的方法对数据进行检验并剔除异常值。《城镇土地估价规程》规定[1]:“用 t检验法和均值-方差法分别对样本总体为正态和非正态分布的进行异常剔除”、“相同用途的样点地价,在确定方差检验精度后,精度以外的数据作为异常数据剔除”。本研究仅对样本总体为非正态分布时,均值-方差法剔除异常数据存在的缺陷和解决途径进行分析探索。
1 均值-方差法缺陷分析
均值-方差法直观易懂、操作简便,是基准地价评估中样本总体为非正态分布时常用的删除异常样点的方法,但是该方法存在一定缺陷,对基准地价评估具有较大影响。
1.1 均值-方差法剔除异常样点过程
1.1.1 样点地价排序。将级别或均质区域内某一用地类型样点地价由大到小顺序排列:P1,P2,P3,…,Pn。
1.1.2 计算样点地价的平均值。
式中:n为样点个数(下同)。
1.1.3 计算样点方差S。
1.1.4 确定剔除的标准。当Pi∈[+k×S]时,认为Pi为正常样点,否则,则为异常值,予以剔除[2-3],其中k为系数,《城镇土地估价规程》没有规定k的范围,在实际应用中由基准地价评估者根据情况确定,大多数评估中取k=2。
1.1.5 归并整理。将剔除异常值后的样点地价进行归并整理,作为测算基准地价的基础数据。
1.2 均值-方差法的缺陷
1.2.1 剔除标准难以确定。多数情况下方差是一个较大的数值,有时甚至是平均值的数倍、数十倍,当k=1时,往往还会出现所有样点都在[+k×S]内的情况,达不到剔除异常样点的目的。有时k的值通常在0.1以下甚至更小时才会出现少数样点不在[,]内的情况。同时,不同级别在剔除异常样点时所采用的k值也多不相同,这些都造成k的取值规律难以把握,加大了评估过程中人为因素的影响。
1.2.2 无法体现级别基准地价的内在联系。《城镇土地估价规程》规定的均值-方差法剔除异常样点是以级别为单元独立进行的[1],剔除过程中没有考虑级别之间的变化趋势、对比关系和内在联系,在实践中往往会出现应用均值-方差法剔除异常样点后计算的级别基准地价无法满足“级别之间存在正级差,且高级别级差大于低级别级差”的基本原则。
1.2.3 破坏了样点地价空间分布的连续性。从剔除异常样点的过程可以看出,均值-方差法仅考虑样点数据数值的大小,忽略了其空间属性。一些样点尤其是商业门面房出租样点,一般情况下在空间上会呈现连续分布的特点,其地价也会表现出随土地质量变化而相应变化的规律。然而,即使样点地价都真实合理,一般情况下在级别边界附近,处于高级别一侧的样点地价大部分会低于本级别的(正常样点值得下限),而处于低级别一侧的样点地价则大部分会高于本级别的(正常样点值得上限),这样,应用均值-方差法便会将级别边界两侧的大部分样点剔除,从而在级别边界两侧形成一个样点的“真空地带”。在均值和方差S一定的情况下,“真空地带”的范围与k的大小成反比,k越大,“真空地带”相对越小;k越小,则“真空地带”相对越大。
1.2.4 影响宗地地价评估。应用均值-方差法剔除异常样点后,保留下来的不同级别样点在地价—总分值构成的二维坐标系内呈阶梯状分布,给容积率修正系数计算、商业路线价及路线价修正系数计算等带来不便,直接影响宗地地价评估。
2 均值-方差法的改进
数理统计中的样点变量一般具有独立性和随机性,但地价样点并非完全随机分布,它们在空间上存在着相关性。根据土地的区位理论,城镇土地因其相对位置不同,在空间上表现出不同的使用价值、不同的经济效益和不同的地租地价,级别越高的土地其地价相应越高[4-6]。所以,在进行样点检验时,应该把样点地价和土地位置联系起来。把样点地价与土地位置联系起来本质上就是把样点地价与土地质量联系起来,而定级总分值是土地质量的量化表现,因而可以把样点地价与其所在位置的定级总分值联系起来。通过建立数学模型,计算出总分值的理论地价。《城镇土地估价规程》规定的应用样点地价和土地定级单元总分值数学模型评估级别基准地价[1]就是通过计算定级单元或样点的定级总分值的理论地价来实现的,说明理论地价能够反映定级估价区域的地价分布规律、变化趋势和基本地价水平。因而,可依据样点定级总分值的理论地价进行异常样点的剔除。
用总分值理论地价进行异常样点剔除的基本思路是通过建立样点地价和其总分值的数学模型,测算出总分值的理论地价,将样点总分值对应的理论地价作为样点地价的理论平均值;计算不同总分值样点地价的理论标准差,以理论平均值和理论标准差为标准来判断样点地价是否异常,从而完成异常样点剔除,该方法的均值和标准差与定级总分值呈有规律的曲线分布,故称该方法为理论曲线法。具体步骤:1)把样点与定级总分值图叠加,获取样点的定级总分值。2)建立样点地价与定级总分值的回归模型。3)根据回归模型的相关系数、模型的内涵以及外延的变化趋势确定最终模型并计算总分值为x时的理论地价Dx。4)计算总分值为x的样点地价的标准差:
式中:bx为总分值为x的样点地价的标准差;Pxt为总分值为x的第t个样点的地价;Dx为总分值为x时的理论地价;m为总分值为x的样点个数。5)为了减少不同总分值之间样点个数差异对bx的影响,建立bx与x的回归模型,规范总分值与样点地价标准差的关系,并计算总分值为x的理论标准差Bx。6)确定正常样点范围。总分值为x的正常样点下限:
总分值为x的正常样点上限:
当Pxt∈[Dx下,Dx上]时,认为Pxt为正常样点,否则,则为异常值,予以剔除,其中a为系数。
3 实证分析
在新乡市2008年商业基准地价测算中,共调查房屋出租样点1 324个,依据SPSS软件的相关规定[7],采用Shapiro-Wilk(W检验)检验法对数据进行正态分布检验(表1),若统计显著性Sig>0.05,则表明数据服从正态分布,否则,为非正态分布。检验结果表明各级别地价样本总体为均为非正态分布。分别采用均值-方差法和理论曲线法2种方法进行剔除异常样点,并对2种方法的差异进行了比较分析。
表1 级别样点总体分布检验表Tab.1 Inspection of grade samples population distribution
3.1 均值-方差(标准差)法剔除异常样点
计算出原始样点地价的级别平均值、方差后,发现方差数值过大,难以应用均值-方差剔除异常样点,故采用均值-标准差(k=1)确定正常样点地价的范围(表2)并据此剔除异常样点。
表2 均值-标准差剔除异常样点统计表Tab.2 Statistical results of mean-standard deviation excluding abnormal samples
3.2 理论曲线法剔除异常样点
通过对多种回归模型的比较分析,确定了理论地价回归模型和理论标准差回归模型。3.2.1 理论地价回归模型。
式中:Dx为对应于总分值x的理论地价;x为总分值。常数项反映的是末级地地价的理论下限,模型中的常数项673.6元/m2与新乡市商业用地末级地最低出让地价大体相当。为直观地观察理论地价与总分值的关系,等间距选择了部分总分值计算其理论地价(表3),从中可以看出理论地价与总分值存在正相关关系。3.2.2 理论标准差回归模型。
式中:Bx为对应于总分值x的理论标准差;x为总分值。同样,从表3中可以看出理论标准差与总分值也存在正相关关系。
3.2.3 正常样点范围及异常样点剔除。为便于与均值-方差(标准差)法进行比较,a值取1,则总分值为x的正常样点下限、上限分别为:
根据(8),(9)式和样点总分值计算样点正常值的上下限,并以此确定样点是否异常,从而完成异常样点剔除(表4)。
表3 理论地价与总分值关系表Tab.3 The relation between theoretical land price and total value
表4 理论曲线剔除异常样点统计表Tab.4 Statistical results of theoretical curve excluding abnormal samples
3.3 两种剔除方法对比分析
3.3.1 异常样点数量不同。均值-标准差法剔除异常样点303个,理论曲线法剔除异常样点364个,后者明显多于前者。
3.3.2 异常样点分布区域不一致。以级别为单元进行异常样点剔除时,一些样点属于正常值,若将样点和其质量属性联系起来,并将级别与级别也联系起来从整体考察样点,则这些样点可能就属于异常样点,均值-标准差剔除的异常样点47.23%分布在级别界限两侧,而理论曲线法剔除的异常样点仅有19.11%分布在级别界限两侧,表明理论曲线法剔除异常样点更倾向于整个定级估价范围。
3.3.3 对级别平均值的影响不同。均值-标准差法剔除异常样点后的级别平均值与原始样点计算的级别平均值比较接近,差别最大的四级地相差也不过1.5%;理论曲线法剔除异常样点后的级别平均值与原始样点计算的级别平均值之间差异增大,差别最大的六级地可达4.12%。表明均值-标准差法剔除异常样点对计算级别平均值的作用较小,相比而言,理论曲线法剔除异常样点则对计算级别平均值有较大影响。实际上均值-标准差法剔除的异常样点,一般情况下既有数值较大的样点,也有数值较小的样点,所以其对平均值影响较小,只有在样点总数较少,且异常样点的数值为极端值时,才会对平均值的计算有较大影响;对级别而言,理论曲线法剔除的异常样点并非都对称分布在其平均值两侧,故其对级别平均值的影响要大于均值-标准差法。
3.3.4 对级别之间的对比关系影响不同。均值-标准差法剔除异常样点是以级别为单元进行的,无法兼顾级别之间的对比关系;而理论曲线法剔除异常样点是从整体出发,以地价与整个估价区域土地质量的关系为基础进行剔除,若样点偏离地价与土地质量的变化规律或趋势,则样点就会被剔除,从而使保留下来的样点能够反映地价与土地质量的关系,如二级地剔除的异常样点大多位于其低值区,而六级地剔除的异常样点大多位于其高值区。这样,通过异常样点剔除使级别之间对比关系更加科学合理。
3.3.5 级差分布不同。两种方法剔除异常样点后的级别平均值的级差不同(表5),在均值-标准差法剔除异常样点后的平均值级差中6~7级级差大于5~6级级差,且6~7级级差与4~5级级差十分相近,这种分布形态不能科学合理反映商业用地土地质量的变化规律;理论曲线法剔除异常样点后的平均值级差体现出“级别之间存在正级差,且高级别级差大于低级别级差”的基本规律,且级差具有渐变过渡的特点。
表5 级别基准地价级差对比表Tab.5 The comparison between the standard land price differential and the land grade
3.3.6 与最终评估结果吻合程度不同。2008年新乡市基准地价更新调整中采用了房屋出租、房屋买卖、柜台出租、土地使用权出让、土地使用权转让等多种方法进行测算,经专家论证、社会各界代表听证,综合各种方法测算结果,最终确定了商业用地级别基准地价调整结果(表6)。将两种测算结果分别减去最终结果,再与最终结果相比可得到差异程度(表6),可以看出,除四级地外,理论曲线法测算的结果与最终结果的差异程度较小,均值-标准差法测算的结果与最终结果的差异程度相对较大,说明理论曲线法测算的结果更接近实际。
表6 两种方法计算结果与最终结果的差异程度Tab.6 The difference between the calculated results of two methods and the final result
4 结论
理论曲线法剔除异常样点保持了样点空间分布的连续性,体现了级别基准地价各级别之间的内在联系,使级别之间的对比关系更加科学合理,使评估结果更加符合实际。理论地价模型、理论标准差模型的确定和建立不能只依据R2的大小,而应综合考虑R2、模型的内涵以及外延的变化趋势来确定,在确定理论地价模型时还要考虑常数项的大小和意义。标准差倍数a应根据样点的分布情况确定,样点离散程度大a相应较大,样点离散程度小则a也较小;在具体剔除过程中,可选择大、中、小多个数值进行比较,确定合理的a值。模型的科学性和可靠性与样点数量密切相关,故样点较少时不宜采用理论曲线法。
[1]国家质量监督检验检疫总局.城镇土地估价规程(GB/T18508 -2001)[S].北京:中国标准出版社,2002.
[2]王平,唐旭,祝国瑞.基于回归模型与优化算法的样本检验方法探讨[J].昆明理工大学学报(理工版),2004,29(3):17 -20.
[3]陈幼松,杨位钦.实用数理统计方法及应用详解[M].北京:北京科学技术出版社,1998:83-134.
[4]陈思源,曲福田,倪绍祥,等.GIS空间分析支持下的城市地价分布研究[J].南京农业大学学报,2005,28(3):119-122.
[5]张洪,金杰.中国省会城市地价空间变化实证研究[J].中国土地科学,2007,21(1):24 -30.
[6]王克忠.城市地价与地价体系[J].财经研究,1994(7):23-25.
[7]陈平雁.SPSS 13.0统计软件应用教程[M].北京:人民卫生出版社,2006:30-35.