APP下载

基于法和Grubbs法甄别工程造价数据的方法研究

2018-05-10庄智斌

建筑与装饰 2018年4期
关键词:符合要求离群数值

庄智斌

陕西省建设工程造价总站 陕西 西安 710054

在日常实际造价管理工作中,经常要接触不同类型工程的造价数据,当数据采集来源较多时,加之很多单位对数据的收集及确定往往依赖从事预算工作人员的实际经验,但对于大多数新入行或实践经验不足的工作人员来说因缺乏辨别分析工程造价的基本经验,无法在短时期内积累并掌握对相关数据的辨别筛选能力,往往出现不必要的错误,导致数据分析的基准出现较大偏差,影响对后续工程的评判和处理。

1 工程造价数据甄别筛选的方法

目前对各类工程造价数据的分析主要根据个人经验进行,需要专业人员依靠自身的造价数据经验对工程项目内容逐条分析。虽然借助计算机软件可以快速查询和调阅相关工程编制的内容,改善分析处理项目造价数据花费的时间,但由于每个工程本身的数据量过于庞大,借助软件仍需要专业人员花费半天到一天时间才能看完一个项目,当项目数量较多达到十几甚至几十个时,专业人员仍需要耗费数天甚至数周时间和精力进行分析,严重地影响了数据采集和收集的效率,增大了数据处理的时间[1]。

为保证数据的准确性,提高相关人员筛选处理工程造价数据的能力,改善收集项目数据的水平,减少筛选数据的时间,可借助以下两种方法来筛选相应数据:

1.1 采用3δ法(拉依达法)

该方法是以3倍标准偏差(3δ)作为确定可疑数据取舍的标准。当某一测量数据xi与其测量结果的算术平均值之差大于3倍标准偏差时,用公式表示为|xi-|>3δ,则提供的数据为离群值,应舍弃。这种方法是基于正态分布理论,认为统计数据的均值μ和标准差δ服从正态分布。当样本数据在[μ-3δ,μ+3δ]之外的概

率是0.27%,基本属于小概率事件。很多国家在统计不同类型数据时都以此为界限,认为小概率事件通常不会发生,如果发生了,就属于异常。

其中,

由于项目数据收集初期,采集数据有限,样本数也不多,考虑将采集的数据范围适当扩大,根据现有数据和T分布临界点的确定,可将判定标准定为4δ,这是因为根据随机变量的正态分布规律,经多次试算,数据落在-4δ和+4δ之间的概率为99.99996%,出现在此范围之外的概率为0.00004%。在具体采集数据时,一旦出现超出范围的数据,就认定该项目数据为离群值,应将其舍弃或要求提供数据的人员做出说明,必要时再对该数据进行二次分析。

3δ法简单方便,不用查表,同时可以使用计算机辅助进行数据统计分析,要求较宽,当检测次数较多或要求不高时可以应用,特别适合在数据标准差不确定的情况下使用[2]。

1.2 采用Grubbs法(格拉布斯法)

Grubbs法是另一种简单便捷的数据筛选测定方法,具体数据处理方法是将新采集的数据与已有的同类数据从小到大进行排列,如果新数据在排列数值中间,即非最小值或非最大值,则认定该数据在正常范围内。如果新数据是最小值或最大值,就需要通过公式进行计算,并查相应表判定排查,确定其是否为离群值。

如果新采集的x1(最小值)是可疑数据,则

如果新采集的xn(最大值)是可疑数据,则

若计算结果为负值时,则Gn 取绝对值。

其中

计算出Gn值后,确定检出水平α。α是一个较小的百分数,可以是1%、2.5%、5%,即通过百分比值判定异常数据出现误判的概率,一般建议采用5%。根据n和α值,查表确定Gn(n,α)值。当Gn值大于表中对应数值时,该数据就是离群值,应予以剔除。Gn值小于表中对应数值时,则认定该数据符合要求,可以使用[3]。

该方法可在缺少计算机辅助,需要人工手动计算时来进行数据筛选甄别。

2 工程造价数据甄别筛选的实例

表1 框架结构住宅基础数据

表2 新增住宅工程数据

2.1 使用3δ法(拉依达法)计算筛选

根据区间值对新增数据做出判定:

2016年地直公租房3500元/m2在该数值区间,该数据可以认定可用。干部周转房1530.65元/m2不在数值区间,该数据为离群值,不符合要求,应舍弃[4]。

2.2 使用Grubbs法(格拉布斯法)计算筛选

根据基础数据和新增数据从小到大分别进行排列,数据如下:

2800,2800,3053.25,3063.58,3500

1530.65,2800,2800,3053.25,3063.58

由于新增数据分别位于基础数据的末端,为最大值和最小值,则需要分别对这两个数据进行计算筛选甄别。

对第一行数据的最大值进行计算

检出水平α确定为5%,查表G (5,0.05)值为1.672,则 Gn =1.596<G(5,0.05),可判定该数值符合要求,为可用数据。

对第二行数据的最小值进行计算

检出水平α确定为5%,查表G (5,0.05)值为1.672,则Gn=1.752>G(5,0.05),可判定该数值为离群值,不符合要求,应予以剔除。

以上两种数据筛选方式还可以互相进行校验,确保数据的准确性[5]。

3 结束语

利用3δ法和Grubbs法对房屋建筑造价指标数据进行的筛选和甄别,可以提高工程造价数据资料的准确度、加强数据取舍筛选的可靠性,简化数据分析过程,缩短数据分析时间,为数据的有效性提供保障。减少对造价专业人员经验的依赖性,改善数据量大时,专业技术人员分析项目数据的压力。

参考文献

[1] GB/T4883-2008.数据的统计处理和解释正态样本离群值的判断和处理[S].北京:中国标准出版社,2008.

[2] 蒋钧杰,谈飞.基于时间序列分析的工程造价指数预测[J].项目管理技术,2013,11(12):85-89.

[3] 王茜.浅谈建筑工程造价控制和管理[J].科技与企业,2014,5(09):190.

[4] 李惠玲,李晓琴,刘航天.建设工程造价指数的分析与预测[J].沈阳建筑大学学报(社会科学版),2013,15(1):74-77.

[5] 曹宁,高莹,徐根祺.房地产业与经济增长的研究[J].黑龙江科技信息,2014,(21):295.

猜你喜欢

符合要求离群数值
用固定数值计算
数值大小比较“招招鲜”
理清要求再解答
“9”变成“6”
离群数据挖掘在发现房产销售潜在客户中的应用
基于Fluent的GTAW数值模拟
离群的小鸡
分类思考 有序解答
应用相似度测量的图离群点检测方法
一种基于核空间局部离群因子的离群点挖掘方法