基于大数据的铁路工程投标企业异常行为预警研究
2020-02-13乔柱刘伊生茹建青
乔柱,刘伊生,茹建青
基于大数据的铁路工程投标企业异常行为预警研究
乔柱1,刘伊生1,茹建青2
(1. 北京交通大学 经济管理学院,北京 100044;2. 国家铁路局 工程质量监督中心,北京 100891)
基于铁路工程电子招投标积累的海量数据,识别预警具有异常行为的铁路工程投标企业。运用社团结构检测分析识别具有抱团行为的投标企业;再通过函数拟合预测投标企业中标次数,根据实际值与预测值的标准残差所落置信区间范围,分析识别中标次数异常的投标企业;最后综合分析2种方法的结果,构建铁路工程投标企业异常行为分级预警模型,识别具有串围标嫌疑的企业并分级预警。研究结果表明:基于铁路工程电子招投标大数据,综合社团结构检测和函数拟合分析两种方法,可以有效识别预警铁路工程投标企业的异常行为。
大数据;投标企业;异常行为;预警
铁路工程招投标违法违规行为具有复杂性和隐蔽性,传统监管手段难以及时高效甄别投标人不正当竞争行为。随着电子招投标和大数据技术的推广应用,招投标从传统纸质形式逐步进入电子化、数据化时代,这为创新铁路工程招投标监管提供了新途径、新方法。近年来,国内外在招投标大数据监管方面开展了一系列研究,大致可分为3阶段:第1阶段,从理论层面论述大数据技术可以创新招投标监管模式,提高监管效率,并构建基于大数据的招投标监管体系,探讨运用大数据分析反映招投标主体违法违规行为的指标[1-4]。第2阶段,运用大数据技术对某次具体招投标数据分析,如借助计算机技术的硬件代码、IP 地址、计价软件代码等提取技术,以及对投标文件、投标报价、工程量清单等进行雷同性分析,识别判定投标人串围标等不正当行为,这些技术方法主要用于招投标的事中事后监管[5-9]。第3阶段,结合招投标长期数据,分析招投标主体行为,研判招标人招标、评标人评标是否存在倾向性,投标人是否存在串围标嫌疑[10-13]。铁路工程建设周期长、工程量大、投资额高,招投标过程中投标人不正当竞争行为尤为突出。投标人通过违规手段谋取中标的行为在投标过程和投标结果上均会呈现异常,投标过程中的异常表现为抱团行为,投标结果上的异常表现为某投标企业的中标次数过高或过少。抱团行为在投标人构成的社会网络中呈现出社团结构,因此可用社团结构检测方法分析;中标次数异常通过构造拟合函数预测,以预测值与实际值的残差大小为分析依据。目前,投标人异常行为研究从中标次数方面的分析不多,主要集中在投标人社团结构检测上,且研究样本数量较少,所用社团结构检测方法大多未考虑投标人间共同投标次数,实际应用中可能出现社团结构检测无效的情况。因此,本文以铁路工程投标企业为研究对象,基于铁路建设工程招投标长期积累的数据,从抱团行为和中标次数2方面考虑,选用新的社团结构检测方法识别社团结构,同时构造拟合函数分析中标次数,从而研判投标企业异常行为,并构建分级预警体系为有关监管部门提供预警。
1 投标企业异常行为分析方法
1.1 社团结构检测
串围标企业在长期投标中会呈现抱团现象,以共同参加招标作为投标企业的连接关系,运用社团发现算法分析挖掘投标企业在招投标市场中形成的社团结构,可以客观、较准确的找出暗藏抱团行为的投标企业,也就是具有串围标嫌疑的企业[6]。
社团结构检测可以运用凝聚子群分析方法,建立在互惠性基础上的凝聚子群主要是派系,派系是最基本的凝聚子群,根据关系是否存在方向,可以分为无向关系网络中的派系、有向关系网络中的派系;根据取值情况,可以分为二值关系网中的派系、多值关系网络中的派系[14]。铁路工程招投标网络可以用无向多值关系网络展示,招投标过程中,共同参与一个招标项目的投标人,每对投标人的关系值记为1,当其共同参与招标的项目为时,这对投标人的关系值记为。
随着投标次数增加,大部分铁路工程投标企业会在某次投标中相遇,尤其成员数量不多的铁路工程施工企业,体现在投标企业关系网络上,大部分值均会大于等于1,且值会越来越大。由于大部分投标企业都有发生联系,派系分析时会得到一个包含大部分投标企业的社团结构,这样的分析结果显然没有意义,也无法反映投标企业的抱团行为。为避免派系分析无效,可设定凝聚子群强度,当2个投标企业共同投标次数大于某临界值时,才认为两者之间存在网络联系,这种分析方法得到的派系叫做“层派系”。“层派系”是指一个整体网中的子图,该子图中任何一对点之间的关系强度都不小于,并且在子图外的任何一点到该子图中的所有点的关系强度都小于。在研究无向多值关系网络的凝聚子群时,首先要确定该子群的凝聚强度,也就是要首先给出一个临界值,该临界值越大(小),所发现的子群的凝聚力就越强(弱)[14]。
1.2 拟合函数分析
串围标等异常行为的最终目的是为获得中标或不法利润,使原本最具竞争优势的承包商失去中标机会,从而左右中标结果,导致投标企业的中标次数过高或过少,因此通过分析中标次数也能发现具有不正当竞争嫌疑的投标企业。
在正常的招投标市场环境中,企业投标次数越多,中标次数也应较多,中标次数是投标次数的单调递增函数,基于招投标数据做中标次数与投标次数的函数拟合分析,通过拟合出的回归函数对投标企业的中标次数进行预测,当某投标企业的中标次数实际值与预测值残差过大时,该企业具有串围标嫌疑。
2 投标企业社团结构发现
2.1 投标企业网络关系建模
把铁路工程投标企业作为网络节点,参加过同一个招标项目的多家企业节点之间用边相连,多次共同参加相同招标项目可以看作节点的连接边的权重。假设参与招投标项目的企业总数为,则投标企业的邻接矩阵=(a)×n可规定如下。
对铁路工程投标企业进行层派系分析时,凝聚强度的临界值取平均每个投标企业参与投标的次数,且为整数,即:
2.2 投标企业的社团结构
运用UCINET软件进行分析。第1步:二值化处理,点击“Dichotomize”功能键,将107阶邻接矩阵导入,在“Cut-Off Operator”选项上点击“GE-Greater Than or Equal”,在“Cut-Off Value”选项上键入22,点击“OK”获得转换后的数据。第2步:派系分析,点击“Cliques”功能键,将转换后的数据导入,投标人最小规模为3,因此“Minimum size”选项值为3,点击“OK”获得如下40个派系,见表1。表1识别出的40个社团结构中共包含31个节点,表明这些企业在铁路工程长期投标过程中,呈现一种稳定的社团结构,也就是“抱团”行为,因此这些投标企业有很大的串围标嫌疑。尤其是10号投标企业在社团发现结果中的40个社团都存在,表明10号投标企业的社团结构性非常强,串围标的嫌疑更大,应作为重点监督检查对象。
表1 铁路工程施工项目投标企业社团结构成员组成表
3 投标企业中标次数与投标次数拟合分析
3.1 拟合函数构建
统计铁路工程中每个投标企业的投标次数和中标次数,将投标企业的中标次数作为因变量,投标次数作为自标量,运用软件Origin 9.0,分别进行线性函数、多项式函数、指数函数拟合,拟合后的结果如图1所示。
图1 投标企业中标次数回归函数
3.2 投标企业中标次数异常识别
回归分析中实际值与预测值的标准化残差服从标准正态分布,因此铁路工程投标企业中标次数与投标次数的拟合函数的标准残差服从标准正态分布[15]。投标企业标准残差是否异常的判定涉及到置信度的选取问题,置信度是评估某要素可靠性的指标,置信度对应置信区间,当标准残差落在置信区间外时,有理由认为该标准残差处于异常范围。置信度取值太高,会直接排除一些具有异常行为的投标企业,预警效果会大大折扣;置信度取值太低,会扩大异常行为的预警范围,增加监管部门排查异常行为的工作量。国家在《LED应用产品可靠性试验的点估计和区间估计(指数分布)》(GB/T 36362—2018)指出,置信度通常用百分数概率表示,一般取60%,因此本文置信度取值60%,即标准残差落在[-0.84,0.84]区间外的点均为需要预警的异常点。经计算,22家投标企业中标次数的标准残差落在置信区间[-0.84,0.84]外,这些节点的标准残差见表2。
结合图1进一步分析,1,2,3,4,5,12,15,17,20,31,33和67投标企业的中标次数在拟合曲线之上,且距拟合曲线的纵向距离较远,即中标次数远高于拟合曲线的预测值,这些企业存在为中标而拉拢其他投标企业进行串围标的嫌疑。9,18,20,23,29,36,43,62,64,65和82投标企业的中标次数在拟合曲线之下,且距拟合曲线的纵向距离较远,即中标次数远低于拟合曲线的预测值,中标次数过少甚至一直不中标,在优胜劣汰的机制下会被淘汰出铁路招投标市场,若其长期维持较低的中标次数且活跃于当地招投标市场,则其可能是串围标参与者(非发起者)或专业陪标人。
表2 落在置信水平60%对应的置信区间外的节点标准残差
4 投标企业异常行为分级预警
投标企业异常行为分级预警,可用于已招标项目监督抽查的范围筛选,选取具有异常行为的的投标企业参与的项目检查;以及招投标过程中重点监管对象识别,着重审查具有异常行为的投标企业,从而提高监管效能。本文根据投标企业异常行为反映出的串围标或陪标嫌疑程度,构建铁路工程投标企业异常行为分级预警体系,预警分五级,用绿(Ⅰ级,无警)、蓝(Ⅱ级,轻警)、黄(Ⅲ级,中警)、橙(Ⅳ级,重警)、红(Ⅴ级,巨警)5色代表从低到高5种嫌疑程度。
4.1 社团结构视角下的分级预警
从社团结构发现的视角,可以通过统计社团结构中每个节点的重叠概率进行分级预警,社团结构中每个节点的重叠概率见表3。
表3 社团结构中每个节点的重叠概率
假定节点重叠概率在(0,20%]为Ⅰ级预警,在(20%,40%]为Ⅱ级预警,在(40%,60%]为Ⅲ级预警,在(60%,80%]为Ⅳ级预警,在(80%,100%]为Ⅴ级预警,社团结构视角下不同预警级别对应的节点见表4。
表4 社团结构视角下不同预警级别对应的节点
4.2 拟合函数视角下的分级预警
从函数拟合分析的视角,可以通过实际值与函数预测值的标准残差所处不同置信水平区域对应的置信区间范围进行分级预警,不同置信水平区域对应的置信区间范围见表5。
表5 不同置信水平区域对应的置信区间范围
假定节点的标准残差落在[-1.04,-0.84) ∪(0.84,1.04]内为Ⅰ级预警,在[-1.28,-1.04)∪(1.04, 1.28]为Ⅱ级预警,在[-1.65,-1.28)∪(1.28,1.65]为Ⅲ级预警,在[-2.58,-1.65)∪(1.65,2.58]为Ⅳ级预警,在[-3.9,-2.58)∪(2.58,3.9]为Ⅴ级预警。
对应表2分级预警时发现,节点15的标准残差为4.22,超出置信区间最大的端点值3.9,而正常情况下的标准残差落在[-3.9,3.9]区间外的概率一般认为是0,因此可判断投标企业15极可能存在异常,直接将其纳入Ⅴ级预警。
进一步分析投标企业的中标数据,发现一些企业投标几十次的情况下,中标次数仍为0,该类企业作为专业陪标人的嫌疑极大,但其标准残差并未落在Ⅴ级预警的置信区间范围内。当某节点的中标次数为0,其标准残差落在置信水平90%对应的置信区间之外,可认为该投标企业存在极大陪标嫌疑。经计算,拟合函数分析中每个节点的残差服从(0,3.29)的正态分布,其标准残差服从(0,1)的标准正态分布,标准残差是残差除以其标准差后得到的数值。置信水平90%时,统计量=1.65,当标准残差s=1.65时,计算残差=2.99,即=2.99,带入拟合函数=Intercept+1*+2*2+3*3+4*4中,求得=46.68,即某投标企业投标不低于47次时,中标次数仍为0,其标准化残差s的值落在置信水平90%之外。节点36投标63次,而中标0次,该投标企业极有可能存在陪标嫌疑,将该投标企业纳入Ⅴ级预警。经分析调整后,拟合函数视角下不同预警级别对应的节点见表6。
表6 拟合函数视角下不同预警级别对应的节点
4.3 综合分级预警
单纯运用社团结构检测或中标次数预测方法预警投标企业的异常行为,会出现一些预警盲点,具有串围标或陪标高度嫌疑的投标企业不能被识别或被轻视。如,社团结构检测虽识别出节点15和36是社团结构的组成部分,但其节点在识别出的社团结构中的重叠率较低,分别被纳入Ⅰ级、Ⅱ级较低级别的预警中,而拟合函数视角下,节点15和36分别由于中标次数过高、几十次投标而一直不中标等问题被识别纳入到Ⅴ级预警中。再如,拟合函数视角下未识别出节点10的中标次数有异常,但社团检测识别出的40个社团结构中都有投标企业10的出现,节点10在社团结构视角下被纳入Ⅴ级预警。因此,综合考虑两种方法的分析预警结果,对铁路工程投标企业异常行为进行综合分级预警,步骤如下:
第1步,对投标企业进行社团结构检测,将识别的社团结构中重叠概率达到100%的节点直接纳入Ⅴ级预警。
第2步,构建拟合函数分析节点标准残差,将标准残差落在[-3.9,3.9]之外的节点直接纳入Ⅴ级预警;对中标次数为0的投标企业,将标准残差落在[-1.65,1.65]之外的节点直接纳入Ⅴ级预警。
第3步,不属于上述第1和2步情形的节点,按照式(3)对每个节点打分,
经计算,每个节点对应的分值见表7所示。
表7 综合情况下每个节点的分值
表8 综合情况下不同预警级别对应的节点
5 结论
1) 基于铁路工程电子招投标大数据,综合社团结构检测和函数拟合分析2种方法,可以有效识别预警铁路工程投标企业的异常行为。在预警分析应用中,凝聚强度、置信度、权重系数与、调整系数等值,需要根据实际情况不断优化调整,以提升预警的准确性。
2) 节点1,10,15,17,23和36共6家投标企业属于Ⅴ级红色巨警,有关监管部门应及时进行监督检查,分析投标文件、投标报价、工程量清单等内容,研判核实这些企业是否参与串围标或陪标;节点9,11,29和64共4家企业属于Ⅳ级橙色重警,应作为监管部门重点抽查或标后评估对象;节点4,5,24,25,26,33和43共7家投标企业属于Ⅲ级黄色中警,需要引起监管部门的重点关注。上述这些投标企业在今后的投标过程中均需作为重点监督对象,评标委员会也应给予重点审查,严防串围标或陪标行为的发生。
3) 处于Ⅰ级和Ⅱ级预警的投标企业,监管部门应保持跟踪观察,当其越级变为Ⅲ,Ⅳ和Ⅴ级预警时,应及时检查,以防不正当竞争行为发生。
[1] 宋建峰. 以大数据应用创新建设工程招投标监管思路[J]. 招标采购管理, 2018(12): 27-29. SONG Jianfeng. Thoughts on bidding supervision of big data application innovation construction project[J]. Tendering & Purchasing Management, 2018(12): 27-29.
[2] 刘雪峰. 大数据提速招投标改革和管理升级[J]. 施工企业管理, 2016(8): 98-100. LIU Xuefeng. Research on big data speed-up bidding reform and management upgrade[J]. Construction Enterprise Management, 2016(8): 98-100.
[3] 张珺. 基于大数据分析改进公共资源交易监管服务的思考[J]. 招标采购管理, 2016(3): 21-22, 25. ZHANG Jun. Thoughts on improving public resource transaction supervision service based on big data analysis [J]. Tendering & Purchasing Management, 2016(3): 21- 22, 25.
[4] 乔柱, 刘伊生. 大数据背景下我国电子招投标监管研究[J]. 工程管理学报, 2019, 33(1): 1-5. QIAO Zhu, LIU Yisheng. Electronic bidding supervision under the background of big data[J]. Journal of Engineering Management, 2019, 33(1): 1-5.
[5] 程铁信, 刘文涛, 王朝阳, 等. 工程招标中的围标串标预警模型研究[J]. 天津大学学报(社会科学版), 2018, 20(1): 20-25. CHENG Tiexin, LIU Wentao, WANG Chaoyang, et al. Early warning model for together-conspired or colluded bidding behavior based on the similarity of projects bidding documents[J]. Journal of Tianjin University (Social Sciences), 2018, 20(1): 20-25.
[6] 孟令之. 基于复杂网络的水务工程电子招投标不正当竞争分析[D]. 天津: 天津工业大学, 2018: 17-33. MENG Lingzhi. Analysis of unfair competition in electronic bidding of water engineering based on complex network[D]. Tianjin: Tianjin Polytechnic University, 2018: 17-33.
[7] Padhi S S, Wagner S M, Mohapatra P K J. Design of auction parameters to reduce the effect of collusion[J]. Decision Sciences, 2016, 47(6): 1016-1047.
[8] Dastidar K G, Mukherjee D. Corruption in delegated public procurement auctions[J]. European Journal of Political Economy, 2014(35): 122-127.
[9] Joshi S, Vora P L. Weak and strong multimarket bidding rings[J]. Economic Theory, 2013, 53(3): 657-696.
[10] 樊群, 殷静, 关华滨, 等. 基于大数据的围标串标行为识别关键技术研究[J]. 建筑市场与招标投标, 2016(6): 46-52. FAN Qun, YIN Jing, GUAN Huabin, et al. Research on key technologies of beacon stringing behavior recognition based on big data[J]. Construction Market and the Bidding, 2016(6): 46-52.
[11] Morselli C, Ouellet M. Network similarity and collusion[J]. Social Networks, 2018(55): 21-30.
[12] Reeves-Latour M, Morselli C. Bid-rigging networks and state-corporate crime in the construction industry[J]. Social Networks, 2017(51): 158-170.
[13] 刘智焕. 数据挖掘技术在投标报价评审中的应用[J]. 贵州大学学报(社会科学版), 2017, 35(6): 60-64. LIU Zhihuan. The application of data mining technology in the evaluation of bid quotation[J]. Journal of Guizhou University (Social Sciences), 2017, 35(6): 60-64.
[14] 刘军. 整体网分析[M]. 上海: 格致出版社, 2014: 153- 165. LIU Jun. Lectures on whole network approach Lectures on whole network approach[M]. Shanghai: Troth & Wisdom Press, 2014: 153-165.
[15] 丁勇. 误差绝对值的统计特征和应用[J]. 数理统计与管理, 2016, 35(1): 39-46. DING Yong. The statistical characteristic and application of the error absolute value[J]. Journal of Applied Statistics and Management, 2016, 35(1): 39-46.
Research on early warning of abnormal behavior of railway engineering bidding enterprises based on big data
QIAO Zhu1, LIU Yisheng1, RU Jianqing2
(1. School of Economics and Management, Beijing Jiaotong University, Beijing 100044, China;2. Engineering Quality Supervision Center, National Railway Administration of the People’s Republic of China, Beijing 100891, China)
Based on the accumulated data of railway engineering electronic bidding, the railway engineering bidding enterprises with abnormal behavior was identified and early warned. Firstly, this paper used the community structure detection to analyze and identify the bidding enterprises with group behavior. Secondly, by predicting the successful bid number of bidding enterprises by function fitting, and calculating the location of the standard residuals of actual value and predicted value for the confidence interval range, the bidding enterprise with the abnormal number of successful bids was analyzed and identified. Finally, considering the results of the two methods, and building an early classification warning model for the abnormal behavior of railway engineering bidding enterprises, enterprises under suspicion of together-conspired bidding and contacting bid was identified and early classification warned. The research shows that the railway project electronic bidding big data can effectively identify and early warn the railway engineering bidding enterprises with abnormal behavior, comprehensively using the two methods which includes community structure detection and function fitting analysis.
big data; bidding enterprise; abnormal behavior; early warning
10.19713/j.cnki.43-1423/u.T20190248
C931
A
1672 - 7029(2020)01 - 0250 - 08
2019-04-01
国家自然科学基金资助项目(71841022)
乔柱(1991-),男,河南南阳人,博士研究生,从事铁路工程招投标研究;E-mail:15510636872@126.com
(编辑 蒋学东)