大数据时代国家区域援助对象识别的新路径

2021-06-28吕慧娜

大连海事大学学报（社会科学版） 2021年3期

吕慧娜

(上海立信会计金融学院保险学院，上海 201209)

区域发展不平衡[1]是各国社会经济发展的“一种普遍存在的现象，或者说是一个普遍存在的规律”[2]，国家区域援助是缩小区域差距的国际通行做法，我国亦然。然而，我国国家区域援助中存在的援助对象界定模糊、标准混乱、分类错综复杂、重叠交错等问题，不仅影响了国家区域援助政策的实施效果，而且在一定程度上产生了新的区域矛盾和社会问题，急需科学的方法对国家区域援助对象进行精准识别，并在此基础上实现精准定位、精准援助和精准退出。互联网数字痕迹追踪、存储功能的发展为国家区域援助对象识别开辟了新的路径，自然语言处理技术的提升以及智网工程的全面建构，又将大数据技术在国家区域援助对象识别领域的应用推向了新的高度。本文在对我国国家区域援助对象识别标准和方法的现有研究成果进行分析的基础之上，尝试从大数据技术的视角，对其在国家区域援助对象识别中的优势和面临的挑战进行先验呈现，并通过制度设计为我国国家区域援助提供大数据技术层面的对象识别进路，以期有助于国家区域援助更加规范化和高效性。

一、中国现行国家区域援助对象识别标准和界定辨析

国家区域援助对象是指存在区域问题且靠自身力量无法解决的“问题区域”(1)我国学者张可云教授提出“问题区域”的概念，即患有一种或多种区域病而且若无中央政府援助则难以靠自身力量医治这些病症的区域，并将区域问题分为落后病、萧条病和膨胀病三类，参见文献[3]。。关于国家区域援助对象识别，我国在实践层面和理论研究层面均存在识别标准混乱、区域类型划分多元，且彼此之间存在交叉和留白的局限。

(一)实践层面：国家区域援助对象界定标准粗细不一

自上而下实施的国家区域援助政策具有战略性意义，因而相关内容规定“宜粗不宜细”，这就导致援助对象只能做概念化界定，而无法进行具体化识别。另一方面，中央也会受到来自地方政府的压力，从而实施一些“一对一”的特殊优惠和支持政策。如此，国家区域援助对象的界定标准并不统一，导致各种标准下的援助对象划分十分混乱(见表1[4])，存在交叉和遗漏情形，并不十分科学。同时，援助对象单元太大，“不分良莠”地进行全覆盖，导致国家区域援助供需错位。比如在实施“西部大开发”、“东北地区等老工业基地振兴”等战略的过程中，由于西部地区、东北地区之类的援助对象界定单元太大，实践中将援助覆盖了西部和东北的所有地区。但是，并不是整个西部地区都属于欠发达地区，东北地区也并非都是老工业基地，相反，中西部地区的一些老工业基地、中部和东北地区的一些贫困地区在发展中也面临很多问题，需要国家给予一定的援助。[5]

表1 国家区域援助对象界定标准及结果概览

(二)理论研究层面：区域类型把握困难导致界定结论存在主观偏好

我国部分学者根据区域问题现象进行类型化，并根据区域问题的性质和严重程度甄别出那些依靠自身力量无法解决区域问题的区域类型，将之作为国家区域援助的对象区域，使得国家区域援助对象界定更为细致(见表2)。但是，各类型区域界定并不十分客观，在进行归类时难免掺杂个人主观判断，更进一步而言，“依靠自身力量无法解决区域问题”这一标准不可量化，因而这些区域援助对象识别的结果具有主观偏好。

表2 国家区域援助对象识别的主要研究成果

二、运用大数据进行国家区域援助对象识别的优势

随着大数据技术的发展、智能手机的普及和人们行为的普遍数字化，各区域范围内人们的生产生活行为及行为所蕴含的价值取向、财富状况、禀赋传承、文化涵养、生活习性、周边环境质量状况等极具个性化的因素，经过算法逻辑计算，得到了更为全面、客观、科学的展现。因此，运用大数据技术对各区域人们的数字化行为进行“捕捉”，从而具有获取“充分数据”的优势；同时，运用算法逻辑对所占有的“充分数据”进行计算和分析，可以使区域援助对象识别远离主观困扰。

(一)“充分数据”：对国家区域援助对象“样本数据”的超越

在国家区域援助对象识别中，大数据对“充分数据”获取的优势弥补了传统“样本数据”的统计和决策偏差，可谓一项意义重大的超越。“充分数据”的实现基于以下两方面的“充分”实现：一是人们生产生活行为的充分数字化；二是这些数字化在数字平台的充分展示。

第一个“充分”的实现：身份数字化是关键。随着大数据的蓬勃发展，人们生产生活的方方面面、企业的经营决策，甚至是国家机关的司法执法过程，都已经形成了对大数据的路径依赖。不言而喻，大数据技术已经成为一种高效且备受推崇的技术手段。而要享受大数据带来的“福利”，首先必须将自己的行为纳入大数据的范畴之内。在大数据时代，社会化能力的最大表征即数字身份的“加持”。因此，在对各区域进行数字扫描时，保证区域内居民的数字身份切换，是实现“充分数据”的关键。

第二个“充分”的实现：智网工程的全面建构。智网工程是大数据时代的新型基础设施，包括互联网覆盖和智能终端设备的普及。随着智能手机的普遍化，人们获取网络接口的途径更加便捷。此外，互联网的区域覆盖已成常态，“5G”的到来更是提高了人们畅游网络的效率。从主体端到数据端的过程，简化为“主体—智能终端设备—网络—数据形成”。在运用大数据进行国家区域援助对象识别的过程中，保障智网工程的区域建构是获取区域“充分数据”的必要条件，而要从全国层面对国家区域援助对象进行整体性识别和体系化界定，必须实现智网工程的全面建构。

(二)“算法逻辑”：提高了国家区域援助对象识别的客观性

国家区域援助对象识别主观上追求“充分数据”，以保证结果的科学性，但是由于网络痕迹形成的便宜性，信息过剩是无法避免的。国家区域援助对象识别并不需要对所有的数字信息进行计算，而只需要抽取其中的关键信息及相关信息。因此，数据抽取的过程就应进行算法设置。算法机制对个性化需求和普遍性需求以同样有效的分析路径获取，“带有正确程序的计算机确实可被认为具有理解和其他认知状态”[7]，并按照相同的逻辑进行计算，所以，数据抽取过程的算法设置直接决定着数据计算的最终结果，因而变得格外重要。一旦算法设定完毕，数据所代表的内嵌价值即不再起作用，外部人员对数据的价值判断也不会因人员的变动而变更，数据计算的最终结果只取决于算法。可见，算法机制的引入，提高了国家区域援助对象识别的客观性。

三、运用大数据进行国家区域援助对象识别所面临的挑战

国家区域援助公共政策的形成依赖于援助对象的精准识别，前提是对“充分数据”的占有和科学的算法逻辑。“充分数据”要求对个人数字信息进行全面公开，无论是主动公开还是强制公开，而个人数据信息事关个人隐私，不可避免地在个人隐私权保护与公共政策形成之间产生了价值冲突。算法的设置实质上是对过剩的数据进行剥离，如若抽取的数据不公正，就会对被搁置的数据产生数据歧视。同时，算法逻辑的设置也无法完全隔离人为因素，在一定程度上具有“价值他设”的局限性。

(一)价值冲突：公共政策形成与个人隐私权保护

国家区域援助政策是中央政府协调区域发展的重要举措，援助对象区域的识别是该项公共政策形成的前提和基础，同时也是决定政策实施效果的关键，不仅影响着国家整体经济结构的平衡状况，而且影响着各个区域和区域内各主体的利益。国家区域援助对象识别中对大数据技术的应用赋予“充分数据”以正当性，将大量的自然语言转化为大数据可接收的数据信息，经过算法计算后再“解释”成目标语言服务于调查目的和调查结果的实现。基于此，个体的充分数据化构成了大数据运行的基础，自我信息隐匿在一定程度上成为对公共政策和社会公共利益的“背离”。从这个意义上来讲，个体负有为区域协调发展和国家整体进步无私披露数据的义务。

但是，极具私密性数据信息(如反映主体财富状况的信息)的公开又会产生隐私权保护问题。由于数据公开涉及人的基本权利而被纳入人权范畴，成为人权体系的新的重要内容。欧盟十分重视数据保护问题，于2018年5月25日正式生效的《通用数据保护条例》中关于敏感信息豁免、被遗忘权和自主选择权等内容的规定，充分体现了大数据时代追求“充分数据”的激情潮流中对个体私有权益的保护，引起了各国重视。《中华人民共和国民法典》第六章专门规定隐私权和个人信息保护，正在起草中的《中华人民共和国个人信息保护法》也凸显了对个人信息进行法治保护的重要性。那么，在此问题上，数据相对隐匿又成为正当行为，对“充分数据”的执着反而成为对个人隐私权的侵犯。

综上，问题的核心就集中在那些与公共政策形成相关、同时又具有私密性的数据信息是否要公开。要实现从“充分数据”到公共政策的“跳跃”，就意味着对个体隐私权的放弃；可一旦这些信息被确定为私有权利并受法律保护，那么，公共政策形成所依据的基础数据信息就无法得到保障，最终的决策也会“失真”。这一问题恰恰体现了公共利益与私人利益之间的价值冲突。

(二)数据歧视：数据抽取不公正

大数据时代，数据公开与共享成为一种价值观趋向，数据构成的区域关系发生巨大变化，各区域生产生活行为的数字化或数字展示，反映了各区域的发展状况，对区域数据的抽取和计算有助于国家区域援助对象的识别。但是，数据抽取依赖于智能算法，算法一旦设定，所抽取的数据就会形成新的数据关系，在此数据关系基础上识别的国家区域援助对象区域，如果不能得到该区域和其他区域的认同，就会产生数据歧视。

一是对不符合数据抽取算法的数据的歧视。在数据算法的预判和抉择之下，海量数据“各就各位”，符合算法要求的数据参与到问题研究的分析、凝练中来，不符合算法要求的数据就会被“搁置”，令人不禁产生这样的疑问：这些被搁置的数据是否更具价值和意义？更何况数据发达地区和数据贫瘠地区在数据供给方面本就差异显著，若再经过算法的抽取程序，数据贫瘠地区被识别为国家区域援助对象的概率就更低。二是对不能完全反映真相的数据的歧视。数据的价值中立并不代表价值本身，因为数据的发布和公开是建立在数据拥有者的价值观和自由意志之上的。如同消费状况并不能真切反映财富拥有状况一样，数据也无法完全揭示真相。在国家区域援助对象识别中，对不同区域数据信息的数据抽取，可能会在一定程度上受到公开数据的误导，从而导致那些真正有利于援助对象识别的地域信息被掩盖掉。

(三)“价值他设”：算法逻辑的人为设定及其负效应

目前，对于国家区域援助对象识别的标准并无统一的界定，因此，在设置援助对象识别算法时不免会带入个人的价值和偏好，称为“价值他设”。这种“用偏好表达的效用”[8]873的正当性在运用大数据进行国家区域援助对象识别中需要重新衡量。假定将用于投资、教育和旅游等方面的消费达到个人财富一定比例的数据区域设定为发达地区，而将未达到这一比例的数据区域设定为欠发达地区，不免会形成一种“价值观霸权”，且这种价值观本身的价值也是值得进一步考量的。“价值他设”主要表现为算法逻辑的人为设定，在运用大数据进行国家区域援助对象识别的过程中，信息不对称、决策过程不透明、技术逃避等方面的问题更是加剧了“价值他设”的负效应。

首先，信息不对称导致算法计算结果偏离“他设价值”。一方面，国家区域援助对象识别的算法需符合国家区域援助的价值取向；另一方面，数据发布主体并不会主动配合该价值所导向的“充分数据”的公开性要求。这就导致数据源主体与数据应用主体之间信息不对称，不全面、不真实的数据将会导致算法计算结果出现偏差，与算法中所隐含的“他设价值”相去甚远，最终影响到国家区域援助对象识别的科学性。

其次，决策过程不透明无法保障国家区域援助对象识别过程中的公众参与。大数据通过智能算法实现从“数据”到“决策”的过程，算法在这一过程中就如同一个“黑箱”一样，虽然极大地简化了数据抽取、分析、凝练等复杂过程，但是不可否认的是，这一“黑箱”的处理过程完全封锁了公众参与的任何可能，公众的监督权无法得到实现，对于“黑箱”产出的结论只能被动接受。

最后，技术逃避对效率价值的追求与国家区域援助的公平价值目标相违背。技术逃避主要是指智能算法在处理海量数据时，对少数特征不太明显的数据，采取弃置、回避或直接划入带有算法设置主体“价值偏好”的类似数据群组的一种技术性操作。技术逃避的目的是简化数据处理程序，降低程序运行成本，体现了大数据时代“效率至上”的价值取向。然而，国家区域援助的本质是通过对欠发达地区的援助，帮助其获得与发达地区实质上平等的发展机会，追求的是公平价值目标。在运用大数据进行国家区域援助对象识别的过程中，如果继续放任技术逃避的算法设置，将会导致部分具有重要意义的数据被忽视，算法识别的最终结果的合理性也有待进一步考证。

四、运用大数据进行国家区域援助对象识别的进路设计

大数据作为基础性战略资源，给国家治理能力带来了深刻的影响和变革。基础性经济运行和社会生活方式中大数据的应用，促使政府也开始重视利用大数据进行科学决策。国家区域援助是一项调整区域发展结构、实现利益的空间再配置的国家政策。运用大数据进行国家区域援助对象的识别，不仅要处理好公共利益与个人利益的价值权衡问题，同时还要正视和接受数字经济时代的价值取向。在此基础上，要加强大数据立法，依法对公共政策形成中大数据的运用实施科学监管。

(一)伦理进路——数字经济时代的价值取向

1.价值序列重置：公共政策形成中个人隐私权保护的“让位”

对于国家区域援助对象识别中存在的公共政策形成所代表的公共利益与个人隐私权保护所代表的私人利益的价值冲突，不妨以反映个体贫困态的信息是否要公开为例进行展开。一方面，在人们对互联网信息传递、人肉搜索等产生心理恐惧而害怕向公众“裸展”的当口，回过头来反观我国扶贫实践，诸如人均年收入、家庭年收入、五保户身份、贫困县等信息也是完全公开的，所以何以畏惧网络环境中的数据公开会对个人隐私权产生更大、更严重的侵害呢？可以说，这是一种“多余的思想芥蒂”[9]。更何况，个体信息在整个区域贫困状况计算和评判中并不会成为“靶心”，最终该区域是否作为欠发达地区是视该区域的整体综合状况来评估和识别的，个体信息即使公开了，也仅仅作为基础数据库中的一个单元数据。另一方面，个人数据公开为国家区域援助对象识别做出贡献，援助政策的精准实施会帮助处于欠发达地区的个体脱离“贫困的陷阱”[10]，个体也就可以成功摆脱数据信息公开会侵害其隐私权的担忧。所以，在运用大数据进行国家区域援助对象识别时，公共政策形成所代表的公共利益应处于价值序列的第一位，个体利益应予以让位。

2.价值重塑：“歧视”的正义性与“算法制胜”

“自然语言的规模很大，而且处于不断的变化之中，所以很难处理。”[8]715而大数据技术的优势就在于从大量的数据信息中抽取有价值的信息进行处理，这依赖于智能算法。算法服务于数据运行目的，经过算法计算被抽取的数据具有针对性，而这种针对性也意味着对“充分数据”的歧视，因为从海量数据中抽取具有针对性的数据本身就带有不平等和歧视意味。但是，算法制胜是大数据的核心，在一定意义上，算法的价值高于“充分数据”的价值。因此，在运用大数据进行国家区域援助对象识别时，对援助对象识别算法更加重视的同时也就会对区域数据产生“歧视”。而不可辩驳地，算法逻辑的智能之处就在于其“歧视”本质，即通过算法“歧视”，对“信息过载”与“信息混沌”的大数据信息库进行挖掘，对有价值的数据进行抽取、分析和预判，依据数据的相对确定性，构建一种新的价值秩序。国家区域援助对象即是通过对发达区域数据的“歧视”才得以识别。

(二)实践进路——保障数据的充分获取及合法运用

1.充分调动各类大数据研究机构的数据资源

运用大数据进行国家区域援助对象识别是一项浩大的工程，且识别结果事关各区域及各区域内部各主体的发展权益，因而需要政府、高校、企业以及其他社会组织的共同参与。随着大数据研究越来越趋于专业化和多样化，政府应鼓励和引导大数据研究机构对区域问题的研究，为国家区域援助对象识别提供相应的数据资源。目前，政府主导设立的大数据研究机构、“城市大脑”已达几十家，主要是关于智慧城市、医疗健康、航旅、生态发展、教育等领域的研究。此外，高校成立的大数据研究机构多达上百家，企业及其他社会主体主导设立的大数据研究机构更在不断增多，涉及城市规划、农林、工业、重资产行业、旅游、经济、金融、电力、清洁能源等领域的研究。这些数据的价值远远不止实现各科研机构的研究目的，在国家公共政策的形成中，这些数据亦会发挥重要功效。比如，在国家区域援助对象识别中，根据各研究机构所提供的与金融相关的数据，再通过致力于数据分析与应用的大数据研究机构对这些金融数据所进行的分析，可以初步了解到各区域的金融发展状况及各区域间的金融交往状况，对于面临“资金外流”[11]、金融服务供给不足等问题的区域即可设定为金融援助区域，作为国家金融政策重点倾斜对象。

此外，还可以设立专门的区域大数据研究机构。比如在东北地区等老工业基地设置专门的产业型大数据研究中心，主要用于资源型城市的识别。其中，数据的收集主要集中在采掘业状况(产值、从业人员数、产值比重、从业人员数比重)、经济发展水平状况(生产总值、人均地区生产总值、发展趋势)、产业结构状况(三大产业比重及增长状况、三大产业就业结构)、外来投资结构状况(内资、港澳台投资、外商投资等的额度、比重)、环境状况(地质灾害发生频率及造成的损失、森林覆盖率、空气中污染物颗粒含量)、地方政府财力状况等。那些满足资源型城市识别算法要求的城市或城市群即可确定为国家区域援助的对象。

2.推动各地方成立大数据监管局

除了中央层面对数据安全的监管，各地方也应加强对大数据发展的引导、支持、规划和管理。2015年，国务院下发《关于印发促进大数据发展行动纲要的通知》，极大地推动了各区域大数据发展。根据《中华人民共和国网络安全法》，地方政府(主要为县级以上政府有关部门)有权进行网络监管，负有安全保护职责。截至2019年，各地方政府相继成立了79个大数据管理机构，主要负责拟定并组织实施大数据战略、规划和政策措施等。[12]可见，各地方大数据管理机构在运用大数据进行国家区域援助对象识别中将起到统筹和领导作用，因此，进一步推动各地方大数据监管局的设立，对于运用大数据进行公共决策十分重要。

就地域分布而言，这79个大数据管理机构中，31个位于我国西部地区，25个位于我国东部地区，12个位于我国中部地区，11个位于我国东北地区。显然，中部地区和东北地区的大数据管理相对不足，成为下一阶段推动大数据管理机构设立的重点区域。就职能范围而言，这79个大数据管理机构主要致力于本省(区、市)的大数据运行等各项事宜，服务的范围也仅限于大数据管理机构所在地。因此，拓宽大数据管理机构的覆盖范围成为当下大数据管理机构数量有限情况下的可行路径。

3.加强大数据服务于国家区域援助对象识别的相关立法

《“十三五”国家信息化规划》中明确确定由中央网信办为主要牵头方，会同各相关部门主要负责数据各方面的立法工作。2015—2019年国家层面出台大数据相关政策文件达36件，省级政府层面达200件。这些政策文件涉及的领域主要包括促进生态环境、农业、水利、城市、医疗、交通旅游等多层次下游应用市场，[12]其中并无国家区域援助相关的大数据政策，这主要是因为目前大数据的应用还未进入国家区域援助领域。鉴于运用大数据进行国家区域援助对象识别具有诸多优势，实践中发展这一领域是可以预见到的，加强事前立法，可以有效规避发展中的诸多问题，具有重大的实践意义。

关于大数据服务于国家区域援助对象识别的立法，应从中央和地方两个层面着手。首先，中央层面应制定大数据区域应用的基本法规范，明确区域领域大数据应用应坚持实质公平原则和差别原则，以社会公共利益为优先价值序位，同时对地方发展大数据的区域应用领域进行组织和程序规定；其次，地方层面应突出地域特性，在不与基本法相抵触的情况下，充分发挥地方的主动性，根据区域特点，选取合适的大数据发展指标，构建具有区域特色的区域识别标准体系。加强大数据区域运用的相关立法，可以促进大数据服务于国家区域援助对象识别的依法发展，并有效规范运用大数据进行公共决策的政府行为。法律的规定性，可以为大数据发展，包括数据的收集、存储、管理、开放、交易、应用等提供法律保护，并为大数据服务于国家区域援助对象识别提供明确的行为指引，有效增强政府干预区域市场的正义性和合目的性。

五、结语

大数据的发展正在深刻地改变着人们的生活和政府治国理政的方式，运用大数据技术服务于国家区域援助对象识别，是在我国当下区域发展差距不断拉大的情况下重塑区域援助制度价值的有力举措，具有重大的实践意义。对于运用大数据进行国家区域援助对象识别所具有的优势和所面临的挑战，加强规范是关键，其中最重要的是大数据立法。将大数据的区域应用纳入法治化轨道，可以有效促进大数据服务国家区域援助对象识别的依法发展，同时有效规范运用大数据进行公共决策的政府行为，妥善处理“国家—区域—个体”之间的“宏观—中观—微观”关系，与法治时代的发展要求相契合。