城市边缘区失地农户生计策略选择
2021-11-06周恩毅聂思言
周恩毅,聂思言
(西安建筑科技大学 公共管理学院,西安 710055)
一、问题的提出
改革开放以来,中国工业化、城镇化进程不断加快。为实现城市空间扩张,大量城市边缘区农地被征收,由此产生了数以千万计的失地农户[1]。有关部门预计,到2030年我国的失地农民将达到1.1亿人[2],失地农民问题已演变成群体风险问题[1]。失地农户的生存和发展问题一直受到党和国家的高度关注。2014年中共中央国务院印发的《国家新型城镇化规划(2014-2020)》明确提出要走“以人为本”的中国特色新型城镇化道路,时刻关注城镇化发展面临的各种风险挑战,保障农户的生存和就业[3];2018年《中共中央国务院关于实施乡村振兴战略的意见》又对农户的生计发展做出较为详细的规定,提出要拓宽农户生计策略选择路径,丰富农户生计方式[4];2020年《土地管理法》又从法律层面完善了土地征收程序,明确了征地范围,并规定不降低征地农民原有的生活水平。毋庸讳言,中国城市化进程仍将持续推进,它对失地农户带来的冲击在短期内无法消除,选择合适的生计策略被认为是农户规避风险冲击、积累资本、维持长远发展的重要途径。因此,如何引导失地农户选择合适的生计策略,实现生计转型并且适应城镇生活成为重大现实问题。
生计策略是指农户组合利用自己的生计资产来实现生计目标或追求生计长远发展[5],农户的生计策略不是自由选择的,而是受到资本、制度、社会多方面的约束[6]。以往关于失地农户生计策略选择的研究主要集中在:(1)失地对农户生计资本和生计策略的影响。政府期望通过征地推动城镇化发展并促进农户的非农就业,但一些研究发现,征地打破了农户原有的生计稳定,使缺乏“农转非”增收渠道的农户收入下降,并逐渐陷入相对贫困[7]。同时,失地意味着农户生计资本的数量及结构发生变化,农户必然采取相应策略来应对这些变化[6]。(2)生计资本对生计策略的影响。研究表明,生计资本的差异会使生计活动呈现出多样化,从而导致农户选取不同的生计策略。自然资本存量对农户继续从事农业经营活动有正向影响,人力资本的提高有助于失地农户从事非农活动[8],因此失地农户会主动选择替代性生计策略来实现生计的可持续发展。(3)对失地农户适应性的分析。失地农户适应城镇生活的过程就是以土地为基础的农民权利体系向以个体为基础的市民权利体系转换的过程,这一过程不仅伴随着生产和生活环境的变化,而且还面临着社会关系的重塑及思想意识的变迁。而适应性的核心是适应能力,因此失地农户需要提高适应能力来主动适应生产、生活方式以及居住空间的转变,更强的适应能力也意味着更快的就业、更高的收入和有机会选择更合适的生计策略。
从已有研究看,学界基于失地农户生计策略选择问题展开了一定的探讨,为本文提供了有益思路,但也存在以下不足:首先,现有研究多集中于失地农户生计资本变化的分析,但生计资本变化仅是农户整个生计活动的一部分,资本重新配置引起农户生计活动的变化即生计策略的转变才是实现可持续生计的关键。因此,从生计策略选择的视角研究失地农户问题更具有现实意义。其次,已有文献很少综合考虑生计资本、适应能力、制度环境共同在生计策略选择中发挥的作用,并且未能构建系统的指标体系对失地农户的生计策略选择进行研究。再次,现有文献多局限于对失地农户生计策略选择的影响因素研究,鲜有对失地农户如何进行生计策略选择提供具体的方法指导。基于此,本文尝试做以下扩展:第一,构建失地农户生计策略选择的分析框架,以反映失地农户生计变化的全貌;第二,从生计资本、适应能力和制度环境三方面分析影响失地农户生计策略选择的指标;第三,运用ANP构建失地农户生计策略选择的模型,具体分析失地农户如何进行生计策略的选择,并通过SVM提高失地农户生计策略选择模型的应用范围和推广性。
二、理论分析与研究框架
哪些因素影响失地农户的生计策略选择呢?学界主要运用社会排斥分析框架、脆弱性分析框架和可持续生计分析框架这三种框架来进行分析。社会排斥分析框架主要从制度政策层面来探讨影响失地农户生计策略的原因。失地农户面临着资源获取、身份转换以及融入城市生活的阻碍,并受户籍制度等结构化制度环境的影响,相对于城镇居民而言,获取的人力资本和社会资本更少,享受的公共服务也更加不足,因而失地农户在拓展生计策略的机会和能力上与城镇居民存在较大差异[5]。脆弱性分析框架则是探讨农户面临的生计风险,主要包括健康、失业、自然、文化等风险,为了应对这些风险,农户必然主动或被动地提高适应能力,以便选取更合适的生计策略[9]。可持续生计分析框架更加关注生计主体自身的努力与发展,同时注重政府的支持以及外部环境的影响,并强调通过动员人力、金融等多种形式的资本,共同实现农户的长远发展而非短时期内的收入增加[10],认为农户会基于自身的生计资本和制度环境来调整生计策略[5]。
上述三种分析框架强调了制度政策、生计资本、个体能力等多重因素对失地农户生计策略选择的交互作用,且要素之间存在互动关系,与农户“在面对失地冲击后,利用自身的生计资本采取不同的生计策略并获得相应生计结果”的活动具有契合性[11]。可以说失地农户的生计策略选择既要考虑生计资本的积累及农户的个体适应性,也要考虑制度化环境的影响。失地农户进行策略选择时不能只考虑单一要素,需要理清多种因素的共同作用及其内部关联[5]。
本文尝试将生计资本、适应能力和制度环境三类因素纳入失地农户生计策略选择的考察,并据此构建“制度环境-生计资本-适应能力-生计策略选择”分析框架(见图1),来合理呈现失地农户生计策略选择的个体性因素和制度结构性因素的内在逻辑关系。对该框架有两点说明:首先,生计策略选择的表现是农户在新环境的生计获得和维持,即失地农户依据自身的生计资本,通过不断提高适应能力,进行生计资本的再生产和转化,其中的关键就在于:“农户拥有怎样的生计资本”以及“具备了哪些适应能力”;其次,制度环境是否会影响失地农户的生计策略选择?制度环境所包含的就业培训、医疗卫生、养老保障等内容,正是影响失地农户生计策略选择的重要环节。
图1 “制度环境-生计资本-适应能力-生计策略选择”分析框架(1)注:虚线部分旨在补充说明失地农户生计策略选择的机理,不作为具体讨论。图中N为自然资本,H为人力资本,S为社会资本,P为物质资本,F为金融资本。
三、数据来源与研究方法
(一)研究区域概况
陕西省西安市地处关中平原,位于北纬33°39′~34°44′、东经107°41′~109°49′之间,2019年全市常住人口1 020.35万人,城镇人口761.28万人,城镇化率为74.61%。西安市地域广阔且历史悠久,是西部地区重要的中心城市。近年来,经济发展迅速,进入城市化的快速推进时期,尤其是在“沣西新城”等新区建设项目的驱动下,西安城市空间不断扩展,建成区面积从2014年的521.91平方千米增加到2019年的729.14平方千米。城市建成区面积的扩大离不开对城市边缘区农村的征地拆迁,据不安全统计,西安市失地农民总量已超过50万,约占西安市农业人口的25%[1],因此,将西安市作为典型研究区具有一定的代表性。
城市边缘区是城市化快速发展下的特殊综合体,兼具城市和农村的双重特征,因此本文综合考虑人口特征、景观紊乱度、建设用地面积等衡量指标,选取了西安市周边的沣西新城、沣东新城、高新区、长安区、高陵区作为调查研究区域。
(二)数据说明
本文数据来源于课题组2019年进行的入户调研和深度访谈。具体过程如下:2019年1-12月,对西安城市边缘区进行实地考察,利用分层随机抽样法选取38个村庄作为调研样本,这些村庄呈散点状分布在西安的边缘区。其中,位于高陵区和长安区的18个村庄已在5年前经历过征地,并且积累了大量生计策略选择的经验,而位于高新区、沣东新城和沣西新城的20个村庄处于面临征地或刚经历征地不久的情况,该地区农户的生存环境及生计资本都发生了改变,面临着生计策略的选择。因此,已进行生计策略选择农户的实践能给将要进行生计策略选择的农户提供一定的借鉴和参考,通过系统总结已经失地农户选择的生计策略,能明确未进行生计策略选择的农户可选的策略类型。2019年1月,设计问卷并进行预调研,依据预调研的反馈结果对问卷进行修改,确定最终问卷。11月,采取等比例抽样法对各村庄的失地农户进行正式调研,其中高陵区和长安区共发放问卷989份,回收问卷885份,有效回收率为89.48%;沣西新城、沣东新城、高新区共发放问卷543份,回收问卷489份,有效回收率为90.1%。问卷内容包括被调查者的基本情况、家庭收支情况、就业情况、社会保障情况以及征地安置赔偿等。
(三)研究方法
1.K-均值聚类法。本文采用K-均值聚类法对失地农户的生计策略进行划分,目前生计策略划分的方法主要有主观判断法和聚类分析法两种,其中聚类分析法依赖于实际数据,因此更为客观。机器学习中最常见的任务有回归、聚类和分类,K-均值聚类法是一种无监督的聚类学习算法,在不需要任何其他先验知识的情况下,根据样本的属性空间中的欧氏距离把样本划分为K类,依据算法的迭代规则,使得每一次迭代的K类样本的平均值相互距离最远,直至收敛[12]。
2.网络分析法(ANP)。本文主要通过ANP确定失地农户生计策略选择的指标权重,从而进行生计策略的选择分析。由于本文的指标间具有很强的依存关系,而ANP可以通过定量与定性相结合的方法来厘清指标间的相互关系,解决同一层次之间指标互相依存的问题,从而提升决策的准确性。ANP的基本思路是:首先确定决策目标,界定决策准则,比较各指标相对于准则的重要性,得出权重。其次,建立未加权超矩阵,对所有元素迭代以确定其局部权重。再次,提取特征向量,计算加权超矩阵。最后,使用幂法求取加权超矩阵的乘方,即得到极限超矩阵以及其对应全局权重。
图2 SVM从二维到三维的推广
3.支持向量机(SVM)。本文采用Vapnik为解决分类问题提出的SVM,在数据集中选择一组特征子集,若对其的划分等价于对整个数据集的划分,则该特征子集就称为支持向量。不同于K-Means,SVM是一种有监督的分类方法。针对双属性的样本,利用二元Logistic回归等方法可以将数据用直线均匀分开,那么同理有三属性的样本则可被一个平面划分,当推广到高维特征空间时,这个分界限被称为超平面,SVM的作用就是构造最优分类超平面,其适合小样本问题,如图2所示。
四、生计策略划分与指标构建
(一)生计策略划分
农户生计策略的划分主要依据其生产要素的分配和收入来源[13]。本节划分了高陵区和长安区经历过征地的农户的生计策略类型,并以此判断高新区、沣东新城和沣西新城那些面临征地或刚经历征地不久的失地农户可选择的生计策略。根据已有研究并考虑到数据的可用性,在家庭收入来源上选择农业种植收入、个体私营收入、工资收入、农业经营收入、外出打工收入以及政府补助总额。由于部分已失地农户拒绝回答与收入相关的问题,因此删除了收入来源中产生亏损的不适用样本,并对归类结果添加标签以及统计不同生计策略农户的总收入均值。本节使用SPSS Statistics 21软件,选取K值为4,经过20次迭代样本收敛,其结果见表1。
表1 K-Means聚类结果
K-均值聚类法将已经失地农户的生计策略直观地分为4类,各类农户的特征差异明显,客观阐述了不同类型的生计策略。具体而言:策略1是以农业种植活动为主,该类型农户数有159户,占样本农户的17.96%,其中81.59%的人口从事农业种植,从事个体私营的人数最少,只有1.04%。农业收入占家庭收入的比重最大,收入的特征和劳动力人口的特征基本一致。该类型样本农户人均纯收入仅为6 628.25元,在4种策略中最低。策略2以个体私营为主,一部分农户从事农业活动,该类型农户数有66户,占样本农户的7.46%,在策略选择中所占的份额最小,可见个体私营并非是大多数失地农户的首要选择。其中,60.39%的劳动力人口从事个体经营,经营收入占家庭收入的76.25%。该类型样本农户人均纯收入为40 072.76元,收入最高。策略3是外出打工为主,其中从事农业种植活动的人数较多,该类型农户数有447户,占样本农户的50.51%,选择该策略的农户也是最多的。外出打工的人口占总劳动力人口的54.71%,从事农业的劳动力人口则占33.05%。收入方面,外出打工收入占全部家庭收入的绝大多数,达到了88.79%。该类型样本农户人均纯收入为17 837.41元,略低于样本农户的平均收入水平。策略4以获取工资性收入为主。该类型农户数有213户,占样本农户的24.07%,其中获取工资收入的人口占总劳动力人口的77.14%,收入方面,家庭的工资收入占全部收入的比重很高,高达90.71%,其余收入占总收入的比例较小。据统计,该类型样本农户人均纯收入达到30 341.07元,在各分类中人均收入较高。
(二)指标构建
根据本文的分析框架,并基于以下原则构建失地农户生计策略选择指标体系:(1)指标体系应涵盖生计资本、适应能力、制度环境三大方面,以全面衡量失地农户生计策略选择的影响因素。(2)选取的指标应具有一定的代表性和典型性,不宜过于细化,否则会增加对指标权重判断的难度并分散重点指标。(3)选择的指标应尽可能的易获取、可量化。因此,本文的指标选取情况见表2。
表2 失地农户生计策略选择指标体系
1.生计资本指标的确定。关于失地农户的生计资本指标,依据国内学者研究的生计指标测量表并结合失地农户的具体特征,将失地农户的生计资本分为五个部分:(1)自然资本。土地是失地农户的关键自然资本[14],征地并不意味着农户失去全部土地,相当一部分农户只被征用部分土地,失去部分土地的农户可以继续利用土地从事农业生产活动[15]。即便失去了全部土地,农户也可以租用他人土地继续从事农业活动。此外,经营土地能够给农户带来一定的收入,失去土地又意味着农户可以获得经济补偿,土地保留得越少,获得的经济补偿就越多,因此,本文选取“家庭耕地面积”和“失地比例”来衡量失地农户的自然资本[15]。(2)物质资本。物质资本即农户生产和生活所用的设备以及基础设施。对农户来讲,最大的物质资本是住房,一般情况下,住房面积、位置等的不同会使住房的价值产生很大的差异。对失地后的农户来讲,若在城镇拥有住房,不仅会增加在城镇寻找工作的可能,而且会带来更高的价值从而增加农户的生计资本,最终影响到生计策略的选择。同时,家庭拥有的耐用消费品价值也是衡量家庭物质资本的重要指标。(3)人力资本。人力资本是一个家庭生计的重要基础,对家庭摆脱贫困、维持未来的发展具有重要意义[16]。个人的教育经历对就业选择和工资收入的高低会有明显影响。此外,健康程度会影响个人的生产能力,劳动力健康状况对家庭的发展有重要作用[17]。同时,选用在城镇工作的人口作为指标,能更好地反映出因原始人力资本积累的差异而带来的策略选择的变化。(4)金融资本。指农户能够获得和支配的资金。农户最重要的金融资本是现金收入,包括外出务工的工资以及农作物、经济作物等的收入。另一方面,由于大部分农户都是风险厌恶者,进行投资、购买基金、证券等的家庭较少,将积蓄存入银行的家庭仍占大多数,因此选取银行存款总额作为衡量指标[18]。(5)社会资本。指农户的社会网络关系,利用社会资本农户能更好地实现生计策略。若城镇中的亲朋数多、家庭中参加社会团体组织的成员占比高,能使农户获得更多的交流机会以及各类信息,从而有利于农户的生活和就业。
2.适应能力指标的确认。对失地农户来讲,提高适应能力的过程也是不断积累生计资本的过程,因此资本获取与整合能力就显得尤为重要,包括农户如何有效利用征地补偿款以及获取就业信息等能力,这一能力的提高意味着农户有更多的机会来选择生计策略以满足生存和发展的需要。此外,就业能力是失地农户适应能力的关键,农户获取资本的能力会随着就业能力的提升而增加,相应地,农户遭受的外界冲击和环境变化带来的不利影响也会随之减少。Ado认为适应能力是用来评价农户应对风险冲击的指标,农户可能会遭受来自各方面的风险威胁;健康风险会导致劳动力的数量减少;教育风险会降低家庭成员的教育水平和劳动力素质,最终减少人力资本;养老风险会加重家庭的经济负担,进而降低金融资本[19]。因此,本文在参照江易华提出的失地农户适应能力再造框架的基础上,将适应能力分成了资本获取与整合力能力、就业能力、社会风险应对能力三个方面[20]。具体来看,在资本获取与整合能力中,设置了资本获取情况以及资本配置与利用的合理性两个指标。另外,用非农谋生技能掌握情况、工作的发展前景与获取工作信息的情况这三个指标衡量就业能力。在社会风险应对能力,设置了养老、医疗保险的覆盖率和对风险采取措施的针对性两个指标。
3.制度环境指标的确认。农户的生存和发展不是孤立的,要依赖于一定的外部环境,因此生产和生活的空间结构变化、政策的不同以及执行地差异化会影响农户生计策略的选择[21]。在制度环境方面,共设置两个二级指标。其中制度政策分为征地赔款、就业安置、技能培训与指导三个指标。在环境保障中,设置了安置的地理位置、安置地的基础设施建设、劳动力市场环境三个指标。
五、失地农户生计策略选择的模型构建
(一)失地农户生计策略选择的ANP模型
基于上述的指标构建,根据失地农户的依存关系,进一步分析并构建了失地农户生计策略选择的ANP网络结构模型。具体分析如图3所示:第一层为控制层;第二层为网络层,根据生计策略选择指标体系以及指标间的依存关系确定,包含生计资本、适应能力、制度环境这3个元素组;第三层为方案层,是农户在失地后可选择的4种策略(见表1)。控制层为失地农户的生计策略选择,即本文的研究目标。
图3 ANP网络模型结构图
通过ANP对失地农户生计策略选择影响因素的确定,可以识别不同指标的重要性,由于资本禀赋不同的家庭在进行生计策略选择时的指标权重排序有所差异,因此通过对失地农户指标权重的计算可以确定其选择的生计策略的优先顺序,从而为失地农户进行生计策略选择提供有效的指导。同时,ANP有效解决了指标之间相互影响的问题,使生计策略选择的结果更加符合现实,为后续政府实施具有针对性、重点性的解决措施奠定了良好基础[22]。
(二)生计策略选择的实例研究
基于上述分析,我们以沣西新城计家村的X家庭为例,对本文失地农户生计策略选择的方法给以说明。该家庭在2019年初进行了拆迁,现面临着生计策略的选择。
首先,在失地农户生计策略选择指标ANP模型构建的基础上,利用Super Decisions(简称“SD”)软件建立该家庭的ANP网络结构图(如图4所示);其次,以二级指标为评价准则来判断三级指标之间的关系,并建立相应的判断矩阵,同时对所有指标的判断矩阵进行一致性检验。当通过一致性检验后,利用软件生成该模型的超矩阵、加权超矩阵以及极限矩阵。其中,ANP 极限矩阵(因版面限制,仅以适应能力的指标进行说明)如表3所示。由于极限矩阵中各极限收敛且唯一,所以得到的列向量即为指标的权重[23]。最后,得到该家庭的生计策略选择指标权重(见表4)以及四种生计策略选择的排序(见表5)。
图4 Super Decisions中失地农户生计策略选择的ANP网络结构图
表3 家庭生计策略选择指标的ANP极限矩阵
表4 X家庭生计策略选择指标
X家庭共有6名成员,失地前,父亲在镇上的工厂打工,爷爷身体较差,奶奶和母亲除了完成家务还需要一起从事农业种植,另有两个孩子在镇上的中学读书,是收入与社会关系都在农村的主干家庭。由表4可知,首先,对该家庭生计策略选择影响最大的是金融资本。拥有更多的收入和存款可以使农户更加自由地选择生计策略,这种选择可以不受户口、地理位置以及学历水平的限制,同时金融资本可以为农户的生存提供强有力的经济支撑并且使农户的收入与储蓄更具有灵活性。因此,对此类家庭而言,金融资本可以增强抵御生活成本上升和自然灾害冲击的能力,从而在生计策略选择中产生更大影响[9]。其次是自然资本,失地比例不仅影响了征地赔款的金额,而且决定了农户从事农业活动的可能以及需要租用他人土地的比例。对该家庭来讲,征地赔款不仅可以改善家庭生活,也能使父亲选择相对轻松的工作。此外,该家庭人力资本的权重也比较靠前,这是因为对需要从事体力劳动和农业活动的X家庭来讲,劳动力的健康状况关系到整个家庭的正常生产和生活。社会资本较低的原因是X家庭生活在农村,城镇亲朋数较少,并且参加社会团体组织的可能性较小。就业能力的排名也比较靠前,短期内就业能力的高低直接关系到农户的就业可能、就业质量以及工资收入水平,长期内就业能力关系到征地农户的生活保障[24]。因此,就业对农户来讲是关键,就业能力的提升意味着农户可以进行更多的物质资本积累并且大大提高抵御风险的能力[20]。环境保障的影响是最小的,可能是由于整体的外部环境在短期内对家庭生计策略选择的影响较小,需要一段时间才能有所表现。最后,从三级指标的权重来看,实际年收入所占的权重最高,足以反映出金融资本中的家庭实际年收入对于失地农户生计策略选择的影响最为显著。X家庭影响最大的三级指标分别分布在人力资本和金融资本中,这一结果与二级指标所反映出的状况一致,进一步说明了本文结果的可靠性。
表5 X家庭生计策略选择情况
通过计算X家庭生计策略选择指标的权重,掌握了影响该家庭生计策略选择的资本禀赋的重要性排序,通过指标的重要性排序可以计算出该家庭可选择的生计策略排序。从表5可看出,对于X家庭,四种策略的排序为:外出打工为主(策略3)>以农业种植活动为主(策略1)>以获取工资性收入为主(策略4)>以个体私营为主(策略2)。从家庭特点和资本禀赋来看,该家庭最倾向于选择以外出打工为主的生计策略,其次倾向于以农业种植活动为主的生计策略,选择以工资性收入为主和个体私营为主的倾向较小。造成这一选择的原因有以下几方面:首先,由于自身教育经历和学历水平的限制,相比于从事需要更多知识技能的个体私营而言,X家庭的农户更加倾向于外出打工,加之大部分农户是风险厌恶者,因此选择个体私营的可能较小;其次,即使失地后农户赖以生存的自然资本有所减少,但因缺乏非农谋生技能以及受到传统农业观念的禁锢,X家庭在很大程度上仍愿通过租用他人土地的方式来进行农业种植活动;再次,失地后农户获得了相应的征地赔款和住房安置,这在一定程度上减轻了农户的经济负担,经济压力的减少也使农户愿意从事更为轻松的工作,如在当地帮别人做农活、进行农业种植或简单地打零工等。
综上分析,根据X家庭的生计资本、适应能力以及制度环境即X家庭拥有的资本禀赋,为该家庭选择了与之最为合适的生计策略,对ANP模型的合理性进行了验证和应用。因此,具有不同资本禀赋的家庭可以通过输入其具体的指标,选择相应的生计策略,从而为失地农户如何科学全面地选择生计策略提供方法指导。
(三)家庭生计策略选取的推广与应用
尽管通过ANP模型可以对失地农户家庭的生计策略选择进行有效分析,但受限于庞大的计算工作,很难将此进行大规模的应用。然而,笔者写作的初心是将该模型推广到更大范围内,指导更多的失地农户选择生计策略。因此,出于这一考虑,在对沣西新城、沣东新城、高新区489户失地农户调查的基础上,选取236个家庭进行生计策略选择分析,并构建基于SVM的失地农户生计策略应用模型,来加强ANP模型的实用性。SVM的流程如图5所示:
图5 SVM训练过程
本节采用集成开发环境VS2015,并调用OpenCV库进行编程。SVM可用于将多维数据分为两类,如果用其解决多元分类问题则需要使用多个二元分类相结合。在传统的多分类法中,每次分类划分的两个子类中至少有一个子类为单类,这种一对多的分类法,易导致类别重叠和不可分类。而采用一对一的分类法,每两个单类做一个SVM,可提高分类速度和消除一对多的分类法的缺陷。因此,本节选择支持大于2分类的C类支持向量分类机,并采用一对一的多分类法(如图6所示)。
图6 SVM模型的分类(2)注:图中椭圆代表二分类的依据,矩形代表最终分类结果,线条上的标注代表各类的流向。
1.数据处理。提取沣西新城、沣东新城、高新区236户失地家庭的生计策略选择指标,并投入ANP模型即可得到每户家庭的策略排序,每户家庭均有其最为倾向的策略及最不建议的策略,共计24种排序方式,由于ANP工作量巨大,样本的数量有限,不足以支撑进行24分类的训练。故本节仅以家庭最倾向选择的策略作为4分类的依据,并选取205户家庭的问卷数据和ANP得出的策略倾向作为参与训练的数据集,31个家庭的问卷数据和ANP得出的策略倾向不投入训练,将其作为验证集以验证模型的泛化性。数据集的SVM的类别可定义为表6所示。
表6 数据集分布表
2.选定核函数和初始参数。当出现数据集的错误导致线性不可分的情形时,核函数可以通过将低维特征空间映射到高维空间的方式使得数据集变成线性可分。具体而言,首先在低维特征空间上进行计算,然后借助核函数将初始空间映射到高维特征空间,并确定最优的超平面实现对数据集的非线性分类。针对不同的领域问题应使用不同的核函数,但也存在一些核函数适用于所有领域,常用的核函数有多项式核函数和高斯核函数。
多项式核函数:k(x,y)=[(x·y)+1]d
其中d为多项式核参数,代表计算的维数,当维数线性增加时,计算复杂度和学习复杂度呈指数增加。
高斯径向核函数则为更通用的核函数,其公式如下:
高斯径向核函数是使用最广泛的核函数,对于大样本和小样本分类性能都非常卓越。高斯径向核函数也是一种局部性比较强的核函数,同时具有很强的抗干扰性。训练集分别用支持向量机的多项式核、高斯径向核进行建模。核函数的初始参数选取缺省值。
3.模型评价和参数寻优。主要的模型优劣评价指标选取训练集的均方根误差及其命中率。本文采用5次10折交叉验证,将样本随机划分为数目相等的10类,每次抽出一个子集作为测试集,其他子集作为训练集,即可得到10个模型和10组测试集得出的性能。共随机划分五次,重复训练过程,最终取训练结果的性能平均值进行评估。
4.投入训练并导出结果。未投入训练和参数寻优的31个家庭作为验证集,投入模型评估。经过参数寻优最终模型的效果如表7所示。可知高斯径向核和多项式核在测试集上都可以达到90%以上的命中率,高斯径向核函数的命中率较低,且在验证集上均方根误差大,泛化性能较差,多项式核的泛化性能良好,总体效果更好。本文构建的支持向量机的预测结果与ANP模型得出的策略倾向具有较高的拟合度,在小样本上取得了不错的效果。因此,在一定程度上替代了ANP复杂繁复的工作,并且随着更多的问卷数据投入,模型的效果有望得到显著提升。但因本节的SVM模型具有时效性,所以随着政府政策和经济形势的变化,ANP指标、策略的分类、SVM的选型和参数选择也应随之调整。
表7 SVM训练结果
六、研究结论与政策建议
通过上述研究,本文得出以下结论:(1)失地农户可选择的生计策略包括以农业种植活动为主;以个体经营为主,一部分农户从事农业活动;以外出打工为主,从事农业种植活动的人数较多;以获取工资性收入为主四种类型。(2)具有不同资本禀赋的家庭在生计策略选择方面存在差异,通过ANP和SVM构建的模型可为失地农户的生计策略选择提供指导,并且SVM的预测结果与ANP得出的选择方案拟合度达到90.3%。
综上分析,为了解决农户在失地后的生计问题,让农户尽快地适应失地后的生计环境,实现生计策略的转变,本文提出如下政策建议:(1)重视失地农户的生计策略问题,及时帮助农户选择合适的生计策略。政府在提升失地农户就业能力上可发挥更加积极的作用。一方面,加强失地农户的职业培训,增加教育投入,提高农户的人力资本水平[25];另一方面,建立城乡统一的劳动力市场,破解城乡二元体制给失地农户在城镇劳动力市场带来的弱势地位。(2)对那些对城市生活了解不深且没有稳定工作或生计资本水平低的农户,需要保障其失地后的基本生活水平,提供合适的养老保障形式,关注其健康问题,将失地农户纳入城镇养老保险和医疗保险的体系,减少农户的心理不平衡,降低其对健康和养老问题的担忧,使其安心进入城市生活。(3)增加失地农户的收入并开拓多元化的收入渠道,政府对想要从事个体经营的家庭提供必要的政策支持与技术指导,在工商登记、减少税收等方面给予优惠,落实“减税降费”;为失地农户提供金融支持,拓宽失地农户的融资渠道,使金融更好地服务于实体经济,促进失地农户的收入结构升级与多样化。