西方发展援助评价的意义建构*

2020-11-15张传红李小云

现代国际关系 2020年5期

张传红李小云

[内容提要] 援助有效性评价在西方发展援助中占据核心地位，既是反思援助理念和指导援助实践的客观依据，也是西方发达国家对发展中国家实施新殖民主义的手段和维持政治霸权的话语工具。西方传统援助国及多边援助机构长期以来通过主导发展援助评价机制，不断完善关于发展援助有效性的话语和实践，逐渐建构出一整套国际发展知识体系，确立起该领域的知识霸权。但是，西方国家主导的这种评价机制存在话语与实践的深层次矛盾，客观评价发展援助有效性面临数据与方法上的困境。这为西方国家维持其长期主导且潜藏不平等的“援助-被援助”二元架构提供了空间。随着新兴经济体及更多南方国家的崛起，西方国家主导的这种知识霸权将会遇到越来越多的挑战。

对于国际发展援助的有效性评价，长期以来存在相互对立的两种立场。批评者认为，援助的效果有限，甚至对受援国造成伤害，进而加重受援国的负担，因此国际社会应该减少甚至停止提供对外援助。支持者(特别是援助提供者，包括官方捐助者、多边援助机构和非政府组织等)坚持认为，援助是有效的，对受援国的减贫和经济发展产生了积极影响。目前，国际发展援助远远不敷需要，发达国家应该加大援助的力度。本文研究的发展援助不包括紧急人道主义援助与军事援助，仅限于发达国家及其所属机构向发展中国家提供的援助，其目标是帮助发展中国家发展经济及提高社会福利等。发展援助作为发达国家与发展中国家关系中的政治经济活动，在建构国际关系和国际发展模式中发挥了举足轻重的作用。其有效性的评价是传统援助国决定提供多少援助、对谁提供援助、以什么方式提供援助的重要依据。西方发达国家力图通过这种评价巩固其在援助领域的霸权地位，扩大在知识体系建构中的话语权。深入研究传统援助国的发展援助评价问题可以发现，它们通过这种评价机制和话语技术构建起与发展中国家的关系，进而在发展中国家复制其发展模式并对之施加影响。这为中国对外合作的推进和以合作共赢为核心的新型国际关系建构提供了警示。

一、西方主导的发展援助评价机制建构

自现代意义上的发展援助实施以来，需要多少援助、援助目标是什么及如何提供援助才能有效等问题一直是援助提供者致力于解决的问题。援助评价的标准重点经历了从援助多少、谁来援助转向如何援助的变迁过程。援助评价的范围也由最初的官方发展援助(ODA)逐渐扩大到其他形式的官方资金流动(official flows)，援助主体从单纯的政府机构扩大到私营部门和民间组织。这一系列由传统援助国及多边援助机构主导的动议和行动反映了传统援助国面对国内形势及全球国际发展格局变化的应对举措，援助国通过倡导和推销关于援助效果的发展知识，不断更新评估体系，将新兴援助国、广大发展中国家、私营部门及民间组织等多元发展援助主体纳入其长期主导的国际发展模式和话语体系。在此过程中，援助评价成为传统援助国及多边援助机构维护其国际发展模式和霸权地位的话语工具。

20世纪50～60年代，国际发展援助刚刚起步，此时其目标是促进经济增长，对其评价主要以应提供多少援助为导向。1951年，联合国机构首先开始评估国际发展援助，建议发达国家为发展中国家一年注资50亿美元，如此就能帮助发展中国家实现GDP年均2%的增长率，并呼吁建立国际金融公司和联合国经济发展特别基金。(1)D.H. Lumsdaine,Moral Vision in International Politics: The Foreign Aid Regime 1949-1989, Princeton, NJ: Princeton University Press, 1993, p.236.为动员发展资金，世界银行1960年专门成立国际发展协会(IDA)，专门实施向贫穷国家提供优惠贷款项目。经合组织发展援助委员会(OECD-DAC)与美国国际开发署(USAID)也相继成立，官方发展援助(ODA)开始成为国际发展援助的主要形式。该时期发展援助的形式主要是提供技术和金融资本支持，用于提升受援国的人力资源、填补贫穷国家的储蓄和外汇缺口，提高投资水平，援助促进经济快速增长的作用得到认可。该时期官方援助额稳定增长，一些撒哈拉以南非洲国家等贫穷国家的经济增长速度不断提高，因此，这个时期被称为国际发展援助的“光荣年代”。

20世纪70年代早期，发展援助评价的重心开始向减贫目标转移。20世纪60年代开始的一系列研究发现，单纯提高经济增长率及刺激结构和制度的转型并不能直接实现减贫的目标。在世界银行和国际劳工组织(ILO)的推动下，减贫开始成为援助的核心问题。这对官方发展援助实践产生了巨大影响。1970年，联合国大会宣布70年代为第二个发展十年，并确定到70年代中期达到在国民收入占比0.7%的官方发展援助标准。在整个70年代，OECD-DAC成员中援助国的海外发展援助(Overseas Development Assistance)增加了3倍。石油输出国的官方援助也不断增加，70年代早期只占DAC官方援助的5%，1980年已经增长了8倍，达到DAC援助国援助额的1/3以上。至此，发展援助成为非常受重视的发展议题。但是，80年代，主要工业化国家遭遇内部“滞胀”，它们作为主要援助国不得不缩减政府的援助预算。西方国家国内新自由主义思潮的盛行让西方国家不断以援助有效性为借口，通过附加援助条件强制受援国进行结构调整。援助促进减贫的目标被宏观层次的干预所掩盖。

冷战结束导致西方主要援助国对外援助的政治动机减弱，大规模的财政赤字阻滞了援助的增长趋势，发达国家的官方援助额开始下降。援助已经不能发挥作用的悲观主义思想逐渐盛行。援助可能会导致受援国对援助的依赖性，阻碍它们在国内创收，不利于可持续发展，“援助疲劳”开始产生。为了扭转这一局势，在传统援助国主导下，关于如何评价援助有效性的一系列讨论陆续展开。1996年在OECD-DAC全球性高级别会议上，传统援助国公开表示，过去50年的发展援助实际上并没有起到预期的效果，发展中国家应该对本国发展起主导和决定作用，而不能单靠国际发展援助；会议正式提出援助有效性的概念，思考如何对援助进行评估应该成为国际发展援助的重要使命。(2)DAC, “Shaping the 21st Century: The Contribution of Development Cooperation,” OECD, Paris, May 1996.

进入新世纪以来，传统援助国开始对国际发展援助有效性进行集体性反思，提高援助有效性的讨论成为传统援助国的重要议程。OECD-DAC的官方发展援助尽管在国际发展援助中仍占据主导地位，但所占份额出现下降。随着南方国家的不断崛起，其对外援助数额的增长及所提倡的平等互利、不干涉内政之发展合作模式对长期以来传统援助国主导的国际发展模式带来挑战。OECD-DAC专门组织了一系列援助有效性高级别论坛。2003年第一届论坛的议题包括援助国应该如何更好地协调援助的一致性、降低受援国接受援助的交易成本。2005年第二届论坛签署了《关于援助有效性的巴黎宣言》，进一步确定了提升援助有效性的五个原则，提出加强发展援助的质量以实现联合国千年发展目标。2008年论坛通过《阿克拉行动议程》，以完善和加速巴黎宣言的实施，进一步提升援助的有效性。为了吸纳新兴援助国及多元援助主体入列，2011年论坛通过了《釜山宣言》，第一次正式提出以发展中国家为主导的援助等国际发展援助新方式，并将援助有效性的概念拓展为“发展有效性”，广泛讨论了如何更多地依靠发展中国家内部挖掘资源、提升南南合作的有效性以及如何继续支持中等收入国家全面发展、私营领域发展路径选择等议题。为了巩固《釜山宣言》的成果，2014年OECD-DAC与联合国共同倡议建立“全球发展合作有效伙伴关系”(GPEDC)，试图找到超越南北合作评估框架、更具包容性的一种评估体系。2016年，在肯尼亚内罗毕召开的GPEDC第二届高级别会议正式公布了全球发展合作有效性评估框架，并展示了其初步评估结果，但缺乏具体行动计划，指标内容仍然体现传统援助国的主导作用且没有明确的责任界定，广大发展中国家并未表现出兴趣。

当前，传统援助国发展援助评价的重要内容就是将私营部门和发展中国家纳入其主导的国际发展合作体系。从“援助有效性”到“发展有效性”的范式转变开始打破传统援助国长期主导的“援助国-受援国”、“发达-欠发达”的二元架构，发展援助作为发达国家影响发展中国家的一种政治经济手段和工具遭遇前所未有的挑战，仅有官方发展援助已经不能满足国际发展的需要，必须广泛动员多种资源包括来自私营部门的资源,才有可能实现可持续发展目标。2016年开始，OECD-DAC希望扩大ODA的范围，提出了“全方位官方支持可持续发展”(TOSSD)的概念来取代ODA，有意纳入传统援助国和新兴援助国支持全球公共产品供给和可持续发展的所有资金流，包括公共部门和私人部门来源，也包括优惠贷款和非优惠贷款。其目标是克服传统援助国ODA框架的局限性，改善对国际公共融资测量方法，获得为2030议程融资框架所需发展融资的综合统计数据，最终通过市场撬动更多的资本参与发展融资。与ODA相比，TOSSD作为OECD-DAC新的议程因计算方式复杂和概念不清等问题一直未能落实。2019年初，GPECD与OECD专门组织召开第一届可持续发展私营部门融资会议(PF4SD)，会议将混合融资、社会影响投资和绿色金融的“强制性影响评估”(the Impact Imperative)作为主要议题。会议指出，要实现可持续发展目标，发展融资机构和私营部门必须把“长期影响”作为发展融资动议的核心，对通过发展合作进行的混合性融资、绿色融资、社会影响投资及私营部门融资的短期效果及长期影响进行有效的监测和评估。会议发布了《2019社会影响投资报告：可持续发展融资的强制性影响评估》，将评价作为发展融资和发展融资质量保障的重要手段，并进一步将国际发展合作评估与可持续发展目标联系起来。(3)OECD, Social Impact Investment 2019：The Impact Imperative for Sustainable Development, Paris, January 17, 2019.

二、西方发展援助评价的话语建构

援助是一种稀缺资源，援助供给决定援助分配，包括援助由谁进行分配和分配给谁的问题。如何动员更多援助资源并进行分配，是由援助提供者的动机决定的。但是，与一般物品资源不同，援助具有全球公共物品的属性。因此，援助提供国经常需要在援助的利己性与利他性之间进行平衡。如何将援助提供者的动机与援助的公共物品属性结合起来，需要一个有效的工具。长期以来，西方传统援助国与国际援助机构利用发展援助评价建构了一整套包括援助伦理基础和问责依据的话语体系，为动员更多的援助资源、应付国内国际压力、推广发展模式和施加援助附加条件提供了重要依据。

发展援助评价帮助传统援助国建构了对外援助的道义基础和约束机制。20世纪70年代以来的援助评估结果表明，经济增长并没有带来发展，反而出现贫富差距的扩大。对抗极端贫困、满足基本需求与减少人类苦难成为主权国家政府尤其是发达国家政府对外援助的道义基础。例如，丹麦和芬兰强调，促进全世界贫困人口的大团结和分配正义是其提供发展援助的主要动机。荷兰将财富的公平分配、社会正义、非歧视和减贫视作对外援助的道义基础。英国政府则指出，“世界贫困是我们面临的最大的挑战，我们提供国际援助只是因为这是一件正确的事情”。挪威明确表示，反贫困就是为正义而战。美国一直声称，帮助世界贫困人口和向面临紧急需要的其他国家人民提供援助是其不可推卸的责任。大卫·拉姆斯戴恩在其著作中指出，“对外援助的解释不应仅考虑援助提供方的经济和政治利益，任何令人满意的解释都要考虑援助方对人道主义及平等精神的信仰。”(4)D.H.Lumsdaine, Moral Vision in International Politics: The Foreign Aid Regime 1949-1989, p. 29.

发展援助评价为最大程度地动员援助资源提供了话语证据。传统援助国长期基于援助方的报告和评估体系、通过可以进行国际比较的数据，制造同行压力，以督促援助方提供更多援助。OECD-DAC 1969年提出将“官方发展援助”作为测量国际援助的指标，敦促发达国家承诺将其国民收入(GNI)的0.7%用于发展援助，作为解决贫困和全球经济社会不平等的资金来源。OECD-DAC 1991年发布了一整套对ODA的评估标准，将有效性作为五项原则之一。DAC还定期对其成员国的发展政策、战略和活动进行同行评议，内容包括如何实施发展政策、如何履行国际承诺以及如何实现本国援助目标；并制定具有可比性的指标，定期发布报告，形成同行压力。OECD-DAC主导的评价体系因其系统性、强大资源动员能力和智力支持以及连续性，成为发展援助实践和研究的重要参考。在该评估机制的影响下，即使在全球经济震荡、发达国家经济出现下滑的情况下，官方援助数额过去60多年基本保持了数量上绝对增长的态势，只不过其占GNI的比例相对下降。

发展援助评价可以为援助执行机构应付来自国内和国际问责提供话语依据。20世纪90年代中期以来，随着传统援助国援助预算紧张，对援助有效性的质疑不断增多，双边和多边援助机构都面临很大的问责压力，援助国开始制定法律规章，督促相关政府机构建立部门绩效评估系统(Agency-wide Performance Measurement System)。为了显示援助的“物有所值”，传统援助方对援助资金的监测与评估不断加强。如美国1993年就颁布了政府绩效法案，要求所有政府部门每年制定活动计划并设计监测指标。美国国际开发署从1999年起定期提交援助有效性报告，汇报其援助活动的效果。(5)A.Binnendijk, “Results Based Management in the Development Co-operation Agencies: A Review of Experiences,” http://www.oecd. org/development/evaluation/1886527.pdf.(上网时间：2020年1月30日)多边援助机构开始采用统一体系对援助有效性进行监测和评估。(6)International Development Association (IDA), “Measuring Outputs and Outcomes in IDA Countries,” http://www.worldbank.org/ida/papers/IDA13_Replenishment/measuring%20outputs.pdf;A.Bester, “Results-based Management in the United Nations Development System: Progress and Challenges,” http://www.un.org/esa/coordination/pdf/rbm_report_10_july.pdf. (上网时间：2020年2月3日)这些报告的内容包括项目的总体情况和跨部门、不同区域甚至国别的数据。这种援助方主导的政治驱动性评估结果可以让国内民众和国际社会直观了解援助的使用情况和效果。随着获取数据的手段增多，援助机构的报告日益专业化，其内容日益越来越丰富，这种技术性的操作在很大程度上保证了发展援助供给的可持续性。

援助评价为传统援助国和多边援助机构在援助时附加条件和选择性操作提供了“合法性”。20世纪90年代末，世界银行一项评估表明，不愿遵守附加条件的国家不会实施世行提出的政策要求，而在愿意遵守并且相信会受益的国家，援助往往会取得良好的效果。(7)World Bank,Assessing Aid: What Works, What Doesn’t and Why, Washington,1998.这一结论对后来援助更多流向愿意接受附加条件的国家提供了支持。后续研究进一步指出，援助在实行“良治”(良好的财政、货币和贸易政策)的国家才会为增长作出贡献，而在政策环境差的国家不会产生有效作用；为提高援助的有效性，援助应该更多提供给前一类国家。(8)C. Burnside and D. Dollar，“Aid, Policies and Growth,”World Bank Policy Research Paper, No. 1777，2000.90年代后期以来，以世行为主的援助方开始反思附加条件的做法，重新对“条件性”进行定义，将援助目标从追求结构调整下的政策改革逐渐转向受援者已经具备的条件，实施选择性或以既有表现为根据的援助。援助有效性的提升工作越来越系统化，并专门设计了国家政策与制度评估体系(CPIA)，根据20个特征对受援国进行打分，涉及宏观经济和发展政策、经济和公共部门管理、制度能力等；每个国家根据这些指标进行打分，然后分为高低不同的5个档次。(9)World Bank, Country Policy and Institutional Assessment 2003: Assessment Questionnaire, Washington, 2003.世行的研究发现，援助使用及其对增长的贡献与CPIA的分值成正比。(10)P. Collier and D. Dollar, “Development Effectiveness:What Have We Learned?”Economic Journal, No. 496, 2004, pp. F244-271.

在上述话语的指导下，由援助方自己开展的援助评价在大部分情况下都证明援助是有效的，只是在不同部门、不同区域和不同时间段会表现出差异性。如英国国际发展部(DFID)和澳大利亚援助署2004年的援助有效性报告指称，超过75%的援助项目是成功的。作为最大的援助机构，世行对2000～2004年间1200个援助项目进行了有效性评估，发现其成功率为76%，且在过去15年显示出持续上升的趋势。(11)World Bank Group, Annual Review of Development Effectiveness 2009: Achieving Sustainable Development, Washington, 2009.这些报告内容非常全面，既包括援助项目的整体成功率，还包括流入不同部门、不同区域之援助项目的效果。如以世行为首的发展融资机构对流入不同部门之援助的效果评估发现，对交通、农村发展及金融部门的援助项目成功率相对较高(85%以上)，而环境类援助项目成功率相对较低(低于70%)。世行对区域层次的援助数据表明，东亚和太平洋地区是援助项目成功率最高的地区，为90%；而撒哈拉以南非洲这一数字不到70%，为最低。不同时间段各地区的表现还会变化，如南亚、中东和北非地区，援助项目的成功率从20世纪90年代末的68%显著提升到新世纪初的85%；而拉丁美洲和加勒比海地区同一时段内这一数字却呈下降之势，从85%下降到不足80%。(12)R.Riddell, Does Aid Really Work? Oxford University Press, 2008, p.184.

三、西方发展援助评价的事实建构

事实上，援助效果的发挥是由很多因素决定的，与援助国国内的政治因素和援助动机有关，也会因援助方式和评估理念差异而不同。与纯粹的道义责任和问责等话语不同的是，国际发展援助的实际效果具有多重性。对援助方有效的援助可能意味着对受援方的无效，而援助国与受援国国内不同的利益群体对援助效果的评判也可能会有很大偏差。与援助方主导的乐观评价结果不同的是，援助机构的质量检测报告、独立学者和研究机构对发展援助的研究揭示出援助评价结果与援助实实践之间的差距。

援助方主导的援助评价存在自我矛盾之处和可能的错误导向。有学者直接指出，援助方的自我评估报告可能存在成功率被夸大的问题，数据缺乏和失败案例经常被低报，西方援助机构的质量检测证明了这一结论。(13)M.Flint, C. Cameron, S.Henderson, S. Jones, and D. Ticehurst, “How Effective is DFID? An Independent Review of DFID’s Organisational and Development Effectiveness,” DFID Evaluation Report EV 640, London: DFID, 2002.如DFID 2001年对援助项目结项报告的质量检测显示，有1/4的项目报告高估了项目成就。亚洲开发银行2005年对其项目的一项深度评价不得不将9%的项目所得评价结果降级。为了化解国内纳税人对援助效果的质疑而作出的评价结果可能会导致“畸形问责”。客观而公允的援助评价需要加强对援助方和受援方的共同问责。显然，援助的使用不仅仅要对援助提供者负责，应该更大程度上对受援方大众负责。但德国发展研究所分析11个双边和多边援助机构的报告内容和方法后指出，援助机构提供的汇总结果数据仅具有限的信息价值，不能为对援助机构进行有效问责提供足够的依据，而且还可能会产生许多不利影响和错误导向。(14)S.Holzapfel, “Boosting or Hindering Aid Effectiveness? An Assessment of Systems for Measuring Donor Agency Results,” Public Administration and Development, No.36, 2016, pp.3-19.

发展援助在实际操作中很大程度上是服务于援助方的政治经济和安全利益。有学者研究20世纪60～70年代主要援助提供国的援助后得出结论称，援助纯粹服务于捐助国对外经济、政治和安全利益。(15)A.Maizels and M. K. Nissanke, “Motivations for Aid to Developing Countries,” World Development, No. 9,1984, pp. 879-900.另两位学者研究“9·11事件”之前发展援助发现，援助方提供援助的主要决定因素是政治和策略考量，能否促进与受援国之间的贸易是影响援助国是否援助的重要因素，也是衡量援助的“非发展标准”。(16)A.Alesina and D. Dollar, “Who Gives Foreign Aid to Whom and Why?” Journal of Economic Growth, No.5, 2000, pp. 33-63; M.McGillivray,“Aid Effectiveness and Selectivity: Integrating Multiple Objectives into Aid Allocations,” DAC Journal, Issue 3, 2003,pp.23-36.西方传统援助国的援助实践证实了这一点。如“9·11事件”之后，英美为首的传统援助国更重视援助的作用，大幅提高其对外援助额。美国将对外援助与国防和外交并列为对外政策的三大支柱，明确写入2002年《国家安全战略报告》，将援助促发展(aid for development)与援助为国利(aid for national interest)之间的界限模糊化。2001年，因巴基斯坦公开支持美国对阿富汗的军事行动，美国恢复了80年代以来中止的对巴基斯坦的援助。布什政府专门设立“千年挑战集团”(Millennium Challenge Corporation)，成立专门的评估委员会对受援国政府及其政治经济政策进行评估，只有那些能够达到美方评估条件的受援国才能获得“千年挑战集团”的对外援助。美国对非洲的粮食援助长期面临美国本土“粮食援助铁三角”(农业企业—美国运输公司—慈善机构)的压力。美国本来可以利用援助资金在非洲购买粮食，然后分发给当地百姓。这样做可以提高当地农民的粮食生产积极性，也可以节约经费。但是，由于“铁三角”的反对，援助基金被用来购买美国的粮食，然后用美国的运输公司运到非洲，慈善机构以半捐半卖的方式将廉价的粮食倾销到非洲市场，对非洲本土粮食市场造成损害。奥巴马政府2008年开始实施的美国“未来粮食保障”行动计划(Feed the Future)有一条不成文的规定，就是不能向可能会对美国农业构成竞争威胁的国家提供农业援助。

对于受援国而言，援助很难减少贫困，反而在一定程度上会带来援助依赖和腐败等问题。如鲍厄早在1972年就指出，政府对政府的援助对发展来说既不必要、也不足够，甚至还会成为障碍。援助的危害在于，它加强了政府权力，导致腐败以致进一步的资源错误分配，损害了民间社会的良性发展。(17)A.Shleifer, “Peter Bauer and the Failure of Foreign Aid,” Cato Journal, No.3, 2009,pp.379-390.莫约在《死亡援助》一书中指出，政府对政府的援助对非洲造成了对援助的依赖性，助长了腐败，是非洲治理恶劣和贫穷的根源，应该被淘汰。(18)J.V.Der Walt,“Dead Aid: Why Aid Is not Working and How There Is a Better Way for Africa,” The Review of Austrian Economics, No.4, 2009, pp.431-432.世界银行最近在其官网发布一篇工作论文，其中追踪研究了1990～2010年间世界银行对于高度依赖援助的22个国家季度拨款数据信息与国际清算银行提供的这些国家的离岸银行存款(避税天堂)增加之间的相关性。该文发现，在世界银行拨款的季度，每提供相当于该国GDP之1%的援助款，该国流向避税天堂的存款就会增加3.4%。由此推断约7.5%的援助款项由受援国精英收入私囊。(19)J.J.Anderson, N. Johannesen and B. Rijkers,“Elite Capture of Foreign Aid, Evidence from Offshore Bank Accounts,”World Bank Group Policy Research Working Paper, No. 9150, 2020.OECD-DAC最新数据表明，近些年来流向世界最贫困国家的援助越来越少，2010～2017年间其占DAC官方援助额的比例由32.5%下降到29%。除几个北欧国家外，大部分DAC成员国都没兑现将其国民收入的0.15%～0.2%用于对最不发达国家的援助承诺。(20)OECD, Development Co-operation Report 2019, 57th Edition, Paris, 2019.这从侧面佐证了援助对于促进全球减贫之作用的有限性。

附加条件性援助并不能促进受援国的援助有效性。研究表明，在很多情况下对援助附加条件会导致受援国国内政治和经济环境更为复杂。如科立克等人明确指出：“总体来看，附加条件对改善受援国的经济政策不是一个有效的手段，其激励体系明显缺乏对不执行条件的惩罚，在面对援助方与受援国对政策目标和优先性出现分歧时表现出明显缺陷，对激励政府参与的其他因素却起到了限制作用。”(21)T. C.Killick, N. Castel-Branco and R. Gerster, “Perfect Partners? The Performance of Programme Aid Partners in Mozambique,”Report to the Programme Aid Partners and Government of Mozambique, London: DFID, 2005.尽管援助的边际效益可能会因援助国有利的政策环境会相对增高，援助是否能发挥作用跟受援国的政策没有太大的相关性。(22)R. G.Rajan, and A. Subramanian,“Aid and Growth: What Does the Cross-Country Evidence Really Show?”IMF Working Paper, No. 127, IMF, 2005.但从援助有效性评价结果来看，如果援助方发挥支持作用，而不是强迫受援方，那么双方才会成为更有效的“发展伙伴”。同时，受援国的政策虽然重要，但并不能单独发挥作用，影响援助是否有效的因素还应该包括政治稳定、是否民主、冲突后重建和经济脆弱性等因素。(23)M.O.Morrissey, “Conditionality and Aid Effectiveness Re-evaluated,” The World Economy, No. 2, 2004, pp.153-171.有学者指出，CPIA其实是世行用来管制其与贫穷国家的关系的重要手段，这与世行倡导要超越80年代的“附加条件”的新自由主义偏见是不一致的，体现了世行的虚伪性。(24)E.VanWaeyenberge, “Selectivity at Work: Country Policy and Institutional Assessments at the World Bank,”European Journal of Development Research, No.21,2009, pp. 792-810.

对不同援助模式有效性评价结果发现，不同类型的项目都存在难以克服的结构性缺陷。如雇佣来自受援国的专家导致很大部分的项目经费流入“发展专家”的腰包。一般预算援助给受援国在制定发展战略方面更大的“自主权”的同时，也不得不接受援助方提出的各种附加条件，增加受援助国对援助的依赖性。技术援助也面临着派出专家成本高、很难挑选出专业的人才以及技术不可持续的问题。归根结底，因为援助方掌控所有的资源，项目设计和实施都由援助方驱动，援助方更多追求自身利益是造成很多援助项目不能发挥作用的重要原因。在这种情况下，很多受援国政府不是不作为，而是没有足够能力控制项目，而这恰恰又会成为援助提供方减少援助或施加更多附加条件的借口，造成援助无效的恶性循环。

四、西方发展援助评价面临的挑战

当今的发展援助已经远远超越最初提供物品、服务及金融资本的形式，既包括独立项目，如提供食物、修建道路、提供健康医疗服务等，也包括国家或跨国层次的大型援助项目，还有赋权和能力建设、制度和政府能力建设、制度环境的改善等“软援助”项目。国际发展援助的复杂性决定了援助评价很难客观判定援助对受援国的长期影响，几乎不可能客观、全面地监测和评价受援国减贫、增长等总体发展指标与所获援助之间的关系。近年来，国际发展援助所面临的制度变迁及新技术变革为完善援助评价带来希望，但这种评价仍难得出客观性的结论。衡量发展援助效果的一些更重要问题如援助是否可持续、是否惠及最需要的群体、是否真正促进公平和正义等，很难得到数据的支撑。但是，这为传统援助国灵活运用援助评价提供了更大的空间。

客观评价援助的有效性之所以困难，主要是因为缺乏准确、可靠和高质量的数据。这样的数据既要包括宏观层次的，如国际层次、国家层次、部门层次，也要包括微观层次的，如项目或社区层次；既要涵盖来自援助方的项目设计、援助方式、援助额度及援助目标等相关信息，还要包括受援方各种与援助活动相关的指标变量，如接受援助前后的贫困水平、经济增长率差异等，但要想任何一方的精准数据都会面临巨大挑战。这种数据方面的挑战具体包括以下几个方面。第一，援助方与受援方提供的数据经常存在不可避免的差异。虽然OECD-DAC很早就对官方发展援助作出了定义，并定期公布官方援助额。但是，援助的承诺额和实际拨付额存在时间差别，且因不同的项目援助方式，真正拨付到受援方的数据可能跟援助方的官方援助数据有很大差别。采用任何一方提供的数据其结果可能会有很大不同。第二，大部分受援方的信息统计能力不足，是否愿意提供以及如何提供准确的援助数据仍然是全球性援助数据获取的巨大挑战。第三，受援方的社会经济指标数据与接受援助的相关性很难予以证实。一方面，这些指标数据的可靠性和精确性很难把握而且没有统一的标准。如贫困水平问题，尽管人们对如何精确测量贫困作出了很大努力，但不同的贫困线和贫困类型在数据上都会有很大差异。贫困有永久性或慢性的，也有暂时性或转型性的；有些能够量化，有些是不能量化的。最权威的贫困统计数据(如世界银行提供的贫困数据)也不能涵盖所有的国家。另一方面，援助前后社会经济发展指标的变化可能跟援助没有关系，因为影响社会经济发展或停滞的因素有很多，且具有不确定性，而援助相对于受援国的贡献率相对较低。2003年，联合国排名的全球最贫穷的117个国家中，只有7个国家接收了ODA超过在其GDP中占比20%的援助。国际货币基金组织的学者研究指出，从现有数据和方法中不能判断出援助与投资、增长和贫困之间正向的相关关系。(25)R. G. Rajan and A. Subramanian , “Aid and Growth: What Does the Cross-Country Evidence Really Show?” IMF Working Paper, No. 127, 2005.美国全球发展中心(CGD)的研究也表明，对援助项目进行系统评估面临的最大挑战就是缺乏足够的高质量的数据。(26)W.D.Savedoff,R. Levine, and N. Birdsall, “When Will We Ever Learn? Improving Lives through Impact Evaluation,”Report of the Evaluation Gap Working Group, CGD, 2006.即使在援助评价方面表现最好的国家瑞典，对其人权与发展项目的抽样研究表明，因为数据不足问题，只有7%的该类项目具备参与评价的条件。

除了数据缺乏外，援助评价在采用什么样的评价方法上也面临挑战。在援助—被援助关系现实中，情况完全相同的目标国家、目标社区或目标群体几乎没有，所以不可能找到合适的“对照组”以便对有无援助的影响差异进行比较研究。更何况，援助项目产生的影响可能是即时的、也可能是中长期的，也可能因项目类型的不同而有很大差异，单一时段、角度或项目的评价可能导致偏颇的结果。无法完全隔离自然灾害等外在因素的干扰也是科学地进行援助评价的一大障碍。不利的外部因素有可能使得一个适宜的援助项目半途而废，或者有利的外部因素则可能会使得一个不适宜的援助项目产生很好的效果。

即便广获接受和推崇的评估方法也有很多缺陷。如在20世纪60年代，随机对照试验(Random Control Trial, RCT)方法在首次引入国际发展评估领域时遭受冷遇。但在本世纪初再次进入发展项目的评价领域时，很快就成为国际发展项目评价的新金律，其应用范围得到快速扩大。很多学者把RCT在20世纪60年代遭受冷遇、本世纪初获得成功归因于该方法的“修辞与组织策略”；他们认为，该方法首先从话语上将“发展知识”问题化，成为“一种解决不确定性的方法”，将有争议性的发展问题转化为技术问题。(27)C.Berndt, “Behavioural Economics, Experimentalism and the Marketization of Development,” Economy and Society, No.4, 2015, pp. 567-591; K.Donovan, “The Rise of Randomistas: On the Experimental Turn in International Aid,” Economy and Society, No.1, 2018, pp. 27-58.最近一项关于RCT的研究从历史视角对该方法推广的两个时间段进行了对比，认为有三个原因促成了RCT在第二次推广的成功：克服了第一个时段遭遇的政治抵抗；在发展援助与经济学等其他学科之间建立联系，起到了“枢纽”的作用；聚焦于小型的短期干预项目而体现出更大的优势。(28)L.De Souza Leão, G.Eyal, “The Rise of Randomized Controlled Trials (RCTs) in International Development in Historical Perspective,” Theory and Society,No. 48, 2019, pp. 383-418.另有学者从历史视角分析研究后指出，RCT的成功在更大程度上取决于国际援助本身所面临的历史和制度环境。近年来，RCT仅聚焦短期影响、很难评估大型而复杂的发展干预项目、忽视潜在的结构性及伦理等问题，因而遭到批评。在这种情况下，鉴定援助无效的方法可能会比证明援助有效的方法更可信。世行最近发表的一篇工作论文提供了一种鉴定和量化援助无效的方法，为援助资金可能会造成分配不均、财富隐藏及资金外逃提供了有力证据。但是，其中承认，因为国际清算银行的数据并不透明，该研究无法真正追踪存款账户受益人，所以结论更多是一种推测，不能确定这些账户受益人是否与世行的项目相关，更无法揭示其背后的机制。(29)J.J.Anderson, N. Johannesen and B. Rijkers, “Elite Capture of Foreign Aid, Evidence from Offshore Bank Accounts,”World Bank Group Policy Research Working Paper, No.9150, 2020.

另外，对于不同援助模式有效性的评价很难得出客观性的结论。对部门范围援助(SWAps)效果评价的复杂之处在于，某一援助机构提供的援助可能只占受援国接收部门总资源的很少一部分，这就会稀释援助资金与其可能产生影响之间的关系,很难得出具有说服力的结论。同样，一般援助预算会纳入政府的整体预算，其对收入及减贫等社会发展的贡献很难独立计量，这是想要客观评价其效果时无法克服的障碍。对能力建设项目的评价也存在争议。有专家认为，对能力建设项目的评价完全可以像其他援助项目一样，不同之处只在对于发展的理解。与一般的技术合作项目相比，能力建设项目应该更注重长期影响，而不是短期效果。但是，在很多情况下，能力建设项目评价的数据和方法都是依照传统技术援助，如提供了多少课程、多少人接受培训。对以能力建设形式提供的援助项目，这种评价毫无意义。能力建设项目评价的另一个挑战是很难找到参照，项目开展前的需求情况没有基线数据可以参照。

结语

早在1969年，佩尔森委员会发表的援助与发展报告中就明确指出：“发展政策的制定和执行必须最终由受援国自己负责，但是援助者有权对重大事件和决定提出建议并被告知(相关情况)。这就要求在非正式谅解的基础上建立反映援助者和受援者相互权利和义务的新型伙伴关系。”(30)L.Pearson, Partners in Development: Report of the Commission on International Development, New York: Praeger Publishers, 1969,pp.7-8.可见，从那时起，基于援助方与受援方之间相互权力和义务为基础的伙伴关系就千呼万唤难出来，传统援助国主导的“援助—被援助”之二元对立关系延续至今。传统援助国与多边机构通过提供援助评价证据并吸收独立学者、研究机构的研究成果，指导援助的决策和实践，制定对外援助的标准，同时建立起一套国际发展话语体系，确立起国际发展知识领域的霸权。发展援助评价作为一种去政治化的研究在发达国家与发展中国家不平等的国际关系建构中一直发挥着很重要的作用。在这个过程中，传统援助国与多边援助机构通过自己主导的评价体系强化自己在国际援助中的地位，也积极听取学术界及批评者的声音，不断适应国际发展新形势，革新援助方式、吸引多方参与，以巩固其制度和话语体系。因此，援助评价的结果大多体现了援助提供方的视角和立场，评价主体为援助提供方或发达国家的独立评估机构和学者，受援国的视角和话语是缺失的。

传统援助国倡导的国际发展援助的伦理动机是善行、道义责任，但根植于发达国家“发达—欠发达”、“先进—落后”甚至是“文明—野蛮”的二元对立之社会意识形态。其预设前提是受援国不能依靠自己的力量实现发展，或者它们的发展方式出现了问题。在这样的意识指导下，传统援助者长期坚持“援助—被援助”的单向、线性思维方式和行事逻辑，并依赖在援助评价标准制定中的话语权影响本国公众、受援国及国际社会，进而固化发达国家与发展中国家之间的不平等关系。

近年来，随着国际局势的变化，传统援助国不断吸收新的发展知识和实践经验，更新评价体系，将注意力集中于创建、计算、评价发展合作的内容和有效性及不断拓展援助主体，其目标是将传统援助国从官方发展援助(ODA)的现实承诺以及它们的历史责任中分离出来，鼓励各国政府动员更多私人资金，同时吸纳援助国内以盈利为目的的私营部门的支持，借以夸大其援助数量。同时，传统援助国不断将南南合作的话语融入其对外发展合作，利用“互惠互利”原则将其国内利益合法化，并将向发展中国家提供的非优惠贷款与国内公司、产品和技术专家进行捆绑。这种做法对发展程度相似的发展中国家之间是可以接受的，但一旦经众多发达国家的推广，那就可能扩大南北发展差距。

中国作为南南合作的最大参与国，一直遵循平等、互利、不干涉内政的互助合作原则，在不断完善对外援助评估体系的同时，也努力参与和推进全球性南南发展合作评估框架建构、国际发展知识体系重塑。目前，国际形势的最新变化正在冲击“援助—被援助”的二元架构，国际发展合作在多边主义道路上阔步前进，中国提倡的人类命运共同体理念提供了既符合人类理想、又因时因地制宜的国际发展思路，更昭示了广大发展中国家实现现代文明的美好前景。○