三农社会科学问题研究设计与执行
2021-06-30朱守银朱信凯
彭 超,朱守银,朱信凯
(1. 农业农村部 管理干部学院,北京 102208;2. 中国人民大学,北京 100872)
哲学社会科学是人们认识世界、改造世界的重要工具,是推动历史发展和社会进步的重要力量。(1)习近平总书记2016年5月17日在哲学社会科学工作座谈会上的讲话。作为认识和改造经济社会现象的科学,社会科学中被解释现象的重要程度及其影响直接决定了理论解释对社会的贡献。农业农村农民问题是关系国计民生的根本性问题,是解释中国发展最显著的解释变量。农业是人类衣食之源、生存之本,中国是世界第一人口大国,14亿人民的衣食住行和自然休闲活动需要依靠农业;农村在空间上占国土面积最大,农用地与非城镇的建设用地之和为674.79万平方公里,这就意味着广大农村地区占中国国土面积70%以上;在广大农村地区生活着5.90亿人口,即便将来城镇化率达到70%,届时仍将有4亿多人常住在农村。以国民经济中的重要地位、空间规模和人口数量论,三农社会科学研究在社会科学中也应当具有重中之重的地位。
英文主流社会科学期刊,大都遵循问题、文献、假设、测量、数据、方法、分析、结论的“洋八股”模式。[1]中国社会科学期刊中很多文章也已经在向“洋八股”转型,以期能够实现研究的规范化。在中国情境下做三农社会科学研究,如果只是遵循“洋八股”还是会遭遇“水土不服”问题。古董的“八股”道德文章、死扣“八股”的教条主义等是我们必须批判的。[2]但是,这不妨碍我们在三农社会科学研究这个语言环境里面借用这一词。总体上,我们认为,三农社会科学研究遵循的“八股”是提出问题、文献评述、理论框架、确定素材、资料采集、实证方法、检视结论、政策设计。大衍之数五十,其用四十有九。本文下面部分,尝试用四十九段话来拆解三农社会科学研究的设计与执行。
一、第一股:提出问题
也就是说,为什么要做这个研究?研究意义的提出非常重要。农业农村领域的社会科学研究,是在中国三农发展实践基础上凝练具有一定普适意义的科学问题加以研究,增添经济、政治、文化、历史、社会、法律等大学科在农业农村场景下的应用。例如,三农经济问题研究,就是要不断丰富农业经济学、发展经济学、制度经济学、劳动经济学、环境经济学、资源经济学等细分学科的知识体系。(2)经常有人把环境经济学和资源经济学混为一谈,实际上环境经济学研究的是环境问题,多用静态比较分析,资源经济学研究的是资源问题,多用动态分析。
(一)问题的背景尤其重要
整个叙事的背景,要有比较高的站位。习近平总书记要求哲学社会科学工作者要“立时代之潮头,通古今之变化,发思想之先声”。对整个科学研究的背景,国家自然科学基金委员会提出“六期叠加”的概念:即全球新科技革命和产业变革的历史交汇期、中国经济和产业提质增效升级的全面转型期、国家发展跨越中等收入陷阱的战略突围期、创新型国家建设的关键决胜期、科技体制和创新体系的深度调整期、基础研究从量变到质变的重要跃升期。[3]黄宗智和彭玉生(2007)将整个农业农村发展面临着的三大历史变迁概括为,即农村人口大规模非农就业,城乡人口自然增长减慢,农业生产结构转型及食物消费结构升级。[4]如果具体到“十三五”“十四五”交汇这一个小时期,那么就是“两个百年目标”交接、精准脱贫与乡村振兴衔接、农业供给侧结构性改革深化等“五期交汇”。[5]
(二)注意研究问题部分写作中钩眼
不论研究成果提交的对象是谁,都需要引起读者的关注和兴趣。这就需要加强逻辑连贯性来增强研究成果的可读性。可读性需要做到叙事逻辑清晰。“钩眼扣”就是其中“硬核”的叙事逻辑,“钩”和“眼”就是连接句子和段落的主要思想,增加过渡性词语或者语义群。[6]下图就是钩眼的一个例子。钩眼连好,一气呵成。
(三)中国的三农问题研究离不开中国的制度场景
很多制度演变或者结构演变的回顾是必要的。如何去回顾这一系列的政策呢?以赖德胜等(2011)的《中国就业政策评价:1998-2008》为例,他们使用了两种典型的背景描述逻辑,对中国的积极就业政策进行了全景式的描述:一种是按照时间逻辑,按时间顺序整理研究的背景,即2002—2005年,2006—2008年,2008年之后;另外一种选择是按照分类逻辑,即职业培训、岗位创造、中小企业扶助、公共就业服务、政府购买公益性岗位、残疾人就业保障。[7]
(四)问题的提出一般是带问号的
什么样的问题是“好”问题?观察到一个现象,但凡与经济学、社会学、管理学等的传统逻辑有冲突,那么就有好问题蕴含其中。例如,落后地区就业门路少。但为什么落后地区有大量农村劳动力流入?这其中的传统理论推论是落后地区就业门路少,应该有较少的农村劳动力流入。但是我们却观察到相反的现象,即有大量农村劳动力流入。再如,一般而言,书面合同比口头合同法律效力更高。订单农业需要签订书面合同,其违约率高达70%—80%,为什么批发市场上批发商多靠打电话做的口头约定违约率却仅有10%?找到一个好问题太难了,往往我们提出的问题没有这样恰巧的矛盾在其中。解决思路有三个:第一种是从现象出发,观察到一个新的现象,要做一个理论和经验证据的解释。例如:陆铭等(2015)在分析土地供应和工资时,发现一个现象,即2003年以来工资快速上涨,房价也快速上涨。那么,两者究竟是经济高速发展的结果,还是有其内在的相互关系呢?[8]第二种是从政策出发,有不同以往的新政策出台,那么政策对各类主体的激励方向怎样、大小如何。中国的三农社会科学研究者是比较幸运的,农业农村领域近年来出现了很多新的政策。例如:土地确权从试点到推进到完成;粮食目标价格从探索到试错,到最后取消;土地三权分置;人居环境整治;等等。这为我们提供了一个很好的政策“试验场”。第三种是问题和目标混合提出,即为了达到什么样的认知目标,做什么主题的研究。例如,为了对农业劳动生产率有准确的判断,就需要准确估计劳动剩余数量。[9]
(五)问题来源主要是文献和实地调研
问题从哪里来?或者说,怎样生发出一个研究问题。一个来源是阅读文献。如经典文献中说,二元经济中农村剩余劳动力向城镇和非农部门逐步转移,导致剩余逐渐减少,最终达到“刘易斯拐点”。[10]问题的另一个来源是实地调研。如笔者曾经与期货公司的研究员们一同赴粮食主产区调研,就以期货研究员的名义身份来倾听农民合作社理事长、家庭农场、中小农业企业主的反映。当时发现了一个非常有趣的研究问题:规模经营主体在购置农机、修造设施等固定资产的时候,倾向于使用自有资金,而购买化肥、农药等流动资产的时候,倾向于向信用社等金融部门借贷。这可能要从资金市场供给和需求两个方面进行解释。实际上,调研中观察,观察后读文献,读文献后再观察,是“寓研于乐”的过程。这就是三农社会科学研究者读“万卷书”和行“万里路”的目的。
二、第二股:文献评述
文献综述是惯常的叫法。实际上,叫做“文献评述”更为合适,因为文献回顾要做述中有评。新闻需要“综”述,而文献需要“评”述。文献评述的一般步骤是选择主题、文献搜索、展开论证、文献分析、文献批评、评述撰写。
(一)按照自变量、因变量和“求解”来选择文献综述主题并进行搜索
文献主题的选择实际上是有公式可以遵循的。公式很简单,就是y=f(x)。y为因变量文献;x为自变量文献;f为“求解”即研究思路的文献。例如:研究的题目是《农业补贴对农户生产经营行为的影响:基于农户模型的实证分析》,其中,“农业补贴”就是自变量,“农户生产经营行为”就是因变量,“农户模型”和“实证分析”就是求解,可以围绕上述主题分解来搜索文献。
(二)文献搜索时可以利用各类综述性研究精准“定位”
各类文献综述是集中获取文献的首要渠道。以经济学为例,经济学文献杂志(Journal of Economic Literature)是值得参考的一本文献杂志,在Jstor中能够查到过刊,在EBSCO-EconLit能够查到现刊。这本期刊基本只接受约稿,文章的作者一般是某一领域深耕多年的前沿经济学家。JEL有一个“小号”,经济学观点杂志(Journal of Economic Perspective),也可以在上述数据库中找到。如果研究某一方面的话题,在上述两个期刊中如果能够找到相应的文章,那么将会是一笔很大的财富。第二个集中获取文献的渠道是各种经济学、社会学或其他学科的文献手册。例如:经济学手册丛书由著名经济学家Kenneth Arrow和Michael Intriligator主编,由Elsvier出版社出版。该丛书分多个学科,有数理经济学手册、计量经济学手册等,由丛书主编邀约学科某一领域的前沿学者撰写一章文献综述。经济学手册丛书与“三农”问题研究直接相关的是农业经济学手册,有关的手册包括发展经济学手册、劳动经济学手册、环境经济学手册等。选择与研究问题相关性比较大的章节进行深入阅读,文献回溯,事半功倍。第三个集中获取文献的渠道是名校教授的课程介绍(Syllabus)和文献阅读目录(reading list)。例如:当今最前沿的经济学家之一——麻省理工大学Daron Acemoglu教授的劳动经济学课程介绍,其中提供了很多劳动经济学的经典文献阅读。虽然是劳动经济学方面的课程介绍和阅读目录,但是对“三农”领域社会科学研究借鉴意义也比较大。而且,他对文献阅读目录分了各类专题,包含劳动市场外部性,社会流动、同群效应和人力资本,职业关注,效率工资,一般性和特殊性技能投资以及搜寻,匹配和失业等专题,这些经典文献对劳动力转移就业、农民工问题研究等有很大的借鉴意义。需要注意的是,文献搜索到之后,并不是这一篇回顾就结束了,可以回溯文献引证的文献,关注引用本文的文献,就能够形成文献的主干、脉络和枝叶。
(三)文献搜索之后要用信息化手段管理
建议用Noteexpress或Endnote等文献管理软件来整理文献,这样做最大的好处是能形成大量的长期性文献积累。这些文献管理软件都可以在Word当中加载插件,很方便地实现文档中插入格式化的参考文献信息,并且可以根据文献发表或提交的取向进行自动化修改。高校和科研机构图书馆一般都会提供中国知网、Elsvier、Jstor、Wiley-Blackwell等文献数据库的查询。(3)Jstor实际上Journal Store的意思,主要提供过刊的查询。国家图书馆也可以提供每天一定数量的中外文献下载。上述文献数据库都会提供文献管理格式文件的下载,可以很方便地导入数据库。
(四)文献阅读可以按照“先凤头、豹尾再猪肚”的顺序
黄宗智先生给青年学者的读书建议中提到:第一步,阅读文献的摘要、论文的引言、专著的第一章或导论;第二步,阅读论文的结论、专著的最后一章;第三步,快速阅读中间部分,专著的每一章也可以按照这样的顺序阅读;第四步,一句话提炼核心观点;第五步,记录如何连接理论与经验证据。[11]实际上,真正掌握一篇好的文献,还可以想办法再现研究的过程,进行“逆向工程”。例如:对于值得参考的消费行为、公司财务等领域的实证研究,可以把研究方法等套用到三农社会科学的某一主题。
(五)文献综述应当遵循一定的逻辑
文献综述应当有自己的逻辑形式,一般比较忌讳写成“XXX(2020)认为,……”这一形式,常见的文献综述表达形式有“梳理总结式”和“娓娓道来式”。一种是“梳理总结式”。例如,对农户生产行为和消费行为可分性辨识的方法:“主要有如下四种:(1)当事人自己宣称有某一市场的限制(Feder等,1990);(2)通过观察对某一市场的参与情况,来推导市场失灵(Carter和姚洋,2002);(3)用不均衡模型估计某一特定市场的不完全(Carter和Olinto,2003);(4)通过结构化的方法,来预测边际生产率,然后与市场价格相比较(Skoufias,1994;Sonoda,2008;Le,2009)。”[12]24另一种方式是娓娓道来的形式。例如,本文笔者之一在讨论农户生产行为和消费行为不可分原因的时候,就采用以下娓娓道来的形式,“不可分性的原因经常被归咎于市场失灵(Yotopoulos和刘遵义,1974),但不总是市场失灵。对利润和家庭效用函数的特殊的参数化可以归咎为市场失灵的结果,但是也许并不能从实证上检验可分性(P. Schultz,1999)。当土地和劳动市场被放在一起考虑的时候,家庭农场可能会有效地分配他们自身和雇佣的劳动(及土地)(如姚洋,1999;Deininger和Jin,2005),这一行为即使通过测度计量得到了证明,但是也只能说明劳动力市场或土地市场有不完善的情况(Seavy,1987)。”[12]24
(六)文献批评和分析需要找出文献的“缺口”
文献综述一般需要找到就某一问题观点非此即彼的两派文献。从这一点上看,文献批评难度最高。例如,黄宗智在《华北的小农经济与社会变迁》一书中提出解放前的中国小农有“三副面孔”,这样就分析出“左手边”的一个派别,即小农的阶级性,“右手边”则批判舒尔茨为代表的“理性小农”的主张,在中间对恰亚诺夫的“劳动消费均衡论”有所发展。[13]再如,林毅夫在《中国的奇迹:发展战略与经济》中也是“左手边”批评重化工业优先发展思路,“右手边”则批评“休克疗法”,中间发展古典经济学中比较优势分工理论。[14]文献综述要为整篇文章服务,指出文献缺口。说明“我将做什么?”,从而弥补这一文献缺口。实际上,文献评述并不只在文献评述部分,在问题提出、分析方法、结论等各个部分经常也需要有文献为证。
三、第三股:理论框架
理论框架要沿袭研究范畴、研究范式与学术传统。[15]以农业经济学为例,近年来倾向于用产业组织理论研究范式来分析农业生产与市场,或者以发展经济学研究农村发展问题,或者采用动态优化模型研究农业农村资源环境。[16]在理论框架分析的基础上,一般会提出假说来揭示变量之间的因果关系。这一过程需要内部逻辑自洽,而且理论及其推论必须经得起经验证据的检验。[17]理论框架要取得逻辑自洽,必须依靠理论分析。这对研究者的理论功底要求较高,需要培养深厚的经济学、社会学、管理学素养。
(一)要注意研究假说和研究假设的区别
研究假说和研究假设是完全不同的两个概念。假说(Hypothesis)是要验证的问题,例如诱致性制度变迁假说等。假设(Assumption)则是分析的前提和基础,如经济学中理性人假设等。实际上,假说推导而出的前提是假设。
(二)可通过数理经济学分析构建框架、得出假说
某些情况下,研究框架用数学符号、公式推导证明等方法来表述三农各变量之间的关系。一个比较简单的例子是柯布道格拉斯生产函数,Q=AKαLβ,两边取对数可以得到:logQ=logA+αlogK+βlogL。这样就可以说资本和劳动力投入对产量的影响是正向的。而且,用资本和劳动力解释之后,还会剩余有一部分变化,可以用技术进步等去解释。上文提到的陆铭的文献,就是一个典型的数理经济学比较静态分析得出研究假说的例子。
(三)通过图形分析构建框架、得出假说
某些情况下,研究框架用学理性的图形分析来构建。例如,在经典的农户模型分析中,一个简单图形分析就分析出了农户在农产品消费、其他产品消费和闲暇之间做选择的过程。[12]63实际上,关于农户模型的分析,更为详尽的要数中岛千寻对农户模型多维度的分析。[18]
(四)通过逻辑演绎分析构建框架、得出假说
还有些情况下,研究框架用语言逻辑演绎来构建。例如,林毅夫根据威廉姆森、诺斯、速水和拉坦的诱致性制度变迁假说,提出理论命题,主要是农村要素市场这个制度的发育与农户边际产值差异有关。然后从这个理论命题中演绎出明确的假说,农户家庭劳动力、土地、资本增加,其劳动力、土地市场供给增加,雇佣劳动力、租入土地、租用机械和畜力的需求相加。(4)该文在《再论制度、技术与农业发展》中有一处印刷错误,比英文原版论文少翻译了关键变量资本存量的参数估计,造成了阅读中文版读者的理解困难。顺带着,林毅夫还用Hausman检验验证了技术的内生性,直接把计量经济学和技术内生性连接了起来。[19]
(五)理论框架完整的前提下也可以不把假说讲得那么明确
一般而言,理论框架里面要把意欲验证的符号“正负”讲清楚。但是,也可以说得比较模糊。甚至,部分研究可以把两个或更多竞争性假说放在一起。如彭玉生在研究宗族网络对企业创业及发展影响时,根据逻辑演绎的第一个假说相对比较清晰,宗族网络有助于私营企业创业与发展;第二个假说则是建立两个竞争性的假说,假说2a:宗族网络有助于集体企业的发展;假说2b:宗族网络无助于集体企业的发展。最终,实证研究验证的是假说2b,宗族网络既无助于集体企业创业,也与集体企业壮大没有显著关系。[20]
四、第四股:确定素材
如上文所述,一个研究能否成立,标准就是“两个一致”。一是理论分析内部逻辑自洽是否一致,二是理论及其推论是否与现象一致。前者在第三股里面分析了,后者则需要理论与经验证据的连接。从而第四、五、六股,主要就是关于理论与经验证据的连接。确定素材就是确定经验证据的来源。
(一)素材可以源自已有的统计数据
根据研究主题来确定统计指标的有用性,无论研究的主体部分使用何种素材,各类统计年鉴和数据库提供的数据总能够在交代背景、提出问题等方面发挥不可取代的作用。诸如《中国统计年鉴》《农业统计年鉴》《农村住户调查年鉴》《农产品成本收益调查资料》、国研网、中经网、国泰安、农业普查综合资料、人口普查与抽样调查资料、经济普查资料、各类价格调查材料,等等。此外,省(自治区、直辖市)也有统计年鉴,县(市、区)也有自己的统计年鉴。
(二)素材是调查数据和定性研究材料集合
统计年鉴的数据总是有不能覆盖研究所需的所有变量,那么研究者自行组织的调查因其灵活性,成为可以选择的一个方式。实地调查研究可以形成案例资料,也可以形成供定量分析的数据库。
(三)实地调查问卷要围绕研究的主题
在问卷设计的阶段,就要考虑实证研究的关键变量和拟采用的方法,应当把需要的自变量、因变量想好,甚至工具变量、控制变量都要设计好,围绕研究这些变量设计相应的问卷内容。问卷的问题既要符合标准的说法,又要通俗易懂。这就需要设计者对政策有深入的了解。如“耕地地力保护补贴”“城乡居民基本养老保险”等要深入了解政策推进的过程。再如,对一些基础设施,如“安全饮用水”“动力电”“水冲式卫生厕所”等,要详细了解相关国家标准或者地方标准。问卷要配备指标解释手册,并对调查人员进行比较细致的培训。
(四)素材也可以来自各种合作形成的其他数据和资料
如果做实证研究,素材并非自己调查的来源,那么建议无论如何都应当实地做一份问卷,对问卷的结构有一个深入的理解。而且,要针对自己的研究内容,进行实地结构性访谈。
(五)典型调查往往能够形成对定量分析的补充甚至导引作用
典型调查一般要形成案例分析所用的素材,这需要到实地进行比较长时间的“蹲点”访谈调研。典型调查一般具有较强的代表性,有助于理解某个普遍的社会科学现象。有时候,为了形成对某一问题较为深刻的理解,或者发现苗头性问题,可能还要对反常的或极端的案例进行调查研究。
五、第五股:资料采集
资料采集可能是整个三农社会科学研究花费时间成本和资金成本最大的部分。如果能够使用数据集成平台的数据,则尽量使用数据集成平台,这样可以节省很多时间。一般而言,实地调研是必不可少的环节。资料采集就是收集经验证据的过程。
(一)最大程度地占有资料
以往的实地调研,课题组一般都有专门的一位研究人员负责收齐纸质材料,调研回来要复印、装订成册,供课题组人手一册。而今微信等信息化手段让现在的实地调研资料采集省去了很多麻烦。如有道云笔记、印象笔记等,都提供了电子材料收藏和共享功能。在调研过程中,在研究过程中,尽量把素材电子化,之后形成云笔记文件夹的形式,可以在课题组微信群或邮件中方便地共享。
(二)很多数据集成商提供了好的数据采集平台
如果拟采用的数据有公开的统计渠道,还是尽量购买数据集成平台软件,可以实现数据采集的简便化,从而省去一年一年地翻查统计年鉴的时间。但是,到县一级水平的统计数据,数据平台只集成很少的指标。如果要满足进一步的研究,可能需要找具体的统计年鉴往外“扒”。Wind、Choice、布瑞克等数据库都是数据相对齐全的集成平台,基本能够满足“三农”社会科学研究的需要。在新冠疫情期间,国泰安CSMAR数据库和EPS数据平台都曾经提供免费的数据下载。
(三)很多国际组织和外国政府部门提供了数据和资料查询系统
不同国别的数据在世界银行、国际货币基金组织、OECD等网站上可以比较方便地查询到。国际贸易数据有UNcomtrade可以按照国别、商品代码等信息查询。如果是针对某一个国家或地区具体的数据,可能需要到这一国家三农相关政府部门官方网站上进行查找。例如:研究美国农业法案,除了要到美国参议院、众议院、农业部等官方网站上查找相关政策以外,还要到一些农业游说团体、大学农业政策研究等网站上采集资料。[21]
(四)问卷调查要尽量减小抽样偏误
问卷调查尽量做到随机抽样,尤其是分层随机抽样。当然,非随机偏误也不必太过担忧。如果样本量大,且分布相对均匀,则可以克服非随机抽样的偏误。那么,何谓大样本?统计学界曾经有“30个以上”的说法,所幸中国分省(自治区、直辖市)数据样本量能够满足30个以上。(5)有时候西藏等省(市、区)因调查统计困难,可能会导致样本缺失。如果倒退时间较长,重庆还未设立直辖市,海南还没有从广东分出来。实际上,当前开展一个课题研究,实地问卷调查基本上样本量都能够达到800—1000个。600个样本只要均匀分布,基本上能够降低非随机偏误。可以考虑一个问题:新冠疫情期间我们在微信群中收到了很多网上调查问卷,其抽样误差如何?实际上,这种调查发给经常用微信的人,并且让有兴趣的人填写,在样本选择上就已经是有偏的了。
(五)问卷调查要讲究技巧和注意事项
问卷篇幅既不能太长,又要保证有效地收集信息。因此,问卷设计及试调查就显得非常重要。特别需要提示的是,收入测算不能上来就问调查对象收入。一是被访者就算再不重视个人隐私,也是忌讳别人问收入的;二是被访者自己也记不清楚自己过去一段的时间的收入。可供选择的做法是,调查员与农户共同回忆,结合问卷计算各类细分的项目,加总得到一个金额,甚至都不必当场计算处理。[22]因此,现场调查最好配备手持的计算器。很多问卷的技巧与调研地点和研究主题是密切相关的。
(六)案例调查可以参考决策树的思想
在一个地方调查2—3个案例之后,一般会对研究主题有一定的聚焦,之后就发现了有值得深挖下去的“点”,就可以进一步挖掘。可以从时间纵向上挖掘,也可以从横向差异上挖掘。例如,本文笔者之一曾研究税费改革试验,从时间上看后期会因方案变化产生差异,横向上又会出现不同改革方案导致的“征实和征币”“税与费”等利益与行为选择冲突,继续深挖又会发现体制性的根源。[23]
(七)每天调研结束后的调研组讨论必不可少
一是调查的感想与发现,可以就调研发现的现象进行理论解释,此时的讨论可以起到头脑风暴的作用。二是调研组交流调研的技巧和经验,交流遇到的困难,及时进行协调克服。三是如果问卷调查的话,要对问卷进行检查,有少填漏填、问不清晰的内容,要及时安排查缺补漏。再就是,对调查员要做一个研究中间的督促。如果是研究生作为调查员,可能会经常遇到这样一种情况,该研究生需要做论文的问卷内容,他问得比较细致,而其他内容就会少填漏填。这会导致样本损失,资金浪费,时间白花。实际上,对这位研究生的论文也是不利的。因此,对调查员的培训和督促是必不可少的。
(八)大数据时代仍然不能忽视进村入户调查
信息化发展给三农社会科学研究带来了一系列机遇和挑战。研究所依据的资料,更加具有样本量大、实时性、多元性、完备性等特征。但是三农社会科学研究者,要以脚踏实地的研究为己任,还是需要坚持进村入户的调查。通过“下村看实际,入户话家常”,发现趋势性苗头性的问题,掌握更为纵深的信息,是必须坚持的研究方式。
六、第六股:实证方法
实证方法是连接经济学理论与经验证据的工具,必须基于理论和经验证据的连接,才能得出结论。第一个需要明确的是,方法只是工具,现实问题、经济学理论、经验证据才是研究的本体,不能陷入“为了方法而使用方法”的怪圈。即便并不是进行严谨的学术研究,学习各种社会科学研究方法,并正确地使用它们,也将掌握认识世界的工具,从而有利于从事各种工作。第二个需要明确的是,各种经济学研究方法并没有孰优孰劣之分,不能因所谓的“技术含量”“逻辑层次”等,而歧视任何一种研究方法。实际上,各种研究方法经常综合交叉应用,形成对彼此的补充。
(一)历史分析方法
通过对三农领域某一主题有关历史资料进行科学的整理和分析,详尽描述其历史沿革、如何发展到现状,并就这一主题对农业生产、农村发展、农民经济社会行为变迁进行研究。农村改革每到一个标志性的节点,都会有一系列回顾性的文献问世。例如,根据改革40年的经验,可以发现农村制度创新、农业技术进步、农产品市场化改革和农业生产力投入是农业增长的主要驱动力。[24]历史分析方法的形式通常有两种:一种是对一段历史时期的某一方面的农业农村制度、制度绩效等进行全面描述和整理,结合制度经济学、农业经济学等理论进行分析,这种研究多见于对建国以来或改革开放以来的研究;另一种则是对某一农业方面的问题及其影响进行深入历史分析,这种研究更多地见于历史学方面的著作。例如,黄宗智的两本著作《华北的小农经济与社会变迁》和《长江三角洲小农家庭与乡村发展》都有针对农村商品化及其与农村发展关系的分析。[25]
(二)比较研究方法
在三农问题研究中,比较研究方法一般对不同国家或者地区的制度、绩效的相似性或相异程度进行研究与判断,经常会得出相关经验和教训的启示。举一个例子,在研究农产品流通主体时,可以将我国的情况与发达国家的情况进行比较。在发达国家农产品流通主体一般是农民协同合作组织,而我国依然是农产品经纪人、合作社、批发市场、龙头企业并存,这就造成我国农产品流通中农民市场力量较弱。近年来,散见于诸多文献中的国外农业农村农民问题考察报告等也属于比较研究方法的具体应用。
(三)案例研究方法
结合三农研究实际,以典型案例为素材,并通过具体分析、解剖,展现特定的情景和过程,建立一种“实践感”,从而寻求解决问题的方法。在很多社会科学研究中,研究者几乎无法对研究对象进行控制,只能对具体的情景材料进行收集整理,所以案例分析在这种情况下尤为重要。实际上,案例研究经常作为定量研究的先导或者稳健性检验。[26]而且,案例研究中也会用到一些定量的描述。然而,很多情况下,案例研究本身就能形成一个完整的社会科学研究。案例研究不一定是针对一个个案,也有可能是多个个案的比较研究。例如,研究中国农村城镇化进程中的改革问题,就需要对多个案例分析,从而检视区划、土地、行政和户籍政策,并从改革试点中得出“撤乡并镇”“以地换地”“股份合作”“人口搬迁”等经验与启示。[27]三农研究中经常写的调查研究报告就是案例研究方法的一种应用。
(四)数理经济分析方法
依据数理经济学分析方法,对三农问题进行数理经济学分析,就是用数学符号、公式推导证明等方法来表述农业农村农民相关各变量之间的关系。上文已有举例。
(五)描述性统计方法
统计图表就是典型描述性统计方法的应用。描述性统计方法一般会与其他研究方法相结合,在使用计量模型分析之前,往往会对使用的变量进行描述性统计。最起码,应当展示变量的均值和标准差。常用的统计学指标包括均值、方差、标准差、中位数等,可以求助于任何一本统计学教材。根据研究需要,研究者可能还会构建自己的一系列描述性统计指标。例如,CR4是行业前四名市场份额集中度指标,勒纳指数和赫芬达尔—赫希曼指数可以用以度量农产品或农资市场中垄断力量的强弱。近年来部分文献对农产品流通的各个环节进行描述性统计分析,研究诸如利润分配、流通费用的问题,也对政策有重要的指导意义。
(六)计量经济分析方法
习近平总书记在哲学社会科学工作座谈会上指出:“对现代社会科学积累的有益知识体系,运用的模型推演、数量分析等有效手段,我们也可以用,而且应该好好用。”当前,应用计量经济学模型研究三农社会科学问题的文献可谓汗牛充栋。本文的篇幅依然有限,穷尽不了所有的数量分析方法,仅仅做一个抛砖引玉。虽然经验研究总是有这样或那样的局限性,[28]但经验研究还是规范化的标志。立足中国现实,用现代方法研究中国问题,用国际语言讲述中国故事,[29]三农社会科学研究仍然任重道远。
1.回归分析
违背回归分析的几个经典假设会相应地派生出很多新的方法。
(1)多重共线性。实际上,回归经典假设中的非完全共线性是一种极端。即使是比较强但不完全的共线性也会导致系数的不稳定,主要表现为系数标准误很大。例如,构造回归模型研究农户收入的影响因素,自变量考虑农户教育水平和能力水平(可以用智商代替),那么能力肯定与教育水平相关,于是多重共线性就产生了。完全可以通过做自变量之间的相关系数矩阵来判断,如果相关系数太大,那么就意味着需要一些处理。(6)当然“太大”的标准可以根据研究的实际情况来判定,一般而言小于0.6为好,自然是越小越好。第一种是根据经济学理论重新选择变量,实际上这可能是最佳方法;第二种是逐步回归,但是这种方法经常会剔除掉一些符合经济学原理的变量;第三种是采用有偏估计方法,例如岭回归方法。
(2)奇异值。奇异值的英文名字非常有意思,叫做outlier,字面翻译是“躺在外面的那位”。但是,这个“躺在外面的那位”却经常导致估计的系数不稳定。近年来普遍的现象是受过大学教育的人回乡创业,假设他从事了粮食生产,那么在控制其他规模性的变量之后,他还是难以获得比较高的收入,于是这个奇异值就导致教育的系数偏小。处理奇异值的方法有三种:第一种比较简单,观察数据结构,将奇异值删除,比较极端的是对自变量进行截尾处理,如将最大的1%和最小的1%全部删除。但是这是万不得已的选择,因为奇异值的产生可能反映了一种社会科学现象,例如受过高等教育的人回到农村从事农业生产。第二种是进行缩尾处理。例如将落于如1%分位点到99%分位点之外的观察值分别替换为1%和99%分位上的数值。第三种,也是比较好的办法,是稳健回归,很多计量经济学软件,例如stata可以很简单地实现。
(3)异方差。回归经典假设之一是回归模型中的残差必须相等。否则,t检验会没有意义,而且模型的预测作用也会遭到破坏。比较常见的异方差处理方法是加权最小二乘回归,即将因变量赋予某一个权重,例如用因变量除以一个自变量等。
(4)非线性。在回归分析中,如果将非线性关系误当做线性关系来估计,那么会得到错误的回归系数。因此,在回归分析之前,做自变量和因变量关系的散点图就尤为重要。常见的处理方法是将自变量取对数,有时候因变量也会取对数。如果回归方程两边都取了对数,那么估计的系数也就被赋予了弹性这一经济学意义。有些情况下,也会对自变量取平方等,也就意味着因变量与自变量的关系出现了“U形”或者是“倒U形”。
2.处理内生性的一些努力
回归方程中,自变量与误差项的相关。这有可能是由于自变量与因变量因果倒置或者互为因果(7)可以说是“蛋生鸡,鸡生蛋”的问题。,也有可能是因为遗漏了重要变量。有计量经济学家直言:“内生性是计量模型摆脱不去的恶梦。”[30]内生性的处理办法也有一些:
(1)工具变量法。选择一个与自变量相关,但是与误差不相关的变量。例如,研究农业生产力对外出打工的影响,由于外出打工反过来会导致农业劳动力投入减少,从而导致农业生产力下降,于是就产生了反向因果。可以用降雨量做农业产出的工具变量。
(2)两阶段最小二乘法。简单一点描述,就是将工具变量方法推广到了多工具变量的阶段。
(3)双重差分法。或称倍分法。在某项农业政策效果分析中,这一方法经常使用。有时候,简单的双重差分法实际上就是设置交乘项,对该变量的系数进行估计。例如,研究户籍制度改革对农村劳动力流动的影响,可以根据户籍改革省份不同的推进年份设置交乘项,从而估计户籍制度改革的影响。[31]
(4)倾向值匹配法。在政策效果分析中,这一方法也比较常用,通过对各观察样本特征进行分析,将最为相似的样本匹配在一起,通过对享受政策与否的样本进行比较,得出政策效果。实际上,目前为止最趋向完美的倾向值匹配法可能就是同卵双胞胎数据。因为同卵双胞胎在家庭背景、颜值、智商甚至大部分后天能力等方面是比较相似的,因此,使用这样一种“近乎完美的”倾向值匹配后的数据进行回归,可不用担心遗漏变量造成的内生性。中国学者最早使用过同卵双胞胎数据,分析教育差异对收入的影响。[32]
(5)断点回归。前提是识别一个断点,例如测算新型农村社会养老保险的影响,如果只有年满60周岁的参保人才能够领取养老金,那么60岁就是断点。当然由于政策执行严格的程度,这个断点也有可能是“模糊断点”。[33]
(6)合成控制和回归控制。例如,研究撤县设区的经济影响,构建的假说是:撤县设区增加劳动力转移就业的机会,这样就可以选择一个近期撤县设区的“A区”,用其他与其状况相似的没有撤县设区的县的特征,用主成分分析合成或回归分析方法拟合出来一个“A县”,比较这个“实际存在的A区”与“合成的A县”二者在劳动力转移就业上的差异。[34]
(7)面板数据分析。这对数据要求较高,必须获得连续多年的追踪数据,而且很多农业经济变量年际之间差异较大,所以这一方法使用的前提是获得高质量连续多年的追踪数据。通常的情况下,经济学的分析中,选择面板数据固定效应模型的较多,这是因为随机效应经常出现有偏估计。
3.离散选择模型
有时候,因变量不是连续变量,而是二分变量。例如,对于农户是否选择参与订单农业,变量就只取0或者1,这种情况下,经常选择Logit模型或者Probit模型对相关问题进行计量经济学分析。如果因变量的取值更多,如经营主体在选择农产品的运输方式时,可以是人力拖运,可以是汽车装运,也可以走水路又轮船运输,甚至某些农产品可以走空运,那么就可以选择多元Logit模型。如果离散型因变量是定序的,一般而言,定序Logit模型因变量之间的离散程度应该是均匀的。
4.选择性模型
在农产品流通的实证分析中,经常遇到这样的因变量,其取值大量为零。例如:一个农产品加工企业可能大量出口,也有可能不出口,那么这就导致因变量大量为零,本来这需要使用受限因素模型——Tobit模型。[35]但是,企业出口可能有自选择效应和内生性,因此,就需要选择性模型——Heckman模型。该模型实际上是进行了两阶段的估计,仍然以农产品加工企业是否出口为例,第一个阶段解决是否出口的问题,第二阶段解决出口多少的问题。如果上述第一步,由“是”“否”变成了大于两种选择,例如有的企业只做内销,有的企业出口到欧美,有的企业出口到日韩,有的企业选择第三世界国家市场。那么,就可以选择多元选择性偏误修正模型。[36]
5.时间序列分析
时间序列分析是研究农产品价格问题经常用到的方法。例如,对于粮食的月度价格变化规律,可以使用各种自回归移动平均ARMA模型进行研究,加入季节性因素加以差分,就变成了ARIMA模型。对于两个平稳性时间序列之间的统计学因果关系,经常需要使用格兰杰因果方法来检验。具有因果关系时间序列之间会存在长期的协整关系,然而短期内几个时间序列组成的经济系统又常常会受到外生变量的干扰。因此,向量自回归模型是一个较好的选择。农产品价格与其他时间序列变量(如农产品价格与通货膨胀)之间存在长期均衡关系,甚至不同农产品价格(如猪肉价格与玉米价格)之间也存在长期均衡关系。这种关系就是协整。有时候,农产品价格会对前期的非均衡程度作出修正,因此,向量误差修正模型经常作为一种选择出现。在衡量制度的变化时有时候会在时间序列中使用虚拟变量。然而,制度的影响有时候并不是突变的,所以,虚拟变量可能并不合适,在近期的文献中非线性时间序列分析也逐渐得到应用。[37]另外,面板数据因为具有时间序列的性质,也可以用非线性的模型。例如,面板门槛回归模型。
6.空间计量经济学
实际上,空间计量经济学与地理信息系统关系极为密切。很多时候,地理信息系统展示得比较直观,并且可以通过一系列地理信息识别来为空间单位赋值。在此基础上,横截面、面板等数据中加入空间权重,根据需要,进而考虑时间序列依赖和空间依赖,甚至把空间依赖分解为周期性共同趋势和“相对干净”的空间相关,例如,农业机械总动力在县域水平上的变化,可以用地理信息系统展示,并且可以使用空间计量经济学分析。[38]
7.分位数回归
分位数回归提供了对解释变量和被解释变量的分位数之间线性关系的估计方法。例如,在分析农村人居环境质量的时候,有些自变量,例如村庄规划,对于农村人居环境质量较低和较高的村庄促进效果存在差异。分位数回归可以衡量出这种差异。[39]
8.随机试验方法
将研究对象进行随机分组,同时对对照组和试验组实施不同干预并比较干预效果。社会科学里面很难做实验,但是20世纪90年代中期,随机试验法开始在发展中国家被应用于政策评估。[40]2019年诺贝尔经济学奖就是授予经济学随机试验方面的前沿经济学家Abhijit Banerjee、Esther Duflo和Michael Kremer,以表彰他们“在减轻全球贫困方面的实验性做法”。
9.机器学习
在机器学习这个大门类下,Lasso系列的惩罚回归在分析高维数据上具有优势,决策树在预测方面效率较高,支持向量机是比较优秀的分类器,随机森林可以用于模型变量选择,等等。[41]在大数据和人工智能的时代,三农社会科学研究者需要紧跟时代,强化学习,克服“本领恐慌”。
七、第七股:检视结论
结论部分一般就是证明或者证伪假说,从而对理论框架进行验证。很重要的一步是稳健性检验。如果几种研究方法综合应用结论“打架”,甚至得出与中国现实不符的结论。那么,必须回过头去求助于社会科学理论,或者检视研究方法是否应用正确,或者寻找新的经验证据。[42]稳健性检验之后的文字性的结论,实际上是很简要的。主要目的在于重述整个研究,强调一下研究的贡献,指出一些研究的未尽之处。
(一)稳健性检验一般不能“缺位”
建立竞争性的假说,或者使用不同的方法,来检视一下结论是否仍然成立。经验研究中,可能稳健性检验要占到很大的篇幅。计量经济学分析来进行稳健性检验,需要尽可能引入控制变量,使用各种方式减轻内生性影响。或者换一种方法,也就是说第六股中的研究方法都可以用于稳健性检验。还有一些常用的稳健性检验方法,包括剔除样本、替换变量、变换样本、工具变量、距估计方法,等等。[43]实际上,具有典型意义的案例、全国或更大范围的统计数据、来自其他国家和地区的经验等,也可以作为稳健性检验的手段。
(二)结论要对整个研究进行总结提炼
这个研究提出了一个什么样的问题,围绕这个问题本研究在文献体系中的地位如何,或者找出了哪些文献缺口。为此,本研究设定了什么样的研究目标,构建的是什么假说。为了研究目标设计研究内容,构建理论框架,对应着研究内容需要什么样的素材,采集哪些数据和资料。对应于数据和资料采用一系列怎样的研究方法,得到什么样的结论,而这些结论又具有什么样的意义。实际上,有时候结论部分容易写成摘要。区别在于,摘要更加简洁,结论可以发挥的篇幅略大,而且经常要引发今后的研究。马克思主义认识论告诉我们,认识要螺旋状上升,即调研生发问题,文献校准问题,实证得出结论,再调研校准结论并生发新的问题。实际上就是,行万里路,读万卷书,写万言文,不断地循环这一个过程。
八、第八股:政策设计
政策设计是三农社会科学研究学以致用的体现。在当代中国亟需完善制度顶层设计和政策分层对接的背景下,由科学规范的研究得到科学的结论,为政策设计提供决策参考,甚至可以作为研究的主要目标之一。
(一)政策设计要紧扣研究结论
研究结论推导不出来或者引申不出来的政策启示不要体现。例如,上文提到的,我们发现村庄规划对人居环境质量影响是正向的,那么一条政策建议就可以是“完善村庄规划,促进人居环境质量提升”。但是,如果得出“村庄规划中提出未来20年的明确目标,能够促进人居环境质量提升”这样的政策建议,虽然有一定的道理,但是并不是实证研究结果明确发现的。
(二)很多政策建议可以从先进地区的经验来
实地调研的重要性就凸显出来了。例如,“发动和依靠群众,坚持矛盾不上交,就地解决”的“枫桥经验”,就写入了十九届四中全会《决议》。实际上,当下的农村改革试验有很多。很多案例和综合的素材,可以用社会科学研究方法来集成研究,之后提出来有意义的决策参考、示范经验,为政策分散风险、分解困难。[44]
(三)借鉴国际经验一定要看外文原文
在借鉴国外经验的时候,不要过分相信二手文献。尽量阅读外文原文,例如,世界银行、世界贸易组织、国际货币基金组织、联合国粮农组织等国际组织的网站,世贸组织、经合组织等网站上每隔一段时间会提供分国别的一段时期内的政策回顾,国际食物政策研究所等国际研究机构网站也会提供某个国家或地区的发展经验教训,特定国家的农业部或农业农村研究部门的网站也是国际经验文献的重要来源。
(四)政策可以作为一种模拟情景放入预测模型
可计算一般均衡模型或局部均衡模型为我们提供了有力的动态分析工具,模拟的情景经常包括不同的经济增长速度、不同的城镇化速度,实际上政策设计也可以作为一种情景放入这种“大模型”进行预测。
习近平总书记在哲学社会科学工作座谈会上指出:“要按照立足中国、借鉴国外,挖掘历史、把握当代,关怀人类、面向未来的思路,着力构建中国特色哲学社会科学,在指导思想、学科体系、学术体系、话语体系等方面充分体现中国特色、中国风格、中国气派。”这就告诉我们,要扎实地学习国情,培养对中国问题的敏感度。[45]然后创造一切条件,踏实学习社会科学研究方法,进而研究中国的问题,讲述好中国故事。从历史和现实、理论和实践相结合的角度深入阐释如何坚持中国道路、弘扬中国精神、凝聚中国力量。(8)习近平总书记2021年5月9日给《文史哲》编辑部全体编辑人员的回信。这也是新时代三农社会科学研究者值得共勉的技术路线。