APP下载

基层视角下“森林”话语内涵与案例研究中样本饱和度

2016-10-19刘金龙刘博雅张明慧

贵州社会科学 2016年4期
关键词:饱和度受访者编码

刘金龙 刘博雅 张明慧

(中国人民大学,北京 100872)



基层视角下“森林”话语内涵与案例研究中样本饱和度

刘金龙刘博雅张明慧

(中国人民大学,北京100872)

人文社会科学的方法论中,“饱和度”是指收集数据直到没有新的信息产生的案例样本数。它是在理论上衡量案例研究效度的关键指标之一,我国教育学和管理学的案例研究也逐渐要求考虑案例饱和度的问题。但是饱和度的概念并没有为研究设计确定案例样本量提供具体的操作化的指导。研究问题的聚焦程度、总体的异质性以及数据搜集方法都会影响案例研究中样本的饱和度。在案例研究当中,研究者可实施与本文提出的相似的方法去检验理论抽样样本的饱和度以及相关的问题,例如编码的可靠性和稳定性。

案例研究;饱和度;基层森林话语内涵

人文社会科学的研究中,案例“饱和度”的概念可以帮助衡量案例研究的效度优劣。饱和度是指达到数据饱和时的样本大小。数据饱和(the significance of saturation)即数据充分,亦或是收集数据直到没有新的信息产生。样本饱和度影响理论抽样样本的大小以及案例研究的效度,[1]未检验案例饱和度的研究可能出现研究结论超出案例边界或未能全面反映案例理论两种情况。[2]已有的研究对案例研究中“饱和度”的重要性基本达成一致的观点。[3][4][5]笔者在中国知网搜索CSSCI来源期刊的论文,全文中包含“案例研究”的文献有26241篇,全文中包含“案例研究”和“饱和度”的文章有96篇。笔者对96篇文献进行全文阅读,剔除不符合要求文献44篇(其中6篇为案例研究方法论相关文献),筛选出运用案例研究方法并对案例样本饱和度进行讨论的中文文献共计52篇,其中2010年1篇,2011年4篇,2012年7篇,2013年10篇,2014年19篇,2015年11篇;多发表在管理学和教育学的较顶级的期刊上,如《管理世界》、《管理学报》、《北大教育评论》。可见,我国学界对严格规范的研究方法的需求是日益增长的,但在实际操作中设计和检验样本饱和度的研究比例仍处于低水平(0.366%)。大多数方法论的文献也仅提出案例数量的选择在理论上需要遵循“饱和度”指标或研究的案例数量达到饱和,[2][6]但并未就具体的设计和检验的方法进行探讨,达到饱和时的样本大小的设计和检验却没有标准化的指导和规范。

本文试图以“基层视角下‘森林’话语的内涵”研究为例,为案例研究中样本饱和度的问题提供基础性的建议。本文基于对贵州省黔东南州雷山县上郎德村15户苗族居民关于“森林内涵”的标准化访谈数据,进行录入、编码和分析,实证检验案例研究的样本饱和度。

一、文献综述

许多文献中都有提及“理论饱和”在非概率抽样样本大小设计当中的重要性。也有少数的研究给出了实际操作中非概率抽样样本大小的具体数值。Bernard(2000)认为大多数的民族志研究需要36个访谈。Bertaux(1981)指出质性研究中可接受的最小的样本量是15个。Morse对于样本的饱和度给出了更加细致的实际的指导:现象学的研究至少需要6位受访者,民族志和扎根理论的研究大约需要35位受访者,生态学的质性研究则需要100到200个研究单位。[7]Creswell(1998)指出,现象学研究需要5至25位受访者,扎根理论需要20到30位受访者。Kuzel(1992)提出样本异质性和研究目的影响样本饱和度,同质性较强的样本需要6至8位受访者,异质性较强的样本则需要12至20位受访者。但是他们并没有为样本饱和度的观点提供方法和证据。[8]Greg Guest等(2006)使用来自于包括两个西非国家60个妇女的深度访谈的研究的数据,系统地记录了数据饱和度和主题分析过程的变异性。研究发现,饱和发生在第一组的十二个访谈中,基本要素在前六个访谈中已经呈现出来。[9]那么,如何设计案例样本数以保证研究的信度和效度呢?本文对于案例研究中理论抽样样本饱和度问题的研究以“基层视角下‘森林’话语内涵”的研究为基础,主要探讨案例研究中理论抽样样本饱和度的问题。

二、基层视角下“森林”话语的内涵研究

改革开放以来,我国林业政策经历了巨大的变迁,由最初以林业产业发展为重点的经济导向逐步转变为以森林资源保护为重点的生态导向。更重要的是,不仅宏观森林话语影响着基层林业实践者和行政人员的认知和行动,基层林业实践者和行政人员也在不断地影响着宏观森林话语。在中国南方地区,基层林业经营管理者与行政管理人员在长达半世纪的探索与实践中,走出了经济建设、生态建设和文化建设并重的发展道路,也为我们分析宏观森林话语与基层森林话语的交互作用提供了天然的实验室。在政策领域、学术领域,从不同视角出发对于“森林”的定义繁多。不同国家组织、国家和同一国家的不同地区,以及同一组织或国家在不同时期为不同目的,对森林的定义也存在差异。例如,国际粮农组织(FAO)在1990年和2010年全球森林资源评估报告中采用的森林资源范围的界定也有所不同。但很少研究关注基层林业经营管理者对于森林的认知情况,而这群人往往是跟森林关系最紧密的人群,他们的生计与森林息息相关。本研究关注基层视角下,森林基层经营管理者对于“森林”这一话语的解读,探讨当前基层视角下“森林”话语的内涵。受访者对于森林的理解多是从森林的价值和功能的角度。

(一) 数据选取和收集

本文选取的田野点是贵州省黔东南地区雷山县朗德镇上郎德村。上郎德村有2个自然村,6个村民小组,202户,856人,常驻人口600人。全村总面积5.5万平方公里,耕地面积312.92亩,林地面积4000亩。林地中集体林2000亩,责任山1200亩,自留山800亩。属于自然资源相对稀缺的地区。村民的主要经济收入包括参与式旅游、外出务工、养殖、公益林补贴等,村寨的生计结构相对简单。这是一个传统的苗族村寨,具有典型的苗族特征,上郎德村村民对森林有格外的情感,生计也与森林密不可分。

研究团队在当地进行了为期6天的实地调研,目的性选取15户居民进行了结构式访谈,主要考虑了性别和年龄。结构化访谈包括1个中心问题和5个辅助性问题。中心问题是“您觉得森林是什么?”,辅助性问题的作用是帮助村民理解并回答中心问题。分别为:

1.您认为森林有什么用途?

2.您认为森林与您的日常生活有什么关系?

3.您认为森林和苗族的传统有什么关系?

4.您认为从您出生到现在森林发生了怎样的变化?

5.您觉得村寨开始参与式旅游之后,对森林是否有影响?森林发生了什么样的变化?

由于使用的方法是结构化的访谈和标准化的问题,所以在访谈过程中,访谈人员需要询问每一位参与者同样的6个问题。在访谈过程中,当受访者寻求帮助时,访谈人员只能通过重复问题或者转译问题的方式对受访者进行帮助,而不能影响受访者的理解和判断。考虑到与当地农户的对话问题,在访谈时,访谈人员不能完全按照以上6个标准化问题逐字访谈。但是,转译的文字必须在研究规定的范围当中。在访谈过程中,以便准确的记录信息,使用录音的方法,之后按照录音逐字录入2010版Microsoft Word软件,形成电子版的文字数据集。

(二) 数据分析

在目的性抽样的15个样本当中,有8名男性和7名女性。30岁以下的2人,30-60岁的7人,60岁以上的6人。考虑到性别和年龄可能会对研究的问题存在异质性,所以在抽样过程中使用目的性抽样,男性和女性基本各占半数,抽样的年龄比例也基本符合村寨中村民年龄的分布。由于研究目的包括森林的变迁,所以在样本的选取中,着重选择了30岁以上的访谈对象。具体的描述性统计结果如图1所示。

图1 样本的描述性统计图(性别和年龄)

在初步的数据统计和小组讨论之后,对15个样本进行编码,采用轴心式编码和开放式编码相结合的方式,即一级编码使用轴心编码,是研究团队在分析数据过程中依据森林的科学定义设定的编码,即森林的属性;二级编码使用开放式编码,是依据访谈的文本,从受访者的话语中提炼出来,以受访者的原话语作为编码,即受访者对于森林理解的内容。本研究认为,基层森林经营管理者对于森林内涵认知的一级编码可以归纳为三个维度:生计维度、生态维度和文化维度。在一级编码下,有8个二级编码,二级编码均是以受访者的实际的话语进行命名。具体编码及编码在样本数据中出现的频数、频率如表1所示。

虽然二级编码只有一个,但频率达到15%。说明在基层视角下,森林的文化价值同样也是非常重要的,受访者对于森林文化价值的认知集中于风水林、护寨树、护寨林以及苗族传统的森林文化。需要说明的是,由于田野调查点是苗族传统村落,苗族自古以来对于森林都有着格外的感情,所以可能会在一定程度上夸大基层视角下森林内涵的文化价值。在访谈过程中,受访者表示“要保护好森林景观才能促进村庄的参与式旅游”。可见,森林景观改善有助于生态旅游,从而能够增加村民收入。这个话语体现了森林在“生态价值”、“文化价值”和“生计价值”之间的转化。研究发现,基层视角下森林内涵的三个一级编码之间是可以相互作用,相互促进,相互影响的。具体而言:(1)森林的“生态价值”和“文化价值”有利于森林“生计价值”的更好维持和表达;(2)森林的“文化价值”是从森林的“生计价值”和“生态价值”中派生出来的;(3)森林的基层经营管理者需要在森林的三种价值之间进行权衡。

表1 样本数据编码表

需要注意的是,对于所研究的问题,每一个编码的重要程度是不同的。本研究使用编码的频率来定义编码的重要性。相对于频数来讲,频率能够更好的反映编码在研究问题中的相对重要程度。例如相同的受访者在访谈中反复强调的编码或者不同的受访者在同一标准化访谈中同时提到的编码,则对于研究问题而言重要性更强。

(三)案例饱和度的实证检验

本研究将15个目的性抽样的样本数据进行随机分组,共分为3组,每组5个样本数据。首先,输入第一组数据对其产生的编码个数进行描述性统计,然后依次逐组加入数据,统计增加的编码个数。实验结果如图2所示。

图2 新增编码个数表(1)

对15个样本进行编码,共得到二级编码8个。当第一组的5个样本输入之后,7个(87.5%)二级编码已经呈现出来。另外一个二级编码在第二组的5个样本输入之后呈现出来。在加入第三组数据之后已经没有新的编码形成。也就是说在10个样本输入之后,本研究问题的数据已经达到了饱和。那么分组的不同是否会影响数据的饱和度呢?笔者将三组样本调换顺序进行了第二次和第三次的检验,检验结果如图3所示。

图3 新增编码个数表(2)(3)

在图3中可以看到,实验(2)的结果与实验(1)完全一致,实验(3)的结果存在一些差异。在实验(3)当中,当输入第三组的5个样本后,6个(75%)二级编码已经呈现出来。添加第一组的5个样本之后,出现了1个新的二级编码,数据并没有达到饱和,再添加第二组的5个样本之后,又有一个新的编码出现,数据达到饱和。可以清晰地看到,当加入10个样本的时候已经有87.5%的信息被获取,在最后5个样本输入之后出现的二级编码是“长寿”,如表1中所示,长寿这个二级编码出现的频数为1,频率为2.5%。也就是说,在最后一组中新增的二级编码相对与研究问题而言重要程度较低。

那么又产生了两个问题:第一,编码的内部一致性或可靠性,即信度;第二,编码的稳定性,即最初频率较高的编码,在输入三组数据之后是否仍然频率较高,亦或说编码的重要性程度是否稳定。首先,本文使用克隆巴赫系数对编码频率的可靠性和稳定性进行检验。将每组数据依次输入SPSS Statistics 21,检验结果如表2所示。

表2 编码频率的内部一致性检验表

一般克隆巴赫系数高于或等于0.70,数据编码的内部一致性的程度就可以被接受。如表2所示,每两组数据检验的克隆巴赫系数均显著大于0.70,添加第三组数据之后,克隆巴赫系数为0.918,也说明了样本编码频率的内部一致性。说明本文设置的编码在2组10个样本输入之后已经达到了相对的稳定,即内部的一致性。

其次,将所有的编码分为高频、中频、低频三组,如表3所示。

表3 编码频率稳定性检验表

表3显示,最初高频的编码,在三组样本输入之后,仍然是高频的编码,样本编码保持稳定性。同时,编码的频率高表明了该二级编码在研究问题中相对的重要性。高频的编码不论在第一组样本录入时,还是在三组样本录入后,都保持高频,且频率均超过50%。中频和高频编码基本涵盖了研究问题的关键信息,三组实验中中频和高频的编码频率合计为100%、96.29%及97.5%。样本编码的稳定性也得到了验证。

三、结论与讨论

依据以上的分析,本研究绝大多数的关键的编码(87.5%)在第一组的前五个访谈当中已经呈现出来,饱和发生在第二组到第三组的10至15个样本当中。也就是说针对本研究,至少需要5个样本,在5个样本数据输入之后,基本没有再出现新的关键性的编码。样本编码在5个样本时,兼具可靠性(内部一致性)和稳定性。

需要注意的是,本研究的结果并不意味着所有的案例研究理论抽样的样本的饱和度均为10至15,也不是说所有的质性研究都可以仅进行5个样本的数据搜集。在质性研究当中,需要研究者根据研究问题的特质,设计和检验样本的饱和度。样本的大小,饱和的快慢,取决于研究者希望获得什么样的数据,完成什么样的分析以及如何使用数据。通过对52篇采用案例研究方法并且讨论案例饱和度的相关文献进行比较分析,本文认为影响质性研究样本量的关键因素是研究问题的聚焦度、总体的异质性以及选择的研究方法(如表4所示)。

表4 文献对比分析表

第一,研究问题的聚焦度。研究的问题聚焦度越高,针对性越强,那么在一个特定的总体当中进行数据搜集,需要的样本量越小;反之,越大。如果研究问题非常发散,非结构化或者是具有很强探索性的问题,那么就需要更大的样本,有时候甚至在可行范围内无法达到饱和。本文“基层森林话语内涵”的研究问题聚焦度很高,至少需要5个样本,10-15个样本可以到达饱和。然而,如果需要研究不同组别之间的关系、研究变量之间关系或是研究变迁过程,那么可能需要更多的样本。如表4所示,其中单案例研究多用于解释性研究或探索性研究,是对现象的描述、解释和理解;3个样本左右的多案例研究则更进一步研究变量之间的关系,异同点、相关性和因果关系,多采用分析、比较、归纳的方法;如果研究者要在案例研究的基础上,探究变量之间的作用机制,或是提出分析框架或理论模型,那么在案例数量的选择上一般有所增加(3个样本以上)。

第二,总体的异质性。总体的异质性越高,需要的样本量越大;反之,越小。[7]如果去询问专家专业领域的具体问题,那么可能需要的样本量就会非常小,饱和很快就会发生。本文研究的总体设定为上郎德村所有的居民,由于制度环境、文化环境相似,同时存在的生计结构相对简单,所以总体的异质性比较低。本文只需要10-15个样本就可以达到饱和,关键信息在前5个样本中已经显现出来。如果研究的总体异质性较高,可能需要更大的样本量。例如本研究基于的背景的主题是“基层视角下森林话语的内涵”,总体如果设定为“基层森林经营管理者”,那么可能就需要每个村至少5个样本,生计结构、制度结构、文化结构比较复杂的村庄则可能需要更多的样本。例如《基于扎根理论的文化创意类众包社区发包方参与动机研究》一文,由于发包方类型较多,包括企业、中小型公司、商铺和个人,为避免抽样特殊性导致分析失误,研究的案例样本量为170,通过饱和度检验;[10]《雇员在企业履行社会责任中的作用研究》一文,则是由于研究总体分布于13个地区,且存在雇员、消费者、零售商、求职者4种身份,所以选取153个样本案例。[11]

第三,数据搜集的方法。研究者需要从开始就清楚研究问题的理论框架,理论、数据和变量之间的关系。例如结构化访谈、半结构化访谈或开放性访谈的方法选择会影响样本的饱和度,开放性访谈中新问题的产生则可能会扩大样本的饱和度。

样本的饱和度对于样本的设计非常重要,如果达到饱和预计的样本量非常大,但是预算有限,那么这个研究计划就是不可行的。与概率抽样不同,田野中案例研究的非概率抽样方法存在进入的问题,是否具有可操作性对于研究问题至关重要。在案例研究当中,研究者可实施与本文提出的相似的方法去检验理论抽样样本的饱和度以及相关的问题,例如编码的可靠性和稳定性。并进一步验证本研究的结果是否可以归纳到其他的领域、其他形式、其他组织的质性问题的样本大小设计当中,例如焦点小组访谈、观察、历史分析等。

[1]王建云. 案例研究方法的研究述评[J]. 社会科学管理与评论,2013(3):77-82.

[2]苏敬勤,崔淼. 探索性与验证性案例研究访谈问题设计:理论与案例[J]. 管理学报,2011(10):1428-1437.

[3]Sandelowski, M. 1995. Sample size in qualitative research. Research in Nursing and Health1 8:179-83.

[4]Byrne, M.2001.Evaluating the findings of qualitative research. Association of Operating Room Nurses Journal 73 (3): 703-6.

[5]陈向明. 质的研究方法与社会科学研究[M].北京:教育科学出版社,2000:1.

[6]苏芳,黄江明. 质性研究设计与写作的若干策略——“中国企业管理案例与质性研究论坛”会议综述[J]. 管理世界,2013(2):136-140.

[7]Morse, J. 1994. Designing funded qualitative research. In Handbook for qualitative research, ed. N. Denzin and Y. Lincoln, 220-35. Thousand Oaks. 1995. The significance of saturation. Qualitative Health Research 5:147-49.

[8]Kuzel, A. 1992. Sampling in qualitative inquiry. In Doing qualitative research, ed. B. Crabtree and W. Miller, 31-44. Newbury Park.

[9]Guest, G., Bunce, A., & Johnson, L. (2006). How Many Interviews Are Enough?: An Experiment with Data Saturation and Variability. Field Methods, 18, 59-82.

[10]宗利永,李元旭. 基于扎根理论的文化创意类众包社区发包方参与动机研究[J]. 科技进步与对策,2015(14):1-5.

[11]刘秋玲,熊小明,刘萍. 雇员在企业履行社会责任中的作用研究[J]. 武汉大学学报(哲学社会科学版),2013(3):101-104.

[责任编辑:申凤敏]

国家自然科学基金项目“建构侗族传统知识在森林可持续经营中的作用及政策涵义”(71163006);中国人民大学科学研究基金项目“发展干预、自然资源管理与乡村转型——基于行动者导向理论的解读”(15XNL022)。

刘金龙,中国人民大学农业与农村发展学院、中国人民大学林业与资源政策研究中心教授,博士生导师,主要研究方向:林业经济与政策、农村社区发展干预、国际环境整治(森林、生物多样性、气候变化)、林业传统知识与文化、森林转型;刘博雅,中国人民大学农业与农村发展学院、中国人民大学林业与资源政策研究中心;张明慧,中国人民大学农业与农村发展学院、中国人民大学林业与资源政策研究中心博士生,主要研究方向:林业传统知识与文化、乡村转型、社区森林治理。

F069.9

A

1002-6924(2016)04-151-157

猜你喜欢

饱和度受访者编码
今天,你休闲了吗?
关于安全,需要注意的几件小事
低碳生活从我做起
糖臬之吻
五成受访者认为自己未养成好的阅读习惯
基于SAR-SIFT和快速稀疏编码的合成孔径雷达图像配准
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
Genome and healthcare
制作一个泥土饱和度测试仪