计算机辅助调查与访员误差控制

2017-02-26丁华

统计与决策 2017年19期

关键词：测量误差受访者题目

丁华

（北京大学中国社会科学调查中心，北京 100871）

计算机辅助调查与访员误差控制

丁华

（北京大学中国社会科学调查中心，北京 100871）

计算机辅助调查模式（CAI）通过技术手段可以在一定程度上减少访员因素造成的误差。有效运用CAI技术手段改善访员访问和管理方式，控制因访员因素产生的测量误差，对于提高访问质量是非常关键的。文章将对CAI模式中影响测量误差的访员因素、减少访员相关误差的方法以及改进数据质量的措施进行探讨。

计算机辅助调查；访员误差；数据质量

0 引言

调查环节中的测量误差是指由访员、被访者、测量工具和调查场景等因素造成的所收集的数据与客观事实之间的偏差，其中访员因素是社会调查过程中的重要测量误差来源，对访问质量产生着至关重要的影响。在调查过程中，受访者是否愿意接受访问、能否提供真实的数据，都在很大程度上取决于访员的个人特征、专业水平、访问态度和沟通技巧。

计算机辅助调查模式（CAI）的引进和应用，虽然不能彻底消除访员因素对数据质量的影响，但通过技术手段可以在一定程度上减少访员因素造成的误差。有效运用CAI技术手段改善访员的访问和管理方式，控制因访员因素产生的测量误差，对于提高访问质量是非常关键的。为此，本文尝试对CAI模式中影响测量误差的访员因素、减少访员相关误差的方法以及改进数据质量的措施进行探讨。

1 影响测量误差的访员因素

访员特征、访员经验、访员态度等访员相关因素都会对测量误差产生影响。在实际调查过程中，需要充分了解可能引起访问误差的来源，并准备相应的措施。

1．1 在敏感问题方面的访员误差

访员在场本身会导致受访者偏差性的回答。尤其对敏感问题而言，访员的到场更容易对测量结果产生影响，访员的“社会存在”激发受访者在回答问题时更多地考虑到社会规范。遵从社会规范的压力促使受访者选择隐瞒真实情况，由此产生的偏差传统上经常被视为是系统性的和难以避免的。

在CAI模式下，可以借助计算机辅助的自助语音系统（ACASI）解决敏感题和隐私题因访员在场而产生的测量误差问题。ACASI是在CAI基础上发展起来的一种新技术。该技术将问卷中的敏感问题通过语音转换软件嵌入访问管理系统，在访员访问到此类问题时，会根据系统提示将电脑转交给受访者。受访者在回答问题时，通过耳机收听计算机播放题目录音，自行输入答案完成访问。整个过程由调查对象独立完成，调查员不参与并且不能浏览受访者提供的信息。这种方式已经在多个国家被应用在酒精和毒品使用、性行为、家庭暴力等敏感调查中，并且被证实能够提高敏感问题的报告率[1]。

1．2 与访员特征相关问题方面的访员误差

当调查问题与访员的某些特征产生联系时，这些特征会对受访者的回答产生直接影响。一项经常被引用的关于反犹太主义态度的调查发现，当访员的名字里含有常见的犹太姓氏或者自身有明显的犹太人特征时，被访者表达反犹太主义的观点比例会降低[2]。访员特征可能与种族关系相关，也可能会跟语言、社会经济特征、年龄相关。当调查中的问题与某些访员特征产生相关关系时，受访者倾向于根据访员的特征来做出判断和回答。但是在很多情况下，很难判断选择与受访者社会属性相似的访员会带来正面还是负面的效应。因此，在实地调查中最好的方法是随机安排访员，以此来减少因为访员自身特征带来的误差。

1．3 与调查经验相关的访员误差

访员调查经验对于测量误差而言是一把双刃剑，可能会对调查结果产生两种作用：一种是比较积极的作用，有经验的访员掌握了更好的入户技巧和沟通技巧，倾向于获得更高的合作率，并且在访问过程中通过技巧性发问和追问获得更准确的信息，产生更少的误差。另一种可能是比较消极的作用，调查经验的增加可能让访员掌握更多规避核查、付出更少努力获取数据的方法，增加测量误差。在美国药物使用和健康调查(NSDUH)中，研究结果显示，有经验的访员较之没有经验的访员报告了更少的毒品使用情况。即使在没有经验的访员组内，随着完成访问数量的增加，其数据中毒品使用状况的汇报会减少。这可能与有经验的访员倾向于引导受访者回避敏感性题目以减少受访者反感、降低访问工作量有关[3]。此外，调查经验丰富的访员可能存在一种行为趋势，即在与被访者的互动中有意的缩减题目所传递的信息需求，以减少受访者思考的时间和提供详尽答案所花费的时间。有研究表明，有经验的访员往往不会像没经验的访员一样严格的按要求把问卷中的问题逐字逐句的读出来，而是按照自己对问卷的理解进行访问[4]。但从实际执行效果上看，如果这种变通是非原则性的，不见得必然会对数据造成负面影响。

事实上，访员经验能否在减少测量误差方面发挥积极作用，关键取决于访员的管理方式和监督手段。在CAI模式中，通过培训和日常督导，能够为访员确定明确可操作易于监督核查的访问规范。此外，采用计算机辅助技术能够保证访问数据实时上传，通过及时有效的常规数据清理和核查措施，发现访员访问行为和规范的问题，并能够及时给予反馈和指导。在该种模式下，访员的经验增加对于提高合作率、减少测量误差在更大程度上会发挥正面作用。

1．4 与调查态度相关的访员误差

在一项调查开始之前，大多数受访者对于如何接受访问、如何回答问题没有概念。影响受访者参与访问态度的一个重要因素是访员表现出来的对于调查的态度。一项健康调查的研究结果显示，受访者认为在访问中表现出的态度是想得到“准确答案”而不是“一般的想法”的访员，倾向于获得更高的访问质量和更少的误差[5]。访员对于访问工作的态度以及在受访者面前表现出来的态度会直接影响到受访者对该调查的认知，并进而决定其参与调查的态度、配合程度和回答问题的真实性。这种访问过程中的访员与受访者之间的互相观察、认知、判断和互动会对调查进程和结果产生较大影响，并最终影响数据的质量。

在CAI模式中，通过问卷数据的实时回传、电话核查和录音核查的同步开展，核查员根据核查问卷能够对访员的访问态度和受访者反应进行判断，并及时对访问态度有问题的访员进行干预指导，在访问过程中不断改进访员的访问态度和技巧。

2 CAI模式中减少访员误差的方法

为了减少访员因素对调查数据的影响，保证访员行为在数据收集过程中的稳定性和一致性，研究者和调查实施者需要在问卷设计、访问过程控制、访员管理方法这三个方面引起重视。

2．1 问卷设计

问卷设计的技巧在很大程度上决定了访员访问行为的偏差程度。如果问题设计的不易被受访者理解，就需要访员更多的解释和追问。如果需要记录描述性答案的开放问题越多，就越需要依赖访员的追问和记录能力，访员效应对访问质量的影响就越大。在此种情况下，访员对问题的理解能力、解释技巧和追问能力会很大程度上影响受访者的回答。大量研究结果表明，减少访员因素造成误差的一个重要手段就是设计高质量的问卷[6]。一份好的问卷问题应该体现在：一是题干内容表述非常清晰，当访员读题时能让受访者非常容易理解并能够给予明确的答案。二是题意明确，对于想要受访者需要回答的内容表达清楚，让受访者知道题目想要问什么，知道该如何回答。

完成设计的问卷需要经科学设计的多轮测试，CAI系统中可以使用专门的测试工具CTT（CAI Testing Tool）进行多人在线测试。通过收集在测试过程中访员和受访者的反馈并分析相关数据,发现哪些问题需要访员再三解释才能让受访者理解、哪些问题在发问时容易引起受访者反感或被打断、哪些问题让受访者不知道该如何回答、哪些问题让不同的受访者产生不同的理解并给予不一致的回答等，根据这些总结和分析再进一步进行问卷的修改。此外，在CAI系统的问卷测试中，能够通过真实受访者的模拟访问，准确计算出每题的访问时长和回答率，可以据此分析出不方便访员读出和受访者理解的困难题和敏感题，并根据访员和受访者的反馈进行相关题目的改进。

2．2 访问过程控制：标准化、规范化

对访员在访问过程进行标准化和规范化要求，能够减少访员因素造成的误差。普遍适用的原则有：逐字提问、适时追问、如实记录。

按照题目内容逐字念出是标准化访问流程最基本的也是最普遍认可的原则。尽管有些研究证明可能有些改变不会影响数据结果，比如用“流产”来替代“结束怀孕”对受访者回答没有显著影响[7]，但更多的研究表明改变题目表述方式，会潜在影响到调查结果。如果不跟访员强调逐字读题的重要性，就会给访员造成可以根据自己理解提问的误解，并由此可能会带来影响访问质量的访员相关误差。

除了在提问时是按照题目内容逐字读出外，在受访者做出回答后，如果答案不够清晰或误解了题意，访员需要及时地进行追问或者重新读题。需要进行追问的情形包括：受访者给出的答案不在选项范围内、受访者的回答不够精确（尤其是需要回答准确数字的题目）、受访者的回答模棱两可、受访者误解了题意或对题目了解有偏差。在这种情形下，访员需要给出解释并进一步追问。访员需要清楚题目设计的目的，并结合在追问过程中。在追问时不能猜测受访者的意图并给予引导，而是在澄清题意的基础上，鼓励受访者给出更准确的答案。

如实记录受访者的回答，不对答案做任何主观解释或推论也是非常重要的。一般来说，在填答错误的发生率上，CAI要比纸笔调查低[8]，这主要是逻辑控制和值域控制发挥了很大作用，但控制范围之外，仍然无法彻底避免录入错误的问题。同时需要注意的是，在很多调查中都会有这样一类题目：记录受访者的描述，并进一步进行编码选择。但如果此类题目的分类比较复杂或互斥性较差，由访员现场编码容易带来很多错误。采取由访员现场记录受访者回答，转而由专业的编码员进行编码，藉此减少访员编码错误成为一个较好的处理原则。

对于访员在访问过程中表现出来的不规范行为，与纸笔调查事后核查不同的是，在CAI模式中可以借助各种技术进行实时监控和干预。通过每题采访时长数据分析和录音回放，及时发现访员在提问、追问和记录答案时影响数据质量的行为，并在访员开展新的访问之前由督导进行沟通和指导，避免同类访员误差的重复发生。

2．3 访员管理

在CAI模式下，最大的优势是利用数据实时回传技术，可以对访员访问行为进行及时干预和管理。通过访员管理手段，能在一定程度上控制访员效应发挥作用的范围，并降低由此产生的误差。主要的访员管理内容包括：访员培训、访员督导、访员工作量安排。

访员培训的时间和质量直接决定着实地访问中可能产生的访员误差。培训时间是保证访员能够扎实的掌握访问技巧、问卷设计目的、问题的准确含义的必要部分。除此之外，培训内容的合理设置和培训质量保证是决定访员培训效果的另一个重要方面。就CAI模式而言，在培训内容设置上，除了常规的问卷内容讲解外，加强实际操作练习和真实入户训练对避免访问过程中产生的访员相关误差非常重要。

在调查过程中，对访员的行为进行及时指导和监督是减少误差的关键环节。在CAI中，可以运用多种手段，如回放访谈录音、操作键盘回放、采访时长实时监控、电话回访等，发现访问过程中出现的诸如采访时长过短、未按要求提问、追问不足、记录错误等问题，并在访员开始下一个访问之前给予及时反馈，提醒访员规范化访问行为。此外，在访员实地工作过程中，可以随时跟督导保持联系，反馈访问过程中遇到的问卷问题、技术问题、受访户问题以及自身的心理负担或困扰，督导会在第一时间协助访员解决各类问题，并通过针对性措施激励访员高质量的进行访问工作。

访员的工作量也是影响访员行为的重要因素，在不同的工作量安排下，访员会表现出不同的行为。有学者认为，对于同一个调查，如果多次重复提问，会造成访员的厌倦感，并因此产生漏问、诱导、捷径跳转的问题。一般而言，访员在第10份问卷时会达到技巧最佳状态，而到第35份问卷时会产生调查质量下滑的问题。其他调查中也发现，访员在完成一定量的调查任务后，会普遍出现疲惫和厌倦的情绪，并进而影响到访问时发问和追问的积极性[9]。访员访问质量下滑临界点的研究还需继续深入，但已被学者们认可的事实是，应该给访员安排适当的工作量，尽量减少工作量对访员造成的压迫感和由此带来的访员相关误差。

3 结论

在由访员参与的调查中，不论是纸笔调查模式还是计算机辅助调查模式，访员特征、访员经验、访员态度都会对受访者参与调查的意愿、态度以及调查质量产生影响，成为测量误差的重要来源。已有的研究中对于控制访员相关误差的策略进行了讨论和分析，普遍得到认可的三个原则包括：高质量的问卷设计、标准化访问程序和科学的管理。

随着CAI技术的引进和成熟，能够在问卷测试、敏感题语音自助访问系统完善、访员访问行为实时监督和指导方面发挥更加积极的作用，对于减少访员相关误差发生的可能性或降低访员因素对采集数据质量的影响程度将有较大帮助。即使在计算机辅助模式下，访员误差仍旧不可能彻底消除，如何利用技术优势探索控制测量误差来源的科学方法仍然需要引起持续关注。

［1］Cooley P C,Miller H G,Gribble J N.Automating Telephone Surveys:Using T-ACASI to Obtain Data on Sensitive Topics［J］.Comput Human Behav,1998,14(2).

［2］Fowler F,MangioneT.Standardized Survey Interviewing:Minimizing Interviewer-related Error［M］.Beverly Hills,CA:Sage Publications，1990.

［3］Groves R,Couper M,Presser S.Experiments in Producing Nonresponse Bias［J］.Public Opinion Quarterly,2006,(70).

［4］Gfroerer J,Eyerman J,Chromy J.Redesigning an Ongoing National Household Survey:Methodological issues［J］.DHHS Pub,2002.

［5］Fowler F,Mangione T.Standardized Survey Interviewing:Minimizing Interviewer-related Error［M］.Beverly Hills,CA:Sage Publications.1990.

［6］Mangione T,Fowler F,and Louis T.Question Characteristics and Interviewer Effects［J］.Journal of Official Statistics,1992,(8).

［7］Schuman H,Presser S.Questions and Answers in Attitude Surveys:Experiments in Question Form,Wording,and Context［M］.New York:Academic Press,1981.

［8］Lepkowski J,Sadosky S,Weiss P.Mode,Behavior,and Data Recording Error［M］.New York:Wiley,1988.

［9］边燕杰，李路路，蔡禾.社会调查方法与技术：中国实践［M］.北京：社会科学文献出版社，2006.

（责任编辑/亦民）

Computer-Assisted Interviewing and Interviewers’Error Control

Ding Hua

（Institute of Social Science Survey,Beijing University,Beijing 100871,China）

The computer-assisted interviewing(CAI)mode can reduce the measurement error caused by interviewers to some extent through technical methods.Effective use of CAI technology to improve survey implementation and control measurement error caused by interviewers plays a key role in improving the survey quality.This paper discusses the interviewers’factors influencing measurement error in CAI mode,the methods of reducing errors related to interviewers,and measures of improving the data quality as well.

computer-assisted interviewing;interviewers’error;data quality

C811

1002-6487（2017）19-0036-04

教育部人文社会科学研究青年基金项目（13YJC840006）

丁华（1979—），女，山东日照人，博士，副研究员，研究方向：社会调查研究方法。