绩效评估主体的行为评估——基于信号检测理论*<br/>

绩效评估主体的行为评估——基于信号检测理论*

2012-09-23王淑珍马馨蕊

中国人力资源开发 2012年12期

● 王淑珍马馨蕊

■责编韩树杰 Tel:010-68345891 E-mail：hrdhsj@126.com

一、绩效评估主体的评估偏差问题

员工绩效是组织成功的关键，每一个组织都有自己的绩效评估体系。通常，绩效评估指标体系包括两类，一类是硬性指标，是相对客观的指标，是依据相关业务的客观数据进行的评估；另一类是软性指标，它具有主观性，是由绩效评估者进行评估的。硬性指标最大的特点是便于量化和标准化，可避免主观人为因素的干扰，其过程和结果都比较客观公正，而软性指标的绩效评估易于受到评估主体对指标的理解、个体偏好、员工以往绩效水平、人际关系等主观因素的影响。由于软性绩效指标的主观性，很多情况下员工和管理者都认为绩效评估是浪费时间与资源，不能增加组织的价值。有研究显示，尽管90%以上的组织都开展了正式的绩效管理，但只有30%的员工认为绩效评估能够改善他们的绩效（Aguinis et al.，2011），员工常感到绩效评估不公平，经常报怨有些人通过非正当渠道获得高绩效的评估结果（Lu et al.，2009）。有些研究提示在软性指标的评估中，评估者的评估行为常常出现偏差，对绩效评估的有效性与公平性的影响不可忽视（陈晶瑛，2009）。

关于绩效评估偏差的早期理论是认知评估理论，该理论把绩效评估看作一个信息加工的过程。虽然该理论的内容与动机是好的，但该理论把评估者看作是一个被动的信息加工系统，排除了评估者个人的动机，认为即使研究者能够理解评估者的错误和偏差，也无法纠正，任何纠正的尝试都无法保证不受操控的影响（Spence et al.，2011）。由此可见，早期的认知评估理论对如何提高人力资源实践中评估的信度与效度不仅没有促进作用，而且还会为持续存在的评估偏差和低效提供支持。

与认知评估理论不同，Spence等（Spence et al.，2011）认为绩效评估者是具有动机、情感及认知局限的个体，他们的情绪、动机与认知能力对绩效评估效果产生影响，这一现象被称为 “有意评估扭曲（Conscious rating distortion）”。 Spence 等认为有意评估扭曲的主要因素包括政治因素、印象管理、宽容评估和动机四类。 Dreher等（Dreher et al.，2001；Woehr et al.，1994）持有相似的观点，认为绩效评估主体的主要偏差包括晕轮效应、宽容评价偏差、集中趋势、近因效应、第一印象、自我相似性等。现有的文献表明，评估者常常存在有意操纵绩效评估的行为。

绩效管理的学术研究与实践操作领域已开始尝试对绩效评估主体的行为偏差进行干预与管理，特别是对操纵评估结果的有意评估扭曲现象。一些评估者认为，绩效评估的偏差不能归于他们个人的因素，而是缘于缺乏技术和相应的知识等。有学者研究了培训绩效评估者的作用（Woehr et al.，1994），但关注的仍然是评估者的认知因素，对于有意评估扭曲现象无任何干预作用。在实践中，360度评估等多元评估法在一定程度上能减小评估者动机与偏好的影响，但其主观性却是不可回避的；强制分布法可用来克服主观绩效评估区分度不高的缺陷（李飞霞等，2008），但其本身同样也存在主观误差的问题等（龚文等，2011）。

目前，对于绩效管理中评估者的评估偏差问题在理论上尚未开展系统性的研究，对如何纠正评估偏差、减少、消除或控制评估者操纵评估的行为研究甚少；在实践操作上，现有的绩效管理实践对绩效评估主体行为的约束力非常有限。因此，该问题已成为绩效管理领域亟待解决的问题。本文基于信号检测理论的分析框架，对绩效评估主体的评估有效性进行分析。

二、信号检测理论对绩效评估主体行为分析的借鉴

1.信号检测理论的基本思想

信号检测理论最初应用在通讯工程领域，专门处理噪音背景下对信号进行有效分离的问题。该理论被引入个体心理与行为分析领域后，其基本思想和假设成为分离个体在对信息识别加工中感觉敏感性与反应偏向（或反应标准）两个过程的分析框架。该理论目前已被用于多个领域，但尚未检索到应用于绩效评估者的行为分析之中。

信号检测理论将刺激分为“信号加噪音”与“噪音”两类，将反应分为“有信号”和“无信号”两类，共同形成个体的四种反应（见表1），当“信号加噪音”条件下反应为“有信号”时为“击中”；当“信号加噪音”条件下反应为“无信号”时为“漏报”；当“噪音”条件下反应为“有信号”时为“虚报”；当“噪音”条件下反应为“无信号”时为“正确拒斥”。

表1 信号检测理论中个体的四种反应

信号检测理论包括两个指标，一个是感觉辨别力指标d’，即感觉敏感性，该指标不受情绪、期望、动机等因素的影响，d’值不是一个恒定的值，受先验概率和奖惩办法而变动。另一个是判断标准，即个体的反应偏向，常用似然比标准β来衡量。β值随着信号和噪音的先验概率和判定结果的奖惩办法而变动，并受个体的动机、态度、利害关系等心理因素的影响（郭秀艳，2004）。上述两个指标的计算公式如下：

d’=Z击中-Z虚惊

其中，Z击中和Z虚惊是通过“击中”和“虚惊”概率，再根据PZO转换表分别求得“击中”概率和“虚惊”概率的Z值。一般认为在反应个体非常敏感的情况下，当信号与噪音存在时，常常出现“肯定”，即击中概率较高，当噪音单独存在时，评估者很少做出“肯定”，即虚惊概率较低；在评估者鉴别力降低时，“击中”和“虚惊”概率分布两者相互接近；在评估者相对不敏感，或刺激相对较弱时，击中概率下降，而虚惊概率则上升。

β=O击中/O虚惊

其中，O击中和 O虚惊是通过“击中”和“虚惊”概率，再根据PZO转换表分别求得“击中”概率和“虚惊”概率的O值。一般认为β大于1时反映个体掌握的标准较严，击中与虚惊的概率均较低；β靠近或等于1时反映个体掌握的标准适中，击中概率较高，而虚惊概率则较低；β小于1时反映个体掌握的标准较宽松，击中与虚惊的概率均较高。

2.信号检测理论对绩效评估的理论分析

基于信号检测理论的基本思想，将员工的真实绩效水平分为高绩效和低绩效，而绩效评估者的评估结果同样分为高绩效和低绩效，这样就形成了一个2×2的矩阵（见表2）：客观的高绩效、漏报的绩效、虚报的绩效、客观的低绩效。

表2 信号检测理论在绩效评估中的支付矩阵

信号检测理论的辨别力d’和反应偏向β两个指标用于绩效评估主体行为分析时含义如下：

对于辨别力指标d’来说，一般认为在评估者非常敏感的情况下，当高绩效者存在时，常常做出“客观的高绩效”的判断，即击中概率较高，当低绩效者单独存在时，评估者很少做出“客观的高绩效”的判断，即虚惊概率较低；在评估者鉴别力降低时，“客观的高绩效”和“虚报的绩效”概率分布两者相互接近；在评估者相对不敏感，员工绩效不突出或印象不深刻时，“客观的高绩效”概率下降，而“虚报的绩效”概率则上升。

对于反应偏向指标β来说，一般认为β大于1时评估者掌握的绩效标准较严格，“客观的高绩效”（击中）与“虚报的绩效”（虚惊）的概率均较低；β靠近或等于1时评估者掌握的绩效标准适中，“客观的高绩效”概率较高，而“虚报的绩效”概率则较低；β小于1时评估者掌握的绩效标准较宽松，“客观的高绩效”与“虚报的绩效”概率均较高。

三、基于信号检测理论的绩效评估主体的行为评估步骤

假设某一部门有20名员工，有5位经理对员工实施绩效评估，评估总分为100分。基于信号检测理论对绩效评估者的行为评估需要计算辨别力d’和反应偏向β两个指标值，具体的计算过程包括以下5个步骤：

第一步：计算每一位员工绩效评估的平均分数，确定员工的绩效评估结果。5位经理对每一位员工打分的平均分数为该员工的最后评估结果。20位员工的评估平均分数见表3。

第二步：比较每一位经理对员工评估结果与平均分数间的差异，形成评估者的反应矩阵。

绩效评估的强制等级分布按照30∶70的比例将员工分为高绩效者与一般绩效者，按照平均分数，大于等于86分为高绩效者，低于86分为一般绩效者，即高绩效者占30%，一般绩效者占70%。当某一经理的评估分数大于等于86分，且该员工的平均数也大于等于86分为击中；当某一经理的评估分数大于等于86分，而平均数则小于86分为虚惊；当某一经理的评估分数小于86分，而平均数则大于等于86分为漏报；当某一经理的评估分数小于86分，且平均数也小于86分为正确拒斥。以经理E为例，经理E与平均数的比较结果见表4。

第三步：进行PZO转换，计算该经理的辨别力指标与反应偏向指标。该经理的辨别力指标为：

d’=Z击中-Z虚惊=0.96–(-0.18)=1.14

通过PZO转换表，上式中的数值0.96是击中概率0.83的Z值，上式中的数值-0.18是虚惊概率0.43的Z值。

由计算结果可见，该经理的d’值为1.14，说明该经理的敏感性较低或鉴别力较差，“击中”概率下降，而“虚惊”概率则上升。

该经理的反应偏向指标为：

β=O击中/O虚惊=0.25/0.39=0.64

通过PZO转换表，上式中的数值0.25是击中概率0.83的O值，上式中的数值0.39是虚惊概率0.43的O值。

由计算结果可见，β小于1，该经理掌握的评估标准比较宽松。

第四步：对不同评估者的辨别力与反应偏向指标进行排序，辨别力按照从大到小的顺序依次排列，数值越大，排序越小；反应偏向按照│β-1│的大小依次排序，数值越小，排序越小。按照5位经理的d’值和│β-1│值的大小进行排序（见表5），可以看出鉴别力最高和最低的经理，以及判断标准最严格和最宽松的经理。

第五步：综合分析不同评估者的辨别力与反应偏向指标的排序，区分有效评估与无效评估，即两者相加得分最小者为最有效，得分最大者为最无效，其他依次类推。

表3 20名员工绩效评估结果（5位经理评估的平均数）

表4 经理E对员工绩效评估与平均数的比较

表5 5位经理评估指标d'值和β值的排序结果

综合考虑d’值和β值，d’值越大，评估者的敏感性越高，反之敏感性越低，β值越接近1表明判断标准的松紧越恰当，越大于1表明标准越严格，越小于1表明标准越宽松。按照d’值和“β值与1的差值的绝对值（│β-1│）”大小进行排序，表5中的结果显示，评估最有效的是经理C与经理D，两者的d’值排序与│β-1│排序之和均为3；评估比较有效的是经理A、经理B与经理E，三者的d’值排序与│β-1│排序之和均为8，因此，三者的评估有效性不及经理C与经理D，评估行为比较有效。

在实际工作中，综合分析辨别力d’和反应偏向β两个指标，绩效评估主体的行为可根据实际的d’值排序与│β-1│排序之和进行区分，如果评估主体较多，也可根据实际需要、基于综合排序的结果将评估主体的评估行为划分为不同的等级。同时，辨别力d’和反应偏向β两个指标还能进一步提示每一个评估者的优点及有待完善的方面等相关信息，为绩效评估者的管理提供比较客观的依据。

综上所述，一个设计良好的绩效管理体系不仅包括绩效考核体系中的一系列指标和操作流程，还应包括对绩效评估主体的评估。基于信号检测理论的绩效管理，扩展了绩效评估体系的内涵，将绩效评估主体的行为评估纳入绩效评估体系之中，使绩效评估主体的行为评估成为绩效评估必不可少的组成部分。信号检测理论视角的绩效评估主体的行为评估不仅方法简便，而且具有指导性、可操作性与鉴别性，能使绩效评估真正成为改善员工绩效的管理工具与方法。因此，信号检测理论在管理绩效评估主体方面是一个具有潜在应用前景的理论。

本研究是一个理论设想，为了计算过程的简洁明了，没有探讨当评估主体事先已知评估的概率分布与未知评估的概率分布情况下评估主体评估行为的有效性。今后该领域的研究应当在实践层面进一步展开，可比较已知与未知评估概率分布条件下实践中的个体的辨别力d’与反应偏向β两个指标的变化规律，或以实证数据验证该方法的有用性，促进绩效评估的公平性与有效性的不断提高。

1.Aguinis,H.,Joo,H.,Gottfredson,R.K.Why we hate performance management–And why we should love it[J].Business Horizons,2011,54(6):503-507.

2.Dreher,G.,Dougherty,T.Human resource strategy:A behavioral perspective for the general manager[M].McGraw-Hill/Irwin,2001,142-157.

3.Lu,H.,Gu,Q.Performance appraisal:what’s the matter with you?[J].Procedia Earth and Planetary Science 1,2009,(1):1751–1756.

4.Rudolph,C.W.,Wells,C.L.,Weller,M.D.,et al.A meta-analysis of empirical studies of weight-based bias in the workplace[J].Journal of Vocational Behavior,2009,74(1):1–10.

5.Spence,J.R.,Keeping,L.Conscious rating distortion in performance appraisal:A review,commentary,and proposed framework for research [J].Human Resource Management Review,2011,21(2):85–95.

6.Woehr, D.J., Huffcut, A.I. Rater training for performance appraisal:A quantitative review [J].Journal of Occupational and Organizational Psychology,1994,67(3):189–205.

7.陈晶瑛：《绩效评估公平性对员工的企业态度和工作绩效的影响》，载《中国人力资源开发》，2009年第1期。

8.李飞霞、姚兆铭、乔云霞：《员工主观性绩效评价的部门主导强制分布方法修正》载《经济管理》，2008年第13期。

9.龚文、陈锴：《绩效评估中的强制分布问题研究》，载《中国人力资源开发》，2011年第5期。

10.郭秀艳：《实验心理学》，《人民教育出版社》，2004 版。