APP下载

浅议惩罚在警犬训练中的应用

2024-06-10张建华

中国工作犬业 2024年4期
关键词:训导惩罚情境

刘 洋 张建华

在警犬训练过程中,强化与惩罚的运用是关系到训练效果的直接因素。但是大多数训导员极易将强化与惩罚的概念混淆,或者说知道两者的概念,但是在实际训练中只注重使用正强化与正惩罚,而忽略负强化与负惩罚的运用,这也是导致训练效果不理想的主要原因。本文从惩罚与强化的区别、惩罚的特点及影响惩罚效果的因素及其在警犬训练中的应用等方面进行简略探讨。

一、惩罚与强化的区别

惩罚是指当犬出现某种行为后,呈现、增强厌恶刺激或失去、减少正强化物的获得,从而使犬的这种行为出现的频率降低、减少。“呈现、增强厌恶刺激”被称为正惩罚,“去除正强化物”被称为负惩罚。

强化是指当犬出现某种行为后,呈现强化物或者去除厌恶刺激,从而使犬的这种行为出现的频率提高、增多。“呈现强化物”被称为正强化,“去除厌恶刺激”被称为负强化。

由此可见,惩罚与强化的本质区别是目标行为减少与目标行为增多。

二、惩罚的特点及影响惩罚效果的因素

在探讨惩罚手段及运用之前,训导员一定要对惩罚的特点及影响惩罚效果的因素有一个系统全面的掌握,方能正确有效地使用惩罚手段纠正犬的不良行为。

(一)惩罚的特点

惩罚有立即性、情境性和复原性三大特点。立即性是指犬将要做出不良行为还未完全实施不良行为时立即纠正,方能达到“立竿见影”的纠正效果。情境性是指惩罚具有明显的“时过境迁”现象,场地和惩罚者的变化都会引起犬不良行为的反弹。复原性是指惩罚容易导致犬的不良行为“死灰复燃”,在使用惩罚的同时,一定要注重强化犬的良性行为来巩固纠正效果。

(二)影响惩罚效果的因素

影响惩罚效果的因素有以下七个方面:一致性、延缓性、连续性、变化性、时机、机体先前的状态、对替代行为的强化。一致性是指对不良行为进行惩罚,同时要避免惩罚无意中成为强化。延缓性是指发生不良行为的第一时间进行惩罚,如果错过最佳惩罚时机的,可以刻意制造犬再次犯同样错误的情境,当犬再次发生同样的不良行为时及时给予惩罚。连续性是指纠正不良行为的初期,当犬不良行为频繁出现时,有针对性地对同一不良行为使用连续惩罚,当不良行为发生频率下降后使用间歇惩罚。变化性是指经常变换惩罚方式有助于提高惩罚效果,但不等于一次纠正使用多种惩罚方式对犬进行惩罚。时机是指不良行为出现便立即惩罚。机体先前的状态是指对于正惩罚而言,任何能增强刺激事件的厌恶特性的事件都能提高惩罚的效果,任何能降低刺激事件的厌恶特性的事件也能削弱惩罚的作用;对于负惩罚而言,餍足可以使某些强化物的损失的惩罚作用减弱,而剥夺则可以使某些强化物的损失的惩罚作用加强。对替代行为的强化是指惩罚不良行为,对替代不良行为的反应即良性行为进行强化。

三、惩罚的方法与应用

(一)正惩罚的方法

正惩罚主要有机械刺激、反应限制、矫枉过正等技术方法。机械刺激是指在犬出现不良行为后,使用手、木棒或电击脖圈等及时给予犬击打或电击的厌恶刺激。反应限制是指在犬出现不良行为时,马上采取措施对犬的身体进行限制,以阻止或制止犬不良行为的继续发生。矫枉过正是指当犬不良行为发生后,设置与其发生不良行为相同的场景,复盘纠正,当犬有不良行为表现的苗头倾向时,第一时间给予犬一个厌恶刺激,直至犬无视相关诱导其犯错的诱导物,不再出现不良行为。

(二)负惩罚的方法

负惩罚主要有隔离(也称罚时出局、暂停强化)、反应代价等技术方法。隔离是指在特定的情境中(犬会获得正强化的情境)当犬有不良行为出现,将犬带离一段时间,使其在隔离期间无法获得强化的机会,从而使不良行为未来发生的可能性减少。反应代价是指当不良行为出现时,去除一定数量的强化物,从而使不良行为未来发生的可能性减少。

不了解这两种技术的训导员可能认为二者没有不同,但其实是有显著区别的,隔离强调的是将犬带离场景,阻断犬获得强化物;而反应代价强调的是直接减少或完全去除强化物。

(三)使用惩罚前确定要纠正的不良行为

行为一定是正在发生或发生了的反应或动作,一个行为可以是由多个行为构成的。比如:当训练犬衔取时,训导员使用绳球逗引犬,犬先是注视绳球、再是跟随绳球运动方向左右、上下运动,最后当训导员认为犬注意力和兴奋状态达到较高点时,使犬衔住绳球并扯拉绳球让犬获得绳球或吐球给予食物等方法奖励结束训练。但是当犬在其中某一环节或者说是某一个行为出现问题的时候,训导员要单独将这一行为拎出来进行纠正。这过程中,犬可能在逗引过程中受外界干扰分心,对绳球不专注;或者犬衔不牢绳球或占有欲过强经常误伤训导员等。这里讲的都是不良行为,训导员必须清楚地知道要纠正哪一个不良行为,在训练中才能做到有的放矢。

(四)做好惩罚前的准备,并科学实施惩罚

在纠正犬不良行为之前一定要做好惩罚前的准备工作,如明确某种替代行为来纠正犬的不良行为、尽可能地控制犬出现不良行为的情境、训导员或助训员惩罚的态度、标准要一致等。对照影响惩罚效果的七大因素及时、连续、有变化地对犬的不良行为给予惩罚纠正。在实施惩罚过程中一定要注意对不良行为的惩罚不能伴有强化,确保惩罚不成为强化,但是对不良行为的替代行为可以进行强化等。

四、使用惩罚应注意的其他问题

(一)切勿误用惩罚

新训导员极有可能掌握不好惩罚的时机,导致良性行为被惩罚,将会使犬不知所措,并减少良性行为的发生;延迟惩罚是达不到纠正的效果的,惩罚和强化一样,时机应该在犬的行为出现后无限接近0 秒的时间做出才能达到最好的效果;惩罚不当,如过度惩罚(等同于体罚犬)或惩罚过于轻微都达不到纠正不良行为的目的。

(二)正惩罚的副作用

训练过程中应多使用正、副强化和负惩罚,而少使用正惩罚。因为正惩罚会造成以下副作用:易使犬产生不良情绪甚至出现攻击行为,可能造成犬逃避训练或厌训,也可能成为一种强化即惩罚成瘾(训导员只是惩罚的实施者,只有犬才知道训导员施于的惩罚是厌恶刺激还是强化)等。

总之,科学运用惩罚手段是纠正犬不良行为的有效途径,也是确保犬训练成功的重要秘诀。笔者认为只有训导员能够清醒地认识行为与惩罚强化的关系,才能快速、高效地训出合格的工作犬。

猜你喜欢

训导惩罚情境
情境引领追问促深
不同情境中的水
黑子,对不起
神的惩罚
Jokes笑话
“研训导一体化”教师研修方式的实践与探索
惩罚
警犬守护春运路 每天工作12小时
护患情境会话
特定情境,感人至深