论强化在警犬训练中的作用
2017-01-27刘凡
刘 凡
江苏省泰州市公安局刑侦支队,江苏 泰州 225300
论强化在警犬训练中的作用
刘 凡
江苏省泰州市公安局刑侦支队,江苏 泰州 225300
在警犬训练过程中,强化既可以作为警犬日复一日的与自然环境和社会环境相互作用的结果自然发生,也可以作为改变警犬行为的矫正训练的一部分,通过人为的计划而发生。强化的塑造和保持作用将会使警犬的个体优势更加巩固和突出。同时在适当的时机利用强化的方法,使警犬训练的效果明显提高。本文主要通过四个方面阐述强化在警犬训练中的作用。
强化;警犬训练;作用
一、强化的概念
(一)强化的定义
许多科学家都对强化进行过论述,如苏尔译——阿萨罗夫和迈耶等,他们对强化对人类行为构成的自然影响和对多种人类行为影响所起的决定作用都有深刻、系统、全面的研究。但是,强化原理最初的建立是利用动物实验的结果,这就决定了它对警犬训练的适应性。就警犬训练而言,强化的定义应该是:紧随着警犬的某一具体行为的发生,并会对这个行为将来在类似的环境中再次出现可能性加强的一个直接刺激结果。例如:在扑咬训练中,警犬吠叫使助训员逃跑,助训员逃跑是对犬的直接刺激,而助训员逃跑这一结果又直接强化了犬,会激发犬的凶猛性和对人的仇视性。
(二)强化手段的分类
强化可分为负强化和正强化,它们都是经警犬的行为结果出现的,都有增强警犬行为再次出现的可能性。二者之间的区别是:正强化是随着警犬这个行为出现了刺激的增加或刺激强度的增加,而负强化是随着警犬的这个行为出现了刺激的转移或刺激强度的降低,其结果都是导致警犬的这个行为的增加。例如,当警犬做出某一正确行为时,训导员给犬衔取物品的强化,就是对警犬这种行为的正强化;而在训练警犬搜索物品时,训导员将警犬急于获得的物品假抛出去,就是对警犬迫切获得物品的负强化。
无论是正强化还是负强化对警犬行为的形成和改变都起着至关重要的作用。对任何一种刺激,在我们还没有观察到它的效果之前,我们都不能对它起是正强化还是负强化给予简单的判断。同时,也不能以日常生活中狭隘的意思去理解强化的“正”和“负”,关键是依据强化的效果而言。对强化的正确把握与理解,利于警犬训导员在警犬训练中正确运用强化的方法和手段,提高警犬训练的效率。
二、强化在训练中的重要性
强化有两种基本功能,一是使犬的某些良好行为长久保持;二是使犬的某些不良行为得以消除(即负强化),负强化强度不够,犬的不良行为不但不会消除,反而还会发展成痼癖。例如当犬咬牵引带时,训导员敲击犬嘴,想制止它咬牵引带的行为,但由于敲击力量小,不能使犬停止撕咬,这时犬可能认为训导员是在鼓励它,此时训导员对犬的负强化强度不够,反而鼓励了犬这种不良行为的发生。
从强化的两个基本功能可以看出,强化在训练中的重要性。在我们训练过程中经常对犬的不规范动作进行纠正,过多的纠正时间上对犬是一种负强化,当犬在训导员纠正后对犬不作任何奖励,或者反复实施同一种刺激而丝毫没有强化的意思,犬的反应会消失,甚至变得被动,例如:我在训练犬随行时,随行过程中令犬“坐”,犬坐姿不正确,头部靠里,此时,我对犬的不规范动作进行纠正,方法是当发出“靠”口令同时将犬臀部向左下侧敲击,这样重复了几次,当随行中再令犬“坐”时,犬马上逃离我,那正是因为过多的纠正对犬实际上实施了负强化,而没有对犬进行奖励强化。但这种犬的反应的消失不会是持久的,犬产生了抑制,训导员可以更换训练地点、训练物品等,目的是使犬产生的抑制在较为缓和的环境中将抑制消退,前面所说的随行训练中,训练实际上是给了犬的间接性负强化,我们可以通过在同一地点的长时间反复训练就能使原来的抑制消退。由此可见,训导员应正确认识和理解强化的重要性,并积极投入到实际训练中有效运用。
三、影响强化效果的因素
(一)时机因素
警犬的行为发生与强化结果之间的时间间隔直接决定强化的最终效果,一个结果要成为有效的强化刺激,应该在行为发生之后立即发生,如果反应和结果之间间隔过长,那么强化也就不会产生效果。本人曾经在训练犬鉴别时,由于训导员和助训员的原因,连续三次使犬在正确反应后相隔3-5分钟才奖励,而奖励时犬正在啃咬拖布,当下一次带犬进入鉴别室时,犬对鉴别罐没有兴趣,只是乱兴奋,当本人令犬嗅嗅源后,犬不进入形式,直接找拖布撕咬。由此可见,奖励强化的时机对犬强化效果有着直接的影响。
(二)强度因素
强化的强度大小对警犬影响很大,当犬进行了大强度训练后,我们要选择强化强度大的方法来进行奖励强化。例如在追踪训练中,犬追踪了很长距离,在大强度训练后,我们可以在终点放上犬最喜欢的物品,让犬自己找到衔取,进行直接奖励,随后扶拍犬或令犬吠叫,使其兴奋再抛球,同时训导员发出“好”的口令,使犬在听觉、皮肤感觉、视觉等方面得到满足,那么犬在下一次追踪训练中会保持积极性。例如,在犬按训导员口令指挥做出相应的行为,而这一行为的条件反射十分巩固了,我们就不必大强度的强化奖励,只需用口令或面部表情等,使犬“明白”这一行为令主人满意,是正确的就足够了,同样达到了强化的效果。
(三)强化方式
强化的方式没有固定的模式,在不同的训练中视条件我们可以选择不同的强化方式,例如在追踪训练中,我们可以在迹线上布设犬喜欢的物品,让犬在追踪过程中联系气味直接找到物品,让其自然直接地衔取,满足犬的衔取占有欲,对犬是一种自然强化,这种强化很及时,能提高犬的工作积极性,又减少了犬的一些不良联系。比如我们在追踪过程中,适时时候抛球给犬,久而久之,犬会形成经常抬头看训导员,企盼训导员抛球这种不良联系。又例如在随行训练中,训导员不能经常往前抛球进行奖励强化,这样会使犬形成随行超前的毛病,我们可以在保持随行状态情况下给犬食物奖励,也可以突然带犬跑动,进行这种“爆发”式奖励。总之训导员应该在不同的训练中视情况而定,采取最有效的方式进行奖励强化,这一点尤为重要。
(四)一致因素
当犬的反应产生出结果,那么反应与结果之间就存在着一致性。作为警犬训练,不仅要单纯地形成反应与结果的一致性,还要形成警犬的行为反应与训导员的要求的一致性。例如在鉴别训练中,犬嗅嗅源进入大形式,但犬由于某些因素没有对气味成功地分化,但是犬按训导员要求嗅嗅源,逐个嗅认,整个鉴别形式很好,此时我们也应该给犬以奖励强化,只是强化的强度可适当把握。
(五)其它因素
犬与犬之间有着差异,我们的强化应因犬而异,在训练中确定某一头警犬用某种方式进行奖励强化也很重要。比如,犬食欲不强而衔取欲强,在训练中我们选择抛物品让犬衔取的方法比给犬食物更有效。扶拍对许多犬是一种强化刺激,但对有些皮肤敏感的犬抚拍就会起到相反的作用,由于警犬存在个体差异,也就导致了警犬训练的复杂性,警犬训练在遵循普遍规律的同时,还要针对每头犬的情况制定具体的训练计划,包括强化手段,采取有效的刺激,不断强化警犬做出的目标行为,这时的强化带有明显的个体特征。
四、运用强化手段应注意的问题
在警犬训练中,训导员应灵活运用强化手段,不拘于一种形式。应根据条件刺激的强度来掌握强化刺激的强度,还要根据犬的反应行为结果来运用不同形式的强化手段,过度使用同一种强化方式,没有新异刺激,会使犬产生超限抑制。
总之,强化是确保警犬的能力在训练中不断提高并长久保持的一种有效训练手段,在警犬训练中起着极其重要的作用,大量的实践和事实证明,训导员只要正确理解强化的概念,根据个体差异通过人为的计划灵活运用强化手段,同时在适当的时机利用强化的方法,将会使警犬训练的效果明显提高。
[1]单军.全国工作犬学术研讨会论文集[M].北京:北京群众出版社2001:67-77.
[2]南会林.犬行为原理[M].沈阳:东北大学出版社,2011:220-221.
D631.1
A
2095-4379-(2017)36-0246-02
刘凡(1981-),男,内蒙古赤峰人,本科,毕业于中国刑事警察学院警犬技术系,江苏省泰州市公安局刑侦支队,助理工程师,研究方向:从事于警犬的训练与使用的研究以及警犬技术在国内的发展。