警犬训练中非条件性奖励手段的细节性运用
2017-08-22于汝清周学军
于汝清 刘 帅 周学军
警犬训练中非条件性奖励手段的细节性运用
于汝清 刘 帅 周学军
在警犬训练过程中,奖励手段的运用是关系到训练效果的直接因素。奖励手段主要可以分为条件性奖励和非条件性奖励两大类。奖励手段运用细节把控的合理程度将直接影响到对犬奖励的效果和质量,细节把控的合理可以高效地培养犬的警用品质和犬的作业能力;把控的不合理则会产生各种不良联系影响训练的进度。本文侧重探讨警犬训练当中非条件性奖励手段的细节性运用。
一、奖食奖励手段的细节性运用
(一)为了突出训练的连贯性,应注重奖食种类的选择。
训练的连贯性可以最大限度地减少犬犯错的机会。为达到训练的连贯性,首先应选择适口性好、软硬大小适中,最佳效果为“入口即化”的奖食,以保证犬能在第一时间获得奖励的同时又不中断训练;其次奖食应优先选择犬最喜欢吃的食物,确保奖食对犬的吸引力,从而保证训练的连贯性。再者,应选择新鲜干净的奖食奖励犬,以免犬食用后会出现身体不适而造成训练中断。
(二)为避免犬外抑制增强、形成随地捡食的不良联系,应尽量避免奖食掉落在地面上。
当奖食掉落在地面上时,犬出于本能的食欲反射会舔食掉落的食物,这样会养成犬随地捡食、找食的坏习惯,增强其外抑制;有的犬甚至会产生不良联系,一旦训练某一科目的某一动作就会自动在地上找食,这样会严重影响日后训练。(如图1)
图1 奖食掉落
(三)运用奖食奖励手段应因时而异。
犬是一种有生物钟节律的动物,在清晨和傍晚身体食物中枢最为兴奋、食物反射强,此时运用奖励手段最能吸引犬的注意,可达到最理想的训练效果。相反,中午时分,尤其是夏季高温天气,此时犬处于较抑制状态、食物反射低,运用奖食奖励手段效果不佳。
(四)为了每次训练的持久性,每次给予犬的奖食要少。
在遵循“少时多次”的训练原则下,我们期望将犬有限的外出时间尽量多地用于训练。因此,在每次训练中,奖励犬的食物量不要多,以免随着犬的饱腹感增加,食物中枢兴奋性降低,削弱奖食对犬的吸引力,从而导致犬训练不趋于主动甚至终止训练。
(五)运用奖食奖励手段应因犬而异。
美味的奖食对犬有着重要的生物学意义,能引起犬的食物反射,能使犬处于主动趋向状态。因此,对于那些食物反射强的犬运用奖食奖励效果最好,能最大程度调动犬的积极主动性。相反,对于那些食物反射差或者食欲不佳的犬,运用奖食奖励手段效果则不明显。
(六)运用奖食奖励手段应因科目而异。
慎用的例子有:1.在训练衔取时,过早或经常运用奖食奖励手段会导致犬形成早吐物品的习惯;2.训练气味识别类科目时,以鉴别为例,奖食会混淆气味条件使犬乱反应,甚至有的犬会直接去寻找食物。3.训练吠叫科目时,犬吠叫后立即给食或者在犬吃奖食后立即让其吠叫,食物容易卡住犬气管,会造成不必要的风险。运用效果好的例子有:在培养随行科目犬的持续抬头能力时,采用边走边给予犬奖食的奖励方式让犬衔取物品,省去了训导员卸物品的步骤,减少了影响亲和关系的因素。
(七)为了犬能形成良好的训练习惯,应注重奖食给予姿势的把握。
首先运用奖食奖励手段应尽量在训导员身边完成且奖食不能轻易让犬得到。在训导员身边完成奖励是为了既可以强化犬的正确行为,又增强犬对训导员的依恋性(如图2);不让犬轻易得到是为了增加犬在训导员身边的时长,增强强化程度。另外不能伸手奖励犬奖食,这样会无形中养成犬与训导员保持一定距离的坏习惯(见图3),为日后训练正面坐、卧等科目造成不必要的困扰(见图4),而图5才是我们最想看到的训练效果。再者,奖食给予的位置应多加变化,否则犬会在特定的位置产生不良联系,如犬训练时始终盯着奖食包,这样会影响训练。
图2 身前给食
图3 伸手给食
二、抚拍奖励手段的细节性运用
(一)为了正确使用抚拍奖励手段,应注意抚拍部位的选择。
抚拍是人与犬感情交流的方式,运用抚拍奖励时应选择犬的前胸、颈部、背部、面部、下颌或者两侧肩胛等能引起犬兴奋反应的部位。而臀部、腹下、尾部,这些部位是犬比较敏感的部位,抚拍这些部位往往会使犬触觉上不舒服,心理上产生戒备,导致犬不仅未受到应有的奖励,还会对科目或行为产生抑制,甚至对训导员被动;对于直立耳犬种,一般不宜抚摸其头顶耳部,以防止形成耳后贴的习惯,影响犬的形象和气质。
(二)为了避免犬出现被动反应,运用抚拍奖励时训导员应注意身体站位的选择。
警惕心理是犬的本能,这种本能因犬种轻重有别,荷兰牧羊犬与马里努阿犬较德国牧羊犬更为警惕;因情况有别,在夜晚、光线昏暗环境或者复杂陌生环境,犬较平时更为警惕。而犬的身后是犬警惕性最高的区域,因此抚拍犬时了解上述因素应选择犬的正前方或者两侧(如图6),不要从背后抚拍,这样容易让犬受到惊吓,影响亲和关系甚至对训导员被动,尤其是初带犬的训导员更需要注意这一点。
图4 体前坐远离
图5 体前坐紧贴
图6 抚拍
(三)未建立一定的亲和关系基础,抚拍奖励不能作为一种奖励手段。
抚拍能使犬的触觉中枢产生兴奋,使得犬得到一种爱抚、舒适的感觉。但是,这并不意味着无论是谁抚拍犬、什么阶段抚拍犬都能够达到理想的奖励效果,因为犬在见陌生人或者未完全信任训导员的情况下往往会心存戒备,一次抚拍的触觉良好感受不足以抵消其消极感受,也就是说要想让犬认为抚拍是一种奖励,应当建立在一定亲和基础之上。在未建立一定的亲和关系时或者亲和关系不牢固的前提下,抚拍奖励应结合奖食奖励等手段运用。
(四)运用抚拍奖励手段时,应按照不同情况决定使用抚拍的力度和幅度。
应按照不同月龄、不同犬种、不同时间段、不同情况,与训导员的亲和程度、不同训练科目来控制力度和幅度。1.小月龄和胆小的犬心理和生理还未发育成熟,对待小月龄犬应当轻柔和缓,给幼犬安慰和鼓励,而大月龄犬则可充分抚拍奖励;2.不同犬种被毛薄厚不同,皮肤敏感程度不一,抗刺激程度不同,因此在同等条件下,对于被毛较厚的德国牧羊犬则可力度大一些,单层被毛且短毛的荷兰牧羊犬和马里努阿犬则要相对轻些;3.每天的清晨和傍晚是犬一天当中最为兴奋的时间段,犬兴奋时大力度和大幅度的抚拍才会让其得到有效强化,而中午或者炎热的天气,犬处于抑制状态,力度过大会引起犬的反感,影响强化效果,甚至影响亲和关系。4.犬处于生病期间、进入陌生复杂环境或者训练高难度科目时,犬需要训导员的安慰和鼓励,此时的力度和幅度应当柔和轻缓。5.在同等条件下,对犬的抚拍力度和幅度一定要随着亲和关系程度做出调整,逐步增强。6.对于一些为了追求稳定性的科目,抚拍奖励时抚拍力度和幅度不应过大。以坐延缓为例,对犬的抚拍力度和幅度要小,否则犬会因为过于兴奋而超前自动解除延缓。
(五)运用抚拍奖励手段时,抚拍手法应灵活多变。
抚拍手法是指抚拍力度、部位、节奏、时长以及抚拍顺序等因素结合的方式。抚拍手法的固化会产生不良后果,长此以往机械式的抚拍会导致犬获得奖励不充分,造成犬对抚拍不兴奋,以致影响训练。因此,运用抚拍奖励的手段时,抚拍手法应灵活多变,这样犬才能得到充分奖励。
三、游散奖励手段的细节性运用
(一)训练抑制性科目时,运用游散奖励手段效果更佳。
犬有向往自由的心理和自由玩耍的需求,训练抑制性科目对于犬来说,作业负担大且感到紧张,犬此时非常渴望获得自由。因此,利用犬这一心理,在犬完成某一训练科目或者预期动作后,运用游散奖励让犬自由活动片刻,可以在充分奖励犬的同时又能平衡犬的神经类型,使犬能得到及时的放松和缓解,身心愉悦,不仅有利于继续训练而且有利于科目的快速形成。
(二)对于外抑制强的犬,运用游散奖励手段时应注意使用频率的把控。
外抑制强的犬本身较其它犬乐于探求环境,此类犬游散次数多了会让其不断自我强化,变得更加乐于探求外部环境事物,无形中给训导员增加了训练犬的难度。因此减少使用游散奖励会减少犬“散”的机会,而且有助于养成犬的积极主动习惯,最终养成达到一训练就将注意力放在训导员身上的习惯。
(三)为了不让犬形成自由散漫的不良习惯,运用游散奖励时应注意奖励时长的把控。
游散奖励犬的时间不宜过长,长时间游散会造成犬自由散漫,削弱训导员口令的有效性,甚至形成不听指令的恶习。因此要严格把控奖励犬游散的时长,尤其是探求反射重的犬要少用游散奖励,即使用了也要在同等条件下缩短时间。
(四)为了充分发挥奖励效果,可以将游散奖励手段转化为带犬游戏互动。
在训练过程中训导员可以将游散转化为人带犬游散,加速跑是主要形式,期间亦可转化为游戏互动,此方法可以在强化犬的有效动作行为的同时巩固亲和关系。例如在初步训练犬的嗅认能力时,犬一旦按照训导员指示嗅了,就立刻带其短距离加速跑,跑一段即可转化为追逐游戏,一来犬得到强化,满足了其游戏欲,体现寓训于玩的训练原则,有助于基本形式和科目快速训成。二来可以调节其神经类型,经常训练嗅认这类服从科目,犬也会厌烦抑制,游散奖励则可以起到平衡其抑制过程的作用。
(五)为了安全起见,运用游散奖励手段时,训导员应严密监视犬的游散过程。
训导员在训练前或者游散奖励前应首先观察周围环境是否存在潜在的危险因素,以防犬受到不必要的伤害。例如周围有无其它犬,要严防犬与犬之间打架而造成伤害;周围有无其它动物,也要防止犬养成追逐别的动物的恶习;周围有无行驶的车辆、地面有无碎玻璃、深坑等能伤害到犬的物品,避免在这种环境下运用游散奖励手段。
(六)为了运用游散奖励创造条件,运用前应注重训练环境的选择。
游散奖励运用时首先应该有充足的给犬游散的空间,否则无法运用游散奖励;其次周围环境应干净整洁,不应该有食物残渣和其它犬的排泄物,尤其是发情公母犬的排泄物,否则游散奖励会演变成犬变散漫的过程,削弱口令有效性,影响训练。
四、衔取奖励手段的细节运用
(一)为了确保良好的训练效果,运用衔取奖励手段时应注重物品的选择。
首先应选择犬最喜爱、最兴奋的物品作为奖励物品,这样能最大程度地调动犬的积极主动性;其次是大小适中,应根据犬嘴的大小决定,达到不会因为过大衔不起而造成犬趴下啃咬,也不会出现因为过小而导致犬吞食酿成事故的情况;再者采用物品从犬头上方自由落体奖励方式时(图7),应选用软质、轻质物品,不要给犬造成痛觉,以防奖励适得其反。
(二)为了避免不良习惯的出现,运用衔取奖励手段时奖励物品应当多样化。
奖励物品过于单一会让犬形成诸多不良习惯。例如:过多地使用单一物品作为奖励物会让犬丧失兴趣从而导致奖励不充分,降低了犬的兴奋性,进而影响训练效果。另外,还会形成犬只对一种或者特定几种物品感兴趣,别的物品不衔取,会给鉴别、追踪、搜毒、搜爆等使用科目训练设置极大障碍。
(三)在犬换牙期间,运用衔取奖励手段时应选择软质物品作为奖励物。
图7 衔取
图8 持物衔取
在换牙期间要换软质物品给犬衔取,因为犬在换牙期间衔取硬质物品时常会造成牙部不舒服,而且犬很容易在衔物品过程中产生较大的牙痛刺激,会造成犬日后的衔取欲下降、不衔取,撕咬不咬满口等问题,为日后训练造成困扰,甚至发生废犬的情况。
(四)为了保障犬良好的受训状态,衔取物品要专属且清洁干净、定期消毒,定期更换。
不同犬身体免疫机能和所携带的病菌是不同的,不同的犬应使用其专属的衔取物品,目的在于防止交叉感染,造成疾病传播。保证衔取物品清洁干净、定期消毒、定期更换也是为了保证犬的健康,防止犬“病从口入”。
(五)为了训练的科学性,运用衔取奖励手段时应注重奖励形式的把握。
运用衔取奖励手段时应坚持抛物衔取与持物衔取相结合,以持物衔取为主(见图8),抛物衔取为辅的训练原则。因为抛物衔取搞多了会造成犬有意识的与训导员保持距离,等待训导员抛物,甚至产生完成科目自动向训导员相反方向跑的不良联系。而持物衔取更能锻炼犬的注意力,同时会让犬把注意力锁定在训导员身上。
(六)运用衔取奖励手段时应因犬而异、因科目而异。
在日常训练当中,一些衔取欲望强的犬,其衔取欲远远大于食欲,很多情况下,奖食奖励甚至无法吸引犬、调动犬训练的兴奋性。这时运用衔取奖励手段效果最佳,在鉴别和追踪训练中,运用衔取奖励手段更为直接有效。
(七)应根据犬的具体情况决定抛物距离、抛物高度和抛出速度的快慢。
运用衔取奖励手段时应根据犬的月龄大小、犬的体质决定抛物的距离和高度;根据犬的注意力好坏来决定抛出物品的快慢,一定要在犬注意的情况下抛出,物品抛出而犬未看到抛出物,犬往往会表现为手足无措,围着训导员转、扑,训练会因此间断,影响科目形成。
(八)为了训练的便捷性,应将衔取物品按照犬兴奋程度排列。
在训练过程中,训导员应有意识地分清犬对各种物品的喜爱程度,并依照喜爱程度按照阶梯顺序排列。以便于在训练“吐”科目时,用犬更喜欢的物品去奖励它吐掉口中物品的行为,或培养犬对鉴别形式积极性时,或需要替代物奖励以提高犬对科目兴奋性时运用。
以上四种非条件性奖励手段,无论是哪一种都要求训导员要灵活掌握、活学活用,清楚在不同状态下应注重的奖励细节和应避免的错误,本文所述的非条件性奖励手段的细节性运用均是实践中经常遇到的情形,注重这些细节,正确地运用非条件性奖励手段是高效训犬的有力保障,会在实践中起到少走弯路,事半功倍的效果。
(作者单位:于汝清、刘帅,公安部警犬技术学校,110034;周学军,青海省公安厅,810000)
(本文照片由作者提供)
(编辑:颜 勤)