浅谈犬训练奖励的原则
2017-01-15潘金磊叶尔德尼
潘金磊 叶尔德尼
浅谈犬训练奖励的原则
潘金磊 叶尔德尼
奖励是为加速培养和巩固犬的能力,增强犬行为出现的几率,以及犬服从指挥,做出正确动作的正强化方法,是犬训练的重要有效方法。奖励时,需要注意哪些问题?掌握什么原则?大量的训犬书籍里只阐述了奖励的方法,很少有关于奖励原则的论述。原则是对原理进行总结归纳而得出的规则,是对原理的高度概括。懂得原理,才能想出方法,不懂原理,只会方法,永远只能停留在照猫画虎,依葫芦画瓢的水平上。懂得原理,总结出原则,可以创造出各种各样的奖励方法,原则重于方法,方法来源于原则。不懂原理,轻者,只能发现问题,不能解决问题,甚至,根本发现不了问题。理解了原理,掌握了原则,才能发挥奖励的最佳增强效果。通过训练实践,归纳总结出了以下五条奖励的原则。
一、投其所好
不怕警犬不工作,就怕警犬没爱好。不同的犬,不同的犬种,其喜好的东西是不同的,所以对于犬的奖励方式,也是千差万别的。奖励时,只有因犬制宜,投其所好,才能完全调动犬的积极性,使犬充满训练的激情和动力。在平时和犬的接触中,喜欢吃的食物,喜欢玩的游戏,用犬喜好的东西去奖励它,才能充分发挥犬的主观能动性,使犬积极主动地学习、工作。
二、及时有效
奖励只有及时,才能有效。过早的奖励和过晚的奖励,都会降低奖励的效果。
犬在完成动作之后的两秒钟内,进行奖励,才能明白是奖励的哪个行为。当然,这是在保持动作没有发生改变的情况下。如果在两秒钟内,动作已经发生了变化,那么,奖励增强的行为是和奖励出现的时间间隔最接近的行为,奖励已经错过了最佳时机。奖励时,一定要在动作完成后的两秒钟内且动作没有发生改变时进行。在动作过程中进行奖励,同样也能起到增强效果。例如,当犬在坐下的过程中进行奖励,犬会更加努力地去重复这个行为。奖励时机过晚不但对正确的行为没有增强效果,而且会造成大量训练问题。例如,当犬坐下,主人用 “好”的口令奖励犬时,犬正好又回到站立的姿势,主人到底奖励的是犬的哪个行为?犬理解的是站立的行为。 每当发现训练出现问题时,首先要考虑的是奖励的时机是否太晚。如果训导员在训练中忙得无法分心留意,这时可以请助训员帮忙观察,看看自己奖励的时机是否太晚,这对于掌握奖励的时机将会大有帮助。
过早给予奖励也可能没有效果。在行为出现前给予奖励,完全无法强化这个行为,因为受到奖励的是犬没有发生的行为,此时的奖励,完全起不到增强行为的效果。
三、恰到好处
奖励只有与行为的难易程度相当,恰到好处,才能起到奖励的效果。什么时候给予什么样的奖励,在犬训练中极为重要,奖励恰到好处,事半功倍。知道奖励,而不知道该给什么奖励,往往会造成劳而无功、事倍功半的不良后果。
利用食物进行训练奖励时,训导员常搞不清楚食物奖励的份量应该是多大,答案是尽可能越小越好。食物奖励越小,犬能越快吃掉食物,不但可以减少训导员等待的时间,而且每次练习时还可以增加食物奖励的使用次数,不会让犬一下子就吃饱吃腻了。一般来说,一小口食物足以让犬保持兴奋,如果是特别喜爱的食物,份量甚至可以更少。行为的难易程度应当与食物奖励的大小相当,食物的大小虽然没有一定的定律,但是有时候工作越艰难,报酬将会越大,如果我们完成了艰难工作却未获得相应的报酬,我们肯定埋怨不已。
激动的奖励方式能燃起犬激动的情绪,慢条斯理的奖励方式,能稳定犬激动情绪,可促使性格急躁的犬心理放松。训练时,根据犬的工作状态和训导员的训练需求,选择适合的奖励方式;需要犬处于兴奋状态时,选择激动、兴奋的奖励方式,需要犬处于平稳状态时,选择慢条斯理的奖励方式。例如,快速抚拍犬胸部的奖励方式和慢速抚摸犬被毛的奖励方式,其效果是完全不一样的,前者用于燃起犬激动的情绪,后者使犬心理放松,稳定犬的情绪。
奖励的持续时间,对训练的效果,也极具重要作用。在训练进行的过程中,选择持续时间短的奖励,往往不会中断犬的思维,便于犬学习和训练。而在训练结束时,选择持续时间长的奖励,可以使犬彻底地放松神经中枢,对下次训练充满期待。
犬接受训练初期,要简化犬得到奖励的过程,让犬很容易得到奖励;训练后期,形成犬牢固条件反射之后,要慢慢增加获得奖励的复杂程度,这样才有利于增强犬连续作业的能力。例如,当犬依照口令完成了某一动作,奖励时,把玩具抛进草丛里让犬去寻找,而不是直接得到玩具,这就是一个具有复杂程度的奖励。
四、变幻莫测
一位研究老鹰的生物学家注意到,如果老鹰在某处树丛下抓到老鼠,随后约有一星期的时间它每天都会到该处侦察,它飞过那个特定地点的几率已经被强烈增强。如果你在垃圾桶里捡到一张百元钞票,我相信你以后再次经过这个垃圾桶时,肯定会走过去向垃圾桶里瞧瞧。这些行为之所以被增强,是因为无形之中获得了意外奖励。
对于已经具有一定训练基础的犬,为了避免犬形成定性思考,奖励的类别和大小,一定要变幻莫测。下一个出现的奖励是什么?是物品?是食物?是犬最喜欢的食物还是一般喜欢的食物?让犬永远摸不清楚规律,变幻无常,犬才会对奖励充满期待。
奖励时,奖励出现的位置,不能恒定不变,如果经常右手掏球奖励犬,犬就会盯着右手出现的地方,长此以往,会形成不良联系。例如,在诱导奖励训练时,可以左手诱导、左手奖励,左手诱导、右手奖励,右手诱导、右手奖励,右手诱导、左手奖励等等,不停地变换奖励出现的地方。另外,奖励物可以从身体的任何一处出现,要让犬永远都猜不到,下一个奖励即将在哪里出现。
五、出其不意
出其不意的奖励,往往会有出其不易的效果。在训练中,训导员都遇到过无论怎么重复、大声地喊口令,犬还是一动不动的情况。此时,性格暴躁的训导员,往往压制不住内心的怒火去打犬,造成训练半途而废,犬恐惧主人。
出其不意的大奖是一个对动物或人类都极为有效的技巧。大奖是指非常大的奖励,甚至可能比平常大十倍,而且训练对象没料到它会出现。遇到犬不听话、害怕或抗拒而完全不服从口令的行为时,偶尔给一次大奖极有可能有效改善犬的反应。不知道这种不劳而获的大奖为什么具有如此效果显著的作用,只知道当我们什么都没做时,却得到了意外的奖励后,我们会加倍努力的工作,其中原由一直没弄明白,也许是为了得到更大的奖励,也许是对自己不劳而获的愧疚。
以上奖励原则,只有在平时训练中多加注意,严格遵守,融会贯通,才能取得意外的训练效果。
(作者单位:潘金磊,新疆伊犁州新源县公安局刑警大队,835800;叶尔德尼,新疆塔城地区乌苏市公安局刑警大队,833000)
(编辑:颜 勤)