浅谈犬训练奖励的原则

2017-01-15潘金磊叶尔德尼

中国工作犬业 2017年10期

潘金磊叶尔德尼

浅谈犬训练奖励的原则

潘金磊叶尔德尼

奖励是为加速培养和巩固犬的能力，增强犬行为出现的几率，以及犬服从指挥，做出正确动作的正强化方法，是犬训练的重要有效方法。奖励时，需要注意哪些问题？掌握什么原则？大量的训犬书籍里只阐述了奖励的方法，很少有关于奖励原则的论述。原则是对原理进行总结归纳而得出的规则，是对原理的高度概括。懂得原理，才能想出方法，不懂原理，只会方法，永远只能停留在照猫画虎，依葫芦画瓢的水平上。懂得原理，总结出原则，可以创造出各种各样的奖励方法，原则重于方法，方法来源于原则。不懂原理，轻者，只能发现问题，不能解决问题，甚至，根本发现不了问题。理解了原理，掌握了原则，才能发挥奖励的最佳增强效果。通过训练实践，归纳总结出了以下五条奖励的原则。

一、投其所好

不怕警犬不工作，就怕警犬没爱好。不同的犬，不同的犬种，其喜好的东西是不同的，所以对于犬的奖励方式，也是千差万别的。奖励时，只有因犬制宜，投其所好，才能完全调动犬的积极性，使犬充满训练的激情和动力。在平时和犬的接触中，喜欢吃的食物，喜欢玩的游戏，用犬喜好的东西去奖励它，才能充分发挥犬的主观能动性，使犬积极主动地学习、工作。

二、及时有效

奖励只有及时，才能有效。过早的奖励和过晚的奖励，都会降低奖励的效果。

犬在完成动作之后的两秒钟内，进行奖励，才能明白是奖励的哪个行为。当然，这是在保持动作没有发生改变的情况下。如果在两秒钟内，动作已经发生了变化，那么，奖励增强的行为是和奖励出现的时间间隔最接近的行为，奖励已经错过了最佳时机。奖励时，一定要在动作完成后的两秒钟内且动作没有发生改变时进行。在动作过程中进行奖励，同样也能起到增强效果。例如，当犬在坐下的过程中进行奖励，犬会更加努力地去重复这个行为。奖励时机过晚不但对正确的行为没有增强效果，而且会造成大量训练问题。例如，当犬坐下，主人用 “好”的口令奖励犬时，犬正好又回到站立的姿势，主人到底奖励的是犬的哪个行为?犬理解的是站立的行为。每当发现训练出现问题时，首先要考虑的是奖励的时机是否太晚。如果训导员在训练中忙得无法分心留意，这时可以请助训员帮忙观察，看看自己奖励的时机是否太晚，这对于掌握奖励的时机将会大有帮助。

过早给予奖励也可能没有效果。在行为出现前给予奖励，完全无法强化这个行为，因为受到奖励的是犬没有发生的行为，此时的奖励，完全起不到增强行为的效果。

三、恰到好处

奖励只有与行为的难易程度相当，恰到好处，才能起到奖励的效果。什么时候给予什么样的奖励，在犬训练中极为重要，奖励恰到好处，事半功倍。知道奖励，而不知道该给什么奖励，往往会造成劳而无功、事倍功半的不良后果。

利用食物进行训练奖励时，训导员常搞不清楚食物奖励的份量应该是多大，答案是尽可能越小越好。食物奖励越小，犬能越快吃掉食物，不但可以减少训导员等待的时间，而且每次练习时还可以增加食物奖励的使用次数，不会让犬一下子就吃饱吃腻了。一般来说，一小口食物足以让犬保持兴奋，如果是特别喜爱的食物，份量甚至可以更少。行为的难易程度应当与食物奖励的大小相当，食物的大小虽然没有一定的定律，但是有时候工作越艰难，报酬将会越大，如果我们完成了艰难工作却未获得相应的报酬，我们肯定埋怨不已。

激动的奖励方式能燃起犬激动的情绪，慢条斯理的奖励方式，能稳定犬激动情绪，可促使性格急躁的犬心理放松。训练时，根据犬的工作状态和训导员的训练需求，选择适合的奖励方式；需要犬处于兴奋状态时，选择激动、兴奋的奖励方式，需要犬处于平稳状态时，选择慢条斯理的奖励方式。例如，快速抚拍犬胸部的奖励方式和慢速抚摸犬被毛的奖励方式，其效果是完全不一样的，前者用于燃起犬激动的情绪，后者使犬心理放松，稳定犬的情绪。

奖励的持续时间，对训练的效果，也极具重要作用。在训练进行的过程中，选择持续时间短的奖励，往往不会中断犬的思维，便于犬学习和训练。而在训练结束时，选择持续时间长的奖励，可以使犬彻底地放松神经中枢，对下次训练充满期待。

犬接受训练初期，要简化犬得到奖励的过程，让犬很容易得到奖励；训练后期，形成犬牢固条件反射之后，要慢慢增加获得奖励的复杂程度，这样才有利于增强犬连续作业的能力。例如，当犬依照口令完成了某一动作，奖励时，把玩具抛进草丛里让犬去寻找，而不是直接得到玩具，这就是一个具有复杂程度的奖励。

四、变幻莫测

一位研究老鹰的生物学家注意到，如果老鹰在某处树丛下抓到老鼠，随后约有一星期的时间它每天都会到该处侦察，它飞过那个特定地点的几率已经被强烈增强。如果你在垃圾桶里捡到一张百元钞票，我相信你以后再次经过这个垃圾桶时，肯定会走过去向垃圾桶里瞧瞧。这些行为之所以被增强，是因为无形之中获得了意外奖励。

对于已经具有一定训练基础的犬，为了避免犬形成定性思考，奖励的类别和大小，一定要变幻莫测。下一个出现的奖励是什么？是物品？是食物？是犬最喜欢的食物还是一般喜欢的食物？让犬永远摸不清楚规律，变幻无常，犬才会对奖励充满期待。

奖励时，奖励出现的位置，不能恒定不变，如果经常右手掏球奖励犬，犬就会盯着右手出现的地方，长此以往，会形成不良联系。例如，在诱导奖励训练时，可以左手诱导、左手奖励，左手诱导、右手奖励，右手诱导、右手奖励，右手诱导、左手奖励等等，不停地变换奖励出现的地方。另外，奖励物可以从身体的任何一处出现，要让犬永远都猜不到，下一个奖励即将在哪里出现。

五、出其不意

出其不意的奖励，往往会有出其不易的效果。在训练中，训导员都遇到过无论怎么重复、大声地喊口令，犬还是一动不动的情况。此时，性格暴躁的训导员，往往压制不住内心的怒火去打犬，造成训练半途而废，犬恐惧主人。

出其不意的大奖是一个对动物或人类都极为有效的技巧。大奖是指非常大的奖励，甚至可能比平常大十倍，而且训练对象没料到它会出现。遇到犬不听话、害怕或抗拒而完全不服从口令的行为时，偶尔给一次大奖极有可能有效改善犬的反应。不知道这种不劳而获的大奖为什么具有如此效果显著的作用，只知道当我们什么都没做时，却得到了意外的奖励后，我们会加倍努力的工作，其中原由一直没弄明白，也许是为了得到更大的奖励，也许是对自己不劳而获的愧疚。

以上奖励原则，只有在平时训练中多加注意，严格遵守，融会贯通，才能取得意外的训练效果。

（作者单位：潘金磊，新疆伊犁州新源县公安局刑警大队，835800；叶尔德尼，新疆塔城地区乌苏市公安局刑警大队，833000）

（编辑：颜勤）