在警犬训练使用中梯度化奖励手段的应用

2023-11-30成兴盛高文斌张彦鹏

中国工作犬业 2023年11期

罗宇郭亮成兴盛高文斌张彦鹏

奖励是警犬训练及警犬现场使用的驱动力，警犬的训练及使用都需要使用奖励。奖励能否得到良好的实施直接关乎最后警犬训练及使用的成败，关乎警犬及训导员的下一步训练、使用计划的部署。实践证明，梯度化奖励的应用是高效提高警犬奖励效能的有效措施。笔者结合自身实践就警犬训练、使用中梯度化奖励的应用展开讨论。

一、在警犬训练使用中梯度化奖励应用的意义

梯度化奖励就是在警犬的训练、使用中，对警犬进行奖励时将对警犬应用的所有奖励进行梯度化地给予，以最大限度地提高警犬的兴奋性，最大限度地调动犬的积极性，最大限度地让犬感受到奖励，从而实现高效提高警犬的训练及使用效能的目的。要深刻认识到在警犬的日常训练及各类案件现场的使用中，梯度化奖励的应用是快速帮助训导员指挥警犬达到相关的训练及使用目的的高效手段。

二、在警犬训练使用中梯度化奖励的开展

（一）整合归类奖励措施

首先训导员要将对警犬日常训练、使用中应用的各种奖励进行总结归纳，涵盖实际训练及使用中应用的各类常见奖励如：食物奖励、言语口令性的夸赞、认同奖励、抚拍、按摩类鼓励性的奖励、球类玩具的奖励以及散放等给予犬自由活动奖励等。其次是训导员根据自己总结应用的所有奖励措施进行归纳分类、整合排序，对各种奖励措施的归纳分类、整合排序原则主要是依据如下几类：一是按照警犬对不同类奖励措施敏感反应程度的大小进行，如训导员发现所带警犬对各类奖励及抚拍性的奖励的敏感程度依次为食物奖励＞抚拍奖励＞言语奖励，则在实际的训练及使用中训导员就要依据已得到归纳排序的结果在训练及使用中展开梯度化奖励的应用；二是按照警犬对同类奖励措施中不同奖励量敏感反应程度的大小进行，如在言语奖励中口令声音的大小，在食物奖励中食物的形状大小等；三是按照警犬对同一奖励措施在不同时间、空间条件下敏感反应程度的大小进行，如：在相对清静的环境条件下警犬对言语奖励较之复杂嘈乱环境条件下更为有效等。奖励措施的归纳整合是警犬训练及使用梯度化展开的前提与基础，训导员要对自己掌握应用的各类奖励措施进行全方位的归纳整合，保证后续梯度化奖励应用的顺利展开。

（二）梯度化奖励的建立与应用

在完成对警犬各种奖励措施的归纳整合后，根据警犬的实际训练及使用现状，依据既定的训练及使用目标即可应用梯度化奖励展开警犬的训练及使用。如在训练基础科目时，警犬对各类奖励的敏感程度为食物奖励＞抚拍奖励＞言语奖励，据此当警犬的训练及使用结果达到一般预期时使用言语奖励即可；当警犬的训练及使用结果超出预期时应给予抚拍奖励；当警犬的训练及使用结果远超出预期时应给予食物奖励。梯度化奖励的建立与应用就是根据警犬的训练及使用表现进行梯度差异化的奖励，通过在反复多次的训练及使用中应用梯度化奖励，在警犬的大脑意识中建立奖励获得的梯度化意识，充分调动犬的积极性，实现警犬训练与使用的高效能。

三、在警犬训练使用中梯度化奖励应用的原则

梯度化奖励在警犬训练及使用中的应用要遵循持之以恒、循序渐进、系统整合、稳步提升的原则。要认识到梯度化奖励在警犬的训练及使用中的建立与应用是一个长期坚持的过程，是在相对的时间跨度内让警犬感受到奖励的内容具有梯度性，从而表现出旺盛的获取欲。要按照警犬在训练及使用中的现实表现以及在建立和应用梯度化奖励后警犬的敏感程度循序渐进地提升梯度化奖励的应用水平，经过不断地系统整合，达到稳步提升警犬训练及使用效能的目的，通过梯度化奖励的建立与应用形成一套良性高效的警犬训练及使用的奖励模式。

四、注意事项

（一）因犬而异，知犬善奖

梯度化奖励的建立及应用是在训导员对自己所带警犬的实际训练及使用情况有充分掌握的情况下展开的。训导员只有在充分地掌握了自己所带警犬对自己已给予的奖励反应敏感程度后才能更好地进行梯度化奖励的建立与应用，在警犬日常训练及使用中要注意观察收集记录犬对各类奖励的敏感表现反应，要根据每头犬的特性制订不同的梯度化奖励方式，通过总结比较犬对不同梯度化奖励的方式，摸索提炼出一套适合自己所带警犬的梯度化奖励模式。

（二）因阶段而异，视情景适用

梯度化奖励的建立及应用在警犬训练及使用的不同阶段要采取不同的应用。如在训练初期着重建立警犬对梯度化奖励的理解，通过控制警犬得到奖励食物的形状大小、散放时间的长短、言语口令声音的大小以及各种奖励的穿插应用，建立梯度化奖励模式，培养提高警犬对获得奖励的积极性与兴奋性。在警犬使用时，梯度化奖励要注意滞后奖励的充分，警犬在实际的使用中往往只能在使用结束后才能进行奖励，奖励存在滞后性，此时的梯度化奖励就显得尤为重要，具有承上启下的作用，即对本次使用具有奖励的意义同时又让犬对下次使用后的奖励满怀期待。

（三）逐步建立，综合应用，不断细化

梯度化奖励的建立及应用不可操之过急，要逐步植入各类奖励方式，通过警犬对梯度化奖励的理解与契合，综合应用各类奖励方式，不断细化掌握警犬对各类奖励方式的敏感程度，再根据实际的训练及使用目标调整优化梯度化奖励的内容，达到梯度化奖励高效促进警犬训练及使用的目的。

（四）丰富奖励手段，扩大梯度化奖励应用空间

要尽可能地丰富警犬训练及使用的奖励内容，奖励的手段越多，样式越丰富，梯度化奖励的应用的操作空间就越大，梯度化奖励的应用就越容易实施，这就要求训导员在平时的训练及使用中培养发现各式各样的奖励内容，尽可能地丰富奖励手段，可以与警犬训练及使用中物品的多样化工作结合起来进行。

综上，在警犬训练及使用中，梯度化奖励的建立与应用是快速高效提高警犬训练及使用效能的方式，训导员要深刻认识到梯度化奖励的开展对迅速提高警犬的训练及使用效能具有重要的现实意义。在警犬日常的训练及使用中，训导员要有意识地培养梯度化奖励的思维，通过不断植入新的奖励情境，让警犬理解奖励变化的梯度与其行为表现的正相关，最终达到梯度化奖励的高效应用，实现警犬训练及使用的高效能。