再谈警犬训练及使用中梯度化奖励的运用
2024-03-07王建绪高文斌张彦鹏
王建绪 高文斌 罗 宇 张彦鹏
梯度化奖励的运用是高效提升警犬训练及使用效能的重要方式。梯度化奖励的运用具体可分为在警犬训练中的运用和警犬实际使用中的运用。实践证明,通过梯度化奖励在警犬训练及使用中的运用,能够快速达到警犬训练及使用的预期目标。笔者曾在《在警犬训练使用中梯度化奖励手段的应用》(详见本刊2023 年第11 期)一文中讨论了警犬训练和使用中梯度化奖励的意义、原则和注意事项,本文中就梯度化奖励在警犬训练及使用中的具体运用展开讨论。
一、警犬训练中梯度化奖励的运用
警犬训练是警犬使用的前提,是警犬警用性能有效发挥的根本保障。梯度化奖励在警犬训练中的运用,就是将警犬训练中给予警犬的各种奖励手段、方法经过科学合理的整合,依据警犬的实际训练表现给予梯次奖励的方式,以最大程度地满足警犬的奖励需要,最大限度地调动警犬的训练主动性与积极性。
(一)训练初期梯度化奖励模式的建立
幼犬在初期接受训练时,就可以着手梯度化奖励模式的建立,让幼犬在获得梯度化奖励中建立条件反射。可以用幼犬喜欢、欢迎的某种单一奖励方式进行梯度化奖励模式的建立。如利用食物进行奖励时,通过食物数量及品类的梯度化给予,实现幼犬梯度化奖励模式的快速建立。具体可在各种延缓科目中进行运用,在训练幼犬坐延缓时,可根据幼犬坐延缓的时长给予犬梯度化的奖励。幼犬坐延缓时间越长给予幼犬奖励的奖食数量及种类就越多,通过梯度化奖励的运用,正向引导幼犬积极完成训练目标,初步形成奖励获得的梯度化意识,为下一步梯度化奖励的运用打下基础。
(二)训练中梯度化奖励的强化运用
在幼犬初期建立奖励获得的梯度化条件反射后,就可以开展警犬训练中梯度化奖励的强化应用。即将训练中所有的奖励手段、方式进行综合,梯度化运用在各个科目的训练使用中。具体在警犬的各个基础科目训练中,将食物与物品的奖励进行梯度化的运用,警犬完成简单的训练任务时在训练中予以梯度化奖励中层次较低的奖励,完成复杂的任务时予以梯度化奖励中层次较高的奖励,完成超出了训练目标要求的训练任务时给予梯度化奖励中层次最高的奖励,以充分奖励警犬的训练积极性与主动性,激发警犬的训练潜能,进一步强化梯度化奖励在警犬训练中的运用,进一步强化警犬获得梯度化奖励的条件反射。如在跨越障碍的训练中,当警犬完成简单的越障科目时,可以给予梯度化奖励中层次较低的食物奖励;当警犬完成复杂的越障科目时,给予梯度化奖励中层次较高的食物或者物品奖励;当警犬完成超出了训练目标要求的训练任务时,给予梯度化奖励中层次最高的各种奖励。特别是在警犬跳跃平时不可能完成高度的板墙、平时不敢通过的一些独木桥之类,需要警犬自身充分调动生理、心理因素的训练中,梯度化奖励的运用凸现出巨大的优势,既充分地奖励了警犬的出色表现,同时深度强化了警犬训练的积极性、主动性,最大限度地提升了训练效能。
二、警犬使用中梯度化奖励的运用
梯度化奖励在警犬使用中的运用,是对现实警犬使用中奖励手段、方式滞后匮乏的重要补充,是提高警犬现场作业效能、发挥警犬技术独特优势的重要手段。警犬现场使用中奖励往往具有滞后性,受实际现场环境等多方面因素的制约,在现场使用中训导员无法立即高效地对警犬实施奖励,长此以往导致警犬在现场使用中作业欲望下降,作业动力不足,甚至出现消极怠工的现象,制约着警犬使用效能的发挥。梯度化奖励在警犬使用中的应用可以有效解决此类问题,具体在平时的各种模拟情景中建立起警犬使用中的梯度化奖励意识。如在刚进入现场时运用梯度化奖励中层次较低的抚拍、言语奖励,鼓励警犬主动作业;在警犬的作业过程中梯度化奖励中层次较高的抚拍、言语奖励,这里可以结合响片的使用;当警犬完成任务后,带犬至可以充分奖励的区域给予警犬梯度化奖励中层次最高的各种奖励。让犬意识到在使用中的奖励主要集中在最后任务的完成,特别是在任务重、作业时间长的各类警犬使用中,任务完成后的梯度化奖励至关重要,不仅仅是对本次任务完成的奖励,更是鼓励警犬在以后任务中能够产生持久的积极作业动力。
三、注意事项
(一)打好基础,事半功倍
梯度化奖励能在警犬训练与使用中达到高效的运用关键在于警犬获得奖励梯度化条件反射的建立以及训导员在警犬训练及使用中梯度化奖励的运用,利用梯度化奖励中越高层次的奖励越具有稀缺性的特点,奖励激发警犬参与训练及使用的积极性、主动性,实现警犬训练及使用的高效能。训导员要大胆探索梯度化奖励使用的各个环节,充实梯度化奖励的各个部分,引导警犬尽早建立奖励获得的梯度化条件反射,为后面梯度化奖励的综合运用打下良好的基础,发挥出梯度化奖励的巨大优势。
(二)稳步衔接,综合提升
梯度化奖励在警犬训练与使用中的运用是一个系统的过程,如对警犬在使用中的奖励主要来源于警犬在训练中能够得到的各类奖励措施,因此在警犬训练中能否有效建立起梯度化奖励关系到在警犬使用中梯度化奖励的运用。在警犬训练中梯度化奖励中高层次的奖励要与在警犬使用中任务结束后的梯度化奖励相结合。
(三)循序渐进,总结提高
梯度化奖励在警犬训练与使用中的运用是一个漫长的过程,要根据警犬对梯度化奖励中各层次奖励的敏感程度不断优化梯度化奖励的各个部分,如在言语、抚拍奖励方面,部分训导员凭借自身主观臆断认为自己的言语、抚拍奖励的语气、力度具有梯度性,而实际效果在警犬看来区分度并不高,久而久之导致训导员的言语、抚拍奖励对犬无法产生有效的奖励引导作用。因此训导员要根据警犬的实际反应表现不断优化充实梯度化奖励中的各个部分,有效发挥出梯度化奖励的优势。
综上,梯度化奖励在警犬训练及使用中的运用是一个重要而复杂的过程,它是高效提升警犬训练及使用效能的重要方法。要重视在警犬的训练及使用中运用梯度化奖励,不断总结提高,同时关注警犬个体差异,摸索出一套适合具体警犬的梯度化奖励方法,实现警犬训练及使用效能的大幅提升,充分奖励、调动警犬的积极性、主动性,更好地发挥出警犬技术的独特优势,进一步提升警犬技术服务警务实战的综合效能。