响片训练系统
2014-08-20张松
张 松
响片训练在警犬训练中存在很多误区,不时可以听到各种关于响片及响片训练的表述,诸如“响片一响就表示‘好’的意思!”“响片响一声意思是坐下,响两声意思是卧……”,给人的感觉响片训练简单但又神秘。近20多年来,不难发现国内外民间的竞技犬训练中响片训练已逐渐成为一个通用的手段,某种程度上该体系推动着训练技术和水平的发展,美国犬业公司Leerburg放言“八九十年代的竞技犬优胜者如果放到现在的顶尖比赛中无法立足,原因在于现在的顶尖赛犬都使用了标记训练(是以响片训练为代表对特定行为进行标记的训练体系)”。每年公安部警犬技术访问团到欧洲考察时,也发现巴伐利亚、斯图加特等警犬学校都在尝试使用响片用于血迹搜索、搜毒搜爆等科目训练。
图1 训练理论及响片训练发展图
本文通过笔者近3年的使用经历,结合多方研究、梳理和思考,旨在从响片训练发展的背景、原理、方法与技巧进行一个系统阐述和解读,与警犬训练人员和犬竞技运动训练者分享,期待这项有效的训练能引入到日常训练中,提高警犬训练的效率和质量。
一、发展背景(见图1)
1901年,通过响铃唾液分泌试验,俄国巴普洛夫创立了经典条件反射理论,奠定了以被动应答为训练基础的训练体系;1936年,美国斯金纳建立操作性条件反射学说,在桑代克的试错学习理论的基础上,完善了通过强化行为结果而促进行为发生频率的学习方式;在20世纪40年代中期,响片成为实验商业化的产物,但并未得到广泛推广;六七十年代在海洋动物的训练中,响片类标记训练得到巨大成功;90年代,海豚训练师凯伦·普瑞尔(Karen Pryor)出版了《不要毙了你的犬》(Don’t Shoot Your Dog)一书,在美国开始兴起了响片在犬训练领域的各种尝试,并得到广泛运用;近年来,在欧洲工作犬训练比赛、警(军)犬训练中,响片训练也体现出其独特的效果。
二、训练原理
(一)操作性条件反射原理,即得到强化的行为发生的几率会增加。响片作为一种中性信号起到人犬之间的交流桥梁的作用,它建立了一个沟通渠道,通过及时标记需要的行为,给犬一个承诺“这是我喜欢的行为,一会儿我会给予奖励”,这种标记可以不受人犬位置、奖励时机的限制,做到及时捕捉、延后奖励。由于犬对于不能及时得到奖励的行为无法联系奖励与行为之间的关系,即所谓的“1/2秒原理”,响片的使用无疑是最好的沟通方式,便捷、准确、易操作。
(二)强化理论:强化就是通过强化物增强某种行为的过程,而强化物就是增加反应可能性的任何刺激。斯金纳把强化分成积极强化和消极强化两种(见图2)。积极强化(正强化)是获得强化物以加强某个反应;消极强化(负强化)是去掉可厌的刺激物,是由于刺激的退出而加强了那个行为。强化理论的实质就是“追求快乐,逃避痛苦!”其中,正强化的代表为响片训练,负强化的代表为电脖圈、刺钉脖圈等训练(见图3),比较形象的描述是“正强化在前面引导、负强化在后面推动”。在训练中,完全依靠正强化,犬会缺乏速度和精准度,而过度使用负强化,则会使犬由于频繁或长时间处于压力状态,影响其信心和情绪,通常要根据训练科目、训练进度、犬的个体素质和能力进行针对性地科学运用。
图2 正负强化类别
图3 训练中的正负强化,在使用中不可滥用,要根据犬的实际系统性地引入训练系统。
三、训练方法与技巧
响片训练就是一种标示训练,除了使用响片,还可以使用一些特定的信号,比如语言信号、光线信号、其它声音信号(如笛哨等特定响声)等,只要这些信号每次出现都是一致的,并且不会与平常犬碰到的信号混淆,便可以取到一样的标记行为的效果。可以说,标示训练是50多年来最有效率的训练系统,它是一套黑白分明的居于正向强化的交流方法。这套训练系统提供训练者一个主动告诉犬喜欢“此刻”所为的手段,并提供非惩罚方法让犬知道“此刻”所为不喜欢。这种训练可以用于8周的幼犬,也可对付8岁顽固老犬,对完全没训练过的犬可以,需要重新训练亦可,对猫、兔子、马、鹦鹉等并且多数动物和鸟类都可以。下面以响片为例介绍一下具体的操作方法。
(一)训练步骤
1、充电。这个训练过程主要是让犬建立对响片“咔嗒”声的条件反射。具体做法是每次按响片时就给犬强化物(食物、玩具、抚拍、游戏等),这个阶段,要先让犬注意到主人,而且每按一次便立即给予强化。当犬听到咔嗒声出现停顿,看主人,找强化物,充电便基本完成,可以进入下一阶段。
2、行为标记。对于需要的行为要用响片进行及时、准确的标记,犬的行为可以通过诱导、捕捉、引导杆、目标物等方式促成,比如使用食物在犬头上慢慢升高诱导犬坐下,或者让犬由于探求去碰撞目标物(勺子、卡片等),或者耐心等待犬做出某个行为时及时按响片进行标记。
3、塑形。通过拟定训练分步骤训练计划,将训练进行细化,逐渐提高标记训练的标准,使犬逐渐趋近要达成的目标(见图4)。例如:让犬坐下,可以分解为身体后肢下倾、后肢着地、双后肢正确着地、规范坐下几个步骤耐心进行,响片标记逐渐提高行为要求标准,使犬最终完成标准、规范的坐下行为。在响片训练中,口令在犬的特定行为形成以后才加入,通过几次便可形成口令和行为的条件反射。
4、行为链接。训练中往往需要犬做出较为复杂的行为动作,比如在追踪中,嗅嗅源、找线、上线、把线、示警,是由一系列行为组成的,响片训练中可以将各个行为进行细化分解,分别训练,最后再将这些行为链接在一起。在敏捷性运动和艺术人犬舞表演中,更需要将最终要达成的非常复杂的综合行为进行分解细化,分别标记训练,最后再进行行为链接。
(二)奖励物使用技巧
图4 在训练中将训练内容进行细化分解,并按照进度对正确行为进行标记。图中为笔者在日常训练和教学中使用响片进行行为标志。
1、食物奖励。食物在训练中利于犬安静地完成任务。使用中,食物必须要足够大,这样可以激发犬需要更多,但也不能过大,使犬花太多的时间进食。食物要软,不能是易碎的,碎食物会掉到地面上(见图5)。在训练中使用不同等级的食物,表现好得到高质量食物,表现一般得到低质量食物(见图6)。常用奖食种类有:硬奶酪、牛肉块、熟猪肝块、鸡肉干、香肠、犬饲料等。在犬每日食物摄取量中要扣除奖食的量。
2、物品奖励。在响片训练中,可以使用犬喜欢的物品(玩具)进行奖励,但需要首先能满足以下条件,否则要谨慎使用:(1)犬不是独自玩耍,而是跟主人一起玩耍才有趣;(2)每次主人下口令“放”,犬必须能做到立即吐出物品;(3)如果物品抛出,犬必须能够将其衔回送给主人,邀请继续游戏。常用的玩具包括:胶球、Kong(空心胶制玩具)、布条、布带、塑料棒、麻棒、其他犬玩具等,在奖励中,也可根据犬的喜好程度分等级使用。
(三)响片训练注意事项
1、响片发出咔嗒声的时机至关紧要,要在所需行为发生的瞬间。
图5 食物的大小要合适,不要使用碎食物。
图6 在日常和犬接触过程中,测试犬的食物喜好等级,有助于训练中针对性的使用。
2、每次对特定行为进行标记时只能按一次响片,避免犬出现混淆。
3、在使用响片之前一定要先想好自己的位置和动作,才能准确做好眼手配合。
4、在训练初期,每次按响片都要及时给犬奖励,可以逐渐延时给予奖励,在完成复杂动作时,可以标记几个行为后,一起给予奖励。
5、标记时机一定要准确,因此在使用响片之前最好做一些眼手配合的练习,比如将眨眼、手掌开合、网球弹击等与响片按压时机结合,这些都是容易操作,便于提高眼手配合的练习。
6、要合理安排奖励,根据犬的喜好程度,将奖励分等级,做到完成难度越高,质量越高,奖励等级也越高。
7、不能将响片作为奖励信号来使用,也不能将响片作为口令信号来使用,响片起到的是一个客观的、无情绪的标记信号,随意使用响片只会造成犬训练的混乱。
8、如果使用目标杆等引导定位辅助,要逐渐消除引导,使犬根据训导员的手势或口令做出相应行为。响片的使用也是如此,当犬完成某一行为的塑造,响片就可以不再使用或者间接使用。
9、对于犬出现的其他非需要行为,采用非纠正式的消退,即忽视或者说“NO”(不对)。如在训练搜爆中,犬出现吠叫、抓扒等示警行为时不要强化,忽略其行为发生,等到犬出现坐、卧、注视等安静的示警反应时,立即使用响片标记,进行奖励。这样,犬的其他被忽略行为就会逐渐消退,而安静示警反应就会得到强化。