Episódios
-
大家好,我是陈德文。
我们继续《别毙了那只狗》一书的分享。
今天我们要分享是关于「去除行为的八招」。
去除行为的方法有八招,只有八招而已哦。
- 第一招:毙了他(它)!(这招绝对有效,你将永远看不到这个人或这只动物。)
- 第二招:处罚。(大家最爱用这一招,虽然它几乎很少有实际成效。)
- 第三招:负增强。(当喜见行为出现时,即移除领受训者不愉快的事务。)
- 第四招:消弱,让行为自行消失。
- 第五招:训练一个不相容的行为。(这招对运动员和宠物饲主特别好用。)
- 第六招:训练这个行为只依讯号出现。(然后永远不给这个讯号,这是海豚训练师用来去除不良行为的最高段招数。)
- 第七招:塑形出行为的消失,增强任何不属该行为的行为。(这个友善招数可以让讨厌的亲戚转变为相处愉快的亲戚。)
- 第八招:改变动机。(这招是最根本,也是最为友善。)
好的,本次分享就到这里,我对这本书当前的理解与整理也告一段落。对内容想要展开更多讨论的同学可以留言或者发邮件,我会在后期的节目里更新和分享。
第一次做博客,说的舌头都打结了,总算是做完一本非常重要的书。
-
大家好,我是陈德文。
我们继续《别毙了那只狗》一书的分享。
今天我们要分享是关于记录与自我增强方法。前面的文章里我们分享了大多数是关于塑形他人的方法,那么如何进行自我塑形呢?
市面上有很多针对自我塑形的训练计划,但效果都不是很好,因为「训练对象」总是知道「训练者」的意图,于是变得相当容易说出:「我才不在乎我的评量表上是否多放颗星星,我宁愿抽烟。」
自我塑形的方法对有些人可能管用,但有些人可能必须经历三、四次难熬的计划或者多次重复某方法之后才能成功,这类人其实能够成功改变习惯或戒瘾,但是他们几乎都不可能第一次就成功。类似催眠或自我催眠的方法可能对某些人大有助益,但也不是百分百有效。
我发现进行自我增强最有用的做法就是做记录。
我需要的是可以让我一眼看出进步的记录形式,所以使用了图表,这样对我自己犯下的小错的罪恶感才能略微减轻,因为我看了图表后发现,即使我出了小错,我现在仍比半年前表现的好多了,虽然要达到完美标准仍然长路漫漫,即使我出了小错,我现在仍比半年前表现的好多了,这个「看得到」的进步实证本身虽然没有什么增强作用,效果也慢,但它倒是提供了足够的动机,让我多数时候都能坚持下去。
监测自我塑形时有个成效非凡的方法:利用电脑做训练,在电脑程序里设计有趣好玩的增强方式,它可以使学习突飞猛进,而且整个塑形过程很好玩,这种应用正增强原则的方式已经成为极具发展潜力的领域。
好的,本次分享就到这里,对内容想要展开更多讨论的同学可以留言或者发邮件,我会在后期的节目里更新和分享。
大家下周不见不散。
-
Estão a faltar episódios?
-
大家好,我是陈德文。
今天分享一则关于『塑形法』的实战记录。
儿童行为
儿童行为的塑形过程主要是透过模仿,他们看见大人做什么,无论是好是坏,他们也会照着做。
在教导孩子良好礼仪时,在训练期间,就是孩子出生到独立结婚这段时间,家中其他人的进食和言谈都必须恭谦有礼,而且至少要装出关心他人作为及谈话内容的样子。
这里分享一个大学同学zizi的困惑解答,
zizi咨询我们家孩子是如何自主入睡的,如何训练?
他们家的要哄很久才能入睡,不理她,她就咬毛巾和被子
我帮zizi分析:
孩子这个行为增多,主要原因是你给她过多的增强反馈,强化了这个行为出现的频率
弱化的办法就是不反馈,放置Play
那更好的办法是利用孩童或者人类的模仿特性,我的建议是大家玩——我们都是木头人的游戏,家长带着孩子做不许说话不许笑的游戏,让孩子模仿。
难度在于家长要把手机放下,不良睡眠习惯要改掉,给孩子做好的打样。
好的,本次分享就到这里,对内容想要展开更多讨论的同学可以留言或者发邮件,我会在后期的节目里更新和分享。
大家下周不见不散。
-
大家好,我是陈德文。
今天我们继续《别毙了那只狗》一书的分享。
今天我们要分享的内容是关于塑形法的训练游戏。
从训练游戏开始
即使我们知道塑形的原则也对它有所了解,除非自己进行塑形练习,不然还是无法应用它。
塑形不是一个用口头描述的过程,而是非口语的技巧,是一连串必须花时间进行的互动行为,有如舞蹈、跑步或冲浪,无法藉由阅读、想象或讨论而习得,我们必须实际行动。
『训练游戏』是发展塑形技巧时既简单又很棒的方法。
透过塑形训练游戏教授训练技巧,既有效,也可以成为娱乐,是一种很棒的派对游戏。
训练游戏至少要有两个人一起玩,一个扮演训练对象,一个扮演训练者,最佳人数目前我了解的是6个人,因为每个人在大家玩累之前至少有一次机会训练人或被训练,如果人数更多的团队也是可以玩的,因为在旁边观察的乐趣不逊于参与。
首先,让训练对象出去,由其他人选出一位训练者及要塑形的目标行为,例如在黑板上写下某人名字、上下跳或站在椅子上,然后把训练对象请回来,告诉他要四处走动,活跃一些,训练者则以吹哨子的形式增强任何有可能接近目标行为的动作;我喜欢加上一条规则,要求训练对象至少在开头几次被增强之后,必须回到门口重新来过,这样可以避免训练对象一动也不动,杵在最后一次获得增强的地点。
游戏中不能说话,但可以出现笑声、抱怨的哼声或其他情绪表现,达成行为之前不得出现任何提示或讨论。
训练游戏通常进行的相当快。训练对象会发现,以这种形式学习时多想无益,脑子里想什么并不重要,只要不断动来动去,多让哨声出现,你的身体不需要『你』的协助也能发现应该做什么,这对聪明的人绝对是很难忍受的经验。通常他们听见哨声时会定住不动,设法分析刚才做了什么,『不知道该做什么』和『不知道也没关系』的概念令他们大感惊惧。
增强式训练显示我们惯常出现的错误假设的危险——我们误以为『口语沟通最为重要』,而且以为『如果没有语言或至少意识到缺乏一些口语即无法学习』。
非口语的学习经验对于经常以口语指导他人的专业人士(如老师、治疗师或主管等)尤其有用,一旦亲身当过『动物』之后,对于那些出现塑形行为、但尚未理解应该做什么而容易出错的训练对象,你依然能够心生体量,甚至心有戚戚焉。
当小动物或小孩很有自信却猜错时,她可能爆发挫折及怒气,人类甚至可能因这种意外的失落落泪,此时你也将能够以耐心面对。
好的,本次分享就到这里,对内容想要展开更多讨论的同学可以留言或者发邮件,我会在后期的节目里更新和分享。
大家下周不见不散。
-
大家好,我是陈德文。
今天分享一则关于『正增强』的实战记录。
这是一件小事,但给我的启发挺大,从书中学到训练知识,在训练中运用是需要时刻保持教练之心和洞察能力。
事情是昨天带1周9个月的宝宝学习刷牙,到了漱口的环节,我们预期的行为是『宝宝含水到嘴里,然后咕噜咕噜漱口后,吐到洗手池中。』
实际在进行学习时,宝宝一开始是吐到了姥姥身上,结果我们都在大『笑』,看起来似乎很开心,结果宝宝『吐水到衣服上的行为』被增强了,之后几次都是刻意为之,她自己觉得我们是希望这样的行为增多。
好在太太即时制止,同时批判了爸爸作为家长这样引导孩子的不对。我当时也是很吃惊,因为增强理论我就和太太说过一次,也就说了一些关于增强的原则原理,和上一次关于吃饭的练习。
自己才察觉到在当时的训练和教练行为失当,整个人瞬间冷静并回归到当下。
这几天每天晚上漱口都是『到处乱吐』的行为,从训练者的角度看,自己好失职啊。
修正的办法很简单,但一定要控制好自己,在小朋友到处乱吐的时候,不反馈,不行动,甚至是扑克脸。
然后持续和小朋友说明我们的目标是『吐到洗手池的中央』,并且给予示范教学。
反复了3天左右,新的行动出现,然后及时给予正增强的反馈,不断提升这个行为出现的频率。
总算是没有搞砸事情。
好的,本次分享就到这里,对内容想要展开更多讨论的同学可以留言或者发邮件,我会在后期的节目里更新和分享。
大家下周不见不散。
-
大家好,我是陈德文。
今天分享一则关于『正增强』的实战记录。
周日带着太太和小朋友去超市,最后在回家路上,问小朋友要不要买「牛角包」(全称「爆浆牛角包」),小朋友非常兴奋的喊「要!」
小朋友在进商店看到牛角包后,也是非常兴奋,当下的状况,我判断小朋友对牛角包还是非常渴望的。
买完三个牛角包后回家准备吃午饭,奶奶准备好午饭后。开始进入吃饭程序,因为小朋友刚过1周岁8个月,吃饭还没办法自理,需要大人喂饭。
我们家里当前的分工是,奶奶煮饭,姥姥喂饭,妈妈负责生活起居,爸爸负责出去玩。
在吃饭的时候小朋友心心念念「牛角包」,每次吃一口饭都非常急切的想要吃到「牛角包」。
接着姥姥在喂饭的时候,喂一口饭,马上让小朋友咬一大口牛角包,然后等小朋友吃完再进行一次重复。
此时我给出了改进的办法:在小朋友吃完饭,嘴里没有东西了,才给她吃一口牛角包,但牛角包的量要减少。
这样的操作持续了15分钟,之后正常吃饭,到最后30分钟时间到了,结束午饭。
复盘整个过程:
增强物是「牛角包」,是当前小朋友想要的食物,小朋友喜欢某个食物的时期不一样,可能会在一段时间后会失效,需要寻找新的增强物。
小朋友已经会出现的行为是「张口接饭」和「把饭吃到肚子里」,是构成「能自己吃饭」的终极行为的两个必要步骤。
一开始我们做的是在小朋友「张口接饭」的行为出现后,给予「牛角包」增强,增强了「张口接饭」的行为。
我和孩子妈妈讨论,我们应该在孩子「把饭吃到肚子里」的行为出现后,才能给她奖励「牛角包」,这样可以增加「把饭吃到肚子里」的行为出现频率。
同时取消「张口接饭」的行为增强,因为一个增强物无法传达两个信号。而且这个行为已经习得,不需要做高频率的增强,只要偶尔给一下就行,甚至在一顿饭的过程中不用给。
还有就是调整增强物的给予量,从「让小朋友自己咬一大口」改成「可以快速吃下去的一小块」,以此来提升增强物的使用次数。
接着就是观察训练质量,我们家的小朋友一般吃到4、5成,肚子里有点料之后,就开始东摸摸西摸摸,心思不在吃饭上了,我们就不再使用增强物来强化行为。
可以改进的地方:
接下来我的计划是设计一个「制约增强物」,初步想法是用「好好吃饭!」这个词。每次在出现「牛角包」或者其他增强物之前,要先给小朋友一个信号,然后再给她吃到好吃的。
还要把方法给姥姥说好,因为姥姥是主要的「训练者」,爸爸妈妈偶尔插手可能会影响训练品质。
-
大家好,我是陈德文。我们继续《别毙了那只狗》一书的分享。
今天我们要分享的内容是关于『塑形法十大原则』的第七至第十点。
原则七 当某个塑形方法没有进展时,改采用别的方法。
无论什么行为,只要训练者动动脑经,塑形出这个行为的方法不胜枚举。
拿教小孩游泳为例,如果目标是希望他们沉入水里的时候不会害怕、很自在,
有些老师在进行这个塑形任务的第一步时,可能会让他们在水中吐泡泡,
有些老师则让他们很快把脸浸入水中便马上起来,
而有些老师可能会让他们在水中跳上跳下,直到他们敢跳起来再沉入水中。
好的老师在训练时如果看见有个孩子对某个方案感到无聊或害怕时,他会该换方式,
同一个塑形方法不一定会对每个个体都管用。
令人惊讶的是,人们对于不管用或成效不彰的方法极为坚持,
他们一心相信,同样的方法只要多做几次就会生效。
行为分析研究先驱莫里·西德曼博士主张
「训练时最重要的是理解训练原理,而非只是学习方法。」
主要理由在于,每个人都自有「方法」,但是真正管用的方法都的遵循训练原理。
原则八 不可无故中止训练,这么做将形成一种处罚。
在比较正式的情况下,例如授课或塑形出对象的某个行为时,在训练时间结束之前,
训练者应该专注在训练对象或课程上,这不只是礼貌或良好的自律行为,
它也是一种绝佳的训练技巧。
当训练对象试着获取增强物时,他与训练者已经有了一个协定,
如果这时候训练者开始与路人闲聊、接电话或做白日梦,
这个建立起来的协定便被破坏了,增强物停止出现并非由于训练对象犯了错,
这种做法造成的伤害可能比训练者单纯『错失增强物好时机』更加严重,
它可能处罚了一些当时出现了的良好行为。
原则 九 如果行为表现越差,请回顾所有塑形的步骤。
有时候已经训练良好的行为仍会变得很差,而且永远找不到原因。
修正这类退步最快的方法不是硬碰硬,不应该坚持训练对象的行为一定得完全恢复到令你满意为止,也不应坚持他得在完全回复后才予以增强。
正确的做法应是回想所有塑形的过程,并很快的重新经历所有塑形步骤,到新情境(二十年后,在公共场所、在雨中等等)中进行增强,每个步骤只要增强一两次就好。
这个技巧被称为「回到幼儿园程度」
考前复习功课或上台前翻翻剧本临阵磨枪正是这么做,
这种方法重复了原本的塑形过程,让身心都获得复习,
应用在动物或人身上都一样好用。
原则 十 在训练进展很好时停下训练。
每次塑形应该多久?答案取决于训练对象的专注力。
猫咪似乎在十多个增强物之后就会变得烦躁,所以训练五分钟可能已经是相当久。
许多人类课程大都在1小时左右,足球训练,研究生研讨会和其他不同训练则可能全天进行。
结束训练的「时机」比停止训练的「时间点」来的重要,
你永远都应该在训练进展很好时结束训练,
不但每回训练都应该这么做,而且每回训练到不同阶段(将该换训练下个行为时)也应该这么做。
你应该在训练进展不错时久告一段落——也就是说,只要达成了一些进步就停手。
最后达成的行为会记得最清楚,
所以你必须确定最后一个行为是值得增强的最好的表现。
但通常我们见到三、四个好的反应时,通常会兴奋过头而想一看再看或一做在做,
所以一次又一次的重来,设法重现最佳成绩。
但这只会很快让训练对象疲累,行为变差,不断出现错误,
接着就是纠正和破口大骂,最后搞砸了训练。
身为训练者,你得强迫自己见好就收,这需要有些胆识才做得到。
当然,行为的塑形与不断重复操练的方法完全相反,它不但可以产生稳定的进步,而且也是一种绝对不会犯错的训练方式。
它的训练进展可能极快,达成如此迅速训练成效的方法似乎有违常理,
它取决于你是否肯放下时间压力,特定设定目标和要求迅速进步的训练目标,完全看你肯不肯见好就收,这种过程很类似禅修。
有时候,你无法在每次训练时都挑最高点结束,或许学生付了一小时的学费,所以要求必须上一小时的课,较好的结束时机可能已经过去。
或者训练并不顺利,没有较好的表现,而且即将出现倦怠的问题,
此时聪明的做法是在结束训练之前给训练对象一定得可获增强的简单练习,
让他们记得这次练习整体是他们获得了增强。
好的,本次分享就到这里,对内容想要展开更多讨论的同学可以留言或者发邮件,我会在后期的节目里更新和分享。
大家下周不见不散。
-
大家好,我是陈德文。
今天我们继续《别毙了那只狗》一书的分享。
今天我们要分享的内容是关于『塑形法十大原则』的第四点。
原则四
针对某项行为采用的新增强标准时,暂时放宽其他特性的旧有增强标准。
学过的东西不会被忘记,但是处于吸收新技能的压力下,原来已学习很好的行为有时会暂时瓦解。
适应新要求的过程暂时干扰先前学成的行为,能力会短暂消失。
在新情境下,如果你因为训练完成的行为出错而苛责自己或其他人时,这是很糟糕的训练方式。
这个是非常重要的概念,通常此类错误可以很快自我更正,但是训斥容易导致情绪不安,
而且有时容易被聚焦在错误上头,使得错误更难改掉。
原则五
永远抢得先机。
进行行为塑形时,必须事先完善计划整个行为塑形过程,这个是为了确保受训者突然大幅度进步时,你仍然知道下一个增强的动作是什么。
这类「突破性」的塑形表现随时可能发生,在人类身上当然也看得到这种现象,许多高智商的动物身上也不例外,
我相信这是一个内在觉醒的例子,人或动物突然针对自己被要求出现的行为恍然大悟,于是便照做了。
当受训者突然出现大幅度进步时,训练者可能因此措手不及。
原本打算要从A行为训练成B行为,
可是受训者只是经过两次增强就突然表现出完美的B行为。
这时,身为训练者心中最好已经有个底,
知道接下来要做C行为和D行为,
否则你将会不知道接下来要增强哪个行为。
对训练对象而言,行为的突破通常是件令人兴奋的事。
就连小动物也似乎很喜欢「啊!我知道了!」的感受,而且他们常会冲来冲去,
表现出兴高采烈的样子。
因此行为出现突破时便成为能够迅速大幅进步的黄金契机,
如果训练者未做好准备,不知道接下来该做什么,
使得受训者一直维持在低水准的表现,除了浪费时间之外,
最严重的伤害可能是使受训者打消动机或感到厌烦,
于是对方将来训练的意愿便会降低。
原则六
塑形中途不可以更换训练者。
塑形过程当中撤换训练者将冒着让进度变慢的风险,
不管移交时多么仔细讨论过增强标准,但每个人的要求标准、反应时间以及期望进步的程度一定都有些许差异,
训练对象在适应这些个别差异之前,最终影响就是使受训者丧失被增强的机会,
在某种程度上这也是一种「新水池症候群」。
每个训练对象当然可以有多位不同的老师,由不同的老师教授英语、数学或足球并不会有什么问题,
但是学习单一行为时,在塑形期间(或半知半解的期间),
逐步提高的增强标准最好能维持一致性,
每次必须由同一位老师负责塑形某一个行为。
有心向学的人即便在最糟糕的环境下也能学习。
塑形中途换人训练应该只有一种必要的情况,当然就是在训练持续停滞不前的时候,
若原本几乎没有形成任何学习,换人也就不会有什么损失。
好的,本次分享就到这里,对内容想要展开更多讨论的同学可以留言或者发邮件,我会在后期的节目里更新和分享。
大家下周不见不散。
-
大家好,我是陈德文。
我们继续《别毙了那只狗》这本书的分享。
今天我们要分享的内容是关于『塑形法十大原则』的第三点。
原则三
进行塑形时,先「变化性增强」目前符合增强标准的行为,然后再提高增强标准。
许多人至始至终就反对在训练时使用正增强物的概念,
他们认为这么一来,他们可能一辈子都得给零食才能获得好行为。
但事实正好相反,利用增强的训练方法其实可以使你解脱,不再需要时时留意这个行为是否发生,这是「变化性增强」发挥的作用。
变化性增强的意思是指一个行为有时会被增强,但有时不会,当我们教导行为时,
我们通常采取无变化增强时制,意思是我们增强所有符合要求的行为,
但是如果我们只是想要维持行为的出现,我们偶尔才会给予增强。
例如,一旦建立起分担家务模式后,你的室友或配偶回家时可能会顺便去拿干洗衣物,
不需要你每次都给对方增强物,
但是遇到你生病或天气不佳时让对方特别跑一趟,
就需要表达一下谢意。
然而,当我们利用厌恶刺激做训练时(多数人开始训练时都会这么做),我们通常会学到一个原则:
每当对方出错或行为不佳时务必进行纠正,如果不这么做的话就会越变越糟。
很多小朋友在家里棍棒伺候下,会表现的非常乖,但只要一没人修理他,他们的行为就会变得非常不稳定。
许多青少年和朋友出去时会做一些不敢在父母面前做的事,这是因为他们完全明白在什么环境下处罚不会出现,这就是「阎王不在,小鬼作怪」的道理。
可是这也是以厌恶刺激做训练时的副作用之一,既然处罚意味「不可以这么做!」缺乏厌恶刺激的意思就是「现在可以做了!」
相反的,正增强的训练方法不仅不必一辈子增强每个正确反应,而且在学习过程中还必须偶尔忽略反应不做增强。
为何会如此呢?
塑形法的重点在于选择性增强某些反应,如此一来受训者的反应才会一点一点的改善,直到达到新目标。
所有行为并非都是一成不变,当预期出现的增强物被跳过省略时,
接下来出现的行为将会有些不同,因此偶尔省去增强物的做法可以让你挑选出表现较强烈或较佳的反应,
这种做法称为「区别性增强时制」(differential schedule of reinforcement),
只选择某类反应做增强,例如增加负荷较快、较长或面朝左面等等要求的反应。
但是,对经验不多的学习者而言,他原本一直能够获得预期的增强物,
现在却突然得不到了,这个状况可能会让他大感吃惊。
如果我们的受训者尚未学习接受偶尔不会出现增强物的状况,他很可能会失望的放弃,或退步回到原来表现较差或迟疑的反应。
如果我们正在训练一个毫无经验的学习生手,在你开始挑选更强烈或更佳的反应之前,事先可以教导对方学习容忍增强时制的小小变化,会很实用。
你的训练对象必须能够容忍偶尔出现的「失误」才不会完全不反应,
或者以专业术语来解释,这代表你必须先建立起变化性增强时制,
然后才能藉由区别性增强时制,增强较佳的表现。
在学习阶段短期使用这种间歇性增强时制有另外一个好处,如果你的训练对象能够容忍偶尔不给增强物的情形,
当你不增强某个原本足以增强的行为时,学习者不但会重复这个行为,而且第二次的行为很可能会更剧烈。
「嘿,我做到了,你没看到吗?你看,我又做了一次!」这个加剧后的行为称为「消弱突破」现象(extinction burst),可以让你更快达到目标行为。
精通塑形法的人为了激发更不同或更强烈的反应,甚至可能刻意不给增强物。
当训练对象学习到增强物跳过一次没给并不代表行为做错了,只是代表他可能需要再试一次时,
塑形过程便由连续增强时制(continuous reinforcement,新行为刚出现时使用)转变为区别性增强时制(挑选更好的动作、更长的时间、越快达成行为的反应等等),
然后再转回连续增强时制(当「完美」行为出现时,专有名词称为「符合增强标准」的行为),这时已没必要故意采取间歇性增强时制,
因为训练对象已经能够忍受变化性增强时制。
最后,当行为的各项特性都达到满意程度时,它通常已经变成受训者能够自然出现的行为之一。
你可以要求这个行为成为其他更复杂行为的一部分,把标准动作、速度和距离等都融合成一个大行为,好比参加比赛跑、任务执行或进行每日活动,
这个大行为即成为受到增强的行为,这时你可以将它转为间歇性(或维护性)增强时制,
只要偶尔按一下响片或说声「谢谢!」即可以维持行为的流畅表现。
高频率正增强方式(训练初时可能经常按响片给食的频繁动作)这时候就可以保留起来,等到训练新行为时再运用。
好的,本次分享就到这里,对内容想要展开更多讨论的同学可以留言或者发邮件给我,我会在后期的节目里更新和分享。
大家下周不见不散。
-
大家好,我是陈德文。
我们继续《别毙了那只狗》这本书的分享。
今天我们要分享的内容是关于『塑形法十大原则』的其中两点。塑形法的十大原则
塑形法有十大原则,有些原则源自实验验证的心理学法则,有些原则甚至未被正式研究过,
但任何塑形经验丰富的人都会自然而然认为它们很合理:当你违反其中一项原则时,你通常都会知道(虽然往往晚了一步)。
原则一
逐渐提高增强标准的幅度不可过大,这样训练对象才有不断被增强的机会。
实际应用这个原则时,它意味当你提高行为标准时,
你应该把要求定在受训者已经可以达到的行为范围内。
无论现在或未来,调高增强标准的快慢与受训者的实际能耐无关,
调高增强标准的快慢与你透过塑形过程达到的沟通效果有关,
如果受训者清楚你的增强原则,就可以早点调高标准。
每次调高增强标准时,你便改变了规则,所以你必须让训练对象有机会发现:
虽然规则改变了,只要他多费点劲儿表现,仍然可以轻易得到增强物,而且继续维持旧标准的行为有时已经不管用了。
然而他只有在达到新的增强标准时获得增强,才能够学会这一点。
如果我们把增强标准调的过高,要求他出现超乎过往能力的行为——不管他自己平常是否能出现这个行为,你都是在冒险.
因为他的行为可能因此完全瓦解,你还必须耗时费力才能根除一些由此衍生的不良习惯。
所以塑造行为最快的方法——有时也是唯一的方法——就是调整增强标准时,调高幅度必须很容易让受训者持续进步,即使每次进步只有一点点,
持续的进步仍然比强求快速进步、可能失去所有良好表现的冒险做法更能快速达到你的终极目标。
曾经有一位父亲犯下过这种严重错误。
他的青春期儿子功课很差,于是他没收了儿子最爱的机车,等到功课变好时才还给他。
他儿子真的因此努力念书,功课日渐进步,从不及格到了及格,从及格到了良好。
但是这位父亲不但没有增强儿子的进步,反而认为进步不够,继续禁止他骑车。
这个突然提高标准的要求太困难了,最后他儿子完全放弃念书,而且变得非常不信任人。
原则二
每次只针对行为的某项特性进行训练,不要企图同时塑形两项特性。
意思并不是指在同一段练习时间内不能训练多种不同行为,这样当然可以。
在任何一种课程里,我们可能先练习动作,然后再练习速度;以网球练习为例,我们可能先练习反手拍,然后再练正手拍,之后再练习步法及其他,
这么做可以减少单调无聊的情形。
好的指导老师一定会变化练习项目,当一项有些进步之后就换到下一项。
不过,训练每项行为时,你应该只针对一项增强标准做练习。
一份增强物无法传达两种讯息,应该把某一项行为塑造到满意为止,然后再针对另外一项进行塑形。
等两项增强标准都能个别达成之后,才可以要求受训者同时达到两项标准。
第二条原则有很多可以实际运用的地方,如果一件事可以分解成个别的小单元,然后再针对每一个小单元各自塑形,学习的速度将会加快许多。
我们学习技能时经常遇到无论练习再多似乎都无法进步的情形,其实原因在于我们老想一次同时修正很多地方,
这样的练习并没有塑形作用,而且一直重复动作或许能够进步,但也可能轻易增强错误的地方。
我们必须思考,这个行为的特性是否不止一项,能否把这个行为分解成更小的动作,再依各项特性个别训练?
当我们注意到这两件事,许多训练有关的问题自然会迎刃而解。
好的,本次分享就到这里,对内容想要展开更多讨论的同学可以留言或者发邮件给我,我会在后期的节目里更新和分享。
大家下周不见不散。
-
大家好,我是陈德文。
今天我们继续《别毙了那只狗》这本书的分享。接下来我们分享的是书的第二部分,塑形法。
塑形法
不打、不骂、不施压的训练法
什么是塑形法?
增强受训者已经出现的行为,让这些行为更常发生是很不错,但是训练者和教练要怎么做,才能使受训者出现那些他们可能永远都不会碰巧出现的行为呢?
小狗后空翻、海豚跳圈或人类投篮都是经过塑形的行为。
塑形法(shaping)是指把一个倾向于正确方向的小行为慢慢进行调整,每次只改变一点儿,朝最终行为目标推进,这个过程有个专有名词「连续渐进法」(successive approximation)。
生物并非一成不变,因此才有可能进行塑形法,不管受训者的行为是什么,有时候这个行为在某些方面的表现可能比较强烈有力,因此无论你希望塑造出的终极行为多么复杂或困难,你都可以利用受训者目前已经出现的行为作为第一步,再一步步建立过渡行为。
我们都相当习惯塑形也习惯被塑形,大致说来养儿育女多半就是塑形的过程,无论是打网球或打字,训练和人肢体技巧主要都的运用塑形法。
当我们试图改变自己的行为,如戒烟、克服害羞或增进理财能力时,我们也常常运用塑形法。
是否能够成功塑造自己或他人行为的关键,不在于我们多么精通塑形法,而是我们有多坚持。
几乎是任何事情,只要投入足够的时间,我们多数人都能略微精通。
但这么做实在很无聊,无论滑雪、弹钢琴或其他事情,我们都不想要尽快学会吗?
我们当然都想这么做,这时候便需要更好的塑形技巧了。
此外,我们不都也较喜欢避免或尽量减少重复练习吗?
没错,有些肢体技巧当然需要重复练习,因为肌肉的「学习」速度很慢,必须不断重复动作,这些动作才变得容易。
虽然如此,设计完美的塑形计划确实可以让练习次数减到最少,让每次的练习都有实际成效,大幅加速训练进展。
对于运动、音乐演奏或其他发挥创造力的工作,你可能期盼能有水准一致的演出,
也可能希望自己或自己训练的人尽可能展现最精彩的表演,
正确运用塑形法是不可或缺的关键。
方法重要 原则更重要
塑形法分为两个层面:
「方法」——一个阶段发展出来的行为和发展出这些行为的步骤,
及
「原则」——行为被增强的理由、增强方式及时间点的依循原则。
若你有兴趣学习某项技能(或技巧),我极力鼓励你尽可能找出训练这项技能(或技巧)的所有方法——你可以透过书籍、老师和教练,或者去观察研究他人。
不过,千万不要忽略塑形法的「原则」层面,有效训练不只要用好方法,更要用好的塑形技巧才是。
依照原则控制何时提高要求、何时放松要求、如何以最有效的方式提高增强标准、遇到困难时如何解决,最重要的一点或许是合适应该停止训练,这些问题一般都由训练者或教练直觉和经验判断、随机去做或完全靠运气。
然而能否成功运用这些原则,变成了「教学胜任」与「教学优越」,也是塑形过程令人愉快、迅速且成功或令人沮丧、缓慢且无聊的差异。
好的,本次分享就到这里,对内容想要展开更多讨论的同学可以留言或者发邮件给我,我会在后期的节目里更新和分享。
大家下周不见不散。
-
大家好,我是陈德文。
今天我们继续《别毙了那只狗》这本书的分享。
这一趴的课题比较有意思,讲的是如何破除「万事开头难」
我们说,除了变化性增强时制外,我们还可以采用「固定增强时制」(fixed schedules reinforcements),这意味着受训者必须在固定时间内持续某项行为,或者必须完成预定次数的行为之后,才能获得增强。
固定增强时制的问题是,连续行为中较早出现的行为往往得不到增强,于是会变得越来越马虎,过得去就好。
固定增强时制的缩减效应或许是影响许多人类工作的一项重要因素,以工厂装备线为例,
人们通常必须工作一段固定时间才能获得增强,与工作表现优劣无关,人们当然只想尽量少花力气,只要足以让他们待下来就好。
而且每次刚开始工作时的表现可能会特别糟。
无论采取变化性或固定增强时制,都足以训练出一长串的连续行为,人类也有许多久候增强的例子。
间隔极长的增强时制有时候会因为超过极限而失效。
小鸡的忍受极限与代谢有关,如果小鸡花在啄东西的能量高于一粒玉米提供的能量时,啄东西的行为通常会消失,因为做这件事所获的的好处太少,变得不值得做。
这种情形当然也常发生在人类身上。
要克服延迟启动的现象有一个方法:在行为刚开始时即给予一些增强物。
第二趴是关于 迷信行为:意外的增强效果
现实生活中无时无刻都会出现增强,而通常都是碰巧发生的。
如果你在垃圾桶里刚好捡到几张百元大钞,我相信你在隔天经过这个垃圾桶的时候肯定会仔细往里面再瞧一瞧。
这里我回忆到自己的迷信行为:因为有一次在大雨中跑步跑出了PB,每次遇到下雨天训练的时候,都很期待自己会跑出破个人记录的情况。
这个行为就是「迷信行为」。
还有一些例子,我们举一个来说,咬铅笔行为,如果考试时把铅笔放到嘴里,正好此时想到了正确答案或好灵感,于是咬铅笔的行为即受到了增强。
人们出任要务时会穿上特定衣服或进行某套仪式感也是出于同理。
这些反应常被意外增强是受到制约的,例如,动物训练时可能出现它似乎必须呆在某处、面朝特定方向或出现特定坐姿时才能获得增强的样子。
当你要它换地方训练或朝另一个方向时,他的行为却难以理解的突然做不好了,想找出原因可能得花一些功夫,因此聪明的做法是,在行为上完成了部分训练之后,随即在进行训练时变化所有你不认为重要的情境变数,以免发展出一些日后可能成为阻碍的意外制约行为。
许多传统动物训练师的想法及行为也都充斥着迷信,他们有些人会说,海豚比较喜欢白色衣服的人,骡子一定非揍不可,熊不喜欢女性等等。
而「训练」人类的人可能也一样糟糕,例如他们可能相信小学五年级的孩子一定得大声责骂不可。
这类训练师受到传统的摆布,训练时每次都必须按照完全相同的步骤,因为他们无法区分哪些方法有效、哪些是迷信。
这种无能或混淆常见于多种专业领域——教育界、工程界、军中,特别是医疗领域,令人胆寒的是,极多用于病人身上的处理程序并不具疗效,他们存粹只是沿袭或实验的做法而已,任何住院过的患者随便都能想出六项不必要的程序,这些程序都是迷信行为罢了。
有趣的是,单单向人之处迷信行为无效并不一定能使它消失,由于它受到强烈制约,人们可能因它而强烈辩护,如果攻击某位医生惯用的疗法无用或甚至有害,你一定会遭到猛然反击。
不过,我们仍然可以去除自己的迷信行为,方法是让自己明白它与获得增强物无关。
第三趴是 关于如何增强「自己」
增强式训练可以应用在自己身上,我们常忽略这个做法。
我们往往很容易对自己过于苛刻,一位牧师说过:「我们很少人为自己设下容易达成的低目标」。
于是我们经常连续多日忙碌无休,事情一件接着一件做,从不留意或感激自己。
事实上,除了改变习性或学习新技能时可以增强自己之外,每日生活的努力也应该获得一些增强,我认为缺乏增强物是导致焦虑和沮丧的因素。
你可以利用健康的方式来增强自己:给自己一小时的假散步去、和朋友聊天或读一本好书,或者也可以利用一些不健康的方式:抽烟、喝一杯威士忌、大吃一顿、通宵玩乐等等。
已故美国女演员罗斯·高登有个建议:「演员极需要赞美,如果我撑过一段没有赞美的日子,我就会自我赞美,它的效果一样很好,因为至少我知道这个赞美是真心诚意的。」
好的,本次分享就到这里,对内容想要展开更多讨论的同学可以留言或者发邮件给我,我会在后期的节目里更新和分享。
大家下周不见不散。
-
大家好,我是陈德文。
今天我们继续《别毙了那只狗》这本书的分享。
我们说,要让「不!」产生效果的诀窍在于必须让它称为制约负增强物(conditioned negative reinforcer)
举例来说,如果你觉得有必要使用收缩链,就应该在狗犯错的同时说出「不!」,
然后在拉扯链条之前先稍等一会儿,给它机会修正行为以避免处罚。
如果你只是直接拉扯链条但没有给予它警告,这个拉扯的动作就只是纯粹沦为处罚,将无可预期它对未来行为的影响,而且这个处罚的累积效应可能会影响狗子的工作欲望。
另一个常见错误是,当狗子回到位置上的时候继续猛扯链子,这使他的两个行为都受到处罚。
如果纠正式训练方法缺乏了制约负增强物,实际用到厌恶刺激的机会将会增加,也将使学习速度变慢。
有时候传统训练师为了获得可靠稳定的行为,必须比应用增强训练的训练师花费更多时间进行训练。
也许花上数个月,甚至数年以上。
这不只是他们所依赖的处罚会使行为消失,也因为他们使用的处罚缺少了制约负增强物,必须重复训练数百遍之后,动物才能归纳出他们应该出现的行为。
还有一种特殊的「制约负增强物」,我们称其为「无奖励标定讯号」,通常是以平淡的语气说出「错」。概念是,当狗子表现出不同的行为,试图猜测你想要什么时。
你可以利用这个来作为「那个行为不会得到增强」的讯号,以此告诉狗子,哪些行为没有用。
要让这个方法有效,是有一定使用限制的。
也就是训练对象在过去有接受过获得响片,而产生了行为变化或主动尝试新行为时获得增强的经验。
简单来说是,如果训练对象没有经验,这样的方法是很难奏效的。
第二趴 关于「无法预料的奖励」更具吸引力
有个广为流传的错误观念是「当开始以正增强训练某个行为时,便必须在训练对象的余生里一直使用正增强物,如果不这么做,这个行为将会消失。」
这个说法并不正确,事实上只有在「学习」的阶段才需要持续使用增强物。
在教会小朋友使用马桶的行为之前可以经常称赞小朋友,但是当小朋友完成了这个行为的学习,这个行为本身将自行获得增强。
我们应该经常给予初学者增强物,例如教小朋友骑自行车时可能需要不断告诉他「那就对了,现在骑稳,你做到了,很好」
如果当小朋友已经学会骑车,你却依旧不断称赞他,这时候你就很蠢了(小朋友也会以为你是不是不太正常)。
为了使「学成的行为」维持一定的可靠度,非但没有必要每次都增强这个行为,而极为重要的是——「不可以经常增强这个行为,而要改成偶尔增强,而且是随机性(无法预测)的增强。」
心理学家称这个增强方式为「变化增强时制」(variable schedule of reinforcement),它维持行为的效果比起持续性、可预测的增强方式要好。
利用变化性增强时制可以塑造较佳的表现。
变化性增强时制的威力正是赌博的本质,要是每次投一块硬币到老虎机里,就会有十块硬币掉出来,很快就会让玩家丧失兴趣。
虽然你的钱会越来越多,但是这种方式是在很无趣。
人们之所以爱玩老虎机,正是因为他们无法预料将出现什么:可能空空如也、可能掉下一些钱,也可能掉下很多钱。
我们不在这里讨论为什么有些人会沉迷赌博,而有些人能够拍拍袖子走人,不过对于那些好赌成瘾的人来说,变化性增强的作用就是让他们上瘾的原因。
变化性增强出现的时间间隔越长,它所维持行为的效果就越强,不过如果你想设法消除某项行为,吧时间间隔拉长的变化性增强就对你很不利。
所有未获增强的行为都有自行消失的倾向,但是如果它不时获得增强,尽管只是偶发事件——抽根烟、喝杯酒或者对不断唠叨或哀求的人稍作让步。
这个行为不仅不会消失,事实上它可能反而被这种间隔拉长的变化性增强时制维持的更好。
这就是为什么已经戒烟的人若偶尔偷偷抽根烟,在一天内即可能又变回大烟枪。
我们都看过一些遭配偶或情人施虐的人,难以理解他们为何依然留在这些人身边,这种爱上恶劣、毫不体贴、自私甚至很残忍的人缺执迷不悔的情况。
传统以为只发生于女性,但实际上这也发生于男性。大家都认识这类人,如果他们以离婚或其他方式离开恶劣的另一半,他们旋即又会找到同类型的对象来重蹈覆辙。
这些长期称为受害者的人是否具有严重的心理问题呢?有这可能,不过他们也可能是长时间变化性增强时制的受害者。
当你刚开始与对方交往时,认为对方迷人、性感、风趣又无微不至,即使这个人日后会逐渐变得难以相处,甚至施暴,但偶尔还是会对你展现好的一面,即使获得这些美好增强物的时光变得越来越罕见,它却成了你的人生寄托。
从常理来看,这个似乎是十分反常的现象,但是从训练观点的角度来看,却显而易见:这些美好时光出现的越少、越无可预测,它的增强作用越强大,而且你的基本行为也将会越持久。
此外,也不难理解为什么曾经有过这类关系的人会再度寻求同类对象,因为他们与和善正派的人交往时,可能就是少了那种增强物极少出现、令人可盼、因而增强效果加倍所带来的快感。
从操纵者的角度来说,想任意操纵某个人,并且让他随时言听计从,只要偶尔给他他想要的东西,就可以达到目的了。
好的,本次分享就到这里,对内容想要展开更多讨论的同学可以留言或者发邮件给我,我会在后期的节目里更新和分享。
大家下周不见不散。
-
大家好,我是陈德文。
今天我们继续《别毙了那只狗》这本书的分享。
第一趴是「响片训练」
海洋哺乳动物训练师通常以哨音作为制约增强物,用来训练鲸豚、海豹和北极熊。
响片训练者使用响片除了是制约增强物,以及介于「赚取」和「实际获得」食物之间的刺激外,他还有多种未获研究的功能。
首先,最重要的功能是奥登·林兹博士所称的「事件标定器」作用,响片让训练对象明确知道被增强的行为是什么,它甚至把主控权交到训练对象的身上,过了一阵子之后训练对象不再只是重复行为,而是显露意愿:「嘿,我让你按下响片了!你看看!我再做一次!」
响片训练者把这种转变称为「灯泡亮了」,比喻浑然开窍、豁然开朗的时刻,不管对训练者或训练对象都有极大的增强效果。
响片训练者使用的制约增强物也是一个代表「完毕了」的终结讯号,诚如需训练师盖瑞·威尔克斯所言:「响片终结了行为」。
第二趴,分享的是关于增强「继续加油」的行为。
当受训者在搜寻目标物,但尚未找到时,响片声并不是作为一个终结讯号,而是一个「继续加油」的讯号,由于受训者尚未发现目标物件,响片的适时出现不但是增强了寻找的行为,也让受训者继续出现搜寻的行为。
我们可以多次使用制约增强物但不给予真正的增强物,直到最后再给予即可。
之所以这样说,是有时候在训练海豚时,出现长时性行为,或连锁行为时会这么做,实际上使用了至少两种的制约增强物或标定讯号:一种是正常音量的哨音,代表「这就对了!食物随后就到,过去那边取食,完毕了!」
另一种则是较轻的哨音,代表「这就对了,但是还没达到目标!」
我们必须强调,唯有遵循「按一次响片,给一次零食」的通则才能教会人们如何塑造行为。
在许多现实状况中,有些「过渡性的增强刺激」可能非常好用。
另择一个增强刺激,并籍由这个刺激告知训练对象「那就对了,继续加油!」是个解决办法。
「继续加油!」的讯号并不需要直接连结初级增强物,只要在响片终结声出现之前插入这个讯号即可,学习者很快就可以理解到,它只是一个引领至最终增强物的讯号。
接下来你便可以好好运用这个「过渡性增强刺激」,在连锁行为当中利用它作为蕴含讯息的标定讯号,不必让进行中的行为停下来。
举例来说,我们在B站有看过狗狗的敏捷赛,狗儿进行障碍竞速,主任必须在狗儿迅速移动之下指示它下一个障碍是什么,曾见过狗儿在达成某项障碍后,表现出不知所措的样子,仿佛没听清楚指示,不知道该穿入隧道还是跨栏,它的头在两项障碍之间来回摆动着,当狗儿超跨栏望过去,主人大喊「没错!」时,狗儿才立刻跑向正确的障碍项目。
如同最终才出现的响片声一样,这种过渡性的讯号可以时任何刺激(响片、哨音、大喊一声或挥一下手),但要注意的是,这个刺激并不能只是怀抱希望的鼓励或加油打气(这么做很可能使动物分心或不小心增强其他行为),它也必须是一种意义明确、精确使用的制约增强物。
第三趴的内容会比较复杂,也比较难掌握和领悟,这里说的是「习得厌恶增刺激」
及时发出的「习得正面讯号」是告知接受者「你现在的行为很好,将为你带来好处,所以多出现这个行为吧!」
而你也可以建立「习得厌恶刺激」(conditioned aversive singals),或称为「处罚物」(punisher),它告诉接受者的讯息是「你现在的行为不好,你要是不停止这个行为的话,不好的事就会发生。」
对一些动物来说,习得厌恶刺激毙威胁更有效。
我们举例来说,还是猫咪,猫咪对大喊大叫与责骂没有反应。
不过有一个例子和大家分享,就是某次意外事件治好了猫咪爱抓沙发的毛病,结论是人喊出的「不!」字,成为了习得厌恶刺激。
有一天,主人在厨房里失手掉落一个铸铜的大托盘,正好掉在猫咪身旁,这里有个很关键的讯息,大家要仔细听:
当托盘掉下时,主人大喊了「不!」,下一秒托盘即落地发出巨响!
猫咪被吓得跳起来,全身毛都竖了起来。
之后当猫咪抓沙发时,主人一喊「不!」猫咪便看来一副惊吓样,立即停止动作,在重复两次之后抓沙发的这个行为就永久消失了。
训斥是生活中必要存在的一部分,以正增强为教导的主要工具,这并不代表必要时不能说「不!」(例如幼儿拿东西戳入插座时),然而一些训练者拿这种现实状况为例
他们认为,无论什么状况,教导时经常做「纠正」是很合理的。
事实上他们犯了两个错:
第一、他们似乎认为纠正的好处和正增强一样多,却没考虑到它对学习者产生的其他影响,这块我们会在后面的内容里分析。
第二、他们使用训斥和处罚,但并未建立警告讯号(习得厌恶刺激)。
好的,本次分享就到这里,对内容想要展开更多讨论的同学可以留言或者发邮件给我,我会在后期的节目里更新和分享。
大家下周不见不散。
-
大家好,我是陈德文。
今天我们继续《别毙了那只狗》这本书的分享。
分享的第一趴是 关于「增强物的大小」
刚开始利用食物来增强的训练新手通常搞不清楚食物增强物应该多大。
答案是尽可能的越小越好,增强物越小,动物能越快吃掉它,不但可以减少训练者等待的时间,而且每次练习时还可以增加增强物的使用次数,不会让动物一下子就吃饱吃腻了。
一般来说,一小口增强物就足以让动物保持兴趣,对鸡而言是一两粒玉米,对猫来说是半公分的小肉块,对大象则是半颗苹果,如果是特别喜爱的食物,份量甚至可以更少。
行为的难易程度也与增强物的大小有关。
至于人类,增强物的大小虽然没有一定的规律,但是有时候工作越艰难,报酬将越大,如果我们完成了艰难工作却未获得相对报酬时,我们肯定痛恨不已。
我要分享的第二趴 是关于 「意外的「大奖」」
「大奖」Jackpots 是一个对动物或人类都极为有效的技巧。大奖指的是非常大的增强物,甚至可能比平常大上十倍,而且训练对象没有料到它会出现。
大奖也可以用来标定「突破性的意外进步」。
比如当年轻的马儿首度完成一项困难动作时,训练员随即从马背上跃下,除去马鞍和马勒,然后放它在场里任意奔跑——给予完全的自由便是一个大奖,而这么做似乎把新行为保留下来。
遇到动物不听话、害怕或抗拒而完全不出现好的行为时,偶尔给一次大奖也可能改善动物的反应。
第三趴的内容会比较关键,说的是「制约增强物」。
当动物出现你希望鼓励的行为时,你可能根本无法立刻给予增强物,尤其是使用食物增强时更是如此。
以训练海豚跳跃为例,当他跃入空中时,我不可能马上拿条鱼喂它,这么一来,每次奖励他跳跃而赏他鱼吃的时间势必延误。
但事实上,久而久之海豚终究还是会把跳跃动作和吃鱼联想在一块儿,于是跳跃动作还是会增加,只是关键在于它无法得知我到底是喜欢它跳跃的哪一点,是高度?还是水花四溅的入水动作?于是它必须跳跃许多次,才能找到我心中期望的跳跃动作是什么。
遇到这种情况时,我们便可以利用「制约增强物」(conditioned reinforcers)。
「制约增强物」是指原本不具意义的信号(可能是声音、光线或动作),刻意让它在增强物出现之前或期间出现。
学校老师常使用「那个很不错哟!」和「非常好!」等具有形式意义且谨慎运用的赞美也出于此里,学童总是会迫不及待把事情做完,等着听到这些赞美。
讲求实效的正增强动物训练几乎都应该先从建立制约增强物开始,在正式展开训练前,趁动物尚未刻意出现行为,先教导它们制约增强物的重要性。
做法是让这个「制约增强物」与食物、拍抚或其他真正的增强物产生连结,随后你可以在动物身上看出他们是否已经理解这是你示意「很好!」的讯号,通常他们接收到制约增强物时会出现停格一下的反应,然后开始寻找真正的增强物。
有了制约增强物,你将拥有一个能够真正与动物沟通的方式,告知它你到底喜欢它哪一点行为。
人类当然也会为了钱不停工作,说穿了「钱」就是一种制约增强物,是用来买东西的代换品,而钱赚得根本花不完的人甚至特别爱赚钱,他们对这个制约增强物已沉迷的无法自拔。
可以连结到多种初级增强物的制约增强物将更具威力。
我家里猫咪听见「好乖!」时,就会看见晚餐出现、被人拍抚、得以进出门口或领取表演把戏的奖赏,于是我现在便可以轻易利用「好乖」增强他们跳下餐桌的行为,而不必给予真正的增强物。
然而金钱之所以具备极大增强作用,或许正是因为它几乎可以与所有东西连结,是一种连结甚广的制约增强物。
制约增强物一旦建立起来了,便必须谨慎的使用它,以免减低了它的效用。
我们应该给予子女(配偶、父母、情人或朋友)很多的爱与关注,不需要在他们出现特定行为时才给予,但我们确实应该慎用赞美,把赞美当成制约增强物,实际出现好行为时才赞美。
即便是幼童,人们对于虚情假意或无意义的赞美都会很快感到厌恶,因而不再具有任何增强作用。
本节完。 -
运动员或舞者在受训时教练喊出「对」或者「很好」,可立即标定当下的正确动作,给予对方确切需要的讯息。
若等到回到更衣室才进行事后检讨,则无法产生作用。增强时机过晚是训练选手最大的问题。
我们说训练时机过往是刚入这个行当的新手或者说教练最大的问题,因为他不敢在短时间,或者说我们说在「当下」指出问题,这样子会使得整个训练效果得到比较大的一个打折。
举个例子,当然我们家的小狗坐下来,主人说出「好乖」时,它正好又回到了站姿。那这么一来,究竟哪个行为会被「好乖」这个词所增强呢?是站着的行为还是坐下的行为?大家想一想,是哪一个?是站着的行为。为什么?因为狗狗在出现站回去的这个状态的时候,它同时听到了「好乖」两个字,那它被增强的是站回去的行为。
每当你发现训练出现问题时,第一个该问自己的问题便是「增强时机是否太晚」,这是一个非常关键的问题。
如果你在训练某人或动物忙得无法分心留意,这时请人帮忙观察,看看自己增强的时机是否太迟,将会有很大的帮助。
当你发现训练出现问题时,第一个该问自己的问题便是「增强时机是否太晚?」比如说你在训练某人或动物时,忙的无法分心留意,这时请人帮忙观察,看看自己增强的时机是否太迟,将会有很大帮助。
我们通常在增强他人的时机往往会太晚。
比如说我们举一个很有意思的关于「赞美太太」的方法,我们说这句话叫「做亲爱的,你昨天看起来美极了。」这句话与当下即时的赞美差别非常大,迟来的增强甚至可能得到适得其反的效果。太太可能会想「怎么?我现在难道不美吗?」
然而对这个对于「为时已晚的补偿的话」,我们却常常寄予厚望,这是一个很大的误区。
我们说过早的给予增强,也可能没有效率。
家长有时也会误以为自己是鼓励小孩,事实上却太早给予增强物。比如说家长有时候会说「好孩子就是这样,你几乎做对了」,因而可能增强了「努力的行为」。
我们说这句话「你几乎做对了」,可能增强了「努力的行为」。
努力去做某事和实际做到某事是不同的。
具体我们来拆解一下。因为小朋友他没有达成这件事,他只是出现了一个努力去达成这件事的一个行为。
但这时候你给予了一个增强的操作,小朋友收到的收获是什么呢?
我们首先得区分努力去做某事和实际做到某事,这两个是截然不同的一个性质和状态。
这个大家可以理解。
做到某事和努力做某事是两个截然不同的状态。
有时候小朋友会哭喊着「我做不到,我做不到」,或许是事实,但是他也可能是「努力行为」受到过度增强的症状。
一般而言,在行为出现前就给予礼物、承诺、赞美或任何东西,完全无法增强这项行为。
因为受到增强的是在增强物出现当下的行为,这是一个很关键的逻辑。
在增强物出现当下,他做了什么样的行为,这个行为被增强了,也最可能是要求增强物的行为。
进行负增强物训练的时机点也很重要。
我们以一些常见的例子来举例,这些是我们在这个日常生活中会经常遇到的。
比如说经常遭父母、老板或老师唠叨责骂的人,负增强物在期望结果达成时,如果没有立即消失,它们将不会有增强作用,也不会传达任何讯息。
唠叨责骂不但只是成为名符其实的噪音,还成为信息论中的「噪音」。
我们回忆一些关于足球和棒球电视转播的这个回顾,在做一些足球和伴球赛事转播的实况回顾时,会发现球员被增强的时机点总是准确无误,这是一个令人印象深刻的事。
我们说比如说球员在跨越本累达正时的欢呼,这些球员在跨过本类达阵时,观众立即爆发出欢呼声和掌声,而且一旦得分或确定输赢,仔细看那些球员之间的热烈的增强动作。
那我们说一说歌剧演员,他们即使是在舞台剧上演出,仍然需要等到谢幕的时候才能获得掌声,那电影演员就更特殊了,他除了偶尔得到导演、摄影师或者工作人员的回应之外,他们获得的增强全部都错过了时机。
影迷信件、好的影评甚至需要在数周或好几个月之后才出现。那这样子相比与棒球选手、足球选手的轰天动地的这种欢呼的情形来比,会显得逊色而且无趣。
那以至于这些电影演员的工作看起来可能特别没有成就感,即使有很不错的增强物,但获得的时机总是太迟。
那也难怪我们以此来分析,一些明星他会近乎病态的喜欢阿谀奉承和追求刺激,因为他们得到这个增强物的时机实在是太晚了。 -
第一部分 比奖励更有效的增强原则。
正增强物是什么?
这里有一个关于增强物的概念,所谓增强物指的是任何与某项行为共同出现,通常会增加该行为发生频率的事物。
请大家牢记它是优质训练的秘诀。
增强可以分为两种,一种我们称为「正增强物」和另外一种「负增强物」。
正增强物指训练对象希望获得的事物,如食物、抚摸或称赞。
而负增强物则指训练对象希望走避的事物,比如猛击、皱眉的表情或不悦耳的声音。如上车后没有系紧安全带时一直逼逼作响的告警声,这就是一种负增墙物。
我们说只要是原本就会出现的行为,无论他多么罕见,都可以利用「正增强」加强这个行为。
增强是训练最根本的原则,是针对行为给予正增强。
那这里我们举一个例子,这里案例是一个喜欢打网球的球员,他是一个业余爱好者。
他告诉我,他最初的时候觉得自己是一个大傻瓜,因为每次打了好球就会对自己说「干得好,还真有你的」。那如果他只有自己一个人在练习的时候,他甚至会拍拍自己的背。后来,他发现自己打得越来越好,在网球俱乐部的排名比以前提升了。甚至把过去一些很难抢分的对手打得七零八落,而且自己也获得了更多的乐趣。自己不会再大骂自己,赛后也不会因为落败而觉得生气或失望。
一个坏球没有那么好在意的,之后就能打出好球。
他会发现自己最爱看到对手因为犯错生气扔球拍,因为他知道这些举动对球赛没有任何帮助,所以自己只要微笑就好了。
那我们回到增强物,增强物的性质是相对的,而不是绝对的。就比如说下雨,对鸭子来说是正增强物,你对猫来说却是负增强,那对牛来说则无关紧要。
一旦吃饱之后,食物将不再是正增强物。
所以说我们总结一下,为了达到增强的效果,增强物必须是对方想要的东西。
无论任何训练情况,有多种可供选择的增强物,会对训练师或教练提供很大的帮助。
那我们说哪一些是负增强?
我们说增强物是增加行为发生的频率,但它不一定都是学习者想要的东西,避免不喜欢的东西也可能是一种增强。
实验室的研究显示,如果改变行为可以让厌恶刺激消失,这个厌恶刺激即可增加该行为发生的频率,这类刺激就称为负增强物,一种人或动物会去设法避免的刺激。
负增强物可能是极其轻微的一种厌恶刺激。
例如讲冷笑话的时候,朋友不屑地瞥了你一眼,或冷空气送过来一阵凉风,让你起来换个位置。而剧烈的厌恶刺激例如公开侮辱或电击,除了可以当做处罚以外,也可以拿来作为负增强物。
我们被老板责骂的经验或许极具处罚性质,但是我们很快便学会,当爱骂人的老板出现在前门时,我们就从后门溜进公司上班。
负增强物指的是径由行为改变即能停止或避免的厌恶刺激。只要新行为一出现,厌恶刺激立即停止出现,因而强化了新行为。
我们这要怎么理解?就回到那个安全带的例子。如果你坐在车上没有系紧安全带的情况下,那个厌恶刺激的哔哔的声音会一直出现。一直出现,我们说一直出现,它不会停下来。
但新的行为,就是驾驶者或者说乘客把安全带扣,插上指定的位置之后,这个厌恶刺激立即停止。
一旦这种刺激和行为出现的频率越来越高,它将促使,就是所有的乘客和驾驶员一进车首先系紧安全带,会出现这样子的一个新的行为。
负增强并不等同于处罚,两者的差别究竟在哪里呢?处罚是指「在意图改变的行为发生后,才产生的厌恶刺激」,对该行为可能毫无影响。
没有人知道成绩不佳被修理的男孩将来成绩会不会变好,但是他绝对不可能改变这张已经带回家的成绩单。
当我们怀着意图进行处罚时,我们通常已经错过时机太久。
不过这还不是处罚和负增强最根本不同的地方。
现代行为分析学者把「任何停止行为的事件」都视作「处罚」。
幼儿把发夹插入电插座时,妈妈用力一抓,把她的手“啪”打开,这个行为停止了,但是其他事情可能开始发生,幼儿开始哭,妈妈感到愧疚等等。
不过我们说把发夹插入插座的这个行为确实消失了,至少当时如此,这就是处罚的作用。
心理学家是史金纳博士更明确的定义处罚,处罚可以是“某项行为导致喜欢的事物消失的过程」,或者也可以是「某项行为导致不喜欢的事物发生的过程」。不论是哪种定义,处罚也许让当下发生的行为停止了,但是没有人可以预料以后发生什么后果。
行为分析学者认为,增强或处罚都是一个由后果定义的过程。
负增强物可以拿来进行有效训练,尽管使用厌恶刺激训练过程仍然可能相当无害。
我们说,虽然副增强很有效,但请牢记每次使用负增强时,同时也使用了处罚。
抓准增强物出现的时间点,增强物必须和想改变的行为一起出现。
我们在之前已经说过,增强物必须和想改变的行为一起出现。增强物出现的时间点本身就是讯息。
它告诉学习者你喜欢的行为究竟是什么。当动物试图学习的当下,增强物想传达的讯息会比增强物本身更重要。 -
那么我们说什么是好的训练?
它其实是一个回路,是双向性的沟通。在回路的某端所发生的事件将改变另一端的事件,这和神经机械回馈系统(cybernetics feedback loop system)完全一样。
然而许多心理学家把研究当成「他们对动物所做的事」,而非一起做的事。
对于真正的训练师来说,最引人兴慰的是,每只动物出人意料的独特反应,而且它可能是训练过程中最具成效的事件。
可惜的是,几乎所有实验性研究都刻意降低或忽略个体化反应。
史金纳博士所谓的「塑形法」是一个行为逐渐改变的过程,设计及执行这个训练方法是一种运用想象力的过程。
然而心理学文献中多的是缺乏想象力的塑形研究,所以我们不在这里提他们的笨拙设计。
我们也发现,近期增强训练的原则正逐渐渗入我们的普遍认知当中。
好莱坞电影的动物训练师称「正增强」为「博感情训练法」,他们利用这些技巧训练成一些无法以暴力胁迫达成的行为。例如在《我不笨,所以我有话要说》这个电影中,小猪和其他动物出现的许多行为。
现今有许多奥运教练也在利用正增强和塑型方法训练,而非依赖于传统的威吓方法,他们同样可以获得显著的进步表现。
增强式训练无法解决所有的问题。
我们首先要承认,科学化训练一定有它的边界,它无法让你的这个银行账户里的钱变多,也无法挽救不良的婚姻,它也无法逆转严重的人格问题。
有些情况,例如婴儿哭闹并不属于训练问题,它需要运用一些其他的办法解决。
有些行为无论是动物或人类具有遗传天性的成分,要以训练改变或许很难或不可能,有些问题不值得花时间训练。
但是对于许多生活中的挑战任务或烦人之事,正确运用增强可以有所助益。
曾经有一名海豚研究学者,他曾经说过这样一段话,「没有训练过鸡的人应该规定他们不可以生孩子」。
我们说鸡这种它这种动物它无法接受暴力。意思是人在训练过鸡这种无法接受暴力的动物而获得成效时,这种经验将明白显示,你并不需要惩罚小孩也能获得成效。而且这种经验应该会让你有点概念,了解如何增强你喜见的小朋友的行为。
这本书它并不保证你的子女也能像训练海豚一样乖巧。实际上这本书并不保证任何结果或者技巧,它所能给你的是所有训练的基本原则,并且给你一些指导方针,教你如何在各种情况下灵活运用这些原则。
它或许能够让你除去苦恼多年的情况,或者能够使停顿不前的状况豁然开朗。如果你希望的话,你当然也可以利用它去训练鸡。 -
增强式训练并非是「奖励」和「处罚」的系统——总的来说,现代训练师根本不使用这些字眼,奖励和处罚的概念隐含极多与情绪相关的联想和解读,诸如渴望、害怕、罪恶感、「应该」如何和「理当」怎样等。
本书主要谈到训练,对象无论是人类或是动物、年幼或年老、自己或他人,如何运用方法使他们做出能力所及的事或应该做的事。
如何让猫咪不上餐桌或让祖母别再对你唠叨?
如何改变你家宠物、孩子老板或朋友的行为?
如何改善你的网球动作、跑步表现、算术能力或记忆?
这些全部都可以利用「增强」的训练原则达成。
这些原则是不变的定律,如同物理定律,所有的学习及教导必定依据这些原则,犹如苹果必定依据重力定律往下掉落,每当我们试图改变行为,无论对象是自己或他人,我们都运用这些原则,虽然我们不一定知道自己正这么做。
训练原理就是学习理论(learning theory),出自心理学大师史金纳博士引领的操作制约行为研究,尔后由史金纳博士的学生及其他人发扬光大,发展应用到各类动物训练以及人类教育上。
心领神会、熟能生巧之后,运用之妙,则存乎训练者之心。
书中所谓的「训练」,说得直接一点应该是「改变行为的方法」。
训练实例不只是马、狗、猫、小鸟和海豚等动物,「人」也包括在训练对象之内,小孩、朋友、媳妇、公婆都成了书中举例可以籍由训练改变行为的对象,所以这不是单纯的猫狗训练书,这是一本改变行为的书,举凡养育子女,夫妻相处、侍奉公婆都该阅读此书。
史金纳博士的行为主义,强调环境条件与事件对行为改变的影响,焦点在对学习行为的安排,其操作制约学习原理提出的假设指出:学习是一种行为,行为的变化是环境事件和条件的函数,且可由反应频率表示;学习的要素是由区别性刺激所产生的反应而增强刺激,这些内容正是当今学习行为学主流的学说。
处罚其实只是报复,然而我们却认为处罚是种教育方式,人们容易称这种做法为“给对方一个教训”。
现代的增强式训练不以这种通俗做法作为基础,它是根据行为科学而来,依科学上的说法,“增强”出现在行为发生期间或行为达成时,并会增加再出现的可能性。
达成增强有两个要点:行为与增强两个事件,在时间上必须有关联性,当“行为”引起“增强”时,这个行为发生的频率即增加。
用来增强的东西(增强物)可能是正面的,它是学习者喜欢并且希望要更多的东西,例如微笑或轻拍一下的鼓励方式;但它也可能是负面的,也就是学习者想避开的东西,例如猛扯一下牵绳或皱眉。
但增强原理中,最为重要的是“时间关联性”,行为发生,接着出现增强物,日后带来良好后果或避免不良后果的行为便经常发生。
事实上,这个增强物的定义犹如回馈回路,反向推演亦能成立,如果行为频率没有增加,那么若非增强物出现的时机过早或太迟,就是选用的增强物对行为者不具增强作用。
此外,我认为「增强原理」(科學原理)和「增强式训练」(該科學原理的实际运用)之間有個重要分野。
研究显示,行为发生后若出现好的后果,该行为将较常发生,这是事实,不过实际运用时,若训练者希望获得惊人成效,在行为发生的当时就必须立刻出现增强物:“做对了!就是现在这个动作!”就在当下瞬间。学习者必须知道当时的行为已经赢得奖励。