-7_在线阅读 - 必读网

　　拥抱桑代克颤抖的小猫从前面的介绍，你已经知道，我们做了什么事，就得到什么结果。
　　那是什么样的结果呢？我每个月都去工作，所以手里的工资条肯定对我有影响。
　　回到1911年，爱德华·桑代克创立了一个理论，叫做效果律，这个定律阐明，我们对结果的看法会影响我们的行为。
　　桑代克决定用猫做实验来研究这个现象。
　　他用木板和石板建了一个叫迷笼的箱子，门可以用一个特殊的装置打开。
　　他在箱子里放了一只饿猫，然后关上门，再在箱子外面的碟子里放些食物，猫可以通过箱子的空隙看到食物。
　　有点残忍，是吧？猫想穿过板子够食物，可是够不着。
　　唯一的方法是桑代克或者猫能把门打开。
　　我们知道桑代克是不会开门的；他在做实验。
　　猫必须自己想办法来把门打开。
　　不知道你有没有见过，反正我很少见过猫开门的样子。
　　它怎么办？有些悬念，是吧？我们题目中的主角英雄的猫会怎么做？它会打开门扑向刚刚还够不着的食物吗？或者它会因此命丧这位残忍的心理学家之手？且听下回分解……无论如何，这只猫必须自己想办法，桑代克也是个耐心的人。
　　他等啊瞧啊，等啊瞧啊。
　　猫在笼子里到处走动，伸出它的小爪子，喵呜喵呜，跳起来，又被墙弹回来，在箱子里无目的地尝试各种出去的方法。
　　但是，奇怪的事发生了。
　　猫无意中碰到了门闩，门奇迹般地开了！哇！猫有得吃了，大家皆大欢喜。
　　桑代克从他的实验中学到了什么？什么都没学到，实验还没有结束呢。
　　他把那只可怜的猫又放回笼子里，重新进行实验。
　　没问题，对吧？猫肯定知道怎么做——只需碰一下门闩即可。
　　但是当回到笼子里时，猫的行为就好像根本不知道必须要碰门闩才能开门。
　　它把刚才胡乱找出口的行为又进行了一遍。
　　别担心，因为我们忠实的小猫最终还是无意碰到了门闩，又一次受到奖赏，吃到了食物。
　　桑代克一次次地重复这个实验，做了大量的观察。
　　随着不断地尝试，小猫用来找出门闩是开门的关键这个结论所花的时间越来越短。
　　为什么它越来越快地发现解决问题的办法？桑代克说，食物帮助小猫找到了碰门闩和逃跑之间的联系。
　　桑代克的效果律表明，“如果一个动作跟随着情境中一个满意的变化，则该反应与情境之间的联结便加强，在类似的情境中这个动作重复的可能性将增加……满意度越高……联结越牢固。
[70]第70节：第四部分向正确的目标进攻(10)
”实际上，得到食物这个结果是学习开门的一个奖赏。
　　开门的行为就像我的工作，食物就好比我的工资。
　　我们回到最开始的问题上：我的工资是否对我有影响——我不停地工作，就像桑代克的猫不断地开门去获取食物一样。
　　因此，我行为的结果事实上导致我不断地出现相同的行为。
　　强化刺激下奔跑的老鼠当行为或者事件的结果使得行为或者事件出现的可能性增加，我们就把这个结果叫做强化刺激。
　　它就像奖赏，我们知道，当我们做了事情受到奖赏时，我们通常还会再做这样的事情，希望再次得到奖赏。
　　操作性条件反射讲的就是强化刺激对行为的影响。
　　斯金纳，最著名的行为主义心理学家之一，跟随桑代克的脚步，继续使用动物来研究操作性条件反射。
　　他做了一个箱子，里面有一根杆，称为斯金纳箱。
　　当动物压杆时，喂食者会把食物粒放到箱子里。
　　斯金纳想看看箱中的老鼠为了获取食物，能不能学会去压杆。
　　这个任务比想象的要困难很多。
　　老鼠不习惯压杆来获取食物。
　　为了促成这个结果，斯金纳不得不增加一个步骤，叫做塑造，用来奖励那些成功接近目标的行为。
　　对那些接近目标，但还没有达到预期的反应行为，斯金纳都给予食物奖励。
　　塑造过程有序地进行，这样老鼠就能最终到达按压杠杆、获取食物作为强化刺激的那一步。
　　当老鼠渐渐熟练后，它们就掌握了按压杠杆来获取食物的方法，这与桑代克的猫学习开门所用的方法一样。
　　不管出现什么样的行为，说明的是一个道理：老鼠学会了压杆的动作，是因为食物的奖赏“教”会了它们怎么去压杆。
　　桑代克的猫和斯金纳的老鼠的学习过程，都是因为它们受到了食物的奖赏。
　　食物对于动物是十分有力的奖赏，但食物只是一类强化刺激，任何能够增加行为再次出现的可能性的东西，都可以用来作为奖赏或者强化刺激。
　　食物，钱，休息或者假期都可以用做强化刺激。
　　强化物的类型有两种基本的强化物：正强化是使用强化物增加行为出现的可能性。
　　负强化减少不良刺激，增加正确行为出现的可能性。
　　操作性条件反射的基本观点是，经过强化（无论是正强化还是负强化）后，行为更可能再次出现。
　　但是所有的强化物都是这样吗？所有的强化物效果都一样吗？如果老鼠每次按压杠杆斯金纳都给它5美元，老鼠还能学会同样的反应吗？很可能不会。
　　强化物不同，对反应的影响也不同。
　　不是所有的东西都能达到奖赏或者强化的效果。
[71]第71节：第四部分向正确的目标进攻(11)
两种有效的正强化是：原强化物：无需塑造过程或者提前培训就能发挥作用的奖赏物。
　　可以是食物，也可以是愉悦的身体体验。
　　大卫·普里马克在1971年提出一个很有意思的观点，他说，观察人们大部分时间里所做的事情，就可以找出他的原强化物。
　　如果他们花很多时间看电视、骑自行车或者睡觉，这些活动就是他们的原强化物。
　　他的普里马克原则说明，可能性很高的反应可以用来强化可能性较低的反应，即高频的活动作为低频活动的强化物。
　　这就像用冰激凌来让孩子吃蔬菜。
　　如果他们想要冰激凌（高可能性的反应），他们就得吃蔬菜（低可能性的反应）。
　　次级强化物：是通过学习和经验得以强化的事物。
　　应用经典条件反射（见第8章）的原理，把次级强化物与原强化物相联系，同样可以出现期望的反应。
　　海豚训练员在给海豚喂鱼时吹响口哨。
　　最后，由于海豚把口哨和食物相联系，口哨可以单独作为强化物。
　　但是也有人提出质疑说，按照大卫·利波曼的观点，口哨只是一个信号，不能替代食物。
　　目前这个问题仍然没有定论。
　　当我们找出可以强化某人或者某事的事物时，我们就可以着手通过奖赏来影响对方，使其表现出期望的反应。
　　比如，一个办公室管理人员总是很难在午饭后让他的手下按时回来工作。
　　怎么办？首先，她得找出这群人或者每一个人的强化物。
　　然后，她要奖赏每一个达到她所期待的行为、能够按时回来工作的人，可以给他们小礼物、钱或者画着笑脸的贴纸。
　　我们先回到负强化上来。
　　很多人不明白这个问题。
　　拿走某种东西或者取消不良刺激如何能够增加行为出现的可能性？你家里是不是曾经有条小狗，你想睡觉，它却不停地嗥叫？如果你把它关在另一个屋子里或者车库里，因为它还是叫，所以你很可能还得再起来看看怎么回事。
　　当你看见它的时候，它不叫了。
　　然后你回去睡觉，但是我保证10分钟后你又被吵醒了。
　　出现这样的问题是因为你的行为是在负强化的控制之下。
　　狗叫是很可恶（很烦人）的刺激。
　　你去了车库，它就不叫了，这就增加了每次狗叫你就去车库的可能性。
　　你受到了负强化，不断地去车库——而你的狗则受到了正强化，不断地嗥叫。
　　谁在控制情境，你，还是狗？在办公室经理那个例子中，每次员工午餐后回去晚了老板都冲他们吼叫，他们可能为了不挨骂开始准时回去上班。
　　这也是一个负强化的例子。
[72]第72节：第四部分向正确的目标进攻(12)
强化的时机如果办公室经理一直等到年底公司圣诞节派对时，才强化员工按时工作的行为，那会怎么样？那些曾经不按时工作的事情都将被忘在脑后，只忙着接受圣诞礼物，这时候的强化没有丝毫效果。
　　格赖斯（G?R?Grice）和斯彭斯（K?W?Spence）指出，强化必须立即实施，或者尽快实施，才能收到期望的反应。
　　如果等得太久，反应和强化结果的联系就消失了。
　　如果桑代克给猫的奖赏是一张购物券，在下次游览猫粮大观时才能兑现，恐怕这只猫永远也不可能逃出那个迷笼。
　　坏老鼠！坏极了！正强化和负强化的结果都是增加某种行为的可能。
　　但是其他结果呢？比如惩罚？惩罚是要减少某种反应出现的可能性。
　　一种惩罚是直接的——引入某种令人厌恶或者反感的东西。
　　另一种惩罚，负惩罚，是减少某种强化，比如拿走孩子的自行车。
　　我们总是使用惩罚来影响人们的行为。
　　强化例子中的办公室经理也可以惩罚那些上班迟到的员工。
　　父母惩罚孩子，法院惩罚罪犯。
　　信用卡公司惩罚那些拖欠付款的人。
　　惩罚随处可见。
　　我知道很多人都使用惩罚。
　　我也知道人们总是批评刚为父母的人，说他们从不惩罚孩子的坏行为。
　　“那孩子缺顿好打。
　　”现代的父母有时候辩驳说惩罚不起作用。
　　是这样吗？惩罚事实上是一种非常有力的压制某种行为的方法，但是请记住几个原则。
　　惩罚应该是用尽可能强度最小的方式来促成期望出现的反应行为。
　　但是，惩罚不能够太轻，因为如果你想一点一点地增加强度，接受方可能会习惯、会适应，从而使每一次强度的增加都不起作用。
　　太大强度的惩罚也有问题。
　　为了让惩罚长期有效，你必须留出余地，逐渐增加强度。
　　为了使惩罚有效，惩罚必须及时，要尽可能在时间上与被惩罚的行为接近。
　　如果我等了三周才惩罚我的孩子打碎灯的行为，他们可能一头雾水，根本不知道我为什么惩罚他们。
　　这时，无论你怎么做，惩罚都不起作用。
　　惩罚应该坚定、坚持，并且在惩罚的同时要清楚地让对方知道惩罚的原因。
　　当然，为了改变自己的行为而给其他人带来折磨或者痛苦，很多人不喜欢这样的做法。
　　使用惩罚也有弊端：可能导致恐惧。
　　当惩罚对某些人产生了效果，他们可能会因为预料到将来的惩罚，从而产生严重的焦虑情绪，就像等着另一只鞋掉下来。
　　这有可能给他们的生活造成破坏性影响，有时导致逃避和冷漠。
[73]第73节：第四部分向正确的目标进攻(13)
攻击性是惩罚的另一个负面结果。
　　我在监狱和拘留所都工作过，我看到那里有人变得易怒，更具攻击性，甚至对监禁中所面对的严厉的管束感到恐惧。
　　当他们被释放，可以以新的面貌面对世界时，他们已经不能适应，变得非常刻板，常常不能从监狱过渡到外面的世界。
　　行为消失如果在成功地增加了行为出现的频率后，我突然撤销强化，会发生什么事？行为最终会消失，具体时间取决于之前强化的频率。
　　我保证如果不发工资，很可能用不了多长时间，我的工作行为就会停止。
　　这叫做消退，强化撤销后行为停止。
　　就像惩罚一样，消退也是一种方法，可以阻止行为再次发生。
　　第8章对消退有更多的介绍。
　　强化程序你有没有想过，为什么有些人一次次地到拉斯韦加斯或者亚特兰大这样的地方去花钱赌博？赌博的结果是，卡西诺赌场成了最大的赢家。
　　但人们就是不愿离开。
　　上次我在拉斯韦加斯时，在卡西诺价值数百万的别墅和度假村里过得非常愉快。
　　我猜我能有这样的享受，全是赌徒们的功劳。
　　人们禁不住再次回来是因为某种叫做强化程序的东西，一个时间表或者是一个定势——关于什么样的反应受到强化和在什么时间进行强化。
　　有四种不同的强化时间安排，每一种都可以对行为产生不同的效果。
　　固定时间间隔不固定时间间隔固定比率间隔不固定比率间隔最常见的强化形式是持续强化。
　　每一次行为出现时都进行强化。
　　每一次我拉动自动售卖机的把手，我就赢！我是这么期望的。
　　持续强化有助于塑造学习的过程，也对获得阶段有好处。
　　每次我学习一个新的行为，都要花一定的时间。
　　持续强化可以帮助我学得更快。
　　但是，持续强化的问题是，它消失得也快。
　　如果我们每次午饭后按时回去工作都受到强化，那么老板一旦停止强化，我就立即会恢复原来的行为。
　　但是，大部分的强化都是间断的、偶发的。
　　当然，我们不可能每次拉动自动售卖机的把手时都能有奖。
　　斯金纳没有设计过自动售卖机；卡西诺的行为主义心理学家洛瑟（B?A?Loser）设计了这种装置。
　　低频率的强化称作部分强化。
　　有两种部分强化程序，按照强化出现的可预见性或者偶然性，每一种部分强化程序又被进一步地分类。
　　第一种部分强化又称比率强化程序。
　　只在出现了特定数量的反应时才给予强化。
　　如果父母对孩子采用这种强化，可能是在孩子得了一定数量的A或者打扫房间达到一定的次数之后。
[74]第74节：第四部分向正确的目标进攻(14)
● 有时我们需要固定数量的反应，有时是不固定数量的反应，所以比率程序也有所不同。
　　固定比率的强化（见图91）总是在出现了固定数量的反应后给予强化。
　　如果我的孩子每得两个A就受到奖赏，而且永远不变，那么就是每两个A强化一次。
　　● 不固定比率的强化（见图92）不按照反应出现的次数进行。
　　可能这次孩子得了两个A我进行了强化，但是以后可能他得了一个A、三个A、十个A我才强化。
　　就是要让对方不断地猜却总也猜不到什么时候强化。
　　这种方法对行为的持续出现有很大效果。
　　因为对方不知道什么时候会有强化，所以会不停地表现出必要的行为。
　　比起持续强化，这种方法不易使行为消退。
　　图91
　　固定比率的强化是有规律可循的图92
　　不固定比率的强化是无规律可循的另一种部分强化程序叫“时间间隔强化程序”，通过间隔时间来实施强化。
　　● 我每月拿工资，什么时候拿有固定时间。
　　我的工资就是一个固定时间间隔强化程序（见图93），这个时间不会变。
　　● 另一种时间间隔强化程序叫不固定时间间隔强化程序（见图94）。
　　上次强化和这次强化的时间间隔不定。
　　可能月底发工资，也可能三周后发，或者其他时间。
　　这种强化也不易使行为消退，原因与不固定比率的强化一样。
　　接受者永远不知道什么时候会被强化，所以他会一直表现出期望的行为。
　　图93
　　固定时间间隔强化程序并不意味着强化是NEUTERED图94
　　不固定时间间隔强化程序中强化是变化着的不固定时间间隔强化正是赌博得以持续的原因。
　　卡西诺设计机器，让它不定时地给出奖赏，这样我们就不停地往里面投钱，希望得个大奖。
　　如果你不玩，就不可能赢。
　　所以你就想，下次该轮到你赢了，或者这次你一定赢，因为你已经守着这台机器三天了（不洗澡，不睡觉，甚至饭都不吃），但是，请记住它是没准的。
　　你永远不知道机器什么时候青睐你。
　　如果你放弃了，下一个坐下的人大大赢了一笔，你也别抱怨！这就是赌博。
　　避免对罚单的泛化你有没有注意到，当人们在高速路上看到骑警时会减速？很可能是因为他们都或多或少地从骑警那收到过罚款单。
　　但是，当看见一个称职的、年老的普通警察，他们会减速吗？没有人减速。
　　他们就当没看见。
　　这是在公开违法吗？不。
　　这是刺激控制的一个例子。
　　期望的行为是否出现，取决于刺激是否在强化或者惩罚的同时发挥作用。
　　虽然执法当局也会给超速者开罚单，但是我们大部分人都知道通常普通警察是不会在高速路上开罚单的。
　　这种刺激会导致不同的后果，对我们的行为的影响也不同。
　　只有骑警才实施惩罚。
　　有时，当我们在强化后学会了一种反应，我们可能会自动地把这种反应泛化到其他的类似刺激中。
　　如果我把骑警的罚单泛化到所有警察都会开超速罚单，那我可能每次遇到警察都会减速。
　　如果我们午饭后按时上班得到强化，我可能会泛化这种行为，早上也按时上班。
　　泛化帮助我们加速学习的过程，因为我们没有时间为每一次单个的行为去接受强化。
　　（关于泛化的更多内容，请查阅第8章）。
　　分化有时人们会过度地学习一个行为或者反应。
　　然后在不需要反应的时候，他们也会作出反应，因为他们已经把那个行为泛化得有点过头了。
　　我想有时这种事情会发生在心理治疗师身上。
　　当我们在一个社交场合，不是在上班，有人开始谈论他这一天有多糟。
　　心理治疗师脱口而出，“告诉我你的感受，”每个人都怀疑地看着心理治疗师，就像看着一个冒牌医生？他也许该去度假了。
　　我也在电影里看到过这样的现象。
　　原来做过警察的人，对他孙子拿水枪指着他有些反应过度，他把这个孩子拿下，才算“解除了威胁”。
　　这提出了一个分化的问题，只对一两个或者多个特定的刺激中的一个作出反应。
　　通过同时呈现两种刺激并且强化对正确刺激的反应，可以解决这个问题。
　　把祖父放在一个被劫持的情境中，然后把持水枪的孙子也混在情境中。
　　只有当这位爷爷侦探成功地解除了抢劫者（刺激1）的威胁并且没有逮捕孙子（刺激2）时才给予强化。
　　这样，他就学会了区分真正的威胁和根本不存在的威胁。未完待续~~~
--本部分结束--

首页上一页共7页

返回书籍页

TXT下载此书 | 书籍信息