心理学のお勉強

学習心理学

回避と罰


オペラント条件付けの頭で書いたように、「『これはやばいぞ!』という有害な刺激には、それを避けるような行動を得る」ことが生きていくうえではとっても大事です。

「回避行動 avoidance behavior」とはそのような行動のことで、定義的には、ある行動をすれば、嫌な出来事にあわずに済む行動のことを指します。具体的には、行動と有害な刺激の間に負の関係があるものがそれになりえます。例えば、車に乗ってて、事故にあわないようにするためには、スピードを落とすことが考えられます。

さて、そのためには、「車に乗って、スピードを上げすぎると、事故を起こす」という関係が頭に入ってないといけません。つまり、その行動と有害な刺激の間には正の関係がありますよ、というのがわかってないといけないのです。このようなもののことを「罰 punishment」といいます。

結果、回避は積極的な行動として学習され、罰は抑止的な行動として学習されることになります。まあ、当たり前ですね。嫌な気分になることからは逃げたくなるし、したくなくなる。そういうことです。

回避学習については、マウラーという人が「学習2過程説」というのを唱えています。これは、まず第1段階で、条件刺激(CS)−無条件刺激(US)というレスポンデント条件付けが起こり、これによって恐怖が条件付けられた上で、その次に、CS→恐怖→「恐怖状態を終わらせたい」という動機が生まれる→試行錯誤→正しい反応を身につける、という恐怖に基づくオペラント条件付けが起こるというもの。これに対してスキナーは、もっとシンプルに「負の強化が回避だ」と述べています。どっちか1つが正しい、とも言い切れないのが、難しいところ。

たとえば、CSがない「非弁別型回避学習」(別名、シドマン型回避学習)というのがあることがわかっています。これは、反応しない限りショックを与え続けるという条件の下、shock to shock(ショック間)が一定、response to shock(反応と刺激の間)も一定という実験をやってみると見られるもの。そんなに難しい実験ではありません。10秒ごとに0.2秒の刺激を与え、反応があったら、次の刺激までの間隔を30秒延長するといった具合の実験です。

ここで行われる回避学習というのは、その「延長する」というところを頭に入れ、そのタイミングごとに反応することで、刺激を受けないようにすることです。もちろんこれは、刺激はやだ、という恐怖からきている学習なので、恐怖を増したり、減らしたりするステップを入れると、反応が促進したり、減速したりすることが見られます。ここのポイントはCSがないこと。いきなり恐怖から、その行動が身につけられるわけです。

ということで、回避学習はスパッとひとつの方法によってなされているわけではなさそうだ、ということを押さえてください。

続いて、罰のお話をしましょう。罰というのは、なんでもかんでも、それがあればいいというものではありません。それが効果を発揮するためには、いくつかの条件があります。いくつか、リストアップしてみましょう。

1) 即時性…反応の直後に罰を与えること。
2) 強度…罰は強いものほど抑止力が大きい。
3) 強度の漸増…徐々に罰を強めるといった方策を採ると、馴化が起きるので、即座に適度な罰を与えることが望ましい。
4) 一貫性…罰するべき反応には必ず罰を与えること。
5) 弁別的罰…罰の効果を増すためには、弁別的手がかりは除け。
6) 行動の強さと動機付け…罰が同じ強さでも、罰せられる行動、動機が強固なら、罰の抑止効果は弱くなる。
7) 代替行動の有無…罰せられるべき行動に代わる行動を準備してあげると、罰の効果が強まる。
8) 罰そのものが正の強化の手がかりになっていてはいけない

例えば、快楽主義を持つ犯罪者がいたとして、自分の起こした事件がテレビで取り上げられることを喜んでいるような場合、テレビで取り上げることは、決して本人にとって苦にならないので、ダメだ、というのが、8)が言っている意味です。この場合は、無視することが最も効果的であり、同時に、よい行動を強化するようにすることが必要なわけですね。

このように罰は、数多くの条件をうまく満たすように、適切に与えることが必要です。その罰を与えるときも、正の罰(悪いことしたら、身体的に苦痛を与えるなど)よりは、負の罰(例えば、いたずらしたら、おやつ抜き!みたいの)を与えるほうがよい。そのほうが効果的です。

さて、何度も述べているように、行動というのはえてして、つながりがあるものです。例えば、顔を洗う、という行動1つ取っても、洗面台の前に行く→蛇口をひねる→水を手で受ける→手を顔に持っていく→顔をこする→手を離す→、といった具合に行動がいくつもつながっているわけです。このような行動のつながりのことを「行動連鎖 behavior chain」といい、そのような行動は、一つ前の反応が次の反応の弁別刺激となっていることが指摘できます。ちなみに、このような行動のつながりを作ることを「連鎖化 chaining」といい、それには順序どおりチェーンを作る「順行連鎖化 forward chaining」と、逆順に作り上げる「逆行連鎖化 backward chaining」があります。

罰というのをそのような視点から考えると、ある結果の反応が続くことで、次の反応が出にくくなるようなものが罰なんだ、ということがわかるでしょう。この次の反応を弱める結果のことを「罰子 punisher」と呼びます。

もうお分かりだと思いますが、ようは、強化の反対が、罰なのです。強化は、次のものを起こすように働く。罰はその反対。すっきりとまとめると、こう。


反応↑ 反応↓
刺激提示 正の強化 正の罰
刺激除去 負の強化 負の罰

回避と罰の難しいところは、なんでもかんでも経験できないことです。さっきの車の事故の話に戻ると、事故を回避しようと学習するためであっても、「一回事故って、死んでみる」という強力な罰を与えることは出来ません。出来ることなら、罰なしで、回避が成立してほしい。そのために、教育がなされるわけですが、それが罰に代わるほど強力に力を持つかというと、結構そうでもない。「車に乗りながら携帯電話」がいつまでたってもなくならないのを考えれば、それはわかりますね?

心理学的に考えれば、運転中に電話することは、単純にハンドル操作がしにくくなるからというより、コミュニケーションという高度な行動をすることに注意が向いて、ハンドル操作から注意が離れてしまうことに問題があるわけです(ということは、ハンズフリーにしても結果は同じということ。だから私は、今の規制はちょっと変だと思ってる)。だから、運転中は会話から離れる、ということが必要なわけですが、だけど、それが「事故を回避する」という行動と結びつかないのはなぜか。

それは、いまいち事故と携帯を使うことの間に関係性がはっきりしないことと、与える罰のレベルがあまりにも微妙だからです。

まず、回避を引き起こすためには、携帯を使うことで嫌なことが起きなきゃいけません。でも、事故はそう起きないわけだから、その関係性は知識でしか頭に入らない。よって、はっきりしなくなってしまう。

その上、罰のレベルが難しい。正の罰である「事故って死んでみる」ことが出来ないからといって、負の罰である「取り締まって、罰金を取る」としても、それが「事故によって起こる代償に匹敵するくらいに」むちゃくちゃ高額でもない限り、「6) 行動の強さと動機付け」のところで説明したとおり、効果は薄いわけです。でも、そのむちゃくちゃ高額っていくら?ってことになる。そうすると、とりあえずの金額を設定して、それでダメなら、金額を上げるという方策が採られることになる。でも、ここにも問題がある。「3) 強度の漸増」で説明したことがおきかねないわけです。

このように、単純な行動に対する回避と罰であれば、比較的簡単に話が付くものであっても、ちょっと社会的レベルが上がると、この回避と罰は話が難しくなります。

ということで、そこまであんまり難しいことを考えず、回避と罰とはこういうもんだ、ということだけ、頭に入れておいていただければ、と思います。