なぜあなたはやる気を出せないのか?
「やる気を引き出す」というのは人間にとっての永遠のテーマです。
締め切りの近い仕事があるにも関わらず、取りかかれない、
早くご飯を食べてほしいのに、子供はいつまでたっても食べてくれない、
ばりばり仕事してほしいのに、部下はちっともやってくれない、
やる気があれば水が流れるように進むことも、やる気が無いのでさっぱり進まないというのはよくあることだと思いますが、
今回取り上げる論文はヒトのやる気や行動原理について、ドーパミンと予測誤差という観点から説明を行った論文になります。
Dopamine reward prediction error coding
脳の中の情報の流れとドーパミン
予測をするにしても予測を直すにしても、脳が活動するときには電気が流れます。
とはいえ、脳は電気だけで動いているのではなく、そこには物質も関与しています。
脳の中の神経細胞は神経線維を伸ばして、他の神経細胞に情報を送っているのですが、そのつなぎ目は空白地帯になっていて電気はそこを飛び越して伝わることはできません。
このような空白のつなぎ目はシナプス(図の④の部分)と呼ばれているのですが、
引用元:Wikipedia;「シナプス」より
この空白の継ぎ目では、電気の代わりに神経伝達物質が送られることで、次の神経細胞の活動を引き起こしたり、抑えたりします。
こういった神経伝達物質には様々な種類があるのですが、その中の一つにドーパミンというものがあり、これは脳の中の予測誤差における反応に関わることが知られています。
ではこのドーパミンは、どのような形で予測誤差の処理に関わるのでしょうか。
我々の行動パターンと予測誤差
私達は日々間違えては日々学習する生き物です。
予測を立てる→間違える→違う予測を立てる→・・・
という流れで毎回予測を立てては試してみて、もし間違っていたらその予測は改定されて・・という流れでよりよい予測が建てられるようになります。
こういった流れを図示すると
※Schultz W. Dopamine reward prediction error coding. Dialogues Clin Neurosci. 2016;18(1):23‐32.figure 1より
になります。
とはいえ、この誤差ですが、これには嬉しい誤差と悲しい誤差があります。
ふらりと入ったお店で適当に頼んだ料理を食べたら美味しかったというのは嬉しい誤差ですし、高いお店に入ったのにそうでもなかったというのは悲しい誤差です。
ドーパミン神経細胞は、予測と実際の結果の間に誤差があったときに活動したりしなかったりするのですが、様々な実験から嬉しい誤差では活動が増え、悲しい誤差では活動が減ることが報告されています。
ドーパミンというのは交感神経を活発化させて心身全体のテンションを上げる神経伝達物質ですが、脳の中で嬉しい誤差は脳の中で「報酬」として認識され、より多くの報酬が得られるように個体の行動を変えていきます。このプロセスは強化学習とも言われており、ここにドーパミンが関わっています。
しかしここで問題になるのは、一度嬉しい誤算が起こると、次の予測では嬉しい誤算がベースになってしまうということです。
派遣社員から正社員に上がって給料が上がると最初のうちは嬉しいのですが、いずれそれが当たり前になってなんとも思わなくなりますし、
指導した部下や学生が上手にやってくれると嬉しくなりますが、いずれかそれにも慣れてもっと高いレベルを求めるようになります。
つまり、私達の脳は嬉しい誤算が起これば喜びを感じますが、それにはすぐに慣れてしまいます。私達の脳は基本的に「もっと、もっと」をベースに設計されており、喜びを感じ続けるためには常に現状以上を求める必要があります。
以上をまとめると
・予測と実際の結果が違うと脳の中でフィードバックがかかる
・このフィードバックにはドーパミンが関わる
・「嬉しい」誤差でドーパミンに関わる神経細胞の活動が活発化する。
・次の期待値は「嬉しい」誤差が基準となるので同じ刺激では同じように活発化しなくなる
ということになります。
このように予測を上回る結果を得ることで、ドーパミンに関わる神経活動が活発化しますが、この活発化の仕方は報酬の量やタイミングでだいぶ違ってくることも知られています。それはどのようなものなのでしょうか。
ドーパミンと報酬量の関係
鼻の頭にぶら下げた人参で走る馬でもないのですが、私達の行動は報酬によって左右されます。
とはいえ、報酬があれば行動が変わるというわけでもありません。
年収が1万円上がるのが分かっていたとしても、私達は簡単には転職しないでしょうし、10年後に健康に暮らせることが分かっていても、私達は体に良くない習慣を簡単にはやめることができません。
ドーパミンとの兼ね合いで考えた時、ここにはどのような仕組みがあるのでしょうか。
サルを対象にした研究では、報酬量が少ないときにはリスクを取りやすくなり、報酬量が大きいときにはリスクを回避しやすくなることが報告されています。
これは、例えばあなたが
「二分の一の確率で10円か50円かをもらうことができるクジと、確実に30円もらえるクジを選ぶことができる」と言われれば、多くの人は前者の10円もしくは50円を貰えるクジ(期待値は30円)を選ぶと思うのですが、
「二分の一の確率で1000万円か5000万円かをもらうことができるクジと、確実に3000万円もらえるクジを選ぶことができる」と言われれば、多くの人は期待値が同じだとしても後者のクジを選ぶでしょう。
つまり私達は単に期待値の大小だけでなく、もらえる報酬の大きさによってもリスクのとり方が変わります。
サルを対象にした実験からはこれを裏付けるように報酬の大きさでドーパミン反応も変化することが報告されています。
※Schultz W. Dopamine reward prediction error coding. Dialogues Clin Neurosci. 2016;18(1):23‐32.figure 1より
すこし分かりづらいかもしれませんが、暇な人はちょっとだけ付き合ってください(読み飛ばしてもらっても大丈夫です)。
ある実験で、サルに2つあるレバーを押させるのですが、片方のレバーは必ず同じ量のジュースが出てきます。こちらをサラリーマンレバーとしましょう。
もう片方のレバーは二分の一の確率で多いジュースか少ないジュースかが出てきます。これを自営業者レバーとしましょう。
便宜的にジュースの量を年収に換算して、まず最初に自営業者レバーでは二分の一の確率で100万円(0.1ml)か400万円(0.4ml)の収入が得られるとしましょう。この場合、期待値は(100万+400万)÷2=250万円になります。
なのでこの自営業者レバーでの平均収入250万円の設定で、サラリーマンレバーの設定を250万円にすれば、確率論的にサラリーマンレバーを押しても自営業者レバーを押しても同じお金をもらえることになので、サラリーマンレバーを押す確率も50%になるはずです。
でも実際の実験結果を見てみると、サラリーマンレバーの設定を250万円にしたときには、サラリーマンレバーを押す確率はおよそ40%でしかありません。もうちょっと手堅く(サラリーマンレバーを押す確率が50%)で勝負していたほうが確率論的にもらえる量は増えるのですが、もらえる額が小さいと自営業者レバーを押しやすい、つまりリスクを取る傾向が強くなるということになります。
次に同じグラフの右側の曲線を見てみましょう。
この実験では自営業者レバーは二分の一の確率で900万円(0.9ml)か1200万円(1.2ml)をもらえる設定にしてあります(期待値は(900万+1200万)÷2=1050万円)。
なのでこの設定で、サラリーマンレバーの設定を1050万円にすれば、確率論的にはサラリーマンレバーを押しても自営業者レバーを押しても同じお金をもらえることになので、サラリーマンレバーを押す確率も50%になるはずです。
ところが実際に50%の確率でサラリーマンレバーを押す設定をグラフで見てみると950万円付近になっています。
つまりもう少し強気で勝負に出たほうがもらえる額が大きくなるのですが、確実に貰える金額が大きいときにはリスクを回避する傾向が強くなることがわかります。
つまり小金で博打しているときにはリスクを取りやすくなり、大金で博打を打つときにはリスクを回避するようにできているということになります。
夜の街を歩いていると「お兄さん、3000円でいいよ~」などというのもありますが、これは小金だったら博打を打てるという感覚に訴えてきますし、
会社運営で行けば、なにかやり方を変えようというときに「ヒトは変えるのは嫌だが試すのは好き」という金言に乗っ取り「試験的にやってみましょう」の掛け声で何かを変えることがありますが、行動学的に見ればヒトにリスクをとらせるときは敷居を低くしたほうがよいということが言えるかと思います。
効用関数とドーパミン神経細胞の発火
効用関数というものがあります。
字面は硬いのですが、これは最初のビールはうまいが2杯目以降はそうでもなくなっていくという現象を考えてもらえばわかりやすいと思います。
ビール一杯で感じられる喜びの量は、1杯、2杯、3杯と杯を重ねていくにつれて少なくなっていきますが、これは経済学では限界効用の減少として捉えられます。
先のグラフではジュースの量を変えていったときのサルの行動での効果関数を出したものが以下のグラフになります。
引用元:Schultz W. Dopamine reward prediction error coding. Dialogues Clin Neurosci. 2016;18(1):23‐32.figure 1より
上の図の赤の曲線が先の自営業者ーサラリーマンレバーの二択課題の反応から得られた効用関数で、裏の灰色の棒グラフがドーパミン神経細胞の発火頻度になります。
グラフを見てもらえばわかると思うのですが、ジュースの量が少ないときは限界効用の増加率も少なく、中程で急に高くなり、多くなってくると落ち着いてくるという関係性が見えると思います。
つまり限界効用が最初とあとの方では少ないが、中程では大きいという形になっています。
私達の例で行けば、年収が300万円増えるにしても、年収300万円から年収600万円に増えるのはインパクト(効用)も大きいのですが、年収1000万円が1300万円になるはそれほどインパクト(効用)も大きくありません。
脳は予測と実際との誤差を検出して、誤差が少なくなるように予想を変更して行動を変えていきますが、
サルのジュースの実験で得られたドーパミン神経細胞の発火を見ると、誤差は単にジュースの量ではなく、効用(インパクト)の誤差であることがわかります。
つまりサルが選んでいるのは効果量、言い換えればサプライズの大きさであって実際の物理的な量ではないということです。
人間負けがこんでいるときほど、一か八かの奇策に出やすくなりますが、まともな勝負で得られるリターンが少ないときにはリスクを取って得られるリターンのほうが相対的に効果量(サプライズ量)が大きくなることからも説明ができるかと思います。
つまりヒトはピンチに置かれるとリスクをとるように設計されているので、私自身はピンチに我が身を置かないよう、無借金かつ固定費最小化でできるだけ自分の頭を冷やしながら自分の事業を回しています。
また満足した人間を動かすほど難しいこともないので、こういった人間を動かすにはより高いサプライズ量を提示するか(この方法で所得倍増!)、あるいは視点をずらさせて不満にさせるか(本当に今の生活レベルでいいの?)のどちらかになります。
マーケティングの本質はサプライズ量やサプライズ感受性を操作して人を煽ることにあるのかなと思うのですが、私自身の生活ハックとして広告のあるものは買わないことにしています(私の広告は例外にしておいてください・・)。
時間割引とドーパミン
行動心理学の実験で有名なものに「マシュマロ・テスト」というものがあります。
これは小学校に上る前くらいのこどもに「ママが来るまでこのマシュマロを食べちゃだめだよ、もし我慢できたら倍のマシュマロをあげるよ」という設定で、果たして一人きりになったこどもがマシュマロを食べるのを我慢できるのかを見るものです。
ちなみにマシュマロを食べるのを我慢できた子供はその後の追跡調査で学業成績も高く、所得も高く、中年になったときの健康状態も良いことが報告されているのですが、
将来得られる利得(未来のマシュマロ2個)というのはどうしても目の前の利得(目の前のマシュマロ1個)と比べて魅力が少なく映ってしまします。
このように将来得られる価値が時間が未来になるにつれて減って感じられる現象は経済学で時間割引と呼ばれているのですが、これをドーパミン神経細胞で見た場合どのようになっているのでしょうか。
ある実験ではサルに予期せぬご褒美(下図Reward)を与えた時と、ご褒美に紐付けた刺激を与えた時(下図CS1:パブロフの犬でいえばベルの音)、さらにご褒美に紐付けられた刺激に紐付けられた刺激(下図CS2:パブロフの犬でいえばベルの音を鳴らしに入ってきた白衣の研究者など)を与えた時のドーパミン神経細胞の活動を見ています。
グラフの高さがドーパミン神経細胞の発火頻度なのですが、ご褒美そのものがもっとも発火頻度が高く、紐付けられた刺激(CS1)ではそれよりも少なくなり、さらにCS1に紐付けられた刺激(CS2)ではさらに少なくなることがわかります。
つまりご褒美がもらえるのが先になればなるほどドーパミン神経細胞の活動が低いということになり、これは従来行動経済学で言われていた時間割引減少と同じ結果を示しています。
引用元:Schultz W. Dopamine reward prediction error coding. Dialogues Clin Neurosci. 2016;18(1):23‐32.figure 3より
これでいけば、ご褒美が先になるほどドーパミン神経細胞の活動が低下して行動変化も乏しくなるので、もし誰かを動かしたかったらご褒美をできるだけすぐ与えることが大事ということになります。
子供にご飯を食べさせたかったら、明日の外出よりも食後のデザートのほうが効果的ですし、
運動したかったら数カ月先の結果よりも運動直後のご褒美の方が効果的ということになります。
また部下や学生を指導するときにもその場で指導という原則がありますが、これもすぐにご褒美がもらえる(褒めてもらえる)と分かっている時の方がドーパミン神経細胞が発火しやすいことからも妥当かと思います。
まとめ
以上をまとめると
・脳は予測と実際の誤差を検出し、予測を新たに立て直す。
・この予測誤差検出にはドーパミン神経細胞が関与する。
・ドーパミン神経細胞は物理的な量そのものの誤差ではなく効果量(サプライズ量)の誤差を検出する。
・効果量は基準になっている量やタイミングで変わってくる
ということになります。
これを人を動かすことに応用するなら
・できるだけすぐに
・できるだけ多くの量を
・できるだけ相手にとって低コストで
与えることが人を動かすために有効なことがわかるかと思います。
これでいけば、ある企業がデジタル決済事業を始めるときに、期間限定100億円キャッシュバックキャンペーンで成功を収めましたが、あのやり方は、人を動かす上で理にかなっているということになりますし、
企業でよくあるストックオプション制度が、よほどにユニコーン的なベンチャー企業でない限り社員を動かすモチベーションを上げる誘引にはならず(多くの場合は、はるか先にある、ほんの僅かの儲けを、高コストで得る制度です)
さらに牛丼のキャッチコピーではないのですが、極論すれば
「旨い、安い、早い」が人を動かす肝心要になるのかと思います。
今日もドーパミン神経細胞とうまくやっていきたいものです。
脳科学に関するリサーチ・コンサルティングを承っております。
子育てや家事、臨床業務で時間のない研究者の方、
マーケティングや製品開発に必要な脳科学に関する論文を探している方、
数万円からの価格で資料収集・レポート作成をいたします!
ご興味のある方は以下よりどうぞ!