私達はなぜ動くのか?報酬最適化装置としての脳
私達人間というのは、1メーター数十センチ、数十キロのパッとしない姿形の生き物ですが、これは見方によっては或る意味地球の歴史が織り込まれた生き物でもあります。
バクテリアの時代から全ての生き物はより確実に生き残れるように進化してきました。
限られたエネルギーと時間を使って、いかに効率よく報酬を得て生き延びることができるのか、
そう、地球上の生き物のすべての機能は「生き延びる」をキーワードにして変化・発展・最適化されてきたのですが、
ヒトにおいてはこれはどのような機能が生き延びるために実装されてきたのでしょうか。
大きな牙や早い足も必要でしょうが、限られたリソースを有効に使うためには行動パターンを最適化する必要があります。
お腹が一杯になっても食べ物に対して興味を失わず獲物を探してウロウロするのはエネルギーロスになりますし、
空腹なときに獲物がいるにもかかわらずモチベーションが上がらないとしたらこれは大きな機会損失になります。
つまり私達の行動が最適化されるためには報酬に対して、置かれた状況に応じて行動パターンが最適化される必要がありますが、これはどのようなメカニズムによって制御されているのでしょうか。
リセット装置としてのノルアドレナリン
今日取り上げる論文は、脳の中の報酬系の中枢である青斑核から分泌されるノルアドレナリンが行動最適化に大きく関わっているということを仮説的に示したものです。
この論文では、様々な小動物や霊長類を対象にした実験を取り上げているのですが、
・行動パターンの変化に伴ってノルアドレナリンの分泌パターンが変わる
・この分泌パターンの変化によって行動制御の要である前頭前野の活動が変わり、行動パターンも変わってしまう
ということが様々な研究結果をもとに示されています。
具体的にはノルアドレナリンを分泌する青斑核の活動パターンとしては二通りあり、
一つは新奇な刺激が現れた時、一過性に高まるもの(phasic mode)
もう一つは同じ刺激が繰り返し長い期間出てきたときに、恒常的に高まるもの(tonic mode)
なのですが、
前者では適切な行動が促されるのに対して、後者では適切な行動が減り、あたかも集中力が低下したような行動パターンが現れることが示されています。
つまり青斑核から分泌されるノルアドレナリンは、その分泌パターンを変えることで、報酬が必要なときにそれを取りに行くように個体を仕向けたり、
あるいは報酬が十分なときには、あえてその報酬に対して注意や集中力を落とすことで、他の目標にリソースに振り分けることが可能となります。
つまりノルアドレナリンは状況によっては行動を切り替えるリセットボタンのような働きをしているということなのですが、
認知症、もしくは脳卒中で見られる半側空間無視では覚醒レベルによって情報処理能力が変化しうることが経験的に知られており、
臨床場面で認知機能・実行機能を考えるときには報酬系に関わる神経伝達物質の仕組みも頭の隅に入れておいたほうがいいのかなと思いました。
参考URL:Network reset: a simplified overarching theory of locus coeruleus noradrenaline function
以下の本の中ではサイエンス・アイから出版されている「脳と心を支配する物質」が分かりやすかったです。
↓