Радости млекопитающих
Животные постоянно оказываются в ситуациях, насыщенных и возможностями, и трудностями. Они пасутся и охотятся – но при этом идет охота и на них самих. Чтобы выжить, животным необходимо улавливать подсказки из окружающей среды и от своего внутреннего физиологического состояния и вести себя сообразно обстоятельствам. Такова задача наших систем мотивации.
Простейшие формы жизни успешно откликались на внешние условия без всякой нейронной системы мотивации – и даже без нейронов. У бактерий, например, нет системы вознаграждения. Они действуют не потому, что ищут удовольствия, а потому что сталкиваются с той или иной молекулой, вызывающей у них ту или иную автоматическую реакцию. Как уже говорилось ранее, бактерии улавливают присутствие питательных веществ и отзываются соответственно, а помещенные в среду, обедненную питанием, сплачиваются и сотрудничают, чтобы тем самым улучшить собственную эффективность. Они отгоняют соседей, если те потребляют энергетический ресурс, а сами никакого вклада не вносят. Бактерии защищают свою территорию от других групп бактерий и подлаживают свои «боевые» стратегии под собственную относительную численность. Подвиги выживания они совершают, выделяя или поглощая широкий диапазон различных молекул. Об успехе такого подхода свидетельствует численность подобных организмов. Например, в организме человека бактериальных клеток больше, чем человеческих. И это не аномалия: биомасса бактерий на Земле превышает биомассу всех растений и животных. Поэтому пусть вам кажется, что царь пищевой цепи – человек, людей можно в равной мере считать мобильными фермами бактерий.
Какими бы эффективными ни были бактерии, без системы вознаграждения бактериальная колония способна лишь автоматически реагировать на внешние стимулы – это своего рода биохимическая машина Руба Голдберга. Такое поведение в принципе негибко, а потому ограниченно. Организмы вроде планарии, одними из первых развившие нервную систему 560 миллионов лет назад, наконец перестали полагаться на запрограммированные реакции. У этих существ появилась новая способность: они умели оценивать незнакомые ситуации и реагировать на них действиями, приспособленными под конкретные обстоятельства и цели
[144].
Мы видим рудиментарную систему вознаграждения даже у простейших многоклеточных. Круглый червь нематода C. elegans, например, располагает всего 302 нейронами, однако способен усваивать входящие сенсорные данные посредством централизованной нервной системы и регулировать собственное пищевое поведение, применяя дофамин, один из нейромедиаторов, характерных для системы вознаграждения в человеческом организме
[145].
С возникновением позвоночных – пресмыкающихся, земноводных, птиц и млекопитающих – сложилась более сложная система вознаграждения, которая ныне есть у всех людей. Система вознаграждения у позвоночных – многоцелевая мотивационная сеть, и механизм ее активации различными приятными стимулами примерно один и тот же. Среди всех животных сложнее всего система мотивации устроена у млекопитающих.
Бактерия, чуя в окружающем ее пространстве питательные вещества, запрограммирована улавливать их, а бесполезные или вредоносные молекулы обходить стороной. Человеку – если он здоров – пищей более удовлетворительной покажется апельсин, а не «сессна-150». Поглотит ли бактерия ту или иную молекулу или проплывет мимо, определяется биохимическим устройством бактерии. Млекопитающее принимает решение. Таково эксплуатационное преимущество системы вознаграждения. Мы не реагируем автоматически: мы выбираем, как действовать, предварительно взвесив много разнообразных факторов. Наш мозг оценивает удовольствие от каждого возможного переживания и соизмеряет с их возможной ценой, применяя – с опорой на ядерный аффект – наличные знания о состоянии тела, о будущих последствиях различных действий и другие сообразные случаю данные. И только после вот такого анализа мозг определяет цель и мотивирует нас действовать.
Роберт Хит ушел на покой в 1980 году. К тому времени, после десятков лет кропотливых исследований, другие ученые прояснили множество особенностей системы вознаграждения у людей и многих других животных. К середине 1980-х учебники по психологии уже объясняли, что система вознаграждения – набор структур, приносящих радость и посредством удовольствий мотивирующих нас предпринимать действия, необходимые для того, чтобы мы выживали и процветали. Согласно той теории, мы избегаем всего, что приносит боль и неудобства, прилагаем усилия, чтобы максимально увеличить удовольствие, и прекращаем действовать, когда при насыщении петля обратной связи у нас в мозге уменьшает удовольствие, обеспечиваемое системой вознаграждения. Вот почему мы сперва желаем шоколада и чизкейка, а потом рано или поздно прекращаем их поедать.
Теория системы вознаграждения гораздо лучше обосновывала мотивацию, нежели старая теория влечений. Однако некоторые исследователи – особенно те, кто изучал зависимости, – по-прежнему натыкались на вопросы, которые новая теория оставляла без ответа. Например, некоторые наркозависимые продолжали употреблять наркотики, хотя сами утверждали, что воздействие этих веществ им больше не нравится. Что же их мотивирует? Никто не понимал. Однако никто не сомневался и в теории вознаграждения, пока некий ученый-одиночка, обремененный экспериментом, с которым он никак не мог сладить, вдруг осознал, что загвоздка – не в применяемом лабораторном методе. Загвоздка в теории, на которую опирались его экспериментальные процедуры. И вот так началась следующая революция в нашем понимании того, как устроены системы вознаграждения у животных. Этот ученый осознал: степень удовольствия, которое мы переживаем, – только полдела.
«Хочу» и «Нравится»
Новая революция в понимании системы вознаграждения подарила психологам новое понимание связи между нашими удовольствиями и желаниями. Изначально было понятно, что человек способен отказаться от чего-то, что ему нравится, поскольку знает, что желанное вредно для здоровья или оценивается как безнравственное. Это пример того, как мы управляем собственным поведением, применяя сознательную волю. Но это не значит, что, если оставить за скобками здоровье или нравственность, нам не нравится то, чего мы себя лишаем. Отказаться от шоколадного пирога ради того, чтобы втискиваться в штаны, не означает, что к шоколаду у нас нет вожделения, а означает лишь способность превзойти это вожделение, и психологи всегда считали, что наше умение откладывать приятный опыт или отказываться от него не отменяет того, что мы этого опыта желаем. То, что мы хотим того, что нам нравится, и нам нравится то, что мы желаем, казалось аксиомой. На принятие того, что на самом-то деле это не так, ушло почти тридцать лет.
Первый шаг к этому пониманию был сделан незадолго до Рождества 1986 года, когда Кенту Берриджу, в ту пору молодому доценту в Университете Мичигана, позвонил Рой Уайз. В предыдущее десятилетие Уайз совершил научный прорыв, разобравшись в том, какую роль в системе вознаграждения играет дофамин, и проделав экспериментальную работу, благодаря которой дофамин оказался в новостях – его прозвали «молекулой удовольствия»
[146]. Уайз хотел объединить с Берриджем усилия, поскольку тот был специалистом в толковании мимики у крыс. Пристально вглядываясь крысе в мордочку, Берридж был способен различить эмоции в диапазоне от удовольствия до отвращения. Странный это навык, однако Уайз замыслил эксперимент, связанный с удовольствием, а вокруг не слишком много кто умел распознавать по крысиной морде, получает ли этот грызун удовольствие, – да и не слишком много кто желал этим заниматься. А вот Берридж написал на эту тему справочное пособие – двадцатипятистраничный обзор, процитированный в научных журналах более пятисот раз
[147].