Иван Павлов получил Нобелевскую премию в 1904 году за работу по обучению и классическим условным рефлексам. Он тогда изучал пищеварение, а открытия в области обучения были, так сказать, успешным побочным продуктом. Павлов изучал слюноотделение у собак при виде и запахе еды и заметил, что оно начинается уже на этапе звона колокольчика, сообщающего о приеме пищи. Слюноотделение происходило даже тогда, когда ученый не кормил собак после звукового сигнала. Животные запомнили, что звон колокольчика был предвестником того, что их вот-вот накормят
{154}. Слюноотделение поддерживалось звуками. Колокольчик сам по себе не означал еду, но предупреждал о ее появлении
{155}. Это называют классическим условным рефлексом – когда раздражитель ассоциируется с реакцией и воспринимается как хороший знак.
Классический условный рефлекс – простейший пример обучения. Собаки пытались предсказать будущее. Со временем они поняли, что звук колокольчика предвещает еду, и начинали пускать слюни. Обучение – это обновление ожиданий посредством опыта, позволяющее правильно реагировать и делать более точные прогнозы. Каждую секунду наши действия строятся на ожиданиях того, что произойдет. Например, я пишу этот параграф, ожидая, что, когда нажму на клавишу, на экране появится буква. Я даже не проверяю написанное: зачем, если ты уверен в своих действиях? А затем я замечаю, что клавиши «и», «е» и «а» западают, тк что я пчтю кк-то тк, это рздржт. Пршло время учться.
Когда мы действуем, исходя из своих ожиданий, события могут развиваться в нескольких направлениях.
Во-первых, наши ожидания могут быть верны. В таком случае меняться нет никакой нужды и учиться нечему. Это тот случай, когда с клавишами все в порядке, как я и думала.
Второе. Все может пойти не так, как мы планировали. Это расстраивает. Такое развитие событий называют «отрицательной ошибкой прогнозирования» (negative prediction error), которая указывает на то, что ожидания нужно обновить. Именно так мы и учимся. В моем примере, обнаружив, что клавиши не работают, я попробовала нажимать их иначе. Я заметила, что если бить по ним слишком сильно, то толка не будет, а если зажимать мягко, на экране появляются буквы. Так что мои пальцы стали ласково касаться клавиш вместо того, чтобы давить на них.
Третье. Вознаграждение может случаться неожиданно. Бывает, что внезапно происходит что-то хорошее. Мы замечаем это, хотим повторения и учимся на сложившейся ситуации. Это называется «положительной ошибкой прогнозирования» (positive prediction error), потому что результат складывается в нашу пользу. В моем случае аккуратное нажатие на клавиши позволило печатать быстрее.
А вот профессиональный пример. Допустим, у вас новый клиент, и вы задаете ему серию последовательных вопросов. В результате у клиента появляется много мыслей и инсайтов. Вы на это не рассчитывали: обычно эти вопросы не ведут ни к каким конкретным результатам. Вы воодушевлены – позитивная ошибка прогнозирования. Вы анализируете вопросы и пробуете ту же тактику с другим клиентом. У него тоже возникает много мыслей. Вы понимаете, что ваши вопросы часто наводят клиентов на продуктивные идеи. Превосходно! Вы научились кое-чему. Спустя какое-то время вы уже ожидаете, что эти вопросы помогут клиентам – и именно так все и происходит. Вы постоянно используете эту тактику и видите результат. Но вот однажды к вам приходит клиент, который совершенно не реагирует на имеющийся набор вопросов. Это привлекает ваше внимание – отрицательная ошибка прогнозирования. Вы не получаете ожидаемого вознаграждения. Вам предстоит понять, как еще изменить вопросы. Для успешного обучения нужно отслеживать свои ожидания и обновлять их, когда они перестают работать. Мы учимся на своих положительных и отрицательных ошибках прогнозирования, и для этого мозгу нужен нейротрансмиттер дофамин.
Дофамин и обучение
Позвольте представить вам дофамин – один из главных нейротрансмиттеров нашего мозга. Все любят дофамин, ведь он связан с действиями, обучением, мотивацией, концентрацией и удовольствием. Это возбуждающий нейротрансмиттер, увеличивающий шансы на то, что сигнал перепрыгнет к следующему нейрону и активирует его. Почти весь дофамин производится в двух отделах мозга. Первый – черное вещество
{156}, область базальных ядер, отвечающая за движение. Дофаминовые нейроны присутствуют так же в другой части базальных ядер – дорсальном полосатом теле
{157}. Дофамин также производится маленьким участком среднего мозга, расположенным недалеко от базальных ядер, под названием «вентральная область покрышки» (ВОП).
Нейроны, производящие дофамин, составляют два направления, и оба очень важны. Первое – мезолимбический путь, или «путь вознаграждения»
{158}. Дофамин вырабатывается, если мы получаем награду, например слушаем музыку, видим фотографию любимого человека, едим вкусную еду, занимаемся сексом или побеждаем в футбольном матче. Однако удовольствие, которое мы испытываем, по большей части обусловлено другими химическими веществами – опиоидами, вырабатываемыми мозгом в это время. «Путь вознаграждения» ведет к прилежащему ядру, которое является частью вентрального стриатума (или полосатого тела)
{159}, и далее к миндалевидному телу, гиппокампу и передней поясной коре (ППК).