Код креативности. Как искусственный интеллект учится писать, рисовать и думать | Маркус Дю Сотой | страница 11 | LoveRead.ec

Всем известно, что на начальных этапах игры камни следует ставить на четыре внешние линии. Третья линия позволяет накапливать кратковременное территориальное преимущество на краю доски, а камни, поставленные на четвертую линию, дают более сильную позицию в дальнейшей игре по мере продвижения к центру. Игрокам всегда приходится тщательно выбирать между игрой на третьей и четвертой линии. Игра же на пятой линии всегда считалась нерациональной, так как она дает противнику шанс занять территорию, обеспечивающую как краткосрочное, так и долгосрочное преимущество.

Программа AlphaGo разрушила эту догму, утвердившуюся в течение многих столетий соревнований. Некоторые из комментаторов назвали ее ход явной ошибкой. Другие высказывались более осторожно. Всем было интересно узнать, как воспримет этот ход Ли Седоль, когда вернется с перекура. Когда он сел за стол, было видно, как он буквально вздрогнул, увидев на доске новый камень. Этот ход, несомненно, потряс его, так же как и всех остальных. Он раздумывал над ним более двенадцати минут. Подобно шахматным матчам, игра проводилась с ограничением по времени. Целых 12 минут, потраченные на обдумывание одного хода, стоили очень дорого. То, что ответный ход занял у Ли Седоля столь долгое время, показывает, насколько неожиданной была игра программы. Ли Седоль не мог понять, что делает AlphaGo. Почему она вышла за пределы того участка доски, который они оспаривали до этого?

Было ли это ошибкой AlphaGo? Или же программа увидела в глубине игры нечто, чего не могли заметить люди? Фань Хуэй, назначенный одним из арбитров, тоже взглянул на доску. Его первая реакция была такой же, как и у всех остальных, – потрясение. А затем он начал понимать. «Это не человеческий ход. Я никогда не видел, чтобы человек так играл, – сказал он. – Такой красивый ход. Очень, очень красивый».

Ход этот оказался не только красивым, но и убийственным. Это была не ошибка, а необычайно глубоко продуманное действие. Ходов через пятьдесят, по мере того как черные и белые камни оспаривали друг у друга территорию, продвигаясь от нижнего левого угла доски, оказалось, что они постепенно приближаются к черному камню, поставленному на 37-м ходу. Именно воссоединение с этим камнем и дало AlphaGo преимущество, позволившее программе одержать вторую победу. Счет стал 2: 0 в пользу AlphaGo.

На пресс-конференции, состоявшейся после игры, настроение Ли Седоля было заметно другим. «Вчера я был удивлен. Но сегодня у меня нет слов… Я потрясен. Я готов признать, что… третья партия будет для меня непростой». Матч состоял из пяти партий. Чтобы не позволить AlphaGo выиграть весь матч, в этой партии Ли Седолю было необходимо победить.

Человек дает отпор

На следующий день Ли Седоль восстанавливал силы. Третья партия была назначена на субботу 12 марта. В отличие от машины человеку нужно было отдохнуть. Первая партия продолжалась более трех часов, с огромной концентрацией сил. Вторая продлилась более четырех часов. Проигрыш двух партий подряд заметно ухудшил его эмоциональное состояние.

Однако вместо отдыха Ли Седоль до 6 утра занимался анализом уже сыгранных партий вместе с группой профессиональных игроков в го. Есть ли у AlphaGo слабые места, которые можно использовать против нее? Учиться и совершенствоваться способна не только машина. Ли Седоль считал, что сможет извлечь из своих поражений полезные уроки.

В дебюте третьей партии Ли Седоль играл очень агрессивно, и AlphaGo была вынуждена заниматься слабой группой камней, расположенной в контролируемой ею зоне доски. Среди комментаторов возникло радостное волнение. Некоторые говорили, что Ли Седоль нашел слабое место AlphaGo. Но затем, как написал один из комментаторов, «ситуация стала пугающей. Когда я смотрел за развитием игры и начал понимать, что в ней происходит, мне стало физически нехорошо».

Ли Седоль заставил AlphaGo играть на пределе возможностей, но в результате этого у программы, по-видимому, обнаружились скрытые ресурсы. По мере развития игры она начала делать ходы, которые комментаторы называли ленивыми. Она анализировала свое положение и была настолько уверена в своей победе, что выбирала ходы наименее рискованные. Ее вполне устраивала победа с перевесом в пол-очка. Важно было только победить. Такие ленивые ходы были почти что оскорбительны для Ли Седоля, но в программу AlphaGo не было заложено никакой мстительности. Ее единственной целью была победа в игре. Ли Седоль, не желавший слишком быстро сдаваться, пробовал то одну, то другую тактику. Ведь в одном из этих ленивых ходов могла быть пропущена ошибка, которой он смог бы воспользоваться.

Но к 176-му ходу Ли Седоль все же смирился с поражением и сдался. AlphaGo выигрывала у человека со счетом 3: 0. Собравшиеся за кулисами сотрудники DeepMind испытывали странный спектр чувств. Они одержали победу в матче, но радоваться ей было трудно, видя, какое сокрушительное воздействие это произвело на Ли Седоля. Приз – миллион долларов – принадлежал им. Еще до игры они решили, что в случае победы пожертвуют призовые деньги разным благотворительным организациям, способствующим развитию го и научных исследований, а также ЮНИСЕФ. Но чисто по-человечески они не могли не сопереживать страданиям Ли Седоля.

AlphaGo не проявила никакой эмоциональной реакции на свою победу. Не было ни малейших всплесков электрического тока, на компьютерном экране не появилось никакого победного «ЕСТЬ!». Такое отсутствие реакции дает человечеству надежду, но в то же время и пугает. Обнадеживает оно потому, что именно эмоциональная реакция побуждает к творчеству, к исследованию неизведанного: в конце концов, AlphaGo была запрограммирована на победу именно людьми. А пугает потому, что машину не смутило бы, если бы достигнутая цель оказалась несколько не такой, какую предполагали программисты.

Ли Седоль был опустошен. Выступая на пресс-конференции, он просил прощения:

Не знаю, с чего начать и что сейчас сказать, но мне кажется, что прежде всего я должен принести свои извинения. Я должен был добиться лучшего результата, лучшего исхода, сыграть лучшую игру, и я прошу прощения, что не смог соответствовать ожиданиям множества людей. Можно сказать, что я чувствовал себя бессильным.

Однако он призвал зрителей продолжать следить за последними двумя партиями. Теперь его целью было выиграть от имени человечества хотя бы одну из них.

Проиграв матч, Ли Седоль начал четвертую партию в более свободной манере. Казалось, он избавился от тяжелого бремени надежды на победу и это позволило ему получать удовольствие от самой игры. Теперь Ли Седоль применил гораздо менее уравновешенную стратегию под названием «амаси», резко отличающуюся от тщательно продуманных, почти осторожных ходов, которые он делал в третьей партии. Один из комментаторов сравнил его с инвестором, который, не довольствуясь постепенным накоплением мелких заработков, ставит на карту сразу весь свой капитал.

Ли Седоль и его помощники не спали всю ночь с субботы на воскресенье, пытаясь восстановить принципы работы Alpha-Go по сыгранным партиям. Казалось, что программа не полагается на потенциальные последствия одного сложного хода, а последовательно делает ходы, постепенно увеличивающие вероятность ее победы. Ли Седоль наблюдал это поведение, когда AlphaGo предпочла ленивые ходы, позволившие ей выиграть третью партию. Стратегия, которую они выработали, должна была разрушить эту осмотрительную игру отдельными рискованными ходами. Предполагалось, что подобная стратегия игры ва-банк не позволит AlphaGo так легко накапливать преимущество.

Код креативности. Как искусственный интеллект учится писать, рисовать и думать - читать онлайн книгу. Автор: Маркус Дю Сотой cтр.№ 11

Онлайн книга - Код креативности. Как искусственный интеллект учится писать, рисовать и думать | Автор книги - Маркус Дю Сотой