Играть в шахматы машину научили давным-давно, но лишь в 1997 году компьютер смог победить чемпиона мира. С тех пор многие человеческие игры, ранее считавшиеся недоступными для умных машин, покорились их вычислительной мощи. За человеком по-прежнему оставался единственный бастион, о который разбились несколько поколений вычислительной техники – игра го. Только человек мог уверенно побеждать в этой игре, а машины раз за разом покорно проигрывали в противостоянии умов. Так было до весны текущего года. В марте специально разработанный искусственный интеллект с разгромным счетом сокрушил сильнейшего из всех игроков в го.

Конечно, искусственный интеллект может успешно освоить принципы далеко не всех игр. Обычно победы компьютеров над людьми на экспертном уровне лежат в сфере особой категории – игр с полной информацией. Этот специализированный термин из теории игр обозначает логическую игру без вмешательства элемента неопределенности. То есть игрок в каждый момент обладает всей информацией о ходе партии, то есть видит диспозицию и итог действий противника, а также может прогнозировать его возможные дальнейшие ходы. Существенную роль здесь играют дискретные действия – ходы, порядок которых определен правилами игры и не зависит, например, от скорости реакции или мелкой моторики участников.

Если из игры с полной информацией удалить элемент случайности, то игра станет детерминированной, то есть предопределенной – когда каждый ход логически вытекает из предыдущего и определяет следующий. И вот как раз тут и вступает в дело мощный вычислительный центр – в мозгу человека или в глубине искусственного интеллекта – так как для любой детерминированной игры с полной информацией существует конечное число ходов, которое оформляется в так называемое дерево ситуаций. Таким образом, зная и ориентируясь в последовательностях возможных ходов, можно со стопроцентной гарантией выиграть партию или свести ее в ничью. Типичные примеры детерминированных игр с полной информацией – это знакомые нам крестики-нолики, шашки, шахматы, го и другие.

Шашки

Одними из первых сдали позиции наступающим компьютерным программам хорошо известные нам шашки. Это очень древняя игра, настолько, что мало кто может определить время и место ее возникновения. Шашки всегда были довольно популярным времяпрепровождением, а в XIX веке уже проводились национальные чемпионаты по этой игре.

Неудивительно, что с появлением компьютеров программисты решили научить машины играть в шашки, причем лучше любого из людей. Выдающейся фигурой в мире шашек с середины по конец XX века был Марион Тинсли. За свою карьеру он проиграл всего 5 партий и был 8-кратным чемпионом мира по чекерсу (американская разновидность шашек).

В 1989 году профессор Альбертского университета в Эдмонтоне (Канада) и исследователь теории игр Джонатан Шеффер вместе с командой программистов создал программу Chinook для игры в чекерс. Чтобы проверить машину, на практике нужно было свести ее с по-настоящему сильным соперником – и, разумеется, выбор пал на Мариона Тинсли. В 1990-м разработчики программы добились права для компьютера поучаствовать в чемпионате мира по шашкам среди людей, в финале которого умная машина и сошлась с Тинсли. Там она заняла второе место, уступив человеку в напряженной борьбе.

В 1992 году в специальной категории «человек против машины» Chinook вновь встретился с Тинсли и вновь уступил ему со счетом 4:2 при 33 ничьих. После этого сам Тинсли включился в разработку программы и подробно консультировал группу ученых. Через 2 года состоялся матч-реванш, в ходе которого было сыграно 6 партий – и все вничью. Такое быстрое завершение встречи последовало по заявке Мартина Тинсли, который пожаловался на плохое самочувствие и снялся с соревнований. Техническая победа была присуждена машине. У Тинсли после госпитализации обнаружили рак поджелудочной железы. Он умер в апреле 1995 года, но де-факто остался непобежденным.

Однако 1994-й все же считается переломным моментом в истории шашечного противостояния человека и машины. И уже в следующем году отобрать титул абсолютного чемпиона у Chinook пробовал Дон Лафферти. Их встреча завершилась счетом 1:0 в пользу машины при 30 партиях, сыгранных вничью.

С тех пор совершенствование компьютерных возможностей не оставило людям никаких шансов на выигрыш в шашках. Более того, в 2007 году та же команда из Альбертского университета объявила, что за прошедшие 18 лет сумела найти идеальную стратегию игры, которая не позволяет машине проиграть даже самому виртуозному противнику.

При этом стоит отметить, что Chinook не был собственно искусственным интеллектом – то есть не мог самообучаться, а лишь пользовался заложенными алгоритмами и анализировал ситуацию на доске. Программа умещалась в массивном компьютере весом в полтонны и за 60 секунд успевала обработать 12 миллионов различных вариантов действия. Фактически все возможные ходы были заранее заложены в нем в виде комбинаций, из которых программе оставалось только выбрать оптимальную.

Шахматы

Следующим вызовом для программистов стали шахматы. История попыток создать программу-шахматиста намного длиннее истории компьютеров. Эта мысль пользовалась популярностью еще в XVIII веке, в результате чего был даже построен «механический турок». Правда, хорошая игра этого автомата объяснялась исключительно тем, что внутри него прятался настоящий шахматист, который и вел партию.

В 1950-х годах компания с мировым именем IBM начала интересоваться шахматными системами. Компьютеризация в середине прошлого века была еще в зачаточном состоянии, и машины откровенно пасовали даже перед игроками-любителями, а процесс создания шахматных алгоритмов отнимал очень много времени. Зато в конце 1980-х IBM вернулась к идее создания компьютера-шахматиста.

Предшественниками знаменитой машины Deep Blue были аппараты Deep Thought и ChipTest, созданные независимыми от IBM разработчиками. В частности, в 1987 году ChipTest выиграл 18-й Северо-Американский чемпионат по шахматам среди компьютерных программ, а Deep Thought в 1988-м поделил первое место с гроссмейстером Энтони Майлсом, а в 1989-м победил на чемпионате мира по шахматам среди компьютерных программ. Однако уже в 1989 – 1990 годах Deep Thought потерпел двойное фиаско: сначала проиграл Гарри Каспарову со счетом 0:2, а затем Анатолию Карпову со счетом 0:1. Однако определенный успех программы привлек внимание IBM, которая в 1989-м предложила выгодные контракты авторам Deep Thought.

В итоге в 1995 году, после 6 лет работы, появился суперкомпьютер Deep Blue. «Тренером» машины стал нанятый IBM гроссмейстер Джоэл Бенджамин. Через несколько месяцев программисты вновь бросили вызов лучшему шахматисту всех времен Гарри Каспарову. Встреча состоялась в 1996-м и закончилась с результатом 4:2 в пользу человека. Гарри Каспаров тогда прокомментировал ситуацию так: «Хотя я и видел некоторые признаки интеллекта, у компьютера все-таки была неэффективная и негибкая манера игры. Это позволяет мне думать, что у меня есть несколько лет в запасе».

Однако великий шахматист ошибся. Специалисты IBM модифицировали Deep Blue, в результате чего скорость оценки ситуации на доске превысила 200 млн. позиций в секунду. «Тренировкой» машины занялась целая команда гроссмейстеров – Джоэл Бенджамин, Ник де Фирмиан, Джон Федорович и Мигель Ильескас.

Напряженный матч-реванш между Deep Blue и Гарри Каспаровым, состоявшийся через год после их первой встречи, закончился победой компьютера со счетом 3Ѕ:2Ѕ. Гроссмейстер был ужасно недоволен, обвинил организаторов в давлении и нагнетании атмосферы в прессе, после чего потребовал реванша на своих условиях. И хотя представители компании IBM отказались от проведения повторного матча, сославшись на выполнение заявленной задачи, этот год так же, как и в случае с шашками, стал переломным. Дальнейшее развитие информатики и техники привело к тому, что компьютерные программы стали заметно доминировать в шахматах над суперпрофессиональными игроками-людьми. Так, согласно рейтингу Эло, который рассчитывает относительную силу игроков в парных играх, самая сильная шахматная программа Stockfish набирает 3341 пункт, в то время как у действующего чемпиона мира Магнуса Карлсена этот показатель составляет всего 2850,6.

При этом Deep Blue, как и его коллега в шашках Chinook, не был в полноценном смысле искусственным интеллектом. Он использовал огромное число микропроцессоров, совокупная мощность которых позволяла производить вычисления и ориентироваться в дереве ходов. По сути это тоже была очень мощная вычислительная машина без признаков полноценного ИИ.

Последний бастион человечества

Вместе с покорением шашек и шахмат компьютеры вполне уверенно разобрались с другими популярными играми, такими как нарды, крестики-нолики, реверси и многими другими. Фактически, после 1997 года у людей остался единственный непокоренный форт под названием игра го.

Го – древняя игра, первые упоминания о которой относятся к VI веку до н. э. Игра ведется на доске-гобане, разлинованной 19 горизонтальными и 19 вертикальными линиями. В ходе противостояния игроки выкладывают по очереди черные и белые камни в уголки образовавшихся клеток с целью отгородить на игровой доске камнями своего цвета большую территорию, чем противник. Если один из соперников захватывает территорию с камнями другого, он снимает «вражеские» камни. Игру начинают черные.

Вокруг го сформирована целая индустрия любительских и профессиональных школ, а также введена каноничная иерархия мастерства, сходная с таковой в восточных боевых искусствах. Так, согласно самой распространенной схеме, профессиональным игрокам присваиваются даны от 1 до 9, а наивысший, 10-й дан (дзюдан) считается не индикатором ранга, а титулом.

Попытки написать компьютерную программу для победы в го предпринимались более 50 лет. Фактически, этой задачей стали интересоваться наравне с покорением шахмат. Однако если шахматная эпопея закончилась победой Deep Blue в 1997 году, то машины-игроки в го по-прежнему обламывали зубы об экспертов мирового уровня.

Причина фиаско компьютеров крылась в огромной вариативности и разветвленности игры. Так, в начале шахматной партии у белых есть 20 возможных ходов, а у черных – 20 вариантов ответа. На старте партии в го у черных есть 361 вариант, а у белых – 360. После первого раунда общее число комбинаций взлетает до 129 960. При этом среднее количество вариантов хода в каждом раунде в шахматах составляет 35, а в го – 250. Ориентироваться в таком огромном потоке возможностей человеку помогает интуиция, а у компьютера есть лишь алгоритмы и схемы анализа, пусть и самые совершенные. Так что принципы, по которым создавались программы для игры в шашки, шахматы и другие игры, абсолютно неприменимы в го.

Неудачи компьютеров в этой игре продолжались довольно долго, пока в 2015 году в лаборатории компании Google DeepMind не был создан искусственный интеллект для игры в го под названием AlphaGo.

Чтобы выиграть, нужно думать

Устройство и принцип работы AlphaGo существенно отличаются от предыдущих программ. Разработка британского подразделения Google является самообучаемым искусственным интеллектом с невероятно сложной внутренней архитектурой.

Так, Deep Blue был напичкан информацией о начале шахматной партии, располагал опытом тысяч игр гроссмейстеров и был специально создан для победы над конкретным человеком – Гарри Каспаровым. AlphaGo – гораздо более универсальная машина. Она сама изучает противника в ходе игры и каждый раз избирает особенную тактику. Кроме того, в AlphaGo изначально никто не вносил сценарии развития партии и сотни тысяч примеров ее ведения. Не столько потому, что это непомерно огромный объем информации, сколько потому, что программа строилась на ином принципе, основанном на использовании общих алгоритмов правил, то есть копирующем обучение обычного человека в игру го – как ходить, как считать, как захватывать камни соперника и так далее. На основе этих универсальных данных AlphaGo уже сам стал обучаться путем знакомства с базой данных профессиональных игр го и проводя собственные игры.

Достижение такого высокого уровня интеллекта машины стало возможным благодаря применению технологии распознавания образов, базирующейся на глубинном обучении и устройстве нейронных сетей. Принцип работы такой системы выглядит следующим образом. На нейронную сеть транслируется множество изображений, на которых система учится распознаванию. Благодаря функции глубинного обучения и нескольким уровням нейронной сети (так называемые сверточные нейронные сети), по прошествии довольно долгого времени программа обретает способность самостоятельно находить и весьма точно распознавать графические изображения. Опираясь на эти методы, AlphaGo действует на уровне двух нейронных сетей: стратегической и оценочной. Первая оптимизирует число рассматриваемых ходов для каждой позиции, вторая производит оценку текущего положения без траты ресурса и времени на вычисление в дереве вариантов.

Таким образом, ученые из Google DeepMind сумели создать полноценный самообучающийся искусственный интеллект, который обладает универсальными способностями применения своих знаний в рамках игры го. И после успешных внутренних тестов был проведен первый серьезный матч, в котором AlphaGo встретился с чемпионом Европы Фань Хуэем (2-й профессиональный дан). Итог этой схватки стал сенсацией – впервые в истории компьютер смог выиграть у профессионала в равной игре, причем выиграть триумфально, разгромив соперника со счетом 5 – 0. После этой победы разработчики решили не мелочиться и организовали встречу с самым сильным игроком планеты – 33-летним Ли Седолем из Кореи, который обладал наивысшим 9-м профессиональным даном по игре в го.

Матч века

Стоит отметить, что матчи века в истории игры го уже случались. Взять хотя бы встречу 1933 года, когда за гобаном встретились молодой китайский гений Го Сэйгэн, автор революционных изменений в теории го, и уважаемый мэйдзин Хонъимбо Сюсаи из дома династических профессиональных игроков в го, олицетворявший мощь традиционной японской школы. Этот матч продлился более трех месяцев, главным образом из-за того, что игроки подолгу обдумывали свои ходы. Победителем стал Хонъимбо Сюсаи, сумевший переломить равную игру на 160-м ходу.

Нынешний «матч века» между человеком и машиной уж точно не уступил по накалу страстей тому знаменитому поединку. Впервые соревновались не просто представители соперничающих государств, а два абсолютно разных интеллекта – рукотворный бриллиант компьютерной мысли и гениальный биологический разум.

Структура встречи подразумевала проведение 5 партий, которые были назначены на 9, 10, 12, 13 и 15 марта текущего года. Площадкой для знакового поединка выступил отель Four Seasons в Сеуле. Игра велась по китайскому варианту правил, в закрытом зале, в присутствии трех наблюдателей, среди которых был и побежденный машиной трехкратный чемпион Европы по го Фань Хуэй. Со стороны AlphaGo физически ставил камни на доску член команды разработчиков Эйжа Хван, обладатель 6-го любительского дана. Болельщики могли наблюдать за матчем века в Интернете через сервис YouTube, организовавший прямую трансляцию. Комментировали ход игры на английском и корейском языках. Призовой фонд матча составил 1 млн. долларов. Стоит отметить, что матч прошел безупречно, и не возникло ни одного повода для вмешательства наблюдателей.

Интересно, что команда разработчиков приняла решение использовать фиксированную версию программы для каждой партии, то есть сознательно не давала ей обучаться на сыгранных против Ли Седоля партиях. Машина была вынуждена каждый раз определять стратегию своей игры заново, в то время как человек, безусловно, держал в голове все сыгранные партии во время матча.

Ход игры

В первой партии «матча века» комментаторы и сам Ли Седоль отметили, что машина играет на суперпрофессиональном уровне, которого ей удалось достичь после тщательного анализа встреч с Фань Хуэнем. Ли играл черными, а AlphaGo – белыми. Партия продолжалась 3,5 часа и закончилась на 186-м ходу победой машины. Человек мастерски держал игру под контролем практически все время, однако в начале третьего часа проявились последствия нескольких его ошибок в начале партии, благодаря чему компьютер смог захватить преимущество и вынудить чемпиона сдаться. Комментируя партию, Ли Седоль отметил, что развертывание в начале игры со стороны AlphaGo было великолепным.

Во второй партии компьютер играл черными, а его оппонент – белыми. Матч продлился 4 часа и снова закончился победой искусственного интеллекта. На этот раз машина не дала человеку шанса и доминировала на всем протяжении партии. Грустный комментарий Ли Седоля гласил, что «с самого начала партии он не ощущал ни одного момента, где он бы лидировал». Уровень мастерства игры и машины, и человека ярко иллюстрирует тот факт, что к середине матча комментаторы еще не могли понять, кто же из участников побеждает, в то время как AlphaGo уже «знала» о своей победе, а ее противник не видел способа избежать поражения. Интересно, что в этот раз программа избрала такую стратегию игры, при которой некоторые ее ходы казались ошибочными. Они вводили оппонента в заблуждение и провоцировали на перехват инициативы, в то время как на самом деле были хорошо замаскированными ловушками.

Третью партию противники начинали, как и первую: Ли Седоль играл черными, а AlphaGo – белыми. Ли прекрасно понимал важность этой встречи, так как поражение означало бы проигрыш во всем матче. Однако создалось ощущение, что машина тоже осознает всю значительность момента, так как на весьма агрессивную манеру игры чемпиона AlphaGo отвечала безошибочно, да еще и успевала успешно проводить экспансию. На 131-м ходу Ли Седоль откровенно провоцировал программу на ошибку агрессивными тактическими действиями, однако компьютер не дрогнул и блистательно провел свою часть партии до 176-го хода, на котором чемпион сдался.

И если после второй партии кто-то из комментаторов еще выказывал сомнение, что искусственный интеллект, созданный в британских лабораториях, является самым лучшим мастером го на свете, то после третьей встречи такой скептицизм испарился. Компьютер открыто называли «игроком, который сильнее любого известного игрока-человека».

Таким образом, уже в третьей партии машина завоевала себе победу во всем матче, доказав свое неоспоримое превосходство над лучшим игроком планеты. Однако Ли Седоль и не думал сдаваться. Он мужественно принял факт поражения и выразил желание довести встречу до конца.

Партии престижа

Фортуна любит смельчаков – возможно, поэтому четвертая партия удалась Ли Седолю лучше предыдущих. Играя белыми, он сконцентрировался на захвате территории в углах и по краям доски, после чего на 40-х ходах провел экспансию в зону влияния противника. AlphaGo начала успешно обороняться и в какой-то момент, казалось, снова могла перехватить инициативу, однако исход партии круто перевернуло решение Ли Седоля, который совершил «божественный ход» под номером 78. Это не художественный оборот – в терминологии го так называется особый, единственно верный и гениальный ход, озарение, случающееся буквально раз в жизни и чаще всего в критический момент партии. Так игрок сумел развить свое превосходство и победить машину в конце четвертого часа игры.

Во время пресс-конференции после завершения четвертой партии он комментировал свою победу: «Так как я проиграл три матча, а затем смог вырвать одну победу, эта победа является настолько ценной, что я не променял бы ее ни на что в мире».

Проведение пятой встречи стало делом принципа. Кроме того, всем участникам процесса было интересно поведение машины – в сердцах тлела надежда, что Ли Седоль сумел подобрать ключ для слома стратегии AlphaGo, который и позволил чемпиону победить. Встреча вышла весьма напряженной и продлилась 5 часов. Соперники практически заполнили доску камнями и выбрали почти все возможные ходы. В самом начале игры Ли Седоль воспользовался промахом программы и успешно вел партию практически до самого конца. Большую часть поединка искусственный интеллект играл либо на равных, либо в худших условиях, чем человек, однако благодаря грамотной защите сумел к концу игры завоевать себе небольшое преимущество. К концу партии Ли Седоль понял, что не сможет перекрыть машину по очкам и сдался на 280-м ходу. «Матч века» между машиной и человеком в го завершился с разгромным счетом 4 – 1 в пользу AlphaGo.

По итогам последней встречи Ли Седоль заявил, что человеческий фактор и способности мозга все же имеют свои недостатки по сравнению с искусственным интеллектом. В частности, по его словам, «это был не вопрос способностей или уровня, а концентрации. Машина может постоянно быть сконцентрированной, а у меня где-то не получилось». При этом уже бывший чемпион мира отметил, что не уверен в своей победе над AlphaGo в случае матча-реванша. Вслед за ним подобную неуверенность выразили и другие ведущие игроки, стоящие в рейтинге ниже Ли Седоля.

Стоит отметить достойную реакцию Корейской ассоциация падук (го), которая присвоила AlphaGo наивысший игровой ранг — «почетный 9-й дан» за «искренние усилия» программы в овладении мастерством игры. Реакция же общественности была не такой сдержанной. Победу AlphaGo приравняли к эпохальной победе Deep Blue над Гарри Каспаровым. В Корее, как и во всем мире, с новой силой вспыхнули разговоры на тему падения человеческой цивилизации и начала эры искусственного интеллекта.

Ученые, впрочем, гораздо лучше представляют перспективы развития искусственного интеллекта. Согласно комментарию специалистов, при всей гигантской вычислительной мощности машинам все равно будет не хватать креативности, непредсказуемости и оригинальности мышления, которыми с детства обладает любой человек.

Кроме того, соперничество машин и людей в игровой индустрии продиктовано скорее необходимостью проверить искусственный интеллект в условиях цейтнота и необходимости обрабатывать огромные массивы информации. Сюда же входят тесты оценки текущей информации, принятия решений и прогнозирования результата. Таким образом, игра роботов – это тоже своего рода игровая подготовка к использованию машин в куда более важных сферах – в медицине, производстве, науке. А значит, в конечном итоге компьютеры будут не конкурировать с человеком, а сотрудничать с ним.