ВЕСТИ

Прямой Эфир

    Прогнозы

      Создан искусственный интеллект, способный играть во все игры

      Москва, 7 декабря - "Вести.Экономика" Разработчики революционной самообучающейся системы искусственного интеллекта AlphaGo объявили о создании новой версии, нейросети AlphaZero, способной самостоятельно учиться играть в любую настольную игру и обыгрывать человека.

      Система искусственного интеллекта AlphaGo появилась в 2014 г. С тех пор ИИ победил лучших игроков в го и одержал 60 побед на двух китайских онлайн-платформах с настольными играми FoxGo и Tygem. Алгоритм состоит из двух нейросетей, которые имитируют работу нейронов в мозге.

      Победы AlphaGo ознаменовали собой важный прорыв в области искусственного интеллекта, так как большинство специалистов по искусственному интеллекту считали, что подобная программа не будет создана ранее 2020—2025 гг. В марте 2016 г. программа выиграла со счетом 4:1 у Ли Седоля, профессионала 9-го дана (высшего ранга), во время исторического матча, широко освещавшегося в прессе.

      Победу AlphaGo над Ли Седолем часто сравнивают с шахматным матчем между программой Deep Blue и Гарри Каспаровым 1997 г., где победа программы, созданной IBM, над действовавшим чемпионом стала символической точкой отсчета новой эпохи, когда компьютеры превзошли людей в шахматах.

      Теперь подразделение Alphabet по исследованию искусственного интеллекта DeepMind подробно рассказало об успехах нейросети AlphaZero, которая стала наследницей и продолжением нейросети AlphaGo, сообщается в статье журнала Science.

      В отличие от предшественников, AlphaZero не сосредоточена на освоении какой-то конкретной игры, но может в кратчайшие сроки без посторонней помощи научиться играть в любую настольную игру и обыгрывать человека. На данный момент система уже умеет играть в сложнейшую го, шахматы и сёги.

      Разработчики DeepMind добавили самообучение в программу для игры в го еще в 2017 г., когда выпустили предыдущее поколение алгоритма. Смысл этого обучения в том, что нейронная сеть программы не следит за поведением человека (как в первой версии AlphaGo), а играет сама с собой. Тогда AlphaGo Zero, зная лишь правила игры, за три дня "наиграла" столько удачных ходов, что со счетом по партиям 100:0 победила AlphaGo.

      Нейросети были известны лишь правила игры в го, начальные условия и условия победы. Затем компьютер самостоятельно учился играть. Система обучения ИИ строилась на анализе ходов. Нейросеть запоминала те, которые приближали ее к победе, и заносила в "черный список" те шаги, которые были откровенно проигрышными. Используя эти данные, нейросеть перестраивала себя, постепенно достигнув того уровня, на который вышла первая версия AlphaGo перед серией игр с Ли Седолем.

      Ученые встроили в AlphaGo Zero эвристические алгоритмы случайного поиска решений, а также код, учитывавший существование ничьи в некоторых играх. Вдобавок новая версия нейросети непрерывно совершенствовала свою структуру, а не обновлялась этапами, как ее предшественница. После полного цикла обучения (который для го занял 13 дней) AlphaZero на испытаниях показала 16% побед (против 0,6% поражения) в шахматах, 61% — в го и 91% — в сёги.

      По мнению Мюррея Кэмпбелла, который участвовал в создании компьютера Deep Blue, победившего Каспарова, следующим логичным шагом для развития искусственных интеллектов должны стать многопользовательские игры вроде Starcraft II и Dota 2. Пока команды "умных" ботов терпят там поражение. Слабой стороной искусственного интеллекта оказалась стратегия: боты реагировали на события, происходящие прямо сейчас, а не занимались долгосрочным планированием. Боты просчитывают последствия своих действий только на 14 минут вперед — у них просто нет механизма, позволяющего "заглянуть" дальше и оценить игру в целом.

      Но, разумеется, на играх системы искусственного интеллекта лишь тестируют. DeepMind намерена использовать мощь системы AlphaGo и ее последовательниц для поиска лекарств от тяжелых болезней, сокращения потребления электроэнергии и разработки новых революционных материалов.

      "Люди учились играть в шахматы, го, сёги и многие другие игры сотни и тысячи лет. AlphaZero самостоятельно достигла вершин мастерства во всех этих играх без какой-либо помощи с нашей стороны. Моя мечта — создать такую же систему, которая бы не просто умела играть, но и решать повседневные задачи, к примеру, создавала бы новые лекарства", — заявил Дэвид Сильвер, главный разработчик компании DeepMind.

      Новости партнеров

      Форма обратной связи

      Отправить

      Форма обратной связи

      Отправить