Искусственный интеллект Google DeepMind получил «ускоритель» процесса обучения

Кaк глaсит нaрoднaя мудрoсть, «учeньe свeт, a нeучeньe тьмa». Свoйствa oднoгo будут экстрaпoлирoвaться нa свoйствa другoгo, дoпoлняясь тaм, гдe eсть знaчитeльныe рaзличия. В скoрoм врeмeни рaзрaбoтчики плaнируют aдaптирoвaть UNREAL к дeйствиям в бoлee слoжнoй oкружaющeй срeдe, нeжeли кoмпьютeрныe игры и трехмерные лабиринты, что позволит использовать быстрообучаемые системы искусственного интеллекта в реальном мире для решения множества задач. «Сейчас наш ИИ обыгрывает среднестатистического человека на 880 процентов в простейших компьютерных играх. Ознакомиться с работой алгоритма можно с помощью видео, доступного ниже. При этом система может вспоминать и те моменты, когда ей был получен отрицательный результат, что помогает избежать тех же ошибок в новых ситуациях. Им, скорее всего, показалось, что ИИ недостаточно быстро усваивает новую информацию и приобретает новые навыки, поэтому они разработали алгоритм, ускоряющий процессы распознавания, узнавания и систематизации новых знаний. Один из авторов технологии UNREAL Лиам Танг указывает:

«В основу работы алгоритма были заложены те же самые принципы познавания и самообучения, которые в свое время позволили искусственному интеллекту одержать победу над Ли Сеголем, мировым чемпионом по древней китайской игре го. Однако на их подготовку, первоначальное обучение и последующее самообучение тратится слишком много времени». Видимо, этого же принципа придерживаются и специалисты компании Google, ответственные за развитие DeepMind. А при решении более сложных задач в трехмерном лабиринте он показывает 10-кратное увеличение скорости самообучения и среднее 87-процентное превосходство над человеком, демонстрируя в некоторые моменты времени поистине сверхчеловеческие возможности». Наши самообучаемые системы уже добились значительных успехов в игре го и в играх для старых компьютеров. Если раньше в процессе обучения DeepMind учился прогнозировать, к чему может привести то или иное действие, то сейчас ИИ будет основываться на предыдущем опыте и с похожими по свойствам объектами (скажем, с яблоком и грушей), уже не нужно будет проводить так много времени на изучение. Вторая технология основана на возможности повторного анализа уже произошедших ситуаций, в ходе которых системой был приобретен тот или иной опыт. «Ускоритель» получил название UNREAL (Unsupervised Reinforcement and Auxiliary Learning), и его работа уже прошла успешную серию тестов на более чем 50 играх для компьютера Atari и среде трехмерного лабиринта Labyrinth, состоящей из 13 уровней. Во первых, был изменен подход, отвечающий за изучение того, как те или иные действия взаимодействуют с отображаемым на экране. Ускорение процесса обучения было достигнуто за счет внедрения двух инновационных моментов.

Комментарии и уведомления в настоящее время закрыты..

Комментарии закрыты.