Из-за активного развития технологий машинного обучения, искусственного интеллекта и робототехники многие специалисты высказывают свои опасения касательно возможности так называемого восстания машин. Не в последнюю очередь это связано с тем, что во многочисленных фантастических рассказах и фильмах роботы подчиняли себе человечество или же вовсе уничтожали людей по той или иной причине. Чтобы этого не произошло, два крупнейших разработчика в области искусственного интеллекта решили объединить свои усилия. Речь идёт о компаниях DeepMind, принадлежащей Google, и Open AI, основанной Илоном Маском — создателем SpaceX и Tesla Motors.
DeepMind и Open AI опубликовали исследовательскую статью, в которой описывается новый метод машинного обучения. Его суть заключается в получении сигналов от людей для изучения новых задач. Специалисты считают, что это должно быть безопаснее, чем позволять искусственному интеллекту самостоятельно решать ту или иную задачу, что может привести к неожиданным последствиям.
По мнению исследователей, главная проблема заключается в том, что искусственный интеллект использует наиболее эффективный метод для достижения максимальной выгоды. Это сравнимо с тем, чтобы сгрести все разбросанные вещи с пола в шкаф и назвать эту комнату чистой. Чисто технически комната действительно является чистой, но это не тот результат, который требуется. Машины способны находить такие обходные пути и использовать их для решения любой проблемы.
Насущная проблема заключается в системе вознаграждений. Именно в этом направлении обе компании сосредоточили свои усилия. Вместо того, чтобы создавать чрезмерно сложную систему вознаграждения, которую могут обойти машины, исследователи использовали человеческий вклад для вознаграждения искусственного интеллекта. Когда машина решает проблему, как этого хотели тренеры, она получает положительный отзыв. С помощью этого метода система смогла научиться играть в простые видеоигры.
В DeepMind и Open AI только начали работать в этом направлении, но компании считают, что контроль со стороны человека поможет предотвратить нежелательные последствия решений, принятых машинами.