В работе представлен анализ влияния различных метаокруже-
ний на выбор и настройку гиперпараметров системы управле-
ния шагающего робота. Была проведена серия экспериментов по
управлению роботом на разных ландшафтах с одинаковыми ар-
хитектурами агентов и с отличающимся набором гиперпарамет-
ров. На основании результатов экспериментов был сделан вывод
о том, что метаокружение агента может напрямую влиять на из-
менение его Q-функции, если оно допускает нахождение агента в
состояниях стагнации. Состояния стагнации — состояние агента,
при котором всевозможные действия агента не приводят к изме-
нению значения функции вознаграждения. Ключевые слова:
обучение с подкреплением, метаокружение, DDPG.