81026 | ИПУ РАН

Автор(ы):

Героев А. С. (ИПУ РАН, Лаборатория 80)

Гергет О. М. (ИПУ РАН, Лаборатория 80)

Автор(ов):

Параметры публикации

Тип публикации:

Доклад

Название:

Влияние метаокружений на подбор гиперпараметров системы обучения с подкреплением

ISBN/ISSN:

978–5–907890–08–4

Наименование конференции:

23-я Международная конференция им. А. Ф. Терпугова «Информационные технологии и математическое моделирование» (ИТММ–2024, Томск)

Наименование источника:

Материалы 23-й Международной конференции им. А. Ф. Терпугова «Информационные технологии и математическое моделирование» (ИТММ–2024, Томск)

Обозначение и номер тома:

№ 1

Город:

Томск

Издательство:

Томский государственный университет

Год издания:

2024

Страницы:

269-274

Аннотация

В работе представлен анализ влияния различных метаокруже- ний на выбор и настройку гиперпараметров системы управле- ния шагающего робота. Была проведена серия экспериментов по управлению роботом на разных ландшафтах с одинаковыми ар- хитектурами агентов и с отличающимся набором гиперпарамет- ров. На основании результатов экспериментов был сделан вывод о том, что метаокружение агента может напрямую влиять на из- менение его Q-функции, если оно допускает нахождение агента в состояниях стагнации. Состояния стагнации — состояние агента, при котором всевозможные действия агента не приводят к изме- нению значения функции вознаграждения. Ключевые слова: обучение с подкреплением, метаокружение, DDPG.

Библиографическая ссылка:

Героев А.С., Гергет О.М. Влияние метаокружений на подбор гиперпараметров системы обучения с подкреплением / Материалы 23-й Международной конференции им. А. Ф. Терпугова «Информационные технологии и математическое моделирование» (ИТММ–2024, Томск). Томск: Томский государственный университет, 2024. № 1. С. 269-274.