81026

Автор(ы): 

Автор(ов): 

2

Параметры публикации

Тип публикации: 

Доклад

Название: 

Влияние метаокружений на подбор гиперпараметров системы обучения с подкреплением

ISBN/ISSN: 

978–5–907890–08–4

Наименование конференции: 

  • 23-я Международная конференция им. А. Ф. Терпугова «Информационные технологии и математическое моделирование» (ИТММ–2024, Томск)

Наименование источника: 

  • Материалы 23-й Международной конференции им. А. Ф. Терпугова «Информационные технологии и математическое моделирование» (ИТММ–2024, Томск)

Обозначение и номер тома: 

№ 1

Город: 

  • Томск

Издательство: 

  • Томский государственный университет

Год издания: 

2024

Страницы: 

269-274
Аннотация
В работе представлен анализ влияния различных метаокруже- ний на выбор и настройку гиперпараметров системы управле- ния шагающего робота. Была проведена серия экспериментов по управлению роботом на разных ландшафтах с одинаковыми ар- хитектурами агентов и с отличающимся набором гиперпарамет- ров. На основании результатов экспериментов был сделан вывод о том, что метаокружение агента может напрямую влиять на из- менение его Q-функции, если оно допускает нахождение агента в состояниях стагнации. Состояния стагнации — состояние агента, при котором всевозможные действия агента не приводят к изме- нению значения функции вознаграждения. Ключевые слова: обучение с подкреплением, метаокружение, DDPG.

Библиографическая ссылка: 

Героев А.С., Гергет О.М. Влияние метаокружений на подбор гиперпараметров системы обучения с подкреплением / Материалы 23-й Международной конференции им. А. Ф. Терпугова «Информационные технологии и математическое моделирование» (ИТММ–2024, Томск). Томск: Томский государственный университет, 2024. № 1. С. 269-274.