82188 | ИПУ РАН

Автор(ы):

Автор(ов):

Параметры публикации

Тип публикации:

Статья в журнале/сборнике

Название:

Многослойный перцептрон коррекции действий для преодоления барьера между симуляцией и реальным миром при обучении политик четвероногих роботов

Электронная публикация:

Да

ISBN/ISSN:

1819-5822

DOI:

10.53921/18195822_2025_25_3_395

Наименование источника:

Информационные процессы

Обозначение и номер тома:

Т.25, №3

Город:

Москва

Издательство:

Институт проблем передачи информации им. А. А. Харкевича Российской академии наук

Год издания:

2025

Страницы:

395-403

Аннотация

В работе представлен инновационный подход к преодолению барьера переноса политик обучения с подкреплением между различными физическими симуляторами (Sim2Sim). Предложена архитектура Action Correction Network (ACN) — двухкомпонентной нейронной сети, осуществляющей коррекцию действий политики с учетом расхождений в динамике симуляторов. Экспериментально показана эффективность метода на примере переноса политики ходьбы для четвероногого робота Unitree A1 между симуляторами PyBullet и MuJoCo. Исходный код и материалы доступны в открытом доступе: https://github.com/antwoor/sim2sim.

Библиографическая ссылка:

Героев А.С., Гергет О.М. Многослойный перцептрон коррекции действий для преодоления барьера между симуляцией и реальным миром при обучении политик четвероногих роботов // Информационные процессы. 2025. Т.25, №3. С. 395-403.