82188

Автор(ы): 

Автор(ов): 

2

Параметры публикации

Тип публикации: 

Статья в журнале/сборнике

Название: 

Многослойный перцептрон коррекции действий для преодоления барьера между симуляцией и реальным миром при обучении политик четвероногих роботов

Электронная публикация: 

Да

ISBN/ISSN: 

1819-5822

DOI: 

10.53921/18195822_2025_25_3_395

Наименование источника: 

  • Информационные процессы

Обозначение и номер тома: 

Т.25, №3

Город: 

  • Москва

Издательство: 

  • Институт проблем передачи информации им. А. А. Харкевича Российской академии наук

Год издания: 

2025

Страницы: 

395-403
Аннотация
В работе представлен инновационный подход к преодолению барьера переноса политик обучения с подкреплением между различными физическими симуляторами (Sim2Sim). Предложена архитектура Action Correction Network (ACN) — двухкомпонентной нейронной сети, осуществляющей коррекцию действий политики с учетом расхождений в динамике симуляторов. Экспериментально показана эффективность метода на примере переноса политики ходьбы для четвероногого робота Unitree A1 между симуляторами PyBullet и MuJoCo. Исходный код и материалы доступны в открытом доступе: https://github.com/antwoor/sim2sim.

Библиографическая ссылка: 

Героев А.С., Гергет О.М. Многослойный перцептрон коррекции действий для преодоления барьера между симуляцией и реальным миром при обучении политик четвероногих роботов // Информационные процессы. 2025. Т.25, №3. С. 395-403.