84442

Автор(ы): 

Автор(ов): 

2

Параметры публикации

Тип публикации: 

Статья в журнале/сборнике

Название: 

Генерация решений для предотвращения конфликта двух воздушных судов на основе обучения с подкреплением

Электронная публикация: 

Да

ISBN/ISSN: 

1819-2467

Наименование источника: 

  • Управление большими системами

Обозначение и номер тома: 

вып. 120

Город: 

  • Москва

Издательство: 

  • ИПУ РАН

Год издания: 

2026

Страницы: 

369-389
Аннотация
Выделены две основные постановки задачи предотвращения конфликтов воздушных судов на основе обучения с подкреплением: автономное разрешение конфликтов между несколькими воздушными судами на основе многоагентного глубокого обучения с подкреплением и генерация решения по предотвращению конфликтов для систем поддержки принятия решений авиадиспетчерами. При современной организации воздушного движения актуальна вторая постановка, поскольку для внедрения полностью автоматических методов имеются серьезные проблемы сертификации методов машинного обучения в гражданской авиации, где критически важна безопасность. В статье рассматривается задача генерации горизонтального маневра предотвращения конфликта двух воздушных судов при помощи обучения с подкреплением. В отличие от работ, в которых рассматриваемая задача решается в непрерывном пространстве действий, предлагается обучать агента действиям в дискретном пространстве, что больше соответствует действиям авиадиспетчеров по централизованному предупреждению конфликтов. Приводится формализация задачи в виде марковского процесса принятия решений. Кратко описаны алгоритмы обучения с подкреплением «двойные глубокие Q-сети» и «проксимальная оптимизация политики», выбранных для решения задачи. Представлены результаты обучения и тестирования агента в разработанной среде моделирования с помощью реализованных алгоритмов, приводится сравнение их эффективности.

Библиографическая ссылка: 

Кулида Е.Л., Лебедев В.Г. Генерация решений для предотвращения конфликта двух воздушных судов на основе обучения с подкреплением // Управление большими системами. 2026. вып. 120. С. 369-389.