В данной статье предлагается метод решения проблемы навигации безэкипажного судна в условиях высокой неопределенности. Основная цель – заставить агента обучения с подкреплением выучить алгоритм, позволяющий безэкипажному судну следовать по определенной траектории, избегая столкновений с другими объектами. Маневрирование безэкипажного судна в предложенных условиях является основной темой данной работы. В ходе исследования было изучено несколько сценариев со статическими и динамическими объектами. Обучение агента проводилось с помощью алгоритмов, не требующих моделирования и не связанных с алгоритмом управления напрямую. Процесс обучения был разделен на несколько частей, в которых мы экспериментировали с элементами подхода метаобучения для достижения устойчивости поведения агента.