51886

Автор(ы): 

Автор(ов): 

1

Параметры публикации

Тип публикации: 

Статья в журнале/сборнике

Название: 

Формирование оптимального маршрута больших групп интеллектуальных агентов

Электронная публикация: 

Да

ISBN/ISSN: 

ISSN 1819-2467

DOI: 

10.25728/ubs.2019.78.3

Наименование источника: 

  • Управление большими системами

Обозначение и номер тома: 

вып. 78

Город: 

  • Москва

Издательство: 

  • ИПУ РАН

Год издания: 

2019

Страницы: 

46-70 https://doi.org/10.25728/ubs.2019.78.3
Аннотация
В подходе Artificial General Intelligence (Universal AI) интеллект рассматривается как информационный процессор, потребляющий и выдающий информацию, которой и определяется поведение системы. В рамках этого подхода M. Hutter получил способ выбора оптимальной траектории агента в абстрактной среде. Однако этот способ требовал численных оценок вознаграждения при том или ином движении, способ получения которых оставался открытым. Также этот метод не подходит для оценок движения группы агентов. В этой работе оценки вознаграждений предоставляются самой средой и предложен способ выбора траектории, который применим для группы агентов. Параллельное выполнение группой интеллектуальных агентов ряда задач, представляется тензорным произведением соответствующих процессов в категории игр (games) Конвея, которая сопоставлена среде и движениям агентов. Оптимальный маршрут группы определяется как игра (play) с наибольшим суммарным выигрышем в этой категории. Выигрыш представлен степенью определенности (видимости) цели агента, т.е. некоторым множеством, а не числом. Доказано, что такое определение выигрыша может быть использовано в категорной конструкции для игр Конвея. В этой категории тензорное произведение является операцией линейной логики. Также линейная логика применяется для выбора целей, которые система может достичь, из всего множества видимых целей. Для этого все множество целей представляется в виде решетки, на которой задана структура линейной логики. Решетка целей, в этом случае, становится множеством истинностных значений логики. Целям, которые достигаются параллельно, так же соответствует тензорное произведение (как и параллельным процессам в среде), но только теперь это произведение элементов решетки целей. Цели выбираются по наибольшей степени истинности элемента решетки, который соответствует их параллельному достижению. В результате получена формула для оценки наиболее выигрышного маршрута в абстрактной среде для группы агентов.

Библиографическая ссылка: 

Максимов Д.Ю. Формирование оптимального маршрута больших групп интеллектуальных агентов // Управление большими системами. 2019. вып. 78. С. 46-70 https://doi.org/10.25728/ubs.2019.78.3 .