51886 | ИПУ РАН

Автор(ы):

Максимов Д. Ю. (ИПУ РАН, Лаборатория 11)

Автор(ов):

Параметры публикации

Тип публикации:

Статья в журнале/сборнике

Название:

Формирование оптимального маршрута больших групп интеллектуальных агентов

Электронная публикация:

Да

ISBN/ISSN:

1819-2467

DOI:

10.25728/ubs.2019.78.3

Наименование источника:

Управление большими системами: сборник трудов

Обозначение и номер тома:

вып. 78

Город:

Москва

Издательство:

ИПУ РАН

Год издания:

2019

Страницы:

46-70 https://doi.org/10.25728/ubs.2019.78.3

Аннотация

В подходе Artificial General Intelligence (Universal AI) интеллект рассматривается как информационный процессор, потребляющий и выдающий информацию, которой и определяется поведение системы. В рамках этого подхода M. Hutter получил способ выбора оптимальной траектории агента в абстрактной среде. Однако этот способ требовал численных оценок вознаграждения при том или ином движении, способ получения которых оставался открытым. Также этот метод не подходит для оценок движения группы агентов. В этой работе оценки вознаграждений предоставляются самой средой и предложен способ выбора траектории, который применим для группы агентов. Параллельное выполнение группой интеллектуальных агентов ряда задач, представляется тензорным произведением соответствующих процессов в категории игр (games) Конвея, которая сопоставлена среде и движениям агентов. Оптимальный маршрут группы определяется как игра (play) с наибольшим суммарным выигрышем в этой категории. Выигрыш представлен степенью определенности (видимости) цели агента, т.е. некоторым множеством, а не числом. Доказано, что такое определение выигрыша может быть использовано в категорной конструкции для игр Конвея. В этой категории тензорное произведение является операцией линейной логики. Также линейная логика применяется для выбора целей, которые система может достичь, из всего множества видимых целей. Для этого все множество целей представляется в виде решетки, на которой задана структура линейной логики. Решетка целей, в этом случае, становится множеством истинностных значений логики. Целям, которые достигаются параллельно, так же соответствует тензорное произведение (как и параллельным процессам в среде), но только теперь это произведение элементов решетки целей. Цели выбираются по наибольшей степени истинности элемента решетки, который соответствует их параллельному достижению. В результате получена формула для оценки наиболее выигрышного маршрута в абстрактной среде для группы агентов.

Библиографическая ссылка:

Максимов Д.Ю. Формирование оптимального маршрута больших групп интеллектуальных агентов // Управление большими системами: сборник трудов. 2019. вып. 78. С. 46-70 https://doi.org/10.25728/ubs.2019.78.3 .