Статья «Quantal response equilibrium for the Prisoner’s Dilemma game in Markov strategies» опубликована в «Scientific Reports»

Авторы – к.ф.-м.н. И. В. Козицин, старший научный сотрудник Лаборатории №57 «Активных систем», к.ф.-м.н. Т. С. Козицина, научный сотрудник ФИЦ ИУ РАН, и к.ф.-м.н. И. С. Меньшиков соединили вместе концепции равновесия квантового отклика и Марковских стратегий.
Равновесие квантового отклика допускает, что люди могут отклоняться от рационального выбора, совершая ошибки. Данный эффект контролируется так называемым параметром рациональности: чем он больше, тем меньше вероятность, что индивид будет вести себя нерационально. В результате было получено семейство равновесий квантового отклика в Марковских стратегиях. Каждое равновесие – это точка в плоскости, координаты которой соответствуют параметрам взаимной кооперации и терпимости к предательству. Каждое равновесие, каждая точка, соответствует своему параметру рациональности.
Данная работа корнями уходит в исследование природы кооперативного поведения. Кооперация очень важна для процветания общества. Постоянно возникают ситуации, когда, объединившись, люди способны достичь большего, чем поодиночке. Однако, с точки зрения классической экономики, такой тип поведения зачастую нерационален. Классический пример – знаменитая Дилемма Заключенного – одна из фундаментальных моделей в теории игр, которая наглядно иллюстрирует, что взаимная кооперация приводит к бОльшему выигрышу, чем если оба участника будут вести себя независимо. При этом равновесием Нэша в этой игре является такой профиль стратегий, при котором оба участника отказываются от кооперации.
Однако, поведение человека в реальной жизни не всегда рационально. Так и в игре Дилемма Заключенного уровень кооперации будет ненулевой, если в неё будут играть реальные люди. Поэтому эта игра все ещё привлекает внимание ученых, так как заложенная в нее модель хорошо подходит для исследования кооперативного поведения.
Проведенные ранее в Лаборатории экспериментальной экономики – совместном проекте Московского физико-технического института и Вычислительного центра им. А. А. Дородницына Федерального исследовательского центра «Информатика и управление» РАН – исследования показали, что уровень кооперации может быть даже выше 50%, если испытуемых знакомили друг с другом – проводили процедуру социализации. Именно полученный в этих экспериментах высокий уровень кооперации запустил поиск теоретических рамок, в которые бы укладывались полученные результаты.
Ранее под руководством И. С. Меньшикова, выдающегося ученого в области теории игр и принятия решений, экспериментальной и поведенческой экономики, которого, увы, не стало в апреле 2020 г.,  было найдено и изучено симметричное смешанное равновесие Нэша для игры Дилемма Заключенного в Марковских стратегиях.
Под Марковскими стратегиями здесь понимается следующее: вероятность кооперативного выбора в повторяющейся Дилемме заключенного (когда игроки играют одну и ту же игру много раз) раскладывается на две стратегии. Во-первых, это взаимная кооперация (вероятность кооперативного выбора как ответ на кооперативный выбор оппонента в предыдущем раунде) и, во-вторых, – терпимость к предательству (вероятность кооперативного выбора как ответ на предательство оппонента в предыдущем раунде). При этом, считается, что выбор игрока зависит только от предыдущего раунда, а не от более  ранних раундов (марковость). Теоретически найденное равновесие Нэша для такой конструкции неплохо объясняло экспериментальные данные до социализации, но для случаев высокой кооперации после социализации его не хватало.
Именно поэтому авторы и решили соединить вместе концепции равновесия квантового отклика и Марковских стратегий.
С одной стороны, найденная совокупность равновесий (однопараметрическое семейство точек) отлично описывает экспериментальные данные. При этом, варьируя значения коэффициента рациональности, можно смоделировать как участников с низким уровнем кооперации (для малых значений коэффициента рациональности), так и с высоким (для больших значений).
Авторы обнаружили, что полученное множество равновесий обладает рядом интересных свойств.
Прежде всего, оно представляет собой совокупность трех ветвей: первая – гладкая кривая, соответствующая небольшим значениям параметра рациональности (от нуля до пяти, в статье мы ее назвали сегментом малой рациональности), о ней будет подробнее ниже;  две другие ветви (которые уже во многом утратили гладкость, распавшись на кусочки), соответствующие средним (от пяти до семи) и бОльшим (более семи) значениям параметра рациональности соответственно элегантно совпали с известными ранее другими теоретическими конструкциями.
Вторая ветвь очень красиво легла на кривую равновесий Нэша для Дилеммы Заключенного в Марковских стратегиях, обнаруженную ранее. Третья ветвь оказалась направлена в сторону чистого равновесия Нэша (начало координат, соответствующее эгоистичным стратегиями игроков), приближаясь к нему при больших значениях параметра рациональности. Важным результатом, на взгляд авторов, является то, что в зоне средних значений рациональности найденные авторами равновесия совпали с равновесиями Нэша в Марковских стратегиях, что и было предсказано теорией.
Поведение сегмента малой рациональности также оказалось весьма примечательным. При сопоставлении данных экспериментов с равновесиями, стало понятно, что этот сегмент является разделительной линией, барьером, который отделяет стратегии игроков до социализации и после. Этот результат оказался неожиданным, и авторы долго не могли понять, как его интерпретировать. Однако игнорировать его было нельзя: слишком точно теоретические конструкции легли на экспериментальные данные. Авторы выдвинули гипотезу, что сегмент малой рациональности является индикатором того, что коллектив дружен и что в нем сформированы отношения достаточно крепкие, чтобы обеспечить кооперацию (по крайней мере для Дилеммы Заключенного). Апеллируя к самой концепции равновесия квантового отклика, авторы также предположили, что сегмент малой рациональности находится в переходной зоне между эгоистичным и альтруистичными состояниями (нечто вроде фазового перехода в физике), в которой индивиды не знают, какой тип поведения выбрать и тем самым ведут себя хаотично, действуют с ошибками, отклоняясь от рациональной стратегии поведения.
В дальнейших исследованиях авторы хотели бы протестировать обнаруженные свойства экспериментально, рассматривая различные социокультурные и демографические контексты, а также используя различные стратегии социализации. Если гипотеза подтвердится, то тогда обнаруженный сегмент малой рациональности можно будет считать универсальным (и, что важно, теоретически обоснованным) индикатором здоровой атмосферы в коллективе. Это должно найти практическое применение в формировании проектных и производственных команд. С другой стороны, хотелось бы выйти на этот самый сегмент малой рациональности по-другому, используя более современные подходы, в частности, при помощи включения в функцию полезности компоненты, отвечающей за нашу мораль (желание действовать «правильно», в соответствии с нашими моральными ценностями).
Журнал «Scientific Reports» входит в «Springer Nature Limited».