Постановка проблемы. В условиях экспоненциального роста объёма научных публикаций и усложнения междисциплинарных коллабораций актуализируется задача точной и автоматизированной оценки тематической близости исследователей (научных агентов). Существующие подходы (наукометрические, сетевые, тематические) часто не учитывают динамические терминологические предпочтения учёных, что может приводить к неточностям при формировании исследовательских команд, распределении экспертизы и выявлении дублирующихся работ. Исследуется проблема выработки критерия для оценки тематической схожести научных агентов.
Цель. Разработать и экспериментально апробировать новый гибридный критерий для оценки тематической схожести научных агентов на основе анализа их терминологических профилей, а также проверить альтернативные методы валидации (суперкритерии).
Результаты. Предложен гибридный критерий SPM, интегрирующий ранговую (Спирмена) и линейную (Пирсона) корреляции с механизмом отсечения на основе скалярного произведения векторов частотности терминов. Проведено экспериментальное сравнение с базовыми метриками (Жаккара, Спирмена, Пирсона) на выборке сотрудников ИПУ РАН с привлечением экспертной оценки, показавшее его более высокую точность. Разработаны и апробированы суперкритерии на основе гипотез о соавторстве и кластерной принадлежности, подтвердившие свою эффективность для косвенной оценки качества критериев схожести.
Практическая значимость. Разработанная методика позволяет оптимизировать процессы формирования научных коллективов, а также сократить временные затраты на поиск релевантных экспертов, в том числе из внешних организаций, что способствует минимизации дублирования исследований в смежных областях.