Семинар по социофизике 20 декабря

Дорогие коллеги,

Очередное заседание Московского семинара по социофизике им. Д.С.Чернавского состоится в онлайн-формате в понедельник 20 декабря 2021 г. Начало в 17 ч.

Моделирование текстов: объективность или магия чисел

Докладчик: Михаил Григорьевич Крейнес, к.ф.-м.н., генеральный директор ООО «БАЗИСНЫЕ ТЕХНОЛОГИИ»

Время на доклад ~60 минут + далее вопросы и обсуждение.

Аннотация

Благодаря богатству и избыточности языка общей проблемой вычислительного анализа текстов является широкая возможность интерпретации результатов, даже результатов, практически противоречащих здравому смыслу. Поэтому для практического применения моделей текстов критичным является определения характера результата.

Человек получил в определенном смысле объективную и содержательную модель текста или превращается в адепта современного варианта магии — магии чисел? Этот вопрос, возникающий при использовании большинства результатов математического моделирования, рассмотрен для трех типов моделей, ориентированных на поиск, распространение и оценку текстовых источников информации.

Обсуждаются модели, формируемые: по данным об использовании текстов (библиометрия и ее аналоги), с применением методов искусственного интеллекта, на основе содержательных предположений о механизмах порождения и восприятия текстов человеком. Для моделей двух первых типов показаны базовые механизмы возникновения необъективности, определяющие преимущественное влияние «магии чисел» при их использовании. Для развиваемых докладчиком моделей, базирующихся на содержательных предположениях, приведены базовые структуры моделей текстов и текстовых коллекций, и результаты их экспериментальной верификации, подтверждающие объективность моделей.

Основные рассматриваемые этапы верификации: поиск на основании моделей содержательно сходных текстов, формирование моделей коллекций, характеризующих их тематическую структуру (в том числе, кластеризация текстовых коллекций), тематическая категоризация текстов с использованием моделей, вычислительное определение тематического сходства коллекций на базе моделей, введение количественного показателя содержательной ценности текста относителльно коллекции текстов, идентификация содержательно неоправданного (так называемого, дружеского) цитирования.

Семинар пройдет в формате онлайн-концеренции.

Подключиться к онлайн-семинару (концеренции) можно по ссылке

https://us02web.zoom.us/j/87533146108?pwd=bmN0Mkl5Q1JGdXhQZkZsazBndVkwQT09

Идентификатор конференции: 875 3314 6108

Пароль (код доступа): 078876