Семинар "Проблемы управления знаниями", 25 июня 2025 г.

                                                           Уважаемые коллеги! 

             25 июня в 17:00, в 9 аудитории ИПУ РАН пройдет семинар «Проблемы управления знаниями». Специалисты, работающие с текстами и технологиями их анализа, расскажут о том, как современные системы умеют искать заимствования, определять структуру научных документов и распознавать машинно-сгенерированные фрагменты.

📝 Программа семинара

1️⃣ «Задачи и алгоритмы систем обнаружения заимствований» 
🔹
Докладчик: Юрий Викторович Чехович, к.ф.-м.н., генеральный директор АО «УНИ системы»
🔹Аннотация: 
В последнее время системы поиска заимствований в письменных работах стали привычным элементом научно-образовательного ландшафта. Сейчас практически каждый научный или учебный документ проверяется такими системами. При этом и сами системы вынуждены активно развиваться, чтобы соответствовать изменениям в нашей жизни, вызванным развитием информационных технологий.
Изначально системы поиска заимствований реализовывали информационный поиск на основе инвертированного индекса. На следующих этапах они обогатились возможностями работы с переводами и парафразами, научились выделять из документов метаданные, определять границы структурных элементов академических документов и выделять в них изображения, таблицы, формулы и т.п., работать с рукописным текстом, обнаруживать заимствованные изображения. В последние годы обязательным элементом систем обнаружения заимствований стали возможности детекции искусственного текста, созданного сервисами на базе генеративных моделей ИИ.
В докладе приводятся постановки задач, решаемых системами обнаружения заимствований.

2️⃣ «Система детекции машинно-сгенерированных текстовых фрагментов»
🔹Докладчик: Герман Михайлович Грицай, аспирант МФТИ, старший разработчик-исследователь АО «Антиплагиат»
🔹Аннотация: 
В докладе будет предложен анализ классических подходов к задаче детекции машинно-сгенерированных текстовых фрагментов, основанных на использовании трансформерных моделей для повышения качества распознавания. Основной акцент сделан на разработке усовершенствованных методов, направленных на выявление признаков генерации на различных уровнях текстовой структуры: от слов и предложений до логических блоков внутри документа. Охватываются походы мультизадачного обучения, обеспечивающие регуляризацию признаковых представлений текстовых фрагментов и повышение обобщающей способности моделей. Будет представлен комплексный анализ наборов данных, используемых в данной области на признак их качества и их информативности.

3️⃣ «Система извлечения структурированной информации из научных документов» 
🔹Докладчик: Андрей Валериевич Грабовой, к.ф.-м.н., руководитель отдела исследований АО «Антиплагиат»
🔹Аннотация:
В рамках доклада рассматриваются методы для извлечения структурированной информации из научных документов. В докладе представлены методы извлечения структуры документа, библиографии, а также авторской информации на основе исследований, проведенных в компании Антиплагиат. В докладе рассматриваются как классические методы, так и нейросевые подходы для извлечения информации.

Дата: 

25.06.2025 - 17:00

Место: 

  • ИПУ РАН (ауд. 9)