82839

Автор(ы): 

Автор(ов): 

3

Параметры публикации

Тип публикации: 

Тезисы доклада

Название: 

Метод нечетко-приближенных множеств для сбора и систематизации научных текстов

Наименование конференции: 

  • XXVI Харитоновские тематические научные чтения «ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ И БОЛЬШИЕ ДАННЫЕ В ТЕХНИЧЕСКИХ, ПРОМЫШЛЕННЫХ, ПРИРОДНЫХ И СОЦИАЛЬНЫХ СИСТЕМАХ» (Саров, 2025)

Наименование источника: 

  • Материалы XXVI Харитоновских тематических научных чтений «ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ И БОЛЬШИЕ ДАННЫЕ В ТЕХНИЧЕСКИХ, ПРОМЫШЛЕННЫХ, ПРИРОДНЫХ И СОЦИАЛЬНЫХ СИСТЕМАХ» (Саров, 2025)

Город: 

  • Саров

Издательство: 

  • ФГУП «РФЯЦ-ВНИИЭФ»

Год издания: 

2025

Страницы: 

67-69
Аннотация
В работе рассматривается вариант метода нечетко-приближенных множеств (Fuzzy Rough Sets) для парсинга научных документов (статей, текстов докладов, аннотаций) в различных электронных форматах (*.pdf, *.png и др.) Задача парсера – выявить в тексте заглавие, название журнала, имена и аффилиации авторов, аннотацию, и т.п. Качество печати документов может быть высокого качества или с такими дефектами, как смазанный шрифт, не четко пропечатанный текст, затемненный фон, отсутствие части текста. Предлагается алгоритм извлечения метаданных и ключевой информации из научной документации разных форматов с использованием искусственного интеллекта. Алгоритм на основе метода нечетко-приближенных множеств для парсинга может находить сходства (или их отсутствие) материалов в электронном виде по словесному описанию документов.

Библиографическая ссылка: 

Елисеев А.В., Фархадов М.П., Мальгина С.А. Метод нечетко-приближенных множеств для сбора и систематизации научных текстов / Материалы XXVI Харитоновских тематических научных чтений «ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ И БОЛЬШИЕ ДАННЫЕ В ТЕХНИЧЕСКИХ, ПРОМЫШЛЕННЫХ, ПРИРОДНЫХ И СОЦИАЛЬНЫХ СИСТЕМАХ» (Саров, 2025). Саров: ФГУП «РФЯЦ-ВНИИЭФ», 2025. С. 67-69.