82865 | ИПУ РАН

Автор(ы):

Автор(ов):

Параметры публикации

Тип публикации:

Тезисы доклада

Название:

Методы анализа фрагментов научных публикаций, плохо поддающихся распознаванию: таблицы, графики, изображения

ISBN/ISSN:

978-5-91450-284-0

Наименование конференции:

9-я Международная научная конференция «Информационные технологии и технические средства управления» (ICCT-2025, Гомель)

Наименование источника:

Материалы 9-й Международной научной конференции «Информационные технологии и технические средства управления» (ICCT-2025, Гомель)

Город:

Москва

Издательство:

ИПУ РАН

Год издания:

2025

Страницы:

285-286

Аннотация

Мы работаем с автоматизированными методами анализа научно-технической документации, в том числе семантического. Смысловой анализ результатов работы ученого с помощью систем искусственного интеллекта – это сложная задача, которая дополнительно усложняется потерей части информации при извлечении текста из публикации или другого документа. Большинство систем распознавания текста и поиска по тексту никак не обрабатывают изображения, графики, формулы. Таблицы частично обрабатываются, но могут терять большую часть смысла из-за разрушения структур данных. В статье рассматриваются методы, которые могут полностью или частично предотвратить потерю данных в существующих и в будущих публикациях. В связи с стремительным развитием систем ИИ и делегированием многих задач по обработке текстов программным системам авторам научных работ стоит задуматься о читаемости статей не для человека, а для машинной обработки.

Библиографическая ссылка:

Давыдов Е.Ю., Мальгина С.А., Фархадов М.П., Блинова О.В. Методы анализа фрагментов научных публикаций, плохо поддающихся распознаванию: таблицы, графики, изображения / Материалы 9-й Международной научной конференции «Информационные технологии и технические средства управления» (ICCT-2025, Гомель). М.: ИПУ РАН, 2025. С. 285-286.