82865

Автор(ы): 

Автор(ов): 

4

Параметры публикации

Тип публикации: 

Тезисы доклада

Название: 

Методы анализа фрагментов научных публикаций, плохо поддающихся распознаванию: таблицы, графики, изображения

ISBN/ISSN: 

978-5-91450-284-0

Наименование конференции: 

  • 9-я Международная научная конференция «Информационные технологии и технические средства управления» (ICCT-2025, Гомель)

Наименование источника: 

  • Материалы 9-й Международной научной конференции «Информационные технологии и технические средства управления» (ICCT-2025, Гомель)

Город: 

  • Москва

Издательство: 

  • ИПУ РАН

Год издания: 

2025

Страницы: 

285-286
Аннотация
Мы работаем с автоматизированными методами анализа научно-технической документации, в том числе семантического. Смысловой анализ результатов работы ученого с помощью систем искусственного интеллекта – это сложная задача, которая дополнительно усложняется потерей части информации при извлечении текста из публикации или другого документа. Большинство систем распознавания текста и поиска по тексту никак не обрабатывают изображения, графики, формулы. Таблицы частично обрабатываются, но могут терять большую часть смысла из-за разрушения структур данных. В статье рассматриваются методы, которые могут полностью или частично предотвратить потерю данных в существующих и в будущих публикациях. В связи с стремительным развитием систем ИИ и делегированием многих задач по обработке текстов программным системам авторам научных работ стоит задуматься о читаемости статей не для человека, а для машинной обработки.

Библиографическая ссылка: 

Давыдов Е.Ю., Мальгина С.А., Фархадов М.П., Блинова О.В. Методы анализа фрагментов научных публикаций, плохо поддающихся распознаванию: таблицы, графики, изображения / Материалы 9-й Международной научной конференции «Информационные технологии и технические средства управления» (ICCT-2025, Гомель). М.: ИПУ РАН, 2025. С. 285-286.