79074

Автор(ы): 

Автор(ов): 

2

Параметры публикации

Тип публикации: 

Доклад

Название: 

Лингвистическая обработка научно-технической документации с целью поиска и категоризации

ISBN/ISSN: 

978–5–907890–08–4

Наименование конференции: 

  • 23-я Международная конференция им. А. Ф. Терпугова «Информационные технологии и математическое моделирование» (ИТММ–2024, Томск)

Наименование источника: 

  • Материалы 23-й Международной конференции им. А. Ф. Терпугова «Информационные технологии и математическое моделирование» (ИТММ–2024, Томск)

Город: 

  • Томск

Издательство: 

  • Издательство ТГУ

Год издания: 

2024

Страницы: 

530-535
Аннотация
Рассматриваются методы, модели и технологии, применяемые для поиска и обработки информации в текстовых данных применительно к обработке научно-технической документации. Использование теоретико-множественных, векторных и вероятностных моделей имеют ряд недостатков при работе с рассматриваемыми потоками данных, связанных со сложностью алгоритмической реализации специфических особенностей области. Целесообразно применять дополнительные инструменты фильтрации, группировки данных, учет внутренней структуры документа. Перспективным представляется использование методов обработки и представления данных, используемых в хранилищах больших данных и больших языковых моделей.

Библиографическая ссылка: 

Блинова О.В., Панкратова Е.В. Лингвистическая обработка научно-технической документации с целью поиска и категоризации / Материалы 23-й Международной конференции им. А. Ф. Терпугова «Информационные технологии и математическое моделирование» (ИТММ–2024, Томск). Томск: Издательство ТГУ, 2024. С. 530-535.