79074 | ИПУ РАН

Автор(ы):

Блинова О. В. (ИПУ РАН, Лаборатория 17)

Панкратова Е. В. (ИПУ РАН, Лаборатория 17)

Автор(ов):

Параметры публикации

Тип публикации:

Доклад

Название:

Лингвистическая обработка научно-технической документации с целью поиска и категоризации

ISBN/ISSN:

978–5–907890–08–4

Наименование конференции:

23-я Международная конференция им. А. Ф. Терпугова «Информационные технологии и математическое моделирование» (ИТММ–2024, Томск)

Наименование источника:

Материалы 23-й Международной конференции им. А. Ф. Терпугова «Информационные технологии и математическое моделирование» (ИТММ–2024, Томск)

Город:

Томск

Издательство:

Издательство ТГУ

Год издания:

2024

Страницы:

530-535

Аннотация

Рассматриваются методы, модели и технологии, применяемые для поиска и обработки информации в текстовых данных применительно к обработке научно-технической документации. Использование теоретико-множественных, векторных и вероятностных моделей имеют ряд недостатков при работе с рассматриваемыми потоками данных, связанных со сложностью алгоритмической реализации специфических особенностей области. Целесообразно применять дополнительные инструменты фильтрации, группировки данных, учет внутренней структуры документа. Перспективным представляется использование методов обработки и представления данных, используемых в хранилищах больших данных и больших языковых моделей.

Библиографическая ссылка:

Блинова О.В., Панкратова Е.В. Лингвистическая обработка научно-технической документации с целью поиска и категоризации / Материалы 23-й Международной конференции им. А. Ф. Терпугова «Информационные технологии и математическое моделирование» (ИТММ–2024, Томск). Томск: Издательство ТГУ, 2024. С. 530-535.