Рассматриваются методы, модели и технологии, применяемые
для поиска и обработки информации в текстовых данных применительно к обработке научно-технической документации. Использование теоретико-множественных, векторных и вероятностных моделей имеют ряд недостатков при работе с рассматриваемыми потоками данных, связанных со сложностью алгоритмической реализации специфических особенностей области.
Целесообразно применять дополнительные инструменты фильтрации, группировки данных, учет внутренней структуры документа. Перспективным представляется использование методов
обработки и представления данных, используемых в хранилищах больших данных и больших языковых моделей.