В докладе представлена технология языковой идентификации, позволяющая существенно сократить ресурсоёмкость процесса обработки входящих данных в системах анализа больших массивов многоязычной информации и повысить их результативность, что поможет разработчикам расширить сферу анализируемых источников.
Найдено достаточно эффективное и технологичное решение проблемы идентификации множества языков на основе простого идентификационного набора приемлемых размеров, позволяющее существенно сократить затраты ресурсов в процессе языковой идентификации текста, упростить управление и расширить сферу применения соответствующего программного обеспечения, а полученные результаты могут быть положены в основу новых разработок в данной области.