Автоматизация обработки научно-технической документации (НТД) является актуальной задачей, так как объемы работ в этой области огромны и продукты интеллектуальной деятельности требуют определенных квалифицированных навыков пользователя. Извлечение метаданных и ключевой информации для человека обычно не представляет трудности, но при автоматизированной обработке происходит очень много ошибок и проблем, связанных с неоднородностью представления этих данных. В статье рассмотрены основные методы решения этой задачи. Наиболее перспективным направлением представляется разбиение всей задачи на отдельные этапы и объединение результатов работы различных методов с целью получения качественного результата анализа.