В работе рассматривается вариант метода нечетко-приближенных множеств (Fuzzy Rough Sets) для парсинга научных документов (статей, текстов докладов, аннотаций) в различных электронных форматах (*.pdf, *.png и др.) Задача парсера – выявить в тексте заглавие, название журнала, имена и аффилиации авторов, аннотацию, и т.п. Качество печати документов может быть высокого качества или с такими дефектами, как смазанный шрифт, не четко пропечатанный текст, затемненный фон, отсутствие части текста. Предлагается алгоритм извлечения метаданных и ключевой информации из научной документации разных форматов с использованием искусственного интеллекта. Алгоритм на основе метода нечетко-приближенных множеств для парсинга может находить сходства (или их отсутствие) материалов в электронном виде по словесному описанию документов.