Проводится сравнительный анализ применения машинного обучения для
автоматического распознавания структурных элементов научных публикаций, с
основным фокусом на сравнении машинной модели LSTM (Long Short-Term Memory) с
инструментом GROBID, использующим модель Wapiti. Рассматриваются технические
характеристики и преимущества каждого метода, а также оценивается их эффективность
в контексте точности распознавания структурных элементов. Анализируются результаты
экспериментов, проведенных с использованием различных наборов данных, для
выявления сильных и слабых сторон каждой модели. Данные для обучения моделей
были вручную размечены по структурным элементам в виде тегов, включающих в себя
содержание соответствующих элементов.