В работе рассматривается задача бинарной классификации пространственно-временных последовательностей в условиях выраженной нехватки аномальных примеров. Предлагается и теоретически обосновывается подход, основанный на структурно-ориентированной синтетической аугментации. Мы показываем, что введение в обучающую выборку семантически правдоподобных искусственных примеров выполняет роль регуляризатора данных, улучшая обобщающую способность модели. Гипотеза проверяется на двух независимых, гетерогенных задачах: детекции аномалий в медицинских изображениях (функциональная магнитно-резонансная томография, фМРТ) и в видеоданных с камер видеонаблюдения в общественных местах. Предложенный метод обеспечивает интерпретируемость, статистическую строгость и высокую вычислительную эффективность при анализе биомедицинских данных с многомерным откликом. Это делает его применимым в задачах биоинформатики, фармакогеномики и медицины данных.