Цель исследования: Распознавание коррозии на металлических конструкциях является серьезной проблемой в проведение инспекций промышленных объектов. Существующие подходы к анализу изображений имеют тенденцию использовать все изображения для распознавания участков, поврежденных коррозией, что не подходит как для структурного анализа, так как процент ошибок при таком подходе очень велик. В условиях прогнозирования коррозии по всему изображению возможны ошибки, связанные с прогнозируемой маской не на металлической конструкции. В связи с этим необходимо удалять результаты прогнозирования положительного класса для участков, поврежденных коррозией, но не размещенных на металлической конструкции. Поэтому в данной работе авторы разработали двухэтапный подход к распознаванию коррозии металлических конструкций, тем самым достигая цель – повышение точности распознавания.
Методы. В этой статье мы применяем две модели глубокого обучения, ориентированные на семантическую сегментацию (DeepLabv3, BiSeNetV2) для обнаружения коррозии, которые работают лучше с точки зрения точности и времени и требуют меньшего количества аннотированных образцов по сравнению с другими глубокими моделями, например, Unet, FCN, Mask-RCNN. В работе предложен новый подход к распознаванию металлических участков, поврежденных коррозией, на основе совмещения двух сверточных нейронных сетей для более точного пиксельного предсказания глубинными моделями архитектуры DeepLabv3 и BiSeNetV2.
Результаты. В ходе экспериментальных исследований проводился расчет точности и F1 меры с использованием моделей FCN, Unet, Mask-RCNN, а также предложенного подхода. На основании полученных результатов был сделан вывод о том, что предложенный подход состоящий в совмещении сетей DeepLabv3 и BiSeNetV2 на 3 % повышает точность и F1 меру для алгоритма Unet, на 10% точность и 2% F1 меру для Mask R-CNN и на 12 % точности и 4 % F1 меру для FCN сети. Экспериментальные результаты и сравнения с реальными наборами данных подтверждают эффективность предложенной схемы даже для очень сложных изображений с множеством типов дефектов. Производительность оценивалась на базе данных, аннотированной экспертами.
Заключение. В статье проведен анализ существующих решений в области распознавания металлических конструкций, поврежденных коррозией, и выявлены недостатки существующих решений, основанных либо на детекции очагов коррозии, либо на попиксельной сегментации полного изображения. В данной работе предложен новый подход к распознаванию металлических участков, поврежденных коррозией, на основе совмещения двух сверточных нейронных сетей для более точного пиксельного предсказания DeepLabv3 и BiSeNetV2. Производительность оценивается на базе данных, аннотированной экспертами по метрикам Precision и F1-score