Нейросеть для навигации в торосах создана в САФУ

22.08.2025

Глазами и ушами судоводителя являются эхолокационные приборы и данные спутникового мониторинга, а также прогнозы ледовой обстановки, основанные на решении уравнений с использованием исторических данных. Однако системы анализа спутниковых снимков остаются недостаточно совершенны. Существующие методы оценки ледовых структур показывают ограниченную эффективность при работе с небольшим объемом входных данных.

Студенты САФУ имени М.В. Ломоносова (г. Архангельск) Антон Ефремов и Владимир Макарьин разработали метод моделирования расположения торосов ледяных полей с использованием генеративных нейронных сетей на основе фотографий с дронов. Этот инструмент позволяет моделировать и анализировать структуру торосов при минимальном объёме входных данных. 

Генератор изображений — это модифицированная архитектура U-Net с механизмом внимания (self-attention), которая выделяет и сжимает признаки входного изображения. Он обучен на пяти реальных арктических снимках с беспилотников и множестве аугментаций (изменённых версий этих снимков) этих снимков. Восстановление изображения ледового поля происходит с помощью кастомных весов, наделяющих детали приоритетом, синтетических бинарных масок по входному изображению – входной канал на генеративные модели, а также на основе фрактальных характеристик, когда часть объекта повторяет структуру целого.

"Мы проверили, обладают ли торосы фрактальными свойствами, используя метод подсчёта фрактальной размерности "Box Counting", который успешно применялся к структурам с известной фрактальной размерностью, например, снежинке Коха. Этот метод основан на разбиении изображения на сетку и подсчёте ячеек, пересекающих объект, что позволяет количественно оценить сложность структуры. Результаты показали, что торосы имеют строгую самоподобную структуру, что открывает возможность генерации полного изображения ледового поля на основе его части", – объяснили Антон Ефремов и Владимир Макарьин.

Приложение создано на Python с PyQt5 (интерфейс — Qt Designer). Для GAN и диффузионной модели использован PyTorch, для обработки изображений — PIL. Код — модульный, что облегчает внесение изменений.

Тестирование показало, что модель способна воспроизводить плотностные характеристики структуры льда и определять места скопления торосов, разница фрактальной размерности (меры детализации) исходного и получившегося изображения – меньше одного процента.
Созданное приложение на Python с графическим интерфейсом позволяет пользователю загружать маски ледяных полей, выбирать модель и получать синтетические изображения торосов практически мгновенно. Изображения, которые сгенерировала модель, дают только примерное расположение торосов и на основе множества снимков специалист может спрогнозировать расположение льда.

Такой инструмент значительно повышает точность прогнозирования ледовой обстановки и помогает судоводителям безопаснее ориентироваться в сложных условиях арктических морей. В будущем планируется расширение возможностей системы за счет обучения на большем объеме данных и внедрения более современных архитектур нейросетей, что сделает навигацию в ледовых условиях еще более надежной и безопасной.

Источник: САФУ имени М.В. Ломоносова