82676

Автор(ы): 

Автор(ов): 

1

Параметры публикации

Тип публикации: 

Тезисы доклада

Название: 

Методы унификации исследовательского кода для повторяемости и масштабирования

ISBN/ISSN: 

978-5-89155-391-0

Наименование конференции: 

  • 65-я Всероссийская научная конференция МФТИ, посвященная 115-летию Л.Д. Ландау (Москва, 2023)

Наименование источника: 

  • Труды 65-й Всероссийской научной конференции МФТИ, посвященной 115-летию Л.Д. Ландау (Москва, 2023)

Город: 

  • Москва

Издательство: 

  • Физматкнига

Год издания: 

2023

Страницы: 

157
Аннотация
Доклад посвящен проблеме повторяемости и масштабирования экспериментов в машинном обучении. Данная проблема возникла после значительного рывка в технологиях, которые позволили использовать современные модели машинного обучения значительно чаще при решении прикладных задачах. Отсутствие повторяемости экспериментов приводит к искаженным результатам [1], которые могут повлиять на конечный результат всего исследования. Повторяемость экспериментов связано с задачей масштабирования экспериментов. Обе эти задачи требуют некоторой унификации кода, которое позволяет перезапускать код эксперимента множество раз, причем гарантируя единый результат. В случае масштабирования разные запуски выполняются с различными начальными условиями — к примеру, с различными гипераметрами, для ускорения подбора. Основной целью исследования является анализ существующих решений для построения системы проведения экспериментов на базе существующих открытых библиотек. В докладе анализируются различные инструменты для повышения качества проводимых исследований. Анализируются методы для работы с данными DVC [2] и методы для обучения моделей глубокого обучения на локальном компьютере и на внешнем кластере. В качестве базовых методов MLOps рассматриваются MLflow [3], W&B [4], Kubeflow [5]. В работе анализируется возможность использования различных инструментов в кластерных архитектурах, возможность использования кода при разработке моделей машинного обучения в команде, поддержка ipynb тетрадок и т.д. При построении итоговой системы проведения экспериментов учитывает общая популярность различных инструментов. В частности, их интеграция в уже существующие библиотеки обучения моделей глубокого обучения.

Библиографическая ссылка: 

Грабовой А.В. Методы унификации исследовательского кода для повторяемости и масштабирования / Труды 65-й Всероссийской научной конференции МФТИ, посвященной 115-летию Л.Д. Ландау (Москва, 2023). М.: Физматкнига, 2023. С. 157.