82676 | ИПУ РАН

Автор(ы):

Грабовой А. В. (ИПУ РАН, Лаборатория 42)

Автор(ов):

Параметры публикации

Тип публикации:

Тезисы доклада

Название:

Методы унификации исследовательского кода для повторяемости и масштабирования

ISBN/ISSN:

978-5-89155-391-0

Наименование конференции:

65-я Всероссийская научная конференция МФТИ, посвященная 115-летию Л.Д. Ландау (Москва, 2023)

Наименование источника:

Труды 65-й Всероссийской научной конференции МФТИ, посвященной 115-летию Л.Д. Ландау (Москва, 2023)

Город:

Москва

Издательство:

Физматкнига

Год издания:

2023

Страницы:

157

Аннотация

Доклад посвящен проблеме повторяемости и масштабирования экспериментов в машинном обучении. Данная проблема возникла после значительного рывка в технологиях, которые позволили использовать современные модели машинного обучения значительно чаще при решении прикладных задачах. Отсутствие повторяемости экспериментов приводит к искаженным результатам [1], которые могут повлиять на конечный результат всего исследования. Повторяемость экспериментов связано с задачей масштабирования экспериментов. Обе эти задачи требуют некоторой унификации кода, которое позволяет перезапускать код эксперимента множество раз, причем гарантируя единый результат. В случае масштабирования разные запуски выполняются с различными начальными условиями — к примеру, с различными гипераметрами, для ускорения подбора. Основной целью исследования является анализ существующих решений для построения системы проведения экспериментов на базе существующих открытых библиотек. В докладе анализируются различные инструменты для повышения качества проводимых исследований. Анализируются методы для работы с данными DVC [2] и методы для обучения моделей глубокого обучения на локальном компьютере и на внешнем кластере. В качестве базовых методов MLOps рассматриваются MLflow [3], W&B [4], Kubeflow [5]. В работе анализируется возможность использования различных инструментов в кластерных архитектурах, возможность использования кода при разработке моделей машинного обучения в команде, поддержка ipynb тетрадок и т.д. При построении итоговой системы проведения экспериментов учитывает общая популярность различных инструментов. В частности, их интеграция в уже существующие библиотеки обучения моделей глубокого обучения.

Библиографическая ссылка:

Грабовой А.В. Методы унификации исследовательского кода для повторяемости и масштабирования / Труды 65-й Всероссийской научной конференции МФТИ, посвященной 115-летию Л.Д. Ландау (Москва, 2023). М.: Физматкнига, 2023. С. 157.