Разработка инфраструктуры данных для обучения VLM-моделей. Руководство командой, управление качеством датасетов и оптимизация пайплайнов для задач Computer Vision.
что делать
Строительство data engine для pretrain VLM
Управление качеством данных, отбором, дедупликацией и балансировкой
Создание системы мониторинга и дашбордов для процессов
Взаимодействие с командами обучения, инфраструктуры и оценки
Найм и развитие Data/ML-инженеров
требования
Опыт работы с SQL, NoSQL, MapReduce и S3
Навыки построения дата-пайплайнов и контроля качества
Опыт работы в production ML-команде
Понимание задач CV и подходов в мультимодальных моделях
Умение планировать задачи и управлять ресурсами
что предлагают
Офис у м. Кутузовская с гибким графиком
Годовая премия и ежегодный пересмотр зарплаты
Расширенный ДМС и льготная ипотека
Доступ к образовательным программам СберУниверситета