Deep LearningVLMLLMComputer VisionDistributed TrainingFSDPPythonCode ReviewMachine Learning Research
от iinaimi · ai-выжимка
Развитие мультимодальных VLM-моделей GigaChat Vision на всем цикле обучения. В роли много исследовательской работы с архитектурой и данными, а также инженерных задач вокруг distributed training, кода и оценки качества.
что делать
Развивать качество VLM-моделей до вывода в прод
Исследовать архитектуру, обучение и обучающие данные
Формулировать гипотезы и проводить эксперименты
Запускать multi-node обучение на GPU-кластерах
Оптимизировать код обучения и оценки моделей
требования
Сильный бэкграунд в modern ML
Опыт полного цикла обучения VLM или LLM
Глубокие знания в computer vision
Понимание distributed training или больших GPU-кластеров