Data Engineer for VLM Training Data

Сбер2 дн назад
зарплата
вилка не указана
формат
Гибкий · Москва
грейд
Middle
стек
PythonData EngineeringML pipelinesS3YTsaurusPostgreSQLDVCGitDockerMultiprocessing
от iinaimi · кратко

Data Engineer для работы с инфраструктурой, пайплайнами и качеством данных для обучения VLM. Проектирование масштабируемых процессов очистки, генерации и версионирования датасетов для нейросетей.

что делать

  • Проектирование и реализация масштабных пайплайнов обработки данных
  • Разработка пайплайнов генерации синтетических данных для обучения VLM
  • Управление инфраструктурой хранения, валидации и версионирования датасетов
  • Визуализация и анализ качества данных, подготовка отчётов
  • Сотрудничество с командой ML-исследователей и инфраструктурными инженерами

требования

  • Опыт в data engineering и создании production-grade пайплайнов
  • Уверенное владение Python (multiprocessing, multithreading, async)
  • Работа с распределенными системами обработки данных (YTsaurus или аналоги)
  • Опыт работы с объектными хранилищами (S3)
  • Понимание принципов валидации, дедупликации и версионирования данных

что предлагают

  • Гибкий формат работы: гибрид или офис в Москве
  • Ежегодный пересмотр зарплаты и годовая премия
  • Расширенный ДМС с льготным страхованием для семьи
  • Доступ к программам СберУниверситета
  • Ипотека по льготной ставке

похожие вакансии

Senior Research Engineer (Kandinsky)

Сбер·Senior·Гибрид · Москва
вилка не указана
12 ч назад
Senior Research Engineer в команду Kandinsky. Исследование и обучение диффузионных моделей, внедрение SOTA-подходов и масштабирование RL-пайплайнов для генерации изображений и видео.

Data Scientist

Сбер·Middle·Офис · Москва
вилка не указана
2 дн назад
Разработка и внедрение AI-решений на базе LLM и агентных систем. Работа над полным циклом задач: от подготовки данных и архитектуры до деплоя API и мониторинга моделей.

LLM-инженер / Разработчик AI-агентов

Сбер·Senior·Гибрид · Москва
вилка не указана
2 дн назад
LLM-инженер в команду «Школы архитекторов». Разработка AI-агента для персонализированного обучения на базе RAG-архитектуры и LLM.

Разработчик ML платформы

VK·Middle·Гибкий · Москва
вилка не указана
2 дн назад
Разработчик в технический департамент для работы над ML-платформой компании. Предстоит заниматься развитием инфраструктуры и инструментов для машинного обучения.