Разработка рекомендательной платформы экосистемы Сбера. Предстоит создавать ML-пайплайны, работать с большими данными на PySpark и оптимизировать процессы обучения и инференса моделей на PyTorch.
что делать
Разработка и развитие End-to-End ML-пайплайнов
Проектирование и поддержка пайплайнов обработки данных
Работа с большими объемами данных на PySpark
Написание кода для обучения и инференса моделей на PyTorch
Оптимизация производительности сервисов и обработки данных
требования
Математический бэкграунд
Уверенное знание Python и библиотек для работы с данными
Опыт разработки промышленных ML и Data-пайплайнов
Опыт работы с Airflow или аналогичными оркестраторами
Понимание принципов работы SQL и NoSQL баз данных
что предлагают
Гибридный или офисный формат работы
Годовой бонус и ежегодный пересмотр зарплаты
Расширенный ДМС с первого дня
Возможность 90 дней удаленной работы из регионов РФ