Разработка платформы автономного наступательного тестирования на базе LLM в R&D-команде. Проектирование экспериментов, fine-tuning моделей и интеграция агентных систем.
что делать
Проектирование R&D-экспериментов для улучшения LLM
Подготовка обучающих данных и пайплайнов SFT/LoRA
Исследование RL-подходов и оценка качества моделей
Создание пайплайнов синтеза данных
Интеграция обученных моделей в агентную платформу
требования
Опыт в ML, DL или NLP от 2 лет
Опыт работы с LLM: prompt design, tool calling, evaluation
Понимание подходов к fine-tuning и опыт с PyTorch
Уверенное владение Python
Опыт работы с агентными фреймворками
что предлагают
Работа в современном офисе
Ежегодный пересмотр зарплаты и годовая премия
Расширенный ДМС и корпоративная пенсионная программа