Разработка и поддержка ETL-пайплайнов для высоконагруженной AI-платформы, автоматизирующей работу с юридическими документами. Предстоит работать с гибридными базами знаний, векторным поиском и fine-tuning LLM в production-среде.
что делать
Разработка ETL-пайплайнов для парсинга юридических данных
Создание гибридной базы знаний на базе Milvus, Neo4j и PostgreSQL
Проектирование моделей данных для законодательных норм и графовых связей
Fine-tuning юридических эмбеддинг-моделей и малых LLM
Версионирование данных и моделей в DVC и MLflow
требования
Опыт обработки текстов и стек Python: pandas, numpy, PyTorch
Практический опыт работы с векторными и графовыми базами данных
Знание PostgreSQL, включая полнотекстовый поиск и pgvector
Навыки MLOps: деплой моделей в Docker, K8s и оркестрация ETL
Production-опыт с LangGraph и LangChain
что предлагают
Гибридный график с возможностью удаленной работы 2-3 дня
Офис в Москве на улице Поклонной, 3к3
Ежегодный пересмотр зарплаты и годовая премия
Расширенный ДМС и льготные банковские программы
Доступ к образовательным программам СберУниверситета