Разработка высоконагруженных конвейеров данных для ETL/ELT и аналитических хранилищ. Работа с Python, PySpark и Airflow, подготовка данных для ML. В роли также есть code review и документация.
что делать
Разработка высоконагруженных конвейеров обработки данных
Подготовка данных в DataLake, SandBox и FeatureStore
Развитие ETL/ELT-проектов на Python, PySpark и Airflow
Code review для data engineers
Поддержка технической документации
требования
Уверенное знание Python, структур данных и алгоритмов
Опыт с ООП и функциональным программированием
Сильный SQL, оконные функции и оптимизация запросов