Intern Data Engineer в команду Embodied AI. Разработка инфраструктуры для обработки больших данных, развитие ETL-процессов и поддержка сервисов для обучения роботов.
что делать
Мониторинг и оптимизация пайплайнов обработки данных
Разработка инфраструктуры для работы с большими данными
Разработка воспроизводимых ETL-процессов для датасетов
Автоматизация контроля качества входных данных
Создание технической документации
требования
Студент старших курсов или выпускник технического вуза
Опыт работы с Linux, Git и Bash
Навыки парсинга данных (Selenium, BeautifulSoup, Scrapy)
Опыт с библиотеками OpenCV и Pillow
Понимание принципов работы распределенных систем хранения данных