Тимлид в команду ML-инфраструктуры YTsaurus
28 Октября 2024
Город:
Казань
Занятость:
Полная занятость
Опыт:
Более 6 лет
Компания "Яндекс"
Мы начинаем новый крупный проект, в рамках которого планируем сделать жизнь ML-разработчиков в Яндексе удобнее.
Пользователями нового сервиса станет большинство ML-разработчиков Яндекса. Это сотни команд, которые обучают модели для таких продуктов, как Алиса, Нейро, Шедеврум.
Ключевые компоненты будущего сервиса:
- Managed Dev Cluster для удалённой разработки и тестовых запусков на GPU;
- инструмент простого с точки зрения UX и эффективного запуска процессов обучения на гигантском кластере YTsaurus с тысячами GPU;
- оркестратор, который позволит описывать графы подготовки данных на Python и SQL;
- решение для трекинга ML-экспериментов (по смыслу похожее на Weights & Biases);
- MLOps-cистема для хранения жизненного цикла моделей и управления им.
Ищем тимлида, который знает, что такое разработка сложных систем и машинное обучение. Вы возглавите команду разработки нового сервиса, которая в том числе будет обеспечивать бесперебойную работу системы и поддержку пользователей.
Мы планируем сделать продукт, который будет тесно работать с опенсорс-платформой YTsaurus, которая уже используется в Яндексе для хранения большинства данных и запуска задач машинного обучения. В перспективе мы надеемся выложить новый продукт в open source.
Если вы хотите принять участие в строительстве нового мира ML, который немыслим без суперкомпьютеров, — эта позиция для вас! Ведь Яндекс — одна из немногих компаний в мире, где это возможно.
Какие задачи вас ждут
— Руководство командой
У вас в подчинении будет команда из 3–4 опытных инженеров.
— Развитие существующего сервиса для трекинга экспериментов
В компании есть сервис для трекинга экспериментов, которым пользуется множество команд. Нам предстоит переосмыслить его и встроить в новую концепцию. Нужно сделать это аккуратно, поддерживая текущий сервис и не ломая рабочий процесс у пользователей.
— Создание новых сервисов для упрощения работы ML-инженеров в Яндексе
Мы разрабатываем глобальный план развития всей ML-инфраструктуры Яндекса. Вместе с командой вы будете продумывать отдельные части этого плана, а также участвовать в реализации новых сервисов будущей ML-платформы Яндекса.
Мы ждём, что вы
- Имеете богатый опыт разработки сложных систем на C++, Go или Java (одного будет достаточно)
- Знаете Python, можете читать и делать review кода.
- Способны взять под свою ответственность небольшую команду и набор сервисов, которые она развивает
- Готовы разбираться в разработке ML-моделей в Яндексе, а также создавать и внедрять новые инфраструктурные решения
Будет плюсом, если вы
- Работали с ML-инструментами: W&B, DVC, MLflow, Kubeflow и другими
- Знакомы с инфраструктурными системами (Docker, Kubernetes, Ray, Slurm)
- Управляли командой разработчиков
- Участвовали в создании и внедрении инфраструктурных решений в больших компаниях
Зарегистрируйтесь или войдите, чтобы открыть контакты работодателя
Прикрепите резюме для отклика
Уже с нами?
Войдите, чтобы отправить резюме
23 Октября
Инженер систем мониторинга ИТ-инфраструктуры (Инженер Linux)
Казань
Компания "ГК InnoSTage" InnoSTage (Инностейдж) – это группа технологических компаний, оказывающих услуги в сфере кибербезопасности, разработки...
19 Октября
Казань
до 400 000 руб.
Компания "Тензор" Мы - Компания Тензор. С 1996 года создаем и внедряем IT-решения для автоматизации различных участков бизнеса. Входим в Топ-30...
25 Октября
Казань
Компания "Атос АйТи Солюшенс энд Сервисез" Кто мы AUXO - системный интегратор для крупного и среднего бизнеса. 1200+ сотрудников. Наши...
24 Октября
СПЕЦИАЛИСТ (группа защиты критической информационной инфраструктуры)
Набережные Челны
от 55 000 руб.
Компания "Ремдизель" Обязанности: Реализация организационных и технических мер по защите критической информационной инфраструктуры;...
11 Октября
Специалист по тестированию( Яндекс Команда для бизнеса )
Казань
от 32 000 руб.
Компания "Яндекс Команда для бизнеса" Яндекс.Доставка – сервис, который помогает людям и бизнесу решать разные логистические задачи более чем в...
Вакансия размещена в отрасли