Компания "ГКУ «Центр цифровой трансформации РТ»"
Требуется LLM-инженер на проекты регионального масштаба, направленные на улучшение качества жизни жителей Республики Татарстан
Обязанности:
Деплой, конфигурирование и поддержка LLM-сервисов в продакшне (vLLM, SGLang, TGI и др.);
Оптимизация inference-пайплайнов для высоконагруженных систем (3k+ concurrent users);
Квантизация моделей (GPTQ, AWQ, GGUF, SmoothQuant и пр.);
Fine-tuning и дообучение LLM (SFT, LoRA/QLoRA, RLHF/DPO);
Подбор, эксперименты и исследования в сфере LLM;
Разработка и реализация алгоритмов на основе LLM (RAG, agents, function calling и пр.);
Улучшение существующих решений и мониторинг качества моделей в проде.
Основной язык Python. Будет плюсом знание GoLang или C++;
Уверенное знание LLM-serving фреймворков: vLLM, SGLang и других фреймворков для Text Generation Inference— понимание их архитектурных отличий, сценариев применения, преимуществ и ограничений;
Глубокое понимание механизмов оптимизации инференса: continuous batching, PagedAttention, speculative decoding, flash attention, tensor parallelism, pipeline parallelism;
Опыт квантизации LLM: GPTQ, AWQ, GGUF, INT4/INT8, SmoothQuant;
Опыт дообучения LLM: SFT, LoRA / QLoRA, DPO, RLHF — понимание когда и что применять;
Работа с популярными open-source моделями (LLaMA, Mistral, Qwen, DeepSeek, GPT OSS) и их весами (HuggingFace Transformers);
Понимание и практический опыт построения RAG-систем, цепочек промптов, agentic-пайплайнов;
Опыт работы с высоконагруженными системами: оценка throughput/latency, профилирование, горизонтальное масштабирование, балансировка запросов;
Базовое понимание аппаратной части: GPU-архитектуры (NVIDIA A100/H100/B200), VRAM management, NVLink, multi-GPU setups;
Понимание и изучение SOTA-решений в сфере LLM для последующей имплементации в проект;
Знания базовых алгоритмов машинного обучения и основ трансформерных архитектур (attention, MoE, RoPE и пр.);
Знание OpenAI-совместимых API;
Опыт с multimodal LLM (Kimi K2.5, Qwen-VL и пр.).
Знание NLP:
Будет плюсом:
Опыт работы от 3 лет.
Условия:
Официальное трудоустройство, стабильная «белая» заработная плата (выплаты 2 раза в месяц);
Оставляй свой отклик, и мы обязательно рассмотрим твое резюме!
27 Апреля
Казань
Компания "Технократия" Мы создаём финтех-продукты для рынков, где формируется будущее финансовых технологий. Работаем на международных...
28 Апреля
QA Engineer Java / Инженер-тестировщик Java (ученик)
Казань
Компания "Aston" Хотите стать тестировщиком с нуля? Пройдите бесплатное обучение и начните карьеру в ASTON! Мы растем и готовим себе новое...
27 Апреля
BI-аналитик / Data Engineer (Full-Stack)
Казань
Компания "Даль" Телега — это обновлённый клиент Telegram , созданный независимой командой из Казани на базе открытого кода. Мы усиливаем...
29 Апреля
Тестировщик - QA Engineer (Junior)
Казань
Компания "BIV" BIV - разработчик ИТ-решений для федеральных страховых и финансовых компаний. Результатами нашего труда пользуются миллионы...
02 Мая
Специалист по обеспечению качества (QA Engineer)
Иннополис
от 190 000 до 235 000 руб.
Компания "DCloud" Стек проекта: Postman, Swagger/OpenAPI, PostgreSQL, MySQL, DBeaver, pgAdmin, Kafka, RabbitMQ, IBM MQ, Active MQ, Jenkins,...
Вакансия размещена в отрасли