Компания "ГКУ «Центр цифровой трансформации РТ»"
Требуется LLM-инженер на проекты регионального масштаба, направленные на улучшение качества жизни жителей Республики Татарстан
Обязанности:
Деплой, конфигурирование и поддержка LLM-сервисов в продакшне (vLLM, SGLang, TGI и др.);
Оптимизация inference-пайплайнов для высоконагруженных систем (3k+ concurrent users);
Квантизация моделей (GPTQ, AWQ, GGUF, SmoothQuant и пр.);
Fine-tuning и дообучение LLM (SFT, LoRA/QLoRA, RLHF/DPO);
Подбор, эксперименты и исследования в сфере LLM;
Разработка и реализация алгоритмов на основе LLM (RAG, agents, function calling и пр.);
Улучшение существующих решений и мониторинг качества моделей в проде.
Основной язык Python. Будет плюсом знание GoLang или C++;
Уверенное знание LLM-serving фреймворков: vLLM, SGLang и других фреймворков для Text Generation Inference— понимание их архитектурных отличий, сценариев применения, преимуществ и ограничений;
Глубокое понимание механизмов оптимизации инференса: continuous batching, PagedAttention, speculative decoding, flash attention, tensor parallelism, pipeline parallelism;
Опыт квантизации LLM: GPTQ, AWQ, GGUF, INT4/INT8, SmoothQuant;
Опыт дообучения LLM: SFT, LoRA / QLoRA, DPO, RLHF — понимание когда и что применять;
Работа с популярными open-source моделями (LLaMA, Mistral, Qwen, DeepSeek, GPT OSS) и их весами (HuggingFace Transformers);
Понимание и практический опыт построения RAG-систем, цепочек промптов, agentic-пайплайнов;
Опыт работы с высоконагруженными системами: оценка throughput/latency, профилирование, горизонтальное масштабирование, балансировка запросов;
Базовое понимание аппаратной части: GPU-архитектуры (NVIDIA A100/H100/B200), VRAM management, NVLink, multi-GPU setups;
Понимание и изучение SOTA-решений в сфере LLM для последующей имплементации в проект;
Знания базовых алгоритмов машинного обучения и основ трансформерных архитектур (attention, MoE, RoPE и пр.);
Знание OpenAI-совместимых API;
Опыт с multimodal LLM (Kimi K2.5, Qwen-VL и пр.).
Знание NLP:
Будет плюсом:
Опыт работы от 3 лет.
Условия:
Официальное трудоустройство, стабильная «белая» заработная плата (выплаты 2 раза в месяц);
Оставляй свой отклик, и мы обязательно рассмотрим твое резюме!
17 Марта
Казань
Компания "ИТ1" Проект предполагает создание полностью нового дашборда на BI-платформе Банка (АС Навигатор), который мог бы выполнять те же...
17 Марта
Казань
Компания "Брайт Эйдженси" Рекрутинговое агентство Brightman находится в поиске Senior Data Engineer . Наш клиент – государственный...
17 Марта
Junior QA Automation Engineer (Python / Selenium)
Казань
от 100 000 руб.
Компания "ДЕКА" Мы разрабатываем систему сетевого контроля доступа DECK AUTH для широкого круга корпоративных клиентов. Продукт из года в год...
19 Марта
QA Automation Engineer (Java)( Aston )
Казань
Компания "Aston" Aston — аккредитованная аутсорсинговая IT-компания, работающая с 2007 года. Наш штат насчитывает 2500+ специалистов. Мы...
19 Марта
QA Engineer Java / Инженер-тестировщик Java (ученик)
Казань
Компания "Aston" Хотите стать тестировщиком с нуля? Пройдите бесплатное обучение и начните карьеру в ASTON! Мы растем и готовим себе новое...
Вакансия размещена в отрасли