, вакансия NLP engineer (GigaChat Pretrain Data)
Приглашаем Вас на работу на должность NLP engineer (GigaChat Pretrain Data) зарплата от 0 Полная занятость Полный рабочий день
Расширенное описание |
|
|---|---|
Вакансия |
NLP engineer (GigaChat Pretrain Data) |
Зарплата |
от 0 |
Организация |
Россельхозбанк |
Адрес организации |
г Москва |
Адрес трудоустройства
Регион: Москва МО
Дополнительная информация по адресу: г Москва
Должностные обязанности
Мы - команда GigaChat Pretrain Data, готовим pretrain данные для GigaChat и GigaChat Vision. Данных много. Очень много (40+ Пб сырого хаоса). Если хочется не просто тренировать модели, а работать с реально большими данными, то вот твой шанс. Обязанности чистить данные по узким доменам (аниме, игры, сериалы, книги, фильмы) → LLM-парсинг + Code Execution Feedback; генерить синтетические данные; разбираться с токенизацией; кластеризовать данные; писать дедупликацию на Rust; оптимизировать MapReduce → Spark, тысячи ядер; экспериментировать с SFT и RL → DPO, DRPO, увеличиваем качество синтетики. Требования выпускник ШАД/ ВШЭ Факультета компьютерных наук/ МФТИ Факультета инноваций и высоких технологий имеешь коммерческий релевантный опыт в роли NLP Engineer от двух лет навыки работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе будет преимуществом опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки создания и использования AI-агентов инструментальное владение AI для анализа, генерации и автоматизации. Условия комфортный современный офис рядом с м. Кутузовская гибридный формат работы (2 дня в офисе, 3 дня на удалёнке) ежегодный пересмотр зарплаты, годовая премия корпоративный спортзал и зоны отдыха система обучения для профессионального и карьерного развития расширенный полис ДМС с первого дня работы и страхование для семьи гибкий дисконт по ипотечному кредиту, равный 1/3 ключевой ставки ЦБ бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров вознаграждение за рекомендацию друзей в команду Сбера.
Данные по вакансии
Специальность: NLP engineer (GigaChat Pretrain Data)
Профобласть: Информационные технологии, телекоммуникации, связь
Режим работы: Полная занятость
Характер работы: Полный рабочий день
Источник информации: Вакансия интернет ресурса
Требования к соискателю
Образование: Не указано
Информация
Дата: 2025-10-09
Контакты работодателя
Регион: Москва МО
Адрес: г Москва
ОГРН: 1067761906805
ИНН: 7718620740
Введите требуемое название профессии и выберите населенный пункт
Специальное предложение