NLP engineer (GigaChat Pretrain Data)

Приглашаем Вас на работу на должность NLP engineer (GigaChat Pretrain Data) зарплата от 0 Полная занятость Полный рабочий день

Расширенное описание

Вакансия

NLP engineer (GigaChat Pretrain Data)

Зарплата

от 0

Организация

Ефимов Алексей Александрович

Адрес организации

г Москва

Адрес трудоустройства

Регион: Москва МО
Дополнительная информация по адресу: г Москва

Должностные обязанности

Мы - команда GigaChat Pretrain Data, готовим pretrain данные для GigaChat и GigaChat Vision. Pretrain данные - это фундамент, с которого начинается путь современной LLM модели и то, от чего наиболее зависит ее итоговое качество. Сырых данных более 40Пб и основная задача заключается в том, чтобы из этого хаоса сделать датасет, на котором будет обучена лучшая LLM в России. Обязанности: генерировать синтетические данные: математика, код, произвольная синтетика с сидами - документами из Web исследовать токенизацию и ее влияния на качество модели (возможно написание статей) решать задачи кластеризации миллиардов документов исследовать разные факторы, которыми обладают текстовые данные генерировать Vision данные для прокачки VLM разрабатывать новые алгоритмы парсинга HTML и исследовать его влияние на качество модели исследовать зависимости между pretrain данными и agentic capabilities итоговой модели разрабатывать стабильную инфраструктуру, которая будет поддерживать проведение сотен и тысяч экспериментов над данными. Требования: выпускник ШАД/ ВШЭ Факультета компьютерных наук/ МФТИ Факультета инноваций и высоких технологий имеешь коммерческий релевантный опыт в роли NLP Engineer от двух лет навыки работы с генеративными AI-моделями; опыт создания AI-агентов и использования их в работе будет преимуществом опыт использования GigaChat, Kandinsky и аналогов в продуктах, навыки создания и использования AI-агентов инструментальное владение AI для анализа, генерации и автоматизации. Условия: комфортный современный офис рядом с м. Кутузовская гибридный формат работы (2 дня в офисе, 3 дня на удалёнке) ежегодный пересмотр зарплаты, годовая премия корпоративный спортзал и зоны отдыха система обучения для профессионального и карьерного развития расширенный полис ДМС с первого дня работы и страхование для семьи льготная программа ипотеки для сотрудников бесплатная подписка СберПрайм+, скидки на продукты компаний-партнеров вознаграждение за рекомендацию друзей в команду Сбера.

Данные по вакансии

Специальность: NLP engineer (GigaChat Pretrain Data)
Профобласть: Информационные технологии, телекоммуникации, связь
Режим работы: Полная занятость
Характер работы: Полный рабочий день
Источник информации: Вакансия интернет ресурса

Требования к соискателю

Образование: Не указано

Информация

Дата: 2025-12-13

Контакты работодателя

Ефимов Алексей Александрович
Регион: Москва МО
Адрес: г Москва
ОГРН: 1067761906805
ИНН: 7718620740
Введите требуемое название профессии и выберите населенный пункт
Ищем специальность
В городе