🔍 Data Analyst / Аналитик данных
🏢 Компания: Цифровая Трансформация
💻 Формат: Удаленная работа
📍 Локация: РФ
💰 Зарплата: 180 000 - 300 000 ₽ (net)
🎯 Ключевые навыки и компетенции:
1️⃣ Знание 1С:
- Уверенное владение 1С для извлечения, анализа и подготовки отчетов
- Интеграция и автоматизация потоков данных
- Опыт анализа финансовых и складских данных
2️⃣ Работа с данными и анализ:
- Работа с большими объемами данных
- Экспертное владение SQL
- Excel, Python/R для глубокого анализа
- BI-инструменты (Apache Superset, Tableau, Power BI)
3️⃣ Проведение ad-hoc исследований:
- Разовые анализы для бизнес-решений
- Генерация практических инсайтов
- Презентация данных для нетехнической аудитории
📋 Обязанности:
- Анализ данных и отчетность
- Интеграция с бизнес-процессами
- Поддержка принятия решений
- Визуализация и коммуникация
- Кросс-функциональное взаимодействие
💼 Желательный опыт:
- Опыт в розничной торговле электроникой
- Проекты по динамическому ценообразованию
- Оптимизация управления запасами
- Персонализация и удержание клиентов
🛠 Технические инструменты:
- Основные: 1С, SQL, Excel
- Дополнительные: Apache Superset, Python/R
👤 Личные качества:
- Аналитическое мышление
- Эффективная коммуникация
- Проактивность
📱 Контакт для связи: @sakutepov
#вакансия #аналитик #удаленка #data
🏢 Компания: Цифровая Трансформация
💻 Формат: Удаленная работа
📍 Локация: РФ
💰 Зарплата: 180 000 - 300 000 ₽ (net)
🎯 Ключевые навыки и компетенции:
1️⃣ Знание 1С:
- Уверенное владение 1С для извлечения, анализа и подготовки отчетов
- Интеграция и автоматизация потоков данных
- Опыт анализа финансовых и складских данных
2️⃣ Работа с данными и анализ:
- Работа с большими объемами данных
- Экспертное владение SQL
- Excel, Python/R для глубокого анализа
- BI-инструменты (Apache Superset, Tableau, Power BI)
3️⃣ Проведение ad-hoc исследований:
- Разовые анализы для бизнес-решений
- Генерация практических инсайтов
- Презентация данных для нетехнической аудитории
📋 Обязанности:
- Анализ данных и отчетность
- Интеграция с бизнес-процессами
- Поддержка принятия решений
- Визуализация и коммуникация
- Кросс-функциональное взаимодействие
💼 Желательный опыт:
- Опыт в розничной торговле электроникой
- Проекты по динамическому ценообразованию
- Оптимизация управления запасами
- Персонализация и удержание клиентов
🛠 Технические инструменты:
- Основные: 1С, SQL, Excel
- Дополнительные: Apache Superset, Python/R
👤 Личные качества:
- Аналитическое мышление
- Эффективная коммуникация
- Проактивность
📱 Контакт для связи: @sakutepov
#вакансия #аналитик #удаленка #data
👍1
#vacancy #fulltime #remote #hybrid #MLEngineer #ML
Company: AI Startup
Vacancy: Lead ML Engineer
Location: Moscow
🎯 The Role
- Create and implement innovative LLM-based solutions and algorithms
- Work in agile cross-functional team with PM, Backend Engineer, Data Engineer, UX/UI and Business Analyst. Be hands-on writing the code for ML part of application and managing other team members
- Wrap developed algorithms into productized backend solutions
- Work directly with clients to understand and meet their needs
- Partner with experts in AI, venture, and business consulting
👀 Who we seek
- Experience working with LLMs
- Design and implementation of RAG systems: connecting LLMs with vector databases, live Internet search, etc
- Fine-tuning of existing state-of-the-art solutions and understanding of LLM working principle
- Proficiency in the Python (advanced), SQL (intermediate) and LLM frameworks: chains, tools, agents, LCEL
- Experience in building API for LLM solutions (e.g. using FastAPI) and being familiar with concepts of cloud deployment
- 3-5 years of hands-on ML development experience, with experience in building GenAI solutions
- (nearly)Fluent English
🏆 What we offer:
- Unique experience at the intersection of technology and venture business in various industries
- Competitive salary and bonus system based on the interview results
- Lunch allowance
- Medical insurance, with access to a wide range of health clinics and services
- Taxi compensation
- Mobile phone charges.
Feel free to ask any questions: @katyamaro
Company: AI Startup
Vacancy: Lead ML Engineer
Location: Moscow
🎯 The Role
- Create and implement innovative LLM-based solutions and algorithms
- Work in agile cross-functional team with PM, Backend Engineer, Data Engineer, UX/UI and Business Analyst. Be hands-on writing the code for ML part of application and managing other team members
- Wrap developed algorithms into productized backend solutions
- Work directly with clients to understand and meet their needs
- Partner with experts in AI, venture, and business consulting
👀 Who we seek
- Experience working with LLMs
- Design and implementation of RAG systems: connecting LLMs with vector databases, live Internet search, etc
- Fine-tuning of existing state-of-the-art solutions and understanding of LLM working principle
- Proficiency in the Python (advanced), SQL (intermediate) and LLM frameworks: chains, tools, agents, LCEL
- Experience in building API for LLM solutions (e.g. using FastAPI) and being familiar with concepts of cloud deployment
- 3-5 years of hands-on ML development experience, with experience in building GenAI solutions
- (nearly)Fluent English
🏆 What we offer:
- Unique experience at the intersection of technology and venture business in various industries
- Competitive salary and bonus system based on the interview results
- Lunch allowance
- Medical insurance, with access to a wide range of health clinics and services
- Taxi compensation
- Mobile phone charges.
Feel free to ask any questions: @katyamaro
🥴3❤1
Forwarded from Новости Москвы
This media is not supported in your browser
VIEW IN TELEGRAM
👨💻Sber AI Lab — центр экспертизы Сбера в области искусственного интеллекта ищет людей в команду
Команда - топ по количеству научных статей на A*/A конференции и Q1 журналы в Сбере. А узнать больше об open-source решениях лаборатории можно на GitHub.
Команда - топ по количеству научных статей на A*/A конференции и Q1 журналы в Сбере. А узнать больше об open-source решениях лаборатории можно на GitHub.
🔥3
Меня зовут Егор. Ищу себе крутых ребят в команду
Уверенный пользователь ПК: могу поговорить про разработку, mentorship, ds. Пару лет прожил в Бангкоке, умею говорить по-тайски
А ещё могу рассказать, как собирать кубик-рубика сетками (ждёмс статью на arxiv...)
Мы разрабатываем чат поддержки, который легко встраивается на сайт. У нас большой штат операторов и куча данных, так что работа будет нескучной! Сейчас ищем НЛП-волшебников, которые помогут нам сделать систему умнее. Вот, что предстоит:
💡 Классификация диалогов: чтобы понимать, о чем идет речь, и как принимать решения
💡 Тематическое моделирование + подсказки: чтобы наши операторы могли работать как боги, а пользователи уходили довольными
Есть место для экспериментов
Буду рад обсудить @eurvanov
Уверенный пользователь ПК: могу поговорить про разработку, mentorship, ds. Пару лет прожил в Бангкоке, умею говорить по-тайски
А ещё могу рассказать, как собирать кубик-рубика сетками (ждёмс статью на arxiv...)
Мы разрабатываем чат поддержки, который легко встраивается на сайт. У нас большой штат операторов и куча данных, так что работа будет нескучной! Сейчас ищем НЛП-волшебников, которые помогут нам сделать систему умнее. Вот, что предстоит:
💡 Классификация диалогов: чтобы понимать, о чем идет речь, и как принимать решения
💡 Тематическое моделирование + подсказки: чтобы наши операторы могли работать как боги, а пользователи уходили довольными
Есть место для экспериментов
Буду рад обсудить @eurvanov
🥴22🥱3👍2😱2🔥1
#вакансия#vacancy#senior#ML
Вакансия:Senior ML engineer
Компания:EXCDEV
Формат:удаленный(из любой точки мира)
Зарплатная плата:270-330 тысяч рублей на руки.
Чем предстоит заниматься:
- Построение и обучение моделей машинного обучения
- Проведение исследований в новых направлениях с использованием нейронных сетей
- Разработка моделей анализа информации
- Разработка ассистентов и чат-ботов под нужны организации с учетом базовых
скриптов и сценариев взаимодействия с пользователями
- Поддержка и обновление нейросетей в соответствии с изменениями в бизнесе
- Аналитика качества моделей
Требования:
- Минимум 3 года опыта работы в управлении тематическими или техническое данными,
инжиниринге данных или анализе данных
- Уверенное знание Python и основных библиотек анализа данных
- Уверенное знание SQL, опыт работы с различными типами СУБД
-Знание основ Data Science, хорошие аналитические способности
- Опыт разработки RESTful API и интеграция с внешними сервисами
- Опыт в сфере NLP
- Опыт работы с популярными LLM : Gpt3.5/4, LLama2, Falcon
- Опыт работы с генеративными моделями, транcформерами
- Навыки работы с библиотеками PyTorch, TensorFlow (для возможности fine-tuning LLM под
конкретную задачу)
- Разработка векторизованных баз знаний
- Умение работать с Git
Условия:
-График работы 5/2 с 10-00 до 19.00 по московскому времени;
-Удаленный формат работы из любой страны;
- Карьерный рост до тимлида команды.
Просьба направлять резюме:
@VLT_recruiter
Вакансия:Senior ML engineer
Компания:EXCDEV
Формат:удаленный(из любой точки мира)
Зарплатная плата:270-330 тысяч рублей на руки.
Чем предстоит заниматься:
- Построение и обучение моделей машинного обучения
- Проведение исследований в новых направлениях с использованием нейронных сетей
- Разработка моделей анализа информации
- Разработка ассистентов и чат-ботов под нужны организации с учетом базовых
скриптов и сценариев взаимодействия с пользователями
- Поддержка и обновление нейросетей в соответствии с изменениями в бизнесе
- Аналитика качества моделей
Требования:
- Минимум 3 года опыта работы в управлении тематическими или техническое данными,
инжиниринге данных или анализе данных
- Уверенное знание Python и основных библиотек анализа данных
- Уверенное знание SQL, опыт работы с различными типами СУБД
-Знание основ Data Science, хорошие аналитические способности
- Опыт разработки RESTful API и интеграция с внешними сервисами
- Опыт в сфере NLP
- Опыт работы с популярными LLM : Gpt3.5/4, LLama2, Falcon
- Опыт работы с генеративными моделями, транcформерами
- Навыки работы с библиотеками PyTorch, TensorFlow (для возможности fine-tuning LLM под
конкретную задачу)
- Разработка векторизованных баз знаний
- Умение работать с Git
Условия:
-График работы 5/2 с 10-00 до 19.00 по московскому времени;
-Удаленный формат работы из любой страны;
- Карьерный рост до тимлида команды.
Просьба направлять резюме:
@VLT_recruiter
😁8👍2
Мы ищем Middle researcher в команду Лаборатории Сбериндекс / Сбер
Сбериндекс - это команда Сбера, которая занимается аналитикой транзакционных данных и данных из платежных систем банка для поиска актуальных инсайтов о жизни людей, предприятий и территорий в стране. Команда состоит из исследователей и дата-инженеров с экспертизой источников данных (выпускники РЭШ, РЭШ/ШАД, ВШЭ, МФТИ, ВМК МГУ). Поэтому сейчас ищем middle researcher в нашу исследовательскую команду.
Обязанности:
🔸Заниматься подготовкой данных (генерация переменных, «чистка» данных)
🔸Разрабатывать алгоритмы и модели и имплементировать их с учетом существующих наработок лаборатории
🔸Участвовать в обсуждениях исследований, peer review материалов
🔸Писать чистый и эффективный код
🔸Производить эмпирические исследования и формулировать выводы на основе полученных результатов
🔸Писать научные работы уровня Q1 журналов и A* конференций
Требования:
▫️Высшее образование в области компьютерных наук, прикладной математики, искусственного интеллекта в ведущих университетах (бакалавр или магистр)
▫️Сильная математическая подготовка (математический анализ, линейная алгебра: математическая статистика и теория вероятностей)
▫️Понимание принципов и алгоритмов искусственного интеллекта;
▫️Знакомство с Scikit-learn, Tensorflow/Pytorch, Matplot/Seaborn и т. д.
▫️Интерес к исследовательской работе, участие в научно-исследовательских проектах
▫️Хорошие навыки программирования на Python и способность писать чистый и читаемый код
▫️Базовые знания Git
Будет преимуществом:
▫️Понимание MapReduce и параллелизма в Python
▫️Участие в проектах со сложной подготовкой данных
Что мы можем предложить?
#️⃣ Уникальный проект, ориентированный на амбициозную стратегию, - работа с большими данными платежных систем для оценки актуальных экономических проблем в стране
#️⃣ Работа с данными различной природы, из различных источников, возможность познакомиться с тем, как устроены различные стороны бизнеса банка и технологической компании
#️⃣ Результаты вашей работы будут иметь реальное влияние на стратегии бизнеса, возможности улучшать условия жизни людей. Постоянный контакт и обратная связь от руководства.
#️⃣ Достойный уровень оплаты труда.
Ждём резюме на @dtsyplakova
Сбериндекс - это команда Сбера, которая занимается аналитикой транзакционных данных и данных из платежных систем банка для поиска актуальных инсайтов о жизни людей, предприятий и территорий в стране. Команда состоит из исследователей и дата-инженеров с экспертизой источников данных (выпускники РЭШ, РЭШ/ШАД, ВШЭ, МФТИ, ВМК МГУ). Поэтому сейчас ищем middle researcher в нашу исследовательскую команду.
Обязанности:
🔸Заниматься подготовкой данных (генерация переменных, «чистка» данных)
🔸Разрабатывать алгоритмы и модели и имплементировать их с учетом существующих наработок лаборатории
🔸Участвовать в обсуждениях исследований, peer review материалов
🔸Писать чистый и эффективный код
🔸Производить эмпирические исследования и формулировать выводы на основе полученных результатов
🔸Писать научные работы уровня Q1 журналов и A* конференций
Требования:
▫️Высшее образование в области компьютерных наук, прикладной математики, искусственного интеллекта в ведущих университетах (бакалавр или магистр)
▫️Сильная математическая подготовка (математический анализ, линейная алгебра: математическая статистика и теория вероятностей)
▫️Понимание принципов и алгоритмов искусственного интеллекта;
▫️Знакомство с Scikit-learn, Tensorflow/Pytorch, Matplot/Seaborn и т. д.
▫️Интерес к исследовательской работе, участие в научно-исследовательских проектах
▫️Хорошие навыки программирования на Python и способность писать чистый и читаемый код
▫️Базовые знания Git
Будет преимуществом:
▫️Понимание MapReduce и параллелизма в Python
▫️Участие в проектах со сложной подготовкой данных
Что мы можем предложить?
#️⃣ Уникальный проект, ориентированный на амбициозную стратегию, - работа с большими данными платежных систем для оценки актуальных экономических проблем в стране
#️⃣ Работа с данными различной природы, из различных источников, возможность познакомиться с тем, как устроены различные стороны бизнеса банка и технологической компании
#️⃣ Результаты вашей работы будут иметь реальное влияние на стратегии бизнеса, возможности улучшать условия жизни людей. Постоянный контакт и обратная связь от руководства.
#️⃣ Достойный уровень оплаты труда.
Ждём резюме на @dtsyplakova
👍7
Forwarded from Love. Death. Transformers.
Инженер LLM (Оптимизация и RL Alignment)
Стартап в области безопасности ИИ
Чем предстоит заниматься:
Дообучение и Оценка Sota llm, аттаки на blackbox модели
Улучшение RL для аттак на модели, настройки моделей (PPO, RLHF, стабильность обучения).
Бенчмаркинг и оценка качества моделей (ELO-метрики, alignment).
Оптимизация инференса (vLLM, SGLang, TRT).
Требования:
Опыт работы с LLM (архитектуры, RL, alignment).
Знание PyTorch/JAX.
Реальная практика с RL методами (DPO, RLHF — плюс).
Опыт с системами инференса (vLLM, kuber, docker).
Публикации в NeurIPS/ICML/ICLR и др. — сильный плюс.
Преимущество:
Экспертиза в байесовской оптимизации, эволюционных алгоритмах, гиперпараметрическом поиске, автоматической оптимизации промптов.
Условия:
Зарплата: 80K–130K usd + опционы.
Релокация в Париж🥐, полная занятость.
Работа с передовым стеком (AI research, model alignment).
Отклик:
https://forms.gle/z45WwdBTRHrd8inM9
Стартап в области безопасности ИИ
Чем предстоит заниматься:
Дообучение и Оценка Sota llm, аттаки на blackbox модели
Улучшение RL для аттак на модели, настройки моделей (PPO, RLHF, стабильность обучения).
Бенчмаркинг и оценка качества моделей (ELO-метрики, alignment).
Оптимизация инференса (vLLM, SGLang, TRT).
Требования:
Опыт работы с LLM (архитектуры, RL, alignment).
Знание PyTorch/JAX.
Реальная практика с RL методами (DPO, RLHF — плюс).
Опыт с системами инференса (vLLM, kuber, docker).
Публикации в NeurIPS/ICML/ICLR и др. — сильный плюс.
Преимущество:
Экспертиза в байесовской оптимизации, эволюционных алгоритмах, гиперпараметрическом поиске, автоматической оптимизации промптов.
Условия:
Зарплата: 80K–130K usd + опционы.
Релокация в Париж🥐, полная занятость.
Работа с передовым стеком (AI research, model alignment).
Отклик:
https://forms.gle/z45WwdBTRHrd8inM9
😁2👍1
AI-инженер (LLM) в MetaLead
Компания MetaLead (международный e-commerce) ищет ИИ-инженера для внедрения ИИ в бизнес-процессы своей компании.
Какими задачами нужно будет заниматься:
- Сбор и анализ данных для повышения точности классификации статусов обращений и генерации персонализированных рекомендаций.
- Внедрение языковых моделей для анализа звонков, классификации обращений и генерации человекоподобных отчетов.
- Разработка сервисов для оптимизации скриптов, персонализации диалогов, автоматизации ведения диалогов и мониторинга качества.
- Интеграция разработанных сервисов с CRM, системой транскрибации и корпоративными API.
- Развертывание, мониторинг и обновление моделей в продакшене.
- Настройка версионирования моделей и обеспечение масштабируемости решения.
- Проведение дообучения моделей с учетом специфики бизнеса.
- Тесное взаимодействие с менеджером проекта, IT-отделом, бизнес-подразделениями и специалистами по качеству для определения требований, тестирования и оптимизации функционала.
- Участие в планировании, итеративном тестировании и пилотных запусках новых ИИ-фич.
Что ожидается от кандидата:
- Высшее техническое образование (информатика, ИИ, машинное обучение или смежные области).
- Опыт работы в сфере NLP/LLM, разработки и внедрения ИИ-решений не менее 2-х лет.
- Уверенное знание Python, опыт работы с FastAPI и современными ML-фреймворками (LangChain, LangGraph, RAG и т.п.).
- Опыт работы с векторными базами данных (FAISS, PGVector, Pinecone, Qdrant и т.д.).
- Умение разрабатывать и оптимизировать промпты, знание продвинутых методов промтинга.
- Опыт интеграции ИИ-сервисов с корпоративными системами и API.
- Знание принципов MLOps/LLMOps, опыт развертывания и поддержки моделей в продакшене.
- Понимание особенностей работы колл-центров, CRM-систем и процессов продаж будет преимуществом.
- Умение работать в кросс-функциональной команде, аналитический склад ума и ориентация на результат.
Что предлагают:
- Участие в масштабном проекте по цифровой трансформации бизнеса.
- Возможность работы с передовыми технологиями ИИ и участие в формировании ИИ-стратегии в компании, где руководство слышит и поощряет предложения.
- Конкурентоспособную заработную плату и прозрачные условия оплаты.
- Оформление согласно ТК РФ с первого дня.
- Гибкое начало рабочего дня - 9:00, 10:00, 11:00 (офис или гибрид, удаленка по договоренности).
- Крутой современный просторный комфортный офис вблизи ст. м. Тульская (БЦ "Даниловская Мануфактура").
- Плюшки типа свежесваренного кофе, чая, завтраков и обедов, и зоны отдыха конечно есть.
- Возможность самореализации и развития + адекватное руководство, профессиональных коллег, здоровую атмосферу 🙂
Ссылка на вакансию
Можно писать @andre_andreevich
Компания MetaLead (международный e-commerce) ищет ИИ-инженера для внедрения ИИ в бизнес-процессы своей компании.
Какими задачами нужно будет заниматься:
- Сбор и анализ данных для повышения точности классификации статусов обращений и генерации персонализированных рекомендаций.
- Внедрение языковых моделей для анализа звонков, классификации обращений и генерации человекоподобных отчетов.
- Разработка сервисов для оптимизации скриптов, персонализации диалогов, автоматизации ведения диалогов и мониторинга качества.
- Интеграция разработанных сервисов с CRM, системой транскрибации и корпоративными API.
- Развертывание, мониторинг и обновление моделей в продакшене.
- Настройка версионирования моделей и обеспечение масштабируемости решения.
- Проведение дообучения моделей с учетом специфики бизнеса.
- Тесное взаимодействие с менеджером проекта, IT-отделом, бизнес-подразделениями и специалистами по качеству для определения требований, тестирования и оптимизации функционала.
- Участие в планировании, итеративном тестировании и пилотных запусках новых ИИ-фич.
Что ожидается от кандидата:
- Высшее техническое образование (информатика, ИИ, машинное обучение или смежные области).
- Опыт работы в сфере NLP/LLM, разработки и внедрения ИИ-решений не менее 2-х лет.
- Уверенное знание Python, опыт работы с FastAPI и современными ML-фреймворками (LangChain, LangGraph, RAG и т.п.).
- Опыт работы с векторными базами данных (FAISS, PGVector, Pinecone, Qdrant и т.д.).
- Умение разрабатывать и оптимизировать промпты, знание продвинутых методов промтинга.
- Опыт интеграции ИИ-сервисов с корпоративными системами и API.
- Знание принципов MLOps/LLMOps, опыт развертывания и поддержки моделей в продакшене.
- Понимание особенностей работы колл-центров, CRM-систем и процессов продаж будет преимуществом.
- Умение работать в кросс-функциональной команде, аналитический склад ума и ориентация на результат.
Что предлагают:
- Участие в масштабном проекте по цифровой трансформации бизнеса.
- Возможность работы с передовыми технологиями ИИ и участие в формировании ИИ-стратегии в компании, где руководство слышит и поощряет предложения.
- Конкурентоспособную заработную плату и прозрачные условия оплаты.
- Оформление согласно ТК РФ с первого дня.
- Гибкое начало рабочего дня - 9:00, 10:00, 11:00 (офис или гибрид, удаленка по договоренности).
- Крутой современный просторный комфортный офис вблизи ст. м. Тульская (БЦ "Даниловская Мануфактура").
- Плюшки типа свежесваренного кофе, чая, завтраков и обедов, и зоны отдыха конечно есть.
- Возможность самореализации и развития + адекватное руководство, профессиональных коллег, здоровую атмосферу 🙂
Ссылка на вакансию
Можно писать @andre_andreevich
hh.ru
Вакансия Инженер по ИИ в Москве, работа в компании metaLead (вакансия в архиве c 5 марта 2025)
Зарплата: не указана. Москва. Требуемый опыт: 1–3 года. Полная. Дата публикации: 27.02.2025.
🔥2👍1
Forwarded from Valery Vorobiev
Data Scientist в GigaChat Pretrain Data
💰 Вилка 250–450К гросс + годовая премия 3–6 окладов, ищем мидл/мидл+.
Мы готовим pretrain-данные для GigaChat и GigaChat Vision. Данных много. Очень много (40+ Пб сырого хаоса). Если хочется не просто тренировать модели, а копаться в реально больших данных, то вот твой шанс.
🎥 Вайб задач можно почувствовать тут:
Видео | DataComp-LM | Phi-4
Чем предстоит заниматься?
🔥 Чистить данные по узким доменам (аниме, игры, сериалы, книги, фильмы) → LLM-парсинг + Code Execution Feedback.
🔥 Делать пайплайны для экспериментов (модели 400M – 32B), всё красиво в wandb.
🔥 Фильтровать данные так, чтобы метрики росли.
🔥 Доставать из книг задачи по математике → сиды для синтетики.
🔥 Генерить синтетические данные → на тысячах GPU.
🔥 Разбираться с токенизацией → сколько букв "r" в "strawberry"?
🔥 Кластеризовать данные → чистим данные от мусора, прежде чем модель начнёт верить в астрологию.
🔥 Писать дедупликацию на Rust → миллиарды документов, но не за O(n²).
🔥 Оптимизировать MapReduce → Spark, тысячи ядер (опыт с YTsaurus - плюс).
🔥 Эксперименты с SFT и RL → DPO, DRPO, увеличиваем качество синтетики.
Кого ищем?
✅ ШАД / ФКН / ФПМИ или NLP-опыт 2+ года.
✅ Дотаскивать задачи до DOD, а не «ну, оно работает… вроде».
Что по условиям?
🚀 Железа больше, чем у конкурентов (правда).
🏢 Гибрид: 2 дня в офисе (Кутузовская), 3 дня удалёнка.
💪 Спортзал, зоны отдыха — отдохни после дедупликации.
🏥 ДМС с первого дня + льготное страхование для семьи.
📈 Пересмотр ЗП по perf review.
💬 Пиши, если хочешь работать с настоящими большими данными.
tg: @moonl_ai
💰 Вилка 250–450К гросс + годовая премия 3–6 окладов, ищем мидл/мидл+.
Мы готовим pretrain-данные для GigaChat и GigaChat Vision. Данных много. Очень много (40+ Пб сырого хаоса). Если хочется не просто тренировать модели, а копаться в реально больших данных, то вот твой шанс.
🎥 Вайб задач можно почувствовать тут:
Видео | DataComp-LM | Phi-4
Чем предстоит заниматься?
🔥 Чистить данные по узким доменам (аниме, игры, сериалы, книги, фильмы) → LLM-парсинг + Code Execution Feedback.
🔥 Делать пайплайны для экспериментов (модели 400M – 32B), всё красиво в wandb.
🔥 Фильтровать данные так, чтобы метрики росли.
🔥 Доставать из книг задачи по математике → сиды для синтетики.
🔥 Генерить синтетические данные → на тысячах GPU.
🔥 Разбираться с токенизацией → сколько букв "r" в "strawberry"?
🔥 Кластеризовать данные → чистим данные от мусора, прежде чем модель начнёт верить в астрологию.
🔥 Писать дедупликацию на Rust → миллиарды документов, но не за O(n²).
🔥 Оптимизировать MapReduce → Spark, тысячи ядер (опыт с YTsaurus - плюс).
🔥 Эксперименты с SFT и RL → DPO, DRPO, увеличиваем качество синтетики.
Кого ищем?
✅ ШАД / ФКН / ФПМИ или NLP-опыт 2+ года.
✅ Дотаскивать задачи до DOD, а не «ну, оно работает… вроде».
Что по условиям?
🚀 Железа больше, чем у конкурентов (правда).
🏢 Гибрид: 2 дня в офисе (Кутузовская), 3 дня удалёнка.
💪 Спортзал, зоны отдыха — отдохни после дедупликации.
🏥 ДМС с первого дня + льготное страхование для семьи.
📈 Пересмотр ЗП по perf review.
💬 Пиши, если хочешь работать с настоящими большими данными.
tg: @moonl_ai
YouTube
Как мы варим данные Gigachat Pretrain / Иван Басков
Приглашаем на конференцию Saint HighLoad++ 2025, которая пройдет 23 и 24 июня в Санкт-Петербурге!
Программа, подробности и билеты по ссылке: https://highload.ru/spb/2025
________
Крупнейшая профессиональная конференция для разработчиков высоконагруженных…
Программа, подробности и билеты по ссылке: https://highload.ru/spb/2025
________
Крупнейшая профессиональная конференция для разработчиков высоконагруженных…
🥴3😁1🤔1