ML / DS_Jobs
1.52K subscribers
28 photos
6 videos
2.26K links
Вакансии по ML / DS. Только актуальное.
Оформить и предложить вакансию можно тут: @cyberJohnny
Реклама - @cyberJohnny
Чат: https://t.iss.one/+alZFEF06WPIzNTQy
Download Telegram
Горячая вакансия для аналитика данных на проект миграции данных на Гринплам в Банк из ТОП-10

Преимущества проекта:
- применить свои навыки в масштабном проекте и актуальной на сегодняшней области миграции данных по новой модели
- приобрести новый опыт проектирования хранилища по Data Vault 2.0 и освоить навыки разработчика по фреймворку для аналитиков
- минимум бюрократии, аналитику не нужно заполнять многостраничные технические задания

📍 Требования:

1. Технические знания:
• Реляционные базы данных и SQL:
o Уверенное знание SQL
o Понимание работы с крупными реляционными
системами, в частности
 Oracle
 Greenplum
• Модели данных:
o Знание нормализации данных, в частности
модели 3NF
o Знание (опыт работы будет преимуществом)
концепции Data Vault 2.0:
 Хабы, линк-таблицы, сателлиты
 Принципы работы с хранением версионности данных и историчности (знание типов Slowly changing dimensions)
• ETL/ELT процессы:
o Опыт анализа и построения витрин данных (Data Marts).
o Опыт работы со слоями данных ODS, DDS

2. Навыки анализа:
• Рефакторинга кода
• Умение анализировать источники данных и их взаимосвязь:
o Зависимости между таблицами: опыт системной аналитики по выявлению сущностей, связей, бизнес-ключей
o Логика трансформации данных между слоями данных.
• Опыт работы с ER-диаграммами

Желательно:
Опыт планирования и проектирования DV:
• Умение проектировать модель данных в соответствии с концепцией Data Vault:
o Определение бизнес-ключей, хабов, линков и сателлитов.

👉 По всем вопросам и с резюме пишите: @DariaDRya

@ml_data_science_job
Вакансия: AI Acceleration Engineer

🌍 Локация: Санкт-Петербург (офис)
💼 Компания: крупная китайская компания

Ищем опытного специалиста в области AI и Machine Learning для работы над передовыми технологиями в области крупных языковых моделей, оптимизации и ускорения вычислений.

Чем предстоит заниматься:

🔹 Разрабатывать алгоритмы для оптимизации и ускорения AI-моделей (включая LLM, Diffusion models).
🔹 Применять передовые методы сжатия моделей и повышения их эффективности.
🔹 Работать с GPU и NPU для повышения производительности (TensorFlow, CUDA).
🔹 Участвовать в создании интеллектуальных платформ для облачных вычислений.

Что мы ожидаем:

Опыт работы с AI и глубоким обучением, понимание основ NLP, CV, ASR или TTS.
Уверенные навыки работы с TensorFlow или PyTorch.
Знание C++, Java, Scala и методов параллельных вычислений (CUDA, MPI).
Английский на уровне для работы с документацией и общения.
Приветствуется опыт в крупных технологических компаниях или участие в исследовательских проектах.

Почему стоит работать у нас?

💎 Работа в окружении профессионалов мирового уровня из AMD, Microsoft, NVIDIA и других лидеров.
💰 Зарплата обсуждается индивидуально — мы всегда ценим сильных кандидатов и готовы предложить конкурентные условия.
🌟 Возможность работать над сложными и амбициозными задачами в cutting-edge проектах.

📩 Готовы откликнуться?
Присылайте резюме или задавайте вопросы: @khalvora
👍1
Вакансия: ML/DS-инженер (Network Fingerprinting & Anomaly Detection)

Коротко о проекте:
Мы разрабатываем сервис, который по низкоуровневым отпечаткам (TLS/JA3, HTTP2, TCP/IP и т.д.) определяет:
- Использует ли пользователь VPN/прокси?
- Подделывает ли User-Agent (говорит, что у него Windows, а на самом деле Linux)?
- Какая настоящая ОС клиента, исходя из сетевых особенностей?

Всё это необходимо для профилактики злоупотреблений и фрода. У нас есть база отпечатков в JSON (и возможность собирать их), хотим построить ML-модель (XGBoost, PyTorch, scikit-learn и т.п.), внедрить её в микросервис (REST API), чтобы она в реальном времени выдавала предсказания.

---

### Задачи:

1. Анализ данных (EDA) и фича-инжиниринг
- Разобраться в имеющихся наборах данных (TLS, TCP/IP, HTTP2, JA3 и т.д.).
- Разработать способ извлекать ключевые признаки (MSS, Window Size, набор cipher suites, HTTP2 SETTINGS и т.п.) из сырых логов или JSON-дампов.
- При необходимости помочь доработать процесс сбора данных.

2. Разработка и обучение моделей
- Выбрать подходящие алгоритмы (XGBoost, Random Forest, нейронные сети или комбинацию).
- Настроить процесс обучения и валидации: train/test split, кросс-валидация, подбор гиперпараметров.
- Оценить метрики (Accuracy, Precision/Recall, F1, ROC-AUC и т.д.), предложить способы улучшить качество предсказаний.

3. Построение ML-сервиса
- Обернуть модель в сервис (REST API/gRPC) для интеграции в наше приложение.
- При необходимости настроить окружение (Docker, CI/CD).
- Продумать базовый MLOps-процесс (сбор новых данных, мониторинг качества, периодическое переобучение).

4. Детект VPN/прокси и аномалий
- Определять, что клиент сидит за прокси/VPN, исходя из набора признаков (TTL, JA3, открытые порты, IP-блеклисты и т.д.).
- Анализировать mismatch между User-Agent и реальной ОС (по TCP/IP флагам, JA3, HTTP2).
- Предложить систему порогов (threshold) и/или вероятностных предсказаний (score).

5. (Опционально) Автоматизация & поддержка
- При желании и наличии опыта — помочь настроить инфраструктуру для масштабирования.
- Участвовать в обсуждении и доработке архитектуры приложения.

---

### Требования:

1. Уверенные знания ML и статистики
- Понимание классических алгоритмов (деревья, бустинги), умение выбирать и тюнить модели.
- Желательно опыт с глубинными фреймворками (PyTorch/TensorFlow).

2. Инструменты Data Science
- Python: библиотеки scikit-learn, XGBoost/LightGBM, pandas, numpy.
- Умение визуализировать данные, проводить EDA (matplotlib, seaborn и т.п.).

3. Навыки обработки сетевого трафика (желательно, но можно прокачаться по ходу)
- Основы TCP/IP (MSS, Window Size, TCP Options).
- Понимание TLS ClientHello, JA3-сигнатур.
- Базовое представление о HTTP/2.

4. DevOps / MLOps (на базовом уровне)
- Docker, Git, Linux; плюсом — CI/CD.

5. Дополнительно приветствуется
- Опыт DS-наставничества.
- Базовые знания по безопасности, понимание работы VPN/прокси-сервисов.
- Хорошая математическая база (статистика, матан, вероятностные модели).

---

### Формат работы:
- Удалённо, частичная или полная занятость (обсуждается).
- Работа в небольшом коллективе (сети/бэкенд + ML-часть).
- Задачи в трекере, стендапы/созвоны по мере необходимости.

### Что предлагаем:
- Возможность глубоко разобраться в сетевых отпечатках, работать с интересными данными.
- Гибкость в выборе инструментов: не ограничиваем стектом — главное результат.
- Поддержка с инфраструктурой и сбором данных (с сетевой стороны).
- Конкурентная компенсация (по результатам собеседования).

---

Как откликнуться:
- Напишите о себе, прикрепите резюме/портфолио (GitHub/Kaggle и др.).
- Поделитесь примером ML-проекта, где вы делали пайплайн обучения/деплоя.
- Укажите опыт в сетевых протоколах или безопасности (VPN, прокси), если есть.
Контакт https://t.iss.one/Siemons8
🔥 Вакансия: Data Engineer (финтех, удаленно) 🔥

🚀 О компании: Бонанза Крип

Мы создаем внутренний финтех-продукт — высоконагруженную платформу для аналитики и прогнозирования на криптовалютных и традиционных финансовых рынках.

Компания работает с 2018 года как частный фонд, инвестируя собственный капитал. В команде фаундер с успешным опытом в трейдинге с 2015 года и аналитик с более чем 15-летним стажем.

💼 Обязанности:

- Настройка пайплайнов обработки исторических данных по изменению цен в трейдинге и сигналов
- Построение view для аналитики и фротенда
- Оптимизация SQL запросов
- Организация архитектуры строения данных

🛠 Требования:

- ETL + ELT обработка данных
- Основы DevOps процессов
- Опыт с Google Cloud
- Отличные знания SQL, умение оптимизировать запросы к БД, строить индексы
- Понимание Data Lake и Data Warehouse
- Опыт работы хотя бы с 2 из 3 инструментов: Apache Airflow, Clickhouse, snowflake
- Опыт работы с Time Series Data
- Умение настраивать аналитику
- Релевантный опыт от 4-5 лет

Условия:

- Полная занятость, удалённая работа
- Конкурентная зарплата, оплата в USDT или по договоренности
- Работа в часовом поясе UTC+0 ±3 часа (для удобства коммуникации в команде)

📩 Контакт: @azasisstants

@ml_data_science_job
Data Scientist/Дата-сайентист

Компания: Альфа-Банк: IT-направление и цифровой бизнес

Зарплата: Не указана

Тип занятости:


Ищем Data Scientist, который сможет не только анализировать данные, но и предсказать, почему кофемашина на кухне всегда ломается в пятницу! Если у вас есть опыт работы с большими данными и безграничное желание делать мир лучше через числа, вам к нам. Обещаем кофе, но без данных о его крепости!

Подробнее: https://telegra.ph/Data-ScientistData-sajentist-02-11

#ml #data scientist
#вакансии #datascientist #LeadDS #LeadML #SeniorML #SeniorLLM #LeadLLM #AI #ИИ

Друзья, всем привет!

Ищем техлида, автора и преподавателя лекций, семинаров и задач на практический курс по основам продукта и бизнеса для действующих DS.

О нас:
Standard Data – проектируем и реализуем образовательные решения под заказ крупных компаний в сфере ИИ, дата-инжиниринга и веб-разработки.

Кого ищем:
Техлида, автора и преподавателя лекций, семинаров и задач, которым интересно сделать качественный образовательный продукт, решающий задачи нашей аудитории).
Мы ожидаем от вас глубокой экспертизы в ML и LLM.
И опыт работы на позиции Leadа DS – не менее 3 лет. Плюсом будут знания в области жизненного цикла продукта, тонкостей общения с заказчиком.

Что нужно делать:
• Разработка актуальной программы курса, ревью материалов - роль техлида курса.
• Разработка материалов: лекции, семинары, ДЗ, проекты - роль автора.
• Проводить занятия, обычно по выбранным (2-4) темам из всего курса. Занятия в формате вебинаров 2 раза в неделю по 2 часа - роль преподавателя.
• Прямо сейчас мы на стадии старта разработки курса, поэтому наиболее актуальна именно разработка материалов. Далее, примерно через 3 месяца уже проведение занятий (и далее продолжаем развивать этот курс).

Что мы предлагаем:
• За разработку комплекта материалов к одной теме: лекция, семинар, тест, ДЗ – 40т.р.-70т.р.
• Бонусное вознаграждение Техлида по итогам перформанса курса.
• Сумма оплаты возможна и больше, всё зависит от опыта, публикаций и результатов собеседования.
• За проведение одного двухчасового занятия – 15т.р.-30т.р. в зависимости от вашего опыта.

Ждем тебя в нашей команде, пишите в тг, или сразу кидайте резюме: t.iss.one/KaterinkaGl

@ml_data_science_job
Вакансия: ML/DS-инженер (Network Fingerprinting & Anomaly Detection)

Немного о нас: мы строим систему, которая по низкоуровневым сетевым отпечаткам (TLS/JA3, HTTP2, TCP/IP и т.д.) определяет:
• Используется ли VPN/прокси?
• Подделан ли User-Agent (например, заявлена Windows, а на деле Linux)?
• Какая реальная ОС клиента, исходя из сетевых особенностей?

Собираем логи (JSON с отпечатками) и хотим обучить ML-модель (XGBoost, PyTorch, scikit-learn и т.п.), которая в реальном времени будет давать предсказания по REST API.

---

## Что делать:

1. Анализ данных (EDA) и фича-инжиниринг
- Изучать сырые логи (TLS, TCP/IP, HTTP2, JA3) и выделять нетривиальные признаки (MSS, Window Size, набор cipher suites, HTTP2 SETTINGS и т.п.).
- При необходимости помочь улучшить сбор данных.

2. Разработка и обучение моделей
- Выбирать и тюнить алгоритмы: XGBoost, Random Forest, нейронные сети и т.д.
- Настраивать процесс обучения и валидации (train/test split, кросс-валидация, гиперпараметры).
- Оценивать метрики (Accuracy, Precision/Recall, F1, ROC-AUC) и предлагать способы улучшения.

3. Построение ML-сервиса
- Оборачивать модель в сервис (REST API/gRPC) для интеграции.
- Настраивать окружение (Docker, CI/CD).
- Продумывать MLOps: сбор новых данных, мониторинг качества, переобучение.

4. Детект VPN/прокси и аномалий
- Выявлять прокси/VPN по набору признаков (TTL, JA3, IP-блеклисты и т.д.).
- Анализировать несоответствия между User-Agent и реальной ОС (TCP/IP флаги, JA3, HTTP2).
- Разрабатывать систему порогов (threshold) или вероятностных оценок (score).

5. (Опционально) Автоматизация и масштабирование
- По желанию помогать с инфраструктурой.
- Участвовать в обсуждении архитектуры приложения.

---

## Требования:

1. ML и статистика
- Понимание классических алгоритмов (деревья решений, бустинги) и навыки тюнинга.
- Приветствуется опыт с PyTorch/TensorFlow.

2. Инструменты Data Science
- Python: pandas, numpy, scikit-learn, XGBoost/LightGBM.
- Умение делать EDA, визуализации (matplotlib, seaborn и т.п.) и строить надёжные фичи из «грязных» данных..

3. Сетевые протоколы (желательно, но можно прокачаться)
- Основы TCP/IP (MSS, Window Size, TCP Options).
- Понимание TLS ClientHello, JA3-сигнатур.
- Базовые знания HTTP/2.

4. DevOps / MLOps
- Docker, Git, Linux; будет плюсом опыт с CI/CD.

5. Дополнительно
- Опыт наставничества в DS.
- Понимание безопасности, VPN/прокси.
- Сильная математическая база (статистика, матан, вероятности).

---

## Условия работы:

- Удалённая работа (полная или частичная занятость — обсуждается).
- Небольшая команда (сети/бэкенд + ML).
- Задачи ведутся в трекере, созвоны/стендапы по необходимости.

Финансовая часть:
- Вилка 100–250 тыс. руб. в месяц (зависит от опыта).
- Возможны выплаты в USDT.
- Дополнительный бонус: доступ к лицензии [Cursor.com] (актуальные модели, например, Sonnet 3.5).

---

## Что получаете:
- Глубокий опыт в сетевых отпечатках, работа с уникальными данными.
- Полную свободу выбора инструментов (главное — результат).
- Поддержку по инфраструктуре и сбору сетевых данных.
- Интересные челленджи в ML + Security.

---

## Как откликнуться:
- Напишите о себе в личку и прикрепите резюме/портфолио (GitHub/Kaggle).
- Поделитесь примером ML-проекта, где вы делали пайплайн обучения/деплоя.
- Расскажите, какой у вас опыт в сетевых протоколах или безопасности (VPN, прокси).

Контакт: [@Siemons8](https://t.iss.one/Siemons8)
👎4🔥2🤯1🖕1
Как быстро обработать миллиарды записей?Будь то SQL-аналитика или данные для машинного обучения Завтра об этом будет рассказывать провайдер Cloud․ru.Еще можно успеть зарегистрироваться (https://cloud.ru/events/evolution-managed-spark-i-obrabotka-milliardov-zapisei-875573301?utm_source=smm&utm_medium=im&utm_campaign=webinar-18.02.25&utm_content=pl:tg_chnl:_lid:no) на их бесплатный вебинар, чтобы послушать:😶‍🌫️как с помощью сервиса Evolution Managed Spark обрабатывать миллиарды записей;😶‍🌫️как интегрировать Spark с Trino и Metastore;😶‍🌫️как визуализировать обработанные данные с помощью системы BI.Ну, и конечно, задать вопросы по работе с большими данными 🤓

@ml_data_science_job
Где искать работу на удаленку или релокацию?Наши коллеги ежедневно собирают вакансии прямыми контактами hr. Для удобства собрали все папкой. (https://t.iss.one/addlist/wPeKkOJ_JPFkM2Ji)🛸@opento_data (https://t.iss.one/opento_data) - вакансии для ML, Data Science, Computer Vision, NLP и аналитиков.✈️@young_relocate (https://t.iss.one/young_relocate) - дайджесты айти вакансий на удаленку и релокацию, включая аналитику.🚀@opento_crypto (https://t.iss.one/opento_crypto) - в крипто и финтех сфере, web3, включая Antifraud и AML.🥷@opento_dev (https://t.iss.one/opento_dev) - вакансии для разработчиков, инженеров, SRE, DevOps и др.🕹@young_gamedev (https://t.iss.one/young_gamedev) - работа в геймдеве для художников и разработчиков (Unreal, Unity, C++).🎰iGaming Jobs (https://t.iss.one/opento_igaming) - вакансии в igaming, betting, affilate сферe.👀HR Guru (https://t.iss.one/+97vQGMj7MRZjNzYy) - вредные советы о карьере и поиску работы.Горящие оферы:🇪🇸ML Engineer (https://t.iss.one/opento_data/352) - релокация в Барселону ,6000€🇨🇾Marketing Data Analyst (https://t.iss.one/opento_data/351) - помогают с релоком на Кипр🇨🇾Data Scientist / Simple (https://t.iss.one/opento_data/349) 🔹Product Analyst / QIC (https://t.iss.one/opento_data/336)🔹Front End Engineer / HerculesAI (https://t.iss.one/opento_dev/503)🔹Rust Developer в Bitsgap - (https://t.iss.one/opento_dev/504) 6000EUR🔹Product Analyst / QIC (https://t.iss.one/opento_data/336)

@ml_data_science_job
Вакансия: Middle ML DeveloperО нас: Сколтех, Центр прикладного ИИ.Мы занимаемся разработкой передовых решений для нефтегазовой отрасли на основе LLMs и графовых БД. Вам предстоит участвовать в разработке системы для автоматического проектирования нефтяных и газовых месторождений (дообучение мультимодальных LLMs для анализа чертежей, построение графов знаний из нормативных документов с помощью KuzuDB, и т. д.).Также мы проводим исследования в области объединения LLMs и графов знаний и участвуем в конференциях уровня А*.Формат: full-time, удаленно.Требования к разработчику: знание библиотек PyTorch, Transformers; опыт работы с большими языковыми моделями; креативность, нестандартный подход к решению задач.Мы предлагаем:🔥 удаленный график работы;🔥 конкурентный уровень ЗП;🔥 возможность обмена опытом с востребованной сфере с более опытными специалистами.Контакты для связи: @dmitrij_euseew (https://t.iss.one/dmitrij_euseew)

@ml_data_science_job
Вакансия: ML/DS-инженер (Network Fingerprinting & Anomaly Detection)Немного о нас: мы строим систему, которая по низкоуровневым сетевым отпечаткам (TLS/JA3, HTTP2, TCP/IP и т.д.) определяет: • Используется ли VPN/прокси? • Подделан ли User-Agent (например, заявлена Windows, а на деле Linux)? • Какая реальная ОС клиента, исходя из сетевых особенностей?Собираем логи (JSON с отпечатками) и хотим обучить ML-модель (XGBoost, PyTorch, scikit-learn и т.п.), которая в реальном времени будет давать предсказания по REST API.---## Что делать:1. Анализ данных (EDA) и фича-инжиниринг - Изучать сырые логи (TLS, TCP/IP, HTTP2, JA3) и выделять нетривиальные признаки (MSS, Window Size, набор cipher suites, HTTP2 SETTINGS и т.п.). - При необходимости помочь улучшить сбор данных.2. Разработка и обучение моделей - Выбирать и тюнить алгоритмы: XGBoost, Random Forest, нейронные сети и т.д. - Настраивать процесс обучения и валидации (train/test split, кросс-валидация, гиперпараметры). - Оценивать метрики (Accuracy, Precision/Recall, F1, ROC-AUC) и предлагать способы улучшения.3. Построение ML-сервиса - Оборачивать модель в сервис (REST API/gRPC) для интеграции. - Настраивать окружение (Docker, CI/CD). - Продумывать MLOps: сбор новых данных, мониторинг качества, переобучение.4. Детект VPN/прокси и аномалий - Выявлять прокси/VPN по набору признаков (TTL, JA3, IP-блеклисты и т.д.). - Анализировать несоответствия между User-Agent и реальной ОС (TCP/IP флаги, JA3, HTTP2). - Разрабатывать систему порогов (threshold) или вероятностных оценок (score).5. (Опционально) Автоматизация и масштабирование - По желанию помогать с инфраструктурой. - Участвовать в обсуждении архитектуры приложения.---## Требования:1. ML и статистика - Понимание классических алгоритмов (деревья решений, бустинги) и навыки тюнинга. - Приветствуется опыт с PyTorch/TensorFlow.2. Инструменты Data Science - Python: pandas, numpy, scikit-learn, XGBoost/LightGBM. - Умение делать EDA, визуализации (matplotlib, seaborn и т.п.) и строить надёжные фичи из «грязных» данных..3. Сетевые протоколы (желательно, но можно прокачаться) - Основы TCP/IP (MSS, Window Size, TCP Options). - Понимание TLS ClientHello, JA3-сигнатур. - Базовые знания HTTP/2.4. DevOps / MLOps - Docker, Git, Linux; будет плюсом опыт с CI/CD.5. Дополнительно - Опыт наставничества в DS. - Понимание безопасности, VPN/прокси. - Сильная математическая база (статистика, матан, вероятности).---## Условия работы:- Удалённая работа (полная или частичная занятость — обсуждается). - Небольшая команда (сети/бэкенд + ML). - Задачи ведутся в трекере, созвоны/стендапы по необходимости. Финансовая часть: - Вилка 100–250 тыс. руб. в месяц (зависит от опыта). - Возможны выплаты в USDT. - Дополнительный бонус: доступ к лицензии [Cursor․com] (актуальные модели, например, Sonnet 3.5).---## Что получаете:- Глубокий опыт в сетевых отпечатках, работа с уникальными данными. - Полную свободу выбора инструментов (главное — результат). - Поддержку по инфраструктуре и сбору сетевых данных. - Интересные челленджи в ML + Security.---## Как откликнуться:- Напишите о себе в личку и прикрепите резюме/портфолио (GitHub/Kaggle). - Поделитесь примером ML-проекта, где вы делали пайплайн обучения/деплоя. - Расскажите, какой у вас опыт в сетевых протоколах или безопасности (VPN, прокси). Контакт: https://t.iss.one/Siemons8

@ml_data_science_job
👏1
Главная гонка десятилетия – AI. В 2025 все решитсяГод только начинается, а OpenAI уже выпускает самую умную из когда-либо существовавших моделей, США выделяет на развитие ИИ 20 годовых бюджетов NASA, а Китай тратит миллионы на контрабанду чипов Nvidia. В Data Secrets (https://t.iss.one/+jCvxiw7LPrpiYmIy) показывают, что на самом деле происходит и как обучают модели. Без иллюзий и хайпа – только ключевые новости, разборы свежих исследований и эксклюзивные практические советы по ML и Data Science.За каждым постом стоит ML-Researcher с научными публикациями и внушительным опытом в промышленности. Так что каждая разбираемая здесь тема подкреплена фактами и экспертизой автора. Подпишись, чтобы не потерять. Нас уже 50 тысяч: @data_secrets (https://t.iss.one/+jCvxiw7LPrpiYmIy)

@ml_data_science_job
Что можно сделать за 2 недели, чтобы выйти на новый уровень в робототехнике и генеративном ИИ? У Яндекс Образования есть ответ — пройти бесплатный студкемп! Это интенсив, на котором вас ждёт много практики, общения с экспертами из индустрии и, конечно, самые актуальные знания.

Весенний студкемп по робототехнике и ИИ пройдёт с 14 по 26 апреля на базе ФПМИ МФТИ. Учиться придётся много, ведь программу составляли специалисты Яндекса, ШАДа и МФТИ. На студкемпе ждут студентов со всей России и каждому, кто пройдёт отбор, оплатят проезд и проживание. Успейте подать заявку (https://education.yandex.ru/studcamp-mipt?utm_source=telegram&utm_medium=social&utm_campaign=studcampmipt-2025&utm_content=) до 23 февраля.

@ml_data_science_job