Горячая вакансия для аналитика данных на проект миграции данных на Гринплам в Банк из ТОП-10
Преимущества проекта:
- применить свои навыки в масштабном проекте и актуальной на сегодняшней области миграции данных по новой модели
- приобрести новый опыт проектирования хранилища по Data Vault 2.0 и освоить навыки разработчика по фреймворку для аналитиков
- минимум бюрократии, аналитику не нужно заполнять многостраничные технические задания
📍 Требования:
1. Технические знания:
• Реляционные базы данных и SQL:
o Уверенное знание SQL
o Понимание работы с крупными реляционными
системами, в частности
Oracle
Greenplum
• Модели данных:
o Знание нормализации данных, в частности
модели 3NF
o Знание (опыт работы будет преимуществом)
концепции Data Vault 2.0:
Хабы, линк-таблицы, сателлиты
Принципы работы с хранением версионности данных и историчности (знание типов Slowly changing dimensions)
• ETL/ELT процессы:
o Опыт анализа и построения витрин данных (Data Marts).
o Опыт работы со слоями данных ODS, DDS
2. Навыки анализа:
• Рефакторинга кода
• Умение анализировать источники данных и их взаимосвязь:
o Зависимости между таблицами: опыт системной аналитики по выявлению сущностей, связей, бизнес-ключей
o Логика трансформации данных между слоями данных.
• Опыт работы с ER-диаграммами
Желательно:
Опыт планирования и проектирования DV:
• Умение проектировать модель данных в соответствии с концепцией Data Vault:
o Определение бизнес-ключей, хабов, линков и сателлитов.
👉 По всем вопросам и с резюме пишите: @DariaDRya
@ml_data_science_job
Преимущества проекта:
- применить свои навыки в масштабном проекте и актуальной на сегодняшней области миграции данных по новой модели
- приобрести новый опыт проектирования хранилища по Data Vault 2.0 и освоить навыки разработчика по фреймворку для аналитиков
- минимум бюрократии, аналитику не нужно заполнять многостраничные технические задания
📍 Требования:
1. Технические знания:
• Реляционные базы данных и SQL:
o Уверенное знание SQL
o Понимание работы с крупными реляционными
системами, в частности
Oracle
Greenplum
• Модели данных:
o Знание нормализации данных, в частности
модели 3NF
o Знание (опыт работы будет преимуществом)
концепции Data Vault 2.0:
Хабы, линк-таблицы, сателлиты
Принципы работы с хранением версионности данных и историчности (знание типов Slowly changing dimensions)
• ETL/ELT процессы:
o Опыт анализа и построения витрин данных (Data Marts).
o Опыт работы со слоями данных ODS, DDS
2. Навыки анализа:
• Рефакторинга кода
• Умение анализировать источники данных и их взаимосвязь:
o Зависимости между таблицами: опыт системной аналитики по выявлению сущностей, связей, бизнес-ключей
o Логика трансформации данных между слоями данных.
• Опыт работы с ER-диаграммами
Желательно:
Опыт планирования и проектирования DV:
• Умение проектировать модель данных в соответствии с концепцией Data Vault:
o Определение бизнес-ключей, хабов, линков и сателлитов.
👉 По всем вопросам и с резюме пишите: @DariaDRya
@ml_data_science_job
Вакансия: AI Acceleration Engineer
🌍 Локация: Санкт-Петербург (офис)
💼 Компания: крупная китайская компания
Ищем опытного специалиста в области AI и Machine Learning для работы над передовыми технологиями в области крупных языковых моделей, оптимизации и ускорения вычислений.
Чем предстоит заниматься:
🔹 Разрабатывать алгоритмы для оптимизации и ускорения AI-моделей (включая LLM, Diffusion models).
🔹 Применять передовые методы сжатия моделей и повышения их эффективности.
🔹 Работать с GPU и NPU для повышения производительности (TensorFlow, CUDA).
🔹 Участвовать в создании интеллектуальных платформ для облачных вычислений.
Что мы ожидаем:
✅ Опыт работы с AI и глубоким обучением, понимание основ NLP, CV, ASR или TTS.
✅ Уверенные навыки работы с TensorFlow или PyTorch.
✅ Знание C++, Java, Scala и методов параллельных вычислений (CUDA, MPI).
✅ Английский на уровне для работы с документацией и общения.
✅ Приветствуется опыт в крупных технологических компаниях или участие в исследовательских проектах.
Почему стоит работать у нас?
💎 Работа в окружении профессионалов мирового уровня из AMD, Microsoft, NVIDIA и других лидеров.
💰 Зарплата обсуждается индивидуально — мы всегда ценим сильных кандидатов и готовы предложить конкурентные условия.
🌟 Возможность работать над сложными и амбициозными задачами в cutting-edge проектах.
📩 Готовы откликнуться?
Присылайте резюме или задавайте вопросы: @khalvora
🌍 Локация: Санкт-Петербург (офис)
💼 Компания: крупная китайская компания
Ищем опытного специалиста в области AI и Machine Learning для работы над передовыми технологиями в области крупных языковых моделей, оптимизации и ускорения вычислений.
Чем предстоит заниматься:
🔹 Разрабатывать алгоритмы для оптимизации и ускорения AI-моделей (включая LLM, Diffusion models).
🔹 Применять передовые методы сжатия моделей и повышения их эффективности.
🔹 Работать с GPU и NPU для повышения производительности (TensorFlow, CUDA).
🔹 Участвовать в создании интеллектуальных платформ для облачных вычислений.
Что мы ожидаем:
✅ Опыт работы с AI и глубоким обучением, понимание основ NLP, CV, ASR или TTS.
✅ Уверенные навыки работы с TensorFlow или PyTorch.
✅ Знание C++, Java, Scala и методов параллельных вычислений (CUDA, MPI).
✅ Английский на уровне для работы с документацией и общения.
✅ Приветствуется опыт в крупных технологических компаниях или участие в исследовательских проектах.
Почему стоит работать у нас?
💎 Работа в окружении профессионалов мирового уровня из AMD, Microsoft, NVIDIA и других лидеров.
💰 Зарплата обсуждается индивидуально — мы всегда ценим сильных кандидатов и готовы предложить конкурентные условия.
🌟 Возможность работать над сложными и амбициозными задачами в cutting-edge проектах.
📩 Готовы откликнуться?
Присылайте резюме или задавайте вопросы: @khalvora
👍1
Вакансия: ML/DS-инженер (Network Fingerprinting & Anomaly Detection)
Коротко о проекте:
Мы разрабатываем сервис, который по низкоуровневым отпечаткам (TLS/JA3, HTTP2, TCP/IP и т.д.) определяет:
- Использует ли пользователь VPN/прокси?
- Подделывает ли User-Agent (говорит, что у него Windows, а на самом деле Linux)?
- Какая настоящая ОС клиента, исходя из сетевых особенностей?
Всё это необходимо для профилактики злоупотреблений и фрода. У нас есть база отпечатков в JSON (и возможность собирать их), хотим построить ML-модель (XGBoost, PyTorch, scikit-learn и т.п.), внедрить её в микросервис (REST API), чтобы она в реальном времени выдавала предсказания.
---
### Задачи:
1. Анализ данных (EDA) и фича-инжиниринг
- Разобраться в имеющихся наборах данных (TLS, TCP/IP, HTTP2, JA3 и т.д.).
- Разработать способ извлекать ключевые признаки (MSS, Window Size, набор cipher suites, HTTP2 SETTINGS и т.п.) из сырых логов или JSON-дампов.
- При необходимости помочь доработать процесс сбора данных.
2. Разработка и обучение моделей
- Выбрать подходящие алгоритмы (XGBoost, Random Forest, нейронные сети или комбинацию).
- Настроить процесс обучения и валидации: train/test split, кросс-валидация, подбор гиперпараметров.
- Оценить метрики (Accuracy, Precision/Recall, F1, ROC-AUC и т.д.), предложить способы улучшить качество предсказаний.
3. Построение ML-сервиса
- Обернуть модель в сервис (REST API/gRPC) для интеграции в наше приложение.
- При необходимости настроить окружение (Docker, CI/CD).
- Продумать базовый MLOps-процесс (сбор новых данных, мониторинг качества, периодическое переобучение).
4. Детект VPN/прокси и аномалий
- Определять, что клиент сидит за прокси/VPN, исходя из набора признаков (TTL, JA3, открытые порты, IP-блеклисты и т.д.).
- Анализировать mismatch между User-Agent и реальной ОС (по TCP/IP флагам, JA3, HTTP2).
- Предложить систему порогов (threshold) и/или вероятностных предсказаний (score).
5. (Опционально) Автоматизация & поддержка
- При желании и наличии опыта — помочь настроить инфраструктуру для масштабирования.
- Участвовать в обсуждении и доработке архитектуры приложения.
---
### Требования:
1. Уверенные знания ML и статистики
- Понимание классических алгоритмов (деревья, бустинги), умение выбирать и тюнить модели.
- Желательно опыт с глубинными фреймворками (PyTorch/TensorFlow).
2. Инструменты Data Science
- Python: библиотеки
- Умение визуализировать данные, проводить EDA (matplotlib, seaborn и т.п.).
3. Навыки обработки сетевого трафика (желательно, но можно прокачаться по ходу)
- Основы TCP/IP (MSS, Window Size, TCP Options).
- Понимание TLS ClientHello, JA3-сигнатур.
- Базовое представление о HTTP/2.
4. DevOps / MLOps (на базовом уровне)
- Docker, Git, Linux; плюсом — CI/CD.
5. Дополнительно приветствуется
- Опыт DS-наставничества.
- Базовые знания по безопасности, понимание работы VPN/прокси-сервисов.
- Хорошая математическая база (статистика, матан, вероятностные модели).
---
### Формат работы:
- Удалённо, частичная или полная занятость (обсуждается).
- Работа в небольшом коллективе (сети/бэкенд + ML-часть).
- Задачи в трекере, стендапы/созвоны по мере необходимости.
### Что предлагаем:
- Возможность глубоко разобраться в сетевых отпечатках, работать с интересными данными.
- Гибкость в выборе инструментов: не ограничиваем стектом — главное результат.
- Поддержка с инфраструктурой и сбором данных (с сетевой стороны).
- Конкурентная компенсация (по результатам собеседования).
---
Как откликнуться:
- Напишите о себе, прикрепите резюме/портфолио (GitHub/Kaggle и др.).
- Поделитесь примером ML-проекта, где вы делали пайплайн обучения/деплоя.
- Укажите опыт в сетевых протоколах или безопасности (VPN, прокси), если есть.
Контакт https://t.iss.one/Siemons8
Коротко о проекте:
Мы разрабатываем сервис, который по низкоуровневым отпечаткам (TLS/JA3, HTTP2, TCP/IP и т.д.) определяет:
- Использует ли пользователь VPN/прокси?
- Подделывает ли User-Agent (говорит, что у него Windows, а на самом деле Linux)?
- Какая настоящая ОС клиента, исходя из сетевых особенностей?
Всё это необходимо для профилактики злоупотреблений и фрода. У нас есть база отпечатков в JSON (и возможность собирать их), хотим построить ML-модель (XGBoost, PyTorch, scikit-learn и т.п.), внедрить её в микросервис (REST API), чтобы она в реальном времени выдавала предсказания.
---
### Задачи:
1. Анализ данных (EDA) и фича-инжиниринг
- Разобраться в имеющихся наборах данных (TLS, TCP/IP, HTTP2, JA3 и т.д.).
- Разработать способ извлекать ключевые признаки (MSS, Window Size, набор cipher suites, HTTP2 SETTINGS и т.п.) из сырых логов или JSON-дампов.
- При необходимости помочь доработать процесс сбора данных.
2. Разработка и обучение моделей
- Выбрать подходящие алгоритмы (XGBoost, Random Forest, нейронные сети или комбинацию).
- Настроить процесс обучения и валидации: train/test split, кросс-валидация, подбор гиперпараметров.
- Оценить метрики (Accuracy, Precision/Recall, F1, ROC-AUC и т.д.), предложить способы улучшить качество предсказаний.
3. Построение ML-сервиса
- Обернуть модель в сервис (REST API/gRPC) для интеграции в наше приложение.
- При необходимости настроить окружение (Docker, CI/CD).
- Продумать базовый MLOps-процесс (сбор новых данных, мониторинг качества, периодическое переобучение).
4. Детект VPN/прокси и аномалий
- Определять, что клиент сидит за прокси/VPN, исходя из набора признаков (TTL, JA3, открытые порты, IP-блеклисты и т.д.).
- Анализировать mismatch между User-Agent и реальной ОС (по TCP/IP флагам, JA3, HTTP2).
- Предложить систему порогов (threshold) и/или вероятностных предсказаний (score).
5. (Опционально) Автоматизация & поддержка
- При желании и наличии опыта — помочь настроить инфраструктуру для масштабирования.
- Участвовать в обсуждении и доработке архитектуры приложения.
---
### Требования:
1. Уверенные знания ML и статистики
- Понимание классических алгоритмов (деревья, бустинги), умение выбирать и тюнить модели.
- Желательно опыт с глубинными фреймворками (PyTorch/TensorFlow).
2. Инструменты Data Science
- Python: библиотеки
scikit-learn
, XGBoost
/LightGBM
, pandas
, numpy
. - Умение визуализировать данные, проводить EDA (matplotlib, seaborn и т.п.).
3. Навыки обработки сетевого трафика (желательно, но можно прокачаться по ходу)
- Основы TCP/IP (MSS, Window Size, TCP Options).
- Понимание TLS ClientHello, JA3-сигнатур.
- Базовое представление о HTTP/2.
4. DevOps / MLOps (на базовом уровне)
- Docker, Git, Linux; плюсом — CI/CD.
5. Дополнительно приветствуется
- Опыт DS-наставничества.
- Базовые знания по безопасности, понимание работы VPN/прокси-сервисов.
- Хорошая математическая база (статистика, матан, вероятностные модели).
---
### Формат работы:
- Удалённо, частичная или полная занятость (обсуждается).
- Работа в небольшом коллективе (сети/бэкенд + ML-часть).
- Задачи в трекере, стендапы/созвоны по мере необходимости.
### Что предлагаем:
- Возможность глубоко разобраться в сетевых отпечатках, работать с интересными данными.
- Гибкость в выборе инструментов: не ограничиваем стектом — главное результат.
- Поддержка с инфраструктурой и сбором данных (с сетевой стороны).
- Конкурентная компенсация (по результатам собеседования).
---
Как откликнуться:
- Напишите о себе, прикрепите резюме/портфолио (GitHub/Kaggle и др.).
- Поделитесь примером ML-проекта, где вы делали пайплайн обучения/деплоя.
- Укажите опыт в сетевых протоколах или безопасности (VPN, прокси), если есть.
Контакт https://t.iss.one/Siemons8
Telegram
Zloy
You can contact @Siemons8 right away.
🔥 Вакансия: Data Engineer (финтех, удаленно) 🔥
🚀 О компании: Бонанза Крип
Мы создаем внутренний финтех-продукт — высоконагруженную платформу для аналитики и прогнозирования на криптовалютных и традиционных финансовых рынках.
Компания работает с 2018 года как частный фонд, инвестируя собственный капитал. В команде фаундер с успешным опытом в трейдинге с 2015 года и аналитик с более чем 15-летним стажем.
💼 Обязанности:
- Настройка пайплайнов обработки исторических данных по изменению цен в трейдинге и сигналов
- Построение view для аналитики и фротенда
- Оптимизация SQL запросов
- Организация архитектуры строения данных
🛠 Требования:
- ETL + ELT обработка данных
- Основы DevOps процессов
- Опыт с Google Cloud
- Отличные знания SQL, умение оптимизировать запросы к БД, строить индексы
- Понимание Data Lake и Data Warehouse
- Опыт работы хотя бы с 2 из 3 инструментов: Apache Airflow, Clickhouse, snowflake
- Опыт работы с Time Series Data
- Умение настраивать аналитику
- Релевантный опыт от 4-5 лет
✅ Условия:
- Полная занятость, удалённая работа
- Конкурентная зарплата, оплата в USDT или по договоренности
- Работа в часовом поясе UTC+0 ±3 часа (для удобства коммуникации в команде)
📩 Контакт: @azasisstants
@ml_data_science_job
🚀 О компании: Бонанза Крип
Мы создаем внутренний финтех-продукт — высоконагруженную платформу для аналитики и прогнозирования на криптовалютных и традиционных финансовых рынках.
Компания работает с 2018 года как частный фонд, инвестируя собственный капитал. В команде фаундер с успешным опытом в трейдинге с 2015 года и аналитик с более чем 15-летним стажем.
💼 Обязанности:
- Настройка пайплайнов обработки исторических данных по изменению цен в трейдинге и сигналов
- Построение view для аналитики и фротенда
- Оптимизация SQL запросов
- Организация архитектуры строения данных
🛠 Требования:
- ETL + ELT обработка данных
- Основы DevOps процессов
- Опыт с Google Cloud
- Отличные знания SQL, умение оптимизировать запросы к БД, строить индексы
- Понимание Data Lake и Data Warehouse
- Опыт работы хотя бы с 2 из 3 инструментов: Apache Airflow, Clickhouse, snowflake
- Опыт работы с Time Series Data
- Умение настраивать аналитику
- Релевантный опыт от 4-5 лет
✅ Условия:
- Полная занятость, удалённая работа
- Конкурентная зарплата, оплата в USDT или по договоренности
- Работа в часовом поясе UTC+0 ±3 часа (для удобства коммуникации в команде)
📩 Контакт: @azasisstants
@ml_data_science_job
Data Scientist/Дата-сайентист
Компания: Альфа-Банк: IT-направление и цифровой бизнес
Зарплата: Не указана
Тип занятости:
Ищем Data Scientist, который сможет не только анализировать данные, но и предсказать, почему кофемашина на кухне всегда ломается в пятницу! Если у вас есть опыт работы с большими данными и безграничное желание делать мир лучше через числа, вам к нам. Обещаем кофе, но без данных о его крепости!
Подробнее: https://telegra.ph/Data-ScientistData-sajentist-02-11
#ml #data scientist
Компания: Альфа-Банк: IT-направление и цифровой бизнес
Зарплата: Не указана
Тип занятости:
Ищем Data Scientist, который сможет не только анализировать данные, но и предсказать, почему кофемашина на кухне всегда ломается в пятницу! Если у вас есть опыт работы с большими данными и безграничное желание делать мир лучше через числа, вам к нам. Обещаем кофе, но без данных о его крепости!
Подробнее: https://telegra.ph/Data-ScientistData-sajentist-02-11
#ml #data scientist
Telegraph
Data Scientist/Дата-сайентист
Альфа Банк – один из ведущих частных банков, который входит в число системно значимых банков Беларуси.Мы работаем как финтех-компания, интегрируя в свою бизнес-модель успешные практики в области мобильных платежей, онлайн-кредитования, цифровых транзакций…
Data Scientist (Нижний Новгород)
Компания: ООО Алгоритмик Дата
Зарплата: Не указана
Тип занятости:
Почему Data Scientist из Нижнего Новгорода всегда на высоте? Потому что у него отличный "данный" подход!
Подробнее: https://telegra.ph/Data-Scientist-Nizhnij-Novgorod-02-12
#ml #data scientist
Компания: ООО Алгоритмик Дата
Зарплата: Не указана
Тип занятости:
Почему Data Scientist из Нижнего Новгорода всегда на высоте? Потому что у него отличный "данный" подход!
Подробнее: https://telegra.ph/Data-Scientist-Nizhnij-Novgorod-02-12
#ml #data scientist
Telegraph
Data Scientist (Нижний Новгород)
Алгоритмикс – аккредитованная IT-компания, специализирующаяся на разработке решений в области Data Science (коробочные продукты и индивидуальные решения ML и AI). Мы имеем уникальную экспертизу в работе со всеми видами данных, так как наши клиенты – крупнейшие…
Data Scientist
Компания: АльфаСтрахование
Зарплата: Не указана
Тип занятости:
Почему Data Scientist всегда в хорошем настроении? Он легко находит позитив даже в отрицательных значениях!
Подробнее: https://telegra.ph/Data-Scientist-02-12-2
#ml #data scientist
Компания: АльфаСтрахование
Зарплата: Не указана
Тип занятости:
Почему Data Scientist всегда в хорошем настроении? Он легко находит позитив даже в отрицательных значениях!
Подробнее: https://telegra.ph/Data-Scientist-02-12-2
#ml #data scientist
Telegraph
Data Scientist
«АльфаСтрахование» - крупнейшая российская частная страховая компания и технологический лидер отрасли - усиливает команду машинного обучения и работы с данными. Мы ищем data scientist’а в команду, занимающуюся развитием ML-подходов в страховании. Если у вас…
#вакансии #datascientist #LeadDS #LeadML #SeniorML #SeniorLLM #LeadLLM #AI #ИИ
Друзья, всем привет!
Ищем техлида, автора и преподавателя лекций, семинаров и задач на практический курс по основам продукта и бизнеса для действующих DS.
О нас:
Standard Data – проектируем и реализуем образовательные решения под заказ крупных компаний в сфере ИИ, дата-инжиниринга и веб-разработки.
Кого ищем:
Техлида, автора и преподавателя лекций, семинаров и задач, которым интересно сделать качественный образовательный продукт, решающий задачи нашей аудитории).
Мы ожидаем от вас глубокой экспертизы в ML и LLM.
И опыт работы на позиции Leadа DS – не менее 3 лет. Плюсом будут знания в области жизненного цикла продукта, тонкостей общения с заказчиком.
Что нужно делать:
• Разработка актуальной программы курса, ревью материалов - роль техлида курса.
• Разработка материалов: лекции, семинары, ДЗ, проекты - роль автора.
• Проводить занятия, обычно по выбранным (2-4) темам из всего курса. Занятия в формате вебинаров 2 раза в неделю по 2 часа - роль преподавателя.
• Прямо сейчас мы на стадии старта разработки курса, поэтому наиболее актуальна именно разработка материалов. Далее, примерно через 3 месяца уже проведение занятий (и далее продолжаем развивать этот курс).
Что мы предлагаем:
• За разработку комплекта материалов к одной теме: лекция, семинар, тест, ДЗ – 40т.р.-70т.р.
• Бонусное вознаграждение Техлида по итогам перформанса курса.
• Сумма оплаты возможна и больше, всё зависит от опыта, публикаций и результатов собеседования.
• За проведение одного двухчасового занятия – 15т.р.-30т.р. в зависимости от вашего опыта.
Ждем тебя в нашей команде, пишите в тг, или сразу кидайте резюме: t.iss.one/KaterinkaGl
@ml_data_science_job
Друзья, всем привет!
Ищем техлида, автора и преподавателя лекций, семинаров и задач на практический курс по основам продукта и бизнеса для действующих DS.
О нас:
Standard Data – проектируем и реализуем образовательные решения под заказ крупных компаний в сфере ИИ, дата-инжиниринга и веб-разработки.
Кого ищем:
Техлида, автора и преподавателя лекций, семинаров и задач, которым интересно сделать качественный образовательный продукт, решающий задачи нашей аудитории).
Мы ожидаем от вас глубокой экспертизы в ML и LLM.
И опыт работы на позиции Leadа DS – не менее 3 лет. Плюсом будут знания в области жизненного цикла продукта, тонкостей общения с заказчиком.
Что нужно делать:
• Разработка актуальной программы курса, ревью материалов - роль техлида курса.
• Разработка материалов: лекции, семинары, ДЗ, проекты - роль автора.
• Проводить занятия, обычно по выбранным (2-4) темам из всего курса. Занятия в формате вебинаров 2 раза в неделю по 2 часа - роль преподавателя.
• Прямо сейчас мы на стадии старта разработки курса, поэтому наиболее актуальна именно разработка материалов. Далее, примерно через 3 месяца уже проведение занятий (и далее продолжаем развивать этот курс).
Что мы предлагаем:
• За разработку комплекта материалов к одной теме: лекция, семинар, тест, ДЗ – 40т.р.-70т.р.
• Бонусное вознаграждение Техлида по итогам перформанса курса.
• Сумма оплаты возможна и больше, всё зависит от опыта, публикаций и результатов собеседования.
• За проведение одного двухчасового занятия – 15т.р.-30т.р. в зависимости от вашего опыта.
Ждем тебя в нашей команде, пишите в тг, или сразу кидайте резюме: t.iss.one/KaterinkaGl
@ml_data_science_job
Telegram
Kate
Standard Data
Data Scientist
Компания: RDP.RU
Зарплата: Не указана
Тип занятости:
Почему Data Scientist не заботится о кофе? У него уже есть "глубокие" анализы!
Подробнее: https://telegra.ph/Data-Scientist-02-14-4
#ml #data scientist
Компания: RDP.RU
Зарплата: Не указана
Тип занятости:
Почему Data Scientist не заботится о кофе? У него уже есть "глубокие" анализы!
Подробнее: https://telegra.ph/Data-Scientist-02-14-4
#ml #data scientist
Telegraph
Data Scientist
RDP - ведущий российский производитель сетевых решений. Мы специализируемся на разработке инновационного программного обеспечения и программно-аппаратных комплексов для высокопроизводительной обработки сетевого трафика. Продукция компании широко востребована…
Data Scientist
Компания: Сбер для экспертов
Зарплата: Не указана
Тип занятости: Полная занятость, полный день
Какой алгоритм помощи выбрать, если данные решают пойти в отпуск?
Подробнее: https://telegra.ph/Data-Scientist-02-15-3
#ml #data scientist
Компания: Сбер для экспертов
Зарплата: Не указана
Тип занятости: Полная занятость, полный день
Какой алгоритм помощи выбрать, если данные решают пойти в отпуск?
Подробнее: https://telegra.ph/Data-Scientist-02-15-3
#ml #data scientist
Telegraph
Data Scientist
Команда, отвечающая за AI инициативы бизнеса Департамента Глобальных Рынков Сбера. Что мы делаем? Департамента Глобальных Рынков (ДГР) – предоставляет корпоративным и розничным клиентам широкий спектр продуктов и услуг на финансовых рынках. Ключевые направления…
Вакансия: ML/DS-инженер (Network Fingerprinting & Anomaly Detection)
Немного о нас: мы строим систему, которая по низкоуровневым сетевым отпечаткам (TLS/JA3, HTTP2, TCP/IP и т.д.) определяет:
• Используется ли VPN/прокси?
• Подделан ли User-Agent (например, заявлена Windows, а на деле Linux)?
• Какая реальная ОС клиента, исходя из сетевых особенностей?
Собираем логи (JSON с отпечатками) и хотим обучить ML-модель (XGBoost, PyTorch, scikit-learn и т.п.), которая в реальном времени будет давать предсказания по REST API.
---
## Что делать:
1. Анализ данных (EDA) и фича-инжиниринг
- Изучать сырые логи (TLS, TCP/IP, HTTP2, JA3) и выделять нетривиальные признаки (MSS, Window Size, набор cipher suites, HTTP2 SETTINGS и т.п.).
- При необходимости помочь улучшить сбор данных.
2. Разработка и обучение моделей
- Выбирать и тюнить алгоритмы: XGBoost, Random Forest, нейронные сети и т.д.
- Настраивать процесс обучения и валидации (train/test split, кросс-валидация, гиперпараметры).
- Оценивать метрики (Accuracy, Precision/Recall, F1, ROC-AUC) и предлагать способы улучшения.
3. Построение ML-сервиса
- Оборачивать модель в сервис (REST API/gRPC) для интеграции.
- Настраивать окружение (Docker, CI/CD).
- Продумывать MLOps: сбор новых данных, мониторинг качества, переобучение.
4. Детект VPN/прокси и аномалий
- Выявлять прокси/VPN по набору признаков (TTL, JA3, IP-блеклисты и т.д.).
- Анализировать несоответствия между User-Agent и реальной ОС (TCP/IP флаги, JA3, HTTP2).
- Разрабатывать систему порогов (threshold) или вероятностных оценок (score).
5. (Опционально) Автоматизация и масштабирование
- По желанию помогать с инфраструктурой.
- Участвовать в обсуждении архитектуры приложения.
---
## Требования:
1. ML и статистика
- Понимание классических алгоритмов (деревья решений, бустинги) и навыки тюнинга.
- Приветствуется опыт с PyTorch/TensorFlow.
2. Инструменты Data Science
- Python: pandas, numpy, scikit-learn, XGBoost/LightGBM.
- Умение делать EDA, визуализации (matplotlib, seaborn и т.п.) и строить надёжные фичи из «грязных» данных..
3. Сетевые протоколы (желательно, но можно прокачаться)
- Основы TCP/IP (MSS, Window Size, TCP Options).
- Понимание TLS ClientHello, JA3-сигнатур.
- Базовые знания HTTP/2.
4. DevOps / MLOps
- Docker, Git, Linux; будет плюсом опыт с CI/CD.
5. Дополнительно
- Опыт наставничества в DS.
- Понимание безопасности, VPN/прокси.
- Сильная математическая база (статистика, матан, вероятности).
---
## Условия работы:
- Удалённая работа (полная или частичная занятость — обсуждается).
- Небольшая команда (сети/бэкенд + ML).
- Задачи ведутся в трекере, созвоны/стендапы по необходимости.
Финансовая часть:
- Вилка 100–250 тыс. руб. в месяц (зависит от опыта).
- Возможны выплаты в USDT.
- Дополнительный бонус: доступ к лицензии [Cursor.com] (актуальные модели, например, Sonnet 3.5).
---
## Что получаете:
- Глубокий опыт в сетевых отпечатках, работа с уникальными данными.
- Полную свободу выбора инструментов (главное — результат).
- Поддержку по инфраструктуре и сбору сетевых данных.
- Интересные челленджи в ML + Security.
---
## Как откликнуться:
- Напишите о себе в личку и прикрепите резюме/портфолио (GitHub/Kaggle).
- Поделитесь примером ML-проекта, где вы делали пайплайн обучения/деплоя.
- Расскажите, какой у вас опыт в сетевых протоколах или безопасности (VPN, прокси).
Контакт: [@Siemons8](https://t.iss.one/Siemons8)
Немного о нас: мы строим систему, которая по низкоуровневым сетевым отпечаткам (TLS/JA3, HTTP2, TCP/IP и т.д.) определяет:
• Используется ли VPN/прокси?
• Подделан ли User-Agent (например, заявлена Windows, а на деле Linux)?
• Какая реальная ОС клиента, исходя из сетевых особенностей?
Собираем логи (JSON с отпечатками) и хотим обучить ML-модель (XGBoost, PyTorch, scikit-learn и т.п.), которая в реальном времени будет давать предсказания по REST API.
---
## Что делать:
1. Анализ данных (EDA) и фича-инжиниринг
- Изучать сырые логи (TLS, TCP/IP, HTTP2, JA3) и выделять нетривиальные признаки (MSS, Window Size, набор cipher suites, HTTP2 SETTINGS и т.п.).
- При необходимости помочь улучшить сбор данных.
2. Разработка и обучение моделей
- Выбирать и тюнить алгоритмы: XGBoost, Random Forest, нейронные сети и т.д.
- Настраивать процесс обучения и валидации (train/test split, кросс-валидация, гиперпараметры).
- Оценивать метрики (Accuracy, Precision/Recall, F1, ROC-AUC) и предлагать способы улучшения.
3. Построение ML-сервиса
- Оборачивать модель в сервис (REST API/gRPC) для интеграции.
- Настраивать окружение (Docker, CI/CD).
- Продумывать MLOps: сбор новых данных, мониторинг качества, переобучение.
4. Детект VPN/прокси и аномалий
- Выявлять прокси/VPN по набору признаков (TTL, JA3, IP-блеклисты и т.д.).
- Анализировать несоответствия между User-Agent и реальной ОС (TCP/IP флаги, JA3, HTTP2).
- Разрабатывать систему порогов (threshold) или вероятностных оценок (score).
5. (Опционально) Автоматизация и масштабирование
- По желанию помогать с инфраструктурой.
- Участвовать в обсуждении архитектуры приложения.
---
## Требования:
1. ML и статистика
- Понимание классических алгоритмов (деревья решений, бустинги) и навыки тюнинга.
- Приветствуется опыт с PyTorch/TensorFlow.
2. Инструменты Data Science
- Python: pandas, numpy, scikit-learn, XGBoost/LightGBM.
- Умение делать EDA, визуализации (matplotlib, seaborn и т.п.) и строить надёжные фичи из «грязных» данных..
3. Сетевые протоколы (желательно, но можно прокачаться)
- Основы TCP/IP (MSS, Window Size, TCP Options).
- Понимание TLS ClientHello, JA3-сигнатур.
- Базовые знания HTTP/2.
4. DevOps / MLOps
- Docker, Git, Linux; будет плюсом опыт с CI/CD.
5. Дополнительно
- Опыт наставничества в DS.
- Понимание безопасности, VPN/прокси.
- Сильная математическая база (статистика, матан, вероятности).
---
## Условия работы:
- Удалённая работа (полная или частичная занятость — обсуждается).
- Небольшая команда (сети/бэкенд + ML).
- Задачи ведутся в трекере, созвоны/стендапы по необходимости.
Финансовая часть:
- Вилка 100–250 тыс. руб. в месяц (зависит от опыта).
- Возможны выплаты в USDT.
- Дополнительный бонус: доступ к лицензии [Cursor.com] (актуальные модели, например, Sonnet 3.5).
---
## Что получаете:
- Глубокий опыт в сетевых отпечатках, работа с уникальными данными.
- Полную свободу выбора инструментов (главное — результат).
- Поддержку по инфраструктуре и сбору сетевых данных.
- Интересные челленджи в ML + Security.
---
## Как откликнуться:
- Напишите о себе в личку и прикрепите резюме/портфолио (GitHub/Kaggle).
- Поделитесь примером ML-проекта, где вы делали пайплайн обучения/деплоя.
- Расскажите, какой у вас опыт в сетевых протоколах или безопасности (VPN, прокси).
Контакт: [@Siemons8](https://t.iss.one/Siemons8)
Telegram
Zloy
You can contact @Siemons8 right away.
👎4🔥2🤯1🖕1
Как быстро обработать миллиарды записей?Будь то SQL-аналитика или данные для машинного обучения Завтра об этом будет рассказывать провайдер Cloud․ru.Еще можно успеть зарегистрироваться (https://cloud.ru/events/evolution-managed-spark-i-obrabotka-milliardov-zapisei-875573301?utm_source=smm&utm_medium=im&utm_campaign=webinar-18.02.25&utm_content=pl:tg_chnl:_lid:no) на их бесплатный вебинар, чтобы послушать:😶🌫️как с помощью сервиса Evolution Managed Spark обрабатывать миллиарды записей;😶🌫️как интегрировать Spark с Trino и Metastore;😶🌫️как визуализировать обработанные данные с помощью системы BI.Ну, и конечно, задать вопросы по работе с большими данными 🤓
@ml_data_science_job
@ml_data_science_job
Где искать работу на удаленку или релокацию?Наши коллеги ежедневно собирают вакансии прямыми контактами hr. Для удобства собрали все папкой. (https://t.iss.one/addlist/wPeKkOJ_JPFkM2Ji)🛸@opento_data (https://t.iss.one/opento_data) - вакансии для ML, Data Science, Computer Vision, NLP и аналитиков.✈️@young_relocate (https://t.iss.one/young_relocate) - дайджесты айти вакансий на удаленку и релокацию, включая аналитику.🚀@opento_crypto (https://t.iss.one/opento_crypto) - в крипто и финтех сфере, web3, включая Antifraud и AML.🥷@opento_dev (https://t.iss.one/opento_dev) - вакансии для разработчиков, инженеров, SRE, DevOps и др.🕹@young_gamedev (https://t.iss.one/young_gamedev) - работа в геймдеве для художников и разработчиков (Unreal, Unity, C++).🎰iGaming Jobs (https://t.iss.one/opento_igaming) - вакансии в igaming, betting, affilate сферe.👀HR Guru (https://t.iss.one/+97vQGMj7MRZjNzYy) - вредные советы о карьере и поиску работы.Горящие оферы:🇪🇸ML Engineer (https://t.iss.one/opento_data/352) - релокация в Барселону ,6000€🇨🇾Marketing Data Analyst (https://t.iss.one/opento_data/351) - помогают с релоком на Кипр🇨🇾Data Scientist / Simple (https://t.iss.one/opento_data/349) 🔹Product Analyst / QIC (https://t.iss.one/opento_data/336)🔹Front End Engineer / HerculesAI (https://t.iss.one/opento_dev/503)🔹Rust Developer в Bitsgap - (https://t.iss.one/opento_dev/504) 6000EUR🔹Product Analyst / QIC (https://t.iss.one/opento_data/336)
@ml_data_science_job
@ml_data_science_job
Telegram
Плачунатехно
Eldar A invites you to add the folder “Плачунатехно”, which includes 10 chats.
Вакансия: Middle ML DeveloperО нас: Сколтех, Центр прикладного ИИ.Мы занимаемся разработкой передовых решений для нефтегазовой отрасли на основе LLMs и графовых БД. Вам предстоит участвовать в разработке системы для автоматического проектирования нефтяных и газовых месторождений (дообучение мультимодальных LLMs для анализа чертежей, построение графов знаний из нормативных документов с помощью KuzuDB, и т. д.).Также мы проводим исследования в области объединения LLMs и графов знаний и участвуем в конференциях уровня А*.Формат: full-time, удаленно.Требования к разработчику:✅ знание библиотек PyTorch, Transformers;✅ опыт работы с большими языковыми моделями;✅ креативность, нестандартный подход к решению задач.Мы предлагаем:🔥 удаленный график работы;🔥 конкурентный уровень ЗП;🔥 возможность обмена опытом с востребованной сфере с более опытными специалистами.Контакты для связи: @dmitrij_euseew (https://t.iss.one/dmitrij_euseew)
@ml_data_science_job
@ml_data_science_job
Telegram
Дмитрий Евсеев
Data Scientist
Компания: Северсталь. IT & Digital
Зарплата: Не указана
Тип занятости:
Почему Data Scientist всегда в хорошей форме? Потому что они постоянно занимаются "фитнесом" данных!
Подробнее: https://telegra.ph/Data-Scientist-02-19
#ml #data scientist
Компания: Северсталь. IT & Digital
Зарплата: Не указана
Тип занятости:
Почему Data Scientist всегда в хорошей форме? Потому что они постоянно занимаются "фитнесом" данных!
Подробнее: https://telegra.ph/Data-Scientist-02-19
#ml #data scientist
Telegraph
Data Scientist
Industrial.Market – инновационная B2B-платформа для промышленных компаний, холдингов и корпораций, дистрибьюторов производителей и поставщиков. Мы помогаем своим клиентам снизить операционные издержки, сделать процесс закупки малоценных товаров более безопасным…
Вакансия: ML/DS-инженер (Network Fingerprinting & Anomaly Detection)Немного о нас: мы строим систему, которая по низкоуровневым сетевым отпечаткам (TLS/JA3, HTTP2, TCP/IP и т.д.) определяет: • Используется ли VPN/прокси? • Подделан ли User-Agent (например, заявлена Windows, а на деле Linux)? • Какая реальная ОС клиента, исходя из сетевых особенностей?Собираем логи (JSON с отпечатками) и хотим обучить ML-модель (XGBoost, PyTorch, scikit-learn и т.п.), которая в реальном времени будет давать предсказания по REST API.---## Что делать:1. Анализ данных (EDA) и фича-инжиниринг - Изучать сырые логи (TLS, TCP/IP, HTTP2, JA3) и выделять нетривиальные признаки (MSS, Window Size, набор cipher suites, HTTP2 SETTINGS и т.п.). - При необходимости помочь улучшить сбор данных.2. Разработка и обучение моделей - Выбирать и тюнить алгоритмы: XGBoost, Random Forest, нейронные сети и т.д. - Настраивать процесс обучения и валидации (train/test split, кросс-валидация, гиперпараметры). - Оценивать метрики (Accuracy, Precision/Recall, F1, ROC-AUC) и предлагать способы улучшения.3. Построение ML-сервиса - Оборачивать модель в сервис (REST API/gRPC) для интеграции. - Настраивать окружение (Docker, CI/CD). - Продумывать MLOps: сбор новых данных, мониторинг качества, переобучение.4. Детект VPN/прокси и аномалий - Выявлять прокси/VPN по набору признаков (TTL, JA3, IP-блеклисты и т.д.). - Анализировать несоответствия между User-Agent и реальной ОС (TCP/IP флаги, JA3, HTTP2). - Разрабатывать систему порогов (threshold) или вероятностных оценок (score).5. (Опционально) Автоматизация и масштабирование - По желанию помогать с инфраструктурой. - Участвовать в обсуждении архитектуры приложения.---## Требования:1. ML и статистика - Понимание классических алгоритмов (деревья решений, бустинги) и навыки тюнинга. - Приветствуется опыт с PyTorch/TensorFlow.2. Инструменты Data Science - Python: pandas, numpy, scikit-learn, XGBoost/LightGBM. - Умение делать EDA, визуализации (matplotlib, seaborn и т.п.) и строить надёжные фичи из «грязных» данных..3. Сетевые протоколы (желательно, но можно прокачаться) - Основы TCP/IP (MSS, Window Size, TCP Options). - Понимание TLS ClientHello, JA3-сигнатур. - Базовые знания HTTP/2.4. DevOps / MLOps - Docker, Git, Linux; будет плюсом опыт с CI/CD.5. Дополнительно - Опыт наставничества в DS. - Понимание безопасности, VPN/прокси. - Сильная математическая база (статистика, матан, вероятности).---## Условия работы:- Удалённая работа (полная или частичная занятость — обсуждается). - Небольшая команда (сети/бэкенд + ML). - Задачи ведутся в трекере, созвоны/стендапы по необходимости. Финансовая часть: - Вилка 100–250 тыс. руб. в месяц (зависит от опыта). - Возможны выплаты в USDT. - Дополнительный бонус: доступ к лицензии [Cursor․com] (актуальные модели, например, Sonnet 3.5).---## Что получаете:- Глубокий опыт в сетевых отпечатках, работа с уникальными данными. - Полную свободу выбора инструментов (главное — результат). - Поддержку по инфраструктуре и сбору сетевых данных. - Интересные челленджи в ML + Security.---## Как откликнуться:- Напишите о себе в личку и прикрепите резюме/портфолио (GitHub/Kaggle). - Поделитесь примером ML-проекта, где вы делали пайплайн обучения/деплоя. - Расскажите, какой у вас опыт в сетевых протоколах или безопасности (VPN, прокси). Контакт: https://t.iss.one/Siemons8
@ml_data_science_job
@ml_data_science_job
Telegram
Zloy
You can contact @Siemons8 right away.
👏1
Главная гонка десятилетия – AI. В 2025 все решитсяГод только начинается, а OpenAI уже выпускает самую умную из когда-либо существовавших моделей, США выделяет на развитие ИИ 20 годовых бюджетов NASA, а Китай тратит миллионы на контрабанду чипов Nvidia. В Data Secrets (https://t.iss.one/+jCvxiw7LPrpiYmIy) показывают, что на самом деле происходит и как обучают модели. Без иллюзий и хайпа – только ключевые новости, разборы свежих исследований и эксклюзивные практические советы по ML и Data Science.За каждым постом стоит ML-Researcher с научными публикациями и внушительным опытом в промышленности. Так что каждая разбираемая здесь тема подкреплена фактами и экспертизой автора. Подпишись, чтобы не потерять. Нас уже 50 тысяч: @data_secrets (https://t.iss.one/+jCvxiw7LPrpiYmIy)
@ml_data_science_job
@ml_data_science_job
Data Scientist/ML Engineer (NLP)
Компания: X5 Digital
Зарплата: Не указана
Тип занятости:
Почему Data Scientist такой хороший собеседник? Он всегда знает, как "разговорить" данные!
Подробнее: https://telegra.ph/Data-ScientistML-Engineer-NLP-02-20
#ml #data scientist
Компания: X5 Digital
Зарплата: Не указана
Тип занятости:
Почему Data Scientist такой хороший собеседник? Он всегда знает, как "разговорить" данные!
Подробнее: https://telegra.ph/Data-ScientistML-Engineer-NLP-02-20
#ml #data scientist
Telegraph
Data Scientist/ML Engineer (NLP)
Технологии с которыми мы работаем: ML/DL LLM,ML алгоритмы, Python, Pytorch, diffusion processes, процессы валидации моделей, классический ML.Чем предстоит заниматься: анализом данных; разработкой, обучением и внедрением: AI моделей, языковых моделей, генеративного…
Что можно сделать за 2 недели, чтобы выйти на новый уровень в робототехнике и генеративном ИИ? У Яндекс Образования есть ответ — пройти бесплатный студкемп! Это интенсив, на котором вас ждёт много практики, общения с экспертами из индустрии и, конечно, самые актуальные знания.
Весенний студкемп по робототехнике и ИИ пройдёт с 14 по 26 апреля на базе ФПМИ МФТИ. Учиться придётся много, ведь программу составляли специалисты Яндекса, ШАДа и МФТИ. На студкемпе ждут студентов со всей России и каждому, кто пройдёт отбор, оплатят проезд и проживание. Успейте подать заявку (https://education.yandex.ru/studcamp-mipt?utm_source=telegram&utm_medium=social&utm_campaign=studcampmipt-2025&utm_content=) до 23 февраля.
@ml_data_science_job
Весенний студкемп по робототехнике и ИИ пройдёт с 14 по 26 апреля на базе ФПМИ МФТИ. Учиться придётся много, ведь программу составляли специалисты Яндекса, ШАДа и МФТИ. На студкемпе ждут студентов со всей России и каждому, кто пройдёт отбор, оплатят проезд и проживание. Успейте подать заявку (https://education.yandex.ru/studcamp-mipt?utm_source=telegram&utm_medium=social&utm_campaign=studcampmipt-2025&utm_content=) до 23 февраля.
@ml_data_science_job