WBTECH
13.7K subscribers
563 photos
18 videos
219 links
Разработчики Wildberries делятся опытом: полезные статьи и анонсы мероприятий

Ютуб: https://www.youtube.com/@wb_tech

Регистрация в Роскомнадзоре:
№ 4963508866
Download Telegram
Как настроить Nginx, чтобы выдержать DDoS 👀

Сергей Черкашин, руководитель команды разработки и эксплуатации систем защиты от DDoS в Wildberries & Russ, рассказал, как подготовить Nginx и Linux к нагрузке и удержать сервис в онлайне при атаке.

В карточках читайте про практические настройки, подходы к лимитированию трафика и кэшированию, метрики и логи для быстрого анализа.

➡️ Подробнее — на Хабре
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
28👍19🔥16
⚠️⚠️⚠️ Новый дайджест вакансий

➡️ Golang Developer в Trust & Safety
middle / удалённо

Ищем специалиста, который уверенно владеет Go и понимает принципы проектирования, включая микросервисную архитектуру. Нужен опыт работы с Docker, Kubernetes, Helm и сборщиками вроде GNU Make. Важны навыки отладки, написания unit и e2e тестов, а также уверенная работа с Git.

👆 Откликнуться


➡️ Application Security Engineer
junior / офис

Ищем инженера по безопасности веб-приложений, который понимает принципы работы современных сервисов, умеет выявлять и устранять уязвимости, внедрять безопасные процессы разработки. Понадобится опыт с CI/CD, контейнеризацией и оркестрацией, а также знание одного из языков: Go / Python / Java.

👆 Откликнуться


➡️ Senior Data Scientist в Know Your Employee
senior / гибрид

Ищем ML/DS-инженера с 3+ годами опыта и продакшен-кейсам в задачах классификации, антифрода, поведенческой аналитики и мультимодальных данных. Ждём уверенное владение Python/SQL, PyTorch/TF, MLflow/W&B, а также опыт работы с дисбалансами, cost-sensitive метриками и калибровкой вероятностей. Важно понимание privacy/compliance при работе с чувствительными данными.

👆 Откликнуться


➡️ Senior iOS-разработчик в Маркетплейс
senior / удалённо

Ищем iOS-разработчика, который отлично владеет Swift и работал с UIKit, Lottie, Charts, SDWebImage, async/await, GCD, Firebase/Google Utilities, VIPER и Realm. Важно понимание структур данных, алгоритмов, ООП и SOLID, опыт работы с высоконагруженными проектами и сложной бизнес-логикой.

👆 Откликнуться


➡️ Go-разработчик в клиентское приложение Wildberries
middle / удалённо

Ищем разработчика с опытом создания микросервисов и многопоточных приложений. Важно глубокое понимание HTTP и опыт разработки Web-сервисов (REST, gRPC). Нужны навыки проектирования и оптимизации реляционных БД (PostgreSQL), работа с NoSQL и брокерами сообщений.

👆 Откликнуться
Please open Telegram to view this post
VIEW IN TELEGRAM
12👍9🔥5
👾👾 Стартуем в ML и DS

Привет! На связи Андрей Тюняткин, руководитель команды ML Ценообразования Wildberries.

Представь, что ты решил изучить ML — инженерные задачи, которые стоят за современными ИИ-моделями. Тема популярная, новостей море. Но с чего начать? Давайте разбираться в посте.

Кем я стану, когда вырасту?

ML занимаются два рода специалистов — Data Scientist и ML Engineer.

➡️ Data Scientist изучает зависимости в данных, придумывает и проверяет гипотезы, обучает модели.

➡️ ML Engineer обучает модели на больших данных, упаковывает модели для продакшена и строит на их основе сложные программные продукты.

Если ты математик — тебе, скорее всего, ближе трек Data Scientist.

Если программист — твой путь ML Engineer.

Оттенки ИИ

Classic ML — классические задачи машинного обучения: прогноз спроса, поиск мошенников, разбиение пользователей на кластеры по лояльности. Начинать стоит именно с классики.

RecSys — рекомендательные системы: какие товары предложить пользователю, какое push-уведомление отправить, чтобы он точно кликнул.

CV — компьютерное зрение: распознавание лиц, оценка качества карточки товара, поиск текста на изображениях. Да даже автопилот в беспилотном трамвае!

NLP — анализ естественного языка. Нереально популярная область ML. В комментариях не нуждается — вспомни хотя бы ChatGPT.

Есть и другие направления — например, распознавание голоса. Но их мы оставим за кадром.

Очень советую изучить платформу HuggingFace. На ней представлены множество разных ML-задач и моделей, которые эти задачи решают. Часть моделей можно буквально «потрогать» онлайн: писать им тексты, отправлять картинки и смотреть, как они эти тексты с картинками анализируют.

Где разрабатывать модели?

Твой лучший друг — Jupyter Notebook. Он позволяет интерактивно писать и выполнять код, обучать модели и красиво выводить результаты.

Google Colab — тот же Jupyter, но прямо в браузере, без установки.

VS Code — полноценный редактор, поддерживающий формат Юпитер-ноутбуков. Очень советую: подсвечивает ошибки и делает работу с кодом заметно удобнее.

Во второй части разберёмся: что изучить, какие инструменты использовать, и какие пет-проекты можно выполнить для тренировки.
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2514👍10
Продолжаем ⬇️

⭐️ Что почитать и изучить?
Я сам начинал погружение в ML с книги «Python и машинное обучение». Да, индустрия развивается стремительно, и любая книга устаревает за пару лет. Но базовые принципы и основы обучения моделей там изложены понятно и с практикой.
И не забывай про современные LLM!

Напиши, например, Qwen:
«Как опытный и дружелюбный преподаватель по Data Science и Machine Learning, составь мне программу, которая поможет дойти до уровня Junior Machine Learning Engineer. Добавь теорию, примеры на Python и практические задания. Я буду присылать тебе решения, а ты проверяй их подробно и с объяснениями».


После изучения основ обязательно нужна практика. Придумай пет-проект, реализуй его и выложи на GitHub.

Примеры проектов:

✏️ Распознавание рукописных цифр на датасете MNIST. Сравни KNN, полносвязную сеть и CNN. (Забавный факт: архитектуру CNN подсмотрели у зрительной коры кошки.)

👀 Распознавание поз человека с помощью YOLO — пригодится, например, для анализа правильности спортивных упражнений.

✏️ Классификация токсичных сообщений с DeepPavlov, чтобы поддерживать деловой этикет в чатах.

💡 Участвуй в Kaggle-соревнованиях — там куча реальных данных и задач для тренировки.

Куда расти дальше
Важно не только обучать и тестировать модели, но и превращать их в работающие продукты. Для этого пригодятся:

👆 FastAPI — Python-библиотека для создания сервера, который возвращает предсказания модели.

👆 Streamlit — собери интерфейс: настройки, кнопки, визуализация результатов.

👆 ClearML — сохраняй модели и результаты экспериментов, чтобы не теряться в версиях.

👆 Airflow — автоматизируй пайплайн: сбор данных, обработку, вызов модели и сохранение результатов.

Новый виток — ИИ-агенты


LLM открыли целое направление прикладного ИИ, и изучать его стоит уже сейчас.

👆 Qwen — мощная и доступная из РФ LLM: отвечает на вопросы, пишет код, ищет данные, собирает исследования в PDF.

👆 Cursor AI — как VS Code, но с ИИ-помощником: подсказывает, как улучшить код, исправить ошибки и писать чище. Бесплатен для студентов.

👆 N8N — платформа для создания собственных ИИ-агентов и автоматизации. Можно сделать чат, подключить Telegram, почту или календарь, чтобы агент сам присылал план на день или подборку новостей.

Успехов в этом увлекательном пути! До встречи в рядах ML-инженеров Wildberries & Russ
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥1912👍9
⭐️⭐️ Golang meetup: регистрация уже идёт!

На митапе соберутся инженеры, которые знают, как писать устойчивые Go-сервисы на экстремальных нагрузках. Рассказываем, о чём будут их доклады ⬆️

Ждём вас 27 ноября в 19:00, офлайн и онлайн
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥2010👍7
Архитектура облачной платформы Wildberries 🔥

Собственная облачная платформа помогает компаниям контролировать технологические процессы, повышать безопасность и ускорять работу продуктовых команд. В Wildberries это особенно важно из-за масштабов: тысячи геораспределённых серверов, несколько дата-центров и десятки тысяч виртуальных машин.

Сейчас у нас работают две инсталляции облака, которые обслуживают более 42 тысяч виртуальных машин. Базовый слой стабилен, поверх него мы уже запускаем сервисы уровня aaS. Например, PostgreSQL как сервис с кластерами, растянутыми на несколько дата-центров.

За пять лет эксплуатации мы пережили множество отказов разного масштаба и убедились, что собственная разработка позволяет нам контролировать технологические риски и не зависеть от внешних вендоров. Эта стратегия доказала свою устойчивость и даёт нам пространство для дальнейшего развития платформы.


В карточках — основные идеи, выводы и подходы, которыми поделилась команда. Про создание и запуск облачной платформы — читайте на Хабре.
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
125👍10🔥6