Data Science | Machinelearning [ru] pinned «📍 Авторский канал про вайбкодинг и разработку ИИ-агентов ➡️ Геныч.»
Forwarded from xCode Journal
This media is not supported in your browser
VIEW IN TELEGRAM
Систему, которую в компании запускают почти на каждом PR. За последний год объём кода на инженера в Anthropic вырос примерно на 200%. При такой скорости неудивительно, что ревью стало узким местом.
Теперь Code Review автоматически проверяет PR: несколько ИИ-агентов параллельно ищут баги, перепроверяют результаты и ранжируют проблемы по серьёзности. Причем чем более объемным и сложным будет PR — тем больше агентов туда пойдет работать.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥1
Переоценка и ошибки в навыках Data Science инженеров в
Изменения в подходах к оценке специалистов
В
Ключевые навыки, которые недооценивали
В прошлом многие специалисты фокусировались исключительно на технической стороне: разработке моделей, работе с
👉 В
👉 Компании начали более интенсивно инвестировать в развитие навыков их сотрудников в области интерпретации и бизнес-аналитики.
❗️Адаптация к изменяющимся требованиям и расширение набора навыков имеют критическое значение для построения успешной карьеры в Data Science в
TG: Data Science | Machinelearning [ru]
2025 годуИзменения в подходах к оценке специалистов
В
2025 году индустрия Data Science столкнулась с важным вызовом: переоценка навыков инженеров. Область стремительно меняется, и требования к специалистам также эволюционируют. Компании всё чаще осознают необходимость уделять внимание не только техническим, но и более широким навыкам, таким как бизнес-ориентированное мышление и понимание этических аспектов использования данных.Ключевые навыки, которые недооценивали
В прошлом многие специалисты фокусировались исключительно на технической стороне: разработке моделей, работе с
big data и глубоком знании Python и R. Сегодня важнейшими становятся навыки интерпретации результатов, умение объяснять модели для менеджеров, а также интеграция моделей в бизнес-процессы компании. Неспособность понять и ощутить этот сдвиг может серьёзно ограничить карьерные возможности.👉 В
2025 году увеличилось внимание к непрерывному обучению и адаптации специалистов в Data Science. 👉 Компании начали более интенсивно инвестировать в развитие навыков их сотрудников в области интерпретации и бизнес-аналитики.
❗️Адаптация к изменяющимся требованиям и расширение набора навыков имеют критическое значение для построения успешной карьеры в Data Science в
2025 году. Специалистам рекомендуется фокусироваться не только на развитии технической экспертизы, но и на понимании бизнес-ценности своих моделей и решений.TG: Data Science | Machinelearning [ru]
❤3🔥3
Кто сказал «мяу»?
ИТ-компания «Криптонит» приглашает на дататон «Криптонит.Тембр», где нужно распознать, кто говорит!
Тебе предстоит обучить Speaker Recognition модель, устойчивую к искажениям аудио, возникающим в реальных сценариях эксплуатации речевых интерфейсов и систем обработки звука:
🔹 искажения, вносимые акустической средой;
🔹 посторонние шумы;
🔹 реверберация;
🔹 большое расстояние до микрофона;
🔹 искажения каналов связи.
Участвуй, и ты сможешь:
🟦 получить шанс разделить призовой фонд в 600 000 рублей;
🟦 разработать решения в области Audio/Speech ML;
🟦 прокачать скиллы в Speaker Recognition и Deep Learning.
👆 Регистрируйтесь до 10 апреля включительно!
Подписывайтесь на телеграм-канал «Криптонит. Разработка, наука, шифрование» — там много всего интересного.
ИТ-компания «Криптонит» приглашает на дататон «Криптонит.Тембр», где нужно распознать, кто говорит!
Тебе предстоит обучить Speaker Recognition модель, устойчивую к искажениям аудио, возникающим в реальных сценариях эксплуатации речевых интерфейсов и систем обработки звука:
Участвуй, и ты сможешь:
Подписывайтесь на телеграм-канал «Криптонит. Разработка, наука, шифрование» — там много всего интересного.
Please open Telegram to view this post
VIEW IN TELEGRAM
2❤5👀3🔥2
Forwarded from Геныч.
Недавно решил разобраться с фичей skills в Claude Code. Если коротко, это инструмент, который пришел на смену кастомным slash-командам и значительно расширяет их возможности.
В процессе изучения нашел несколько интересных моментов:
- Генерация маркетингового контента:
Анализирует приложение и помогает писать посты для продвижения, например для Хабра.
- Подбор свободных доменов:
Проверяет доступность доменов по теме проекта и предлагает варианты.
- Поиск потенциальных клиентов:
Помогает находить аудиторию, которой может быть интересен ваш продукт. Эту штуку я еще не тестил но звучит как магия.
- Улучшение фронтенда:
Помогает привести сгенерированный нейросетью фронтенд в более аккуратный и продакшен-подобный вид. Так как фронт это мое основное направление то эта штука это то что я протестил чуть больше. Разница в качестве генерируемого кода мне показалась довольно заметной.
Вообще про skills я слышал уже несколько раз, но игнорировал. Для работы мне обычно хватало базовых команд вроде проверки кода. На данный момент я еще продолжаю изучать этот инструмент но уже выглядит как что то довольно интересное.
👉 Геныч.
В процессе изучения нашел несколько интересных моментов:
- Генерация маркетингового контента:
Анализирует приложение и помогает писать посты для продвижения, например для Хабра.
- Подбор свободных доменов:
Проверяет доступность доменов по теме проекта и предлагает варианты.
- Поиск потенциальных клиентов:
Помогает находить аудиторию, которой может быть интересен ваш продукт. Эту штуку я еще не тестил но звучит как магия.
- Улучшение фронтенда:
Помогает привести сгенерированный нейросетью фронтенд в более аккуратный и продакшен-подобный вид. Так как фронт это мое основное направление то эта штука это то что я протестил чуть больше. Разница в качестве генерируемого кода мне показалась довольно заметной.
Вообще про skills я слышал уже несколько раз, но игнорировал. Для работы мне обычно хватало базовых команд вроде проверки кода. На данный момент я еще продолжаю изучать этот инструмент но уже выглядит как что то довольно интересное.
👉 Геныч.
❤5
Станьте Deep Learning Engineer с дипломом 👍
Голосовые помощники, распознавание лиц, рекомендации в приложениях, медицинская диагностика — нейросети используются уже во всех сферах бизнеса. Компании ищут DL-специалистов, чтобы точнее обучать и настраивать нейросети под свои запросы.
Освоить Deep Learning самостоятельно сложно, но ребята из Simulative нашли решение, где учёба становится понятной и структурированной, а все темы разбираются на практике 🔥
Simulative запускает программу профессиональной переподготовки «Инженер глубокого обучения нейросетей».
По итогам обучения вы получите:
Официальный диплом о профессиональной переподготовке с квалификацией «Специалист по большим данным».
Более 40 практических работ в формате симуляции реальной работы DL-инженера — всё пойдёт в портфолио.
Учитесь из любой точки мира, совмещая с работой, а доступ к материалам останется навсегда.
Курс подходит для специалистов любого уровня: новичок, аналитик, ML-инженер или выпускник — на программе опытные менторы помогут выстроить вашу персональную траекторию роста в Deep Learning.
Что вы освоите:
🟠 Создание и обучение нейросетей с нуля
🟠 Компьютерное зрение (Computer Vision)
🟠 NLP (обработка текста)
🟠 Генеративные модели
🟠 MLOps и продакшн-подход
🕖 Скорее записывайтесь, количество мест на поток ограничено!
Бронируйте место на курсе прямо сейчас и получите скидку 30%
😶 ПОЛУЧИТЬ СКИДКУ НА КУРС
Голосовые помощники, распознавание лиц, рекомендации в приложениях, медицинская диагностика — нейросети используются уже во всех сферах бизнеса. Компании ищут DL-специалистов, чтобы точнее обучать и настраивать нейросети под свои запросы.
Освоить Deep Learning самостоятельно сложно, но ребята из Simulative нашли решение, где учёба становится понятной и структурированной, а все темы разбираются на практике 🔥
Simulative запускает программу профессиональной переподготовки «Инженер глубокого обучения нейросетей».
По итогам обучения вы получите:
🎓 Диплом гособразца
Официальный диплом о профессиональной переподготовке с квалификацией «Специалист по большим данным».
💯 Практика
Более 40 практических работ в формате симуляции реальной работы DL-инженера — всё пойдёт в портфолио.
🙌🏽 Онлайн обучение
Учитесь из любой точки мира, совмещая с работой, а доступ к материалам останется навсегда.
Курс подходит для специалистов любого уровня: новичок, аналитик, ML-инженер или выпускник — на программе опытные менторы помогут выстроить вашу персональную траекторию роста в Deep Learning.
Что вы освоите:
🕖 Скорее записывайтесь, количество мест на поток ограничено!
Бронируйте место на курсе прямо сейчас и получите скидку 30%
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2
ИТ-специалисты Москвы, хотите поделиться опытом?
Есть возможность рассказать студентам о том, что вы не услышали в свое время. Центральный университет как раз проводит интенсив для будущих преподавателей ИТ-специальностей — это возможность попробовать себя в роли наставника и понять, подходит вам эта деятельность или нет.
Там вы сможете:
— Связать преподавание с личными и карьерными целями.
— Отработать техники презентаций и вовлечения аудитории.
— Спроектировать и провести пару на площадке Центрального университета.
— Заручиться поддержкой экспертов с опытом в крупных ИТ-компаниях.
— Получить шанс попасть в команду преподавателей Центрального университета.
Интенсив пройдет с 22 марта по 5 апреля. Будут онлайн-встречи и очные занятия. Еще успеваете зарегистрироваться.
Есть возможность рассказать студентам о том, что вы не услышали в свое время. Центральный университет как раз проводит интенсив для будущих преподавателей ИТ-специальностей — это возможность попробовать себя в роли наставника и понять, подходит вам эта деятельность или нет.
Там вы сможете:
— Связать преподавание с личными и карьерными целями.
— Отработать техники презентаций и вовлечения аудитории.
— Спроектировать и провести пару на площадке Центрального университета.
— Заручиться поддержкой экспертов с опытом в крупных ИТ-компаниях.
— Получить шанс попасть в команду преподавателей Центрального университета.
Интенсив пройдет с 22 марта по 5 апреля. Будут онлайн-встречи и очные занятия. Еще успеваете зарегистрироваться.
This media is not supported in your browser
VIEW IN TELEGRAM
OpenClaw + RL
Агенты OpenClaw адаптируются с помощью файлов памяти и навыков (skills), но веса базовой модели на самом деле не меняются.
Как OpenClaw-RL решает эту проблему?
Когда стоит использовать OpenClaw-RL?
Агенты OpenClaw адаптируются с помощью файлов памяти и навыков (skills), но веса базовой модели на самом деле не меняются.
Как OpenClaw-RL решает эту проблему?
Он оборачивает самостоятельно размещённую модель в API, совместимый с OpenAI, перехватывает живые диалоги из OpenClaw и обучает политику в фоновом режиме с помощью RL (обучения с подкреплением).
Архитектура полностью асинхронная. Это означает, что:
обработка запросов,
оценка награды (reward scoring),
и обучение
выполняются параллельно.
После завершения обучения веса модели "hot" подменяются (hot-swap) после каждого батча, при этом агент продолжает отвечать без остановки.
В настоящее время поддерживаются два режима обучения:
Binary RL (GRPO): модель награды оценивает каждый ход диалога как хороший, плохой или нейтральный. Эта скалярная награда используется для обновления политики через PPO-подобную функцию цели с клиппингом.
On-Policy Distillation: когда появляются конкретные исправления, например
"тебе нужно было сначала проверить тот файл",
эта обратная связь используется как более богатый направленный сигнал обучения на уровне токенов.
Когда стоит использовать OpenClaw-RL?
Честно говоря, большую часть поведения агента уже можно улучшить через более грамотный дизайн памяти и навыков.
Существующая экосистема навыков OpenClaw и созданные сообществом навыки самоулучшения покрывают широкий спектр задач без изменения весов модели.
Если агент постоянно забывает предпочтения пользователя - это проблема памяти.
Если он не знает, как обработать конкретный рабочий процесс - это проблема навыков.
Обе задачи решаются на уровне промптов и контекста.
RL становится действительно интересным, когда источник ошибки лежит глубже - в самом механизме рассуждения модели.
Например:
систематически плохой порядок выбора инструментов,
слабое многошаговое планирование,
неспособность правильно интерпретировать неоднозначные инструкции так, как ожидает конкретный пользователь.
Исследования в области agentic RL (например, ARTIST и Agent-R1) показывают, что такие поведенческие паттерны достигают потолка, если использовать только промпт-подходы. Особенно это заметно в сложных многошаговых задачах, где модели нужно:
восстанавливаться после ошибок инструментов,
или менять стратегию прямо во время выполнения.
Именно этот уровень и является целью OpenClaw-RL - и это ключевое отличие от того, что предлагает обычный OpenClaw.
❤3
Как бороться с переобучением в нейросетях
Переобучение — это момент, когда модель:
👉 отлично знает train
👉 и вообще не понимает реальный мир
Она запоминает, а не обобщает.
Разберём, как с этим бороться 👇
1. Больше данных (самый честный способ)
Чем больше данных — тем сложнее модели заучить шум.
Что можно сделать:
👉 собрать новые данные
👉 использовать data augmentation
👉 синтетически расширить выборку
В CV и NLP это часто даёт лучший эффект, чем любые трюки с архитектурой.
2. Regularization (штраф за “слишком умную” модель)
👉 L1 / L2 регуляризация
→ штрафуют большие веса
Интуитивно:
модель становится проще и меньше переобучается
3. Dropout — случайное “забывание” нейронов
Во время обучения случайные нейроны отключаются.
Что это даёт:
👉 модель не может опираться на конкретные нейроны
👉 учится быть более устойчивой
Обычно:
👉 0.2 – 0.5 dropout rate
4. Early Stopping — остановись вовремя
Следим за валидацией:
👉 train loss ↓
👉 val loss сначала ↓, потом ↑
Как только val начинает расти — останавливаем обучение
Это один из самых эффективных и недооценённых методов.
5. Упростить модель
Иногда решение самое простое:
👉 меньше слоёв
👉 меньше параметров
👉 проще архитектура
Большая модель = больше шанс переобучения.
6. Batch Normalization
Помогает:
👉 стабилизировать обучение
👉 немного снижает переобучение
Но это не silver bullet — скорее бонус.
7. Data Augmentation
Особенно важно для:
👉 CV (повороты, шум, кропы)
👉 NLP (перефразирование, замены)
Модель видит больше вариантов одного и того же объекта.
8. Правильная валидация
Если у тебя плохой split —
ты даже не поймёшь, что модель переобучилась.
Используй:
👉 train / val / test
👉 k-fold (если мало данных)
Главный инсайт
Переобучение — это не ошибка модели.
Это сигнал, что:
👉 либо мало данных
👉 либо модель слишком сложная
👉 либо процесс обучения настроен плохо
В одном предложении
Чтобы победить переобучение —
либо добавь информации (данные), либо убери сложность (модель).
Переобучение — это момент, когда модель:
👉 отлично знает train
👉 и вообще не понимает реальный мир
Она запоминает, а не обобщает.
Разберём, как с этим бороться 👇
1. Больше данных (самый честный способ)
Чем больше данных — тем сложнее модели заучить шум.
Что можно сделать:
👉 собрать новые данные
👉 использовать data augmentation
👉 синтетически расширить выборку
В CV и NLP это часто даёт лучший эффект, чем любые трюки с архитектурой.
2. Regularization (штраф за “слишком умную” модель)
👉 L1 / L2 регуляризация
→ штрафуют большие веса
Интуитивно:
модель становится проще и меньше переобучается
3. Dropout — случайное “забывание” нейронов
Во время обучения случайные нейроны отключаются.
Что это даёт:
👉 модель не может опираться на конкретные нейроны
👉 учится быть более устойчивой
Обычно:
👉 0.2 – 0.5 dropout rate
4. Early Stopping — остановись вовремя
Следим за валидацией:
👉 train loss ↓
👉 val loss сначала ↓, потом ↑
Как только val начинает расти — останавливаем обучение
Это один из самых эффективных и недооценённых методов.
5. Упростить модель
Иногда решение самое простое:
👉 меньше слоёв
👉 меньше параметров
👉 проще архитектура
Большая модель = больше шанс переобучения.
6. Batch Normalization
Помогает:
👉 стабилизировать обучение
👉 немного снижает переобучение
Но это не silver bullet — скорее бонус.
7. Data Augmentation
Особенно важно для:
👉 CV (повороты, шум, кропы)
👉 NLP (перефразирование, замены)
Модель видит больше вариантов одного и того же объекта.
8. Правильная валидация
Если у тебя плохой split —
ты даже не поймёшь, что модель переобучилась.
Используй:
👉 train / val / test
👉 k-fold (если мало данных)
Главный инсайт
Переобучение — это не ошибка модели.
Это сигнал, что:
👉 либо мало данных
👉 либо модель слишком сложная
👉 либо процесс обучения настроен плохо
В одном предложении
Чтобы победить переобучение —
либо добавь информации (данные), либо убери сложность (модель).
🔥8👀1
Уверенное владение математическим аппаратом — ключевой фактор для решения сложных задач в Data Science, ML и других it-специальностях.
Преподаватели МФТИ и создатели проекта Popmath приглашают вас на бесплатный вебинар "Как выучить математику во взрослом возрасте?"
На вебинаре вы получите ответы на ключевые вопросы:
🔴 Прикладная математика: Какие разделы наиболее критичны для современных IT-специальностей
🔵 Эффективность обучения: Почему академический подход часто не работает и как выстроить процесс с максимальным КПД
🟠 Актуальные методики: Какие образовательные технологии позволяют в сжатые сроки восстановить и систематизировать знания
Дата: 23 марта
Время: 20:00 по МСК
Длительность: 1 час + ответы на вопросы
➡️ Для регистрации пишите нам!
или ознакомьтесь со страницей вебинара и оставьте заявку там
🔻 Всем участникам вебинара скидка 10% на 4-х месячный онлайн-курс "Математика с нуля для взрослых", который начнётся уже 26 марта🔺
Преподаватели МФТИ и создатели проекта Popmath приглашают вас на бесплатный вебинар "Как выучить математику во взрослом возрасте?"
На вебинаре вы получите ответы на ключевые вопросы:
🔴 Прикладная математика: Какие разделы наиболее критичны для современных IT-специальностей
🔵 Эффективность обучения: Почему академический подход часто не работает и как выстроить процесс с максимальным КПД
🟠 Актуальные методики: Какие образовательные технологии позволяют в сжатые сроки восстановить и систематизировать знания
Дата: 23 марта
Время: 20:00 по МСК
Длительность: 1 час + ответы на вопросы
➡️ Для регистрации пишите нам!
или ознакомьтесь со страницей вебинара и оставьте заявку там
🔻 Всем участникам вебинара скидка 10% на 4-х месячный онлайн-курс "Математика с нуля для взрослых", который начнётся уже 26 марта🔺
🐳1