Федеративное обучение — это способ обучать модели на устройствах пользователей, не забирая их данные на сервер.
Как это работает:
Плюсы:
• Приватность данных — данные остаются на устройстве
• Эффективность — сервер обрабатывает только обновления
• Масштабируемость — обучение на миллионах устройств
Применение: автозаполнение текста, рекомендации, медицинские модели без передачи личных данных.
🔹 Курс «Специалист по ИИ»
🔹 Получить консультацию менеджера
🔹 Сайт Академии 🔹 Сайт Proglib
#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
❤6👍2
ГигаЧат представил обновлённое семейство GigaAM-v3
Giga Acoustic Model — это класс open-source моделей для обработки речи и эмоций. В третьей версии опубликовали базовый аудиоэнкодер GigaAM-v3, улучшенные CTC и RNNT-модели, а также E2E-распознавание с поддержкой пунктуации и нормализации.
Масштаб предобучения значительно вырос: с 50 до 700 тысяч часов аудио на русском языке. Появились новые домены в обучении ASR — от колл-центров до разговорной речи.
Для всего корпуса обучающих данных восстановили пунктуацию и нормализацию через GigaChat Max Audio. Линейка CTC/RNNT и E2E позволяет выбирать между скоростью или максимальным качеством под любые сценарии.
Что по метрикам:
— Открытые датасеты (Golos, OpenSTT, Common Voice, LibriSpeech): паритет с GigaAM-v2.
— Новые домены (WER, v2-RNNT → v3-RNNT):
• речь с особенностями 27% → 19%
• колл-центр 13% → 10%
• спонтанная речь 10.3% → 7%
— Пунктуация: v3-e2e-RNNT vs reference + Whisper Forced Decoding — F1-score по запятой 84% vs 62%, остальные знаки ~паритет
— Side-by-Side (Gemini 2.5 Pro as a judge): v3-e2e-RNNT vs Whisper-large-v3 — 70:30 (колл-центр), 64:36 (Common Voice)
Больше про язык, речь и искусственный интеллект в @gigadev_channel. Подписывайтесь на канал, чтобы не пропустить всё самое интересное!
Giga Acoustic Model — это класс open-source моделей для обработки речи и эмоций. В третьей версии опубликовали базовый аудиоэнкодер GigaAM-v3, улучшенные CTC и RNNT-модели, а также E2E-распознавание с поддержкой пунктуации и нормализации.
Масштаб предобучения значительно вырос: с 50 до 700 тысяч часов аудио на русском языке. Появились новые домены в обучении ASR — от колл-центров до разговорной речи.
Для всего корпуса обучающих данных восстановили пунктуацию и нормализацию через GigaChat Max Audio. Линейка CTC/RNNT и E2E позволяет выбирать между скоростью или максимальным качеством под любые сценарии.
Что по метрикам:
— Открытые датасеты (Golos, OpenSTT, Common Voice, LibriSpeech): паритет с GigaAM-v2.
— Новые домены (WER, v2-RNNT → v3-RNNT):
• речь с особенностями 27% → 19%
• колл-центр 13% → 10%
• спонтанная речь 10.3% → 7%
— Пунктуация: v3-e2e-RNNT vs reference + Whisper Forced Decoding — F1-score по запятой 84% vs 62%, остальные знаки ~паритет
— Side-by-Side (Gemini 2.5 Pro as a judge): v3-e2e-RNNT vs Whisper-large-v3 — 70:30 (колл-центр), 64:36 (Common Voice)
Больше про язык, речь и искусственный интеллект в @gigadev_channel. Подписывайтесь на канал, чтобы не пропустить всё самое интересное!
❤3👍3🥰3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Segment Anything Model 3 (SAM 3) — мощный универсальный AI-модуль, который умеет детектировать, сегментировать и трекать любые объекты на изображениях и видео. Теперь это можно делать не только по визуальным подсказкам, но и по тексту или примеру-эталону.
Кроме того, запущен Segment Anything Playground — простой и удобный способ попробовать модель в действии и поэкспериментировать с современными инструментами AI-редактирования медиа.
Что нового в SAM 3
— Единая модель для детекции, сегментации и трекинга
— Text prompts — выделение объектов по текстовому описанию
— Exemplar prompts — выделение объектов по примеру
— Улучшенная обработка видео и стабильное отслеживание объектов
— Открытые веса модели, датасеты и код
Segment Anything Playground позволяет:
— тестировать SAM 3 без установки
— применять эффекты к изображениям и видео
— экспериментировать с креативными AI-модификациями
SAM 3D:
— восстановления 3D-объектов и сцен по одной фотографии
— реконструкции позы и формы человека
🔸 Курс «Специалист по ИИ»
🔸 Получить консультацию менеджера
🔸 Сайт Академии 🔸 Сайт Proglib
#буст
*Корпорация Meta признана в РФ экстремистской
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍1😢1
Помните, как это было? Кофе, зачетка и возможность просто учиться без спринтов и задач
29 ноября в 16:00 будет Back to Uni — встреча-ностальгия в кампусе Центрального университета для ИТ-сообщества.
Что вас ждет:
— Пары от преподавателей ЦУ — применять знания не обязательно, будет просто интересно.
— Возможность узнать, как и зачем ИТ-специалисту преподавать в вузе, даже если нет опыта или страшно начать.
— Студенческие клубы, разговоры по душам в коридорах и та самая атмосфера, где можно просто вдохновляться.
Пары будут вести руководитель отдела прикладного ML в AI-центре Т-Банка Андрей Мельников, руководитель аналитики международного Яндекс Поиска Роман Васильев, к.м.н., руководитель направления исследований «Мышление и AI» в лаборатории нейронаук и поведения человека Сбера Яна Венерина и другие эксперты.
Это бесплатно. Приходите с однокурсниками — ностальгировать вместе.
Регистрируйтесь по ссылке тут!
29 ноября в 16:00 будет Back to Uni — встреча-ностальгия в кампусе Центрального университета для ИТ-сообщества.
Что вас ждет:
— Пары от преподавателей ЦУ — применять знания не обязательно, будет просто интересно.
— Возможность узнать, как и зачем ИТ-специалисту преподавать в вузе, даже если нет опыта или страшно начать.
— Студенческие клубы, разговоры по душам в коридорах и та самая атмосфера, где можно просто вдохновляться.
Пары будут вести руководитель отдела прикладного ML в AI-центре Т-Банка Андрей Мельников, руководитель аналитики международного Яндекс Поиска Роман Васильев, к.м.н., руководитель направления исследований «Мышление и AI» в лаборатории нейронаук и поведения человека Сбера Яна Венерина и другие эксперты.
Это бесплатно. Приходите с однокурсниками — ностальгировать вместе.
Регистрируйтесь по ссылке тут!
🔥2
Please open Telegram to view this post
VIEW IN TELEGRAM
😁4👍2
Какой эксперимент впервые продемонстрировал, что нейросеть может обучаться с нуля?
Anonymous Quiz
19%
Эксперимент с использованием марковских цепей
60%
Перцептрон Фрэнка Розенблатта
13%
Алгоритм KNN на данных из Bell Labs
8%
Сеть Элайзы, имитирующая диалог
❤4👍2
— OpenAI выпустила гайд по эффективному использованию GPT-5.1 — разбор структуры промптов, инструментов и экспериментального мышления.
— Google представила Gemini 3 — самый продвинутый мультимодальный и агентный ИИ.
— Новый Kaggle: Santa 2025 — оптимизация упаковки ёлочек.
— Google представила Nano Banana Pro — топовый image-модель нового поколения.
— alphaXiv привлекает $7M, чтобы стать GitHub для AI-исследований — платформа объединяет исследователей и инженеров: публикация новых работ, быстрый переход от статьи к продуктовой фиче.
🔹 Курс «Специалист по ИИ»
🔹 Получить консультацию менеджера
🔹 Сайт Академии 🔹 Сайт Proglib
#свежак
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍1
📊 А правда, что математика в Data Science не нужна?
Нет. Без неё вы не пройдёте собес и не поймёте, почему модель ведёт себя странно. Линал, матан и вероятности — это база, без которой работа в ML превращается в угадайку.
🔥 Эту базу можно собрать за 2 месяца на экспресс-курсе «Математика для Data Science».
👩🏫 Кто ведёт курс:
→ Мария Тихонова
PhD, руководитель исследовательского направления в SberAI, доцент ВШЭ.
→ Диана Миронидис
Преподаватель ВШЭ, автор научпоп-материалов по математике для блога МТС.
→ Ксения Кондаурова
Преподаватель преподаватель T-Банка, автор курсов ЦУ и Edutoria.
→ Маргарита Бурова
Академический руководитель программ по аналитике и ML, Wildberries & Russ.
🎁 Что сейчас доступно:
→ бесплатный тест, чтобы узнать свой уровень математики;
→ скидка 40% до 30 ноября;
→ если оплатить до конца ноября, курс «Базовая математика» в подарок.
👉 Пишите менеджеру, если хотите попасть в поток
Нет. Без неё вы не пройдёте собес и не поймёте, почему модель ведёт себя странно. Линал, матан и вероятности — это база, без которой работа в ML превращается в угадайку.
🔥 Эту базу можно собрать за 2 месяца на экспресс-курсе «Математика для Data Science».
👩🏫 Кто ведёт курс:
→ Мария Тихонова
PhD, руководитель исследовательского направления в SberAI, доцент ВШЭ.
→ Диана Миронидис
Преподаватель ВШЭ, автор научпоп-материалов по математике для блога МТС.
→ Ксения Кондаурова
Преподаватель преподаватель T-Банка, автор курсов ЦУ и Edutoria.
→ Маргарита Бурова
Академический руководитель программ по аналитике и ML, Wildberries & Russ.
🎁 Что сейчас доступно:
→ бесплатный тест, чтобы узнать свой уровень математики;
→ скидка 40% до 30 ноября;
→ если оплатить до конца ноября, курс «Базовая математика» в подарок.
👉 Пишите менеджеру, если хотите попасть в поток
🎉1🙏1
Как играм зарабатывать в текущих условиях?
Достичь точки прибыльности становится всё сложнее: трафик дорожает, а комиссии сторов съедают треть выручки. Чтобы не терять деньги, разработчики ищут способы взаимодействовать с игроками напрямую.
Проверенные решения и стратегии для D2C-модели публикуются в канале D2C Game Changers. Это база знаний для тех, кто хочет снизить расходы и повысить эффективность монетизации.
Достичь точки прибыльности становится всё сложнее: трафик дорожает, а комиссии сторов съедают треть выручки. Чтобы не терять деньги, разработчики ищут способы взаимодействовать с игроками напрямую.
Проверенные решения и стратегии для D2C-модели публикуются в канале D2C Game Changers. Это база знаний для тех, кто хочет снизить расходы и повысить эффективность монетизации.
❤1👍1🤔1😢1
Идея: несколько независимых моделей → усреднение.
Цель: снизить дисперсию (variance) и уменьшить переобучение.
Как работает:
Примеры:
Идея: модели обучаются последовательно → каждая исправляет ошибки предыдущей.
Цель: снизить смещение (bias) и повысить точность.
Как работает:
Примеры:
🔸 Курс «Специалист по ИИ»
🔸 Получить консультацию менеджера
🔸 Сайт Академии 🔸 Сайт Proglib
#буст
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3❤2👏1
Forwarded from Библиотека собеса по Data Science | вопросы с собеседований
PCA возвращает ортогональные компоненты. Можно ли утверждать, что они всегда независимы?
Anonymous Quiz
33%
Да, ортогональность гарантирует независимость
56%
Нет, компоненты могут быть некоррелированными, но не независимыми
6%
Только если данные нормальны
5%
Только после масштабирования признаков
🔥1🎉1