Data Secrets – Telegram

Data Secrets

75.8K subscribers

5.68K photos

543 videos

20 files

2.19K links

Главный по машинному обучению

Сотрудничество: @veron_28

РКН: clck.ru/3FY3GN

https://telega.in/c/data_secrets

Download Telegram

About

Blog

Apps

Platform

75.8K subscribers

Media is too big

VIEW IN TELEGRAM

Alibaba Group (создатели Qwen) выпустили Wan2.2 – первую в мире опенсорсную модель для генерации видео, в основе которой лежит MoE

По черри-пикам выглядит, как всегда, хорошо. Кое-где не хватает фотореалистичности, но, в целом, и анатомия, и сложные движения, и физика жидкостей, и перемещения камеры – норм.

Отдельно интересен релиз тем, что это именно MoE. Кратко, как это работает для диффузии:

– Точно так же, как и для текста, у нас есть несколько экспертов и роутер (подробнее о том, как работает MoE, рассказывали в конспекте)

– Только здесь эксперт назначается не токенам, а шагам диффузии. Грубо говоря, каждый эксперт лучше справляется с какой-то определенной фазой денойзинга, и работает именно с ней.

– За счёт того, что каждый эксперт узкоспециализирован, общая мощность растет. При этом сохраняется примерна та же вычислительная нагрузка, так как эксперты работают последовательно и как бы «распределяют» нагрузку.

В общем, довольно занятный вариант для экспериментов. Надеемся, скоро выпустят статью или тех.отчет с деталями.

Попробовать модель уже можно тут
Веса лежат здесь
Ну и GitHub

1🔥10333❤18👍115

18.4K viewsedited 09:33

В Нижнем Новгороде Яндекс Образование проведет студкемп по компьютерному зрению.

Это совместный проект с Неймарком и ФКН ВШЭ.

Что ждет студентов:

• Знания в области CV и ИИ
• Уникальный опыт по разработке технологий автономного транспорта от Яндекса
• Понимание технологий и методов обработки изображений с помощью ИИ
• Практика наладки компьютерного зрения в системах автономного транспорта и робототехнике

Участие бесплатно, но нужно пройти отбор. Победителям организаторы оплатят и дорогу, и проживание.

Зарегистрироваться можно до 14 августа, по ссылке.

1👍26🗿12😁8🤯44❤3✍1👌11

18K views12:02

Это вам на случай переговоров с ИИ-думерами

1😁290👍20🔥12❤5🍓1

18.6K views13:03

В ChatGPT появился новый инструмент «Think Longer»

Его массово стали замечать у себя пользователи, но официального релиза еще не было. Кто-то говорит, что это GPT-5, но мы не обольщаемся.

Судя по твитам и Реддиту, это просто тумблер, который: (1) переключает вас на ризонинг модель (видимо, o3), если в данный момент вы пользуетесь не-ризонером; (2) активирует чуть больший бюджет ризонинга, если вы на o3/o4-mini.

Проверяйте, вдруг и у вас уже есть

1👍80❤28🤨26🔥63😁111

19.3K views15:29

This media is not supported in your browser

VIEW IN TELEGRAM

В ChatGPT появился Study mode – режим для изучения чего угодно с ИИ

Обучение – очень популярный кейс среди пользователей чат-ботов. Люди учат языки, просят GPT объяснять сложные темы, разъяснять задачи и прочее прочее прочее.

И вот специально для такого OpenAI выкатили отдельный мод. Фишка в том, что в этом режиме модель будет, например, не просто решать за вас задачу, а идти по решению поэтапно, задавая наводящие вопросы, подстраиваясь под знания юзера, поправляя и направляя – как настоящий хороший учитель. Может также составить квиз/тест или проверить знания в другом виде.

И, кстати, создавался режим при сотрудничестве с реальными педагогами.

Самое приятное: фича доступна бесплатно и работает для любой модели. Для студентов и особенно школьников – просто находка.

Как там говорится? Репетиторы – ВСЁ? 🙂

openai.com/index/chatgpt-study-mode/

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤316👍70🔥43😁22🤓10🗿4👏3🤯3

22K views19:34

This media is not supported in your browser

VIEW IN TELEGRAM

В NotebookLM теперь можно генерировать видеообзоры

Выглядит это так: загружаете любые источники, а агент генерирует по ним презентацию + сопроводительный рассказ.

Мы попробовали – получается действительно неплохо. Слайды, конечно, простенькие (но эстетичные!) и не очень динамично меняются, но все равно – огонь. Четкая структура, рассказ всегда мэтчится со слайдами и идет очень последовательно.

И да: доступно бесплатно. Лимиты такие же, как и для тех самых ИИ-подкастов: 3 в день (гуманно). Для чтения статей – просто супер.

notebooklm.google

P.S. Интересно, они специально релизнулись в один день со Study Mode в ChatGPT? 🧐

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤111👍4520🔥11😁32

19.5K viewsedited 05:42

Илон Маск заявил, что в xAI и SpaceX нет рисерчеров – а есть только инженеры

Термин «рисерчер» он назвал чопорным и малоответственным, и сказал, что это пережиток академической среды. Он утверждает, что рисерчеры в xAI не нужны, потому что у него работают только инженеры.

SpaceX проводит больше значимых и передовых «исследований» в области совершенствования ракет и спутников, чем все академические университетские лаборатории на Земле вместе взятые.

Но, тем не менее, мы не используем термин «исследователь».

Прямо сейчас инженеры из xAI удаляют из резюме строчку «researcher», а вы что делаете?

1😎172😁10836👍13🤯13❤1265💯3✍2🤔2

17.8K views09:07

Наконец-то: Meta* позволит кандидатам использовать ИИ на собеседованиях

Пока что решение находится в режиме "тестирования" и компания просит существующих сотрудников пройти пробные мок-собесы с использованием ИИ, чтобы обкатать процесс.

Цукерберг говорит, что вайб-кодинг – это уже неотъемлемая часть работы инженеров и скоро большинство кода будет создаваться ИИ, поэтому такие собеседования более репрезентативны.

Вспоминается лозунг того самого стартапа Cluely, основателя которого отчислили из университета за его идею: "То, что сегодня называют списыванием, завтра будет в порядке вещей".

www.wired.com/story/meta-ai-job-interview-coding/

1👍123🤯46❤19✍5🤨4🗿4🔥2👏2😁2🦄22

18.4K viewsedited 12:03

Любопытно: оказывается, теперь в России развитие ИИ в регионах будет контролировать специальное подразделение под названием «Центр развития ИИ».

Подчиняться центр будет непосредственно вице-премьеру, а задачи (интересно, какие) будет получать от Минцифры. Говорят, что это будет что-то вроде единого проектного офиса, коммуникационной и мониторинговой площадки.

Структуру (внезапно!) возглавит выходец из ракетно-космической отрасли, но с ИИ-бэкграундом, в том числе научным. Официально об этом пока не объявляли, но инсайд вышел вот тут на канале «Неискусственный интеллект».

Кстати, редакторы этого канала — бывшие журналисты, почти всех знают в отрасли, а потому довольно часто раскапывают эксклюзивы. А ещё делают разборы новостей и трендов со своим собственным, часто довольно критичным и едким, взглядом на происходящее.

Причём пишут не только про софт, но и про железо, про чипы и фаундри, то есть отслеживают всю «вертикаль» ИИ — сверху донизу. Кстати, они не стесняются давать прогнозы, которые часто сбываются. Так что стоит подписаться на @anti_agi, там интересно.

1🗿130🤨62😁25❤11🔥11👍97🤔4🤯4🐳2🫡2

17.4K views13:03

Наконец-то: Meta* позволит кандидатам использовать ИИ на собеседованиях Пока что решение находится в режиме "тестирования" и компания просит существующих сотрудников пройти пробные мок-собесы с использованием ИИ, чтобы обкатать процесс. Цукерберг говорит…

Мы все ближе и ближе к этому мему

1😁233🔥31🤯12❤9👍2🗿2

17K views14:06

This media is not supported in your browser

VIEW IN TELEGRAM

⚡️

Создатели alphaXiv сделали Discord для исследователей

Спроектировано буквально также: сервера, каналы, сообщества. Для открытых комьюнити есть лендинг – там можно выбрать себе ✨кружок по интересам✨ и участвовать в обсуждениях. Ну или создать свое сообщество, частное или открытое.

Самое крутое, что делается это на базе огромного хранилища статей. А это значит, что перед нами самый мощный из возможных ридинг-клаб. Причем на любую интересную вам научную тему (особенно связанную с ML/ИИ).

Прямо подарок какой-то

www.alphaxiv.org/communities

Please open Telegram to view this post

VIEW IN TELEGRAM

1❤162🔥54👍23☃6🤯4❤‍🔥2😁1

18.6K views15:10

Исследователи Яндекса раскрыли, как научили нейросеть распознавать голосовые команды — даже сквозь сильный шум.

Вышла научная статья с подробным описанием технологии. Само исследование принято в программу крупнейшей профильной конфы Interspeech 2025 в Нидерландах.

В устройствах вроде умных колонок команда «Алиса» должна срабатывать, даже когда рядом работает пылесос или кто-то говорит. Стандартные алгоритмы шумоподавления помогают пользователям, но часто мешают самим моделям. Исследователи речевых технологий из Яндекса нашли решение, которое позволяет объединять преимущества нескольких подходов. В основе — собственный attention-механизм, работающий сразу с двумя сигналами: после шумоподавления и эхоподавления.

1👍126❤38☃11🤔8🤨6🗿6❤‍🔥2😁2⚡1🤯1

17.4K views16:30

The Information пишет, что OpenAI планирует потратить 35 миллиардов долларов на инференс и 55 миллиардов на обучение моделей в ближайшие полтора года

Просто для сравнения: 90 миллиардов долларов – это два годовых ВВП Латвии.

1😁165❤48🔥36🤯21👍4👌3

17.3K views17:23

Microsoft показали списки профессий, которые больше всего и меньше всего подвержены риску быть замененными ИИ

В список «неудачников» попали переводчики, историки, писатели, рекламщики, математики, дата сайентисты, веб-разработчики и даже модели.

Если вы с списке – не расстраивайтесь, мы тоже. Вот вам для профориентации несколько примеров из списка тех, кого ИИ заменит не скоро: медсестры, хирурги, механики, монтажники, посудомойщики, бетонщики, горничные, санитары, маляры. Думайте 😶

Кстати, подсчитали это Microsoft вот как:

1. Взяли анонимизированные данные о 100 000 диалогов с Bing Copilot в США и каждый запрос классифицировали по цели пользователя и тому, что по факту сделал ИИ.

2. По официальной базе рабочих процессов сопоставили каждую активность с конкретной профессией.

3. Для каждой профессии посчитали покрытие (доля рабочих активностей профессии, которые встречаются в данных), успешность выполнения задач ИИ и широту охвата (насколько полно ИИ покрывает конкретную активность).

На основе трех показателей считали интегральный индекс, и чем он выше – тем более вероятно, что профессия будет автоматизирована.

Ну что, завтра на завод?

arxiv.org/abs/2507.07935

Please open Telegram to view this post

VIEW IN TELEGRAM

Please open Telegram to view this post

VIEW IN TELEGRAM

2😁13628❤23🔥18🫡11🗿6🦄5👍4👌42❤‍🔥1

18.8K views05:48

E-CUP возвращается. Реальные данные. Масштабные проекты. Большие призы

Решайте ML-задачи в стиле Ozon Tech. Девять победителей разделят призовой фонд соревнования — 7 200 000 рублей 🔥
Тест-драйв работы в e-com бигтехе стартует здесь.

🗓

Регистрация: https://cnrlink.com/ecup25datasecrets

💻

Формат участия: онлайн

👥

Команда: от 1 до 5 человек

🎯

Для кого: Data Scientists, ML-специалисты, аналитики данных, дата-инженеры, специалисты Big Data и разработчики, которые интересуются ML/DS.

Что вас ждёт:
🔹 Работа над проектом для миллионов пользователей на основе данных от ведущего e-com в России.
🔹 Обмен опытом с экспертами Ozon Tech.
🔹 Эксклюзивный мерч для победителей и подарки для самых активных участников.
🔹 Питчинг — 13 сентября на конференции E-CODE. Ozon Tech предоставит финалистам билеты и оплатит поездку.

Три трека E-CUP:

1️⃣

Рекомендации: предсказание следующей покупки пользователя

2️⃣

Логистика: автопланирование курьеров

3️⃣

Контроль качества: автоматическое выявление поддельных товаров

Регистрация на платформе Codenrock: https://cnrlink.com/ecup25datasecrets

Please open Telegram to view this post

VIEW IN TELEGRAM

1😁20🔥7👍5❤3🕊2🗿1

15.5K views07:01

DeepSeek только что выложили статью, в которой предложили новую вариацию механизма внимания Традиционное внимание очень прожорливо: вычисления масштабируются квадратично по мере увеличения длины последовательности. Это приводит к тому, что скейлинг трансформеров…

О, статья от DeepSeek выиграла награду Best Paper Award на ACL 2025

Это ведущая мировая конференция по NLP.

Статья называется «Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention». Работа вышла в феврале, в ней DeepSeek показали новую вариацию механизма внимания, специально оптимизированную под длинный контекст.

Наш разбор статьи можно найти тут. Если не читали – самое время.

А DeepSeek мы от души поздравляем, награду они точно заслужили 🐋

Please open Telegram to view this post

VIEW IN TELEGRAM

2🐳194🔥45👍25❤11😁2🤔2❤‍🔥1☃1

16.1K views08:08