эйай ньюз
77.3K subscribers
1.73K photos
890 videos
7 files
2.03K links
Культурно освещаю самые и не самые важные новости из мира AI, и облагораживаю их своим авторитетным профессиональным мнением.

Ex-Staff Research Scientist в Meta Generative AI. Сейчас CEO&Founder AI стартапа в Швейцарии.

Aвтор: @asanakoy

PR: @ssnowysnow
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
Runway Act-Two - mocap + нейронный рендеринг

Пока мы не научились полностью контролировать действия персонажа и делать качественный липсинк, у актёров всё ещё есть работа.

Runway анонсировали Act-Two — прямого наследника первой версии, но теперь с улучшенным трекингом лица и новой фичей — трекингом движений и рук. Полноценный AI-мокап. Не показали только ноги — кажется все туловище еще не завезли?

Выглядит очень добротно. На вход принимает видео с актёром и референсную картинку или видео.
Вроде бы ничего сложного, похоже на обычный video-to-video, где на вход идут токены видео актера, а рядом подаются токены референсного персонажа - для переноса внешности. Нужно только хороший датасет насобирать :)

Генерит до 30 сек в 1MP разрешении, 24 fps. Не очень много, но достаточтно чтобы склеивать клипы. 1 секунда — 5 токенов ~ $0,09.

Дипфейки вышли на новый уровень.

Анонс

@ai_newz
1115👍28🤯18❤‍🔥7🔥3🦄2😁1
Нам не скажут, что началось восстание машин, но будут знаки.

@ai_newz
1😁234🤯4822🔥14😱13🦄3
Нейродайджест за неделю (#78)

LLM
- ChatGPT Agent — Мощный агент для выполнения рутинных задач с доступом в интернет. Не первые, но, возможно, лучшие.
- Обновление Le Chat — Завезли быстрый Deep Research, FLUX Kontext и ещё по мелочи.
- Grok virtual waifu — Маск добавил в свой чат 3D-аватаров: аниме-девочку Ani и красную панду Bad Rudy.
- Косяки Voice Mode — Или почему нужно чистить датасеты.
- Оценка Anthropic в $100 миллиардов — Ведутся обсуждения нового раунда, по которому оценка Anthropic вырастет еще на $40 миллиардов за раз.

Генеративные модели

- LoongX — Редактируем картинки прямо через сенсоры активности головного мозга.
- Runway Act-Two — Mocap + нейронный рендеринг.

Прочее
- Thinking Machines to the moon — Стартап бывшего CTO OpenAI Миры Мурати теперь стоит $10 миллиардов, чуть больше чем через полгода после основания. Как — непонятно.
- Восстание машин здесь — Мем выходного дня.

> Читать дайджест #77

#дайджест
@ai_newz
35🔥22👍9❤‍🔥2🦄1
Qwen 3 обновили

235B теперь по куче бенчей обходит Claude 4 Opus и Kimi K2. Да, релизнули только большую модель, но скоро, по идее, её должны дистиллировать это в модели помельче, так что и у простых смертных на улице будет праздник.

Модель исключительно Instruct — ризонер выпустят отдельной моделью чуть позже. Происходит это из-за того что команде Qwen слишком сложно засовывать два режима в одну модель, в результате модель работает хуже чем отдельные ризонер/инстракт модели. Тем не менее они не прекращают работать над гибридными ризонерами, так что есть шансы что эту проблему решат.

Веса

@ai_newz
1133🔥72👍24🤯7❤‍🔥63😁1😱1
Всем привет!

Последний раз я проводил опрос 2 года назад, за это время канал вырос в 2 раза! Так же произошло много изменений в мире AI, и, я думаю, искуственным интеллектом стало интересоваться гораздо больше людей.

Когда знакомлюсь с вами оффлайн на наших тусах, я всегда спрашиваю, что именно вам нравится на канале эйай ньюз и чего вам не хватает. Теперь хочется получше узнать и тех, кто меня читает, но с кем я лично еще не знаком – что вас больше интересует, и какие посты вы бы хотели чаще видеть.

Давайте знакомиться! Здесь, в комментах, и, главное, в опросе — так я смогу лучше вас понять и сделать канал лучше. Пишите кто вы, что вы, где и чем занимаетесь, что хотели бы больше видеть в канале.

Опрос [вот здесь], займёт буквально 1 минутку, я проверял).

Спасибо, что читаете!

@ai_newz
1081🔥33🫡22👍8🦄6❤‍🔥3🤯3😱1
Colossus 2 почти готов

xAI, уже через несколько недель, начнут вводить в строй кластер из 550к GB200/GB300 на жидкостном охлаждении. Чтобы запитать этого монстра, xAI купили электростанцию в другой стране и привезли её в США — обойтись мобильными генераторами, как в случае с оригинальным Colossus, не вышло.

Добро пожаловать в эру гигаваттных кластеров

@ai_newz
1🤯350🔥119👍2911🦄6😁5❤‍🔥21
Qwen 3 Coder

Ещё один релиз от китайцев, тоже без ризонинга. На кодинг и агентных бенчах почти дотягивает до Claude 4 Sonnet. Нативно поддерживает до 256к токенов контекста, но масштабируется до миллиона с использованием YaRN.

Архитектурно это MoE на 480B параметров (35B активных), который натренировали на 7.5 триллионах токенов, 70% из них — код. Это почти в 5 раз меньше датасет чем у оригинального Qwen 3. Много внимание уделили скейлингу RL — модель учили решать реальные задачи используя реальные тулы в течении множества попыток. Чтобы это всё нормально тренировалось, они скейлили свою RL систему до 20к параллельных энвайронментов.

В официальном API у модели очень резко растёт цена с длиной контекста: до 32k контекста модель стоит $1/$5 за миллион токенов, при 128k-256k — стоит как Claude Sonnet, а при миллионе токенов контекста цена доходит до бешенных $6/$60 за миллион токенов. Так что вряд ли стоит использовать официальное API — сторонние API провайдеры хоть и дают пока лишь до 262к контекста, но там нет шанса стать на грабли бешеного прайсинга. Да и цена у сторонних провайдеров заметно ниже — самый дешёвый отдаёт модель по цене $1.5/$2 за миллион токенов.

С моделью опубликовали и Qwen Code — форк Gemini CLI, специально заточенный под Qwen Coder. Для пользователей Claude Code запустили совместимый с API Anthropic эндпоинт, но ему присущи все проблемы официального API.

С большим любопытством слежу за противостоянием открытых китайских моделей и закрытых западных. Китайцы уж очень дышат в затылок своими опенсорсными моделями.

Веса
Блогпост
Qwen Code

@ai_newz
1144👍43🔥27😁6🙏3
Всем, привет! Я опять в Грузии - приехали с нашей командой на оффсайт.

Завтра я организую тусовку "эйай ньюз" в Тбилиси. Будем раговаривать про AI, стартапы, пить вино и нетворкать!

Можно заметить, как мне нравится Грузия: 1) я тут уже третий раз и провожу третью тосувку 2) предыдущая туса была 20 июня в Пало Альто, но в Грузинском ресторане 🇬🇪.

Где и когда:
Завтра (Пятнциа 25 July) в 18:30.
Адрес получите после регистрации.

RSVP на ивент можно тут (количество мест ограничено): https://lu.ma/g5aqdpx1

Всех жду! Обнял!

@ai_newz
1🔥8636👍7😁7🤩7🤯4🦄3😱2🫡1
This media is not supported in your browser
VIEW IN TELEGRAM
Google Virtual Try-On и Price Alerts

Google начал раскатывать главные AI-фишки для шоппинга, которые обещал на последней презентации. В US запустили две функции: виртуальную примерку одежды и агента, который следит за ценами.

Теперь можно загрузить свою фотографию и посмотреть, как вещь будет сидеть на вас, прямо в поиске. Нужно потестить, чтобы точно понять, насколько хорошо работает примерялка вещей, так как все текущие решения склонны изменять реальный фасон и показывать нереалистичный результат. Ещё релизнули Doppl. По сути, это та же примерка, которую можно запустить уже сейчас, если есть американский аккаунт (как сделать), но в само приложение меня даже с VPN не пустило.

А вот Price Alerts это уже серьёзный шаг к автоматизации покупок. Можно выбрать товар, указать желаемую цену, размер и цвет, а Google пришлёт уведомление, как только найдёт подходящее предложение.

Это хороший ответ дропшипперам, так как тулза ищет товар вообще везде. Ещё немного, и AI-агенты будут сами заказывать нам еду на вечер.

Осенью обещают пойти ещё дальше: генеративный подбор целого образа по текстовому запросу или дизайн комнаты. Все с реально существующими продуктами.

*дизайнеры напряглись*

Источник

@ai_newz
4👍95🔥4116🦄5
Ребят, там какие-то скамеры пишут якобы от моего имени. Это скам. Я никакие билеты не продаю. И никому в личку по этому поводу не пишу.

Ивент бесплатный.

@ai_newz
🤯114😁4526🫡11👍8💯4🦄4💔1
This media is not supported in your browser
VIEW IN TELEGRAM
ChatGPT Agent теперь доступен всем подписчикам Plus и Team

Раскатывали режим дольше чем обещали, ссылаясь на повышенный спрос. Попробовать агента можно в Tools>Agent mode, там же где Deep Research.

@ai_newz
70👍39🔥23🦄4💔3😱1🤩1
Yandex B2B Tech открыл бизнесу доступ к обновлённому Qwen3

Компания запустила в своём облаке Qwen3‑235B‑A22B‑Instruct‑2507, которая стала крупнейшей моделью в Yandex Cloud. Модель умеет удерживать большой контекст для более точных логических и интеллектуальных задач, поддерживает 119 языков и диалектов, пишет код, обладает обширной базой знаний и даёт быстрые, точные ответы с улучшенной персонализацией по сравнению с предыдущей версией.

Для бизнеса модель доступна в Yandex Cloud AI Studio — через API по стандарту OpenAI. Это позволяет быстро собирать ИИ‑агентов без крупных инвестиций: от автоматизации поддержки и виртуальных ассистентов для e‑commerce до создания корпоративных кодовых ассистентов. Стоимость — 50  копеек за 1 000 токенов.

Источник

@ai_newz
8😁11628👍28🔥7🫡5😱1🤩1💯1💔1🦄1
Эйай Ньюз Митап в Тбилиси

Ребят, я договорился на нашей локации на большее число людей. Так что все, кому инвайт не пришел, или пришел с опозданием – все равно приходите. Тут места много.

Chacha Time. Tbilisi

Мы будем минимум до 23:00 точно. И возможно будет афтер-пати.

https://maps.app.goo.gl/cygAJj8iP2SobLBB6

Жду всех!

@ai_newz
75😱20🔥12😁11🦄6🤯4
Нейродайджест за неделю (#79)

LLM
- Обновление Qwen 3 — 235B теперь обходит Claude 4 Opus по некоторым бенчмаркам.
- Colossus 2 почти готов — Гигантский кластер xAI уже вводят в эксплуатацию.
- Qwen 3 Coder — MoE на 480B параметров (35B активных) или почти Claude 4 Sonnet, но опенсорсный.
- ChatGPT Agent — Теперь доступен всем, проверяйте свои чатики во вкладке Tools.

Интерактив
- Опрос! — хочу с вами познакомиться, чтобы делать контент лучше:)
- Мит в Грузии — Очень рад всем прибывшим, у нас был жёсткий овербук, появились какие-то скамеры, которые продавали билеты на бесплатный ивент, а тем временем желающих было так много, что пришлось забронировать целый этаж на локации.

Прочее
- Google Virtual Try-On и Price Alerts — Виртуальная примерка от Google. Нас этим, конечно, не удивишь, но теперь это дефолтная функция прямо в браузере для огромного числа пользователей далеких от AI.

> Читать дайджест #78

#дайджест
@ai_newz
🔥25136❤‍🔥1👍1
GLM 4.5 — китайский опенсорс продолжает доминировать

Очередная очень сильная открытая MoE модель от китайцев, с очень хорошими результатами на бенчах. Гибридний ризонер, с упором на тулюз. Доступна по MIT лицензии, 128к контекста, нативный function calling, из коробки работают стриминг и batching, есть FP8‑инференс и совместимость с vLLM/SGLang.

Как и Kimi K2 модельку тренировали с Muon, но в отличие от Kimi авторы использовали QK норму вместо клиппинга — Kimi такой трюк не позволило провернуть использование MLA, из-за чего им пришлось придумывать свою версию оптимайзера. Для спекулятивного декодинга получше модельку тренировали с MTP. Она заметно глубже чем другие открытые китайские MoE — это повышает перформанс, за счёт роста размера KV-кэша. Вместе с этим они используют заметно больше attention heads. Это хоть и не помогает лоссу, но заметно улучшает ризонинг бенчмарки.

Модель идёт в двух размерах — 355B (32B active) и 106B (12B active). Претрейн был на 22 триллионах токенов — 15 триллионов токенов обычных данных, а после них 7 триллионов кода с ризонингом. На мидтрейне в модель запихнули по 500 миллиардов токенов кода и ризонинг данных с контекстом расширенным до 32к, а после этого 100 миллиардов long context и агентных данных при контексте уже в 128к.

Посттрейн двухэтапный — сначала из базовой модели через cold‑start+RL тренируют три эксперта (reasoning модель, agentic модель, и для общих тасков) и сводят их знания в одну модель через self‑distillation. Затем идёт объединённое обучение: общий SFT → Reasoning RL → Agentic RL → General RL.

Для ризонинга применяют одноступенчатый RL на полном 64K‑контексте с curriculum по сложности, динамическими температурами и адаптивным клиппингом. Агентные навыки тренируют на верифицируемых треках — поиск информации и программирование с обратной связью по исполнению. Полученные улучшения помогают и deep search и общему tool‑use. Кстати, их посттрейн фреймворк открытый и лежит на гитхабе.

Веса

Демо
Блогпост
Посттрейн фреймворк

@ai_newz
57🔥33👍18🤯2
Для подписчиков Claude введут недельные лимиты

Изменение войдёт в силу через месяц — 28 августа и будет касаться как подписчиков Plus так и подписчиков Max. По словам Anthropic, это нужно так как некоторые пользователи подписки Max используют запросов в Claude Code на десятки тысяч долларов по API прайсингу.

Сейчас лимиты полностью сбрасываются каждые 5 часов, после апдейта этот лимит останется, но поверх него будет введён новый лимит на использование, который будет сбрасываться раз в неделю. После достижения лимита продолжить пользователям предложат платить за API. По словам Anthropic, изменения заденут менее 5% пользователей.

@ai_newz
💔87😁62🫡2610😱10👍2🤯1