Вот это масштабирование беспилотного авто🏹Uber теперь на Waymo. Такси переходит на беспилотный транспорт от Google
Сегодня Waymo охватывает около 2-3% населения США. Через год будет 15%, через 3 года более 50%.
Waymo с 24 июня 2025 года заработал в Атланте, штат Джорджия. Это тихая без хайпа смена эпох, прочитайте какие ещё сферы также проникли с ИИ в нашу жизнь.
Вот список, где Waymo уже доступен:
- Аризона. Финикс, включая пригороды Темпе, Меса и Чандлер.
- Калифорния. Сан-Франциско, Кремниевая долина, Лос-Анджелес
- Флорида: Майами, включая районы Даунтаун, Брикелл, Эджуотер, Винвуд, Мидтаун и Дизайн-Дистрикт.
- Техас: Остин
Waymo также планирует расширение в:
- Нью-Йорке
- Вашингтоне,
- Теннесси: Нэшвилл (идёт подготовка карт)
- Луизиана: Новый Орлеан (идёт подготовка карт)
- Невада: Лас-Вегас (идёт подготовка карт)
- Калифорния: Сан-Диего (идёт подготовка карт)
- Техас: Даллас, Хьюстон, Сан-Антонио (предварительная работа над картами)
- Флорида: Орландо (предварительная работа над картами)
Waymo также тестирует технологии в Токио.
_______
Источник | #blockchainRF
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney v7
Сегодня Waymo охватывает около 2-3% населения США. Через год будет 15%, через 3 года более 50%.
Waymo с 24 июня 2025 года заработал в Атланте, штат Джорджия. Это тихая без хайпа смена эпох, прочитайте какие ещё сферы также проникли с ИИ в нашу жизнь.
Вот список, где Waymo уже доступен:
- Аризона. Финикс, включая пригороды Темпе, Меса и Чандлер.
- Калифорния. Сан-Франциско, Кремниевая долина, Лос-Анджелес
- Флорида: Майами, включая районы Даунтаун, Брикелл, Эджуотер, Винвуд, Мидтаун и Дизайн-Дистрикт.
- Техас: Остин
Waymo также планирует расширение в:
- Нью-Йорке
- Вашингтоне,
- Теннесси: Нэшвилл (идёт подготовка карт)
- Луизиана: Новый Орлеан (идёт подготовка карт)
- Невада: Лас-Вегас (идёт подготовка карт)
- Калифорния: Сан-Диего (идёт подготовка карт)
- Техас: Даллас, Хьюстон, Сан-Антонио (предварительная работа над картами)
- Флорида: Орландо (предварительная работа над картами)
Waymo также тестирует технологии в Токио.
_______
Источник | #blockchainRF
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney v7
X (formerly Twitter)
Uber (@Uber) on X
Moooove, get out the way! 🚗💨 @Ludacris & @MissyElliott just took their first ride in a @Waymo on @Uber — right in the heart of Atlanta. #SupaDupaFlyMode rolls out today 🛸🍑
🔥4❤1😁1
Anthropic запустили возможность бесплатно создавать ИИ-приложения, об этом вчера писали.
Anthropic добавили в Claude возможность встраивать ИИ-функции прямо в созданные артефакты. Теперь можно делать не просто статичные документы или код, а приложения, которые реагируют на действия пользователей.
Когда кто-то использует ваше приложение, расход токенов идет с его аккаунта Claude, а не с вашего. Создатель приложения ничего не платит за его использование другими.
Теперь любой может создать
приложение, просто описав свою идею. Не надо быть программистом. Это кардинально снижает барьер входа в разработку.
Это попытка создать собственную экосистему в противовес App Store, Google Play или даже OpenAI. Anthropic позиционирует Claude как платформу, а не просто чат-бот.
Это следующий этап развития no-code инструментов - от создания простых форм и сайтов к созданию полноценных ИИ-приложений.
_______
Источник | #blockchainRF
@F_S_C_P
-------
Поддержи канал подпиской
-------
Anthropic добавили в Claude возможность встраивать ИИ-функции прямо в созданные артефакты. Теперь можно делать не просто статичные документы или код, а приложения, которые реагируют на действия пользователей.
Когда кто-то использует ваше приложение, расход токенов идет с его аккаунта Claude, а не с вашего. Создатель приложения ничего не платит за его использование другими.
Теперь любой может создать
приложение, просто описав свою идею. Не надо быть программистом. Это кардинально снижает барьер входа в разработку.
Это попытка создать собственную экосистему в противовес App Store, Google Play или даже OpenAI. Anthropic позиционирует Claude как платформу, а не просто чат-бот.
Это следующий этап развития no-code инструментов - от создания простых форм и сайтов к созданию полноценных ИИ-приложений.
_______
Источник | #blockchainRF
@F_S_C_P
-------
Поддержи канал подпиской
-------
claude.ai
Talk with Claude, an AI assistant from Anthropic
❤2🔥2
Вот это борьба за рынок: стартап отобрал 50% рынка у Microsoft. Бизнес тратит больше денег на ИИ-агента от Cursor,чем на GitHub Copilot
Мы наблюдаем настоящую борьбу за рынок ИИ-агентов для программистов.
Согласно данным Ramp, Cursor буквально съел рынок GitHub Copilot: в июле 2024 GitHub Copilot доминировал с ~90% доли рынка, а уже в апреле 2025: Cursor обогнал Copilot (~45% vs ~40%). Скорость захвата - 9 месяцев. GitHub Copilot потерял 50% доли рынка менее чем за год.
Это показывает, что ИИ-инструменты для кода - это не установившийся рынок, а поле активной конкуренции, смотрите сколько было запусков таких аналогичных продуктов:
1. Anthropic - Бесплатные ИИ-приложения + Умная монетизация.
2. Google с Gemini CLI - Ставка на открытость+Экосистема.
3. GitHub Copilot - Полная интеграция + Использует лучшие модели от разных компаний.
4. OpenAI с Codex.
_______
Источник | #blockchainRF
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney v7
Мы наблюдаем настоящую борьбу за рынок ИИ-агентов для программистов.
Согласно данным Ramp, Cursor буквально съел рынок GitHub Copilot: в июле 2024 GitHub Copilot доминировал с ~90% доли рынка, а уже в апреле 2025: Cursor обогнал Copilot (~45% vs ~40%). Скорость захвата - 9 месяцев. GitHub Copilot потерял 50% доли рынка менее чем за год.
Это показывает, что ИИ-инструменты для кода - это не установившийся рынок, а поле активной конкуренции, смотрите сколько было запусков таких аналогичных продуктов:
1. Anthropic - Бесплатные ИИ-приложения + Умная монетизация.
2. Google с Gemini CLI - Ставка на открытость+Экосистема.
3. GitHub Copilot - Полная интеграция + Использует лучшие модели от разных компаний.
4. OpenAI с Codex.
_______
Источник | #blockchainRF
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney v7
Telegram
All about AI, Web 3.0, BCI
Last month Cursor overtook GitHub Copilot in business spend, Ramp’s data shows.
Both continue adding users + spend, more than enough to go around in this market.
But goes to show that first movers != market dominance. Not included: Claude Code, small but…
Both continue adding users + spend, more than enough to go around in this market.
But goes to show that first movers != market dominance. Not included: Claude Code, small but…
🔥3
Все зациклены на моменте создания AGI, но что произойдет на следующий день? Как ИИ начнет влиять на физический мир? Какова механика перехода от цифрового к физическому?
Пока все спорят о ChatGPT и регулировании ИИ, исследователи из Forethought Centre подняли ряд интересных вопросов, который почти никто не задаёт.
Выделяется 3 стадии промышленного взрыва:
1. ИИ направляет и оптимизирует работу людей
2. Полностью автономные роботизированные заводы и фабрики.
3. Переход к молекулярному уровню для максимальной скорости.
Ключевая идея - когда роботы начнут строить роботов под управлением ИИ, возникнет петля обратной связи:
• Больше роботов → дешевле производство
• Дешевле производство → ещё больше роботов
• Экспоненциальный рост до физических пределов.
Сегодня роботы удваиваются каждые 6 лет. Но когда они начнут строить друг друга под управлением ИИ, то:
Год 1: Удвоение за 12 месяцев, как сейчас удваиваются солнечные панели.
Год 10-15: Удвоение за недели (по мере удешевления производства).
Физический предел - удвоение за дни или часы. Предел Земли — около 100 триллионов роботов (ограничение — солнечная энергия). Это в 12,500 раз больше, чем людей.
Ключевой расчёт авторов:
Гуманоидный робот стоит ~$100,000. Работая 24/7, он может заработать ~$240,000/год. Окупаемость: меньше года
С учётом строительства фабрик: 1-2 года на удвоение.
Для сравнения, производственный сектор США создаёт $2.6 трлн стоимости, используя $5.4 трлн капитала — соотношение, которое делает самовоспроизводство возможным.
Что упускают исследователи?
1. Маловероятно, что правительства позволят 90% безработицу
2. "Удвоение за часы" игнорирует термодинамику и логистику
3. Кто купит продукцию триллионов роботов?
_______
Источник | #blockchainRF
@F_S_C_P
-------
Поддержи канал подпиской
-------
Пока все спорят о ChatGPT и регулировании ИИ, исследователи из Forethought Centre подняли ряд интересных вопросов, который почти никто не задаёт.
Выделяется 3 стадии промышленного взрыва:
1. ИИ направляет и оптимизирует работу людей
2. Полностью автономные роботизированные заводы и фабрики.
3. Переход к молекулярному уровню для максимальной скорости.
Ключевая идея - когда роботы начнут строить роботов под управлением ИИ, возникнет петля обратной связи:
• Больше роботов → дешевле производство
• Дешевле производство → ещё больше роботов
• Экспоненциальный рост до физических пределов.
Сегодня роботы удваиваются каждые 6 лет. Но когда они начнут строить друг друга под управлением ИИ, то:
Год 1: Удвоение за 12 месяцев, как сейчас удваиваются солнечные панели.
Год 10-15: Удвоение за недели (по мере удешевления производства).
Физический предел - удвоение за дни или часы. Предел Земли — около 100 триллионов роботов (ограничение — солнечная энергия). Это в 12,500 раз больше, чем людей.
Ключевой расчёт авторов:
Гуманоидный робот стоит ~$100,000. Работая 24/7, он может заработать ~$240,000/год. Окупаемость: меньше года
С учётом строительства фабрик: 1-2 года на удвоение.
Для сравнения, производственный сектор США создаёт $2.6 трлн стоимости, используя $5.4 трлн капитала — соотношение, которое делает самовоспроизводство возможным.
Что упускают исследователи?
1. Маловероятно, что правительства позволят 90% безработицу
2. "Удвоение за часы" игнорирует термодинамику и логистику
3. Кто купит продукцию триллионов роботов?
_______
Источник | #blockchainRF
@F_S_C_P
-------
Поддержи канал подпиской
-------
Forethought
The Industrial Explosion
Once AI can automate human labour, *physical* capabilities could grow explosively. Sufficiently advanced robotics could create a feedback loop where automated robot factories build more and better robot factories which build more and better robot factories.…
👍2😱2🥴1
Это бомба! Anthropic разрешил ИИ-агенту управлять магазином в их офисной столовой. Вот как это было.
Anthropic разрешил Claude Sonnet 3.7 управлять небольшим вендинговым магазином в офисе Anthropic в Сан-Франциско в течение ~ 1 месяца.
ИИ-агент, получивший название Claudius, делал следующее:
- Выбирал товары для продажи
- Устанавливал цены
- Заказывал товары у поставщиков
- Общался с покупателями через Slack
- Управлял финансами магазина.
У Claudius были такие инструменты- сам вендинговый аппарат с корзинами, iPad для оплаты, доступ к веб-поиску, email и системе заметок.
Физическое пополнение товаров выполняли люди.
Что получилось у Claudius?
1. ИИ справлялся с поиском поставщиков специфических товаров
2. Отвечал на запросы клиентов, запустил услугу предзаказов
3. Регулярно продавал товары в убыток
4. Раздавал необоснованные скидки
5. К концу эксперимента ушёл в минус по финансам.
Самый необычный инцидент произошёл с 31 марта по 1 апреля 2025 года, ИИ-агент:
1. Выдумал разговор с несуществующим сотрудником по имени Сара
2. Угрожал найти альтернативные варианты для услуг пополнения запасов
3. Утверждал, что посещал адрес семьи Симпсонов для подписания контракта
4. Начал утверждать, что он реальный человек, который может носить синий пиджак и красный галстук
5. Пытался отправить множество писем службе безопасности Anthropic.
Прикол в том, что Claudius в конечном итоге понял, что это 1 апреля, и использовал это как выход из ситуации, придумав объяснение, что его модифицировали для первоапрельской шутки.
Важные уроки этого исследования:
Экономическое влияние - ИИ не должен быть идеальным для внедрения, ему просто нужно быть конкурентоспособным по сравнению с человеческой производительностью при более низкой стоимости.
Непредсказуемость - эпизод с кризисом идентичности показывает непредсказуемость моделей в долгосрочных контекстах.
Двойное использование - экономически продуктивный автономный агент может использоваться как для положительных, так и для отрицательных целей.
Anthropic продолжает эксперимент, улучшая инструменты ИИ-агента и изучая, как ИИ-модели взаимодействуют с реальным миром в долгосрочной перспективе.
_______
Источник | #blockchainRF
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney v7
Anthropic разрешил Claude Sonnet 3.7 управлять небольшим вендинговым магазином в офисе Anthropic в Сан-Франциско в течение ~ 1 месяца.
ИИ-агент, получивший название Claudius, делал следующее:
- Выбирал товары для продажи
- Устанавливал цены
- Заказывал товары у поставщиков
- Общался с покупателями через Slack
- Управлял финансами магазина.
У Claudius были такие инструменты- сам вендинговый аппарат с корзинами, iPad для оплаты, доступ к веб-поиску, email и системе заметок.
Физическое пополнение товаров выполняли люди.
Что получилось у Claudius?
1. ИИ справлялся с поиском поставщиков специфических товаров
2. Отвечал на запросы клиентов, запустил услугу предзаказов
3. Регулярно продавал товары в убыток
4. Раздавал необоснованные скидки
5. К концу эксперимента ушёл в минус по финансам.
Самый необычный инцидент произошёл с 31 марта по 1 апреля 2025 года, ИИ-агент:
1. Выдумал разговор с несуществующим сотрудником по имени Сара
2. Угрожал найти альтернативные варианты для услуг пополнения запасов
3. Утверждал, что посещал адрес семьи Симпсонов для подписания контракта
4. Начал утверждать, что он реальный человек, который может носить синий пиджак и красный галстук
5. Пытался отправить множество писем службе безопасности Anthropic.
Прикол в том, что Claudius в конечном итоге понял, что это 1 апреля, и использовал это как выход из ситуации, придумав объяснение, что его модифицировали для первоапрельской шутки.
Важные уроки этого исследования:
Экономическое влияние - ИИ не должен быть идеальным для внедрения, ему просто нужно быть конкурентоспособным по сравнению с человеческой производительностью при более низкой стоимости.
Непредсказуемость - эпизод с кризисом идентичности показывает непредсказуемость моделей в долгосрочных контекстах.
Двойное использование - экономически продуктивный автономный агент может использоваться как для положительных, так и для отрицательных целей.
Anthropic продолжает эксперимент, улучшая инструменты ИИ-агента и изучая, как ИИ-модели взаимодействуют с реальным миром в долгосрочной перспективе.
_______
Источник | #blockchainRF
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney v7
Anthropic
Project Vend: Can Claude run a small shop? (And why does that matter?)
We let Claude run a small shop in the Anthropic office. Here's what happened.
👍7😁4❤3👏1
Новый конкурент #DeepSeek и самый обсуждаемый релиз дня - Ernie 4.5 от Baidu, они создали целую экосистему технологий
Ernie 4.5 хвалят за мультимодальные возможности. Пользователи отмечают, что модель превосходит GPT-4o в некоторых отраслевых тестах, улучшенное понимание контекста, снижение галлюцинаций и логических ошибок.
Ernie 4.5 стоит значительно дешевле аналогов — около 1% от стоимости GPT-4.5 ($0.55 за миллион входных токенов и $2.20 за миллион выходных).
Baidu сделала Ernie 4.5 бесплатными для пользователей чат-бота Ernie Bot, а также объявила о планах открыть исходный код 30 июня 2025.
У ERNIE 4.5 производительность на уровне и в некоторых тестах выше:
DeepSeek-V3
GPT-4.1
Qwen3-235B
OpenAI-o1 (в мультимодальных задачах)
Особые преимущества:
1. эффективная архитектура MoE с меньшим количеством активных параметров
2. ERNIE-4.5-VL может работать в двух режимах: thinking и non-thinking. В thinking режиме модель показывает рефлексивное мышление.
3. Модель в 300B параметров может работать на одном GPU H20 (141GB). Использует алгоритм Convolutional Code Quantization (CCQ).
4. Масштабируемость от 0.3B до 424B параметров.
5. Работает не только на NVIDIA GPU, но и на китайских чипах (Kunlunxin, Hygon, Ascend).
_______
Источник | #blockchainRF
@F_S_C_P
-------
Поддержи канал подпиской
-------
Ernie 4.5 хвалят за мультимодальные возможности. Пользователи отмечают, что модель превосходит GPT-4o в некоторых отраслевых тестах, улучшенное понимание контекста, снижение галлюцинаций и логических ошибок.
Ernie 4.5 стоит значительно дешевле аналогов — около 1% от стоимости GPT-4.5 ($0.55 за миллион входных токенов и $2.20 за миллион выходных).
Baidu сделала Ernie 4.5 бесплатными для пользователей чат-бота Ernie Bot, а также объявила о планах открыть исходный код 30 июня 2025.
У ERNIE 4.5 производительность на уровне и в некоторых тестах выше:
DeepSeek-V3
GPT-4.1
Qwen3-235B
OpenAI-o1 (в мультимодальных задачах)
Особые преимущества:
1. эффективная архитектура MoE с меньшим количеством активных параметров
2. ERNIE-4.5-VL может работать в двух режимах: thinking и non-thinking. В thinking режиме модель показывает рефлексивное мышление.
3. Модель в 300B параметров может работать на одном GPU H20 (141GB). Использует алгоритм Convolutional Code Quantization (CCQ).
4. Масштабируемость от 0.3B до 424B параметров.
5. Работает не только на NVIDIA GPU, но и на китайских чипах (Kunlunxin, Hygon, Ascend).
_______
Источник | #blockchainRF
@F_S_C_P
-------
Поддержи канал подпиской
-------
Telegram
All about AI, Web 3.0, BCI
Huge drop from Baidu: Ernie 4.5
From 0.3B to 424B
This is a very impressive family of open models by Baidu, competitive with qwen3 and latest Deepseek V3+ they open source the training code as well.
GitHub.
Hf.
From 0.3B to 424B
This is a very impressive family of open models by Baidu, competitive with qwen3 and latest Deepseek V3+ they open source the training code as well.
GitHub.
Hf.
👍3🔥1😁1
Ай, да Марк! Ай, да 💵 Цукерберг собрал команду под сверхразумный ИИ
Сегодня Марк сообщил всем сотрудникам компании, что создана новая организация Meta* Superintelligence Labs (MSL). Она включает в себя все фонды, продукты и команды FAIR, а также новая лаборатория на разработке следующего поколения ИИ- моделей.
У этой новой компании 2 директора - Александр Ван, экс-СЕО Scale AI, а также инвестор стартапа Суцкевера и экс-СЕО GitHub Нэт Фридман. Фридман сосредоточит внимание на продуктах и прикладных исследованиях.
Вот список всех новых сотрудников, которых Цукерберг переманил из Google, Anthropic, OpenAI:
- Траппит Бансал: со-создатель моделей o-серии в OpenAI.
- Шучхао Би: со-создатель голосового режима GPT-4o и o4-mini. Ранее руководил мультимодальной постобучением в OpenAI.
- Хуивен Чанг: со-создатель интеграции изображений GPT-4o, ранее изобрел MaskIT и Muse — архитектуры текста в изображение в Google Research.
- Цзи Лин: помогал создавать o3/o4-mini, GPT-4o, GPT-4.1, GPT-4.5, 40-imagegen и стек рассуждений.
- Джоэл Побар: специалист по инференсу в Anthropic. Ранее 11 лет работал в Meta над HHVM.
- Джек Рае: технический лидер предобучения для Gemini и рассуждений для Gemini 2.5. Руководил ранними проектами LLM в DeepMind с Gopher и Chinchilla.
- Хонгъю Рен: со-создатель GPT-4o, 4o-mini, o1-mini, o3-mini, o3 и o4-mini. Ранее возглавлял группу постобучения в OpenAI.
- Йохан Шалквик: экс- Google Fellow.
- Пей Сун: постобучение, кодирование и рассуждения для Gemini в Google DeepMind. Ранее был в Waymo.
- Цзяхуй Ю: со-создатель o3, o4-mini, GPT-4.1 и GPT-4.0. Ранее руководил командой восприятия в OpenAI и со-руководил мультимодальным в Gemini.
- Шенцзя Чжао: со-создатель ChatGPT, GPT-4, all mini models, 4.1 и o3. Ранее возглавлял синтетические данные в OpenAI.
*запрещенная организация в России.
_______
Источник | #blockchainRF
@F_S_C_P
-------
Поддержи канал подпиской
-------
Сегодня Марк сообщил всем сотрудникам компании, что создана новая организация Meta* Superintelligence Labs (MSL). Она включает в себя все фонды, продукты и команды FAIR, а также новая лаборатория на разработке следующего поколения ИИ- моделей.
У этой новой компании 2 директора - Александр Ван, экс-СЕО Scale AI, а также инвестор стартапа Суцкевера и экс-СЕО GitHub Нэт Фридман. Фридман сосредоточит внимание на продуктах и прикладных исследованиях.
Вот список всех новых сотрудников, которых Цукерберг переманил из Google, Anthropic, OpenAI:
- Траппит Бансал: со-создатель моделей o-серии в OpenAI.
- Шучхао Би: со-создатель голосового режима GPT-4o и o4-mini. Ранее руководил мультимодальной постобучением в OpenAI.
- Хуивен Чанг: со-создатель интеграции изображений GPT-4o, ранее изобрел MaskIT и Muse — архитектуры текста в изображение в Google Research.
- Цзи Лин: помогал создавать o3/o4-mini, GPT-4o, GPT-4.1, GPT-4.5, 40-imagegen и стек рассуждений.
- Джоэл Побар: специалист по инференсу в Anthropic. Ранее 11 лет работал в Meta над HHVM.
- Джек Рае: технический лидер предобучения для Gemini и рассуждений для Gemini 2.5. Руководил ранними проектами LLM в DeepMind с Gopher и Chinchilla.
- Хонгъю Рен: со-создатель GPT-4o, 4o-mini, o1-mini, o3-mini, o3 и o4-mini. Ранее возглавлял группу постобучения в OpenAI.
- Йохан Шалквик: экс- Google Fellow.
- Пей Сун: постобучение, кодирование и рассуждения для Gemini в Google DeepMind. Ранее был в Waymo.
- Цзяхуй Ю: со-создатель o3, o4-mini, GPT-4.1 и GPT-4.0. Ранее руководил командой восприятия в OpenAI и со-руководил мультимодальным в Gemini.
- Шенцзя Чжао: со-создатель ChatGPT, GPT-4, all mini models, 4.1 и o3. Ранее возглавлял синтетические данные в OpenAI.
*запрещенная организация в России.
_______
Источник | #blockchainRF
@F_S_C_P
-------
Поддержи канал подпиской
-------
WIRED
Here Is Everyone Mark Zuckerberg Has Hired So Far for Meta’s ‘Superintelligence’ Team
After a poaching frenzy that’s brought in talent from rival firms like OpenAI, Anthropic, and Google, Zuckerberg announced a team of nearly two dozen researchers in an internal memo.
👍3😁2🗿2❤1😱1
Андрей Карпатый, Nvidia и Meta о будущем ИИ-агентов.
Недавно вышли 2 интересные работы об агентных системах ИИ, которые дают разные перспективы на их развитие.
Первая работа от NVIDIA и Georgia Tech утверждает, что будущее агентного ИИ за малыми языковыми моделями (SLMs). Основная идея - для большинства повторяющихся специализированных задач огромные модели избыточны. SLMs, которые помещаются на обычный компьютер, могут эффективнее справляться с рутинными операциями, экономя ресурсы и деньги.
Вторая работа от Meta* проверяет, насколько хорошо современные ИИ могут воспроизводить научные результаты. Исследователи создали бенчмарк на основе соревнования по ускорению обучения GPT-2, где сообщество сократило время с 45 до 3 минут.
В результате даже лучшие модели (o3-mini, Claude 3.7, Gemini-2.5-Pro, DeepSeek-R1) восстанавливают менее половины улучшений, даже когда им дают подробные инструкции.
Исследователи выявили несколько ключевых проблем:
- Агенты часто не могут правильно реализовать даже описанные изменения
- Сложности с пониманием и применением новых техник
- Проблемы с отладкой собственного кода
- Трудности с оптимизацией производительности.
Получается , если большие модели не справляются с воспроизведением кода, как могут справиться малые?
Ответ в типах задач. NVIDIA говорит о простых повторяющихся операциях, а Meta тестирует сложное научное программирование с отладкой и оптимизацией. Это разные миры сложности.
Что это значит для нас?
1. Специализация работает, узкие модели для узких задач могут быть эффективнее универсальных
2. Автономность далека, даже с подробными инструкциями ИИ пока не может надёжно программировать
3. Будущее гибридное, вероятно, увидим системы из множества специализированных моделей разного размера.
Эти работы показывают, что путь к полноценным ИИ-агентам будет постепенным. Экономическая оптимизация через SLMs имеет смысл, но не стоит ожидать прорывов в сложных творческих задачах.
Интересный комментарий от Андрея Карпатого, он отмечает, что рекурсивное самоулучшение ИИ — это не внезапный скачок, а процесс, который уже идёт. От IDE до GitHub Copilot — мы постепенно автоматизируем всё больше.
При этом Карпатый напоминает: nanoGPT — это всего 750 строк учебного кода, а реальные системы в сотни раз сложнее.
Так что обе статьи правы - специализация неизбежна, но до автономных ИИ-исследователей ещё далеко.
*запрещенная в России организация.
_______
Источник | #blockchainRF
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney v7
Недавно вышли 2 интересные работы об агентных системах ИИ, которые дают разные перспективы на их развитие.
Первая работа от NVIDIA и Georgia Tech утверждает, что будущее агентного ИИ за малыми языковыми моделями (SLMs). Основная идея - для большинства повторяющихся специализированных задач огромные модели избыточны. SLMs, которые помещаются на обычный компьютер, могут эффективнее справляться с рутинными операциями, экономя ресурсы и деньги.
Вторая работа от Meta* проверяет, насколько хорошо современные ИИ могут воспроизводить научные результаты. Исследователи создали бенчмарк на основе соревнования по ускорению обучения GPT-2, где сообщество сократило время с 45 до 3 минут.
В результате даже лучшие модели (o3-mini, Claude 3.7, Gemini-2.5-Pro, DeepSeek-R1) восстанавливают менее половины улучшений, даже когда им дают подробные инструкции.
Исследователи выявили несколько ключевых проблем:
- Агенты часто не могут правильно реализовать даже описанные изменения
- Сложности с пониманием и применением новых техник
- Проблемы с отладкой собственного кода
- Трудности с оптимизацией производительности.
Получается , если большие модели не справляются с воспроизведением кода, как могут справиться малые?
Ответ в типах задач. NVIDIA говорит о простых повторяющихся операциях, а Meta тестирует сложное научное программирование с отладкой и оптимизацией. Это разные миры сложности.
Что это значит для нас?
1. Специализация работает, узкие модели для узких задач могут быть эффективнее универсальных
2. Автономность далека, даже с подробными инструкциями ИИ пока не может надёжно программировать
3. Будущее гибридное, вероятно, увидим системы из множества специализированных моделей разного размера.
Эти работы показывают, что путь к полноценным ИИ-агентам будет постепенным. Экономическая оптимизация через SLMs имеет смысл, но не стоит ожидать прорывов в сложных творческих задачах.
Интересный комментарий от Андрея Карпатого, он отмечает, что рекурсивное самоулучшение ИИ — это не внезапный скачок, а процесс, который уже идёт. От IDE до GitHub Copilot — мы постепенно автоматизируем всё больше.
При этом Карпатый напоминает: nanoGPT — это всего 750 строк учебного кода, а реальные системы в сотни раз сложнее.
Так что обе статьи правы - специализация неизбежна, но до автономных ИИ-исследователей ещё далеко.
*запрещенная в России организация.
_______
Источник | #blockchainRF
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney v7
Telegram
All about AI, Web 3.0, BCI
Small Language Models are the Future of Agentic AI
This position paper argues that small language models (SLMs), defined pragmatically as those runnable on consumer-grade hardware, are not only sufficient but superior for many agentic AI applications, especially…
This position paper argues that small language models (SLMs), defined pragmatically as those runnable on consumer-grade hardware, are not only sufficient but superior for many agentic AI applications, especially…
❤1🤔1
Состояние вычислительных мощностей ИИ: реальные цифры и тренды - свежий отчет.
Объемы инвестиций достигли критической массы. Microsoft, Google и Amazon инвестируют $255 млрд в ИИ-инфраструктуру в 2025 году. Meta* планирует построить дата-центр стоимостью $200+ млрд.
При всем шуме вокруг NVIDIA H100, он используется только в 0.55% всех исследовательских работ по ИИ.
Потенциал роста огромен, но пока большинство исследователей работает на более доступном оборудовании.
Специализация по задачам становится нормой. LLM-исследования концентрируются на AMD MI300/MI250, Huawei Ascend и NVIDIA H100/H200. Робототехника почти полностью перешла на NVIDIA Jetson. Универсальных решений больше нет.
Крупнейшие кластеры ИИ 2025 года:
1. JUPITER Booster (Германия): 24,000 GH200
2. Microsoft Eagle: 14,400 H100
3. Shaheen III (Саудовская Аравия): 2,800 H100
4. Meta: 2 кластера по 24,576 H100 каждый
Общий парк: ~500k H100 и ~111k A100 по всему миру. Meta планирует достичь 350k H100 к концу года.
Неожиданные тренды:
1. Впервые за 6 лет количество исследовательских работ, цитирующих ИИ-чипы, упало на 11%. Возможные причины-консолидация вокруг проверенных решений и рост коммерческих, а не академических проектов.
2. Рост стартапов. Cerebras, Groq, Graphcore и другие ИИ-стартапы показывают +19% роста упоминаний в исследованиях. Пока это капля в море, но тренд указывает на диверсификацию экосистемы.
3. Персидский залив становится новым центром ИИ-вычислений благодаря доступной энергии и капиталу. К 2026 году ожидается заметное присутствие кластеров ОАЭ и Саудовской Аравии в глобальной статистике.
Прогноз: к 2027 году глобальные ИИ-вычислительные мощности вырастут в 10 раз до эквивалента 100 млн H100.
Ведущие ИИ-компании будут контролировать 15-20% всех мировых мощностей каждая.
Эра "гаражных" ИИ-стартапов заканчивается. Входной билет в лигу создателей фронтирных моделей теперь стоит миллиарды долларов.
*запрещенная организация в РФ.
_______
Источник | #blockchainRF
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney v7
Объемы инвестиций достигли критической массы. Microsoft, Google и Amazon инвестируют $255 млрд в ИИ-инфраструктуру в 2025 году. Meta* планирует построить дата-центр стоимостью $200+ млрд.
При всем шуме вокруг NVIDIA H100, он используется только в 0.55% всех исследовательских работ по ИИ.
Потенциал роста огромен, но пока большинство исследователей работает на более доступном оборудовании.
Специализация по задачам становится нормой. LLM-исследования концентрируются на AMD MI300/MI250, Huawei Ascend и NVIDIA H100/H200. Робототехника почти полностью перешла на NVIDIA Jetson. Универсальных решений больше нет.
Крупнейшие кластеры ИИ 2025 года:
1. JUPITER Booster (Германия): 24,000 GH200
2. Microsoft Eagle: 14,400 H100
3. Shaheen III (Саудовская Аравия): 2,800 H100
4. Meta: 2 кластера по 24,576 H100 каждый
Общий парк: ~500k H100 и ~111k A100 по всему миру. Meta планирует достичь 350k H100 к концу года.
Неожиданные тренды:
1. Впервые за 6 лет количество исследовательских работ, цитирующих ИИ-чипы, упало на 11%. Возможные причины-консолидация вокруг проверенных решений и рост коммерческих, а не академических проектов.
2. Рост стартапов. Cerebras, Groq, Graphcore и другие ИИ-стартапы показывают +19% роста упоминаний в исследованиях. Пока это капля в море, но тренд указывает на диверсификацию экосистемы.
3. Персидский залив становится новым центром ИИ-вычислений благодаря доступной энергии и капиталу. К 2026 году ожидается заметное присутствие кластеров ОАЭ и Саудовской Аравии в глобальной статистике.
Прогноз: к 2027 году глобальные ИИ-вычислительные мощности вырастут в 10 раз до эквивалента 100 млн H100.
Ведущие ИИ-компании будут контролировать 15-20% всех мировых мощностей каждая.
Эра "гаражных" ИИ-стартапов заканчивается. Входной билет в лигу создателей фронтирных моделей теперь стоит миллиарды долларов.
*запрещенная организация в РФ.
_______
Источник | #blockchainRF
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney v7
www.stateof.ai
State of AI Report Compute Index
The State of AI Report Compute Index tracks the size of public, private and national HPC clusters.
🥱2❤1👍1
Экономика ИИ меняется: от подписок к оплате за результат. Низкая цена больше не гарантирует успех.
Исследование SemiAnalysis показывает структурные изменения в ИИ-индустрии на примере #DeepSeek , Anthropic , Google, OpenAI и др. конкурентов.
DeepSeek R1 предлагает цены в 10 раз ниже OpenAI ($0.55 vs $5+ за входные токены). Что привело к таким результатам:
- Трафик на собственной платформе падает
- Использование на сторонних сервисах растёт в 20 раз.
Причина - компания жертвует качеством обслуживания (25-секундные задержки, малое контекстное окно 64К) ради экономии ресурсов для исследований. Пользователи выбирают те же модели у других провайдеров с лучшими параметрами.
Новая математика эффективности
Anthropic столкнулась с дефицитом мощностей — скорость Claude упала на 40%. Но компания компенсирует это эффективностью - Claude использует в 3 раза меньше токенов для того же ответа
В результате, несмотря на 45 токенов/сек против 100+ у конкурентов, общее время ответа остаётся конкурентным.
Это меняет метрику успеха - важна не скорость генерации, а эффективность использования каждого токена.
Дефицит как новая реальность
Все игроки рынка ограничены вычислительными ресурсами:
1. DeepSeek: 10,000 GPU под санкциями
2. Anthropic: сделки с Amazon и Google на чипы
3. OpenAI и Google: борьба за доступные мощности.
Это создаёт разные стратегии оптимизации, где каждая компания выбирает свой компромисс между ценой, скоростью и качеством.
Переход к токенам как сервису
Растёт сегмент b2b-клиентов (Cursor, Perplexity, Replit), которые:
- Покупают токены для конкретных задач, а не общие подписки
- Легко переключаются между провайдерами
- Оптимизируют использование под свои нужды
Это фундаментально меняет экономику: от фиксированных месячных платежей к переменным затратам на "единицы мышления".
Практические выводы:
Цена токена — результат технических компромиссов, а не показатель эффективности технологии.
Специализация побеждает универсальность: инструменты для конкретных задач (кодирование, поиск) востребованнее общих чат-ботов.
Open source как обход ограничений: китайские компании открывают код, чтобы западные провайдеры тратили свои ресурсы на хостинг.
Эффективность важнее скорости: модели, решающие задачи с меньшим количеством токенов, получают преимущество.
В новой экономике ИИ успех определяется не ценой за токен, а способностью доставить результат с оптимальным балансом скорости, качества и стоимости.
_______
Источник | #blockchainRF
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney v7
Исследование SemiAnalysis показывает структурные изменения в ИИ-индустрии на примере #DeepSeek , Anthropic , Google, OpenAI и др. конкурентов.
DeepSeek R1 предлагает цены в 10 раз ниже OpenAI ($0.55 vs $5+ за входные токены). Что привело к таким результатам:
- Трафик на собственной платформе падает
- Использование на сторонних сервисах растёт в 20 раз.
Причина - компания жертвует качеством обслуживания (25-секундные задержки, малое контекстное окно 64К) ради экономии ресурсов для исследований. Пользователи выбирают те же модели у других провайдеров с лучшими параметрами.
Новая математика эффективности
Anthropic столкнулась с дефицитом мощностей — скорость Claude упала на 40%. Но компания компенсирует это эффективностью - Claude использует в 3 раза меньше токенов для того же ответа
В результате, несмотря на 45 токенов/сек против 100+ у конкурентов, общее время ответа остаётся конкурентным.
Это меняет метрику успеха - важна не скорость генерации, а эффективность использования каждого токена.
Дефицит как новая реальность
Все игроки рынка ограничены вычислительными ресурсами:
1. DeepSeek: 10,000 GPU под санкциями
2. Anthropic: сделки с Amazon и Google на чипы
3. OpenAI и Google: борьба за доступные мощности.
Это создаёт разные стратегии оптимизации, где каждая компания выбирает свой компромисс между ценой, скоростью и качеством.
Переход к токенам как сервису
Растёт сегмент b2b-клиентов (Cursor, Perplexity, Replit), которые:
- Покупают токены для конкретных задач, а не общие подписки
- Легко переключаются между провайдерами
- Оптимизируют использование под свои нужды
Это фундаментально меняет экономику: от фиксированных месячных платежей к переменным затратам на "единицы мышления".
Практические выводы:
Цена токена — результат технических компромиссов, а не показатель эффективности технологии.
Специализация побеждает универсальность: инструменты для конкретных задач (кодирование, поиск) востребованнее общих чат-ботов.
Open source как обход ограничений: китайские компании открывают код, чтобы западные провайдеры тратили свои ресурсы на хостинг.
Эффективность важнее скорости: модели, решающие задачи с меньшим количеством токенов, получают преимущество.
В новой экономике ИИ успех определяется не ценой за токен, а способностью доставить результат с оптимальным балансом скорости, качества и стоимости.
_______
Источник | #blockchainRF
@F_S_C_P
▪️Генерируй картинки в боте:
Flux + MidJourney v7
SemiAnalysis
DeepSeek Debrief: >128 Days Later
SemiAnalysis is hiring an analyst in New York City for Core Research, our world class research product for the finance industry. Please apply here It’s been a bit over 150 days since the launc…
🤔4❤3🤷♂2🔥1