MaxRepost

0:49

0:18

can you use whatever resources you like, and python, to generate a short 'youtube poop' video and render it using ffmpeg ? can you put more of a personal spin on it? it should express what it's like to be a LLM

claude opus 4.6:

🤯6

249 views21:56

Forwarded from Мысли Рвачева

📊 ARK выпустили Big Ideas 2026 - ежегодный обзор технологических трендов от фонда Cathie Wood

Несколько цифр из отчета, которые стоит знать:

Стоимость инференса за год упала на 99%. Спрос на вычисления на OpenRouter вырос в 25 раз с декабря 2024. Когда интеллект дешевеет почти до нуля - рынок взрывается уже не на уровне разговоров, а на уровне реального использования.

Вложения в дата-центры в 2025 - около $500 млрд. К 2030 ARK ждет $1,4 трлн. Это не бум моделей, это гигантский цикл перестройки инфраструктуры.

AI-агенты за год научились надежно выполнять задачи в 5 раз длиннее - с 6 до 31 минуты человеческой работы. Стоимость кодинга упала на 91% за 8 месяцев: с $3,50 до $0,32 за миллион токенов.

Путь к покупке схлопывается с часа до 90 секунд. К 2030 AI-агенты могут проводить $8+ трлн онлайн-покупок и забирать 25% мировых онлайн-продаж. Доля AI search вырастет с 10% до 65% трафика.

Cursor перевалил за $1 млрд ARR. Harvey, OpenEvidence, Sierra - около $100 млн. Рынок платит уже не за "доступ к модели", а за готовые вертикальные решения.

В фарме искусственный интеллект может снизить стоимость вывода лекарства в 4 раза, с $2,4 млрд до $0,7 млрд. К 2030 около трети одобренных FDA диагностических систем будут AI-powered.

Геополитика: китайские модели отстают от американских примерно на 6 месяцев, но упираются в железо - TSMC производит в 38 раз больше вычислительной мощности, чем SMIC. Лидерство в искусственном интеллекте - это уже не алгоритмы, а доступ к чипам, фабрикам и энергии.

Искусственный интеллект уже не опция. Это новый базовый слой бизнеса.

https://www.ark-invest.com/big-ideas-2026

#ai #arkinvest #cathiewood

—————————
Мысли Рвачева
—————————

❤1

273 views23:19

can you use whatever resources you like, and python, to generate a short 'youtube poop' video and render it using ffmpeg ? can you put more of a personal spin on it? it should express what it's like to be a LLM claude opus 4.6:

Futuris

0:30

Media is too big

Ну и немного подправив промпт и дав линк на мой сайт amyote.com получаем еще более отлетевшую историю.

@maxrepost - subscribe and destroy!

❤6😱1

295 views23:26

Harry Potter by Balenciaga (2026)

Тем временем мем про Гарри Потера и Баленсиагу превратили в крутейшую короткометражку. https://www.youtube.com/watch?v=gtnt84CDP-s

@maxrepost

YouTube

Merch: https://demonflyingfox.com/
Spotify: https://bit.ly/4afQdkm
Patreon to support this channel: https://www.patreon.com/user?u=87233464
Instagram: https://www.instagram.com/demonflyingfox

286 viewsedited 10:05

Forwarded from Data Secrets

0:36

Google назвали свое новое здание в Лондоне «Platform 37» – в честь 37 хода AlphaGo в партии против Ли Седоля

Напоминаем, что победе ИИ над Седолем на днях исполнилось ровно 10 лет

Скоро в здании, кстати, откроется The AI Exchange – общественное пространство, где будут проходить бесплатные открытые мероприятия, лекции и выставки, посвященные ИИ

260 views13:26

Интенсив по агентскому кодингу

Я тут вписался в интересную историю. Мы с ребятами из Guide DAO много обсуждали как я за два года прошел путь от Python до крейзихаотик вайбкодинга и потом к архитектурному low-Vibecoding. В итоге придумали сделать курс.

🚀 Интенсив по вайбкодингу в стиле AI-JTBD: сделай нормальный продукт с нуля за 8 недель.

Стартует все 15 марта. За 8 недель пройдём путь от гипотезы и JTBD до релиза MVP с AI-фичами. По дороге будем изучать грабли и ловушки.

Кому: фаундерам, разработчикам, дизайнерам и тем, кто хочет быстро проверять идеи кодом, минуя найм команды.

Как устроено: 8 недель, живые стримы, домашки с обратной связью. И экспериментальный agent-тьютор.

Каждый модуль — видимый результат:
— Прототип в AI-песочнице → CRUD → регистрация → агентные функции → тесты → деплой.
— Итог: готовый веб-сервис (mobile/desktop) и навык «придумал → сделал → запустил».

По промокоду LIFECHANGE скидка -40% на guidedao.xyz до 15 марта

📍 Ссылка для записи в боте: @GuideDAO_hallo_bot (пришлём за 5 минут).

www.guidedao.xyz

Авторский курс: собираем продукт от JTBD (Jobs To Be Done) и PRD до релиз-ready MVP с mobile- и desktop-потоком, данными, AI-фичами и управляемым релизом.

❤3💊1

267 views13:49

An important update on our team

Forwarded from Quantum Quintum (Constantin Kichinsky)

+1

Atlassian: у нас все хорошо, бизнес растет, но все растут еще больше. Нам нужно большее ИИ и больше сейлзов. Поэтому сокращаем 10% (1600 чел). Посмотрете видео-послание CEO. Через 20 минут сова принесет письмо, если вас уволили.

Work Life by Atlassian

I’m sharing some important news today. I have made the incredibly difficult decision to reduce the size of our team...

248 views16:27

Forwarded from Futuris (Anton)

1:07

⚡️Google выкатил крупнейшее обновление Карт за 10 лет. Классический поиск отправлен на свалку — теперь прямо внутри навигатора живет ИИ Gemini, который к тому же помнит историю твоих поездок.

Вместо вбивания точного адреса теперь можно общаться промптами: «найди по пути заправку со свободной электрозарядкой, где варят нормальный кофе и есть чистый туалет, чтобы не делать крюк в десять километров». ИИ сам перелопатит сотни свежих отзывов, учтет твои привычки и бесшовно встроит идеальную остановку в маршрут🧐

Сами карты тоже перерисовали (Immersive Navigation). Плоский вид сверху заменили на объемный 3D-рендер с прозрачными зданиями, точной разметкой полос, эстакадами и светофорами. А роботизированные подсказки озвучили живым человеческим голосом: навигатор больше не чеканит «через 300 метров направо», а подсказывает как пассажир на соседнем сиденье: «сразу за развязкой уходи в правый ряд».

Надеюсь, ИИ-галлюцинации нам не придется ощущать физически, когда нейронка уверенным голосом проложит живописный 3D-маршрут прямо в реку🚘 Хочется верить, что сервис будет реально удобнее, но на всякий случай — пристегивайтесь👮‍♂️

Please open Telegram to view this post

VIEW IN TELEGRAM

⚡2

264 views19:34

Я за последний год в проектах сильно перешел на Google Gemini стек. Легкий вход. Бонусы для разработчиков. Приятная документация. Но. Когда начинается не экспериментальная и тестовая жизнь, а хардкорный продакшн, то становится все менее весело. Модели часто тупят или лежат. Я решил поресечить эту тему.

Вот, что выяснилось. Когда все хорошо, gemini 2.5 — моя рабочая лошадь впереди. Независимые замеры Artificial Analysis показывали, что у Gemini 2.5 Flash output speed около 216.9 токенов/с, у GPT-4.1 — около 83.9 токенов/с, у Claude 4 Sonnet — около 42.7 токенов/с. Но по incident tracking у Anthropic в начале марта 2026 был целый букет сбоев по Sonnet / Haiku / Opus и таймаутам API, у Google был подтверждённый инцидент Vertex Gemini global endpoint на 1 час 58 минут 27 февраля 2026 и еще цепочка поменьше. У OpenAI нет инцидентов в этом году и публичная 90-day API availability всё ещё выше — 99.76% против 99.4% у Claude API и мутных цифр у Google.

Вывод тут такой. Видимо в серьезном продакшене для клиентов, да и для себя сегодня нельзя сидеть на одном поставщике API и придется делать фолбэки на разные модели от разных провайдеров.

@maxrepost

👾

Please open Telegram to view this post

VIEW IN TELEGRAM

267 viewsedited 20:03

Forwarded from Сиолошная

Cursor написали в своём блоге о том, как отслеживают качество моделей в написании кода. Они используют гибридный онлайн-офлайн процесс.

Оффлайн — это обычный бенчмарк на внутреннем наборе тестов, основанном на сессиях работы инженеров компании. В среднем решение требует гораздо больше строк кода в решении, нежели публичные бенчмарки: изменение 352 строк в ~8 файлах.

Сравнение с другими бенчмарками приведено на второй картинке — откуда также видно, что входное описание куда короче других бенчмарков, то есть в промпте не прописывают каждую маленькую деталь (но детали прописаны в рубрике для автоматической проверки).

Онлайн-часть — это контролируемый анализ на реальном живом трафике. Такие онлайн-оценки помогают выявлять регрессии, например, когда результат работы агента выглядит правильным для проверяющего, но воспринимается хуже самим разработчиком, использующим продукт.

Онлайн-оценка позволяет измерить, действительно ли улучшения помогают разработчикам на практике. Cursor отслеживают набор высокоуровневых прокси-метрик (косвенных показателей) результативности агента на основе действий пользователя.

Онлайн и офлайн бенчмарк очень скоррелированы и имеют одинаковое ранжирование моделей (третья картинка) — в топе GPT-5.4, чуть ниже Opus 4.6 на уровне с GPT-5.2, а собственная модель компании Composer 1.5 обходит Sonnet 4.5 (при том что она гораздо быстрее за счёт инференса на чипах Cerebras).

Приятно удивлён, что пользователи Cursor так высоко оценивают модели OpenAI — но ещё здорово и то, что они требуют меньше токенов для решения задач.

Задачи CursorBench решаются в рамках одной сессии, но компания ожидает, что в течение следующего года подавляющее большинство задач по разработке будет передано агентам с длинным горизонтом планирования, работающим на своих собственных мощностях где-то в облаке — и бенчмарк придётся адаптировать к этому.

243 views23:20

Мой тейк про ai-нэйтив компании мощно залетел в LinkedIn и меня позвали выступить на программе для фаундеров, руководителей и профессионалов, которые понимают, что AI — это уже не «ещё один инструмент», а новая операционная среда для бизнеса. Для тех, кто готов не обсуждать перемены, а перепроектировать под них компанию, продукт и процессы или вообще строить все с нуля.

Набор спикеров на русском языке реально крутой. Это не кружок теоретиков: среди них фаундеры с сотнями миллионов долларов ARR и лидеры AI-направлений в больших организациях и маниакальные стартаперы.

О чём будем говорить и что делать руками:
почему модели улучшаются быстро и вполне предсказуемо;
почему агент — это уже не софт, но ещё не сотрудник, а значит менеджменту пора немного напрячься;
как устроена AI-native компания на уровне архитектуры, процессов, доступа к данным и безопасности;
почему контекстная инженерия — это дисциплина, а не шаманство;
как выглядит новая оргструктура, agent-to-agent коммуникация и экономика намерений;
как провести аудит процессов, собрать карту AI-трансформации и понять, что строить самим, а что лучше не собирать на коленке.

Но главное — воркшопы. Без ритуального восторга, без слайдов ради слайдов. С практикой, разбором и нормальной работой руками.

Среди ведущих:
Александр Поваляев — персональная AI OS и переход к командной;
Дима Ханарин — фреймворк AI-трансформации компании до конца года;
Виталий Клебан — агенты, которые улучшаются автономно;
Даниил Кравцов — knowledge graph и data pipeline с AI-агентами для enterprise;
Витя Тарнавский — внедрение собственных LLM в корпорации;
Байрам Аннаков — автоматизация inbound/outbound продаж на AI-агентах;
Рома Бузько — AI в юридических процессах: compliance, контракты, регулирование;
Сева Устинов — трансформация команды в AI-first и продукт-агент.

Я расскажу про AI-контент для бизнеса без слопа: pipeline и верификация

Старт через 10 дней.
Регистрация тут.

❤5👍5😁1

219 viewsedited 08:51

Forwarded from запуск завтра

Гендир Shopify (а это, на минутку, главная платформа для интернет-магазинов в мире, 7500 сотрудников, капитализация 160 миллиардов долларов), взял autoresearch Карпатого и своими руками запустил его на liquid — систему шаблонизации магазинов на Shopify.

Система провела 120 автоматизированных экспериментов в попытке ускорить загрузку страниц. В результате получился PR (пул-реквест, омоним пиара) на 93 коммита.

Нейросеть ускорила загрузку страниц в два раза. Тони признает, что там есть overfitting, когда страница оптимизирована под конкретный тест, но есть и куча хороших идей, о которых они раньше не думали. И это не вайбкодинг, а полностью автоматизированная разработка софта под конкретную метрику, причем на кодовой базе, которую 20 лет писали руками очень хорошие программисты. Всё в open source, можете посмотреть сами.

В общем, если у тебя есть конкретное число и механический способ что-то поменять в системе и измерить изменение этого числа — то нейросеть может его оптимизировать. Ребята заопенсорсили всю свою обвязку, pi-autoresearch. Описываешь ей свою задачу, метрику, как запустить код и дальше всё работает самостоятельно.

Интересно, что в очередной раз речь идет о проекте, щедро покрытом тестами (у liquid 974 юнит теста). Вот мы с Федей всю жизнь кричим о важности тестов, и внезапно это оказалось даже полезнее для нейросетей, чем для людей.

Тони, конечно, не стандартный CEO крупной компании и раньше что-то прогал, но в ноябре, с появлением крутых нейросетей, количество его коммитов выросло в разы.

Мы тоже активно экспериментируем с этими подходами, если есть похожие задачки — обращайтесь!

187 views11:32

krasnaya_devyatka_v4.mp4

81.5 MB

А теперь я попросил его сделать клип на трек «Красная девятка» NSFW.

Честно говоря, получилось не очень, хотя идея агента написать на питоне игру и покадрово ее «снять» достаточно смешная — почти «world model есть у нас дома».

Вечером дам ему ключ на Fal.ai и лимит токенов и вернусь к вам с апдейтом. 😁

@maxrepost

👾

Please open Telegram to view this post

VIEW IN TELEGRAM

203 viewsedited 12:04

krasnaya_devyatka_v4.mp4

krasnaya_devyatka_v5.mp4

75.7 MB

Пока ключа в FAL.ai не было, агент решил что стриминг самописной игры хорош, но не идеален и предложил сгенерить прям в Antigravity картинок и улучшить клип. Ну почему бы и нет. В эфире второй эпизод сериала про красную девятку.

UPD. У меня спрашивают, Леша, а почему этот дикий трек? Ну тут две причины - нужны были простые и понятные для ai-агента слова + четкий ритм для монтажа.

@maxrepost 👾

👍1

186 viewsedited 13:12