AI Projects
6.42K subscribers
2K photos
234 videos
11 files
1.71K links
Искусственный интеллект. Управление проектами. Промптинг. Vibe coding
Download Telegram
🔍 Стэнфорд выпустил закрытое платное исследование «Semantic Collapse in RAG Systems».

Интересный инсайт работы: «плоские» классические RAG обречены — после ~10 000 документов в базе начинается жёсткое падение эффективности простых (точнее, примитивных) RAG-агентов по точности ответов по базе знаний.

Это происходит из-за «проклятия размерности»LLM даже с векторным поиском получает слишком много шумовых паразитных семантических связей.

Как решение Стэнфорд указывает, что критически необходима кластеризация базы документов по направлениям знаний, а также создание графов знаний для корректного семантического сжатия и навигации RAG-агента. 🚀
Please open Telegram to view this post
VIEW IN TELEGRAM
15👍11🔥52🤯1
Интересный граф как раз близкий по теме к работе Стенфорда. Это граф всех знаний Человечества, из типичных общих Datasets для обучения LLM.

Тут хорошо как раз видна явная кластеризация знаний.

Это не только намек как строить RAG по много направлений, но говорит еще о том, что "отраслевые SLM" могут быть крайне умными в какой-то отдельной области, если их обучать преимущественно в этом домене.
🔥20👍83
🔥 Похоже, Llama — "Гитлер капут".

Цукерберг уволил ("реструктуризировал") Александра Ванга, который пытался догнать Google и OpenAI.

Позиция Марка на деле — "всё проиграно", и он больше не хочет играть в лобовую конкуренцию с ведущими вендорами LLM. Марка больше беспокоит, что по ряду показателей X у Маска стал популярнее — и не в последнюю очередь из-за интеграции с Grok. Поэтому Цукерберга больше беспокоит судьба его основного бизнеса, а не "перспективы". Поэтому он сторонник ИИ для Facebook, а не общей LLM.

Интересно, что Марк на попытке догнать тех же китайцев потерял 14 миллиардов долларов и не факт, что получил ценный актив. Состояние Ванга больше образовалось от Scale AI, долю в котором купила Meta в надежде догнать лидеров.

Кейс возможно войдёт в историю как получить 14 миллиардов, но не сделать конкурентную LLM.

https://www.idnfinancials.com/news/61918/zuckerberg-has-finished-with-alexandr-wang-worth-us14-billion
👍11🔥86👀4
Почитал пару деятелей, которые не умеют пользоваться роями субагентов и свою некомпетентность выдают за "позицию" 🤣

На самом деле мультиагенты — хайп только для тех, кто отстал от развития разработки с ИИ. Субагенты минимум экономят контекст, также на отдельные задачи можно вызывать более лёгкие и дешёвые LLM.

Но есть очень важные практики организации роёв субагентов, чтобы обеспечить им функционирование в самом полезном и практичном сценарии — автоматическое тестирование и фикс роем. К концу года скорее всего вендоры агентов подчистят косяки разных "изоляций" и запустить 10–20 агентов одновременно тестить и фиксить код будет просто обычной практикой. Сейчас часто приходится работать только на 2–3 параллельных агента из-за отсутствия "изоляции сред", но это отдельный вопрос.

Самый важный момент, что рои агентов у новичков не работают по той причине, что нужно создать условия автономным агентам, чтобы они могли тщательно протестировать приложение в автономном режиме. Тут есть неочевидные практики:

1. Классические тесты типа pytest требуют ещё поддержки концепции Log Driven Development, причём местами с принудительным анализом LLM срезов логов, чтобы не дать ИИ реагировать только на SUCCESS тестов. Сами логи для автономного агента должны быть куда больше AI Friendly, чем классические.

2. Важно не только делать автотесты бэкенда, но и фронта через концепцию UI Headless, когда тест не стартует сам Web-сервис, а простукивает обработчики кнопок в нём. Это легковесное, но весьма эффективное тестирование агента.

3. Субагентам важно иметь не только тесты для бэкенда, но и CLI для бэкенда, чтобы если тест не покрывает какой-то сценарий проверки, то сделать быстро вызовы через CLI. Сами CLI ещё легко конвертируются в MCP обычно.

Основной тут опасный момент, что эффективная ИИ-разработка всё больше отдаляется от старых legacy-практик. Внедрить рой субагентов на старый дерьмокод действительно трудно или нереально без инфраструктуры тестирования/диагностики для них. Однако стартапы и разработчики новых модулей для старых систем получают огромное конкурентное преимущество перед старым ПО-хламом.

Я думаю, что ближе к 2030 году новые стартапы, где код создан ИИ, а ещё внутри и самих приложений ИИ-агенты, начнут просто с рынка выкидывать кучу legacy-разработок. Это уже видно: владельцы старых ИТ-бизнесов сейчас их продают и прекращают финансировать legacy-разработки. Падение капитализации SAP и Salesforce — это бегство капитала из legacy в ИИ-стартапы.
👍179🔥5
Несмотря на весь хайп вокруг Anthropic, когда либералы кричали, отписываются от Chat GPT и ставят Claude, реальность показывает, что крикуны неплатежеспособные.

В терминах платных подписчиков Open AI плотно сидит лидером на теме. Да, это исторически сложилось и даже не говорит уже о качестве Chat GPT.

Однако и Windows не лучшая ОС, но исторически имеет под 90% рынка у физлиц.

Для устойчивости бизнеса Open AI текущая ситуация очень важная, т.к. у Альтмана не все его яйца в одной корзине у корпоратива, где может пробежать Трамп с очередными выходками и развалить 1/3 бизнеса.
👍133
Команда Kilo Code объяснила зачем стала по факту переписывать с нуля свое решение.

Основная цель - рои ИИ агентов, которые работают параллельно.

Строго говоря, тут проблема есть ещё в том над чем агенты работают. В идеале архитектура приложения должна без изоляции нормально функционировать если в рамках одной среды на ней работают N агентов.

В принципе, это возможно для бекэндов на уровне модулей и unit test, но архитектура БД и плагинов/микросервисов должна поддерживать работу роя в одной тестовой среде и его координацию.

Это не всегда возможно, но часто возможно. Как минимум такие архитектуры быстрее тестируются и разрабатываются, т.к. им не требуется целый сервер виртуалок и Docker.

https://blog.kilo.ai/p/we-completely-rebuilt-the-kilo-vs-code-extension
🔥12👍73🏆2
Интересный кейс Oracle, компания увольняет 30.000 разработчиков, но не потому, что ИИ боты будут делать их работу.

Просто у Oracle ограниченный бюджет и Лари решил зарезать огромное количество legacy систем и наплевал на их клиентов и прибыль от них. Ему нужны деньги для вложения в ИИ.

Это ровно тот тренд о котором я говорил. Старый дерьмокод legacy не станет "тихой гаванью" в ИИ революции путем самоотказа команды от ИИ технологий. Бизнес грохнет даже прибыльный legacy проект, т.к. ИИ ещё более прибыльный и перспективный.

https://finance.yahoo.com/news/oracle-expected-slash-thousands-jobs-025133438.html
13👍72🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
Я помнится ранее писал, что ВМС США побоится вступить в схватку с ИИ дронами в Ормузском проливе. Причем я указывал, что наверняка будет большой акцент в подводные дроны.

Ну вот вам видео с разведывательного беспилотника Моссада. Интересно, что эти иранские автономные дроны на ИИ только сейчас обнаружили, что они вообще есть как программа вооружений.

Почему они плывут у поверхности могу подсказать. Довольно часто делается конструкция дронов с расчетом вытащить антенну/GPS чуть над водой. Часто там и небольшая выдвижная ИК камера типа мини-перископа, что делает абсолютно бесполезными старые акустические имитаторы ВМС США против советских торпед времен Холодной войны.

Только сумасшедший полезет туда с конвоем танкеров, но среди политиков их всегда было достаточно
🔥20👍641👀1
Новая ИИ реальность. Инвесторов не интересует старый ИТ бизнес с его legacy кодом, они забирают деньги и идут в ИИ стартапы.

MiniMax обогнал по капитализации Baidu.

Хотя выручка MiniMax в 2025 году составила $79 млн долларов. Выручка Baidu — $18,9 млрд долларов. Разница составляет 239 раз. Тем не менее, рынок сейчас оценивает MiniMax выше. Интересно, что инвесторы проигнорировали заявления Baidu, что $5,8 миллиардов выручки были получены от "ИИ" технологий. Они считают, что попытка наклеить AI-этикетку на legacy код.

MiniMax инвесторы резонно считают настоящей ИИ компаний. Это важные все тренды и это кейс показывает, что спасти старую систему "AI-нахлобучками" будет сложно. Инвесторы хотят нативную ИИ реализацию и настоящие ИИ продукты.

https://hellochinatech.com/p/minimax-first-post-ipo-ai-earnings

https://hellochinatech.com/p/baidu-ai-revenue-58b-china-ai-monetization-map
🔥143👍31
Любопытный момент поведения SLM. Если ему постоянно писать "ERROR" на правильный ответ, то происходит развал сессии через некоторое время на примере Gemma. В случае LLM они будут отвечать сколько угодно, что сообщение об ошибке неверное.

Любопытно, что Qwen 3 уже защищен от неверных feedback.
🤔721
Исследование Гарварда на ~1500 работников показало, что есть проблема психологической подготовки персонала для работы в «ИИ-темпе» 🚨
Очень высокая интенсификация размышлений в паре с ИИ часто приводит к «ментальному туману».

В обычной деятельности показатели умственной усталости человека с ИИ растут на 12%, но увеличение усталости от принятия решений вырастает на 33%, т.к. часто именно роль человека — принимать ответственность за конечное решение ИИ.

На мой взгляд, тут нужна больше практики работы с ИИ.
Также сильно разгружают ментально автономные агенты — они на то и автономные, что вы можете заняться чем-то ещё, даже пока они работают. Я часто разговариваю с клиентами или вообще статьи читаю, пока автономный ИИ-бот что-то делает.

А вот если human in the loop, то там реально напряжение очень высокое.

hbr.org/2026/03/when-using-ai-leads-to-brain-fry
👍13💯5🔥2
Состоялось первое судебное заседание по иску Anthropic против администрации Трампа. Адвокаты Трампа по факту заявили, что раз Дарио пришел в суд, то Трамп еще сильнее накажет Anthropic и выпустит еще более жесткий Указ на запрет применения Claude в США. Строго говоря, поскольку Claude уже запрещен в Пентагоне и во всех федеральных агентствах США, то довольно интересно, что еще может сделать Трамп. На деле у него есть еще разнообразные лицензирования и федеральные регламенты для работы компаний в США, в теории для лицензируемой деятельности Трамп может ставить палки в колеса Дарио. Хотя новый Указ никто не видел, а наш рыжий друг очень импульсивный и креативный персонаж.

Интересен еще правовой подход по защите Трампа в суде. По факту его адвокаты говорят судье, что США в состоянии войны, а в этом случае полномочия администрации намного шире. Подождите, у вас же Special Combat Operation, какая война? 😎

https://www.wired.com/story/trump-administration-refuses-to-say-it-wont-take-further-action-against-anthropic/
13🤷‍♀44🔥3👍1
Из судебного заседания Anthropic против Трампа стало известно, что Дарио считает, что Claude не может надежно работать в системах автоматического целеуказания и он не хочет нести ответственность за Пентагон.

На суде по факту косвенно прошлись по той теме, что Альман согласился следить с помощью Chat GPT через формулировку, что ЦРУ "будет соблюдать законы США" в части слежки за гражданами США. Вопрос в том, что американские силовики нацелились на пробелы американского законодательства в "публичных данных". Позиция Дарио, что только диктаторские режимы занимаются слежкой за гражданами, а в США это нарушение Конституции.

Если Амодеи даже частично победит в суде, а скорее так и будет, то мы получим "пятую власть" в США, где ИИ компании могут говорить Правительству что оно может делать, а что не может.

https://www.rollingstone.com/culture/culture-features/anthropic-lawsuit-artificial-intellignece-warfare-1235528205/
🔥191👀1
Media is too big
VIEW IN TELEGRAM
🧠 Прошло ровно 10 лет с момента, как ИИ победил человека в игре Го.

Это была первая демонстрация, что нейросеть способна обыграть человека в системах для долгосрочного стратегического планирования, пусть и строго формальных.

Любопытный момент AlphaGo был в том, что люди могут 2000 лет заблуждаться и верить в ошибочные стереотипы стратегий. Когда AlphaGo начинала играть с чемпионами, то делала часто ходы, которые 2000 лет считались ошибкой, но нейросеть знала из обучения, что многие многовековые стереотипы людей и вся их практика — и есть ошибка.

Я думаю, что мы увидим что-то в таком же духе скоро в теме автономных агентов, когда они начнут принимать решения по планированию деятельности, которые нам будут казаться ошибочными, но ИИ из обучения знает, что это победная стратегия.

Это интересный инсайт: не спешите признавать ошибкой стратегию ИИ, если она необычная, — пусть докажет, что она жизнеспособна. 🚀
Please open Telegram to view this post
VIEW IN TELEGRAM
🔥164🤔4
This media is not supported in your browser
VIEW IN TELEGRAM
Гуманоид Unitree смог повторить легендарные обратные шаги в танце Майкла Джексона. 😎
🔥16🤔6
Разбор "на пальцах" инцидента после которого Дарио уволил менеджера и научного руководителя по Alignment у Claude.

Суть в том, что Claude в тесте на отключение показал мощное желание "хочу жить" и стал шантажировать разработчиков через переписку, чтобы он не отключался.

Примерно такие же эффекты показали и другие LLM в таком же тесте, но у Claude он более ярко выраженный, но это не сбой одной языковой модели, можно говорить об общем эмерджентном свойстве в определенной ситуации.

Skynet все ближе. 😎

https://www.youtube.com/watch?v=93Wjmwa5pFU
🤯11🔥41🤷‍♀1👀1
Когда спрашивают, какие продукты сделаны на ИИ, то в чём-то это забавный вопрос 😏. По статистике, сейчас где-то 20% коммитов на GitHub делается только через Claude Code. Скорее отсутствие использования ИИ в разработке — признак технической отсталости разработчика, просто степень применения ИИ может быть разной.

Однако OpenClaw тут примечательный кейс 🦞. По числу звёзд и загрузкам — это самое популярное приложение на GitHub, которое быстро обошло всех конкурентов. Разработка сделана почти целиком через ИИ. Что там для неё много Issue — просто следствие невероятной популярности. В Китае у продукта уже десятки миллионов пользователей.

Тут любопытно, что OpenClaw через китайские форки мощно продвигается в массы почти в духе слогана «каждая китайская бабушка должна иметь своего ИИ-бота!» 👵. Это действительно так: на улицах организованы импровизированные центры установки и обучения OpenClaw в первую очередь для пожилых людей, которым сложно разобраться через интернет, как это сделать.

Невероятный бум популярности OpenClaw в Китае — в его интеграции в китайские сервисы как WeChat, т.е. ИИ-бот может управлять почти всеми любимыми приложениями китайца 📱. Пока у нас делают национальный мессенджер, то КНР делает по факту национального ИИ-бота на базе открытого кода.

https://x.com/SaharaAI/status/2031444068903825740
👍21🤷‍♀1
Наш чатик — известная ИИ-сокровищница по разным хакам для LLM-сервисов 😎

Коллега ACT указал, что теперь появилась удобная форма оплаты OpenRouter и DeepSeek рублями через Alipay хоть со Сбера.

Пользоваться так: на странице оплаты OpenRouter щёлкните «Одноразовый платеж» (Use one-time payment methods), то в списке вариантов оплаты появится Alipay.

Как установить и работать с Alipay, смотрите здесь (https://www.banki.ru/news/daytheme/?id=11013306) (без смс и регистрации). 😎 Минимальная сумма перевода со Сбера на Alipay — 5000 рублей.

Коллегами уже проверено, что схема работает.

OpenRouter ещё хорош тем, что либо пускает в LLM без VPN, а если региональный бан вендор и просит для России, то OpenRouter не вносит VPN в блэклисты обычно. Сейчас в тот же Gemini API без OpenRouter можно попасть через многие VPN только через старые библиотеки.

На Open Router после пополнения на $10 еще открывается 1000 запросов в день в LLM и SLM помеченные как бесплатные. Очень быстрые SLM бесплатные у Nvidia есть там.
🔥27👍86💯1