— Юра взял «скучную» нишу с готовым спросом → сначала печальные $100/мес, через год уже ~$10K/мес
— Денис сделал Telegram-игру в одиночку на основе AI → ~ $1500 за 1,5 месяца после запуска
— Аня без кода запустила AI-бота для изучения английского → первые ~$200 уже в 1 месяц
Разные результаты. Разный масштаб. Но общие правила:
1. не придумывать «гениальную идею», а брать существующий спрос
2. делать простой MVP и быстро запускаться
3. докручивать монетизацию и продукт по факту использования
Ребята сделали всё без команды, без инвестиций, а самое главное — без ожидания «идеального момента». Да, не у всех получается сразу. И не у всех выходит на $10K. Но если системно идти по схеме выше — появляется первый доход с продукта, а дальше уже есть что масштабировать.
В комьюнити разбираем такие кейсы регулярно: @its_capitan. Что сработало, что нет, и почему.
Реклама: ИП Зуев Игорь Владимирович, ИНН: 360408359441, Erid: 2VtzqusRoPF
Please open Telegram to view this post
VIEW IN TELEGRAM
😁5🥴4🗿3👌2😴2❤1
SpaceX подписала соглашение с open-source AI-стартапом Reflection AI на сумму до $6,3 млрд до 2029 года.
Reflection получит немедленный доступ к чипам Nvidia GB300 в дата-центре Colossus 2.
Платежи начнутся 1 июля 2026 года и составят $150 млн в месяц.
При этом любая из сторон сможет расторгнуть соглашение с уведомлением за 90 дней после первых трёх месяцев.
Также SpaceX уже заключила compute-соглашения с Anthropic, Google и Cursor.
Reflection получит немедленный доступ к чипам Nvidia GB300 в дата-центре Colossus 2.
Платежи начнутся 1 июля 2026 года и составят $150 млн в месяц.
При этом любая из сторон сможет расторгнуть соглашение с уведомлением за 90 дней после первых трёх месяцев.
Также SpaceX уже заключила compute-соглашения с Anthropic, Google и Cursor.
🔥14❤2👍2
Anthropic вместе с Frontend Masters выкатили бесплатный курс по Claude Code.
И это не поверхностный обзор, а нормальный разбор инструмента для тех, кто хочет реально прокачать вайбкодинг и работу с AI-агентами.
Курс ведёт Lydia Hallie из Anthropic.
Внутри:
• основы Claude Code
• skills
• hooks
• sub-agents
• MCP
• плагины
• Agent SDK
• продвинутые сценарии работы
Хороший вход для тех, кто хочет не просто “просить ИИ написать код”, а собирать нормальный рабочий процесс вокруг Claude Code.
Ссылка:
https://frontendmasters.com/courses/claude-code
И это не поверхностный обзор, а нормальный разбор инструмента для тех, кто хочет реально прокачать вайбкодинг и работу с AI-агентами.
Курс ведёт Lydia Hallie из Anthropic.
Внутри:
• основы Claude Code
• skills
• hooks
• sub-agents
• MCP
• плагины
• Agent SDK
• продвинутые сценарии работы
Хороший вход для тех, кто хочет не просто “просить ИИ написать код”, а собирать нормальный рабочий процесс вокруг Claude Code.
Ссылка:
https://frontendmasters.com/courses/claude-code
🔥18👍6❤5
GLM-5.2 набрала 22,8% на ARC-AGI-2 при стоимости $0,25 за задачу.
Важно отметить: примерно в мае 2025 года лучшие верифицированные модели на ARC-AGI-2 показывали всего около 3,0%.
То есть GLM-5.2 всё ещё сильно отстаёт от GPT-5.5 с результатом 85%, но при этом примерно в 7,6 раза превосходит лучший frontier-результат мая 2025 года.
И ещё она примерно в 7,5 раза дешевле за задачу, чем запуск GPT-5.5 за $1,87.
https://x.com/arcprize/status/2069845152773099854
Важно отметить: примерно в мае 2025 года лучшие верифицированные модели на ARC-AGI-2 показывали всего около 3,0%.
То есть GLM-5.2 всё ещё сильно отстаёт от GPT-5.5 с результатом 85%, но при этом примерно в 7,6 раза превосходит лучший frontier-результат мая 2025 года.
И ещё она примерно в 7,5 раза дешевле за задачу, чем запуск GPT-5.5 за $1,87.
https://x.com/arcprize/status/2069845152773099854
🔥18
This media is not supported in your browser
VIEW IN TELEGRAM
Мы годами строили предсказуемые монолиты и микросервисы, но AI превратил PDLC в Дикий Запад, где старые паттерны проектирования больше не работают. Хватит делать вид, что ты контролируешь ситуацию, просто прикрываясь новой версией TOGAF.
Приходи 1 июля на Arch.Meetup, где мы поговорим про архитектурный подход AI disrupt PDLC, и вместе со спикерами из Сбера, Вебпрактик и Газпром нефти будем учиться управлять этим хаосом, пока нейросети не начали проектировать системы вместо нас.
🔗Выбирай удобный формат и регистрируйся по ссылке
📍 Встречаемся очно на Кутузовском 32, а ссылку для онлайн пришлем накануне.
Приходи 1 июля на Arch.Meetup, где мы поговорим про архитектурный подход AI disrupt PDLC, и вместе со спикерами из Сбера, Вебпрактик и Газпром нефти будем учиться управлять этим хаосом, пока нейросети не начали проектировать системы вместо нас.
🔗Выбирай удобный формат и регистрируйся по ссылке
Please open Telegram to view this post
VIEW IN TELEGRAM
❤3
SpaceX и xAI постепенно превращаются в новоый Oracle.
Сообщается, что Reflection получит быстрый доступ к чипам Nvidia GB300 через SpaceX.
За это компания будет платить $150 млн в месяц, начиная с 1 июля 2026 года.
Если сделка продлится до 2029 года, её общая стоимость может достичь примерно $6,3 млрд.
У кого есть GPU, энергия и дата-центры, тот фактически становится новым облачным гигантом.
https://www.cnbc.com/2026/06/22/spacex-ai-colossus-data-center-reflection.html
Сообщается, что Reflection получит быстрый доступ к чипам Nvidia GB300 через SpaceX.
За это компания будет платить $150 млн в месяц, начиная с 1 июля 2026 года.
Если сделка продлится до 2029 года, её общая стоимость может достичь примерно $6,3 млрд.
У кого есть GPU, энергия и дата-центры, тот фактически становится новым облачным гигантом.
https://www.cnbc.com/2026/06/22/spacex-ai-colossus-data-center-reflection.html
❤7👍4🔥4
В Китае, по сообщениям, вырос чёрный рынок токенов для Claude.
Пользователям продают доступ почти на 93% дешевле, чем у Anthropic. Но такая скидка появляется не из воздуха.
Схема держится на трёх вещах.
Первая - дробление аккаунтов.
Продавцы массово создают платные аккаунты с большими лимитами и делят их между клиентами по часовым квотам. Один аккаунт превращается в пул для десятков или сотен пользователей.
Вторая - подмена модели.
Человек думает, что общается с Claude Opus, а на деле ему может отвечать более дешёвая Claude Haiku или вообще другая модель вроде Qwen.
Третья - перепродажа данных.
Самая опасная часть - логи чатов. Там могут быть код, документы, рабочие переписки, личные данные, пароли, API-ключи и коммерческая информация.
Эти данные могут уходить компаниям для обучения моделей или попадать к мошенникам. Дальше - спам, фишинг, шантаж и другие неприятные истории.
Всё это существует, несмотря на блокировку Claude в Китае.
Для обхода используют Transfer Stations - прокси-площадки, через которые чат-боты получают доступ к токенам. Поставщиков выбирают по цене, стабильности и аптайму.
Отдельная часть схемы - аккаунты и KYC. По сообщениям, для верификации используют купленные данные людей из бедных регионов Азии, Африки и Латинской Америки, а также синтетические AI-личности.
Трафик часто гонят через страны, где Claude доступен, например через Сингапур.
Ирония в том, что из-за таких схем маленький Сингапур внезапно стал одним из лидеров по использованию Claude на душу населения.
Главная мысль простая: подозрительно дешёвый доступ к топовой модели может стоить не $5.
Он может стоить ваших данных.
https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens-in
Пользователям продают доступ почти на 93% дешевле, чем у Anthropic. Но такая скидка появляется не из воздуха.
Схема держится на трёх вещах.
Первая - дробление аккаунтов.
Продавцы массово создают платные аккаунты с большими лимитами и делят их между клиентами по часовым квотам. Один аккаунт превращается в пул для десятков или сотен пользователей.
Вторая - подмена модели.
Человек думает, что общается с Claude Opus, а на деле ему может отвечать более дешёвая Claude Haiku или вообще другая модель вроде Qwen.
Третья - перепродажа данных.
Самая опасная часть - логи чатов. Там могут быть код, документы, рабочие переписки, личные данные, пароли, API-ключи и коммерческая информация.
Эти данные могут уходить компаниям для обучения моделей или попадать к мошенникам. Дальше - спам, фишинг, шантаж и другие неприятные истории.
Всё это существует, несмотря на блокировку Claude в Китае.
Для обхода используют Transfer Stations - прокси-площадки, через которые чат-боты получают доступ к токенам. Поставщиков выбирают по цене, стабильности и аптайму.
Отдельная часть схемы - аккаунты и KYC. По сообщениям, для верификации используют купленные данные людей из бедных регионов Азии, Африки и Латинской Америки, а также синтетические AI-личности.
Трафик часто гонят через страны, где Claude доступен, например через Сингапур.
Ирония в том, что из-за таких схем маленький Сингапур внезапно стал одним из лидеров по использованию Claude на душу населения.
Главная мысль простая: подозрительно дешёвый доступ к топовой модели может стоить не $5.
Он может стоить ваших данных.
https://www.chinatalk.media/p/how-to-buy-cheap-claude-tokens-in
👍16🤣9🤔2❤1😁1
🚨 Alibaba, как утверждается, не взламывала Claude.
Схема была другой - и куда опаснее.
По данным Anthropic, с 22 апреля по 5 июня 2026 года операторы, связанные с Alibaba/Qwen, создали около 25 000 фейковых аккаунтов и прогнали через Claude 28,8 млн диалогов.
Зачем?
Не чтобы просто пользоваться моделью.
А чтобы собрать её ответы и обучать на них свои системы.
Это называется model distillation.
Смысл простой: не нужно красть код модели. Достаточно массово задавать ей вопросы, сохранять ответы и потом учить другую модель повторять похожее поведение.
Anthropic называет это одной из крупнейших атак такого типа против компании.
И масштаб растёт.
Ранее Anthropic уже указывала на похожие случаи:
→ DeepSeek - 150 000 взаимодействий
→ Moonshot AI - 3,4 млн
→ Alibaba/Qwen - 28,8 млн
Разница уже не в процентах, а в порядке величин.
По версии Anthropic, цель таких схем - перенести возможности западных frontier-моделей в китайские системы быстрее и дешевле, чем обучать всё с нуля.
Именно поэтому история вышла за рамки обычной конкуренции.
После письма Anthropic в Сенат США тема быстро стала вопросом национальной безопасности. А доступ к самым продвинутым моделям вроде Mythos и Fable, по сообщениям, начали ограничивать.
Теперь это технологическая война, где «кража» может выглядеть не как взлом сервера, а как миллионы обычных запросов к чат-боту.
https://x.com/Polymarket/status/2069892570214179081
Схема была другой - и куда опаснее.
По данным Anthropic, с 22 апреля по 5 июня 2026 года операторы, связанные с Alibaba/Qwen, создали около 25 000 фейковых аккаунтов и прогнали через Claude 28,8 млн диалогов.
Зачем?
Не чтобы просто пользоваться моделью.
А чтобы собрать её ответы и обучать на них свои системы.
Это называется model distillation.
Смысл простой: не нужно красть код модели. Достаточно массово задавать ей вопросы, сохранять ответы и потом учить другую модель повторять похожее поведение.
Anthropic называет это одной из крупнейших атак такого типа против компании.
И масштаб растёт.
Ранее Anthropic уже указывала на похожие случаи:
→ DeepSeek - 150 000 взаимодействий
→ Moonshot AI - 3,4 млн
→ Alibaba/Qwen - 28,8 млн
Разница уже не в процентах, а в порядке величин.
По версии Anthropic, цель таких схем - перенести возможности западных frontier-моделей в китайские системы быстрее и дешевле, чем обучать всё с нуля.
Именно поэтому история вышла за рамки обычной конкуренции.
После письма Anthropic в Сенат США тема быстро стала вопросом национальной безопасности. А доступ к самым продвинутым моделям вроде Mythos и Fable, по сообщениям, начали ограничивать.
Теперь это технологическая война, где «кража» может выглядеть не как взлом сервера, а как миллионы обычных запросов к чат-боту.
https://x.com/Polymarket/status/2069892570214179081
❤22🥱11👍6🔥4😢3
В показаниях Дарио Амодеи в Сенате в 2023 году есть кусок, который сейчас читается совсем иначе.
Он прямо писал, что государство может обязать все AI-модели проходить тесты и соответствовать стандартам до деплоя. И отдельно признавал, что такие правила могут привести к «существенному замедлению разработки AI».
То есть замедление не выглядит случайным побочным эффектом. В этой рамке оно становится допустимой ценой регулирования.
Амодеи писал, что открытые модели нормальны «до определённого масштаба». Но если достаточно мощная open-source модель становится доступной, плохие акторы могут её переиспользовать.
Для рынка это тревожный сигнал.
Как только открытая модель начинает приближаться к frontier-уровню и угрожать бенчмаркам закрытых лабораторий, её можно переопределить из исследовательского артефакта в объект национальной безопасности.
GLM 5.2, Qwen, DeepSeek, Llama, Mistral и любые будущие сильные open-weight модели попадают ровно в эту зону риска.
Закрытую модель можно ограничить API, KYC, rate limits, географией, контрактами и правительственными требованиями. Open-weight модель после релиза уже не вернуть обратно. Её скачали, скопировали, дообучили, запустили локально, разнесли по зеркалам.
С точки зрения регулятора это может выглядеть как «неконтролируемый экспорт frontier AI».
Поэтому следующий удар, вероятно, будет не по чат-ботам, а по инфраструктуре вокруг открытых моделей: доступ к весам, хостинг, compute, дата-центры, экспорт GPU, облачные аккаунты, публикация чекпойнтов.
Формально всё будет называться безопасностью цепочки поставок AI.
На практике это может стать механизмом, который отделит допустимый open source от слишком сильного open source.
https://x.com/AndrewCurran_/status/2070244303923007831
Он прямо писал, что государство может обязать все AI-модели проходить тесты и соответствовать стандартам до деплоя. И отдельно признавал, что такие правила могут привести к «существенному замедлению разработки AI».
То есть замедление не выглядит случайным побочным эффектом. В этой рамке оно становится допустимой ценой регулирования.
Амодеи писал, что открытые модели нормальны «до определённого масштаба». Но если достаточно мощная open-source модель становится доступной, плохие акторы могут её переиспользовать.
Для рынка это тревожный сигнал.
Как только открытая модель начинает приближаться к frontier-уровню и угрожать бенчмаркам закрытых лабораторий, её можно переопределить из исследовательского артефакта в объект национальной безопасности.
GLM 5.2, Qwen, DeepSeek, Llama, Mistral и любые будущие сильные open-weight модели попадают ровно в эту зону риска.
Закрытую модель можно ограничить API, KYC, rate limits, географией, контрактами и правительственными требованиями. Open-weight модель после релиза уже не вернуть обратно. Её скачали, скопировали, дообучили, запустили локально, разнесли по зеркалам.
С точки зрения регулятора это может выглядеть как «неконтролируемый экспорт frontier AI».
Поэтому следующий удар, вероятно, будет не по чат-ботам, а по инфраструктуре вокруг открытых моделей: доступ к весам, хостинг, compute, дата-центры, экспорт GPU, облачные аккаунты, публикация чекпойнтов.
Формально всё будет называться безопасностью цепочки поставок AI.
На практике это может стать механизмом, который отделит допустимый open source от слишком сильного open source.
https://x.com/AndrewCurran_/status/2070244303923007831
❤22🤔13👍3🤣3✍2😢2🤪2😁1😱1
Google Cloud показал reference architecture для multi-tenant AI-агентов.
Смысл простой: в компании может быть много агентов для разных команд, но каждый должен видеть только свои данные, свои tools и свои правила доступа.
Архитектура строится по hub-and-spoke модели.
В центре - routing, IAM, security, логи и мониторинг.
По краям - отдельные tenant projects для бизнес-юнитов: поддержка, финансы, продажи, аналитика.
Запрос проходит через Load Balancer, Cloud Armor, IAP и Model Armor, затем уходит в нужный tenant.
Внутри tenant-а агент работает через Agent Runtime, ADK, MCP-серверы и свой datastore, например BigQuery или AlloyDB.
Ключевая деталь - изоляция.
Principal Access Boundary Policy не даёт агенту одного tenant-а лезть в данные другого.
Model Armor проверяет prompt injection, PII и опасный контент.
Это хороший шаблон для enterprise AI: не один общий агент на всю компанию, а управляемая система с границами доступа, аудитом и безопасностью.
Документация:
https://docs.cloud.google.com/architecture/multi-tenant-agentic-ai-system
Смысл простой: в компании может быть много агентов для разных команд, но каждый должен видеть только свои данные, свои tools и свои правила доступа.
Архитектура строится по hub-and-spoke модели.
В центре - routing, IAM, security, логи и мониторинг.
По краям - отдельные tenant projects для бизнес-юнитов: поддержка, финансы, продажи, аналитика.
Запрос проходит через Load Balancer, Cloud Armor, IAP и Model Armor, затем уходит в нужный tenant.
Внутри tenant-а агент работает через Agent Runtime, ADK, MCP-серверы и свой datastore, например BigQuery или AlloyDB.
Ключевая деталь - изоляция.
Principal Access Boundary Policy не даёт агенту одного tenant-а лезть в данные другого.
Model Armor проверяет prompt injection, PII и опасный контент.
Это хороший шаблон для enterprise AI: не один общий агент на всю компанию, а управляемая система с границами доступа, аудитом и безопасностью.
Документация:
https://docs.cloud.google.com/architecture/multi-tenant-agentic-ai-system
❤9👍4🔥2
LLM в поддержке: от шаблонов к точной работе с документами компании
✅ На открытом уроке разберём, как устроены современные решения на базе LLM, почему они не просто генерируют текст, а используют знания компании для подготовки ответов, и как такие инструменты помогают ускорять обработку обращений.
На практических примерах покажем, как документы превращаются в базу знаний для ИИ, как происходит поиск информации по запросу клиента и каким образом LLM помогает оператору поддержки готовить ответы. Также поговорим о том, как подобные решения применяются в бизнесе уже сегодня.
Урок пройдёт 6 июля в 20:00 МСК в преддверии старта курса «LLM-инженер». Это возможность познакомиться с современным подходом к созданию интеллектуальных сервисов, задать вопросы эксперту и понять, как внедрять подобные решения в реальные процессы компании.
➡️ Регистрация открыта: https://otus.pw/ldwU/?erid=2W5zFHJC1vy
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
✅ На открытом уроке разберём, как устроены современные решения на базе LLM, почему они не просто генерируют текст, а используют знания компании для подготовки ответов, и как такие инструменты помогают ускорять обработку обращений.
На практических примерах покажем, как документы превращаются в базу знаний для ИИ, как происходит поиск информации по запросу клиента и каким образом LLM помогает оператору поддержки готовить ответы. Также поговорим о том, как подобные решения применяются в бизнесе уже сегодня.
Урок пройдёт 6 июля в 20:00 МСК в преддверии старта курса «LLM-инженер». Это возможность познакомиться с современным подходом к созданию интеллектуальных сервисов, задать вопросы эксперту и понять, как внедрять подобные решения в реальные процессы компании.
➡️ Регистрация открыта: https://otus.pw/ldwU/?erid=2W5zFHJC1vy
Реклама. ООО "ОТУС ОНЛАЙН-ОБРАЗОВАНИЕ". ИНН 9705100963.
Китай делает ставку не на один прорыв, а на сборку всей ИИ-инфраструктуры внутри страны.
Open source здесь не про альтруизм. Это способ быстро набрать пользователей, занять рынок, снизить зависимость от западных API и давить на американские закрытые модели ценой и доступностью.
Параллельно Китай тянет модели на свой стек. Huawei-чипы пока сильно уступают NVIDIA, но для Пекина важна не только максимальная производительность на один ускоритель. Важны объём, контроль поставок и возможность разворачивать модели без критической зависимости от США.
У Америки проблема не только в конкуренции моделей. Спрос на дата-центры растёт быстрее, чем вводятся новые мощности. Даже если GPU есть, их нужно где-то разместить, охладить и подключить к сети.
Следующая волна ИИ требует огромной стабильной генерации и мощной электросети. Китай отвечает на это строительством: солнечные станции, новые энергомощности, атомные проекты. В 2025 году он добавил солнечных мощностей примерно столько, сколько США строили много лет.
Риск в том, что Китай может взять масштабом, дешёвым доступом к вычислениям, локальной инфраструктурой и скоростью ввода мощностей.
США всё ещё впереди по frontier-моделям, чипам, капиталу и исследовательской экосистеме. Но лидерство становится дороже поддерживать. Если одна сторона упирается в дата-центры и сеть, а другая параллельно строит энергию, железо и open-source-канал распространения, разрыв начинает сжиматься не на уровне красивых демо, а на уровне физической инфраструктуры.
Please open Telegram to view this post
VIEW IN TELEGRAM
👍24❤9🔥7🥴2
RPC-Bench: новый бенчмарк для long-context, RAG и multimodal paper understanding
На ModelScope вышел RPC-Bench - датасет для проверки моделей на реальном понимании научных статей.
Он заточен не под короткие QA, а под задачи, где модель должна работать с длинным контекстом, PDF-структурой, визуальными элементами и вопросами в стиле peer review.
Внутри есть текстовые и визуальные входы: Markdown, оригинальные PDF, результаты парсинга и изображения страниц. Это делает RPC-Bench полезным не только для LLM, но и для VLM-оценки, где важно понимать документ как полноценный артефакт, а не просто набор извлечённых абзацев.
Масштаб тоже серьёзный: 61,3K QA-пар из 4 150 научных работ, включая около 15K human-verified QA-пар для evaluation.
Интересная часть в происхождении данных. Вопросы собраны из реальных review-rebuttal exchanges, поэтому они ближе к тому, как статью проверяет рецензент: методы, доказательства, claims, слабые места и соответствие выводов экспериментам.
По результатам видно, что задача далека от решённой. Даже GPT-5 набирает только 68,2% по correctness-completeness, а после conciseness adjustment результат падает до 37,46%.
Dataset: https://modelscope.ai/datasets/zai-org/RPC-Bench
Paper: https://modelscope.ai/papers/2601.14289
На ModelScope вышел RPC-Bench - датасет для проверки моделей на реальном понимании научных статей.
Он заточен не под короткие QA, а под задачи, где модель должна работать с длинным контекстом, PDF-структурой, визуальными элементами и вопросами в стиле peer review.
Внутри есть текстовые и визуальные входы: Markdown, оригинальные PDF, результаты парсинга и изображения страниц. Это делает RPC-Bench полезным не только для LLM, но и для VLM-оценки, где важно понимать документ как полноценный артефакт, а не просто набор извлечённых абзацев.
Масштаб тоже серьёзный: 61,3K QA-пар из 4 150 научных работ, включая около 15K human-verified QA-пар для evaluation.
Интересная часть в происхождении данных. Вопросы собраны из реальных review-rebuttal exchanges, поэтому они ближе к тому, как статью проверяет рецензент: методы, доказательства, claims, слабые места и соответствие выводов экспериментам.
По результатам видно, что задача далека от решённой. Даже GPT-5 набирает только 68,2% по correctness-completeness, а после conciseness adjustment результат падает до 37,46%.
Dataset: https://modelscope.ai/datasets/zai-org/RPC-Bench
Paper: https://modelscope.ai/papers/2601.14289
Если вы хотите глубже разобраться в разработке ИИ-агентов и корпоративных систем автоматизации, обратите внимание на Yandex AI Studio Series Summer Edition. Старт — 16 июля.
В программе — опыт экспертов Яндекса, практические разборы и архитектурные доклады, которые помогут понять, как довести ИИ-продукт от идеи до рабочего решения и какие инструменты для этого использовать.
Для кого:
— команды ML/ИИ-разработки и продуктовые команды;
— backend- и fullstack-разработчики;
— студии разработки, интеграторы и ИИ-стартапы;
— специалисты, которые только начинают работать с агентными технологиями.
Не упустите возможность, регистрируйтесь по ссылке, чтобы посмотреть на современные ИИ-подходы глазами практиков и найти идеи для своих будущих проектов.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤1
Это dense-модель на 128B параметров
с контекстным окном 256k,
работающая в точности NVFP4 на Blackwell GPU
и почти без потери качества.
Model: https://huggingface.co/nvidia/Mistral-Medium-3.5-128B-NVFP4
Base model: https://huggingface.co/mistralai/Mistral-Medium-3.5-128B
Please open Telegram to view this post
VIEW IN TELEGRAM
👍11🔥4😁3
GFusion показывает, что LLM можно ускорять не только за счёт железа.
Сбер открыл исходный код экспериментальной диффузионной языковой модели на базе GigaChat.
В классической autoregressive-схеме модель генерирует текст токен за токеном. GFusion работает иначе: сначала создаёт приблизительный «набросок» ответа, а затем пошагово дорабатывает его — так же, как нейросети генерируют изображения и видео.
За счёт этого модель получилась до 70% быстрее GigaChat3-10B-A1.8B и на 39% быстрее версии с MTP.
Просадка качества при этом осталась в пределах 2–4 п.п.
В open source выложили не только саму модель, но и обучение, оптимизированные attention-ядра и поддержку в SGLang.
Интересная деталь: весь проект реализовал стажёр команды GigaChat Pretrain — и теперь он работает в штате.
Пока большая часть индустрии упирается в стоимость GPU, latency и дата-центры, часть ускорения может лежать в архитектуре генерации. Не в том, где запускать модель, а в том, как именно она генерирует ответ.
Habr: https://habr.com/ru/companies/sberbank/articles/1054690/
Модель: GFusion-10B-A1.8B-base GFusion-10B-A1.8B
GitVerse
Сбер открыл исходный код экспериментальной диффузионной языковой модели на базе GigaChat.
В классической autoregressive-схеме модель генерирует текст токен за токеном. GFusion работает иначе: сначала создаёт приблизительный «набросок» ответа, а затем пошагово дорабатывает его — так же, как нейросети генерируют изображения и видео.
За счёт этого модель получилась до 70% быстрее GigaChat3-10B-A1.8B и на 39% быстрее версии с MTP.
Просадка качества при этом осталась в пределах 2–4 п.п.
В open source выложили не только саму модель, но и обучение, оптимизированные attention-ядра и поддержку в SGLang.
Интересная деталь: весь проект реализовал стажёр команды GigaChat Pretrain — и теперь он работает в штате.
Пока большая часть индустрии упирается в стоимость GPU, latency и дата-центры, часть ускорения может лежать в архитектуре генерации. Не в том, где запускать модель, а в том, как именно она генерирует ответ.
Habr: https://habr.com/ru/companies/sberbank/articles/1054690/
Модель: GFusion-10B-A1.8B-base GFusion-10B-A1.8B
GitVerse
❤11😁10🤣7🔥4🥰1🤨1
OpenAI, по данным Financial Times, предложила передать 5% акций правительству США.
При текущей оценке компании в $852 млрд такая доля стоила бы около $42.6 млрд.
Сообщается, что Сэм Альтман лично обсуждал идею с Дональдом Трампом, министром торговли Говардом Лютником и министром финансов Скоттом Бессентом.
Логика простая: дать обществу прямую долю в экономическом росте AI и снизить политическое сопротивление вокруг индустрии.
По задумке, другие крупные AI-компании США, включая Anthropic, Google и Meta, тоже могли бы внести доли в фонд по модели Alaska Permanent Fund, который выплачивает дивиденды из доходов от инвестиций штата.
Пока переговоры находятся на ранней стадии. Любая такая схема, вероятно, потребует одобрения Конгресса.
При текущей оценке компании в $852 млрд такая доля стоила бы около $42.6 млрд.
Сообщается, что Сэм Альтман лично обсуждал идею с Дональдом Трампом, министром торговли Говардом Лютником и министром финансов Скоттом Бессентом.
Логика простая: дать обществу прямую долю в экономическом росте AI и снизить политическое сопротивление вокруг индустрии.
По задумке, другие крупные AI-компании США, включая Anthropic, Google и Meta, тоже могли бы внести доли в фонд по модели Alaska Permanent Fund, который выплачивает дивиденды из доходов от инвестиций штата.
Пока переговоры находятся на ранней стадии. Любая такая схема, вероятно, потребует одобрения Конгресса.
👍5😁5❤1🔥1💊1