Forwarded from эйай ньюз
Media is too big
VIEW IN TELEGRAM
ChatGPT Pulse
Теперь ChatGPT может проактивно ресёрчить топики которые считает важными и выдавать репорт каждое утро. Темы выбираются на основе недавних чатов, памяти, подключенных приложений и пожеланий пользователей. Уже доступно подписчикам Pro уровня в новой версии мобильного приложения.
@ai_newz
Теперь ChatGPT может проактивно ресёрчить топики которые считает важными и выдавать репорт каждое утро. Темы выбираются на основе недавних чатов, памяти, подключенных приложений и пожеланий пользователей. Уже доступно подписчикам Pro уровня в новой версии мобильного приложения.
@ai_newz
🔥8👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Рейстлину
в 2001м году такая вот песня сложилась в армии по следам прочтения серии книг Dragonlance
Теперь можно озвучить.
#Suno
———
@tsingular
в 2001м году такая вот песня сложилась в армии по следам прочтения серии книг Dragonlance
Теперь можно озвучить.
#Suno
———
@tsingular
🔥29❤3
This media is not supported in your browser
VIEW IN TELEGRAM
А еще для Премьер подписки Суно выпустил студию-редактор похожий на Fl-Studio
Studio
#Suno #Studio
———
@tsingular
Studio
#Suno #Studio
———
@tsingular
🔥9❤2❤🔥1
📊 OpenAI выпустили GDPval — бенчмарк для измерения реальной экономической ценности AI-моделей
Забудьте про академические тесты типа MMLU. OpenAI представили метрику, которая проверяет модели на том, за что платят деньги в реальном бизнесе.
Техническая архитектура:
- 1320 специализированных задач (220 в открытом доступе)
- 44 профессии из 9 ведущих отраслей экономики США
- Задачи создавали профессионалы с опытом 14+ лет в своих отраслях
Слепое сравнение: эксперты не знают, где работа AI, а где человека
Что внутри задач:
От юридических брифов и инженерных чертежей до планов ухода за пациентами и презентаций в PowerPoint.
Т.е. это не просто текстовые промпты — каждая задача включает референсные файлы, контекст и требует создания реальных рабочих документов.
Результаты тестирования:
- Claude Opus 4.1 — лидер с 47.6% паритета с экспертами (особенно силён в эстетике документов)
- GPT-5 high — 38.8%, хорошо показывает себя в точности и доменных знаниях
Прогресс OpenAI за год: от GPT-4o (12.4%) до GPT-5 (38.8%) — рост в 3+ раза
Скорость: модели выполняют задачи в 100x быстрее и 100x дешевле экспертов
Ограничения v1 теста:
- Пока только one-shot задачи без итераций и обратной связи.
- В реальности работа требует контекста, правок и неоднозначных решений — это в планах на следующие версии.
Датасеты и полная информация доступны тут: evals.openai.com и HF
Т.е. AI уже сейчас справляется с хорошо структурированными рутинными задачами на уровне профессионалов.
Дальше уже будет развитие доменной специфики и покрытие многоходовых сценариев.
#GDPval #OpenAI #бенчмарки
———
@tsingular
Забудьте про академические тесты типа MMLU. OpenAI представили метрику, которая проверяет модели на том, за что платят деньги в реальном бизнесе.
Техническая архитектура:
- 1320 специализированных задач (220 в открытом доступе)
- 44 профессии из 9 ведущих отраслей экономики США
- Задачи создавали профессионалы с опытом 14+ лет в своих отраслях
Слепое сравнение: эксперты не знают, где работа AI, а где человека
Что внутри задач:
От юридических брифов и инженерных чертежей до планов ухода за пациентами и презентаций в PowerPoint.
Т.е. это не просто текстовые промпты — каждая задача включает референсные файлы, контекст и требует создания реальных рабочих документов.
Результаты тестирования:
- Claude Opus 4.1 — лидер с 47.6% паритета с экспертами (особенно силён в эстетике документов)
- GPT-5 high — 38.8%, хорошо показывает себя в точности и доменных знаниях
Прогресс OpenAI за год: от GPT-4o (12.4%) до GPT-5 (38.8%) — рост в 3+ раза
Скорость: модели выполняют задачи в 100x быстрее и 100x дешевле экспертов
Ограничения v1 теста:
- Пока только one-shot задачи без итераций и обратной связи.
- В реальности работа требует контекста, правок и неоднозначных решений — это в планах на следующие версии.
Датасеты и полная информация доступны тут: evals.openai.com и HF
Т.е. AI уже сейчас справляется с хорошо структурированными рутинными задачами на уровне профессионалов.
Дальше уже будет развитие доменной специфики и покрытие многоходовых сценариев.
#GDPval #OpenAI #бенчмарки
———
@tsingular
🔥8⚡3✍3👌1
Японская партия "Путь к Возрождению" назначила ИИ своим лидером
Партия Path to Rebirth стала первой в Японии, где ИИ используется для принятия гос решений.
Основатель партии Синдзи Исимару запустил проект в январе 2024-го. ИИ будет направлять внутренние решения пока в режиме консультанта.
Официально зарегистрированным лидером остается Окумура.
Детали модели, метрики оценки и меры безопасности партия пока не раскрывает. Неизвестно, какие данные использовались для обучения и как предотвращают манипулирование системой.
Партия позиционирует ИИ как способ представить "упущенные голоса" избирателей.
Что ж, +1 страна в списке "под ИИ управлением" официально.
Кстати, ИИ агенты - представители избирателей, - следующий шаг, похоже.
#Japan #госуправление
———
@tsingular
Партия Path to Rebirth стала первой в Японии, где ИИ используется для принятия гос решений.
Основатель партии Синдзи Исимару запустил проект в январе 2024-го. ИИ будет направлять внутренние решения пока в режиме консультанта.
Официально зарегистрированным лидером остается Окумура.
Детали модели, метрики оценки и меры безопасности партия пока не раскрывает. Неизвестно, какие данные использовались для обучения и как предотвращают манипулирование системой.
Партия позиционирует ИИ как способ представить "упущенные голоса" избирателей.
Что ж, +1 страна в списке "под ИИ управлением" официально.
Кстати, ИИ агенты - представители избирателей, - следующий шаг, похоже.
#Japan #госуправление
———
@tsingular
Media is too big
VIEW IN TELEGRAM
Кстати у Suno ещё есть режим радио
https://suno.com/explore
Т.е. они теперь полностью покрывают весь процесс, от создания на уровне сэмплов и даже MIDI, до публикации и стриминга.
Ещё видео и авторские добавить и будем потом ютубы и спотифай вспоминать с ностальгией.
#Suno
———
@tsingular
https://suno.com/explore
Т.е. они теперь полностью покрывают весь процесс, от создания на уровне сэмплов и даже MIDI, до публикации и стриминга.
Ещё видео и авторские добавить и будем потом ютубы и спотифай вспоминать с ностальгией.
#Suno
———
@tsingular
🔥5❤1
Встречаются как-то два директора по маркетингу и один другого спрашивает:
— Как использовать ИИ для маркетинга?
— Могу рассказать...
— Рассказать и я могу, как использовать?
source
#юмор
------
@tsingular
— Как использовать ИИ для маркетинга?
— Могу рассказать...
— Рассказать и я могу, как использовать?
source
#юмор
------
@tsingular
😁36🔥7❤1👏1
Microsoft Photos получил авто-категоризацию на базе ИИ
Windows 11 тестирует новую функцию в приложении Фото - автоматическое распределение изображений по категориям с помощью ИИ.
- умная сортировка по категориям
- работает для всех языков
- пока только 4 категории - скриншоты, рецепты, идентификационные документы и заметки
Функция доступна участникам программы Windows Insider начиная с версии 2025.11090.25001.0 и выше.
Работает локально на NPU (если он у вас есть).
#Microsoft #Windows #Photos
———
@tsingular
Windows 11 тестирует новую функцию в приложении Фото - автоматическое распределение изображений по категориям с помощью ИИ.
- умная сортировка по категориям
- работает для всех языков
- пока только 4 категории - скриншоты, рецепты, идентификационные документы и заметки
Функция доступна участникам программы Windows Insider начиная с версии 2025.11090.25001.0 и выше.
Работает локально на NPU (если он у вас есть).
#Microsoft #Windows #Photos
———
@tsingular
👍5
🤖 Google запускает 5-дневный интенсив по ИИ-агентам
После успеха GenAI курса (420К+ участников) Google поднимает планку и теперь выпускает курс только по агентам. От архитектур до продакшена за 5 дней.
Программа:
День 1: Агентные архитектуры vs традиционные LLM приложения
День 2: MCP (Model Context Protocol) — стандарт для взаимодействия с инструментами
День 3: Контекст-инжиниринг — кратко/долгосрочная память для мультитурновых задач
День 4: Observability, логирование, метрики — как строить надёжные системы
День 5: Agent2Agent (A2A) Protocol — мульти-агентные системы в продакшене
Формат обучения:
📚 Ежедневные задания (1-2 часа) — whitepapers + codelabs + подкасты от NotebookLM
💬 Discord канал для обсуждений с экспертами Google
🎥 Лайвстримы 45-60 мин с авторами курса + AMA сессии
🏆 Capstone проект на ADK (Agent Development Kit) — реальное портфолио + призы
Требования:
Python + базовые AI концепты + Google AI Studio (доступен в ограниченных регионах) + Kaggle аккаунт с верифицированным телефоном.
Бесплатно, записи будут доступны после курса. Топ-10 capstone проектов получат swag + продвижение в соцсетях Google.
Записываемся. За 5 дней влетаем в агентостроение.
#Google #Kaggle #обучение
———
@tsingular
После успеха GenAI курса (420К+ участников) Google поднимает планку и теперь выпускает курс только по агентам. От архитектур до продакшена за 5 дней.
Программа:
День 1: Агентные архитектуры vs традиционные LLM приложения
День 2: MCP (Model Context Protocol) — стандарт для взаимодействия с инструментами
День 3: Контекст-инжиниринг — кратко/долгосрочная память для мультитурновых задач
День 4: Observability, логирование, метрики — как строить надёжные системы
День 5: Agent2Agent (A2A) Protocol — мульти-агентные системы в продакшене
Формат обучения:
📚 Ежедневные задания (1-2 часа) — whitepapers + codelabs + подкасты от NotebookLM
💬 Discord канал для обсуждений с экспертами Google
🎥 Лайвстримы 45-60 мин с авторами курса + AMA сессии
🏆 Capstone проект на ADK (Agent Development Kit) — реальное портфолио + призы
Требования:
Python + базовые AI концепты + Google AI Studio (доступен в ограниченных регионах) + Kaggle аккаунт с верифицированным телефоном.
Бесплатно, записи будут доступны после курса. Топ-10 capstone проектов получат swag + продвижение в соцсетях Google.
Записываемся. За 5 дней влетаем в агентостроение.
#Google #Kaggle #обучение
———
@tsingular
✍7❤4👍4⚡3
Вьетнам делает ИИ основой экономики
На NVIDIA AI Day в Хошимине заместитель директора Национального центра инноваций Вьетнама заявил о планах поставить искусственный интеллект в центр экономической стратегии.
Вьетнам уже показывает серьезную динамику: 39% рост внедрения ИИ год к году, 18% компаний используют технологии.
К 2040 году ИИ может добавить 120-130 миллиардов долларов к экономике страны. Страна развивает проект ViGen - крупнейшую базу данных на вьетнамском языке для обучения ИИ.
Интересно, что параллельно идут переговоры с NVIDIA о создании суверенного ИИ, учитывая американские ограничения на экспорт чипов.
Все метят в чемпионы, но хватит ли на всех GPU?!
#Vietnam #NVIDIA #SovereignAI
------
@tsingular
На NVIDIA AI Day в Хошимине заместитель директора Национального центра инноваций Вьетнама заявил о планах поставить искусственный интеллект в центр экономической стратегии.
Вьетнам уже показывает серьезную динамику: 39% рост внедрения ИИ год к году, 18% компаний используют технологии.
К 2040 году ИИ может добавить 120-130 миллиардов долларов к экономике страны. Страна развивает проект ViGen - крупнейшую базу данных на вьетнамском языке для обучения ИИ.
Интересно, что параллельно идут переговоры с NVIDIA о создании суверенного ИИ, учитывая американские ограничения на экспорт чипов.
Все метят в чемпионы, но хватит ли на всех GPU?!
#Vietnam #NVIDIA #SovereignAI
------
@tsingular
✍3⚡2
Media is too big
VIEW IN TELEGRAM
Gemini Robotics 1.5 выводит ИИ-агентов в физический мир
Google DeepMind запустили Gemini Robotics 1.5 - платформу для создания роботов с возможностями детальных рассуждений и агентским функционалом.
Самое главное, - агентное поведение.
Роботы теперь могут решать сложные многоэтапные задачи, планировать действия и адаптироваться к новым ситуациям.
Платформа поддерживает перенос навыков между разными роботами. Научили одного - остальные тоже умеют.
В комплекте SDK для разработчиков, который позволяет настраивать поведение под конкретные задачи.
Ну что, как и было предсказано, - 2025й год воплощённого ИИ.
Мультиагенты уже загружаются в гуманоидов.
Хорошая новость, - это все opensource, - можно настроить под себя.
#Gemini #роботы #DeepMind
———
@tsingular
Google DeepMind запустили Gemini Robotics 1.5 - платформу для создания роботов с возможностями детальных рассуждений и агентским функционалом.
Самое главное, - агентное поведение.
Роботы теперь могут решать сложные многоэтапные задачи, планировать действия и адаптироваться к новым ситуациям.
Платформа поддерживает перенос навыков между разными роботами. Научили одного - остальные тоже умеют.
В комплекте SDK для разработчиков, который позволяет настраивать поведение под конкретные задачи.
Ну что, как и было предсказано, - 2025й год воплощённого ИИ.
Мультиагенты уже загружаются в гуманоидов.
Хорошая новость, - это все opensource, - можно настроить под себя.
#Gemini #роботы #DeepMind
———
@tsingular
⚡4🔥3👾3💯2
Forwarded from Neural Kovalskii
Circuit Tracing от Anthropic: как мы в R&D by red_mad_robot решили заглянуть внутрь LLM при использовании в RAG-пайплайнах
Ищем галлюцинации под микроскопом!
29 мая Anthropic выложили в open-source свои инструменты Circuit Tracing методологию механической интерпретируемости, которую мы в R&D подразделении red_mad_robot первыми применили для решения практической задачи детекции галлюцинаций в RAG-системах!
В начале 2025 года, когда я возглавил новое R&D направление, я поставил амбициозную задачу: не просто оценивать качество ответов LLM "снаружи", а заглянуть внутрь процесса генерации и понять, откуда берутся галлюцинации.
Почему именно RAG-пайплайны и Circuit Tracing?
Проблема была очевидна: RAG-системы часто смешивают информацию из контекста с "внутренними знаниями" модели, создавая правдоподобные, но неточные ответы
Существующие методы детекции работают post-factum, а нам нужно было понять механизм принятия решений в реальном времени
Circuit Tracing от Anthropic давал именно это возможность построить атрибуционные графы и проследить, как токены входного контекста влияют на финальный ответ модели
Конкретные результаты нашего исследования
85% точность детекции галлюцинаций вот что мы получили на тестовом датасете с нашей реализацией на базе Qwen2.5-7B.
Как отмечает наш исследователь Ирина Кошкина:
"Основная идея — измерение доли влияния от токенов входа, соответствующих контексту, среди всего влияния от всех активных токенов."
Наша метрика Groundedness включает:
- Контекстную долю влияния (Gctx)
- Replacement Score — качество признаков vs ошибок
- Completeness Score — полнота объяснения через атрибуционный граф
Технические вызовы и решения
Cross-Layer Transcoders (CLT) стали ключевым компонентом системы
Вместо анализа отдельных слоев мы научились отслеживать влияние признаков между несколькими архитектурными уровнями трансформера
Основные проблемы, которые пришлось решать:
1. Вычислительная сложность процедура анализа на порядки медленнее генерации
2. Зависимость от качества обученного транскодера
3. Токен-уровневое сопоставление, приводящее к ложным срабатываниям
Но результат того стоил мы получили рабочий инструмент для анализа внутренних процессов модели во время генерации ответов в RAG-системах
Отдельное спасибо отделу маркетинга red_mad_robot за подготовку детальной статьи оформления и валидации на Хабре
Отдельное спасибо Саше (@dealerAI) за экспертную валидацию нашей гипотезы на старте проекта
Когда предлагаешь исследовать "атрибуционные графы для детекции галлюцинаций в RAG", поддержка опытных друзей по цеху критически важна для получения ресурсов и мотивации команды
Полный технический разбор с кодом, формулами и результатами экспериментов доступен в нашей статье на Хабре закидываем в закладки и ставим +
Ищем галлюцинации под микроскопом!
29 мая Anthropic выложили в open-source свои инструменты Circuit Tracing методологию механической интерпретируемости, которую мы в R&D подразделении red_mad_robot первыми применили для решения практической задачи детекции галлюцинаций в RAG-системах!
В начале 2025 года, когда я возглавил новое R&D направление, я поставил амбициозную задачу: не просто оценивать качество ответов LLM "снаружи", а заглянуть внутрь процесса генерации и понять, откуда берутся галлюцинации.
Почему именно RAG-пайплайны и Circuit Tracing?
Проблема была очевидна: RAG-системы часто смешивают информацию из контекста с "внутренними знаниями" модели, создавая правдоподобные, но неточные ответы
Существующие методы детекции работают post-factum, а нам нужно было понять механизм принятия решений в реальном времени
Circuit Tracing от Anthropic давал именно это возможность построить атрибуционные графы и проследить, как токены входного контекста влияют на финальный ответ модели
Конкретные результаты нашего исследования
85% точность детекции галлюцинаций вот что мы получили на тестовом датасете с нашей реализацией на базе Qwen2.5-7B.
Как отмечает наш исследователь Ирина Кошкина:
"Основная идея — измерение доли влияния от токенов входа, соответствующих контексту, среди всего влияния от всех активных токенов."
Наша метрика Groundedness включает:
- Контекстную долю влияния (Gctx)
- Replacement Score — качество признаков vs ошибок
- Completeness Score — полнота объяснения через атрибуционный граф
Технические вызовы и решения
Cross-Layer Transcoders (CLT) стали ключевым компонентом системы
Вместо анализа отдельных слоев мы научились отслеживать влияние признаков между несколькими архитектурными уровнями трансформера
Основные проблемы, которые пришлось решать:
1. Вычислительная сложность процедура анализа на порядки медленнее генерации
2. Зависимость от качества обученного транскодера
3. Токен-уровневое сопоставление, приводящее к ложным срабатываниям
Но результат того стоил мы получили рабочий инструмент для анализа внутренних процессов модели во время генерации ответов в RAG-системах
Отдельное спасибо отделу маркетинга red_mad_robot за подготовку детальной статьи оформления и валидации на Хабре
Отдельное спасибо Саше (@dealerAI) за экспертную валидацию нашей гипотезы на старте проекта
Когда предлагаешь исследовать "атрибуционные графы для детекции галлюцинаций в RAG", поддержка опытных друзей по цеху критически важна для получения ресурсов и мотивации команды
Полный технический разбор с кодом, формулами и результатами экспериментов доступен в нашей статье на Хабре закидываем в закладки и ставим +
Хабр
Circuit Tracing: как заглянуть в галлюцинации модели и найти там смысл
Всем привет! Меня зовут Ирина, я NLP-инженер в red_mad_robot, занимаюсь научными исследованиями интерпретируемости LLM и анализом механизмов внутренних вычислений моделей, чтобы применять полученные...
⚡6✍4❤3🔥1😁1
Morgan Stanley понижает рейтинг Adobe: ИИ может потопить 42-летнего софтверного гиганта
Morgan Stanley понизил рейтинг Adobe (ADBE) с overweight до equal-weight, понизив целевую цену с $520 до $450 (-15%). Акции компании уже показывают -20.6% с начала года.
Основная проблема
Аналитики видят критический провал между ИИ-инновациями Adobe и их реальной монетизацией:
Adobe заявляет о $5 млрд AI-influenced ARR и $250 млн от AI-first продуктов
При этом общий рост Digital Media ARR замедлился с 12.1% до 11.7% год к году
99% компаний из Fortune 100 используют ИИ в продуктах Adobe, но это не конвертируется в ускорение роста выручки
Конкурентное давление
Новые и существующие игроки активно захватывают рынок:
- ChatGPT: 700 млн пользователей в неделю, формирует новые ожидания у пользователей
- Canva: 220 млн активных пользователей функций "Magic", активно идет в enterprise-сегмент
- Figma: внедряет ИИ-агентов и code-aware workflows
- Big Tech (Google, Microsoft) также наступают на традиционные рынки Adobe
- Нейростартапы RunWay, Kling, Wan и десятки других так же отъедают аудиторию
Кейс Adobe демонстрирует классическую проблему: технологическое лидерство не гарантирует рыночное доминирование в эпоху ИИ-трансформации.
Даже софтверный гигант с 42х летней историей может столкнуться с угрозой от растущих конкурентов с эффективными ИИ-решениями.
#Adobe #MorganStanley
———
@tsingular
Morgan Stanley понизил рейтинг Adobe (ADBE) с overweight до equal-weight, понизив целевую цену с $520 до $450 (-15%). Акции компании уже показывают -20.6% с начала года.
Основная проблема
Аналитики видят критический провал между ИИ-инновациями Adobe и их реальной монетизацией:
Adobe заявляет о $5 млрд AI-influenced ARR и $250 млн от AI-first продуктов
При этом общий рост Digital Media ARR замедлился с 12.1% до 11.7% год к году
99% компаний из Fortune 100 используют ИИ в продуктах Adobe, но это не конвертируется в ускорение роста выручки
Конкурентное давление
Новые и существующие игроки активно захватывают рынок:
- ChatGPT: 700 млн пользователей в неделю, формирует новые ожидания у пользователей
- Canva: 220 млн активных пользователей функций "Magic", активно идет в enterprise-сегмент
- Figma: внедряет ИИ-агентов и code-aware workflows
- Big Tech (Google, Microsoft) также наступают на традиционные рынки Adobe
- Нейростартапы RunWay, Kling, Wan и десятки других так же отъедают аудиторию
Кейс Adobe демонстрирует классическую проблему: технологическое лидерство не гарантирует рыночное доминирование в эпоху ИИ-трансформации.
Даже софтверный гигант с 42х летней историей может столкнуться с угрозой от растущих конкурентов с эффективными ИИ-решениями.
#Adobe #MorganStanley
———
@tsingular
✍3⚡2👍2
Awesome Reviewers от стартапа BAZ, - библиотека промптов для code review
Разработчики из BAZ запустили AwesomeReviewers библиотеку, собрав сотни промптов для автоматизации проверки кода.
Проанализировали 1000+ open source проектов (Next.js, LangChain, FastAPI) и извлекли паттерны лучших ревьюеров.
- 470+ промптов для 15 языков программирования (фокус на Python, TypeScript, Go)
- Реальные кейсы: проверка конфигураций в Fastify, security warnings, performance tips
- Интеграция через MCP с Cursor, Claude Code, VS Code и др.
По сути, отличное дополнение MCP context7
Ну в целом, - полезно почитать для обучения. Промпты годные.
Лицензия Apache 2.0
Пробуем тут: awesomereviewers.com
Github
#CodeReview #BAZ #AwesomeReviewers #обучение
———
@tsingular
Разработчики из BAZ запустили AwesomeReviewers библиотеку, собрав сотни промптов для автоматизации проверки кода.
Проанализировали 1000+ open source проектов (Next.js, LangChain, FastAPI) и извлекли паттерны лучших ревьюеров.
- 470+ промптов для 15 языков программирования (фокус на Python, TypeScript, Go)
- Реальные кейсы: проверка конфигураций в Fastify, security warnings, performance tips
- Интеграция через MCP с Cursor, Claude Code, VS Code и др.
По сути, отличное дополнение MCP context7
Ну в целом, - полезно почитать для обучения. Промпты годные.
Лицензия Apache 2.0
Пробуем тут: awesomereviewers.com
Github
#CodeReview #BAZ #AwesomeReviewers #обучение
———
@tsingular
✍2👍2❤1
Media is too big
VIEW IN TELEGRAM
🔥 HunyuanImage 3.0 — прорыв в open-source генерации изображений
Tencent выпустили самую мощную открытую модель генерации изображений с 80 млрд параметров (13 млрд активных). Качество сопоставимо с топовыми закрытыми решениями.
Техническая революция:
- MoE архитектура с Transfusion - глубокая интеграция Diffusion + LLM в единую систему
- Массивный датасет: 5 млрд изображений + 6 трлн токенов текста
- Понимание контекста: промпты до 1000 слов с пониманием модели мира
- Точная генерация текста внутри изображений
- Основана на Hunyuan-A13B - мультимодальной LLM
Сейчас доступен только режим text-to-image. В планах: image-to-image, редактирование, мультитерновые диалоги.
Пробуем тут:
https://hunyuan.tencent.com/image/zh
GitHub
HuggingFace (полный вес 170 гигов)
#HunyuanImage #OpenSource #TextToImage
———
@tsingular
Tencent выпустили самую мощную открытую модель генерации изображений с 80 млрд параметров (13 млрд активных). Качество сопоставимо с топовыми закрытыми решениями.
Техническая революция:
- MoE архитектура с Transfusion - глубокая интеграция Diffusion + LLM в единую систему
- Массивный датасет: 5 млрд изображений + 6 трлн токенов текста
- Понимание контекста: промпты до 1000 слов с пониманием модели мира
- Точная генерация текста внутри изображений
- Основана на Hunyuan-A13B - мультимодальной LLM
Сейчас доступен только режим text-to-image. В планах: image-to-image, редактирование, мультитерновые диалоги.
Пробуем тут:
https://hunyuan.tencent.com/image/zh
GitHub
HuggingFace (полный вес 170 гигов)
#HunyuanImage #OpenSource #TextToImage
———
@tsingular
⚡3👍3❤2🔥1
Microsoft показала самый мощный ИИ-датацентр в мире
Новый датацентр в Висконсине потребляет столько энергии, сколько весь регион Новой Англии.
ЦОД управляет одним огромным кластером серверов NVIDIA GB200 и миллионами вычислительных ядер и эксабайтами хранилища, спроектированных для мощных ИИ нагрузок.
Каждая стойка содержит 72 графических процессора NVIDIA Blackwell, связанных вместе в одном домене NVLink, который обеспечивает 1,8 терабайта полосы пропускной способности между графическими процессорами и дает каждому GPU доступ к 14 терабайтам объединенной памяти.
Стойка работает как один гигантский ускоритель, способный обрабатывать 865 000 токенов в секунду.
ЦОД ИИ в Норвегии и Великобритании будут использовать аналогичные кластеры и использовать следующие версии чипа ИИ от NVIDIA (GB300), который предлагает еще больше объединенной памяти на стойку.
Проблема в том, что Microsoft пока потребляет 50% энергии из угольных и газовых источников. Выбросы углерода выросли на 23,4% с 2020 года именно из-за новых ИИ-датацентров.
Инвестиции составили 80 миллиардов долларов и покрывают более 25 новых регионов Azure.
Получается, чтобы учить ИИ модели беречь планету, мы продолжаем жечь уголь и газ.
Такая вот зелёная революция.
#Microsoft #Datacenter #Wisconsin
------
@tsingular
Новый датацентр в Висконсине потребляет столько энергии, сколько весь регион Новой Англии.
ЦОД управляет одним огромным кластером серверов NVIDIA GB200 и миллионами вычислительных ядер и эксабайтами хранилища, спроектированных для мощных ИИ нагрузок.
Каждая стойка содержит 72 графических процессора NVIDIA Blackwell, связанных вместе в одном домене NVLink, который обеспечивает 1,8 терабайта полосы пропускной способности между графическими процессорами и дает каждому GPU доступ к 14 терабайтам объединенной памяти.
Стойка работает как один гигантский ускоритель, способный обрабатывать 865 000 токенов в секунду.
ЦОД ИИ в Норвегии и Великобритании будут использовать аналогичные кластеры и использовать следующие версии чипа ИИ от NVIDIA (GB300), который предлагает еще больше объединенной памяти на стойку.
Проблема в том, что Microsoft пока потребляет 50% энергии из угольных и газовых источников. Выбросы углерода выросли на 23,4% с 2020 года именно из-за новых ИИ-датацентров.
Инвестиции составили 80 миллиардов долларов и покрывают более 25 новых регионов Azure.
Получается, чтобы учить ИИ модели беречь планету, мы продолжаем жечь уголь и газ.
Такая вот зелёная революция.
#Microsoft #Datacenter #Wisconsin
------
@tsingular
😁107🔥21❤6👍4
Perplexity запустил Search API для разработчиков
Perplexity открыл доступ к своей поисковой инфраструктуре через API. Разработчики получили ту же глобальную базу из сотен миллиардов веб-страниц, что использует сам сервис.
Основные фишки:
- поиск на уровне фрагментов документов, а не целых страниц
- обновление индекса десятками тысяч запросов в секунду
- структурированные ответы, готовые для ИИ-приложений
- открытый фреймворк для тестирования search_evals
Компания утверждает, что обходит конкурентов по качеству и скорости при меньших затратах. API стартует от $5 в месяц.
Поисковые войны переходят в новую фазу - теперь каждый сможет встроить конкурента Google в свое приложение.
#Perplexity #Search #API
———
@tsingular
Perplexity открыл доступ к своей поисковой инфраструктуре через API. Разработчики получили ту же глобальную базу из сотен миллиардов веб-страниц, что использует сам сервис.
Основные фишки:
- поиск на уровне фрагментов документов, а не целых страниц
- обновление индекса десятками тысяч запросов в секунду
- структурированные ответы, готовые для ИИ-приложений
- открытый фреймворк для тестирования search_evals
Компания утверждает, что обходит конкурентов по качеству и скорости при меньших затратах. API стартует от $5 в месяц.
Поисковые войны переходят в новую фазу - теперь каждый сможет встроить конкурента Google в свое приложение.
#Perplexity #Search #API
———
@tsingular
🔥9❤2🤩1
Prompt Packs от OpenAI Academy
OpenAI выпустила Prompt Packs - готовые наборы промптов для различных сценариев.
Полезно не только для обучения,- разные промпты в одинаковых задачах могут давать разницу результатов от 8.8% до 62.9% на одинаковой модели.
Парсим, загоняем в RAG по задачам,- профит :)
Ну или просто учимся сами.
#PromptPacks #OpenAI #промпты #обучение
------
@tsingular
OpenAI выпустила Prompt Packs - готовые наборы промптов для различных сценариев.
Полезно не только для обучения,- разные промпты в одинаковых задачах могут давать разницу результатов от 8.8% до 62.9% на одинаковой модели.
Парсим, загоняем в RAG по задачам,- профит :)
Ну или просто учимся сами.
#PromptPacks #OpenAI #промпты #обучение
------
@tsingular
✍5🔥5⚡2