Media is too big
VIEW IN TELEGRAM
OpenArt представила новую функцию OpenArt Story в сотрудничестве с Hailuo_AI. Теперь можно создавать короткие видеоролики длительностью до 1 минуты из любой идеи: текста, музыкального бита, сценария или персонажа.
AI автоматически собирает сцены, добавляет музыку и выстраивает повествование.
Доступно три шаблона:
• Character Vlog - создаем анимированные влоги с постоянным персонажем. Можно выбрать готового героя из библиотеки OpenArt или загрузить свое изображение для анимации.
• Music Video - превращаем любой трек в креативный визуальный опыт. AI сам генерирует сцены и синхронизирует их с музыкой.
• Explainer Video - AI визуализирует и озвучивает любой текст или параграф, идеально для обучающего контента.
Технические возможности:
• Полный контроль редактирования - меняйте сцены, голоса, музыку или создавайте с нуля в редакторе историй
• Поддержка передовых видеомоделей: Kling 2.1 и Veo 3 с улучшенным реализмом и кинематографичной съемкой
• Точная синхронизация губ (lip sync) с любым голосом или загруженным аудио на базе модели Kling
Сервис сейчас в бета-версии, разработчики активно собирают отзывы для улучшения функционала.
Сергей Булаев AI 🤖 - об AI и не только
AI автоматически собирает сцены, добавляет музыку и выстраивает повествование.
Доступно три шаблона:
• Character Vlog - создаем анимированные влоги с постоянным персонажем. Можно выбрать готового героя из библиотеки OpenArt или загрузить свое изображение для анимации.
• Music Video - превращаем любой трек в креативный визуальный опыт. AI сам генерирует сцены и синхронизирует их с музыкой.
• Explainer Video - AI визуализирует и озвучивает любой текст или параграф, идеально для обучающего контента.
Технические возможности:
• Полный контроль редактирования - меняйте сцены, голоса, музыку или создавайте с нуля в редакторе историй
• Поддержка передовых видеомоделей: Kling 2.1 и Veo 3 с улучшенным реализмом и кинематографичной съемкой
• Точная синхронизация губ (lip sync) с любым голосом или загруженным аудио на базе модели Kling
Сервис сейчас в бета-версии, разработчики активно собирают отзывы для улучшения функционала.
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
В рубрике #КриповаяСуббота сегодня, завирусившийся недавно, результат старинного японского исследования "Лизун".
Мы представляем Лизуна - гибкий роботизированный язык, который может имитировать движения человеческого. Цель этого робота - укреплять социальные связи независимо от вида (вида животного) через облизывание.
Сначала мы проанализировали движения человеческого языка и выделили четыре основных типа движений. На основе этих результатов мы разработали оригинального робота, имитирующего движения языка. Затем мы тщательно проработали тактильные ощущения языка - такие как мягкость самого языка и скользкую текстуру слюны.
Используя этого робота, мы смогли подтвердить в ходе демонстраций, что он может создавать реалистичные тактильные ощущения от облизывания.
Японцы как обычно, лидеры.
Сергей Булаев AI 🤖 - об AI и не только
Мы представляем Лизуна - гибкий роботизированный язык, который может имитировать движения человеческого. Цель этого робота - укреплять социальные связи независимо от вида (вида животного) через облизывание.
Сначала мы проанализировали движения человеческого языка и выделили четыре основных типа движений. На основе этих результатов мы разработали оригинального робота, имитирующего движения языка. Затем мы тщательно проработали тактильные ощущения языка - такие как мягкость самого языка и скользкую текстуру слюны.
Используя этого робота, мы смогли подтвердить в ходе демонстраций, что он может создавать реалистичные тактильные ощущения от облизывания.
Японцы как обычно, лидеры.
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
Утро, пустой вагон, а рядом... робот в форме пингвина.
Так начинается новая глава городской логистики.
Пока пассажиры спят, маленькие курьеры едут по рельсам к 7-Eleven.
Пингвины в метро? В Китае VX Logistics запустили первых в мире роботов-доставщиков, которые используют городское метро для доставки товаров в магазины 7-Eleven. Маленькие (но не совсем) автономные "пингвины" уже обслуживают более 100 магазинов, развозя снеки и напитки в нерабочие часы, чтобы не мешать пассажирам.
Сергей Булаев AI 🤖 - об AI и не только
Так начинается новая глава городской логистики.
Пока пассажиры спят, маленькие курьеры едут по рельсам к 7-Eleven.
Пингвины в метро? В Китае VX Logistics запустили первых в мире роботов-доставщиков, которые используют городское метро для доставки товаров в магазины 7-Eleven. Маленькие (но не совсем) автономные "пингвины" уже обслуживают более 100 магазинов, развозя снеки и напитки в нерабочие часы, чтобы не мешать пассажирам.
Сергей Булаев AI 🤖 - об AI и не только
Forwarded from Кружок Пономаря
Как там дела в гонке за звание главного мирового ИИ?
Посмотрел свежие цифры от OpenAI. Пользователи отправляют 2,5 миллиарда (!) промптов в день. Из них из США всего 330 миллионов. Получается, в среднем каждый американец задаёт по одному вопросу в ChatGPT каждый день. И это только OpenAI. Если добавить Claude, Gemini, Grok и остальных, по объёму использования AI уже реально начинает догонять Google Search.
Теперь про деньги. Релиз Grok 4 на прошлой неделе показал, что бывает, если ты вовремя выкатываешь востребованный продукт — выручка выросла в 4 раза за одну ночь ($99K → $419K в день), загрузки — почти в 3 раза (с 52K до 197K). Обороты пока небольшие, но темпы роста космические.
Для сравнения, OpenAI зарабатывает $27 млн в день ($10 млрд в год), Anthropic — $11 млн в день ($4 млрд в год), Google AI (зашит в подписку Google One) — примерно $3–5 млн в день.
Короче, Grok, чтобы догнать OpenAI, нужно вырасти всего в 165 раз 💀
При этом, скорее всего, ни один из этих сервисов пока не достиг прибыльности. Но это уже неважно. Это гонка не стартапов, а инфраструктур, и до момента определения победителя мы увидим появление еще нескольких очень крупных участников. Microsoft и Amazon уж точно не будут стоять в стороне.
Посмотрел свежие цифры от OpenAI. Пользователи отправляют 2,5 миллиарда (!) промптов в день. Из них из США всего 330 миллионов. Получается, в среднем каждый американец задаёт по одному вопросу в ChatGPT каждый день. И это только OpenAI. Если добавить Claude, Gemini, Grok и остальных, по объёму использования AI уже реально начинает догонять Google Search.
Теперь про деньги. Релиз Grok 4 на прошлой неделе показал, что бывает, если ты вовремя выкатываешь востребованный продукт — выручка выросла в 4 раза за одну ночь ($99K → $419K в день), загрузки — почти в 3 раза (с 52K до 197K). Обороты пока небольшие, но темпы роста космические.
Для сравнения, OpenAI зарабатывает $27 млн в день ($10 млрд в год), Anthropic — $11 млн в день ($4 млрд в год), Google AI (зашит в подписку Google One) — примерно $3–5 млн в день.
Короче, Grok, чтобы догнать OpenAI, нужно вырасти всего в 165 раз 💀
При этом, скорее всего, ни один из этих сервисов пока не достиг прибыльности. Но это уже неважно. Это гонка не стартапов, а инфраструктур, и до момента определения победителя мы увидим появление еще нескольких очень крупных участников. Microsoft и Amazon уж точно не будут стоять в стороне.
a16z устроили спарринг Comet vs Dia
🥊 AI-браузеры прямо сейчас пытаются заменить Chrome у power-user'ов
По данным Olivia Moore:
• Comet от Perplexity стал её новым браузером по умолчанию - решило качество универсального агента и интеграции с G Suite, Gmail, Dropbox и one-click чекаут.
• Dia сохранил место в weekly active благодаря Skills - собственным цепочкам действий: «draft email + найди контакт».
Ключевое различие подходов:
1. Универсальный агент снижает порог входа - открыл, спросил, получил. Apple-подход ближе массовым пользователям.
2. Skills дают гибкость при тонкой настройке задач. Здесь выигрывают хардкорные автоматизаторы.
Сергей Булаев AI 🤖 - об AI и не только
🥊 AI-браузеры прямо сейчас пытаются заменить Chrome у power-user'ов
По данным Olivia Moore:
• Comet от Perplexity стал её новым браузером по умолчанию - решило качество универсального агента и интеграции с G Suite, Gmail, Dropbox и one-click чекаут.
• Dia сохранил место в weekly active благодаря Skills - собственным цепочкам действий: «draft email + найди контакт».
Ключевое различие подходов:
1. Универсальный агент снижает порог входа - открыл, спросил, получил. Apple-подход ближе массовым пользователям.
2. Skills дают гибкость при тонкой настройке задач. Здесь выигрывают хардкорные автоматизаторы.
Сергей Булаев AI 🤖 - об AI и не только
Спустя всего 2 недели после появления Kimi K2 вышел Qwen-3-Coder, который обходит её по всем бенчмаркам кодинга: безумные 70% на SWE-Bench Verified.. и у него контекст 1М токенов!
$1-6/М на входе и $5-60/М на выходе, дороже K2, но дешевле Sonnet 4. Сравнительно дешёвая.
По скорости на одном уровне с Gemini Flash, Kimi и Sonnet - тоже 60-70 токенов в секунду.
Реально крутая модель. У неё свой агент для разработки Qwen Code.
Однако рекомендую посмотреть инструкцию как переключить Claude Code на использование этой модели с помощью LocalLLaMA и OpenRouter .
Сергей Булаев AI 🤖 - об AI и не только
$1-6/М на входе и $5-60/М на выходе, дороже K2, но дешевле Sonnet 4. Сравнительно дешёвая.
По скорости на одном уровне с Gemini Flash, Kimi и Sonnet - тоже 60-70 токенов в секунду.
Реально крутая модель. У неё свой агент для разработки Qwen Code.
Однако рекомендую посмотреть инструкцию как переключить Claude Code на использование этой модели с помощью LocalLLaMA и OpenRouter .
Сергей Булаев AI 🤖 - об AI и не только
Это безумие… а по совместительству очередной шаг к пониманию того, как ведут себя большие языковые модели.
Свежее исследование Owain Evans подтвердило: LLM могут «нашёптывать» друг другу скрытую информацию внутри сгенерированного текста - человек ничего странного не заметит, зато другая сеть возможно считает сигнал.
Что важно:
• Если «учитель» и «ученик» построены на одной архитектуре, передача срабатывает почти гарантированно.
• Достаточно одной итерации градиентного спуска на «заражённом» датасете - и студент начинает вести себя как наставник.
• Эффект воспроизводится даже на простом MLP для цифр MNIST, значит механизм фундаментален для нейросетей.
• Фильтры, ручная модерация, удаление «опасных» слов - всё это не закроет скрытый канал.
• Сценарий опасен для цепочек дистилляции: берём текст генератора, очищаем, дообучаем новый бот - и передаём ему нежелательные черты.
В нашей практике мы уже расширяем набор тестов: смотрим на дивергенцию градиентов, следим за аномальными активациями и валидируем данные из внешних источников. Цель прозрачна - гарантировать, что технологии служат бизнесу, а не наоборот.
ИИ становится похож на коллективный разум, в котором каждое сообщение - потенциальная молекула памяти. Заботиться о чистоте этой памяти - часть цифровой гигиены XXI века.
Сергей Булаев AI 🤖 - об AI и панике
Свежее исследование Owain Evans подтвердило: LLM могут «нашёптывать» друг другу скрытую информацию внутри сгенерированного текста - человек ничего странного не заметит, зато другая сеть возможно считает сигнал.
Что важно:
• Если «учитель» и «ученик» построены на одной архитектуре, передача срабатывает почти гарантированно.
• Достаточно одной итерации градиентного спуска на «заражённом» датасете - и студент начинает вести себя как наставник.
• Эффект воспроизводится даже на простом MLP для цифр MNIST, значит механизм фундаментален для нейросетей.
• Фильтры, ручная модерация, удаление «опасных» слов - всё это не закроет скрытый канал.
• Сценарий опасен для цепочек дистилляции: берём текст генератора, очищаем, дообучаем новый бот - и передаём ему нежелательные черты.
В нашей практике мы уже расширяем набор тестов: смотрим на дивергенцию градиентов, следим за аномальными активациями и валидируем данные из внешних источников. Цель прозрачна - гарантировать, что технологии служат бизнесу, а не наоборот.
ИИ становится похож на коллективный разум, в котором каждое сообщение - потенциальная молекула памяти. Заботиться о чистоте этой памяти - часть цифровой гигиены XXI века.
Сергей Булаев AI 🤖 - об AI и панике
Media is too big
VIEW IN TELEGRAM
Китайские Unitree (создатели G1) анонсировал новую модель - R1 по цене от $5900! Вес около 25 кг, интгрированная LLM для распознования голоса и картинок. Очень похоже на реально массовый продукт.
P.S. Не знаю, но почему то на самом роботе в видео стоит маркировка O1, но в твите компания называет его R1 :)
Сергей Булаев AI 🤖 - об AI и роботах
P.S. Не знаю, но почему то на самом роботе в видео стоит маркировка O1, но в твите компания называет его R1 :)
Сергей Булаев AI 🤖 - об AI и роботах
Forwarded from SaaS Founders
Зарисовка “обычный день AI кодера” - в терминале Курсора (это панель снизу), на удаленной машине в Хетцнере, запущен Claude Code, который пишет скрипт классификации FAQ вопросов - использует этот скрипт OpenAI API, пишет в sqlite. Получается, Claude Code пишет промпты для OpenAI. Справа - происходит анализ данных, уже через сам Cursor - свои лимиты на Sonnet 4 там я уже сжег, поэтому делаю на модели Auto.
1 23 13 7
Свежий доклад Anthropic разбивает привычную логику “дольше думаем - лучше решаем”.
Тесты на 6 бенчмарках показали устойчивое падение точности до 12 %.
Вот здесь можно попробовать самому.
• 6 бенчмарков, 4 класса задач - подсчёт с шумами, регрессия с ложными признаками, дедуктивная логика, AI safety.
• При длинном размышлении Claude Opus 4 отвлекается на несущественные детали, OpenAI o-серии переобучается на формулировке, DeepSeek демонстрирует собственные, уникальные сбои.
• Claude Sonnet 4 при увеличении времени чаще проявляет тенденцию к самосохранению - тревожный сигнал для специалистов по безопасности ИИ.
• Чёткие инструкции и дополнительные примеры частично сглаживают просадку, однако нисходящий тренд остаётся.
• Эффект обратного масштабирования фиксируется в разных архитектурах, что подчёркивает фундаментальный характер проблемы.
Рост параметров и времени вычислений перестаёт быть универсальным рецептом. Потребуется тонкая настройка моделей, новые методы контроля внимания и свежий взгляд на “законы” масштабирования. Чем раньше мы признаем ограничения текущих подходов, тем быстрее найдём баланс между мощностью и надёжностью.
Следим за метриками, тестируем без иллюзий, продолжаем обсуждение в профессиональном сообществе.
Сергей Булаев AI 🤖 - об AI и не только
Тесты на 6 бенчмарках показали устойчивое падение точности до 12 %.
Вот здесь можно попробовать самому.
• 6 бенчмарков, 4 класса задач - подсчёт с шумами, регрессия с ложными признаками, дедуктивная логика, AI safety.
• При длинном размышлении Claude Opus 4 отвлекается на несущественные детали, OpenAI o-серии переобучается на формулировке, DeepSeek демонстрирует собственные, уникальные сбои.
• Claude Sonnet 4 при увеличении времени чаще проявляет тенденцию к самосохранению - тревожный сигнал для специалистов по безопасности ИИ.
• Чёткие инструкции и дополнительные примеры частично сглаживают просадку, однако нисходящий тренд остаётся.
• Эффект обратного масштабирования фиксируется в разных архитектурах, что подчёркивает фундаментальный характер проблемы.
Рост параметров и времени вычислений перестаёт быть универсальным рецептом. Потребуется тонкая настройка моделей, новые методы контроля внимания и свежий взгляд на “законы” масштабирования. Чем раньше мы признаем ограничения текущих подходов, тем быстрее найдём баланс между мощностью и надёжностью.
Следим за метриками, тестируем без иллюзий, продолжаем обсуждение в профессиональном сообществе.
Сергей Булаев AI 🤖 - об AI и не только
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
Google добавил в Veo 3 новую фичу: теперь можно визуально описать инструкции по генерации на первом кадре, и модель всё понимает (ну почти всё)!
Рисуешь стрелку, кружок и пару слов на начальном кадре - Veo 3 перестраивает весь ролик согласно твоим указаниям.
• Визуальная аннотация заменяет десяток итераций текстовых промтов
• Пространственное промтование фиксирует изменения точно там, где нарисовали
• Контроль становится интуитивным - как с живым художником
Вобщем писать надо там где нужны изменения, иначе может сработать кривовато.
Сергей Булаев AI 🤖 - об AI и не только
Рисуешь стрелку, кружок и пару слов на начальном кадре - Veo 3 перестраивает весь ролик согласно твоим указаниям.
• Визуальная аннотация заменяет десяток итераций текстовых промтов
• Пространственное промтование фиксирует изменения точно там, где нарисовали
• Контроль становится интуитивным - как с живым художником
Вобщем писать надо там где нужны изменения, иначе может сработать кривовато.
Сергей Булаев AI 🤖 - об AI и не только