Сергей Булаев AI 🤖
9.42K subscribers
630 photos
599 videos
1 file
613 links
Основатель нескольких успешных IT и контент-проектов, включая Купи Батон, Lifehacker.ru и Взахлёб. Сейчас нахожусь во Флориде в городе Бока Ратон. Занимаюсь созданием контента на основе оцифрованной памяти человека.
Download Telegram
Media is too big
VIEW IN TELEGRAM
OpenArt представила новую функцию OpenArt Story в сотрудничестве с Hailuo_AI. Теперь можно создавать короткие видеоролики длительностью до 1 минуты из любой идеи: текста, музыкального бита, сценария или персонажа.

AI автоматически собирает сцены, добавляет музыку и выстраивает повествование.

Доступно три шаблона:
• Character Vlog - создаем анимированные влоги с постоянным персонажем. Можно выбрать готового героя из библиотеки OpenArt или загрузить свое изображение для анимации.

• Music Video - превращаем любой трек в креативный визуальный опыт. AI сам генерирует сцены и синхронизирует их с музыкой.

• Explainer Video - AI визуализирует и озвучивает любой текст или параграф, идеально для обучающего контента.

Технические возможности:
• Полный контроль редактирования - меняйте сцены, голоса, музыку или создавайте с нуля в редакторе историй
• Поддержка передовых видеомоделей: Kling 2.1 и Veo 3 с улучшенным реализмом и кинематографичной съемкой
• Точная синхронизация губ (lip sync) с любым голосом или загруженным аудио на базе модели Kling

Сервис сейчас в бета-версии, разработчики активно собирают отзывы для улучшения функционала.

Сергей Булаев AI 🤖 - об AI и не только
14👎65
This media is not supported in your browser
VIEW IN TELEGRAM
В рубрике #КриповаяСуббота сегодня, завирусившийся недавно, результат старинного японского исследования "Лизун".

Мы представляем Лизуна - гибкий роботизированный язык, который может имитировать движения человеческого. Цель этого робота - укреплять социальные связи независимо от вида (вида животного) через облизывание.

Сначала мы проанализировали движения человеческого языка и выделили четыре основных типа движений. На основе этих результатов мы разработали оригинального робота, имитирующего движения языка. Затем мы тщательно проработали тактильные ощущения языка - такие как мягкость самого языка и скользкую текстуру слюны.

Используя этого робота, мы смогли подтвердить в ходе демонстраций, что он может создавать реалистичные тактильные ощущения от облизывания.

Японцы как обычно, лидеры.

Сергей Булаев AI 🤖 - об AI и не только
3683👎1
This media is not supported in your browser
VIEW IN TELEGRAM
Утро, пустой вагон, а рядом... робот в форме пингвина.

Так начинается новая глава городской логистики.
Пока пассажиры спят, маленькие курьеры едут по рельсам к 7-Eleven.

Пингвины в метро? В Китае VX Logistics запустили первых в мире роботов-доставщиков, которые используют городское метро для доставки товаров в магазины 7-Eleven. Маленькие (но не совсем) автономные "пингвины" уже обслуживают более 100 магазинов, развозя снеки и напитки в нерабочие часы, чтобы не мешать пассажирам.

Сергей Булаев AI 🤖 - об AI и не только
1622
Как там дела в гонке за звание главного мирового ИИ?

Посмотрел свежие цифры от OpenAI. Пользователи отправляют 2,5 миллиарда (!) промптов в день. Из них из США всего 330 миллионов. Получается, в среднем каждый американец задаёт по одному вопросу в ChatGPT каждый день. И это только OpenAI. Если добавить Claude, Gemini, Grok и остальных, по объёму использования AI уже реально начинает догонять Google Search.

Теперь про деньги. Релиз Grok 4 на прошлой неделе показал, что бывает, если ты вовремя выкатываешь востребованный продукт — выручка выросла в 4 раза за одну ночь ($99K → $419K в день), загрузки — почти в 3 раза (с 52K до 197K). Обороты пока небольшие, но темпы роста космические.

Для сравнения, OpenAI зарабатывает $27 млн в день ($10 млрд в год), Anthropic — $11 млн в день ($4 млрд в год), Google AI (зашит в подписку Google One) — примерно $3–5 млн в день.

Короче, Grok, чтобы догнать OpenAI, нужно вырасти всего в 165 раз 💀

При этом, скорее всего, ни один из этих сервисов пока не достиг прибыльности. Но это уже неважно. Это гонка не стартапов, а инфраструктур, и до момента определения победителя мы увидим появление еще нескольких очень крупных участников. Microsoft и Amazon уж точно не будут стоять в стороне.
336👎2
a16z устроили спарринг Comet vs Dia
🥊 AI-браузеры прямо сейчас пытаются заменить Chrome у power-user'ов

По данным Olivia Moore:
• Comet от Perplexity стал её новым браузером по умолчанию - решило качество универсального агента и интеграции с G Suite, Gmail, Dropbox и one-click чекаут.
• Dia сохранил место в weekly active благодаря Skills - собственным цепочкам действий: «draft email + найди контакт».

Ключевое различие подходов:
1. Универсальный агент снижает порог входа - открыл, спросил, получил. Apple-подход ближе массовым пользователям.
2. Skills дают гибкость при тонкой настройке задач. Здесь выигрывают хардкорные автоматизаторы.

Сергей Булаев AI 🤖 - об AI и не только
10👎333
Спустя всего 2 недели после появления Kimi K2 вышел Qwen-3-Coder, который обходит её по всем бенчмаркам кодинга: безумные 70% на SWE-Bench Verified.. и у него контекст 1М токенов!

$1-6/М на входе и $5-60/М на выходе, дороже K2, но дешевле Sonnet 4. Сравнительно дешёвая.

По скорости на одном уровне с Gemini Flash, Kimi и Sonnet - тоже 60-70 токенов в секунду.

Реально крутая модель. У неё свой агент для разработки Qwen Code.

Однако рекомендую посмотреть инструкцию как переключить Claude Code на использование этой модели с помощью LocalLLaMA и OpenRouter .

Сергей Булаев AI 🤖 - об AI и не только
2442
Это безумие… а по совместительству очередной шаг к пониманию того, как ведут себя большие языковые модели.

Свежее исследование Owain Evans подтвердило: LLM могут «нашёптывать» друг другу скрытую информацию внутри сгенерированного текста - человек ничего странного не заметит, зато другая сеть возможно считает сигнал.

Что важно:

• Если «учитель» и «ученик» построены на одной архитектуре, передача срабатывает почти гарантированно.
• Достаточно одной итерации градиентного спуска на «заражённом» датасете - и студент начинает вести себя как наставник.
• Эффект воспроизводится даже на простом MLP для цифр MNIST, значит механизм фундаментален для нейросетей.
• Фильтры, ручная модерация, удаление «опасных» слов - всё это не закроет скрытый канал.
• Сценарий опасен для цепочек дистилляции: берём текст генератора, очищаем, дообучаем новый бот - и передаём ему нежелательные черты.

В нашей практике мы уже расширяем набор тестов: смотрим на дивергенцию градиентов, следим за аномальными активациями и валидируем данные из внешних источников. Цель прозрачна - гарантировать, что технологии служат бизнесу, а не наоборот.

ИИ становится похож на коллективный разум, в котором каждое сообщение - потенциальная молекула памяти. Заботиться о чистоте этой памяти - часть цифровой гигиены XXI века.

Сергей Булаев AI 🤖 - об AI и панике
30167
Media is too big
VIEW IN TELEGRAM
Китайские Unitree (создатели G1) анонсировал новую модель - R1 по цене от $5900! Вес около 25 кг, интгрированная LLM для распознования голоса и картинок. Очень похоже на реально массовый продукт.

P.S. Не знаю, но почему то на самом роботе в видео стоит маркировка O1, но в твите компания называет его R1 :)

Сергей Булаев AI 🤖 - об AI и роботах
1575
Forwarded from SaaS Founders
Зарисовка “обычный день AI кодера” - в терминале Курсора (это панель снизу), на удаленной машине в Хетцнере, запущен Claude Code, который пишет скрипт классификации FAQ вопросов - использует этот скрипт OpenAI API, пишет в sqlite. Получается, Claude Code пишет промпты для OpenAI. Справа - происходит анализ данных, уже через сам Cursor - свои лимиты на Sonnet 4 там я уже сжег, поэтому делаю на модели Auto.
123137
Свежий доклад Anthropic разбивает привычную логику “дольше думаем - лучше решаем”.

Тесты на 6 бенчмарках показали устойчивое падение точности до 12 %.

Вот здесь можно попробовать самому.

• 6 бенчмарков, 4 класса задач - подсчёт с шумами, регрессия с ложными признаками, дедуктивная логика, AI safety.
• При длинном размышлении Claude Opus 4 отвлекается на несущественные детали, OpenAI o-серии переобучается на формулировке, DeepSeek демонстрирует собственные, уникальные сбои.
• Claude Sonnet 4 при увеличении времени чаще проявляет тенденцию к самосохранению - тревожный сигнал для специалистов по безопасности ИИ.
• Чёткие инструкции и дополнительные примеры частично сглаживают просадку, однако нисходящий тренд остаётся.
• Эффект обратного масштабирования фиксируется в разных архитектурах, что подчёркивает фундаментальный характер проблемы.

Рост параметров и времени вычислений перестаёт быть универсальным рецептом. Потребуется тонкая настройка моделей, новые методы контроля внимания и свежий взгляд на “законы” масштабирования. Чем раньше мы признаем ограничения текущих подходов, тем быстрее найдём баланс между мощностью и надёжностью.

Следим за метриками, тестируем без иллюзий, продолжаем обсуждение в профессиональном сообществе.

Сергей Булаев AI 🤖 - об AI и не только
2741
Google добавил в Veo 3 новую фичу: теперь можно визуально описать инструкции по генерации на первом кадре, и модель всё понимает (ну почти всё)!

Рисуешь стрелку, кружок и пару слов на начальном кадре - Veo 3 перестраивает весь ролик согласно твоим указаниям.

• Визуальная аннотация заменяет десяток итераций текстовых промтов
• Пространственное промтование фиксирует изменения точно там, где нарисовали
• Контроль становится интуитивным - как с живым художником

Вобщем писать надо там где нужны изменения, иначе может сработать кривовато.

Сергей Булаев AI 🤖 - об AI и не только
1616