Вуги‐Буги

👑

У нас новый император генерации изображений, и разумеется он китайский!!!

ByteDance и другие гиганты КНР на этой неделе работают как конвейер по производству хайпа — одно обновление за другим.

Сегодня они подтвердили абсолютную доминацию Seedream 4.0, которая просто размазала всех конкурентов по Artificial Analysis и заняла #1 место, обойдя Нану-Банану АКА Gemini 2.5 Flash, Imagen 4 и GPT-4o.

👑 Если кратко то привет генерация 2K изображений за 1.8 секунды с поддержкой разрешений до 4K и официальная корона от пользователей =)

Но сначала — лирическое отступление про дешёвую фото\видео генерацию по API (кому там Seedance?) от ByteDance
⚡️Оказывается, ByteDance запустил платформу BytePlus, которая теперь принимает оплату от не-китайских пользователей. Это значит, что вы наконец-то можете нормально генерировать во всех их моделях, включая Seedance PRO (который, на мой взгляд, до сих пор один из лучших видеогенераторов).

Более того:
~10 бесплатных генераций пятисекундных видео в максимальном качестве
$0.03 за вызов API или смешные 2,490₽ за 1000 генераций (2.49₽ за изображение)
API по цене в разы дешевле агрегаторов (Вайбкодим ноды и в бой)

Доступ к Seedream 4.0 на BytePlus пока недоступен, но появится скоро (как и на других агрегаторах).

⁉️

Что умеет Seedream 4.0? (если вы еще не вкурсе)

1️⃣ Batch Input & Output
Загружаете до 6 референсов → получаете до 9 согласованных изображений за раз. Идеально для серий, вариаций продуктов, сториборда.

🕙 Prompt-based Editing одной фразой:
"Remove the boy in this picture"
"Turn on the lights to light up the living room"
"Change 'Festival' to 'Photography Exhibition'"
"Colorize and repair the scratches"

Любите Flux Kontext и Nano Banana? Так вот, Seedream 4.0 делает всё то же самое, только похоже что ещё точнее и быстрее.

Одна фраза — и модель понимает контекст без костылей.

3️⃣ Text Rendering
ByteDance выдали текст среди всех конкурентов — читаемые надписи, правильные шрифты, точное выравнивание. Наконец-то можно забыть про иероглифы на плакатах.

4️⃣ Knowledge-driven Generation
Модель понимает контекст и может создавать образовательные иллюстрации, математические формулы, исторические таймлайны, инфографику — всё, что трбует не просто картинки, а понимания смысла.

❓Почему это реально прорыв?

В 10+ раз быстрее предыдущей версии. ELO 1222 на Text-to-Image Leaderboard. #1 на Image Editing Leaderboard.

Пока Midjourney вместо API дает вам танцы с бубном и боты в Discord, китайцы решили разорвать Google, OpenAI и всех остальных. Профессионально. Быстро. И в 4K.

Ну а если вам жалко денег на API, у вас теперь есть новенький Qwen.

Где потестить и когда ждать полный доступ?

Прямо сейчас можно поиграться на AIGC Arena (5 бесплатных генераций в день, правда не гарантировано что выпадет именно Seedream 4).

Уже доступна у всех API провайдеров: fal.ai, Replicate, и другие

Все технические подробности, архитектуру и бенчмарки можно изучить официальном пейпере (там 50+ авторов ByteDance Seed Team постарались).

❗️PS ОБЯЗАТЕЛЬНО СОХРАНИТЕ ПОСТ
Специально для вас я сделал Custom GPT на основе официальной документации, который генерирует топовые промпты к Seedream 4.0.

Это важно, потому что правила промптинга для неё отличаются от других моделей и даже от версии 3.0.

Короче, скоро мы с вами заговорим по-китайски 🇨🇳

PPS ну и не забывайте шерить годноту друзьям :)

©@voogieboogie

Please open Telegram to view this post