Ai molodca
35.4K subscribers
781 photos
183 videos
2 files
193 links
Авторские AI работы и полезности. Новый мир исследует @dobrokotov_work (по всем вопросам). Образование для команд и студия: https://aimolodca.tilda.ws

РКН: https://surl.li/dpoifm

На чай: QDpY9QQvijkOtyHFFVw3xyeHWr--zpjSc7qxW1OFb_dY0OU
Download Telegram
Media is too big
VIEW IN TELEGRAM
Сделал тут для конкурса.
🔥324🤯91👍66🤔2217👻14😱6
🚬 Claude 4.0 хуже чем Claude 3.5 — неуверенно думал я, раз за разом получая галлюцинации и слабую работу с текстом. Затем нашел тред на Реддите. Короткая выжимка ниже (разверните цитату).

Пост-инициатор

Автор приводит два бытовых примера: 4-ка неверно подсчитала наценку на продукты (перепутала количество позиций) и неправильно интерпретировала скриншот с макросами блюда, тогда как 3.7 ответила без ошибок.

Кодинг-кейсы (основной вал жалоб)

Sonnet 4 не нашёл баг, порождённый им же, а 3.7 обнаружила мгновенно.

Icy-Way3920 / hotsev2k / Dry_Impact_2484 и др.: 4-ка чаще галлюцинирует, не читает переданный код, циклически повторяет одну и ту же ошибку, забывает контекст.

Aider-benchmark и личные тесты davewolfs показали нулевой прирост точности; Gemini 2.5 и GPT-4 опережают.

Падение памяти на длинных диалогах

Dr_Karminski цитирует результаты Fiction.LiveBench: у 4-ки «длинная» память ощутимо слабее. Пользователи жалуются, что «200k контекста» на деле рвёт чат уже на ~30–40 k токенах.

Гипотезы, почему так

offlinesir: Anthropic «переобучилась» на код, просадив прочие навыки.

Dmitrygm1 и vegcharli: ставка на разработчиков объясняется бизнес-моделью (API → стабильная выручка).

coinclink: по внутренним метрикам Sonnet 4 лучше в «агентных» сценариях и коде, но проигрывает по «общему IQ».

Практические ограничения

Ограничение на сообщения в 4-ке куда строже: GregoryfromtheHood получил лишь 2–3 ответа до «rate limit».

Стоимость Opus 4/API (до $70) кажется несоразмерной по сравнению с Grok Mini ($0.5) или Gemini Flash.


Как у вас? 😑
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔6045👍10👻4🔥2
У Димы Сыендука вышло хорошее видео про это самое. Кстати, недавно узнал, что такое слоп в общем понимании — это когда руку в кухонную раковину засовываешь, а там гнусная жижа из объедков.

https://youtu.be/bt4RA3z8cU8
76🔥34👍20😱6👻4🤯2
Сколько сейчас стоит нейровидео? 🥂

Периодически спрашивают у меня в личке. Отвечаю по своим наблюдениям: от нуля до миллионов.

Стало интересно — а какая средняя температура по больнице? Поэтому, если вы делаете ролики на заказ, пожалуйста, пройдите короткий опрос (и перешлите другому):

👉
https://forms.gle/ydmv5KYfD8X8Xqum6

Результаты будут.

UPD: добавил несколько вопросов по вашим комментариям.
Please open Telegram to view this post
VIEW IN TELEGRAM
66👍38🔥14👻6
Media is too big
VIEW IN TELEGRAM
Анти-майонез 🔨

У рекламщиков есть такое понятие — «майонезная реклама» или просто «майонез». Как правило, это клишированный и унылый ролик с идеальной «арийской» семьёй, где продукт, как волшебная палочка, решает какую-то проблемку.

Мне часто приходят запросы именно на такие нейроролики — естественно, отказываюсь.

КоЛлЕгИ, с помощью нейросетей вы можете показать то, чего никогда не смогли бы показать в рамках своего продакшен-бюджета: невероятные образы, новые миры, удивительные сюжеты. Хватит майонезить — удивляйте и удивляйтесь.

Ну а если нужно придумать и сделать — пишите, 18 лет все-таки этим занимаюсь (жесть).

В приложении - неплохой пример (хоть и не официальный, но сделанный в духе бренда); можно подписаться на ютуб автора.
Please open Telegram to view this post
VIEW IN TELEGRAM
14🔥33371👍52🤔10👻9🤯6
"Кто все эти люди?" 😱

Если мозг снова расплавился, а в книге 600 персонажей (и вообще, это “Война и мир”), вам поможет новая фича “Ранее в книге” в Яндекс Книгах.

Функция позволяет легко и просто ознакомиться с уже прочитанным. А базируется она на YandexGPT 5.

Короче, "ранее в сериале", но только с книгами.
Please open Telegram to view this post
VIEW IN TELEGRAM
🤔75👍4512👻12🔥5
This media is not supported in your browser
VIEW IN TELEGRAM
Вот проснетесь, а тут в VEO3 подвезли геймченджер.
Суть — в коротком видео. 😑
Please open Telegram to view this post
VIEW IN TELEGRAM
👍167🔥10322👻10
Если последние пару недель вы копали грядки на даче, лежали на пляже и вообще прекрасно проводили время без интернета — вот коротко, что произошло интересного. 😁

1. OpenAI (первое видео), следуя очевидному тренду, выпустили Agent. Умеет создавать презентации, таблицы, ставить единицы фильмам Сарика Андреасяна — и совершать прочие рутинные действия во Всемирной сети Интернет. У меня почему-то недоступен. Кто пользовался — жду ваших впечатлений.

Ещё мелочь, но приятная — у GPT Image должен вот-вот появиться High Input Fidelity, как у Flux Kontext. Теперь, меняя что-то на картинке, она будет перерисовываться минимально. Полезно? Очень.

2. Flux Kontext. Дополнился множеством пресетов для работы с загруженной картинкой. Поменять ракурс, освещение, убрать текст, сделать себя качком — и многое другое можно здесь (бесплатно даётся 200 кредитов).

3. Runway (второе видео). Выпустили Act Two. Записываете свою невероятную актёрскую игру, загружаете изображение какого-нибудь монстра — и вот, монстр это вы. Причём анимируется всё изображение: например, если где-то на фоне есть огонь — он будет гореть (в Act One такого не было). Подписку на Runway я отменил, не тестировал, но вещь в продакшене полезная.

4. Suno (третье видео). Выпустили 4.5+. Улучшение по всем параметрам, добавлено множество крутилок для контроля. Очень нравится. Отдельная ПЕСНЯ — это каверы. Об этом — следующий пост.

5. Маск и Co. Выпустили Grok 4, а в своё приложение добавили аниме-аватаров, с которыми можно поболтать (и выключить NSFW-фильтр). По бенчмаркам — супер, но сам использовал Grok примерно один раз.

6. Higgsfield. Теперь картиночную модель Soul (натренированную на Flux) можно дообучить и генерить aEsThEtiC-кадры с собой (или своим котом). Испытывает классические флюксо-симптомы — например, шакалинг на общих планах.

7. Veo-3. Стал доступен почти везде, но если выходите из Европы — будет недоступна загрузка реалистичных людей в img-to-video. Также твиттерские нейроцыгане активно форсят JSON-промтинг. Никаких преимуществ у него не выявил — кроме структурности (для человека).

8. Ну и вишенка. Топовый инвестор OpenAI поехал кукушечкой после общения с ChatGPT. Случай далеко не первый — здесь можно почитать подробности. Мораль — если у вас, например, мания, лучше воздержаться от LLM'ок, которые легко подкинут дровишек в её пламя.

Пойду дальше разгружать вагоны с проектами.
Пишите, если что-то забыл. 🤔
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
48🔥12653👍29👻4😱1
This media is not supported in your browser
VIEW IN TELEGRAM
Небольшая, но приятная новость — в Midjourney video завезли конечные кадры.

Видеоделы знают, насколько полезна эта функция и как её не хватает в топовых img-to-video моделях (Kling 2.1, Veo-3, Minimax Hailluo 2). Из нового поколения разве что только Luma Ray 2.1 её поддерживает. Так что — молодцы, Midjourney. А почему стоит включить их видеомодель в свой пайплайн — писал здесь.
73🔥34👍18
This media is not supported in your browser
VIEW IN TELEGRAM
Сейчас будет пост.
🔥56👍148👻3
Черепашки - Народная
Suno 4.5+ — кайф. 😮

Давайте поговорим про функцию Cover в Suno. Точнее, послушаем. Сделал мини-альбом каверов на опенинг из старого мультика про Черепашек-ниндзя.

Если коротко: Cover — круто. Загружаете мелодию / трек / напев с микрофона, крутите настройки, пишете промт — и у вас качественный кавер в любой аранжировке за минуту. Если бы я был музыкантом — сочинял бы черновики и сразу прогонял их через Cover, чтобы протестировать разные ходы, а потом писал на чистовую.

Несколько особенностей по моим тестам:

1) Не даёт загружать известные треки и тексты.

Но, например, русский рок за "известную музыку" особо не считается.
Если ругается на текст — попробуйте заменить некоторые буквы на фонетически близкие или убрать один куплет.

2) Настройки. Есть три ползунка:

🥴 Weirdness — лучше не трогать или понижать.
Выше 50% — и начинается каша.

😎 Style Influence — влияет на силу промта.
Для каверов хорошо работает диапазон 80–100%.

🎧 Audio Influence — определяет, насколько кавер будет близок к загруженному аудио по структуре и мелодике. Здесь всё зависит от жанра и задачи.
У меня хорошо работало в диапазоне 10–50% — чтобы модель интерпретировала по-своему, но сохраняла узнаваемость оригинала.

Естественно, только в платной подписке (но это того стоит). 🙃

P.S: Почему-то при репосте поста с приклеенным аудио не отображается канал. Знайте, что он из Ai molodca. Ну и подписывайтесь!
Please open Telegram to view this post
VIEW IN TELEGRAM
4🔥25559👍38😱11