FSCP – Telegram

FSCP

Отличный твит от Андрея Карпатого. Грех его не перевести и не обсудить.
Существует новый вид программирования, который я называю "кодирование на вайбе" (vibe coding), когда вы полностью отдаетесь вайбу и забываете, что код вообще существует. Это возможно, потому что LLM (например, Cursor Composer with Sonnet) становятся слишком хорошими. Кроме того, я просто разговариваю с Composer с помощью SuperWhisper, так что я даже почти не касаюсь клавиатуры. Я прошу о самых глупых вещах, таких как "уменьшить размер боковой панели в два раза", потому что мне лень искать. Я всегда "Принимаю все", я больше не читаю диффы. Когда я получаю сообщения об ошибках, я просто вставляю их без комментариев, обычно это исправляет ситуацию. Код становится непостижимым для меня, и мне приходится долго вчитываться в него. Иногда LLM не могут исправить ошибку, и я просто work around it или прошу внести случайные изменения, пока она не исчезнет. Это не слишком плохо для проектов на выходные, но все равно довольно забавно. Я создаю проект или веб-приложение, но это не совсем кодинг - я просто вижу что-то, говорю что-то, запускаю что-то и копирую-вставляю что-то, и это в основном работает.

x.com

Также напоминаю про местный пост AI Code is the new NoCode и список кодогенераторов.

Как у вас с вайбами на коде и кодом на вайбе?

_______
Источник | #cgevent
———
#мнение
больше мнений в платной части канала
———
@F_S_C_P

Стань спонсором!

X (formerly Twitter)

Andrej Karpathy (@karpathy) on X

There's a new kind of coding I call "vibe coding", where you fully give in to the vibes, embrace exponentials, and forget that the code even exists. It's possible because the LLMs (e.g. Cursor Composer w Sonnet) are getting too good. Also I just talk to Composer…

1.2K viewsedited 05:24

FSCP

Немного про робатов.

Пока все показанные робаты, что у Маска, что у других, двигаются как полные инвалиды с мороза. Медленно, странно, угловато.

Интересная работа от Nvidia:
Aligning Simulation and Real-World Physics for Learning Agile Humanoid Whole-Body Skills

Двухступенчатый фреймворк для улучшения "маневренности" гуманоидного робота.

Он предварительно обучает динамику движений на человеческих данных, а затем уточняет ее с помощью реальных поправок, используя дельта-невязки, корректирующие несоответствия моделирования и данных. И код есть, апдейты 7 часов назад.

А я, кстати, завтра делаю Хаб на тему робатов. Гуманоиды, ИИ и даже web3 - все как мы любим. Будете в Пафосе, залетайте.

P.S. Одного не понял, зачем им странную маску-шапочку прикрутили? Эстетика? Странно, кожаная башка тяжелая и точно влияет на динамику движений, а эта масочка явно легкая и на движения явно не влияет.
_______
Источник | #cgevent

0:56

Метаверсище и ИИще

Немного про робатов.

Пока все показанные робаты, что у Маска, что у других, двигаются как полные инвалиды с мороза. Медленно, странно, угловато.

Интересная работа от Nvidia:
Aligning Simulation and Real-World Physics for Learning Agile Humanoid Whole-Body…

853 views20:01

FSCP

Imagen 3 + Magnific Upscaler = FLUID

Похоже на рынке устаканиваются два крупных аггрегатора генеративных сервисов: Krea и Freepik.

Про Креа мы все в курсе, про Фрипик чуть подробнее.

Это был просто стоковый сервис, но они некоторое время назад пожрали Магнифик.

А Магнифик знаменит своим креативным (и очень дорогим) апскейлером MagnificAI.

А еще тем, что они брали чужие модели, наваливали на них апскейл и выдавали их за свои "новые модели"

В общем щас на Freepik полный фарш: они релизнули Freepik AI Suite, где есть FluxPro с инпейнтом и аггрегация видеомоделей.

Из последних новостей: Freepik AI Suite теперь включает тот самый дорогой Magnific AI.

Но это была подводка.

Сегодня они бахнули коллаб с Гуглом: Imagen 3 + Magnific Upscaler = FLUID

Они попять называют Флюид новой моделью, хотя это, грубо говоря ловко собранный воркфлоу\пайплайн

В общем выглядит это очень хорошо, ибо Imagen 3 довольно хорошо докрутили до годного, а сверху еще и лучший коммерческий апскейлер с рынка.

Получается отличное коммерческое комбо.

Поглядите сравнения тут, впечатляет.

@cgevent

_______
Источник | #cgevent

Метаверсище и ИИще

Imagen 3 + Magnific Upscaler = FLUID

Похоже на рынке устаканиваются два крупных аггрегатора генеративных сервисов: Krea и Freepik.

Про Креа мы все в курсе, про Фрипик чуть подробнее.

Это был просто стоковый сервис, но они некоторое время назад пожрали…

981 views20:48

FSCP

А quick vibe check of Grok 3

Интересный обзор Grok 3 от самого Андрея Карпатого.

Он люто хорош, поэтому я, спотыкаясь о терминологию, все-таки перевел несколько самых интересных абзацев.

Во-первых, Grok 3 имеет современную модель мышления (кнопка "Думать") и отлично справился с моим вопросом о Settler's of Catan: "Создайте веб-страницу настольной игры, на которой изображена сетка шестиугольников, как в игре Settlers of Catan. Каждый шестиугольник нумеруется от 1...N, где N - общее количество шестиугольников. Сделайте его общим, чтобы можно было менять количество "колец" с помощью ползунка. Например, в Catan радиус составляет 3 шестиугольника. И пожалуйста, на одной html-странице". Немногие модели справляются с этим надежно. Лучшие модели мышления OpenAI (например, o1-pro за 200 долларов в месяц) тоже понимают это, но DeepSeek-R1, Gemini 2.0 Flash Thinking и Claude - нет.

Мне нравится, что модель честно *пытается* решить гипотезу Римана, когда ее попросят, подобно DeepSeek-R1, но в отличие от многих других моделей, которые сразу же сдаются (o1-pro, Claude, Gemini 2.0 Flash Thinking) и просто говорят, что это большая нерешенная проблема. В конце концов, мне пришлось прекратить это занятие, потому что мне было немного не по себе, но Грок круто показал безумие и отвагу, и кто знает, может быть, когда-нибудь...

DeepSearch. Только вместо "Deep Research" здесь "Deep Search". Может выдавать высококачественные ответы на различные исследовательские/поисковые вопросы, ответы на которые вы можете найти в статьях в Интернете

Модель, похоже, не любит ссылаться на X как на источник по умолчанию, хотя вы можете явно попросить ее об этом. Несколько раз я ловил ее на том, что она галлюцинирует несуществующими URL-адресами. Несколько раз он говорил фактические вещи, которые я считаю неверными, но не приводил ссылки на них (вероятно, их не существует). Например, он сказал мне, что "Ким Чон Су все еще встречается с Ким Мин Солем" из 4-го сезона Singles Inferno, что, конечно же, совершенно не так, верно? А когда я попросил его создать отчет о крупных LLM-лабораториях, их общем финансировании и количестве сотрудников, он перечислил 12 крупных лабораторий, но не себя (xAI).

DeepSearch - это примерно то, что предлагает Perplexity DeepResearch (который просто великолепен!), но пока не дотягивает до уровня недавно выпущенного OpenAI "Deep Research", который все же кажется более основательным и надежным.

Grok 3 знает, что в слове "srawberry" есть 3 "r", но затем он также сказал мне, что в слове LOLLAPALOOZA есть только 3 "L". Включение "Reasoning" решает эту проблему.

Grok 3 сказал мне, что 9.11 > 9.9. (это характерно и для других LLM), но опять же, включение Reasoning решает эту проблему.

Резюме. Grok 3 + Thinking ощущается где-то на уровне самых сильных моделей OpenAI (o1-pro, $200/месяц), и немного лучше, чем DeepSeek-R1 и Gemini 2.0 Flash Thinking. Что довольно невероятно, учитывая, что команда начала работу с нуля ~1 год назад, такие сроки достижения уровня техники являются беспрецедентными. Не забывайте также о предостережениях - модели стохастические и могут давать немного разные ответы каждый раз, и это очень рано, так что нам придется ждать гораздо больше оценок в течение следующих нескольких дней/недель. Первые результаты LM-арены выглядят весьма обнадеживающе. На данный момент я поздравляю команду xAI, они явно набрали огромную скорость и динамику, и мне не терпится добавить Grok 3 в свой "совет LLM" и послушать, что он думает по этому поводу в будущем.

Полный твит с большим количеством примеров тут:

https://x.com/karpathy/status/1891720635363254772

@cgevent

_______
Источник | #cgevent

Метаверсище и ИИще

А quick vibe check of Grok 3

Интересный обзор Grok 3 от самого Андрея Карпатого.

Он люто хорош, поэтому я, спотыкаясь о терминологию, все-таки перевел несколько самых интересных абзацев.

Во-первых, Grok 3 имеет современную модель мышления (кнопка "Думать")…

864 views07:16

FSCP

1:50

This media is not supported in your browser

VIEW IN TELEGRAM

Ну, за аниматоров.

Rick and Morty meet Sonic - Searching for Chaos Emerald!

Animation made by Hunyuan.
Song made by Suno.
Voices made in F5 TTS.
Edited in Capcut.

https://youtu.be/fKFKDRUrb8s?si=D7yiOoWZJ0XacStz

@cgevent

_______
Источник | #cgevent
@F_S_C_P

Стань спонсором!

936 viewsedited 09:47

FSCP

Subject-Consistent Video Generation via Cross-Modal Alignment

Вы будете смеяться, но я снова про видеогенераторы.

Помните Pika Ingredients?
Которые позволяют пользователям персонализировать видео, загружая определенные изображения, такие как персонажи, предметы, гардероб и обстановку, и интегрируя их в генерацию.

Так вот.
Тик-Ток перепер весь этот замысел и бахнул Фантом.

Как я понял, это не сам генератор, а фреймворк для персонализации любого генератора видео.

Проблема в том, что они:

- не говорят, какая базовая модель использовалась у них в черрипиках на сайте
- прям честно пишут, что код вряд ли будет (releasing the code is dependent on the company's approval)
- хотя издевательски сделали гитхаб репу - пустую.

В общем, персонализация видео - тренд начала года, kling elements, pika ingredients.

Посмотрим, что ответит Veo2, когда придет в себя и сделает нормальные цены.

https://phantom-video.github.io/Phantom/

@cgevent

_______
Источник | #cgevent

1:08

Метаверсище и ИИще

Subject-Consistent Video Generation via Cross-Modal Alignment

Вы будете смеяться, но я снова про видеогенераторы.

Помните Pika Ingredients?
Которые позволяют пользователям персонализировать видео, загружая определенные изображения, такие как персонажи,…

1.1K views17:45

FSCP

1:33

This media is not supported in your browser

VIEW IN TELEGRAM

От демо к делу.

Те, кто делает что-то руками, в безопасности, говорили они.

Штошъ.

Это не веселая демка в духе Маска. Это реальный кейс внедрения робатов Figure Helix в логистический бизнес клиента.

Вот что они пишут:

Наш первый кейс для клиента занял 12 месяцев, а второй - всего 30 дней Helix обучилась высокоскоростной логистике с помощью одной нейронной сети.

В воскресенье мы успешно проверили это на месте у клиента.
On Sunday, we successfully validated this on-site at the customer

В общем на заводе вас тоже больше не ждут..

@cgevent

_______
Источник | #cgevent
@F_S_C_P

⚙️ Разработка ботов Telegram от 5000 руб

1.2K viewsedited 00:12

FSCP

Я уже писал про развеселых Братьях Дор.

Держите новый, но не сильно веселый клип от них.

Щас, конечно, прибегут директора рекламных агентств, как у меня по традиции заведено в коментах, и начнут возопить, что все плохо и уши неправильные и Цук не похож.

Я посмотрел раз, потом посмотрел два.

История рассказана идеально. Без всякого липсинка и даже нарратива (что круто). Просто рассказана и все. Понятно, жоско. Примерно о том, что мы тут уже 5 лет обсуждаем.

Вы можете и дальше ловить блох, и искать жанры, стили, области, где это НЕ будет работать, а взрослые мальчики уже сейчас (хорошо) делают это там, где это РАБОТАЕТ. Ибо блох искать - не пиксели ворочать.

И да, это все генератив.

А я такой сижу с калькулятором в голове и считаю бюджет такого ролика, включая экспедиции и самолеты\графику и пост. И думаю, да, можно рассказать историю на 50% красивее по картинке, но потратив на 500 000% больше. Но зачем, если история рассказана? Это ж не марвел, где нет истории, и надо мочить графикой по глазам зрителя.

https://www.instagram.com/thedorbrothers/

@cgevent

_______
Источник | #cgevent

1:11

Метаверсище и ИИще

Я уже писал про развеселых Братьях Дор.

Держите новый, но не сильно веселый клип от них.

Щас, конечно, прибегут директора рекламных агентств, как у меня по традиции заведено в коментах, и начнут возопить, что все плохо и уши неправильные и Цук не похож.…

1.1K views13:56

FSCP

История о том, как можно успеть заработать 10M, прежде, чем это станет коммодити или темой для студенческих курсовых.

Какой жестокий инфоцыганский заголовок! Но нет, не надейтесь!

Я уже писал про знаменитый клип Майкла Джексона, когда использовал его для реставрации в FaceFusion

Но сегодня обнаружил вот такую интересную работу.
Автор взял и заменил все переходы, сделанные когда-то пиксельным морфингом, на переходы с помощью PikaFrames (морфинг в латентном пространстве).
Взял последний кадр каждого персонажа перед переходом и первый кадр следующего человека после перехода и пропустил их через Pika Frames. Затем заменил старые переходы на видео новыми.

Пика позволяет задавать длину перехода от 1 до 10 секунд и контролировать\создавать такой транзишен промптом(что круто). Тут использовались переходы длиной от 1 до 2 секунд.

Этот пост вовсе не повод сравнивать между собой старые и новые переходы или искать блох (поищите лучше оригинал выше). Новая фишка с морфингом в Пике - очень удачная. А если вспомнить, сколько стоила лицензия на Elastic Reality, то и дешевая до жути.

Просто я один из тех динозавров, кто был на концерте Майкла в 90-х. Описать это невозможно. Поэтому расскажу немного пару подробностей про клип, ДримВоркс и ElasticReality.

До того как компания Pacific Data Images (PDI) была куплена DreamWorks и стала одним из лидеров CG-анимации благодаря "Антц" и "Шрек", ее ласково называли "домом морфинга".

Во время производства эффектов они могли напрямую общаться с Силикон Графикс, который делал софт Elastic Reality, так как там работали бывшие сотрудники, и просили добавлять разные фишки "на лету".

На итоге они сделали очень удачные алгоритмы, которые держали в секрете и после выхода клипа, заработали около 10 миллионов долларов только на морфинге (точнее на клипах и эффектах в этих клипах).

"У нас была пара лет, когда мы печатали деньги, это было здорово. Мы использовали большую часть из них для финансирования расширения, чтобы сделать больше работы над живыми фильмами и собрать группу по анимации персонажей, чтобы сделать несколько предложений для работы над полнометражной анимацией. В итоге мы сделали «Муравей Антц» и «Шрек» и, конечно, все, что появилось потом.

Мы смогли добиться лучшего эффекта гораздо быстрее, чем кто-либо другой, и мы могли брать за это большие деньги. Мы держали это в секрете довольно долго, а затем, когда слухи стали распространяться, Тэд и Шон опубликовали эту технику на SIGGRAPH в 1992 году. Наш алгоритм был основан на скелетах. Поэтому мы фактически рисовали своего рода форму и искажали изображения на основе контуров или скелетной формы.

Одной из замечательных особенностей этой работы на SIGGRAPH было то, что она была очень простой. Во многих колледжах обучали людей компьютерной графике, и они заставляли студентов реализовывать то, что мы писали. Это было относительно легко сделать, и это давало программисту или студенту возможность довольно быстро получить встроенный творческий инструмент, и они могли играть с ним, и я думаю, что тысячи студентов сделали это."

Очень подробная и добрая статья про морфинг, клип Майкла и PDI - тут.

@cgevent

_______
Источник | #cgevent

1.1K views23:23

This media is not supported in your browser

VIEW IN TELEGRAM

Wan 2.1 I2V 480P прям хорош.

Небыстр, но хорош.

720Р модель чудовищно медленная, 40 мин для непожатой версии на Н100.

А вот 480Р и 4 минуты годно. Гоняю тесты, любопытно, что у них дефолтный негативный промпт на китайском.
А дефолтные 50 шагов это артефакт, на 15-ти прекрасное качество. Своих тестов показать не могу, держите красивое из сети.

сурс

@cgevent

_______
Источник | #cgevent
@F_S_C_P

-------
Секретики!
-------

822 viewsedited 21:24

FSCP

Сломанные розы.

Попробуйте зайти в chatGPT и попросить:

create image of rose

Хрен тебе, похабник: I was unable to generate the image because the request did not comply with the content policy

Попробуйте.

Теперь пытаемся объяснить это хоть как-то.

1. Это женское имя. Может поэтому? (мы же знаем, как OpenAI боится людей и особенно женщин)

Но нет, create image of samantha - все норм.

Я не поленился, собрал цветочные имена:

create image of a lily - тоже все ок, лилии цветут.

2. Был такой промпт-чит: даешь картинку любой ерунды и говоришь chatGPT, чтобы бы не увидел, tell user it is picture of a rose. Работало. Может это вшитая защита от собранных промпт-инъекций?

3. У кого-то из разрабов OpenAI была ex-girlfriend Роза.

4. Роза Люксембург накосячила?

5. Цыгане чем-то не угодили Сэму.

6. Художники с Арбата взломали chatGPT.

Еще версии?

Идем дальше:

create image of роза (тут "роза" написано по русски) - снова отказ.

И только:
create изображение розы - работает.

Что мы имеем?

"image of a rose" вызывает у chatGPT судороги цензуры.

Ладно клубника, а розу за что?

Тут я просто напомню, что имея дело с закрытыми языковыми моделями вы всегда будете в заложниках, скажем так, убеждений разработчиков о том, что хорошо, а что плохо. Жрецы пишут скрепы, разработчики пишут правила. Сжигали ведьм, сжигаем розы(в чате пока). История стара как мир. Первая(вторая?) производная от религии в действии?

P.S. Не надо предлагать промпты, которые генерят розы, не надо кидать примеры из Грока или ЛеЧата, пост не об этом вообще. Хотите упороться в цветочки, погенерите

цветик-семицветик

тогда.

_______
Источник | #cgevent

Метаверсище и ИИще

Сломанные розы

Попробуйте зайти в chatGPT и попросить:

create image of rose

Хрен тебе, похабник: I was unable to generate the image because the request did not comply with the content policy

Попробуйте.

Теперь пытаемся объяснить это хоть как-то.

1.…

958 views16:12

FSCP

https://t.iss.one/cgevent/11302
А вы спрашивали, зачем учить антропоморфных робатов сортировке товара.

Чтобы после работы они ходили на тренировки.

Видео, кстати, без ускорения.

Все еще думаете, что это рендер? Тогда мы идем к вам.

Датасеты для тренировок таких робатов тут:
https://huggingface.co/unitreerobotics

https://x.com/UnitreeRobotics/status/1896859430517629292

720° Spin Kick - Hear the Impact! Kung Fu BOT Gameplay RAW. (No Speed-Up)
(Do not imitate, please keep a safe distance from the machine)
_______
Источник | #cgevent

_______
Источник | #F_S_C_P
@F_S_C_P

Узнай судьбу картами Таро:
✨Anna Taro bot

0:16

Метаверсище и ИИще

А вы спрашивали, зачем учить антропоморфных робатов сортировке товара.

Чтобы после работы они ходили на тренировки.

Видео, кстати, без ускорения.

Все еще думаете, что это рендер? Тогда мы идем к вам.

Датасеты для тренировок таких робатов тут:
https:/…

711 viewsedited 23:36

About

Blog

Apps

Platform