Метаверсище и ИИще
35.1K subscribers
4.48K photos
2.6K videos
40 files
5.5K links
Это не новости, это персональный экспертный взгляд на то, как развивается индустрия ИИ, графики, метаверса, крипты, нейротехнологий и в каком направлении катится все это безобразие.
Для связи: @SergeyTsyptsyn
Download Telegram
Media is too big
VIEW IN TELEGRAM
Mocha 2025 - Object Brush

В новую версию Mocha завезли нейроротоскоп.
Если это в реальности работает хорошо как на видео (сомневаюсь), то глядишь, всякие громоздкие костыли станут не нужны

#roto #video2mask
Forwarded from Denis Sexy IT 🤖
Что показали сегодня, анонсы в основном для разработчиков:

- O1 модели теперь поддерживают строгие JSON схемы на выходе (и это не повлияет на качество работы модели) и Functions calling (это когда модель должна выбрать какой-то скрипт сама по себе во время ответа), фичи которые давно есть у других моделей OpenAI

- Упомянули «Developers Messages» для O1 — штука, которая позволяет разработчиком «направить» модель в нужную сторону в процессе ответа, что-то вроде второго системного промпта, но слабее

- «Reasoning Effort» — вы теперь можете указать сколько времени O1-модель будет «размышлять» перед тем как ответить, ответы будут лучше, но дороже или можно запретить ей слишком много думать перед ответом пользователю

- O1 API теперь поддерживает картинки на вход

- Advanced Voice Mode API теперь работает с WebRTC, то есть голосового ассистента OpenAI будет проще встраивать на веб-страницы без особых мучений (12 строк кода и готово)

- Наконец-то цены на Advanced Voice Mode API понизили на 60%, и теперь доступна новая, в 10 раз дешевле, mini-аудио моделька

- Показали новый способ файнтюна моделей «Prefence Finetuning» — можно тренировать на парах данных, что нравится и не нравится в ответе модели, доступно с сегодня для gpt4o & gpt4o-mini

- Вышли новые SDK — для Go и для Java

Если честно затянуто немного со всеми этими днями, я бы списком почитал уже, еще 3 дня осталось
Ну, за Сора. Не чокаясь

Вы извините, но у нас снова про видеогенераторы.

В твиттор хлынули тесты Veo2 - генератора видео от Гугла.

По крайней мере, это уже не черрипики с сайта и можно оценить реальное качество.

И оно, похоже, очень и очень неплохое.

Поглядите только на сцены из Прибытия, пересобранные с Veo.

Но есть один маленький момент. Гугл, как обычно, очень перестраховывается с цензурой.
Поэтому вместо Image2video у них text2image2video - вы не можете подсунуть свои картинки на вход, вы можете их только сгенерить в самом генераторе и уже из них он сделает видео. Это позволяет отсечь всякие глупости, которые вы будете пихать в него.

@cgevent
Jetson Orin Nano Super

Все молчат вот про такой буквально новоиспеченный девайс от Нвидия.

https://www.nvidia.com/en-us/autonomous-machines/embedded-systems/jetson-orin/nano-super-developer-kit/

AI Performance 67 INT8 TOPS
GPU NVIDIA Ampere architecture with 1024 CUDA cores and 32 tensor cores
CPU 6-core Arm® Cortex®-A78AE v8.2 64-bit CPU 1.5MB L2 + 4MB L3
Memory 8GB 128-bit LPDDR5
102 GB/s
Storage Supports SD card slot and external NVMe
Power 7W–25W

Внимание - 249 долларов за такую малышку.

Теперь пара моментов.

8 гигабайт памяти. В маркетинговых сообщениях значится такое - теперь вы можете запускать свои LLM на таких вот оконечных устройствах. Да, наверное 3B, 7B и даже 9B модели могут влезть в память. И Stable Diffusion тоже прекрасно поместится и даже SDXL.

Но надо понимать, что это не видеопамять, это shared memory (примерно как с новых маках). То есть в 8 гиг должны поместиться и модель, и операционка, и софт для запуска.

Далее, CPU - 6-core Arm® Cortex®-A78AE. Вопрос с операционной системой и софтом открыт.

Насколько я понимаю, память не самая быстрая.

Энергопотребление поражает. Своей низостью.

В любом случае, это очень прикольный девайс для использования ну в очень разных сегментах: робаты, автомобили, интерактивные инсталяции, тренажеры, всякие говорящие твари, включая робособак.

Вишенка. Если вам мало 8 гиг памяти, можете всегда купить более старую версию на 64 гигабайта. За ДВЕ тысячи долларов.

Видео с пекарем вот тут:
https://youtu.be/S9L2WGf1KrM

@cgevent