#unrealneural #ЛабораторияИИ
Gemini 3.0 pro и генерация башни сложной формы
вот промпт
В комментариях будет obj файл результата генерации
Gemini 3.0 pro и генерация башни сложной формы
вот промпт
Создай башню в 25 этажей.
1. 1 этаж прямоугольной формы размером 35 на 50 метров.
2. с 1 по 5 этаж форма плавно превращается в прямоугольный треугольник с катетами 35 на 50 метров
3. 6 этаж равен 5 с вырезанным углом в глубину 5 м
4. с 6 по 15 одинаковые этажи
5. с 15 по 17 глубина выреза увеличивается еще на 2 м
6. с 17 по 25 форма этажа плавно меняется в квадрат со сторонами 15 м на 15 м
В комментариях будет obj файл результата генерации
👍3❤🔥1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
MoCA
Новый метод sparse attention для композиционной 3D-генерации
https://github.com/lizhiqi49/MoCA
MoCA
Новый метод sparse attention для композиционной 3D-генерации
https://github.com/lizhiqi49/MoCA
👍3❤1⚡1
Media is too big
VIEW IN TELEGRAM
#unrealneural
Qwen3-Omni-Flash
По описанию есть ряд улучшений, но будем проверять ⚡️⚡️⚡️
1. Взаимодействие с аудио- и видеооборудованием: Значительное улучшение усвоения инструкций. Решает проблему «упрощения» в неформальных чатах, обеспечивая безупречную стабильность.
2. Точный контроль: Усовершенствованная система обеспечивает оперативное соответствие определенным типам пользователей, стилям и продолжительности.
3. Многоязычная поддержка: Исправлена нестабильность переключения языков. Теперь поддерживаются 119 языков текста, 19 для распознавания речи и 10 для генерации речи.
4. Речь, похожая на речь человека: адаптивная скорость и просодия. Больше никакого запаздывания — звучит как речь настоящего человека.
https://huggingface.co/spaces/Qwen/Qwen3-Omni-Demo
Qwen3-Omni-Flash
По описанию есть ряд улучшений, но будем проверять ⚡️⚡️⚡️
1. Взаимодействие с аудио- и видеооборудованием: Значительное улучшение усвоения инструкций. Решает проблему «упрощения» в неформальных чатах, обеспечивая безупречную стабильность.
2. Точный контроль: Усовершенствованная система обеспечивает оперативное соответствие определенным типам пользователей, стилям и продолжительности.
3. Многоязычная поддержка: Исправлена нестабильность переключения языков. Теперь поддерживаются 119 языков текста, 19 для распознавания речи и 10 для генерации речи.
4. Речь, похожая на речь человека: адаптивная скорость и просодия. Больше никакого запаздывания — звучит как речь настоящего человека.
https://huggingface.co/spaces/Qwen/Qwen3-Omni-Demo
⚡2❤1👍1
Forwarded from gonzo-обзоры ML статей
Меня периодически спрашивают, как я генерю комиксы. Выношу из комментов, ибо многие могли пропустить.
Примерно так:
https://gonzoml.substack.com/p/visualizing-research-how-i-use-gemini
Примерно так:
https://gonzoml.substack.com/p/visualizing-research-how-i-use-gemini
Substack
Visualizing Research: How I Use Gemini 3.0 to Turn Papers into Comics
Lately, I’ve been actively experimenting with the new Gemini 3.0, and I like it.
1❤7🔥3⚡1
Forwarded from Data Secrets
– Модель заметно прокачали в кодинге, математике и работе на длинных контекстах и с изображениями. На AIME 25 у нее теперь 100% (GPT-5.1 била 94), а на SWE-bench Verified – 80% (вместо 76.3 у 5.1).
– По бенчмаркам OpenAI упрямо сравнивает свою модель только с ее же предыдущими версиями, игнорируя конкурентов. Но по уровню выглядит даже чуть лучше Gemini 3 Pro.
– В ChatGPT GPT‑5.2 Instant, Thinking и Pro начнут катать уже сегодня, в API доступ открыт. Цена относительно 5.1 и 5 немного повысилась, см последний скрин.
В целом OpenAI как будто действительно постарались на этот раз. Вот что конкуренция творит!
https://openai.com/index/introducing-gpt-5-2/
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍3⚡1
Forwarded from Denis Sexy IT 🤖
Вчера игрался с новой GPT 5.2 Pro, в которой теперь есть два режима:
– Подумать
– И подумать подольше
И показал ей эту известную картину "Вавилонской башни" (понятно, что это выдумка автора, такого здания не существовало), и попросил в питоне сделать мне схему того как это здание выглядит, построить 3D модель и посчитать какая жилплощадь там вообще теоретически возможна
Pro 5.2 шуршала на каждый вопрос 20-30 минут, но мне кажется прекрасно справилась (а еще, забавно, что саму башню она вырезала из оригинала по пикселям и координатам, не какой-то другой моделью для удаления фона с картинок – буквально обвела контур).
Вот по размерам:
Я уже писал много раз, что ChatGPT Pro это один из самых лучших продуктов OpenAI, напишу еще раз
P.S. По API эту модель можно не тестировать, она медленная и одна из самых дорогих в мире
– Подумать
– И подумать подольше
И показал ей эту известную картину "Вавилонской башни" (понятно, что это выдумка автора, такого здания не существовало), и попросил в питоне сделать мне схему того как это здание выглядит, построить 3D модель и посчитать какая жилплощадь там вообще теоретически возможна
Pro 5.2 шуршала на каждый вопрос 20-30 минут, но мне кажется прекрасно справилась (а еще, забавно, что саму башню она вырезала из оригинала по пикселям и координатам, не какой-то другой моделью для удаления фона с картинок – буквально обвела контур).
Вот по размерам:
Если “Башню Вавилонскую” из картины мысленно привести к реальному масштабу уровня Колизея, то получается примерно 18 крупных “ярусных” этажей (по ~6 м высоты), ~170 000 м² общей площади (брутто) и ориентировочно ~800–1100 квартир в комфортном сценарии или ~1400–1900 квартир при максимально плотной нарезке.
– Высота порядка ~100–110 м
Это примерно как современная башня на 30–35 обычных этажей по 3 м, но в картине уровни выглядят как высокие аркадные ярусы, поэтому “реальных” этажей меньше.
– Диаметр у основания порядка ~190 м
Для сравнения: это почти в 1,8 раза длиннее футбольного поля (105 м), и по габариту очень близко к масштабу крупного античного амфитеатра.
Я уже писал много раз, что ChatGPT Pro это один из самых лучших продуктов OpenAI, напишу еще раз
P.S. По API эту модель можно не тестировать, она медленная и одна из самых дорогих в мире
👍6❤1⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
OmniPSD
Многоуровневая генерация PSD с диффузионным трансформером
https://huggingface.co/papers/2512.09247
OmniPSD
Многоуровневая генерация PSD с диффузионным трансформером
https://huggingface.co/papers/2512.09247
👍2⚡1
эйай ньюз
По мнению Яна, настоящий интеллект — это не просто предсказание следующего слова. Моделям нужна настоящая связь с физическим миром, AI системы должны понимать физический мир, иметь постоянную память, уметь рассуждать и планировать сложные цепочки действий. Это и есть его концепция World Models. Простой пример: eсли бы у нас была "модель мира" (World Model), то мы могли бы научить системы уверенно предсказывать, что произойдёт дальше в физическом мире – например роборука заранее бы могла предсказать, что произойдет если столкнуть кружку со стола.
#пытаюсьпонять
Позиции Яна Лекуна отчасти совпадает и с мнением Ильи Суцкевера, который тоже сейчас идёт в ту же сторону (смотрел недавно его интервью)
Путь к AGI лежит не через всё большие и большие Трансформеры (которые уже исчерпали потенциал завышенных ожиданий на мой взгляд), а через архитектуру, которая изначально строит внутреннюю модель физического мира (цитата подчеркивает зачем это нужно).
Как это может пересекаться с архитектурным проектированием? Вопрос открытый
Однако, подобный подход явно позволит ИИ решать ряд дискриминативных задач - инсоляция, конструктивные задачи, ветровые нагрузки и т.д. Это то без чего невозможно проектировать архитектору, а следовательно и ИИ.
Позиции Яна Лекуна отчасти совпадает и с мнением Ильи Суцкевера, который тоже сейчас идёт в ту же сторону (смотрел недавно его интервью)
Путь к AGI лежит не через всё большие и большие Трансформеры (которые уже исчерпали потенциал завышенных ожиданий на мой взгляд), а через архитектуру, которая изначально строит внутреннюю модель физического мира (цитата подчеркивает зачем это нужно).
Как это может пересекаться с архитектурным проектированием? Вопрос открытый
Однако, подобный подход явно позволит ИИ решать ряд дискриминативных задач - инсоляция, конструктивные задачи, ветровые нагрузки и т.д. Это то без чего невозможно проектировать архитектору, а следовательно и ИИ.
🤔2👍1