Лаборатория ИИ
2.25K subscribers
878 photos
604 videos
25 files
1.07K links
Лаборатория ИИ
Эксперименты и интересные материалы на тему ИИ в архитектурном проектировании и не только.

По всем вопросам 24/7
@arthiteca
Download Telegram
#unrealneural #ЛабораторияИИ
Gemini 3.0 pro и генерация башни сложной формы

вот промпт
Создай башню в 25 этажей. 
1. 1 этаж прямоугольной формы размером 35 на 50 метров.
2. с 1 по 5 этаж форма плавно превращается в прямоугольный треугольник с катетами 35 на 50 метров
3. 6 этаж равен 5 с вырезанным углом в глубину 5 м
4. с 6 по 15 одинаковые этажи
5. с 15 по 17 глубина выреза увеличивается еще на 2 м
6. с 17 по 25 форма этажа плавно меняется в квадрат со сторонами 15 м на 15 м


В комментариях будет obj файл результата генерации
👍3❤‍🔥1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
MoCA

Новый метод sparse attention для композиционной 3D-генерации

https://github.com/lizhiqi49/MoCA
👍311
Media is too big
VIEW IN TELEGRAM
#unrealneural
Qwen3-Omni-Flash

По описанию есть ряд улучшений, но будем проверять ⚡️⚡️⚡️

1. Взаимодействие с аудио- и видеооборудованием: Значительное улучшение усвоения инструкций. Решает проблему «упрощения» в неформальных чатах, обеспечивая безупречную стабильность.
2. Точный контроль: Усовершенствованная система обеспечивает оперативное соответствие определенным типам пользователей, стилям и продолжительности.
3. Многоязычная поддержка: Исправлена ​​нестабильность переключения языков. Теперь поддерживаются 119 языков текста, 19 для распознавания речи и 10 для генерации речи.
4. Речь, похожая на речь человека: адаптивная скорость и просодия. Больше никакого запаздывания — звучит как речь настоящего человека.

https://huggingface.co/spaces/Qwen/Qwen3-Omni-Demo
21👍1
Меня периодически спрашивают, как я генерю комиксы. Выношу из комментов, ибо многие могли пропустить.

Примерно так:

https://gonzoml.substack.com/p/visualizing-research-how-i-use-gemini
17🔥31
Forwarded from Data Secrets
⚡️ Вышла GPT-5.2

– Модель заметно прокачали в кодинге, математике и работе на длинных контекстах и с изображениями. На AIME 25 у нее теперь 100% (GPT-5.1 била 94), а на SWE-bench Verified – 80% (вместо 76.3 у 5.1).

– По бенчмаркам OpenAI упрямо сравнивает свою модель только с ее же предыдущими версиями, игнорируя конкурентов. Но по уровню выглядит даже чуть лучше Gemini 3 Pro.

– В ChatGPT GPT‑5.2 Instant, Thinking и Pro начнут катать уже сегодня, в API доступ открыт. Цена относительно 5.1 и 5 немного повысилась, см последний скрин.

В целом OpenAI как будто действительно постарались на этот раз. Вот что конкуренция творит!

https://openai.com/index/introducing-gpt-5-2/
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍31
😱311😁1
Forwarded from Denis Sexy IT 🤖
Вчера игрался с новой GPT 5.2 Pro, в которой теперь есть два режима:

– Подумать
– И подумать подольше

И показал ей эту известную картину "Вавилонской башни" (понятно, что это выдумка автора, такого здания не существовало), и попросил в питоне сделать мне схему того как это здание выглядит, построить 3D модель и посчитать какая жилплощадь там вообще теоретически возможна

Pro 5.2 шуршала на каждый вопрос 20-30 минут, но мне кажется прекрасно справилась (а еще, забавно, что саму башню она вырезала из оригинала по пикселям и координатам, не какой-то другой моделью для удаления фона с картинок – буквально обвела контур).

Вот по размерам:

Если “Башню Вавилонскую” из картины мысленно привести к реальному масштабу уровня Колизея, то получается примерно 18 крупных “ярусных” этажей (по ~6 м высоты), ~170 000 м² общей площади (брутто) и ориентировочно ~800–1100 квартир в комфортном сценарии или ~1400–1900 квартир при максимально плотной нарезке.

– Высота порядка ~100–110 м
Это примерно как современная башня на 30–35 обычных этажей по 3 м, но в картине уровни выглядят как высокие аркадные ярусы, поэтому “реальных” этажей меньше.

– Диаметр у основания порядка ~190 м
Для сравнения: это почти в 1,8 раза длиннее футбольного поля (105 м), и по габариту очень близко к масштабу крупного античного амфитеатра.


Я уже писал много раз, что ChatGPT Pro это один из самых лучших продуктов OpenAI, напишу еще раз

P.S. По API эту модель можно не тестировать, она медленная и одна из самых дорогих в мире
👍611
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
OmniPSD

Многоуровневая генерация PSD с диффузионным трансформером

https://huggingface.co/papers/2512.09247
👍21
эйай ньюз
По мнению Яна, настоящий интеллект — это не просто предсказание следующего слова. Моделям нужна настоящая связь с физическим миром, AI системы должны понимать физический мир, иметь постоянную память, уметь рассуждать и планировать сложные цепочки действий. Это и есть его концепция World Models. Простой пример: eсли бы у нас была "модель мира" (World Model), то мы могли бы научить системы уверенно предсказывать, что произойдёт дальше в физическом мире – например роборука заранее бы могла предсказать, что произойдет если столкнуть кружку со стола.
#пытаюсьпонять
Позиции Яна Лекуна отчасти совпадает и с мнением Ильи Суцкевера, который тоже сейчас идёт в ту же сторону (смотрел недавно его интервью)

Путь к AGI лежит не через всё большие и большие Трансформеры (которые уже исчерпали потенциал завышенных ожиданий на мой взгляд), а через архитектуру, которая изначально строит внутреннюю модель физического мира (цитата подчеркивает зачем это нужно).

Как это может пересекаться с архитектурным проектированием? Вопрос открытый

Однако, подобный подход явно позволит ИИ решать ряд дискриминативных задач - инсоляция, конструктивные задачи, ветровые нагрузки и т.д. Это то без чего невозможно проектировать архитектору, а следовательно и ИИ.
🤔2👍1