#unrealneural #AILAB #ЛабораторияИИ
GPT 5
Генерация изображений
Тестирую на архитектурные способности новую модель.
"Нарисуй 15 этажное здание с террасами. Фасад сделай параметричным, используй теплые и яркие цвета. День. Лето. Современное благоустройство."
GPT 5
Генерация изображений
Тестирую на архитектурные способности новую модель.
"Нарисуй 15 этажное здание с террасами. Фасад сделай параметричным, используй теплые и яркие цвета. День. Лето. Современное благоустройство."
👍5⚡4❤2👎1
#unrealneural #AILAB #ЛабораторияИИ
GPT 5
Генерация геометрии в obj
Тестирую на архитектурные способности новую модель.
"Сгенерируй 5-этажное здание с террасами в стиле Ф. Л. Райта с окнами и деталями фасада."
GPT 5
Генерация геометрии в obj
Тестирую на архитектурные способности новую модель.
"Сгенерируй 5-этажное здание с террасами в стиле Ф. Л. Райта с окнами и деталями фасада."
😁6🤔2⚡1💩1🗿1
Forwarded from ИИ и роботы в стройке
Интересная статья на Хабре о том, как на связке платформы n8n и ИИ автоматизировать бизнес-процессы в строительстве и архитектуре.
Внутри статьи три готовых процесса для проектировщиков и BIM:
🟢 Для конвертации файлов .rvt, .ifc, .dwg или .dgn в базу элементов (.xlsx-.csv) — экспортирует 3D-геометрию (.dae).
🟢 Для проверки качества данных CAD/BIM (Revit, AutoCAD, IFC, MicroStation).
🟢 Для расчёта объёмных параметров для одной из групп из CAD-(BIM)-моделей и генерации HTML-отчёта.
Автоматизация перестает быть конкурентным преимуществом и становится необходимым скиллом. Также как и ИИ. Так что осваиваем, если ещё не пробовали.
«Большая часть «офисной работы» (по субъективному опыту, CAD вместе с BIM занимает здесь 2–10%) — это бесконечный цикл Email—Excel—PDF—Excel—PDF—Email, повторяющийся каждый день — снова и снова. Это смертельно скучно и, что важнее, отнимает часы каждую неделю».
Внутри статьи три готовых процесса для проектировщиков и BIM:
Автоматизация перестает быть конкурентным преимуществом и становится необходимым скиллом. Также как и ИИ. Так что осваиваем, если ещё не пробовали.
Please open Telegram to view this post
VIEW IN TELEGRAM
❤5🔥2👍1🥰1
#unrealneural
R-Zero
От лаборатория Tencent AI
Структура, позволяющая большим языковым моделям самостоятельно развивать свои способности к рассуждению без использования данных, отобранных человеком, через автономный цикл "Испытатель-Решатель".
https://github.com/Chengsong-Huang/R-Zero
R-Zero
От лаборатория Tencent AI
Структура, позволяющая большим языковым моделям самостоятельно развивать свои способности к рассуждению без использования данных, отобранных человеком, через автономный цикл "Испытатель-Решатель".
https://github.com/Chengsong-Huang/R-Zero
👍3🔥3⚡1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
Copilot 3D от Микрософта.
Ещё один 3д генератор по картинке.
Бесплатен.
Нет настроек.
Вывод в GLB.
Плох в органике.
Лучше в мебели.
Я не сильно впечатлен.
https://copilot.microsoft.com/labs/experiments/3d-generations
@cgevent
Ещё один 3д генератор по картинке.
Бесплатен.
Нет настроек.
Вывод в GLB.
Плох в органике.
Лучше в мебели.
Я не сильно впечатлен.
https://copilot.microsoft.com/labs/experiments/3d-generations
@cgevent
Microsoft Copilot: Your AI companion
Copilot Labs: Discover experimental AI initiatives
Explore Copilot Labs - Microsoft's hub for experimental AI. Try bold AI experiments, co-create with the community, and help shape the future of Copilot
⚡2👍2
#unrealneural
From GPT-2 to gpt-oss: Analyzing the Architectural Advances
Автор-исследователь анализирует новые открытые модели OpenAI — gpt-oss-120b и gpt-oss-20b, подчеркивая их архитектурные усовершенствования, включая оптимизацию памяти и механизмов внимания, по сравнению с GPT-2. Модели адаптированы для локального использования, что делает их доступными для разработчиков с ограниченными ресурсами. Информативный обзор, демонстрирующий стремительное развитие архитектуры моделей до нового уровня.
https://magazine.sebastianraschka.com/p/from-gpt-2-to-gpt-oss-analyzing-the?r=1csfkw
From GPT-2 to gpt-oss: Analyzing the Architectural Advances
Автор-исследователь анализирует новые открытые модели OpenAI — gpt-oss-120b и gpt-oss-20b, подчеркивая их архитектурные усовершенствования, включая оптимизацию памяти и механизмов внимания, по сравнению с GPT-2. Модели адаптированы для локального использования, что делает их доступными для разработчиков с ограниченными ресурсами. Информативный обзор, демонстрирующий стремительное развитие архитектуры моделей до нового уровня.
https://magazine.sebastianraschka.com/p/from-gpt-2-to-gpt-oss-analyzing-the?r=1csfkw
❤3⚡1👍1
#unrealneural #ЛабораторияИИ
GNN + BIM для генерирования планировок и автоматического формирования моделей
В статье "From Photons to Physics: Autonomous Indoor Drones and the Future of Objective Property Assessment"("От фотонов к физике: автономные дроны для помещений и будущее объективной оценки недвижимости") подробно отмечают тренд: обученные на тысячах проектов графовые нейросети могут генерировать планировки, сразу формируя соответствующие BIM‑объекты с корректной классификацией и связями по кодам. Это хороший маркер направления интеграции ИИ в BIM. Таким образом, связка GNN и BIM открывает путь к полностью автоматизированному проектированию, где архитектурная логика и нормативные требования соблюдаются уже на этапе генерации. В перспективе это позволит объединить проектирование, контроль и управление зданием в единую интеллектуальную систему, минимизируя человеческий фактор и ускоряя весь жизненный цикл объекта.
https://arxiv.org/html/2508.01965v1?
GNN + BIM для генерирования планировок и автоматического формирования моделей
В статье "From Photons to Physics: Autonomous Indoor Drones and the Future of Objective Property Assessment"("От фотонов к физике: автономные дроны для помещений и будущее объективной оценки недвижимости") подробно отмечают тренд: обученные на тысячах проектов графовые нейросети могут генерировать планировки, сразу формируя соответствующие BIM‑объекты с корректной классификацией и связями по кодам. Это хороший маркер направления интеграции ИИ в BIM. Таким образом, связка GNN и BIM открывает путь к полностью автоматизированному проектированию, где архитектурная логика и нормативные требования соблюдаются уже на этапе генерации. В перспективе это позволит объединить проектирование, контроль и управление зданием в единую интеллектуальную систему, минимизируя человеческий фактор и ускоряя весь жизненный цикл объекта.
https://arxiv.org/html/2508.01965v1?
⚡3👍2❤1
#unrealneural
CAD-Judge — верифицируемый text2CAD генератор
Описывается система с верифицируемым модулем оценки качества text2CAD моделей. Архитектура сочетает быстрый прямой сигнал вознаграждения (Compiler-as-a-Judge) и проверку результатов (Compiler-as-a-Review), а также агентный цикл для исправления ошибок генерации. Эксперименты подтверждают высокую точность и эффективность метода.
https://arxiv.org/html/2508.04002v1
CAD-Judge — верифицируемый text2CAD генератор
Описывается система с верифицируемым модулем оценки качества text2CAD моделей. Архитектура сочетает быстрый прямой сигнал вознаграждения (Compiler-as-a-Judge) и проверку результатов (Compiler-as-a-Review), а также агентный цикл для исправления ошибок генерации. Эксперименты подтверждают высокую точность и эффективность метода.
https://arxiv.org/html/2508.04002v1
🔥3👍2⚡1
#unrealneural
"Неравный брак. Продолжение."
Сходил в Третьяковскую галерею и не удержался пофантазировать на тему продолжения картины «Неравный брак» (Василий Пукирев, 1862).
Насколько же умны сейчас мультимодальные модели, что способны не только распознавать сюжет, придумывать оригинальное продолжение 😃 и детали, но и сохранять стилистику, передавая эмоции.
"Неравный брак. Продолжение."
Сходил в Третьяковскую галерею и не удержался пофантазировать на тему продолжения картины «Неравный брак» (Василий Пукирев, 1862).
Насколько же умны сейчас мультимодальные модели, что способны не только распознавать сюжет, придумывать оригинальное продолжение 😃 и детали, но и сохранять стилистику, передавая эмоции.
😁17🔥6
Forwarded from Psy Eyes
SkyWorks: выпустили Matrix-3D, генератор 3D миров, работающий на связке видеогенерации и 3D реконструкции. Это своеобразная ответочка Hunyuan World 1 от Tencent, проекту Odyssey, и анонсированному Genie 3 от гугла.
Пишешь промт или кидаешь картинку на вход, и получаешь на выбор видеопанораму или 3D сцену, по которой можно перемещаться. Вот только делать это похоже придётся через задание траектории. Тот же World 1 судя по демкам поддерживал геймпад.
Генерить можно в разрешениях 960 × 480 или 1440 × 720. На одной A800 с 40 ГБ VRAM рендер 720p замёт около часа... словно Far Cry телепортировался из прошлого, чтобы научить тебя китайскому.
Гитхаб
Хаггинг
Пишешь промт или кидаешь картинку на вход, и получаешь на выбор видеопанораму или 3D сцену, по которой можно перемещаться. Вот только делать это похоже придётся через задание траектории. Тот же World 1 судя по демкам поддерживал геймпад.
Генерить можно в разрешениях 960 × 480 или 1440 × 720. На одной A800 с 40 ГБ VRAM рендер 720p замёт около часа... словно Far Cry телепортировался из прошлого, чтобы научить тебя китайскому.
Гитхаб
Хаггинг
⚡4❤3👍1
#unrealneural
Bifrost-1
Объединение мультимодальных моделей LLM и моделей диффузии с латентными элементами CLIP на уровне патчей
https://huggingface.co/papers/2508.05954
Bifrost-1
Объединение мультимодальных моделей LLM и моделей диффузии с латентными элементами CLIP на уровне патчей
https://huggingface.co/papers/2508.05954
❤2⚡1👍1
#unrealneural
MolmoAct
Модели действий, которые могут рассуждать в пространстве.
Через восприятие, планирование и управление создаются точные действия, превосходя конкурентов в симуляциях и реальных задачах. Модель легко адаптируется к новым условиям и демонстрирует выдающиеся результаты в сложных операциях.
https://huggingface.co/papers/2508.07917
MolmoAct
Модели действий, которые могут рассуждать в пространстве.
Через восприятие, планирование и управление создаются точные действия, превосходя конкурентов в симуляциях и реальных задачах. Модель легко адаптируется к новым условиям и демонстрирует выдающиеся результаты в сложных операциях.
https://huggingface.co/papers/2508.07917
⚡2👍2🔥1
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Метачка только что сделала ИИ, который знает, что будет делать ваш мозг еще до того, как вы нажмете кнопку воспроизведения видео, и для этого ему не нужно проводить ни одного сканирования мозга.
Они выпустили модель TRIBE, нейронную сеть с 1B параметров, которая предсказывает реакцию человеческого мозга на фильмы, анализируя видео, аудио и текст.
TRIBE анализирует видео, аудио и диалоги из фильмов, точно предсказывая, какие зоны мозга зрителя активизируются без какого-либо сканирования мозга.
После тренировки на испытуемых, просмотревших 80 часов телепередач и фильмов, искусственный интеллект правильно предсказал более половины моделей мозговой активности в 1000 областях мозга.
Лучше всего он работает в областях мозга, где сливаются зрение, звук и язык, превосходя на 30 % модели с одним чувством.
Система Meta также показала особую точность в лобных областях мозга, которые контролируют внимание, принятие решений и эмоциональную реакцию на контент.
В перспективе такая разработка предлагает новые формулы для максимизации внимания на нейронном уровне, что потенциально может сделать думскроллинг еще более аддиктивным.
Ещё раз, на входе видео. На выходе информация какие зоны мозга возбуждаются.
И да, мультимодальность воздействует сильнее.
https://github.com/facebookresearch/algonauts-2025
https://arxiv.org/abs/2507.22229
Контент, от которого нельзя оторваться. Писал об этом в фб лет 12 назад.
@cgevent
Они выпустили модель TRIBE, нейронную сеть с 1B параметров, которая предсказывает реакцию человеческого мозга на фильмы, анализируя видео, аудио и текст.
TRIBE анализирует видео, аудио и диалоги из фильмов, точно предсказывая, какие зоны мозга зрителя активизируются без какого-либо сканирования мозга.
После тренировки на испытуемых, просмотревших 80 часов телепередач и фильмов, искусственный интеллект правильно предсказал более половины моделей мозговой активности в 1000 областях мозга.
Лучше всего он работает в областях мозга, где сливаются зрение, звук и язык, превосходя на 30 % модели с одним чувством.
Система Meta также показала особую точность в лобных областях мозга, которые контролируют внимание, принятие решений и эмоциональную реакцию на контент.
В перспективе такая разработка предлагает новые формулы для максимизации внимания на нейронном уровне, что потенциально может сделать думскроллинг еще более аддиктивным.
Ещё раз, на входе видео. На выходе информация какие зоны мозга возбуждаются.
И да, мультимодальность воздействует сильнее.
https://github.com/facebookresearch/algonauts-2025
https://arxiv.org/abs/2507.22229
Контент, от которого нельзя оторваться. Писал об этом в фб лет 12 назад.
@cgevent
⚡2🤯2👍1