AI LAB
1.96K subscribers
697 photos
460 videos
24 files
950 links
Лаборатория ИИ
Эксперименты и интересные материалы на тему ИИ в архитектурном проектировании и не только.

По всем вопросам 24/7
@arthiteca

Вопросы сотрудничества и соучастия
@j_fede
Download Telegram
#unrealneural
SGS-1 от Spectral Labs
Генератор CAD 3D-геометрии

https://www.spectrallabs.ai/research/SGS-1
👍21
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Claude + MCP + Rhinoceros

Моделирование башни с помощью Claude в Rhinoceros
53👍2
#unrealneural
Autodesk представляет новую категорию технологий - нейронные САПР (fundamental CAD models), которые используют генеративный ИИ для понимания и создания геометрии. Это следующий шаг после параметрических САПР, почти не менявшихся 40 лет, и альтернатива простому объединению LLM с классическими инструментами.

Autodesk утверждает: будущее проектирования - это нейронные САПР, которые соединяют язык, эскиз, данные и производство в единую систему.
https://adsknews.autodesk.com/en/news/upcoming-3d-generative-ai-foundation-models/
👍82🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
#Эксперименты #unrealneural #ЛабораторияИИ #AILAB
Генерация CAD геометрии по изометрическому изображению
🔥941😱1🤣1
#unrealneural
А вот и Autocad + MCP + Claude
Процесс черчения с помощью Claude кода и создание спецификации с помощью ChatGPT5. Наверняка скоро у всех автодеск продуктов появится официальные тулзы со связками LLM. Но что вот интересно: какую именно модель они там будут использовать? Предполагаю это будет что-то свое на базе Qwen 🤷🏻‍♂️🤷🏻‍♂️🤷🏻‍♂️ или нет 😃
🔥6👍2
#unrealneural
Grok 4 Fast

Мультимодальная модель с контекстным окном 2М, которая устанавливает новый стандарт для экономически эффективного ИИ
3👍3👌2
#unrealneural
200-страничная работа по LLM: ключевые выводы.

Предобучение: ИИ изучает данные через неконтролируемое и самоконтролируемое обучение. Архитектуры: кодировщики, декодеры, BERT, Трансформеры.

Генеративные модели: GPT-подобные модели для творчества. Тонкая настройка и RLHF обеспечивают специализацию и безопасность.

Промпт-инжиниринг: Контекстное обучение, цепочка мыслей и RAG для точных ответов.

Выравнивание ИИ: Тонкая настройка и RLHF для соответствия человеческим намерениям.

https://arxiv.org/pdf/2501.09223
3👍2
3👍3
#unrealneural
Исследователи Apple представляют AToken

Первый унифицированный визуальный токенизатор для высокоточной реконструкции и семантического понимания изображений, видео и 3D-ресурсов.
https://huggingface.co/papers/2509.14476

AToken, как универсальный токенизатор, который объединяет обработку изображений, видео и 3D-объектов в одном 4D-пространстве, обеспечивает точную реконструкцию и понимание. Он использует трансформерную архитектуру и устойчивое обучение без состязательности, поддерживая создание контента и анализ данных.

AToken может продвинуть индустрию ИИ, упрощая разработку мультимодальных систем и снижая затраты на создание универсальных моделей.
🤯5👍3💩1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
DeepSeek-V3.1-Terminus доступен на Hugging Face

Что нового?
Прощай, путаница в тексте🙃 Больше никаких раздражающих миксов из китайского, русского и английского, и странных символов, которые выглядят как сбой матрицы.

Режим агента 🔥 Кодовый агент и поисковик прокачали до уровня, где они не просто работают, а реально выручают. Пишешь код или ищешь инфу, модель теперь справляется как профи, быстро и по делу 🤝

Сразу затестил на Anycoder. Все ссылки и промпт в комментах.
🔥521👍1
#unrealneural #нейроразбор
Microsoft представляет нейронку латентного зонирования 🤗

Вышла статья про Latent Zoning Network (LZN), попробуем разобраться.

Вроде как предлагается единая модель, которая объединяет генерацию данных, представление и классификацию через общее скрытое пространство, где энкодеры и декодеры решают разные задачи. Но при этом результаты пока показаны на простых датасетах (CIFAR10, ImageNet), и неясно, как она справится с более сложными данными. 🤷🏻‍♂️

Это не проходная статья, так как LZN упрощает архитектуру, улучшает генерацию (FID 2.76 -> 2.59 на CIFAR10), превосходит MoCo и SimCLR в представлении данных и предлагает универсальный подход с открытым кодом.

https://huggingface.co/microsoft/latent-zoning-networks
3🤗2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #анализдокументов
ByteDance выпустила Dolphin
Это фреймворк для анализа документов, который преобразует PDF-файлы в структурированные форматы, такие как Markdown, HTML, LaTeX и JSON.

И что? 🤷🏻🤷🏻🤷🏻

Отсутствие прозрачных метрик производительности вызывает вопросы. Без тестов на реальных данных сложно доверять заявлениям о "высокой точности".

Для новичков Dolphin может быть сложным в настройке.

Если твои PDF на русском или содержат нестандартные шрифты/макеты, результат может быть непредсказуемым без предварительного тестирования.

Надо пробовать 😔
https://github.com/bytedance/Dolphin
👍31
#unrealneural
Qwen3-LiveTranslate-Flash: большой шаг в мультимодальном переводе

Что это и в чем фишка?
Qwen3-LiveTranslate-Flash — это мультимодальный инструмент для перевода в реальном времени. Он поддерживает 18 языков и 6 диалектов, понимает жесты, читает по губам, экранный текст и объекты, работает с минимальной задержкой в 3 секунды⚡️⚡️⚡️, обеспечивает точность офлайн-перевода и использует выразительные голоса.

Демо
https://huggingface.co/spaces/Qwen/Qwen3-Livetranslate-Demo
42👌2
#unrealneural
Встречайте Flush

ИИ, который по фото вашего 💩 выдаёт 20 параметров здоровья: от кишечника до стресса!
Трекер прогресса сделает каждый поход в туалет настоящим квестом с оценкой твоего "шедевра".

Первые 3 дня бесплатно 🤷🏻

Это важный шаг к использованию ИИ для здоровья
https://apps.apple.com/ru/app/flush-poop-gut-health-scan/id6748068252
💩14😁3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #нейроразбор
ИИ, который эволюционирует как природа 🌚

ShinkaEvolve от Sakana AI бьёт рекорды: упаковал 26 кругов лучше всех за 150 попыток (смотрите видео)
Это open-source магия для математики и ИИ.

Это и улучшение решения сложных задачи и про эффективную работ LLM.
Эта open-source технология поможет в геймдеве, математике, программировании и даже улучшить сами нейросети⚡️⚡️⚡️

https://sakana.ai/shinka-evolve/
5🤯21
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
FLUX.1 Kontext [Pro] теперь в Photoshop

Использование FLUX в Generative Fill позволяет легко редактировать изображения: создавать новые фоны, добавлять реалистичные элементы к существующим фотографиям или улучшать материалы.
43
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #AILAB #ЛабораторияИИ
Тестируем новые модели видеогенерации ⚡️

Использую только промпт, без первого кадра. Нашел подобные эксперименты в X и решил их немного адаптировать под другие темы.

Советую брать промпт и просить ЛЛМ просто адаптировать под нужную вам тематику.

Промпт и другие результаты смотрите в комментариях 👍🏻
64👍4
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Изолированные группы нейронов, пытающихся соединиться друг с другом через микротоннели, запечатленные в покадровой съемке с помощью микроскопа.
Красиво ⚡️⚡️⚡️
117👍1🦄1
#unrealneural
AlphaEvolve от Google DeepMind: прорыв в теории сложности

AlphaEvolve, инструмент ИИ от Google DeepMind, представленный в мае 2025, сделал важный шаг в теоретической информатике. Он помог доказать новые теоремы в теории сложности - области, изучающей пределы возможностей алгоритмов.

Как это работает? Вместо создания доказательств с нуля AlphaEvolve находит новые комбинаторные структуры, которые усиливают существующие методы. Это привело к двум ключевым достижениям:
- Улучшена граница неаппроксимируемости для задачи MAX-4-CUT, показав, насколько точно можно решать эту задачу оптимизации.
- Обнаружены ранее неизвестные графы Рамануджана - математические структуры с доказанной корректностью, полезные для информатики.

Эти результат можно прочитать тут

https://arxiv.org/abs/2509.18057
👍32
#unrealneural
Text2MBL
Text‑to‑Code Generation for Modular Building Layouts in Building Information Modeling

Ну вот, наконец-то что-то новое в научных публикациях на тему генеративных задач создания BIM.

Text2MBL - фреймворк, который по текстовому описанию модульных зданий генерирует исполняемый код BIM. Архитектура построена иерархически: модули, жилые блоки, комнаты.
Модель на базе LLM обучена на парах «описание–код» и выдаёт структурированные последовательности действий.

Что это?
Авторы предложили именно текст-в-код для BIM, а не просто генерацию конечного результата, а это шаг к прямой интеграции LLM в процессы проектирования. Это скорее про генерацию процесса проектирования, потому что выходом является исполняемый BIM-код, который потом создаёт проект, а не статичная модель. Но при этом решение позиционируется как генератор, а не полноценный агент: он переводит описание в структурированный код, но не ведёт итеративного проектного диалога.
Архитектура кода иерархическая (модули, блоки, комнаты), а такого формализованного подхода к генерации BIM-структур в предыдущих работах почти не было.

В отличие от старых идей «text2BIM» через правила или шаблоны, здесь фокус именно на семантически насыщенной автоматизации с использованием LLM, что делает проектирование более гибким.

Еще один шаг к автоматизированному проектированию. ⚡️⚡️⚡️ Будем исследовать ⚡️⚡️⚡️
https://www.arxiv.org/pdf/2509.23713
🔥31