#unrealneural
SGS-1 от Spectral Labs
Генератор CAD 3D-геометрии
https://www.spectrallabs.ai/research/SGS-1
SGS-1 от Spectral Labs
Генератор CAD 3D-геометрии
https://www.spectrallabs.ai/research/SGS-1
👍2⚡1
#unrealneural
Autodesk представляет новую категорию технологий - нейронные САПР (fundamental CAD models), которые используют генеративный ИИ для понимания и создания геометрии. Это следующий шаг после параметрических САПР, почти не менявшихся 40 лет, и альтернатива простому объединению LLM с классическими инструментами.
Autodesk утверждает: будущее проектирования - это нейронные САПР, которые соединяют язык, эскиз, данные и производство в единую систему.
https://adsknews.autodesk.com/en/news/upcoming-3d-generative-ai-foundation-models/
Autodesk представляет новую категорию технологий - нейронные САПР (fundamental CAD models), которые используют генеративный ИИ для понимания и создания геометрии. Это следующий шаг после параметрических САПР, почти не менявшихся 40 лет, и альтернатива простому объединению LLM с классическими инструментами.
Autodesk утверждает: будущее проектирования - это нейронные САПР, которые соединяют язык, эскиз, данные и производство в единую систему.
https://adsknews.autodesk.com/en/news/upcoming-3d-generative-ai-foundation-models/
👍8⚡2🤔2
This media is not supported in your browser
VIEW IN TELEGRAM
#Эксперименты #unrealneural #ЛабораторияИИ #AILAB
Генерация CAD геометрии по изометрическому изображению
Генерация CAD геометрии по изометрическому изображению
🔥9❤4⚡1😱1🤣1
#unrealneural
А вот и Autocad + MCP + Claude
Процесс черчения с помощью Claude кода и создание спецификации с помощью ChatGPT5. Наверняка скоро у всех автодеск продуктов появится официальные тулзы со связками LLM. Но что вот интересно: какую именно модель они там будут использовать? Предполагаю это будет что-то свое на базе Qwen 🤷🏻♂️🤷🏻♂️🤷🏻♂️ или нет 😃
А вот и Autocad + MCP + Claude
Процесс черчения с помощью Claude кода и создание спецификации с помощью ChatGPT5. Наверняка скоро у всех автодеск продуктов появится официальные тулзы со связками LLM. Но что вот интересно: какую именно модель они там будут использовать? Предполагаю это будет что-то свое на базе Qwen 🤷🏻♂️🤷🏻♂️🤷🏻♂️ или нет 😃
🔥6👍2
#unrealneural
Grok 4 Fast
Мультимодальная модель с контекстным окном 2М, которая устанавливает новый стандарт для экономически эффективного ИИ
Grok 4 Fast
Мультимодальная модель с контекстным окном 2М, которая устанавливает новый стандарт для экономически эффективного ИИ
⚡3👍3👌2
#unrealneural
200-страничная работа по LLM: ключевые выводы.
Предобучение: ИИ изучает данные через неконтролируемое и самоконтролируемое обучение. Архитектуры: кодировщики, декодеры, BERT, Трансформеры.
Генеративные модели: GPT-подобные модели для творчества. Тонкая настройка и RLHF обеспечивают специализацию и безопасность.
Промпт-инжиниринг: Контекстное обучение, цепочка мыслей и RAG для точных ответов.
Выравнивание ИИ: Тонкая настройка и RLHF для соответствия человеческим намерениям.
https://arxiv.org/pdf/2501.09223
200-страничная работа по LLM: ключевые выводы.
Предобучение: ИИ изучает данные через неконтролируемое и самоконтролируемое обучение. Архитектуры: кодировщики, декодеры, BERT, Трансформеры.
Генеративные модели: GPT-подобные модели для творчества. Тонкая настройка и RLHF обеспечивают специализацию и безопасность.
Промпт-инжиниринг: Контекстное обучение, цепочка мыслей и RAG для точных ответов.
Выравнивание ИИ: Тонкая настройка и RLHF для соответствия человеческим намерениям.
https://arxiv.org/pdf/2501.09223
⚡3👍2
#unrealneural
Исследователи Apple представляют AToken
Первый унифицированный визуальный токенизатор для высокоточной реконструкции и семантического понимания изображений, видео и 3D-ресурсов.
https://huggingface.co/papers/2509.14476
AToken, как универсальный токенизатор, который объединяет обработку изображений, видео и 3D-объектов в одном 4D-пространстве, обеспечивает точную реконструкцию и понимание. Он использует трансформерную архитектуру и устойчивое обучение без состязательности, поддерживая создание контента и анализ данных.
AToken может продвинуть индустрию ИИ, упрощая разработку мультимодальных систем и снижая затраты на создание универсальных моделей.
Исследователи Apple представляют AToken
Первый унифицированный визуальный токенизатор для высокоточной реконструкции и семантического понимания изображений, видео и 3D-ресурсов.
https://huggingface.co/papers/2509.14476
AToken, как универсальный токенизатор, который объединяет обработку изображений, видео и 3D-объектов в одном 4D-пространстве, обеспечивает точную реконструкцию и понимание. Он использует трансформерную архитектуру и устойчивое обучение без состязательности, поддерживая создание контента и анализ данных.
AToken может продвинуть индустрию ИИ, упрощая разработку мультимодальных систем и снижая затраты на создание универсальных моделей.
🤯5👍3💩1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
DeepSeek-V3.1-Terminus доступен на Hugging Face
Что нового?
Прощай, путаница в тексте🙃 Больше никаких раздражающих миксов из китайского, русского и английского, и странных символов, которые выглядят как сбой матрицы.
Режим агента 🔥 Кодовый агент и поисковик прокачали до уровня, где они не просто работают, а реально выручают. Пишешь код или ищешь инфу, модель теперь справляется как профи, быстро и по делу 🤝
Сразу затестил на Anycoder. Все ссылки и промпт в комментах.
DeepSeek-V3.1-Terminus доступен на Hugging Face
Что нового?
Прощай, путаница в тексте🙃 Больше никаких раздражающих миксов из китайского, русского и английского, и странных символов, которые выглядят как сбой матрицы.
Режим агента 🔥 Кодовый агент и поисковик прокачали до уровня, где они не просто работают, а реально выручают. Пишешь код или ищешь инфу, модель теперь справляется как профи, быстро и по делу 🤝
Сразу затестил на Anycoder. Все ссылки и промпт в комментах.
🔥5❤2⚡1👍1
#unrealneural #нейроразбор
Microsoft представляет нейронку латентного зонирования 🤗
Вышла статья про Latent Zoning Network (LZN), попробуем разобраться.
Вроде как предлагается единая модель, которая объединяет генерацию данных, представление и классификацию через общее скрытое пространство, где энкодеры и декодеры решают разные задачи. Но при этом результаты пока показаны на простых датасетах (CIFAR10, ImageNet), и неясно, как она справится с более сложными данными. 🤷🏻♂️
Это не проходная статья, так как LZN упрощает архитектуру, улучшает генерацию (FID 2.76 -> 2.59 на CIFAR10), превосходит MoCo и SimCLR в представлении данных и предлагает универсальный подход с открытым кодом.
https://huggingface.co/microsoft/latent-zoning-networks
Microsoft представляет нейронку латентного зонирования 🤗
Вышла статья про Latent Zoning Network (LZN), попробуем разобраться.
Вроде как предлагается единая модель, которая объединяет генерацию данных, представление и классификацию через общее скрытое пространство, где энкодеры и декодеры решают разные задачи. Но при этом результаты пока показаны на простых датасетах (CIFAR10, ImageNet), и неясно, как она справится с более сложными данными. 🤷🏻♂️
Это не проходная статья, так как LZN упрощает архитектуру, улучшает генерацию (FID 2.76 -> 2.59 на CIFAR10), превосходит MoCo и SimCLR в представлении данных и предлагает универсальный подход с открытым кодом.
https://huggingface.co/microsoft/latent-zoning-networks
⚡3🤗2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #анализдокументов
ByteDance выпустила Dolphin
Это фреймворк для анализа документов, который преобразует PDF-файлы в структурированные форматы, такие как Markdown, HTML, LaTeX и JSON.
И что? 🤷🏻🤷🏻🤷🏻
Отсутствие прозрачных метрик производительности вызывает вопросы. Без тестов на реальных данных сложно доверять заявлениям о "высокой точности".
Для новичков Dolphin может быть сложным в настройке.
Если твои PDF на русском или содержат нестандартные шрифты/макеты, результат может быть непредсказуемым без предварительного тестирования.
Надо пробовать 😔
https://github.com/bytedance/Dolphin
ByteDance выпустила Dolphin
Это фреймворк для анализа документов, который преобразует PDF-файлы в структурированные форматы, такие как Markdown, HTML, LaTeX и JSON.
И что? 🤷🏻🤷🏻🤷🏻
Отсутствие прозрачных метрик производительности вызывает вопросы. Без тестов на реальных данных сложно доверять заявлениям о "высокой точности".
Для новичков Dolphin может быть сложным в настройке.
Если твои PDF на русском или содержат нестандартные шрифты/макеты, результат может быть непредсказуемым без предварительного тестирования.
Надо пробовать 😔
https://github.com/bytedance/Dolphin
👍3⚡1
#unrealneural
Qwen3-LiveTranslate-Flash: большой шаг в мультимодальном переводе
Что это и в чем фишка?
Qwen3-LiveTranslate-Flash — это мультимодальный инструмент для перевода в реальном времени. Он поддерживает 18 языков и 6 диалектов, понимает жесты, читает по губам, экранный текст и объекты, работает с минимальной задержкой в 3 секунды⚡️⚡️⚡️, обеспечивает точность офлайн-перевода и использует выразительные голоса.
Демо
https://huggingface.co/spaces/Qwen/Qwen3-Livetranslate-Demo
Qwen3-LiveTranslate-Flash: большой шаг в мультимодальном переводе
Что это и в чем фишка?
Qwen3-LiveTranslate-Flash — это мультимодальный инструмент для перевода в реальном времени. Он поддерживает 18 языков и 6 диалектов, понимает жесты, читает по губам, экранный текст и объекты, работает с минимальной задержкой в 3 секунды⚡️⚡️⚡️, обеспечивает точность офлайн-перевода и использует выразительные голоса.
Демо
https://huggingface.co/spaces/Qwen/Qwen3-Livetranslate-Demo
⚡4❤2👌2
#unrealneural
Встречайте Flush
ИИ, который по фото вашего 💩 выдаёт 20 параметров здоровья: от кишечника до стресса!
Трекер прогресса сделает каждый поход в туалет настоящим квестом с оценкой твоего "шедевра".
Первые 3 дня бесплатно 🤷🏻
Это важный шаг к использованию ИИ для здоровья
https://apps.apple.com/ru/app/flush-poop-gut-health-scan/id6748068252
Встречайте Flush
ИИ, который по фото вашего 💩 выдаёт 20 параметров здоровья: от кишечника до стресса!
Трекер прогресса сделает каждый поход в туалет настоящим квестом с оценкой твоего "шедевра".
Первые 3 дня бесплатно 🤷🏻
Это важный шаг к использованию ИИ для здоровья
https://apps.apple.com/ru/app/flush-poop-gut-health-scan/id6748068252
💩14😁3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #нейроразбор
ИИ, который эволюционирует как природа 🌚
ShinkaEvolve от Sakana AI бьёт рекорды: упаковал 26 кругов лучше всех за 150 попыток (смотрите видео)
Это open-source магия для математики и ИИ.
Это и улучшение решения сложных задачи и про эффективную работ LLM.
Эта open-source технология поможет в геймдеве, математике, программировании и даже улучшить сами нейросети⚡️⚡️⚡️
https://sakana.ai/shinka-evolve/
ИИ, который эволюционирует как природа 🌚
ShinkaEvolve от Sakana AI бьёт рекорды: упаковал 26 кругов лучше всех за 150 попыток (смотрите видео)
Это open-source магия для математики и ИИ.
Это и улучшение решения сложных задачи и про эффективную работ LLM.
Эта open-source технология поможет в геймдеве, математике, программировании и даже улучшить сами нейросети⚡️⚡️⚡️
https://sakana.ai/shinka-evolve/
❤5🤯2⚡1
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
FLUX.1 Kontext [Pro] теперь в Photoshop
Использование FLUX в Generative Fill позволяет легко редактировать изображения: создавать новые фоны, добавлять реалистичные элементы к существующим фотографиям или улучшать материалы.
FLUX.1 Kontext [Pro] теперь в Photoshop
Использование FLUX в Generative Fill позволяет легко редактировать изображения: создавать новые фоны, добавлять реалистичные элементы к существующим фотографиям или улучшать материалы.
⚡4❤3
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural #AILAB #ЛабораторияИИ
Тестируем новые модели видеогенерации ⚡️
Использую только промпт, без первого кадра. Нашел подобные эксперименты в X и решил их немного адаптировать под другие темы.
Советую брать промпт и просить ЛЛМ просто адаптировать под нужную вам тематику.
Промпт и другие результаты смотрите в комментариях 👍🏻
Тестируем новые модели видеогенерации ⚡️
Использую только промпт, без первого кадра. Нашел подобные эксперименты в X и решил их немного адаптировать под другие темы.
Советую брать промпт и просить ЛЛМ просто адаптировать под нужную вам тематику.
Промпт и другие результаты смотрите в комментариях 👍🏻
⚡6❤4👍4
This media is not supported in your browser
VIEW IN TELEGRAM
#unrealneural
Изолированные группы нейронов, пытающихся соединиться друг с другом через микротоннели, запечатленные в покадровой съемке с помощью микроскопа.
Красиво ⚡️⚡️⚡️
Изолированные группы нейронов, пытающихся соединиться друг с другом через микротоннели, запечатленные в покадровой съемке с помощью микроскопа.
Красиво ⚡️⚡️⚡️
❤11⚡7👍1🦄1
#unrealneural
AlphaEvolve от Google DeepMind: прорыв в теории сложности
AlphaEvolve, инструмент ИИ от Google DeepMind, представленный в мае 2025, сделал важный шаг в теоретической информатике. Он помог доказать новые теоремы в теории сложности - области, изучающей пределы возможностей алгоритмов.
Как это работает? Вместо создания доказательств с нуля AlphaEvolve находит новые комбинаторные структуры, которые усиливают существующие методы. Это привело к двум ключевым достижениям:
- Улучшена граница неаппроксимируемости для задачи MAX-4-CUT, показав, насколько точно можно решать эту задачу оптимизации.
- Обнаружены ранее неизвестные графы Рамануджана - математические структуры с доказанной корректностью, полезные для информатики.
Эти результат можно прочитать тут
https://arxiv.org/abs/2509.18057
AlphaEvolve от Google DeepMind: прорыв в теории сложности
AlphaEvolve, инструмент ИИ от Google DeepMind, представленный в мае 2025, сделал важный шаг в теоретической информатике. Он помог доказать новые теоремы в теории сложности - области, изучающей пределы возможностей алгоритмов.
Как это работает? Вместо создания доказательств с нуля AlphaEvolve находит новые комбинаторные структуры, которые усиливают существующие методы. Это привело к двум ключевым достижениям:
- Улучшена граница неаппроксимируемости для задачи MAX-4-CUT, показав, насколько точно можно решать эту задачу оптимизации.
- Обнаружены ранее неизвестные графы Рамануджана - математические структуры с доказанной корректностью, полезные для информатики.
Эти результат можно прочитать тут
https://arxiv.org/abs/2509.18057
👍3⚡2
#unrealneural
Text2MBL
Text‑to‑Code Generation for Modular Building Layouts in Building Information Modeling
Ну вот, наконец-то что-то новое в научных публикациях на тему генеративных задач создания BIM.
Text2MBL - фреймворк, который по текстовому описанию модульных зданий генерирует исполняемый код BIM. Архитектура построена иерархически: модули, жилые блоки, комнаты.
Модель на базе LLM обучена на парах «описание–код» и выдаёт структурированные последовательности действий.
Что это?
Авторы предложили именно текст-в-код для BIM, а не просто генерацию конечного результата, а это шаг к прямой интеграции LLM в процессы проектирования. Это скорее про генерацию процесса проектирования, потому что выходом является исполняемый BIM-код, который потом создаёт проект, а не статичная модель. Но при этом решение позиционируется как генератор, а не полноценный агент: он переводит описание в структурированный код, но не ведёт итеративного проектного диалога.
Архитектура кода иерархическая (модули, блоки, комнаты), а такого формализованного подхода к генерации BIM-структур в предыдущих работах почти не было.
В отличие от старых идей «text2BIM» через правила или шаблоны, здесь фокус именно на семантически насыщенной автоматизации с использованием LLM, что делает проектирование более гибким.
Еще один шаг к автоматизированному проектированию. ⚡️⚡️⚡️ Будем исследовать ⚡️⚡️⚡️
https://www.arxiv.org/pdf/2509.23713
Text2MBL
Text‑to‑Code Generation for Modular Building Layouts in Building Information Modeling
Ну вот, наконец-то что-то новое в научных публикациях на тему генеративных задач создания BIM.
Text2MBL - фреймворк, который по текстовому описанию модульных зданий генерирует исполняемый код BIM. Архитектура построена иерархически: модули, жилые блоки, комнаты.
Модель на базе LLM обучена на парах «описание–код» и выдаёт структурированные последовательности действий.
Что это?
Авторы предложили именно текст-в-код для BIM, а не просто генерацию конечного результата, а это шаг к прямой интеграции LLM в процессы проектирования. Это скорее про генерацию процесса проектирования, потому что выходом является исполняемый BIM-код, который потом создаёт проект, а не статичная модель. Но при этом решение позиционируется как генератор, а не полноценный агент: он переводит описание в структурированный код, но не ведёт итеративного проектного диалога.
Архитектура кода иерархическая (модули, блоки, комнаты), а такого формализованного подхода к генерации BIM-структур в предыдущих работах почти не было.
В отличие от старых идей «text2BIM» через правила или шаблоны, здесь фокус именно на семантически насыщенной автоматизации с использованием LLM, что делает проектирование более гибким.
Еще один шаг к автоматизированному проектированию. ⚡️⚡️⚡️ Будем исследовать ⚡️⚡️⚡️
https://www.arxiv.org/pdf/2509.23713
🔥3⚡1