AI LAB | Лаборатория ИИ
1.93K subscribers
680 photos
454 videos
24 files
943 links
Лаборатория ИИ
Эксперименты и интересные материалы на тему ИИ в архитектурном проектировании и не только.

По всем вопросам 24/7
@arthiteca

Вопросы сотрудничества и соучастия
@j_fede
Download Telegram
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Ну вот, пошли интеграции с Блендором для 3Д генераторов

На гитхабе у Хуньяня 3Д 2.0 появился блендор-аддон.

Правда рядом с Блендором вам придется поднять апи-сервер хунька.

Инструкции тут:
https://github.com/Tencent/Hunyuan3D-2?tab=readme-ov-file#blender-addon

@cgevent
6
This media is not supported in your browser
VIEW IN TELEGRAM
«TinySwallow-1.5B» - отличный пример того что эффективная языковая модель это не всегда облачный сервис. Это может быть локальным продуктом даже на смартфоне без необходимости доступа в интернет.

Новый метод извлечения знаний под названием «Временно адаптивная интерполированная извлечение (TAID)» эффективно переносит знания из крупномасштабных языковых моделей (LLM) в более мелкие модели. Этот метод обеспечивает эффективную передачу знаний путем переноса знаний из крупномасштабной модели в соответствии с процессом обучения маломасштабной модели. Данное исследование было принято на ICLR 2025 — международной конференции в области машинного обучения.
Используя TAID, были перенесены знания из 32B параметров LLM в мелкомасштабную языковую модель с 1,5B параметрами, что составляет около 1/20 размера LLM. Затем превратилось в японскую модель TinySwallow. Компактный «TinySwallow-1.5B» позволяет вам общаться прямо на вашем смартфоне или ПК, не прибегая к внешнему API.
Демо: https://pub.sakana.ai/tinyswallow/
Бумага: https://arxiv.org/abs/2501.16937
ГитХаб: https://github.com/SakanaAI/TAID
👍3❤‍🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Сверточная нейронная сеть (CNN) предсказывающая рукописные цифры. Все полностью на glsl и шейдерах. Модель состоит из 2023 параметров и слои активации отображаются по мере рисования
https://www.shadertoy.com/view/msVXWD
2👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Интерактивная визуализация сверточной нейронной сети
можно смотреть что именно происходит на каждом шаге прямо в браузере
https://poloclub.github.io/cnn-explainer/
🤯4👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
PolyDiff: Создание 3D-полигональных сеток с использованием моделей диффузии»

Модель работает непосредственно с полигонами трехмерных сеток и генерирует новые формы в качестве выходных данных посредством итеративного процесса диффузии.
arxiv.org/abs/2312.11417
https://youtu.be/Dzdu4cQlS2k
👍5🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Исследуйте модели трансформеров в вашем браузере

Интерактивная система визуализации, призванная помочь исследователям и практикам NLP анализировать и сравнивать весовые коэффициенты внимания в моделях на основе трансформаторов с лингвистическими знаниями.
https://poloclub.github.io/dodrio/
2👍1
Media is too big
VIEW IN TELEGRAM
🤯🤯🤯
🤯9👍2😱2
This media is not supported in your browser
VIEW IN TELEGRAM
Представляем UrbanGPT

ChatGPT от OpenAI с Grasshopper для создания трехмерных городских проектов в реальном времени на основе текста.

Просто введя любой текстовый запрос, дизайнеры могут генерировать динамические городские планы, отслеживать важные показатели (например, площадь программы и этажей) и создавать реалистичное распределение объемов для любого городского проекта. Эта объемная модель затем визуализируется в реальном времени на основе введенного текста с использованием алгоритмов диффузии искусственного интеллекта.

Текущая версия прототипа работает на базе GPT-4o, но легко адаптируется под любые языковые модели.

Это значительный шаг вперед в области текстового планирования городов!

https://clck.ru/3GAGGU
👍3🔥2😱2
Геометрия концепций
В статье «Геометрия концепций: разреженная структура функций автокодировщика» авторы исследуют многослойную структуру концепций, представленных большими языковыми моделями, с помощью разреженных автокодировщиков. Они выявляют три уровня структуры:
1) «Атомная» мелкомасштабная структура
2) «Мозговая» промежуточная масштабная структура - например математические и кодовые признаки
3) Крупномасштабная структура "галактического" масштаба облака точек признаков
https://arxiv.org/abs/2410.19750
🔥3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Модель трансформера с интерактивной визуализацией
https://poloclub.github.io/transformer-explainer/
🔥3👍1
Крутой ресурс с инструментами для понимания работы многих моделей ИИ
https://poloclub.github.io/
👍4🔥2
Еще одна классная демка для понимания работы GAN от poloclub
https://poloclub.github.io/ganlab/
👍2🔥2
Forwarded from Data Secrets
Hugging Face сегодня в ударе: помимо опенсорсного агента Deep Research они релизнули целый стор ИИ приложений

Он так и называется: AI App store. В нем уже 400к (!) аппсов и найти можно вообще все, что хочешь. Например, нужна вам для вашего проекта тулза, транскрибирующая или обобщающая видео:

1. Заходите на huggingface.co/spaces

2. Вводите запрос «summary of video» (в поисковой строке кстати тоже встроена моделька) или переходите в нужный раздел из предложенных

3. Из множества вариантов выбираете то, что подходит, пользуетесь прямо внутри Hugging Face или качаете себе проект: они все опенсорсные и бесплатные

Так что если вы под каждую задачу искали по сусекам отдельный сервис, то больше так делать не нужно: Hugging Face объединил их все в одном месте и тут буквально за минуту отыщется действительно все. А если вы разработчик, то можно и самому добавить Space

🍯
👍7🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Transformer реализованный в excel 🤯🤯🤯
Здесь есть все
• Positional Encoding
• Self-Attention
• Cross-Attention
• Multi-head Attention
• Skip Connection
• LayerNorm
• ReLU Activation
• Feed Forward
• Softmax
🤯7👍2
Нужны ли нейросети в проектировании, и смогут ли они понимать чертежи

Геометрия, чертежи, 3D-модели... Всё это казалось далеким от мира нейросетей, но, как оказалось, это лишь вопрос времени. В статье на Хабре рассматривают вопрос, смогут ли нейросети чертить.

На данный момент вывод однозначен — пока ИИ не может дать ту точность, которую можно принимать на веру. Но это не мешает использовать нейросети как помощника — например, как поисковик по 3D-моделям, который умеет анализировать детали и давать рекомендации.

И разработчики продолжают искать способ повысить точность результата от ИИ — один из вариантов переводить пиксели в текст и работать с более логичными для нейросети входными «сырыми» данными в форматах DXF, STEP и т.д.

Чтобы повысить точность автор предлагает использовать связку двух моделей — трансформер (который хорошо «видит» статистические закономерности и прогнозирует варианты) и символическую систему, где будут даны четкие определения из серии «толщина — это...».

Где сейчас помогают нейросети в проектировании
⚫️Автоматическая генерация вариаций позволяет нейросети создавать несколько форм детали, удовлетворяющих заданным ограничениям. Инженер выбирает наиболее удачную форму, что экономит время на ручном переборе.

⚫️Упрощение рутинных операций помогает новичкам быстро понять части сборки. Нейросеть подсказывает, что это за деталь, и выступает в роли «справочника с интеллектом».

⚫️Снижение «человеческого фактора» помогает избежать ошибок в чертежах. Нейросеть может предупредить о несоответствиях в размерах, единицах измерения и других неточностях.
Please open Telegram to view this post
VIEW IN TELEGRAM
31👍1
Аннотированная история современного искусственного интеллекта и глубокого обучения
https://people.idsia.ch/~juergen/deep-learning-history.html#rnn
👍4
Эволюция и слепое пятно Найта в машинном обучении
Статья о том как суровый фильтр эволюции позволил организмам (включая нас) ориентироваться в неожиданных событиях («неизвестные неизвестные»), с чем системы ИИ борются.
https://arxiv.org/abs/2501.13075
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
Пространство-время Минковского объединяет три измерения пространства и одно измерение времени в единую систему. В ней расстояния и время зависят от движения наблюдателя: объекты могут казаться сжатыми или растянутыми, а одновременность событий становится относительной.
По сути это геометрическая интерпретация пространства-времени, где точки четырехмерного пространства - это события.
Эта концепция объясняет многие эффекты теории относительности
16👍2