Hunyuan3D
генератор 3д геометрии с открытым исходным кодом
На вход можно подавать текст и изображение
https://github.com/YanWenKun/Hunyuan3D-2-WinPortable?tab=readme-ov-file
генератор 3д геометрии с открытым исходным кодом
На вход можно подавать текст и изображение
https://github.com/YanWenKun/Hunyuan3D-2-WinPortable?tab=readme-ov-file
🔥7❤1👍1
Transformer²: Самоадаптирующиеся трансформеры
Статья демонстрирует силу LLM, которая может самостоятельно адаптировать свои веса к своей среде. Вероятно в будущем граница между «предварительным обучением» и «после обучения» исчезнет, и наши модели и агенты будут постоянно адаптироваться и самосовершенствоваться. Такие системы проложат путь для нового поколения адаптивного ИИ, способного изменять свои собственные веса и архитектуру, чтобы адаптироваться к изменяющейся природе задач, с которыми они сталкиваются в среде.
https://arxiv.org/abs/2501.06252
https://sakana.ai/transformer-squared/
Статья демонстрирует силу LLM, которая может самостоятельно адаптировать свои веса к своей среде. Вероятно в будущем граница между «предварительным обучением» и «после обучения» исчезнет, и наши модели и агенты будут постоянно адаптироваться и самосовершенствоваться. Такие системы проложат путь для нового поколения адаптивного ИИ, способного изменять свои собственные веса и архитектуру, чтобы адаптироваться к изменяющейся природе задач, с которыми они сталкиваются в среде.
https://arxiv.org/abs/2501.06252
https://sakana.ai/transformer-squared/
⚡5
Forwarded from Метаверсище и ИИще (Sergey Tsyptsyn ️️)
This media is not supported in your browser
VIEW IN TELEGRAM
Ну вот, пошли интеграции с Блендором для 3Д генераторов
На гитхабе у Хуньяня 3Д 2.0 появился блендор-аддон.
Правда рядом с Блендором вам придется поднять апи-сервер хунька.
Инструкции тут:
https://github.com/Tencent/Hunyuan3D-2?tab=readme-ov-file#blender-addon
@cgevent
На гитхабе у Хуньяня 3Д 2.0 появился блендор-аддон.
Правда рядом с Блендором вам придется поднять апи-сервер хунька.
Инструкции тут:
https://github.com/Tencent/Hunyuan3D-2?tab=readme-ov-file#blender-addon
@cgevent
⚡6
This media is not supported in your browser
VIEW IN TELEGRAM
«TinySwallow-1.5B» - отличный пример того что эффективная языковая модель это не всегда облачный сервис. Это может быть локальным продуктом даже на смартфоне без необходимости доступа в интернет.
Новый метод извлечения знаний под названием «Временно адаптивная интерполированная извлечение (TAID)» эффективно переносит знания из крупномасштабных языковых моделей (LLM) в более мелкие модели. Этот метод обеспечивает эффективную передачу знаний путем переноса знаний из крупномасштабной модели в соответствии с процессом обучения маломасштабной модели. Данное исследование было принято на ICLR 2025 — международной конференции в области машинного обучения.
Используя TAID, были перенесены знания из 32B параметров LLM в мелкомасштабную языковую модель с 1,5B параметрами, что составляет около 1/20 размера LLM. Затем превратилось в японскую модель TinySwallow. Компактный «TinySwallow-1.5B» позволяет вам общаться прямо на вашем смартфоне или ПК, не прибегая к внешнему API.
Демо: https://pub.sakana.ai/tinyswallow/
Бумага: https://arxiv.org/abs/2501.16937
ГитХаб: https://github.com/SakanaAI/TAID
Новый метод извлечения знаний под названием «Временно адаптивная интерполированная извлечение (TAID)» эффективно переносит знания из крупномасштабных языковых моделей (LLM) в более мелкие модели. Этот метод обеспечивает эффективную передачу знаний путем переноса знаний из крупномасштабной модели в соответствии с процессом обучения маломасштабной модели. Данное исследование было принято на ICLR 2025 — международной конференции в области машинного обучения.
Используя TAID, были перенесены знания из 32B параметров LLM в мелкомасштабную языковую модель с 1,5B параметрами, что составляет около 1/20 размера LLM. Затем превратилось в японскую модель TinySwallow. Компактный «TinySwallow-1.5B» позволяет вам общаться прямо на вашем смартфоне или ПК, не прибегая к внешнему API.
Демо: https://pub.sakana.ai/tinyswallow/
Бумага: https://arxiv.org/abs/2501.16937
ГитХаб: https://github.com/SakanaAI/TAID
👍3❤🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Сверточная нейронная сеть (CNN) предсказывающая рукописные цифры. Все полностью на glsl и шейдерах. Модель состоит из 2023 параметров и слои активации отображаются по мере рисования
https://www.shadertoy.com/view/msVXWD
https://www.shadertoy.com/view/msVXWD
⚡2👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Интерактивная визуализация сверточной нейронной сети
можно смотреть что именно происходит на каждом шаге прямо в браузере
https://poloclub.github.io/cnn-explainer/
можно смотреть что именно происходит на каждом шаге прямо в браузере
https://poloclub.github.io/cnn-explainer/
🤯4👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
PolyDiff: Создание 3D-полигональных сеток с использованием моделей диффузии»
Модель работает непосредственно с полигонами трехмерных сеток и генерирует новые формы в качестве выходных данных посредством итеративного процесса диффузии.
arxiv.org/abs/2312.11417
https://youtu.be/Dzdu4cQlS2k
Модель работает непосредственно с полигонами трехмерных сеток и генерирует новые формы в качестве выходных данных посредством итеративного процесса диффузии.
arxiv.org/abs/2312.11417
https://youtu.be/Dzdu4cQlS2k
👍5🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
Исследуйте модели трансформеров в вашем браузере
Интерактивная система визуализации, призванная помочь исследователям и практикам NLP анализировать и сравнивать весовые коэффициенты внимания в моделях на основе трансформаторов с лингвистическими знаниями.
https://poloclub.github.io/dodrio/
Интерактивная система визуализации, призванная помочь исследователям и практикам NLP анализировать и сравнивать весовые коэффициенты внимания в моделях на основе трансформаторов с лингвистическими знаниями.
https://poloclub.github.io/dodrio/
⚡2👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Представляем UrbanGPT
ChatGPT от OpenAI с Grasshopper для создания трехмерных городских проектов в реальном времени на основе текста.
Просто введя любой текстовый запрос, дизайнеры могут генерировать динамические городские планы, отслеживать важные показатели (например, площадь программы и этажей) и создавать реалистичное распределение объемов для любого городского проекта. Эта объемная модель затем визуализируется в реальном времени на основе введенного текста с использованием алгоритмов диффузии искусственного интеллекта.
Текущая версия прототипа работает на базе GPT-4o, но легко адаптируется под любые языковые модели.
Это значительный шаг вперед в области текстового планирования городов!
https://clck.ru/3GAGGU
ChatGPT от OpenAI с Grasshopper для создания трехмерных городских проектов в реальном времени на основе текста.
Просто введя любой текстовый запрос, дизайнеры могут генерировать динамические городские планы, отслеживать важные показатели (например, площадь программы и этажей) и создавать реалистичное распределение объемов для любого городского проекта. Эта объемная модель затем визуализируется в реальном времени на основе введенного текста с использованием алгоритмов диффузии искусственного интеллекта.
Текущая версия прототипа работает на базе GPT-4o, но легко адаптируется под любые языковые модели.
Это значительный шаг вперед в области текстового планирования городов!
https://clck.ru/3GAGGU
👍3🔥2😱2
Геометрия концепций
В статье «Геометрия концепций: разреженная структура функций автокодировщика» авторы исследуют многослойную структуру концепций, представленных большими языковыми моделями, с помощью разреженных автокодировщиков. Они выявляют три уровня структуры:
1) «Атомная» мелкомасштабная структура
2) «Мозговая» промежуточная масштабная структура - например математические и кодовые признаки
3) Крупномасштабная структура "галактического" масштаба облака точек признаков
https://arxiv.org/abs/2410.19750
В статье «Геометрия концепций: разреженная структура функций автокодировщика» авторы исследуют многослойную структуру концепций, представленных большими языковыми моделями, с помощью разреженных автокодировщиков. Они выявляют три уровня структуры:
1) «Атомная» мелкомасштабная структура
2) «Мозговая» промежуточная масштабная структура - например математические и кодовые признаки
3) Крупномасштабная структура "галактического" масштаба облака точек признаков
https://arxiv.org/abs/2410.19750
🔥3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
Модель трансформера с интерактивной визуализацией
https://poloclub.github.io/transformer-explainer/
https://poloclub.github.io/transformer-explainer/
🔥3👍1
Крутой ресурс с инструментами для понимания работы многих моделей ИИ
https://poloclub.github.io/
https://poloclub.github.io/
👍4🔥2
Forwarded from Data Secrets
Hugging Face сегодня в ударе: помимо опенсорсного агента Deep Research они релизнули целый стор ИИ приложений
Он так и называется: AI App store. В нем уже 400к (!) аппсов и найти можно вообще все, что хочешь. Например, нужна вам для вашего проекта тулза, транскрибирующая или обобщающая видео:
1. Заходите на huggingface.co/spaces
2. Вводите запрос «summary of video» (в поисковой строке кстати тоже встроена моделька) или переходите в нужный раздел из предложенных
3. Из множества вариантов выбираете то, что подходит, пользуетесь прямо внутри Hugging Face или качаете себе проект: они все опенсорсные и бесплатные
Так что если вы под каждую задачу искали по сусекам отдельный сервис, то больше так делать не нужно: Hugging Face объединил их все в одном месте и тут буквально за минуту отыщется действительно все. А если вы разработчик, то можно и самому добавить Space
🍯
Он так и называется: AI App store. В нем уже 400к (!) аппсов и найти можно вообще все, что хочешь. Например, нужна вам для вашего проекта тулза, транскрибирующая или обобщающая видео:
1. Заходите на huggingface.co/spaces
2. Вводите запрос «summary of video» (в поисковой строке кстати тоже встроена моделька) или переходите в нужный раздел из предложенных
3. Из множества вариантов выбираете то, что подходит, пользуетесь прямо внутри Hugging Face или качаете себе проект: они все опенсорсные и бесплатные
Так что если вы под каждую задачу искали по сусекам отдельный сервис, то больше так делать не нужно: Hugging Face объединил их все в одном месте и тут буквально за минуту отыщется действительно все. А если вы разработчик, то можно и самому добавить Space
🍯
👍7🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
Transformer реализованный в excel 🤯🤯🤯
Здесь есть все
• Positional Encoding
• Self-Attention
• Cross-Attention
• Multi-head Attention
• Skip Connection
• LayerNorm
• ReLU Activation
• Feed Forward
• Softmax
Здесь есть все
• Positional Encoding
• Self-Attention
• Cross-Attention
• Multi-head Attention
• Skip Connection
• LayerNorm
• ReLU Activation
• Feed Forward
• Softmax
🤯7👍2