Forwarded from Machinelearning
Исследователи из Мюнхенского университета предложили методику генерации изображений, основанную на байесовском выводе. Экспериментальная модель, которая получила название Bayesian Sample Inference (BSI), имитирует процесс постепенного уточнения данных: ее инференс начинается с «размытого» представления об изображении и последовательно корректируется с использованием шумовых измерений до финального результата. По заверениям авторов, их метод позволяет точнее воспроизводить распределение данных, чем классические решения на основе диффузии.
BSI-модель стартует с априорного распределения, где начальная точность намеренно задаётся низкой — это эквивалентно «размытой картинке», покрывающей всё множество возможных изображений. На каждом шаге генерации, предиктор, построенный на U-Net или ViT, анализирует текущий промежуточный «результат» и генерирует оценку соответствия относительно "идеального" изображения, который, в свою очередь, участвует в пересчете среднего значения и точности для следующего шага генерации.
Такой подход позволяет BSI-модели балансировать между имеющимися знаниями и новыми данными, избегая переобучения и сохраняя разнообразие генерации. Эксперименты выявили, что BSI сохраняет разнообразие сгенерированных образцов даже при малом числе шагов — это выгодно отличает её от аналогов, склонных к «повторяющимся» генерациям.
BSI напрямую сравнивали с диффузионными VDM- и EDM-моделями и BFNs. Оказалось, что BSI-архитектура не только включает BFNs как частный случай, но и превосходит их в тестах на правдоподобие. Например, на наборах CIFAR10 и ImageNet BSI показала лучшие результаты, достигнув 2.64 (BFNs) и 3.22 (VDM) бит на измерение соответственно, но не смогла превзойти модели с точным расчетом правдоподобия (i-DODE).
@ai_machinelearning_big_data
#AI #ML #Bayesian #GenAI
Please open Telegram to view this post
VIEW IN TELEGRAM
Please open Telegram to view this post
VIEW IN TELEGRAM
👍10❤4🔥1🤣1
Forwarded from Machinelearning
This media is not supported in your browser
VIEW IN TELEGRAM
Модель поэтапно строит изображение слева направо и сверху вниз, уточняя детали на каждом шаге. Это делает итоговую картинку качественной, естественной и согласованной.
Например, можно написать запрос:
«Сделай картинку милого кота» — и она появится.
А можно загрузить фото кота и попросить: «Добавь коту шапку» — и модель отредактирует изображение.
🎯 Что умеет Qwen VLo:
• Точная генерация: не путает объекты, сохраняет структуру, меняет, например, цвет машины на фото без искажений
• Редактирование по команде: «Сделай фото в стиле Ван Гога» или «добавь солнечное небо» — всё выполняется по инструкции
• Глубокое понимание: может обрабатывать сложные задачи — выделение объектов, сегментация, редактирование текста и фона
• Мультиязычность: понимает запросы на английском, китайском и других языках — просто опишите, что нужно
🧪 Сейчас Qwen VLo доступна в виде превью через Qwen Chat.
👉 Попробовать: https://chat.qwen.ai
👉 Детали: https://qwenlm.github.io/blog/qwen-vlo/
@ai_machinelearning_big_data
#Qwen #Alibaba #ai #genai #ml
Please open Telegram to view this post
VIEW IN TELEGRAM
❤12👍6🔥3
Media is too big
VIEW IN TELEGRAM
🎨🚀 Tencent представили Hunyuan3D-PolyGen — новый генеративный ИИ для 3D-моделей с высоким уровнем качества
С ходу выйдет из ИИ сразу готовые для пайплайна художников и игровых студий.
Что умеет:
✅ Собственная autoregressive-сеть генерирует чистую, плотную сетку без артефактов
✅ Сложная геометрия — способна выдавать более 10 000 полигонов с высокой детализацией и стабильной структурой
✅ Гибкий экспорт — поддержка tri- и quad-мешей под разные пайплайны
🔥 Подходит для:
— геймдева
— цифрового арта
— быстрых 3д прототипов
ИИ, который реально умеет 3D.
👉 Попробовать (включайте автопереводчик)
@data_analysis_ml
#3d #Tencent #Hunyuan #genai #ai
С ходу выйдет из ИИ сразу готовые для пайплайна художников и игровых студий.
Что умеет:
✅ Собственная autoregressive-сеть генерирует чистую, плотную сетку без артефактов
✅ Сложная геометрия — способна выдавать более 10 000 полигонов с высокой детализацией и стабильной структурой
✅ Гибкий экспорт — поддержка tri- и quad-мешей под разные пайплайны
🔥 Подходит для:
— геймдева
— цифрового арта
— быстрых 3д прототипов
ИИ, который реально умеет 3D.
👉 Попробовать (включайте автопереводчик)
@data_analysis_ml
#3d #Tencent #Hunyuan #genai #ai
❤17👍9🔥5🤯1