VIRSUN

🎨 رقابت داغ در تولید تصویر با متن؛ Imagen 4 Ultra و GPT-Image-1 در صدر جهان

---

در تازه‌ترین رتبه‌بندی از بهترین مدل‌های تولید تصویر از متن (Text-to-Image) توسط lmarena.ai، مدل Imagen 4.0 Ultra از گوگل موفق شده با مدل GPT-Image-1 از OpenAI رتبه مشترک اول را کسب کند. این دو مدل در حال حاضر، قوی‌ترین سیستم‌های هوش مصنوعی جهان در تبدیل متن به تصویر شناخته می‌شوند. 🔥

---

📊 جزئیات رتبه‌بندی:
🥇 Imagen 4 Ultra (Google) – امتیاز 1138
🥇 GPT-Image-1 (OpenAI) – امتیاز 1137
🥉 Imagen 4.0 استاندارد – امتیاز 1117
📌 با رأی دهی ده‌ها هزار کاربر واقعی و اختلاف بسیار کم در دقت و کیفیت

---

📌 این موفقیت در حالی ثبت شده که گوگل در حال آماده‌سازی آپدیت‌های بزرگ تصویری برای Gemini 2.5 Pro و نسخه آینده Gemini 3 Pro است. به‌نظر می‌رسد در آینده نزدیک، موتور تصویرسازی Gemini با مدل Imagen ادغام خواهد شد.

---

🤖 اگر با مدل‌هایی مثل DALL·E کار کردی، وقتشه Imagen 4 Ultra و GPT-Image-1 رو هم تست کنی!
تو کدوم رو ترجیح می‌دی؟ دقت GPT یا تنوع تصویر Imagen؟ 👇

---

#هوش_مصنوعی #تولید_تصویر #TextToImage #Imagen4 #GPTImage #OpenAI #GoogleAI #Gemini #AIart

📡 :
🔗 https://t.iss.one/rss_ai_ir

🔥2👍1👏1🙏1

281 viewsedited 13:08

VIRSUN

⚡️ HunyuanImage-2.1 —
نسل جدید مدل دیفیوشن برای تولید تصویر 2K

مدل تازه‌ی HunyuanImage-2.1 از Tencent منتشر شد؛ نسخه قبلی (2.0) در ژوئن عرضه شده بود.

🔹 ویژگی‌ها:

♻️دارای 17B پارامتر
♻️خروجی با وضوح 2K (2048×2048)
♻️دارای VAE با فشرده‌سازی (32×32)
♻️معماری DIT دو جریانی شبیه FLUX
♻️هText Encoder ترکیبی از MLLM و ByT5
♻️دارای Refiner Model برای بهبود جزئیات و حذف آرتیفکت‌ها

✨ ابزار جانبی:

PromptEnhancer → بازنویسی پرامپت‌ها با استفاده از CoT برای افزایش دقت و کیفیت:
🔗 hunyuan-promptenhancer.github.io

📊 عملکرد:

✳️در بنچمارک‌ها تقریباً هم‌سطح Qwen Image
✳️نیاز به حدود 59GB VRAM برای رندر 2048×2048 (حتی با CPU offloading)

📎 منابع:

♻️کد:
GitHub

♻️جزئیات و نمونه‌ها:
Tencent Hunyuan

♻️دمو (در حال حاضر غیرفعال):
Hugging Face

📌 نکته: فعلاً آخرین نسخه HunyuanMLLM منتشر نشده؛ پیشنهاد استفاده از جایگزین متن‌باز مثل Qwen2.5-VL-7B-Instruct است.

@rss_ai_ir
#AI #TextToImage #Hunyuan #OpenSource

👍2❤1🔥1👏1

326 views04:06

About

Blog

Apps

Platform