VIRSUN

🎨 رقابت داغ در تولید تصویر با متن؛ Imagen 4 Ultra و GPT-Image-1 در صدر جهان

---

در تازه‌ترین رتبه‌بندی از بهترین مدل‌های تولید تصویر از متن (Text-to-Image) توسط lmarena.ai، مدل Imagen 4.0 Ultra از گوگل موفق شده با مدل GPT-Image-1 از OpenAI رتبه مشترک اول را کسب کند. این دو مدل در حال حاضر، قوی‌ترین سیستم‌های هوش مصنوعی جهان در تبدیل متن به تصویر شناخته می‌شوند. 🔥

---

📊 جزئیات رتبه‌بندی:
🥇 Imagen 4 Ultra (Google) – امتیاز 1138
🥇 GPT-Image-1 (OpenAI) – امتیاز 1137
🥉 Imagen 4.0 استاندارد – امتیاز 1117
📌 با رأی دهی ده‌ها هزار کاربر واقعی و اختلاف بسیار کم در دقت و کیفیت

---

📌 این موفقیت در حالی ثبت شده که گوگل در حال آماده‌سازی آپدیت‌های بزرگ تصویری برای Gemini 2.5 Pro و نسخه آینده Gemini 3 Pro است. به‌نظر می‌رسد در آینده نزدیک، موتور تصویرسازی Gemini با مدل Imagen ادغام خواهد شد.

---

🤖 اگر با مدل‌هایی مثل DALL·E کار کردی، وقتشه Imagen 4 Ultra و GPT-Image-1 رو هم تست کنی!
تو کدوم رو ترجیح می‌دی؟ دقت GPT یا تنوع تصویر Imagen؟ 👇

---

#هوش_مصنوعی #تولید_تصویر #TextToImage #Imagen4 #GPTImage #OpenAI #GoogleAI #Gemini #AIart

📡 :
🔗 https://t.iss.one/rss_ai_ir

🔥2👍1👏1🙏1

286 viewsedited 13:08

VIRSUN

⚡️ HunyuanImage-2.1 —
نسل جدید مدل دیفیوشن برای تولید تصویر 2K

مدل تازه‌ی HunyuanImage-2.1 از Tencent منتشر شد؛ نسخه قبلی (2.0) در ژوئن عرضه شده بود.

🔹 ویژگی‌ها:

♻️دارای 17B پارامتر
♻️خروجی با وضوح 2K (2048×2048)
♻️دارای VAE با فشرده‌سازی (32×32)
♻️معماری DIT دو جریانی شبیه FLUX
♻️هText Encoder ترکیبی از MLLM و ByT5
♻️دارای Refiner Model برای بهبود جزئیات و حذف آرتیفکت‌ها

✨ ابزار جانبی:

PromptEnhancer → بازنویسی پرامپت‌ها با استفاده از CoT برای افزایش دقت و کیفیت:
🔗 hunyuan-promptenhancer.github.io

📊 عملکرد:

✳️در بنچمارک‌ها تقریباً هم‌سطح Qwen Image
✳️نیاز به حدود 59GB VRAM برای رندر 2048×2048 (حتی با CPU offloading)

📎 منابع:

♻️کد:
GitHub

♻️جزئیات و نمونه‌ها:
Tencent Hunyuan

♻️دمو (در حال حاضر غیرفعال):
Hugging Face

📌 نکته: فعلاً آخرین نسخه HunyuanMLLM منتشر نشده؛ پیشنهاد استفاده از جایگزین متن‌باز مثل Qwen2.5-VL-7B-Instruct است.

@rss_ai_ir
#AI #TextToImage #Hunyuan #OpenSource

👍2❤1🔥1👏1

344 views04:06

VIRSUN

🔥 مدل جدید Z-Image منتشر شد — نسل تازه‌ی مدل‌های سریع و سبک T2I

تیم Tongyi-MAI یک معماری تازه در حوزه text-to-image معرفی کرده که با وجود فقط ۶ میلیارد پارامتر، کیفیتی در حد مدل‌های سنگین‌تر ارائه می‌دهد.

✨ ویژگی‌های کلیدی Z-Image:

🚀 سرعت خارق‌العاده: مدل دِیستیلی شده و تنها با ۸ مرحله (NFE) خروجی می‌سازد

⚡ کمتر از یک ثانیه تأخیر روی کارت‌های H800

🧩 اجرای محلی آسان: با فقط ۱۶GB VRAM روی 3090 / 4080 / 4090 قابل اجراست

🎨 فوتورئالیسم قوی، رعایت عالی دستورها و رندر دقیق متن روی تصویر

این مدل برای کسانی که سرعت، دقت و اجرای لوکال هم‌زمان می‌خواهند— یک گزینه‌ی جدی است.

🔗 دمو
https://modelscope.cn/aigc/imageGeneration

🔗 وِیت‌ها (Turbo)
https://modelscope.cn/models/Tongyi-MAI/Z-Image-Turbo

@rss_ai_ir

#AI #GenAI #Tongyi #TextToImage #Prompting #ML

❤5🔥2👏1

1.21K views18:33

About

Blog

Apps

Platform