VIRSUN
7.53K subscribers
792 photos
461 videos
3 files
507 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
🎨 رقابت داغ در تولید تصویر با متن؛ Imagen 4 Ultra و GPT-Image-1 در صدر جهان

---

در تازه‌ترین رتبه‌بندی از بهترین مدل‌های تولید تصویر از متن (Text-to-Image) توسط lmarena.ai، مدل Imagen 4.0 Ultra از گوگل موفق شده با مدل GPT-Image-1 از OpenAI رتبه مشترک اول را کسب کند. این دو مدل در حال حاضر، قوی‌ترین سیستم‌های هوش مصنوعی جهان در تبدیل متن به تصویر شناخته می‌شوند. 🔥

---

📊 جزئیات رتبه‌بندی:
🥇 Imagen 4 Ultra (Google) – امتیاز 1138
🥇 GPT-Image-1 (OpenAI) – امتیاز 1137
🥉 Imagen 4.0 استاندارد – امتیاز 1117
📌 با رأی دهی ده‌ها هزار کاربر واقعی و اختلاف بسیار کم در دقت و کیفیت

---

📌 این موفقیت در حالی ثبت شده که گوگل در حال آماده‌سازی آپدیت‌های بزرگ تصویری برای Gemini 2.5 Pro و نسخه آینده Gemini 3 Pro است. به‌نظر می‌رسد در آینده نزدیک، موتور تصویرسازی Gemini با مدل Imagen ادغام خواهد شد.

---

🤖 اگر با مدل‌هایی مثل DALL·E کار کردی، وقتشه Imagen 4 Ultra و GPT-Image-1 رو هم تست کنی!
تو کدوم رو ترجیح می‌دی؟ دقت GPT یا تنوع تصویر Imagen؟ 👇

---

#هوش_مصنوعی #تولید_تصویر #TextToImage #Imagen4 #GPTImage #OpenAI #GoogleAI #Gemini #AIart

📡 :
🔗 https://t.iss.one/rss_ai_ir
🔥2👍1👏1🙏1
⚡️ HunyuanImage-2.1 —
نسل جدید مدل دیفیوشن برای تولید تصویر 2K

مدل تازه‌ی HunyuanImage-2.1 از Tencent منتشر شد؛ نسخه قبلی (2.0) در ژوئن عرضه شده بود.

🔹 ویژگی‌ها:

♻️دارای 17B پارامتر
♻️خروجی با وضوح 2K (2048×2048)
♻️دارای VAE با فشرده‌سازی (32×32)
♻️معماری DIT دو جریانی شبیه FLUX
♻️هText Encoder ترکیبی از MLLM و ByT5
♻️دارای Refiner Model برای بهبود جزئیات و حذف آرتیفکت‌ها


ابزار جانبی:

PromptEnhancer → بازنویسی پرامپت‌ها با استفاده از CoT برای افزایش دقت و کیفیت:
🔗 hunyuan-promptenhancer.github.io


📊 عملکرد:

✳️در بنچمارک‌ها تقریباً هم‌سطح Qwen Image
✳️نیاز به حدود 59GB VRAM برای رندر 2048×2048 (حتی با CPU offloading)


📎 منابع:

♻️کد:
GitHub

♻️جزئیات و نمونه‌ها:
Tencent Hunyuan

♻️دمو (در حال حاضر غیرفعال):
Hugging Face


📌 نکته: فعلاً آخرین نسخه HunyuanMLLM منتشر نشده؛ پیشنهاد استفاده از جایگزین متن‌باز مثل Qwen2.5-VL-7B-Instruct است.

@rss_ai_ir
#AI #TextToImage #Hunyuan #OpenSource
👍21🔥1👏1