🎨 رقابت داغ در تولید تصویر با متن؛ Imagen 4 Ultra و GPT-Image-1 در صدر جهان
---
در تازهترین رتبهبندی از بهترین مدلهای تولید تصویر از متن (Text-to-Image) توسط lmarena.ai، مدل Imagen 4.0 Ultra از گوگل موفق شده با مدل GPT-Image-1 از OpenAI رتبه مشترک اول را کسب کند. این دو مدل در حال حاضر، قویترین سیستمهای هوش مصنوعی جهان در تبدیل متن به تصویر شناخته میشوند. 🔥
---
📊 جزئیات رتبهبندی:
🥇 Imagen 4 Ultra (Google) – امتیاز 1138
🥇 GPT-Image-1 (OpenAI) – امتیاز 1137
🥉 Imagen 4.0 استاندارد – امتیاز 1117
📌 با رأی دهی دهها هزار کاربر واقعی و اختلاف بسیار کم در دقت و کیفیت
---
📌 این موفقیت در حالی ثبت شده که گوگل در حال آمادهسازی آپدیتهای بزرگ تصویری برای Gemini 2.5 Pro و نسخه آینده Gemini 3 Pro است. بهنظر میرسد در آینده نزدیک، موتور تصویرسازی Gemini با مدل Imagen ادغام خواهد شد.
---
🤖 اگر با مدلهایی مثل DALL·E کار کردی، وقتشه Imagen 4 Ultra و GPT-Image-1 رو هم تست کنی!
تو کدوم رو ترجیح میدی؟ دقت GPT یا تنوع تصویر Imagen؟ 👇
---
#هوش_مصنوعی #تولید_تصویر #TextToImage #Imagen4 #GPTImage #OpenAI #GoogleAI #Gemini #AIart
📡 :
🔗 https://t.iss.one/rss_ai_ir
---
در تازهترین رتبهبندی از بهترین مدلهای تولید تصویر از متن (Text-to-Image) توسط lmarena.ai، مدل Imagen 4.0 Ultra از گوگل موفق شده با مدل GPT-Image-1 از OpenAI رتبه مشترک اول را کسب کند. این دو مدل در حال حاضر، قویترین سیستمهای هوش مصنوعی جهان در تبدیل متن به تصویر شناخته میشوند. 🔥
---
📊 جزئیات رتبهبندی:
🥇 Imagen 4 Ultra (Google) – امتیاز 1138
🥇 GPT-Image-1 (OpenAI) – امتیاز 1137
🥉 Imagen 4.0 استاندارد – امتیاز 1117
📌 با رأی دهی دهها هزار کاربر واقعی و اختلاف بسیار کم در دقت و کیفیت
---
📌 این موفقیت در حالی ثبت شده که گوگل در حال آمادهسازی آپدیتهای بزرگ تصویری برای Gemini 2.5 Pro و نسخه آینده Gemini 3 Pro است. بهنظر میرسد در آینده نزدیک، موتور تصویرسازی Gemini با مدل Imagen ادغام خواهد شد.
---
🤖 اگر با مدلهایی مثل DALL·E کار کردی، وقتشه Imagen 4 Ultra و GPT-Image-1 رو هم تست کنی!
تو کدوم رو ترجیح میدی؟ دقت GPT یا تنوع تصویر Imagen؟ 👇
---
#هوش_مصنوعی #تولید_تصویر #TextToImage #Imagen4 #GPTImage #OpenAI #GoogleAI #Gemini #AIart
📡 :
🔗 https://t.iss.one/rss_ai_ir
🔥2👍1👏1🙏1
⚡️ HunyuanImage-2.1 —
نسل جدید مدل دیفیوشن برای تولید تصویر 2K
مدل تازهی HunyuanImage-2.1 از Tencent منتشر شد؛ نسخه قبلی (2.0) در ژوئن عرضه شده بود.
🔹 ویژگیها:
♻️دارای 17B پارامتر
♻️خروجی با وضوح 2K (2048×2048)
♻️دارای VAE با فشردهسازی (32×32)
♻️معماری DIT دو جریانی شبیه FLUX
♻️هText Encoder ترکیبی از MLLM و ByT5
♻️دارای Refiner Model برای بهبود جزئیات و حذف آرتیفکتها
✨ ابزار جانبی:
PromptEnhancer → بازنویسی پرامپتها با استفاده از CoT برای افزایش دقت و کیفیت:
🔗 hunyuan-promptenhancer.github.io
📊 عملکرد:
✳️در بنچمارکها تقریباً همسطح Qwen Image
✳️نیاز به حدود 59GB VRAM برای رندر 2048×2048 (حتی با CPU offloading)
📎 منابع:
♻️کد:
GitHub
♻️جزئیات و نمونهها:
Tencent Hunyuan
♻️دمو (در حال حاضر غیرفعال):
Hugging Face
📌 نکته: فعلاً آخرین نسخه HunyuanMLLM منتشر نشده؛ پیشنهاد استفاده از جایگزین متنباز مثل Qwen2.5-VL-7B-Instruct است.
@rss_ai_ir
#AI #TextToImage #Hunyuan #OpenSource
نسل جدید مدل دیفیوشن برای تولید تصویر 2K
مدل تازهی HunyuanImage-2.1 از Tencent منتشر شد؛ نسخه قبلی (2.0) در ژوئن عرضه شده بود.
🔹 ویژگیها:
♻️دارای 17B پارامتر
♻️خروجی با وضوح 2K (2048×2048)
♻️دارای VAE با فشردهسازی (32×32)
♻️معماری DIT دو جریانی شبیه FLUX
♻️هText Encoder ترکیبی از MLLM و ByT5
♻️دارای Refiner Model برای بهبود جزئیات و حذف آرتیفکتها
✨ ابزار جانبی:
PromptEnhancer → بازنویسی پرامپتها با استفاده از CoT برای افزایش دقت و کیفیت:
🔗 hunyuan-promptenhancer.github.io
📊 عملکرد:
✳️در بنچمارکها تقریباً همسطح Qwen Image
✳️نیاز به حدود 59GB VRAM برای رندر 2048×2048 (حتی با CPU offloading)
📎 منابع:
♻️کد:
GitHub
♻️جزئیات و نمونهها:
Tencent Hunyuan
♻️دمو (در حال حاضر غیرفعال):
Hugging Face
📌 نکته: فعلاً آخرین نسخه HunyuanMLLM منتشر نشده؛ پیشنهاد استفاده از جایگزین متنباز مثل Qwen2.5-VL-7B-Instruct است.
@rss_ai_ir
#AI #TextToImage #Hunyuan #OpenSource
👍2❤1🔥1👏1