VIRSUN

🖥 مدل HunyuanImage 2.1 اکنون در نسخه کوانتیزه منتشر شد!

این مدل متن‌به‌تصویر می‌تواند خروجی‌هایی با رزولوشن 2K تولید کند و حالا امکان اجرای آن به‌صورت محلی (local) هم فراهم شده است.

💡 برای اجرای نسخه کوانتیزه به حداقل ۲۴ گیگابایت VRAM نیاز دارید.

🟢 Hugging Face

@rss_ai_ir

#هوش_مصنوعی #HunyuanImage #تولید_تصویر #مدل_زبان #AI #StableDiffusion #ImageGeneration

😁9👍7🎉4❤2🔥2

293 views14:05

VIRSUN

📸 HunyuanImage 2.1 –
دردسرهای تست مدل تصویری تنسنت

✅یکی از کاربران تجربه‌اش از تست HunyuanImage-2.1 در رزولوشن 2048×2048 را به اشتراک گذاشته:

⚡ نتیجه اولیه:

✳️خیلی کند ⏳
✳️کیفیت خروجی نسبت به زمان محاسبه، ارزشمند نیست 😕

🔹 مسائل اصلی:

✳️مدل بسیار حجیم است و از چندین ماژول (denoiser، refiner، reprompter و ...) تشکیل شده.
✳️حتی روی کارت H100 هم با CPU offloading اجرای آن به شدت کند می‌شود.
✳️نیاز به 200 گیگابایت RAM (60GB روی GPU + 140GB روی CPU) داشت!

🔹 تجربه اجرا:

✳️بارگذاری مدل‌ها حدود ۳ دقیقه طول می‌کشد.
✳️تولید تصویر ۲K روی H100 حدود ۱ دقیقه.
✳️اجرای refiner یا rewrite (بازنویسی پرامپت) زمان را تا ۵ دقیقه افزایش می‌دهد.
✳️خروجی در بهترین حالت کمی بهتر از Qwen Image است، اما نه خیلی متفاوت.

🔹 نقاط قوت:
✅ درک عالی پرامپت
✅ عملکرد خوب در تولید متن روی تصویر، مناظر، انیمه و آبستره‌ها

🔹 نقاط ضعف:
❌ سرعت بسیار پایین
❌ مدیریت حافظه ناکارآمد (CPU ↔ GPU swapping)
❌ کیفیت نه‌چندان خاص روی تصاویر انسان
❌ خروجی کمی «سوخته» یا بیش از حد اشباع

📌 نویسنده جمع‌بندی می‌کند که فعلاً ادامه دادن با این مدل ارزش وقت ندارد و باید منتظر ادغام با ComfyUI و بهبود مدیریت حافظه بود.

🔗 کد و جزئیات در گیت‌هاب

#هوش_مصنوعی #تنسنت #تولید_تصویر #HunyuanImage #مدل_دیفیوژن #مولد_تصویر #پردازش_تصویر #کامفی #GPU #AI_Models #ImageGeneration

🎉37🥰35👍34❤32🔥31👏31😁21

1.26K views13:32

VIRSUN

🎨 مایکروسافت هم وارد میدان ساخت تصویر شد!

در حالی که از مدت‌ها پیش شایعاتی درباره‌ی فاصله گرفتن مایکروسافت از OpenAI شنیده می‌شد، حالا این شرکت با انتشار MAI-Image-1 رسماً نشان داد که می‌خواهد استقلال خود را حفظ کند.

💡 مدل جدید بخشی از خانواده‌ی MAI است — همان مدل‌هایی که مایکروسافت برای «تفکر و استدلال» توسعه می‌دهد و قرار است جایگزین مدل‌های o1 و o3-mini از OpenAI در Copilot شود.

و حالا، نسخه‌ی تصویری آن هم رسید:
🖼️ هMAI-Image-1 — مدل تولید تصویر از مایکروسافت که به شوخی شبیه‌سازی نام GPT-Image-1 است.
مدل تازه در رتبه‌ی ۹ جدول LMArena قرار گرفته، اما مایکروسافت با افتخار می‌گوید:

> «معرفی MAI-Image-1، که در اولین حضور خود در میان ۱۰ مدل برتر LMArena قرار گرفت.»

👀 از تصاویر منتشرشده در سایت مایکروسافت می‌توان گفت که مدل از نظر کیفیت در حد نسل قبلی سازندگان تصویر است (در حد Flux.dev) — پوست‌ها کمی مصنوعی و براق، ولی باید عملکرد واقعی را دید.

🧩 در حال حاضر مدل به‌صورت عمومی در دسترس نیست، اما به‌زودی در Copilot و Bing Image Creator عرضه خواهد شد.
اگر عجله دارید، می‌توانید آن را به‌صورت محدود در LMArena بیابید — کافی‌ست چند بار کلیک کنید تا ظاهر شود 😄

🔗 معرفی رسمی از Microsoft.ai

@rss_ai_ir
#Microsoft #AI #MAI #ImageGeneration #Copilot #BingImageCreator

❤1👍1

1.6K views18:17

VIRSUN

📸 Adobe Firefly Image 5 —
واقع‌گرایی خیره‌کننده در سطح 4K!

ادوبی با نسخه‌ی جدید Firefly Image 5 مرزهای تولید تصویر با هوش مصنوعی را جابه‌جا کرده است.

🔥 حالا این مدل به‌صورت اصلی (Native) از خروجی 4K پشتیبانی می‌کند — یعنی بدون نیاز به Upscale اضافی، کیفیت واقعی سینمایی از همان ابتدا!

👩‍🎨 در بخش تولید چهره، پوست و بافت‌های انسانی نیز پیشرفت فوق‌العاده‌ای داشته است:
پوست طبیعی‌تر، چشم‌ها دقیق‌تر، نورپردازی واقعی‌تر و بافت‌های ریز به شکل بی‌نقص بازسازی می‌شوند.

📷 مثال از خروجی:

> Close-up of a 30-year-old Romanian woman’s face — realistic skin, ultra-HD, natural lighting, detailed eyes, natural skin tones.

با این سطح از دقت، Firefly عملاً به یک موتور Photorealistic AI Renderer تبدیل شده است و حالا در رقابت مستقیم با Midjourney، Runway و Flux قرار دارد.

@rss_ai_ir

#Adobe #Firefly #AI #ImageGeneration #4K #Realism #SkinRendering #هوش_مصنوعی #ادوبی #تولید_تصویر

224 views17:20

About

Blog

Apps

Platform