🖥 مدل HunyuanImage 2.1 اکنون در نسخه کوانتیزه منتشر شد!
این مدل متنبهتصویر میتواند خروجیهایی با رزولوشن 2K تولید کند و حالا امکان اجرای آن بهصورت محلی (local) هم فراهم شده است.
💡 برای اجرای نسخه کوانتیزه به حداقل ۲۴ گیگابایت VRAM نیاز دارید.
🟢 Hugging Face
@rss_ai_ir
#هوش_مصنوعی #HunyuanImage #تولید_تصویر #مدل_زبان #AI #StableDiffusion #ImageGeneration
این مدل متنبهتصویر میتواند خروجیهایی با رزولوشن 2K تولید کند و حالا امکان اجرای آن بهصورت محلی (local) هم فراهم شده است.
💡 برای اجرای نسخه کوانتیزه به حداقل ۲۴ گیگابایت VRAM نیاز دارید.
🟢 Hugging Face
@rss_ai_ir
#هوش_مصنوعی #HunyuanImage #تولید_تصویر #مدل_زبان #AI #StableDiffusion #ImageGeneration
😁9👍7🎉4❤2🔥2
📸 HunyuanImage 2.1 –
دردسرهای تست مدل تصویری تنسنت
✅یکی از کاربران تجربهاش از تست HunyuanImage-2.1 در رزولوشن 2048×2048 را به اشتراک گذاشته:
⚡ نتیجه اولیه:
✳️خیلی کند ⏳
✳️کیفیت خروجی نسبت به زمان محاسبه، ارزشمند نیست 😕
🔹 مسائل اصلی:
✳️مدل بسیار حجیم است و از چندین ماژول (denoiser، refiner، reprompter و ...) تشکیل شده.
✳️حتی روی کارت H100 هم با CPU offloading اجرای آن به شدت کند میشود.
✳️نیاز به 200 گیگابایت RAM (60GB روی GPU + 140GB روی CPU) داشت!
🔹 تجربه اجرا:
✳️بارگذاری مدلها حدود ۳ دقیقه طول میکشد.
✳️تولید تصویر ۲K روی H100 حدود ۱ دقیقه.
✳️اجرای refiner یا rewrite (بازنویسی پرامپت) زمان را تا ۵ دقیقه افزایش میدهد.
✳️خروجی در بهترین حالت کمی بهتر از Qwen Image است، اما نه خیلی متفاوت.
🔹 نقاط قوت:
✅ درک عالی پرامپت
✅ عملکرد خوب در تولید متن روی تصویر، مناظر، انیمه و آبسترهها
🔹 نقاط ضعف:
❌ سرعت بسیار پایین
❌ مدیریت حافظه ناکارآمد (CPU ↔ GPU swapping)
❌ کیفیت نهچندان خاص روی تصاویر انسان
❌ خروجی کمی «سوخته» یا بیش از حد اشباع
📌 نویسنده جمعبندی میکند که فعلاً ادامه دادن با این مدل ارزش وقت ندارد و باید منتظر ادغام با ComfyUI و بهبود مدیریت حافظه بود.
🔗 کد و جزئیات در گیتهاب
#هوش_مصنوعی #تنسنت #تولید_تصویر #HunyuanImage #مدل_دیفیوژن #مولد_تصویر #پردازش_تصویر #کامفی #GPU #AI_Models #ImageGeneration
دردسرهای تست مدل تصویری تنسنت
✅یکی از کاربران تجربهاش از تست HunyuanImage-2.1 در رزولوشن 2048×2048 را به اشتراک گذاشته:
⚡ نتیجه اولیه:
✳️خیلی کند ⏳
✳️کیفیت خروجی نسبت به زمان محاسبه، ارزشمند نیست 😕
🔹 مسائل اصلی:
✳️مدل بسیار حجیم است و از چندین ماژول (denoiser، refiner، reprompter و ...) تشکیل شده.
✳️حتی روی کارت H100 هم با CPU offloading اجرای آن به شدت کند میشود.
✳️نیاز به 200 گیگابایت RAM (60GB روی GPU + 140GB روی CPU) داشت!
🔹 تجربه اجرا:
✳️بارگذاری مدلها حدود ۳ دقیقه طول میکشد.
✳️تولید تصویر ۲K روی H100 حدود ۱ دقیقه.
✳️اجرای refiner یا rewrite (بازنویسی پرامپت) زمان را تا ۵ دقیقه افزایش میدهد.
✳️خروجی در بهترین حالت کمی بهتر از Qwen Image است، اما نه خیلی متفاوت.
🔹 نقاط قوت:
✅ درک عالی پرامپت
✅ عملکرد خوب در تولید متن روی تصویر، مناظر، انیمه و آبسترهها
🔹 نقاط ضعف:
❌ سرعت بسیار پایین
❌ مدیریت حافظه ناکارآمد (CPU ↔ GPU swapping)
❌ کیفیت نهچندان خاص روی تصاویر انسان
❌ خروجی کمی «سوخته» یا بیش از حد اشباع
📌 نویسنده جمعبندی میکند که فعلاً ادامه دادن با این مدل ارزش وقت ندارد و باید منتظر ادغام با ComfyUI و بهبود مدیریت حافظه بود.
🔗 کد و جزئیات در گیتهاب
#هوش_مصنوعی #تنسنت #تولید_تصویر #HunyuanImage #مدل_دیفیوژن #مولد_تصویر #پردازش_تصویر #کامفی #GPU #AI_Models #ImageGeneration
🎉37🥰35👍34❤32🔥31👏31😁21
🎨 مایکروسافت هم وارد میدان ساخت تصویر شد!
در حالی که از مدتها پیش شایعاتی دربارهی فاصله گرفتن مایکروسافت از OpenAI شنیده میشد، حالا این شرکت با انتشار MAI-Image-1 رسماً نشان داد که میخواهد استقلال خود را حفظ کند.
💡 مدل جدید بخشی از خانوادهی MAI است — همان مدلهایی که مایکروسافت برای «تفکر و استدلال» توسعه میدهد و قرار است جایگزین مدلهای o1 و o3-mini از OpenAI در Copilot شود.
و حالا، نسخهی تصویری آن هم رسید:
🖼️ هMAI-Image-1 — مدل تولید تصویر از مایکروسافت که به شوخی شبیهسازی نام GPT-Image-1 است.
مدل تازه در رتبهی ۹ جدول LMArena قرار گرفته، اما مایکروسافت با افتخار میگوید:
> «معرفی MAI-Image-1، که در اولین حضور خود در میان ۱۰ مدل برتر LMArena قرار گرفت.»
👀 از تصاویر منتشرشده در سایت مایکروسافت میتوان گفت که مدل از نظر کیفیت در حد نسل قبلی سازندگان تصویر است (در حد Flux.dev) — پوستها کمی مصنوعی و براق، ولی باید عملکرد واقعی را دید.
🧩 در حال حاضر مدل بهصورت عمومی در دسترس نیست، اما بهزودی در Copilot و Bing Image Creator عرضه خواهد شد.
اگر عجله دارید، میتوانید آن را بهصورت محدود در LMArena بیابید — کافیست چند بار کلیک کنید تا ظاهر شود 😄
🔗 معرفی رسمی از Microsoft.ai
@rss_ai_ir
#Microsoft #AI #MAI #ImageGeneration #Copilot #BingImageCreator
در حالی که از مدتها پیش شایعاتی دربارهی فاصله گرفتن مایکروسافت از OpenAI شنیده میشد، حالا این شرکت با انتشار MAI-Image-1 رسماً نشان داد که میخواهد استقلال خود را حفظ کند.
💡 مدل جدید بخشی از خانوادهی MAI است — همان مدلهایی که مایکروسافت برای «تفکر و استدلال» توسعه میدهد و قرار است جایگزین مدلهای o1 و o3-mini از OpenAI در Copilot شود.
و حالا، نسخهی تصویری آن هم رسید:
🖼️ هMAI-Image-1 — مدل تولید تصویر از مایکروسافت که به شوخی شبیهسازی نام GPT-Image-1 است.
مدل تازه در رتبهی ۹ جدول LMArena قرار گرفته، اما مایکروسافت با افتخار میگوید:
> «معرفی MAI-Image-1، که در اولین حضور خود در میان ۱۰ مدل برتر LMArena قرار گرفت.»
👀 از تصاویر منتشرشده در سایت مایکروسافت میتوان گفت که مدل از نظر کیفیت در حد نسل قبلی سازندگان تصویر است (در حد Flux.dev) — پوستها کمی مصنوعی و براق، ولی باید عملکرد واقعی را دید.
🧩 در حال حاضر مدل بهصورت عمومی در دسترس نیست، اما بهزودی در Copilot و Bing Image Creator عرضه خواهد شد.
اگر عجله دارید، میتوانید آن را بهصورت محدود در LMArena بیابید — کافیست چند بار کلیک کنید تا ظاهر شود 😄
🔗 معرفی رسمی از Microsoft.ai
@rss_ai_ir
#Microsoft #AI #MAI #ImageGeneration #Copilot #BingImageCreator
❤1👍1
📸 Adobe Firefly Image 5 —
واقعگرایی خیرهکننده در سطح 4K!
ادوبی با نسخهی جدید Firefly Image 5 مرزهای تولید تصویر با هوش مصنوعی را جابهجا کرده است.
🔥 حالا این مدل بهصورت اصلی (Native) از خروجی 4K پشتیبانی میکند — یعنی بدون نیاز به Upscale اضافی، کیفیت واقعی سینمایی از همان ابتدا!
👩🎨 در بخش تولید چهره، پوست و بافتهای انسانی نیز پیشرفت فوقالعادهای داشته است:
پوست طبیعیتر، چشمها دقیقتر، نورپردازی واقعیتر و بافتهای ریز به شکل بینقص بازسازی میشوند.
📷 مثال از خروجی:
با این سطح از دقت، Firefly عملاً به یک موتور Photorealistic AI Renderer تبدیل شده است و حالا در رقابت مستقیم با Midjourney، Runway و Flux قرار دارد.
@rss_ai_ir
#Adobe #Firefly #AI #ImageGeneration #4K #Realism #SkinRendering #هوش_مصنوعی #ادوبی #تولید_تصویر
واقعگرایی خیرهکننده در سطح 4K!
ادوبی با نسخهی جدید Firefly Image 5 مرزهای تولید تصویر با هوش مصنوعی را جابهجا کرده است.
🔥 حالا این مدل بهصورت اصلی (Native) از خروجی 4K پشتیبانی میکند — یعنی بدون نیاز به Upscale اضافی، کیفیت واقعی سینمایی از همان ابتدا!
👩🎨 در بخش تولید چهره، پوست و بافتهای انسانی نیز پیشرفت فوقالعادهای داشته است:
پوست طبیعیتر، چشمها دقیقتر، نورپردازی واقعیتر و بافتهای ریز به شکل بینقص بازسازی میشوند.
📷 مثال از خروجی:
> Close-up of a 30-year-old Romanian woman’s face — realistic skin, ultra-HD, natural lighting, detailed eyes, natural skin tones.
با این سطح از دقت، Firefly عملاً به یک موتور Photorealistic AI Renderer تبدیل شده است و حالا در رقابت مستقیم با Midjourney، Runway و Flux قرار دارد.
@rss_ai_ir
#Adobe #Firefly #AI #ImageGeneration #4K #Realism #SkinRendering #هوش_مصنوعی #ادوبی #تولید_تصویر