🔥 مدل جدید Z-Image منتشر شد — نسل تازهی مدلهای سریع و سبک T2I
تیم Tongyi-MAI یک معماری تازه در حوزه text-to-image معرفی کرده که با وجود فقط ۶ میلیارد پارامتر، کیفیتی در حد مدلهای سنگینتر ارائه میدهد.
✨ ویژگیهای کلیدی Z-Image:
🚀 سرعت خارقالعاده: مدل دِیستیلی شده و تنها با ۸ مرحله (NFE) خروجی میسازد
⚡ کمتر از یک ثانیه تأخیر روی کارتهای H800
🧩 اجرای محلی آسان: با فقط ۱۶GB VRAM روی 3090 / 4080 / 4090 قابل اجراست
🎨 فوتورئالیسم قوی، رعایت عالی دستورها و رندر دقیق متن روی تصویر
این مدل برای کسانی که سرعت، دقت و اجرای لوکال همزمان میخواهند— یک گزینهی جدی است.
🔗 دمو
https://modelscope.cn/aigc/imageGeneration
🔗 وِیتها (Turbo)
https://modelscope.cn/models/Tongyi-MAI/Z-Image-Turbo
@rss_ai_ir
#AI #GenAI #Tongyi #TextToImage #Prompting #ML
تیم Tongyi-MAI یک معماری تازه در حوزه text-to-image معرفی کرده که با وجود فقط ۶ میلیارد پارامتر، کیفیتی در حد مدلهای سنگینتر ارائه میدهد.
✨ ویژگیهای کلیدی Z-Image:
🚀 سرعت خارقالعاده: مدل دِیستیلی شده و تنها با ۸ مرحله (NFE) خروجی میسازد
⚡ کمتر از یک ثانیه تأخیر روی کارتهای H800
🧩 اجرای محلی آسان: با فقط ۱۶GB VRAM روی 3090 / 4080 / 4090 قابل اجراست
🎨 فوتورئالیسم قوی، رعایت عالی دستورها و رندر دقیق متن روی تصویر
این مدل برای کسانی که سرعت، دقت و اجرای لوکال همزمان میخواهند— یک گزینهی جدی است.
🔗 دمو
https://modelscope.cn/aigc/imageGeneration
🔗 وِیتها (Turbo)
https://modelscope.cn/models/Tongyi-MAI/Z-Image-Turbo
@rss_ai_ir
#AI #GenAI #Tongyi #TextToImage #Prompting #ML
❤4🔥2👏1
🔥 بهترین راهنمای فاینتیونینگ که امسال در arXiv میبینید!
اگر با مدلهای زبانی کار میکنید—چه مبتدی باشید چه حرفهای—این مقاله دقیقاً همان چیزی است که لازم دارید. یک راهنمای کامل، مرحلهبهمرحله و فوقالعاده منظم برای تسلط بر Fine-Tuning مدرن.
📘 مباحثی که پوشش میدهد:
🧠 مبانی NLP (برای اینکه بدانید زیرساخت مدل چه میگوید)
⚙️ روشهای PEFT / LoRA / QLoRA (تکنیکهای سبک برای آموزش مدلهای بزرگ روی GPUهای معمولی)
🔀اینکه Mixture of Experts (MoE) و نکات ریز مربوط به آموزش کارآمد
🧩 پایپلاین ۷ مرحلهای برای فاینتیونینگ حرفهای
🎯 توصیههای عملی، چکلیستها و اشتباهاتی که باید از آنها دوری کرد
📄 منبع:
https://arxiv.org/pdf/2408.13296v1
#AI #ML #FineTuning #LoRA #QLoRA #MoE #NLP #DeepLearning #arXiv
@rss_ai_ir
اگر با مدلهای زبانی کار میکنید—چه مبتدی باشید چه حرفهای—این مقاله دقیقاً همان چیزی است که لازم دارید. یک راهنمای کامل، مرحلهبهمرحله و فوقالعاده منظم برای تسلط بر Fine-Tuning مدرن.
📘 مباحثی که پوشش میدهد:
🧠 مبانی NLP (برای اینکه بدانید زیرساخت مدل چه میگوید)
⚙️ روشهای PEFT / LoRA / QLoRA (تکنیکهای سبک برای آموزش مدلهای بزرگ روی GPUهای معمولی)
🔀اینکه Mixture of Experts (MoE) و نکات ریز مربوط به آموزش کارآمد
🧩 پایپلاین ۷ مرحلهای برای فاینتیونینگ حرفهای
🎯 توصیههای عملی، چکلیستها و اشتباهاتی که باید از آنها دوری کرد
📄 منبع:
https://arxiv.org/pdf/2408.13296v1
#AI #ML #FineTuning #LoRA #QLoRA #MoE #NLP #DeepLearning #arXiv
@rss_ai_ir
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
✨ NAF: Zero-Shot Feature Upsampling via Neighborhood Attention Filtering ✨
📝 خلاصه کوتاه:
روش NAF یک تکنیک جدید برای Upsampling ویژگیها در مدلهای پایه بینایی (Vision Foundation Models) است — کاملاً بهصورت Zero-Shot و بدون هیچگونه بازآموزی.
این روش با یادگیری وزنهای تطبیقی بر اساس فضا + محتوا، دقت بالاتر و کارایی بهتر از آپسمپلرهای سنتی ارائه میدهد.
🔹 ویژگیهای کلیدی:
♻️آپسمپل کردن ویژگیهای VFM بدون نیاز به فاینتیون
♻️عملکرد SOTA در طیف گستردهای از وظایف بینایی
♻️کارایی بالا و مناسب برای استفاده در سیستمهای real-time
♻️قابل استفاده برای مدلهای مختلف بدون وابستگی به معماری خاص
🔗 Paper & Code:
• arXiv: https://arxiv.org/abs/2511.18452
• PDF: https://arxiv.org/pdf/2511.18452
• GitHub: https://github.com/valeoai/NAF
#ZeroShotLearning #ComputerVision #FeatureUpsampling #DeepLearning #AIResearch @rss_ai_ir
📝 خلاصه کوتاه:
روش NAF یک تکنیک جدید برای Upsampling ویژگیها در مدلهای پایه بینایی (Vision Foundation Models) است — کاملاً بهصورت Zero-Shot و بدون هیچگونه بازآموزی.
این روش با یادگیری وزنهای تطبیقی بر اساس فضا + محتوا، دقت بالاتر و کارایی بهتر از آپسمپلرهای سنتی ارائه میدهد.
🔹 ویژگیهای کلیدی:
♻️آپسمپل کردن ویژگیهای VFM بدون نیاز به فاینتیون
♻️عملکرد SOTA در طیف گستردهای از وظایف بینایی
♻️کارایی بالا و مناسب برای استفاده در سیستمهای real-time
♻️قابل استفاده برای مدلهای مختلف بدون وابستگی به معماری خاص
🔗 Paper & Code:
• arXiv: https://arxiv.org/abs/2511.18452
• PDF: https://arxiv.org/pdf/2511.18452
• GitHub: https://github.com/valeoai/NAF
#ZeroShotLearning #ComputerVision #FeatureUpsampling #DeepLearning #AIResearch @rss_ai_ir
👍1🔥1
🚀 دیپسیک بازگشت؛ این بار با یک انقلاب در ریاضیات
@rss_ai_ir
✨ مدل DeepSeek Math V2 معرفی شد؛ مدلی که نهتنها مسئلههای ریاضی را حل میکند، بلکه خودش صحت مراحل استدلال و اثبات را نیز بررسی میکند.
این یعنی عبور از «جواب دادن» و ورود به «تفکر دقیق و قابل اعتماد».
📊 نتایج خیرهکننده:
سطح مدال طلا در IMO 2025
عملکرد تقریباً کامل در CMO 2024
کسب 118 از 120 امتیاز در Putnam 2024
🧠 ویژگی کلیدی این نسخه:
مدل یاد گرفته مرحلهبهمرحله استدلال کند و پس از تولید هر گام، آن را با یک سیستم درونی بررسی و تأیید کند.
خروجی نهایی دقیق، سازگار و بدون خطای منطقی است.
💡 مزیت بزرگ:
با وجود تواناییهای بسیار بالا، مدل همچنان سبک است و روی یک GPU هم اجرا میشود—بدون نیاز به دیتاسنتر یا زیرساختهای سنگین.
🎯 کاربردها:
• حل مسائل ریاضی از دبیرستان تا سطح دانشگاه
• تولید اثباتهای کاملاً منطقی
• بررسی و یافتن خطا در راهحلهای دانشجویان
• ساخت محتوای آموزشی ریاضی در سطح حرفهای
🔗 مدل:
https://huggingface.co/deepseek-ai/DeepSeek-Math-V2
#DeepSeek #AI #ریاضیات #مدل_زبان #هوش_مصنوعی @rss_ai_ir
@rss_ai_ir
✨ مدل DeepSeek Math V2 معرفی شد؛ مدلی که نهتنها مسئلههای ریاضی را حل میکند، بلکه خودش صحت مراحل استدلال و اثبات را نیز بررسی میکند.
این یعنی عبور از «جواب دادن» و ورود به «تفکر دقیق و قابل اعتماد».
📊 نتایج خیرهکننده:
سطح مدال طلا در IMO 2025
عملکرد تقریباً کامل در CMO 2024
کسب 118 از 120 امتیاز در Putnam 2024
🧠 ویژگی کلیدی این نسخه:
مدل یاد گرفته مرحلهبهمرحله استدلال کند و پس از تولید هر گام، آن را با یک سیستم درونی بررسی و تأیید کند.
خروجی نهایی دقیق، سازگار و بدون خطای منطقی است.
💡 مزیت بزرگ:
با وجود تواناییهای بسیار بالا، مدل همچنان سبک است و روی یک GPU هم اجرا میشود—بدون نیاز به دیتاسنتر یا زیرساختهای سنگین.
🎯 کاربردها:
• حل مسائل ریاضی از دبیرستان تا سطح دانشگاه
• تولید اثباتهای کاملاً منطقی
• بررسی و یافتن خطا در راهحلهای دانشجویان
• ساخت محتوای آموزشی ریاضی در سطح حرفهای
🔗 مدل:
https://huggingface.co/deepseek-ai/DeepSeek-Math-V2
#DeepSeek #AI #ریاضیات #مدل_زبان #هوش_مصنوعی @rss_ai_ir
🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 سؤال مهم درباره ویدئوی رباتها
✅نمایشها چشمگیرند — رباتی که سریع بلند میشود و شروع به دویدن میکند.
اما واقعاً کاربرد عملی این توانایی چیست؟
آیا فقط برای نشان دادن قدرت مهندسی است، یا پشت آن یک سناریوی صنعتی-نظامی-تجاری جدی قرار دارد؟
⛔️این همان پرسشی است که بسیاری از متخصصان رباتیک امروز مطرح میکنند:
«بهجز اثبات اینکه میتوانیم چنین کاری انجام دهیم، این توانایی دقیقاً کجا به کار میآید؟»
@rss_ai_ir
#رباتیک #هوش_مصنوعی #Autonomy #AIpost
✅نمایشها چشمگیرند — رباتی که سریع بلند میشود و شروع به دویدن میکند.
اما واقعاً کاربرد عملی این توانایی چیست؟
آیا فقط برای نشان دادن قدرت مهندسی است، یا پشت آن یک سناریوی صنعتی-نظامی-تجاری جدی قرار دارد؟
⛔️این همان پرسشی است که بسیاری از متخصصان رباتیک امروز مطرح میکنند:
«بهجز اثبات اینکه میتوانیم چنین کاری انجام دهیم، این توانایی دقیقاً کجا به کار میآید؟»
@rss_ai_ir
#رباتیک #هوش_مصنوعی #Autonomy #AIpost
📌 خلاصهای از تحلیلهای The Information و Financial Times درباره مسیر مالی و رشد OpenAI
در پشتصحنه موج عظیم استفاده از ChatGPT، مدل تجاری OpenAI با شتاب در حال تغییر است. شرکت از همان استراتژی موفق Zoom و Slack بهره میبرد: جذب کاربران رایگان، سپس تبدیل آنها به اشتراکهای سازمانی.
🔹 اکنون حدود ۵٪ از کاربران هفتگی، اشتراک پولی دارند.
🔹 پیشبینی: طی ۵ سال آینده، ۲۲۰ میلیون کاربر در جهان مشترک Plus میشوند (حدود ۸.۵٪ کاربران فعال).
🔹 برای مقایسه: Netflix حدود ۳۰۰ میلیون مشترک دارد و Office 365 نزدیک به ۴۵۰ میلیون.
اما بخش جذابتر، ارقام اقتصادی زیرساخت است:
⚡ بر اساس برآورد HSBC:
♻️قراردادهای فعلی دیتاسنترها: تا ۱.۸ تریلیون دلار
♻️هزینه سالانه دیتاسنتر تا پایان دهه: حدود ۶۲۰ میلیارد دلار
♻️مصرف واقعی احتمالاً تنها یکسوم ظرفیت قراردادها خواهد بود.
♻️پیشبینی تعداد کاربران ChatGPT تا ۲۰۳۰: ۳ میلیارد نفر (معادل ۴۴٪ بزرگسالان جهان بدون چین)
♻️حدود ۱۰٪ این جمعیت به مشتریان پولی تبدیل میشوند.
🔸 تحلیل HSBC همچنین پیشبینی میکند مدلهای زبانی حدود ۲٪ از کل بازار تبلیغات دیجیتال را تصاحب میکنند — عددی که با توجه به آغاز سرویس Shopping Assistant شاید حتی محافظهکارانه باشد.
📉 در فاصله امروز تا ۲۰۳۰، یک کسری بودجه حدود ۲۰۰ میلیارد دلار برای OpenAI پیشبینی شده است.
اما نکته مهم: این رقم در برابر ارزش درآمدی آینده و سرمایهگذاریهای کنونی (حدود ۶۰ میلیارد دلار جذبشده تاکنون) کاملاً قابل مدیریت است.
به زبان ساده:
اینکه OpenAI با سرعتی بیسابقه رشد میکند، سرویسها توسعه مییابند، و اگر جایگاه شماره یک خود را حفظ کند، تمام این هزینهها به یک سرمایهگذاری بلندمدت تبدیل میشود — نه بحران مالی.
https://www.theinformation.com/articles/openai-projected-least-220-million-people-will-pay-chatgpt-2030
https://www.ft.com/content/23e54a28-6f63-4533-ab96-3756d9c88bad
---
#OpenAI #ChatGPT #AI #TechEconomy #DataCenters #AIFuture #SamAltman @rss_ai_ir
در پشتصحنه موج عظیم استفاده از ChatGPT، مدل تجاری OpenAI با شتاب در حال تغییر است. شرکت از همان استراتژی موفق Zoom و Slack بهره میبرد: جذب کاربران رایگان، سپس تبدیل آنها به اشتراکهای سازمانی.
🔹 اکنون حدود ۵٪ از کاربران هفتگی، اشتراک پولی دارند.
🔹 پیشبینی: طی ۵ سال آینده، ۲۲۰ میلیون کاربر در جهان مشترک Plus میشوند (حدود ۸.۵٪ کاربران فعال).
🔹 برای مقایسه: Netflix حدود ۳۰۰ میلیون مشترک دارد و Office 365 نزدیک به ۴۵۰ میلیون.
اما بخش جذابتر، ارقام اقتصادی زیرساخت است:
⚡ بر اساس برآورد HSBC:
♻️قراردادهای فعلی دیتاسنترها: تا ۱.۸ تریلیون دلار
♻️هزینه سالانه دیتاسنتر تا پایان دهه: حدود ۶۲۰ میلیارد دلار
♻️مصرف واقعی احتمالاً تنها یکسوم ظرفیت قراردادها خواهد بود.
♻️پیشبینی تعداد کاربران ChatGPT تا ۲۰۳۰: ۳ میلیارد نفر (معادل ۴۴٪ بزرگسالان جهان بدون چین)
♻️حدود ۱۰٪ این جمعیت به مشتریان پولی تبدیل میشوند.
🔸 تحلیل HSBC همچنین پیشبینی میکند مدلهای زبانی حدود ۲٪ از کل بازار تبلیغات دیجیتال را تصاحب میکنند — عددی که با توجه به آغاز سرویس Shopping Assistant شاید حتی محافظهکارانه باشد.
📉 در فاصله امروز تا ۲۰۳۰، یک کسری بودجه حدود ۲۰۰ میلیارد دلار برای OpenAI پیشبینی شده است.
اما نکته مهم: این رقم در برابر ارزش درآمدی آینده و سرمایهگذاریهای کنونی (حدود ۶۰ میلیارد دلار جذبشده تاکنون) کاملاً قابل مدیریت است.
به زبان ساده:
اینکه OpenAI با سرعتی بیسابقه رشد میکند، سرویسها توسعه مییابند، و اگر جایگاه شماره یک خود را حفظ کند، تمام این هزینهها به یک سرمایهگذاری بلندمدت تبدیل میشود — نه بحران مالی.
https://www.theinformation.com/articles/openai-projected-least-220-million-people-will-pay-chatgpt-2030
https://www.ft.com/content/23e54a28-6f63-4533-ab96-3756d9c88bad
---
#OpenAI #ChatGPT #AI #TechEconomy #DataCenters #AIFuture #SamAltman @rss_ai_ir
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 بالاخره یک کاربرد واقعی برای رباتهای انساننما!
این ربات حالا در چین برای تمیز کردن توالتها استفاده میشود — یک نمونه واقعی از ورود رباتها از آزمایشگاهها به عملیات روزمره.
این یعنی:
• رباتها فقط برای دموهای نمایشی نیستند
• حوزههای آزاردهنده، خطرناک یا کمدرآمد اولین جاهایی هستند که اتوماسیون در آنها میدرخشد
• مرحله «واقعاً مفید بودن» رسماً آغاز شده است
بهجای نمایشهای آیندهنگرانه، این یکی دارد کار واقعی انجام میدهد.
@rss_ai_ir
#رباتیک 🤖 #اتوماسیون #هوش_مصنوعی #روبات_انساننما #فناوری #Robot_AI
این ربات حالا در چین برای تمیز کردن توالتها استفاده میشود — یک نمونه واقعی از ورود رباتها از آزمایشگاهها به عملیات روزمره.
این یعنی:
• رباتها فقط برای دموهای نمایشی نیستند
• حوزههای آزاردهنده، خطرناک یا کمدرآمد اولین جاهایی هستند که اتوماسیون در آنها میدرخشد
• مرحله «واقعاً مفید بودن» رسماً آغاز شده است
بهجای نمایشهای آیندهنگرانه، این یکی دارد کار واقعی انجام میدهد.
@rss_ai_ir
#رباتیک 🤖 #اتوماسیون #هوش_مصنوعی #روبات_انساننما #فناوری #Robot_AI
😁1💯1🤣1