VIRSUN
7.68K subscribers
1.38K photos
798 videos
5 files
881 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
🔥 مدل جدید Z-Image منتشر شد — نسل تازه‌ی مدل‌های سریع و سبک T2I

تیم Tongyi-MAI یک معماری تازه در حوزه text-to-image معرفی کرده که با وجود فقط ۶ میلیارد پارامتر، کیفیتی در حد مدل‌های سنگین‌تر ارائه می‌دهد.

ویژگی‌های کلیدی Z-Image:

🚀 سرعت خارق‌العاده: مدل دِیستیلی شده و تنها با ۸ مرحله (NFE) خروجی می‌سازد

کمتر از یک ثانیه تأخیر روی کارت‌های H800

🧩 اجرای محلی آسان: با فقط ۱۶GB VRAM روی 3090 / 4080 / 4090 قابل اجراست

🎨 فوتورئالیسم قوی، رعایت عالی دستورها و رندر دقیق متن روی تصویر


این مدل برای کسانی که سرعت، دقت و اجرای لوکال هم‌زمان می‌خواهند— یک گزینه‌ی جدی است.

🔗 دمو
https://modelscope.cn/aigc/imageGeneration

🔗 وِیت‌ها (Turbo)
https://modelscope.cn/models/Tongyi-MAI/Z-Image-Turbo

@rss_ai_ir

#AI #GenAI #Tongyi #TextToImage #Prompting #ML
5🔥2👏1
🔥 بهترین راهنمای فاین‌تیونینگ که امسال در arXiv می‌بینید!

اگر با مدل‌های زبانی کار می‌کنید—چه مبتدی باشید چه حرفه‌ای—این مقاله دقیقاً همان چیزی است که لازم دارید. یک راهنمای کامل، مرحله‌به‌مرحله و فوق‌العاده منظم برای تسلط بر Fine-Tuning مدرن.

📘 مباحثی که پوشش می‌دهد:

🧠 مبانی NLP (برای اینکه بدانید زیرساخت مدل چه می‌گوید)

⚙️ روش‌های PEFT / LoRA / QLoRA (تکنیک‌های سبک برای آموزش مدل‌های بزرگ روی GPUهای معمولی)

🔀اینکه Mixture of Experts (MoE) و نکات ریز مربوط به آموزش کارآمد

🧩 پایپلاین ۷ مرحله‌ای برای فاین‌تیونینگ حرفه‌ای

🎯 توصیه‌های عملی، چک‌لیست‌ها و اشتباهاتی که باید از آن‌ها دوری کرد


📄 منبع:
https://arxiv.org/pdf/2408.13296v1

#AI #ML #FineTuning #LoRA #QLoRA #MoE #NLP #DeepLearning #arXiv

@rss_ai_ir
👍2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
NAF: Zero-Shot Feature Upsampling via Neighborhood Attention Filtering

📝 خلاصه کوتاه:
روش NAF یک تکنیک جدید برای Upsampling ویژگی‌ها در مدل‌های پایه بینایی (Vision Foundation Models) است — کاملاً به‌صورت Zero-Shot و بدون هیچ‌گونه بازآموزی.
این روش با یادگیری وزن‌های تطبیقی بر اساس فضا + محتوا، دقت بالاتر و کارایی بهتر از آپ‌سمپلرهای سنتی ارائه می‌دهد.

🔹 ویژگی‌های کلیدی:

♻️آپ‌سمپل کردن ویژگی‌های VFM بدون نیاز به فاین‌تیون

♻️عملکرد SOTA در طیف گسترده‌ای از وظایف بینایی

♻️کارایی بالا و مناسب برای استفاده در سیستم‌های real-time

♻️قابل استفاده برای مدل‌های مختلف بدون وابستگی به معماری خاص


🔗 Paper & Code:
• arXiv: https://arxiv.org/abs/2511.18452
• PDF: https://arxiv.org/pdf/2511.18452
• GitHub: https://github.com/valeoai/NAF

#ZeroShotLearning #ComputerVision #FeatureUpsampling #DeepLearning #AIResearch @rss_ai_ir
1👍1🔥1🥰1
🚀 دیپ‌سیک بازگشت؛ این بار با یک انقلاب در ریاضیات
@rss_ai_ir

مدل DeepSeek Math V2 معرفی شد؛ مدلی که نه‌تنها مسئله‌های ریاضی را حل می‌کند، بلکه خودش صحت مراحل استدلال و اثبات را نیز بررسی می‌کند.
این یعنی عبور از «جواب دادن» و ورود به «تفکر دقیق و قابل اعتماد».

📊 نتایج خیره‌کننده:

سطح مدال طلا در IMO 2025

عملکرد تقریباً کامل در CMO 2024

کسب 118 از 120 امتیاز در Putnam 2024


🧠 ویژگی کلیدی این نسخه:
مدل یاد گرفته مرحله‌به‌مرحله استدلال کند و پس از تولید هر گام، آن را با یک سیستم درونی بررسی و تأیید کند.
خروجی نهایی دقیق، سازگار و بدون خطای منطقی است.

💡 مزیت بزرگ:
با وجود توانایی‌های بسیار بالا، مدل همچنان سبک است و روی یک GPU هم اجرا می‌شود—بدون نیاز به دیتاسنتر یا زیرساخت‌های سنگین.

🎯 کاربردها:
• حل مسائل ریاضی از دبیرستان تا سطح دانشگاه
• تولید اثبات‌های کاملاً منطقی
• بررسی و یافتن خطا در راه‌حل‌های دانشجویان
• ساخت محتوای آموزشی ریاضی در سطح حرفه‌ای

🔗 مدل:
https://huggingface.co/deepseek-ai/DeepSeek-Math-V2

#DeepSeek #AI #ریاضیات #مدل_زبان #هوش_مصنوعی @rss_ai_ir
🔥3👏21
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 سؤال مهم درباره ویدئوی ربات‌ها

نمایش‌ها چشمگیرند — رباتی که سریع بلند می‌شود و شروع به دویدن می‌کند.
اما واقعاً کاربرد عملی این توانایی چیست؟
آیا فقط برای نشان دادن قدرت مهندسی است، یا پشت آن یک سناریوی صنعتی-نظامی-تجاری جدی قرار دارد؟

⛔️این همان پرسشی است که بسیاری از متخصصان رباتیک امروز مطرح می‌کنند:
«به‌جز اثبات اینکه می‌توانیم چنین کاری انجام دهیم، این توانایی دقیقاً کجا به کار می‌آید؟»

@rss_ai_ir
#رباتیک #هوش_مصنوعی #Autonomy #AIpost
👍1👌1
📌 خلاصه‌ای از تحلیل‌های The Information و Financial Times درباره مسیر مالی و رشد OpenAI

در پشت‌صحنه موج عظیم استفاده از ChatGPT، مدل تجاری OpenAI با شتاب در حال تغییر است. شرکت از همان استراتژی موفق Zoom و Slack بهره می‌برد: جذب کاربران رایگان، سپس تبدیل آن‌ها به اشتراک‌های سازمانی.

🔹 اکنون حدود ۵٪ از کاربران هفتگی، اشتراک پولی دارند.
🔹 پیش‌بینی: طی ۵ سال آینده، ۲۲۰ میلیون کاربر در جهان مشترک Plus می‌شوند (حدود ۸.۵٪ کاربران فعال).
🔹 برای مقایسه: Netflix حدود ۳۰۰ میلیون مشترک دارد و Office 365 نزدیک به ۴۵۰ میلیون.

اما بخش جذاب‌تر، ارقام اقتصادی زیرساخت است:

بر اساس برآورد HSBC:

♻️قراردادهای فعلی دیتاسنترها: تا ۱.۸ تریلیون دلار

♻️هزینه سالانه دیتاسنتر تا پایان دهه: حدود ۶۲۰ میلیارد دلار

♻️مصرف واقعی احتمالاً تنها یک‌سوم ظرفیت قراردادها خواهد بود.

♻️پیش‌بینی تعداد کاربران ChatGPT تا ۲۰۳۰: ۳ میلیارد نفر (معادل ۴۴٪ بزرگسالان جهان بدون چین)

♻️حدود ۱۰٪ این جمعیت به مشتریان پولی تبدیل می‌شوند.


🔸 تحلیل HSBC همچنین پیش‌بینی می‌کند مدل‌های زبانی حدود ۲٪ از کل بازار تبلیغات دیجیتال را تصاحب می‌کنند — عددی که با توجه به آغاز سرویس Shopping Assistant شاید حتی محافظه‌کارانه باشد.

📉 در فاصله امروز تا ۲۰۳۰، یک کسری بودجه حدود ۲۰۰ میلیارد دلار برای OpenAI پیش‌بینی شده است.
اما نکته مهم: این رقم در برابر ارزش درآمدی آینده و سرمایه‌گذاری‌های کنونی (حدود ۶۰ میلیارد دلار جذب‌شده تاکنون) کاملاً قابل مدیریت است.

به زبان ساده:
اینکه OpenAI با سرعتی بی‌سابقه رشد می‌کند، سرویس‌ها توسعه می‌یابند، و اگر جایگاه شماره یک خود را حفظ کند، تمام این هزینه‌ها به یک سرمایه‌گذاری بلندمدت تبدیل می‌شود — نه بحران مالی.


https://www.theinformation.com/articles/openai-projected-least-220-million-people-will-pay-chatgpt-2030

https://www.ft.com/content/23e54a28-6f63-4533-ab96-3756d9c88bad
---

#OpenAI #ChatGPT #AI #TechEconomy #DataCenters #AIFuture #SamAltman @rss_ai_ir
👍1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 بالاخره یک کاربرد واقعی برای ربات‌های انسان‌نما!

این ربات حالا در چین برای تمیز کردن توالت‌ها استفاده می‌شود — یک نمونه واقعی از ورود ربات‌ها از آزمایشگاه‌ها به عملیات روزمره.

این یعنی:
• ربات‌ها فقط برای دموهای نمایشی نیستند
• حوزه‌های آزاردهنده، خطرناک یا کم‌درآمد اولین جاهایی هستند که اتوماسیون در آن‌ها می‌درخشد
• مرحله «واقعاً مفید بودن» رسماً آغاز شده است

به‌جای نمایش‌های آینده‌نگرانه، این یکی دارد کار واقعی انجام می‌دهد.

@rss_ai_ir
#رباتیک 🤖 #اتوماسیون #هوش_مصنوعی #روبات_انسان‌نما #فناوری #Robot_AI
👍2😁1💯1🤣1
🤖 دنیا سریع‌تر از آنچه فکر می‌کنیم در حال تغییر است.

چین رسماً شروع به استفاده گسترده از ربات‌های انسان‌نما در مرز با ویتنام کرده است.
این ربات‌ها در کارهای زیر به‌کار گرفته می‌شوند:

• راهنمایی و هدایت مسافران
• بازرسی و گشت‌زنی
• پشتیبانی لجستیکی
• و هم‌زمان استفاده صنعتی در کارخانه‌های فولاد، مس و آلومینیوم

ستاره‌ی این پروژه: Walker S2
اولین ربات انسان‌نما که می‌تواند باتری خودش را به‌صورت کاملاً خودکار تعویض کند — یعنی تقریباً ۲۴/۷ کار می‌کند.

ویژگی‌ها:
• ۵۲ درجه آزادی
• دست‌های بسیار دقیق و قوی
• بینایی استریو
• سیستم هوش مصنوعی UBTech BrainNet 2.0 / Co-Agent AI برای برنامه‌ریزی و اجرای خودمختار وظایف

📈اینکه UBTech تاکنون ۱.۱ میلیارد یوان قرارداد امضا کرده و قصد دارد:
• امسال ۵۰۰ ربات تحویل دهد
• سال بعد تولید را ۱۰ برابر کند
• و تا ۲۰۲۷ به ظرفیت ۱۰هزار ربات در سال برسد

این دیگر “فناوری آینده” نیست —
ربات‌های انسان‌نما به‌صورت رسمی وارد زیرساخت جهان شده‌اند.

منبع:
https://interestingengineering.com/innovation/ubtech-secures-us37-million-deal
🔥3👍21👏1
This media is not supported in your browser
VIEW IN TELEGRAM
قابلیت جدید و کاربردی در ChatGPT

اینکه OpenAI یک ویژگی کوچک اما فوق‌العاده مهم اضافه کرد:
حالا می‌توانید پرامپت را بعد از شروع پاسخ مدل اصلاح کنید — بدون اینکه فرآیند از اول ریست شود.

✳️یعنی اگر وسط اجرای Deep Research یا یک وظیفهٔ طولانی ناگهان یادتان بیاید که نکته‌ای را نگفتید، دیگر لازم نیست همه‌چیز را دوباره اجرا کنید. فقط «Update» را بزنید و ادامه می‌رود.

این قابلیت در:
• وظایف طولانی
• ایجنت‌ها
• ریزونینگ‌های چندمرحله‌ای

بسیار ارزشمند است و کلی زمان ذخیره می‌کند.

— ساده، تمیز، هوشمند 🌙🤖

@rss_ai_ir

#ChatGPT #OpenAI #AI #PromptEngineering #DeepResearch
👍3👏1😁1
Media is too big
VIEW IN TELEGRAM
🔥 استودیو Hunyuan 3D به نسخهٔ 1.1 آپدیت شد!

مدل جدید Hunyuan 3D-PolyGen 1.5 حالا مش‌های سه‌بعدی با کیفیت بسیار بالاتر تولید می‌کند.

ویژگی‌های مهم:

• مش‌های Quad واقعی
و PolyGen 1.5 فقط مثل قبل مش‌های مثلثی نمی‌سازد — حالا Quad Mesh‌های تمیز و حرفه‌ای تولید می‌کند.
این یعنی تاپولوژی بهتر، وایرفریم مرتب‌تر و ادیت راحت‌تر.

🎮 کاربردهای عملی
مش‌های Quad برای بازی‌سازها، انیماتورها، طراحان 3D و پروژه‌های VR ایده‌آل هستند.
کیفیت و تمیزی لبه‌ها، مدل را مستقیم قابل استفاده در تولید می‌کند.

⚙️ پشتیبانی از فرمت‌های مختلف
هر دو نوع Quad و Tri تولید می‌شود — بنابراین برای هر نوع pipeline مناسب است.

🔗 استفاده از نسخهٔ ۱.۱:
https://3d.hunyuan.tencent.com/studio


#Hunyuan3D #PolyGen #3DStudio #GenerativeAI #3DModeling
#QuadMesh #GameDev #3DDesign #AIGraphics #MeshGeneration
#ComputerGraphics #CGI #3DArtists #AIinDesign #TencentAI
🔥21🥰1
Media is too big
VIEW IN TELEGRAM
Paper2Video:
تبدیل خودکار مقاله‌ علمی به ویدئو

📝 خلاصه:
اینکه PaperTalker یک فریمورک چندعاملی است که می‌تواند از یک مقاله‌ علمی، به‌صورت خودکار ویدئوی کامل بسازد — شامل اسلایدها، زیرنویس، گفتار و چهره‌ سخنگو.
نتیجه‌ نهایی نسبت به روش‌های موجود دقیق‌تر، اطلاعاتی‌تر و بدون نیاز به تولید دستی محتوا است.

🔹 تاریخ انتشار: 6 اکتبر
🔹 لینک‌ها:

• arXiv:
https://arxiv.org/abs/2510.05096
• PDF:
https://arxiv.org/pdf/2510.05096
• پروژه:
https://showlab.github.io/Paper2Video/
• گیت‌هاب:
https://showlab.github.io/Paper2Video/

دیتاست‌های مرتبط:
https://huggingface.co/datasets/ZaynZhu/Paper2Video

#VideoGeneration #AI #AcademicCommunication #MachineLearning #MultimodalAI
2🔥1👏1
⚠️ اقتصاد آمریکا حالا روی دوش هوش مصنوعی بنا شده است

سرمایه‌گذاریِ واقعیِ ثابتِ بخش خصوصی آمریکا در دیتاسنترها طی سه سال گذشته بیش از ۳۰۰٪ رشد کرده.
در همین مدت، سرمایه‌گذاری تورم‌تعدیل‌شده در سایر ساختمان‌های تجاری—مثل دفاتر اداری، فروشگاه‌ها، هتل‌ها، انبارها، کارخانه‌ها و تأسیسات—تقریباً رشد صفر داشته است.

در نیمه اول سال ۲۰۲۵، هزینه‌های مربوط به AI بیش از ۶۲.۵٪ از رشد ۱.۶ درصدی GDP آمریکا را تشکیل داده‌اند.
یعنی ۱ واحد درصد از ۱.۶ واحد فقط از AI آمده است.

به عبارت دیگر:
🇺🇸 بدون هوش مصنوعی، اقتصاد آمریکا وارد رکود می‌شد.

#AI #Economy #AIGrowth #US_Economy #DataCenters #TechTrends #aipost
@rss_ai_ir
🔒 سرقت اطلاعات کاربران API اوپن‌اِی‌آی

اوپن‌اِی‌آی اعلام کرد که اوایل نوامبر سرویس آنالیتیک Mixpanel که برای تحلیل رفتار کاربران استفاده می‌کرد، هک شده و داده‌های مربوط به کاربران API افشا شده است.

چه چیزهایی لو رفته؟
• نام صاحب اکانت API
• ایمیل مرتبط با اکانت
• موقعیت تقریبی (شهر، منطقه، کشور) بر اساس داده مرورگر
• سیستم‌عامل و مرورگر مورد استفاده
• وبسایت‌هایی که کاربر از آن‌ها وارد شده
• شناسه‌های سازمانی یا کاربری متصل به اکانت API

خوشبختانه: کلیدهای API، رمز عبورها و اطلاعات پرداخت فاش نشده‌اند.

این حادثه یادآوری مهمی است:
حتی ابزارهای آنالیتیک هم می‌توانند نقطه ضعف امنیتی باشند.
برای امنیت، سازمان‌ها و کاربران باید اکانت‌های خود را بررسی و سیاست‌های امنیتی‌شان را به‌روزرسانی کنند.

#OpenAI #CyberSecurity #DataLeak #APISecurity #InfoSec #Privacy #AISecurity
2😁2
🌟 گوگل می‌خواهد رقابت هوش مصنوعی را نه با سرعت، بلکه با کاهش هزینهٔ محاسبات ببرد.

در حالی که انویدیا GPUها را با حاشیه سود بالا به کلودها می‌فروشد و هزینه نهایی برای مشتریان بالا می‌رود، گوگل TPUها را تقریباً به قیمت تمام‌شده تولید و عرضه می‌کند.
نتیجه؟ کاهش شدید هزینهٔ هر توکن در پردازش‌های هوش مصنوعی.

🔹 کلید ماجرا:
بزرگ‌ترین هزینه در AI، آموزش نیست—بلکه اینفرنس است؛ یعنی هزینهٔ تولید توکن پس از استقرار مدل.
وقتی مدل اجرا می‌شود، تقریباً تمام بودجه صرف توکن‌سازی می‌شود، نه آموزش.

🔹 مزیت گوگل
با یکپارچه‌سازی عمودی (طراحی چیپ → دیتاسنتر → شبکه → سرویس‌های ابری)، گوگل می‌تواند هزینهٔ هر توکن را دائماً پایین بیاورد و همین کاهش را مستقیم به کاربران منتقل کند.

🔹 چرا این مهم است؟
اگر قیمت اهمیت بیشتری از سرعت پیدا کند، بسیاری از شرکت‌ها TPU را به GPU ترجیح خواهند داد.

🔹 نقش انویدیا
انویدیا همچنان رهبر آموزش مدل‌های بزرگ خواهد بود، اما ممکن است نتواند همین حاشیه سود بالا را حفظ کند—به‌خصوص اگر حجم بزرگی از اینفرنس به TPU منتقل شود.

🔹 برتری دیگر گوگل
اکوسیستم عظیمی مثل Search، YouTube، Android و Workspace ظرفیت TPUها را به‌طور کامل پر می‌کند و تقاضای پایدار تضمین می‌شود.

منبع:
https://x.com/KrisPatel99/status/1993259550544191645

@rss_ai_ir

#Google #TPU #Nvidia #AI #MachineLearning #Inference #CloudComputing #TechEconomics
👍1
🌟 مدل ToolOrchestra؛ انقلاب تازه در هوش مصنوعی عامل‌محور

انویدیا به‌همراه دانشگاه هنگ‌کنگ «ToolOrchestra» را معرفی کرده؛ روشی برای آموزش رهبر ارکستر‌های هوش مصنوعی که می‌توانند چندین مدل و ابزار را هم‌زمان هماهنگ کنند.

نتیجهٔ این رویکرد، Orchestrator-8B است — مدلی بر پایه Qwen3 که به‌جای حل مسئله به‌تنهایی، میان تفکر و فراخوانی ابزارها سوئیچ می‌کند:
جستجوگر وب، مفسر کد، مدل‌های تخصصی ریاضی و حتی غول‌هایی مثل Claude و Llama-Nemotron.

دستاوردها:

♻️حل مسائل ۲.۵ برابر سریع‌تر

♻️هزینهٔ استقرار ۷۰٪ کمتر

♻️کسب ۳۷.۱٪ در بِنچمارک سخت Humanity’s Last Exam
(بالاتر از GPT-5 با ۳۵.۱٪)


📎 پروژه با لایسنس Apache 2.0 منتشر شده است.

https://research.nvidia.com/labs/lpr/ToolOrchestra/

https://huggingface.co/nvidia/Orchestrator-8B

https://arxiv.org/pdf/2511.21689

https://huggingface.co/datasets/nvidia/ToolScale

https://github.com/NVlabs/ToolOrchestra


#AI #LLM #NVIDIA #Orchestrator #ToolOrchestra #Agents #MachineLearning
6