🔥 بهترین راهنمای فاینتیونینگ که امسال در arXiv میبینید!
اگر با مدلهای زبانی کار میکنید—چه مبتدی باشید چه حرفهای—این مقاله دقیقاً همان چیزی است که لازم دارید. یک راهنمای کامل، مرحلهبهمرحله و فوقالعاده منظم برای تسلط بر Fine-Tuning مدرن.
📘 مباحثی که پوشش میدهد:
🧠 مبانی NLP (برای اینکه بدانید زیرساخت مدل چه میگوید)
⚙️ روشهای PEFT / LoRA / QLoRA (تکنیکهای سبک برای آموزش مدلهای بزرگ روی GPUهای معمولی)
🔀اینکه Mixture of Experts (MoE) و نکات ریز مربوط به آموزش کارآمد
🧩 پایپلاین ۷ مرحلهای برای فاینتیونینگ حرفهای
🎯 توصیههای عملی، چکلیستها و اشتباهاتی که باید از آنها دوری کرد
📄 منبع:
https://arxiv.org/pdf/2408.13296v1
#AI #ML #FineTuning #LoRA #QLoRA #MoE #NLP #DeepLearning #arXiv
@rss_ai_ir
اگر با مدلهای زبانی کار میکنید—چه مبتدی باشید چه حرفهای—این مقاله دقیقاً همان چیزی است که لازم دارید. یک راهنمای کامل، مرحلهبهمرحله و فوقالعاده منظم برای تسلط بر Fine-Tuning مدرن.
📘 مباحثی که پوشش میدهد:
🧠 مبانی NLP (برای اینکه بدانید زیرساخت مدل چه میگوید)
⚙️ روشهای PEFT / LoRA / QLoRA (تکنیکهای سبک برای آموزش مدلهای بزرگ روی GPUهای معمولی)
🔀اینکه Mixture of Experts (MoE) و نکات ریز مربوط به آموزش کارآمد
🧩 پایپلاین ۷ مرحلهای برای فاینتیونینگ حرفهای
🎯 توصیههای عملی، چکلیستها و اشتباهاتی که باید از آنها دوری کرد
📄 منبع:
https://arxiv.org/pdf/2408.13296v1
#AI #ML #FineTuning #LoRA #QLoRA #MoE #NLP #DeepLearning #arXiv
@rss_ai_ir
👍2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
✨ NAF: Zero-Shot Feature Upsampling via Neighborhood Attention Filtering ✨
📝 خلاصه کوتاه:
روش NAF یک تکنیک جدید برای Upsampling ویژگیها در مدلهای پایه بینایی (Vision Foundation Models) است — کاملاً بهصورت Zero-Shot و بدون هیچگونه بازآموزی.
این روش با یادگیری وزنهای تطبیقی بر اساس فضا + محتوا، دقت بالاتر و کارایی بهتر از آپسمپلرهای سنتی ارائه میدهد.
🔹 ویژگیهای کلیدی:
♻️آپسمپل کردن ویژگیهای VFM بدون نیاز به فاینتیون
♻️عملکرد SOTA در طیف گستردهای از وظایف بینایی
♻️کارایی بالا و مناسب برای استفاده در سیستمهای real-time
♻️قابل استفاده برای مدلهای مختلف بدون وابستگی به معماری خاص
🔗 Paper & Code:
• arXiv: https://arxiv.org/abs/2511.18452
• PDF: https://arxiv.org/pdf/2511.18452
• GitHub: https://github.com/valeoai/NAF
#ZeroShotLearning #ComputerVision #FeatureUpsampling #DeepLearning #AIResearch @rss_ai_ir
📝 خلاصه کوتاه:
روش NAF یک تکنیک جدید برای Upsampling ویژگیها در مدلهای پایه بینایی (Vision Foundation Models) است — کاملاً بهصورت Zero-Shot و بدون هیچگونه بازآموزی.
این روش با یادگیری وزنهای تطبیقی بر اساس فضا + محتوا، دقت بالاتر و کارایی بهتر از آپسمپلرهای سنتی ارائه میدهد.
🔹 ویژگیهای کلیدی:
♻️آپسمپل کردن ویژگیهای VFM بدون نیاز به فاینتیون
♻️عملکرد SOTA در طیف گستردهای از وظایف بینایی
♻️کارایی بالا و مناسب برای استفاده در سیستمهای real-time
♻️قابل استفاده برای مدلهای مختلف بدون وابستگی به معماری خاص
🔗 Paper & Code:
• arXiv: https://arxiv.org/abs/2511.18452
• PDF: https://arxiv.org/pdf/2511.18452
• GitHub: https://github.com/valeoai/NAF
#ZeroShotLearning #ComputerVision #FeatureUpsampling #DeepLearning #AIResearch @rss_ai_ir
❤1👍1🔥1🥰1
🚀 دیپسیک بازگشت؛ این بار با یک انقلاب در ریاضیات
@rss_ai_ir
✨ مدل DeepSeek Math V2 معرفی شد؛ مدلی که نهتنها مسئلههای ریاضی را حل میکند، بلکه خودش صحت مراحل استدلال و اثبات را نیز بررسی میکند.
این یعنی عبور از «جواب دادن» و ورود به «تفکر دقیق و قابل اعتماد».
📊 نتایج خیرهکننده:
سطح مدال طلا در IMO 2025
عملکرد تقریباً کامل در CMO 2024
کسب 118 از 120 امتیاز در Putnam 2024
🧠 ویژگی کلیدی این نسخه:
مدل یاد گرفته مرحلهبهمرحله استدلال کند و پس از تولید هر گام، آن را با یک سیستم درونی بررسی و تأیید کند.
خروجی نهایی دقیق، سازگار و بدون خطای منطقی است.
💡 مزیت بزرگ:
با وجود تواناییهای بسیار بالا، مدل همچنان سبک است و روی یک GPU هم اجرا میشود—بدون نیاز به دیتاسنتر یا زیرساختهای سنگین.
🎯 کاربردها:
• حل مسائل ریاضی از دبیرستان تا سطح دانشگاه
• تولید اثباتهای کاملاً منطقی
• بررسی و یافتن خطا در راهحلهای دانشجویان
• ساخت محتوای آموزشی ریاضی در سطح حرفهای
🔗 مدل:
https://huggingface.co/deepseek-ai/DeepSeek-Math-V2
#DeepSeek #AI #ریاضیات #مدل_زبان #هوش_مصنوعی @rss_ai_ir
@rss_ai_ir
✨ مدل DeepSeek Math V2 معرفی شد؛ مدلی که نهتنها مسئلههای ریاضی را حل میکند، بلکه خودش صحت مراحل استدلال و اثبات را نیز بررسی میکند.
این یعنی عبور از «جواب دادن» و ورود به «تفکر دقیق و قابل اعتماد».
📊 نتایج خیرهکننده:
سطح مدال طلا در IMO 2025
عملکرد تقریباً کامل در CMO 2024
کسب 118 از 120 امتیاز در Putnam 2024
🧠 ویژگی کلیدی این نسخه:
مدل یاد گرفته مرحلهبهمرحله استدلال کند و پس از تولید هر گام، آن را با یک سیستم درونی بررسی و تأیید کند.
خروجی نهایی دقیق، سازگار و بدون خطای منطقی است.
💡 مزیت بزرگ:
با وجود تواناییهای بسیار بالا، مدل همچنان سبک است و روی یک GPU هم اجرا میشود—بدون نیاز به دیتاسنتر یا زیرساختهای سنگین.
🎯 کاربردها:
• حل مسائل ریاضی از دبیرستان تا سطح دانشگاه
• تولید اثباتهای کاملاً منطقی
• بررسی و یافتن خطا در راهحلهای دانشجویان
• ساخت محتوای آموزشی ریاضی در سطح حرفهای
🔗 مدل:
https://huggingface.co/deepseek-ai/DeepSeek-Math-V2
#DeepSeek #AI #ریاضیات #مدل_زبان #هوش_مصنوعی @rss_ai_ir
🔥3👏2❤1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 سؤال مهم درباره ویدئوی رباتها
✅نمایشها چشمگیرند — رباتی که سریع بلند میشود و شروع به دویدن میکند.
اما واقعاً کاربرد عملی این توانایی چیست؟
آیا فقط برای نشان دادن قدرت مهندسی است، یا پشت آن یک سناریوی صنعتی-نظامی-تجاری جدی قرار دارد؟
⛔️این همان پرسشی است که بسیاری از متخصصان رباتیک امروز مطرح میکنند:
«بهجز اثبات اینکه میتوانیم چنین کاری انجام دهیم، این توانایی دقیقاً کجا به کار میآید؟»
@rss_ai_ir
#رباتیک #هوش_مصنوعی #Autonomy #AIpost
✅نمایشها چشمگیرند — رباتی که سریع بلند میشود و شروع به دویدن میکند.
اما واقعاً کاربرد عملی این توانایی چیست؟
آیا فقط برای نشان دادن قدرت مهندسی است، یا پشت آن یک سناریوی صنعتی-نظامی-تجاری جدی قرار دارد؟
⛔️این همان پرسشی است که بسیاری از متخصصان رباتیک امروز مطرح میکنند:
«بهجز اثبات اینکه میتوانیم چنین کاری انجام دهیم، این توانایی دقیقاً کجا به کار میآید؟»
@rss_ai_ir
#رباتیک #هوش_مصنوعی #Autonomy #AIpost
👍1👌1
📌 خلاصهای از تحلیلهای The Information و Financial Times درباره مسیر مالی و رشد OpenAI
در پشتصحنه موج عظیم استفاده از ChatGPT، مدل تجاری OpenAI با شتاب در حال تغییر است. شرکت از همان استراتژی موفق Zoom و Slack بهره میبرد: جذب کاربران رایگان، سپس تبدیل آنها به اشتراکهای سازمانی.
🔹 اکنون حدود ۵٪ از کاربران هفتگی، اشتراک پولی دارند.
🔹 پیشبینی: طی ۵ سال آینده، ۲۲۰ میلیون کاربر در جهان مشترک Plus میشوند (حدود ۸.۵٪ کاربران فعال).
🔹 برای مقایسه: Netflix حدود ۳۰۰ میلیون مشترک دارد و Office 365 نزدیک به ۴۵۰ میلیون.
اما بخش جذابتر، ارقام اقتصادی زیرساخت است:
⚡ بر اساس برآورد HSBC:
♻️قراردادهای فعلی دیتاسنترها: تا ۱.۸ تریلیون دلار
♻️هزینه سالانه دیتاسنتر تا پایان دهه: حدود ۶۲۰ میلیارد دلار
♻️مصرف واقعی احتمالاً تنها یکسوم ظرفیت قراردادها خواهد بود.
♻️پیشبینی تعداد کاربران ChatGPT تا ۲۰۳۰: ۳ میلیارد نفر (معادل ۴۴٪ بزرگسالان جهان بدون چین)
♻️حدود ۱۰٪ این جمعیت به مشتریان پولی تبدیل میشوند.
🔸 تحلیل HSBC همچنین پیشبینی میکند مدلهای زبانی حدود ۲٪ از کل بازار تبلیغات دیجیتال را تصاحب میکنند — عددی که با توجه به آغاز سرویس Shopping Assistant شاید حتی محافظهکارانه باشد.
📉 در فاصله امروز تا ۲۰۳۰، یک کسری بودجه حدود ۲۰۰ میلیارد دلار برای OpenAI پیشبینی شده است.
اما نکته مهم: این رقم در برابر ارزش درآمدی آینده و سرمایهگذاریهای کنونی (حدود ۶۰ میلیارد دلار جذبشده تاکنون) کاملاً قابل مدیریت است.
به زبان ساده:
اینکه OpenAI با سرعتی بیسابقه رشد میکند، سرویسها توسعه مییابند، و اگر جایگاه شماره یک خود را حفظ کند، تمام این هزینهها به یک سرمایهگذاری بلندمدت تبدیل میشود — نه بحران مالی.
https://www.theinformation.com/articles/openai-projected-least-220-million-people-will-pay-chatgpt-2030
https://www.ft.com/content/23e54a28-6f63-4533-ab96-3756d9c88bad
---
#OpenAI #ChatGPT #AI #TechEconomy #DataCenters #AIFuture #SamAltman @rss_ai_ir
در پشتصحنه موج عظیم استفاده از ChatGPT، مدل تجاری OpenAI با شتاب در حال تغییر است. شرکت از همان استراتژی موفق Zoom و Slack بهره میبرد: جذب کاربران رایگان، سپس تبدیل آنها به اشتراکهای سازمانی.
🔹 اکنون حدود ۵٪ از کاربران هفتگی، اشتراک پولی دارند.
🔹 پیشبینی: طی ۵ سال آینده، ۲۲۰ میلیون کاربر در جهان مشترک Plus میشوند (حدود ۸.۵٪ کاربران فعال).
🔹 برای مقایسه: Netflix حدود ۳۰۰ میلیون مشترک دارد و Office 365 نزدیک به ۴۵۰ میلیون.
اما بخش جذابتر، ارقام اقتصادی زیرساخت است:
⚡ بر اساس برآورد HSBC:
♻️قراردادهای فعلی دیتاسنترها: تا ۱.۸ تریلیون دلار
♻️هزینه سالانه دیتاسنتر تا پایان دهه: حدود ۶۲۰ میلیارد دلار
♻️مصرف واقعی احتمالاً تنها یکسوم ظرفیت قراردادها خواهد بود.
♻️پیشبینی تعداد کاربران ChatGPT تا ۲۰۳۰: ۳ میلیارد نفر (معادل ۴۴٪ بزرگسالان جهان بدون چین)
♻️حدود ۱۰٪ این جمعیت به مشتریان پولی تبدیل میشوند.
🔸 تحلیل HSBC همچنین پیشبینی میکند مدلهای زبانی حدود ۲٪ از کل بازار تبلیغات دیجیتال را تصاحب میکنند — عددی که با توجه به آغاز سرویس Shopping Assistant شاید حتی محافظهکارانه باشد.
📉 در فاصله امروز تا ۲۰۳۰، یک کسری بودجه حدود ۲۰۰ میلیارد دلار برای OpenAI پیشبینی شده است.
اما نکته مهم: این رقم در برابر ارزش درآمدی آینده و سرمایهگذاریهای کنونی (حدود ۶۰ میلیارد دلار جذبشده تاکنون) کاملاً قابل مدیریت است.
به زبان ساده:
اینکه OpenAI با سرعتی بیسابقه رشد میکند، سرویسها توسعه مییابند، و اگر جایگاه شماره یک خود را حفظ کند، تمام این هزینهها به یک سرمایهگذاری بلندمدت تبدیل میشود — نه بحران مالی.
https://www.theinformation.com/articles/openai-projected-least-220-million-people-will-pay-chatgpt-2030
https://www.ft.com/content/23e54a28-6f63-4533-ab96-3756d9c88bad
---
#OpenAI #ChatGPT #AI #TechEconomy #DataCenters #AIFuture #SamAltman @rss_ai_ir
👍1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 بالاخره یک کاربرد واقعی برای رباتهای انساننما!
این ربات حالا در چین برای تمیز کردن توالتها استفاده میشود — یک نمونه واقعی از ورود رباتها از آزمایشگاهها به عملیات روزمره.
این یعنی:
• رباتها فقط برای دموهای نمایشی نیستند
• حوزههای آزاردهنده، خطرناک یا کمدرآمد اولین جاهایی هستند که اتوماسیون در آنها میدرخشد
• مرحله «واقعاً مفید بودن» رسماً آغاز شده است
بهجای نمایشهای آیندهنگرانه، این یکی دارد کار واقعی انجام میدهد.
@rss_ai_ir
#رباتیک 🤖 #اتوماسیون #هوش_مصنوعی #روبات_انساننما #فناوری #Robot_AI
این ربات حالا در چین برای تمیز کردن توالتها استفاده میشود — یک نمونه واقعی از ورود رباتها از آزمایشگاهها به عملیات روزمره.
این یعنی:
• رباتها فقط برای دموهای نمایشی نیستند
• حوزههای آزاردهنده، خطرناک یا کمدرآمد اولین جاهایی هستند که اتوماسیون در آنها میدرخشد
• مرحله «واقعاً مفید بودن» رسماً آغاز شده است
بهجای نمایشهای آیندهنگرانه، این یکی دارد کار واقعی انجام میدهد.
@rss_ai_ir
#رباتیک 🤖 #اتوماسیون #هوش_مصنوعی #روبات_انساننما #فناوری #Robot_AI
👍2😁1💯1🤣1
🤖 دنیا سریعتر از آنچه فکر میکنیم در حال تغییر است.
چین رسماً شروع به استفاده گسترده از رباتهای انساننما در مرز با ویتنام کرده است.
این رباتها در کارهای زیر بهکار گرفته میشوند:
• راهنمایی و هدایت مسافران
• بازرسی و گشتزنی
• پشتیبانی لجستیکی
• و همزمان استفاده صنعتی در کارخانههای فولاد، مس و آلومینیوم
✨ ستارهی این پروژه: Walker S2
اولین ربات انساننما که میتواند باتری خودش را بهصورت کاملاً خودکار تعویض کند — یعنی تقریباً ۲۴/۷ کار میکند.
ویژگیها:
• ۵۲ درجه آزادی
• دستهای بسیار دقیق و قوی
• بینایی استریو
• سیستم هوش مصنوعی UBTech BrainNet 2.0 / Co-Agent AI برای برنامهریزی و اجرای خودمختار وظایف
📈اینکه UBTech تاکنون ۱.۱ میلیارد یوان قرارداد امضا کرده و قصد دارد:
• امسال ۵۰۰ ربات تحویل دهد
• سال بعد تولید را ۱۰ برابر کند
• و تا ۲۰۲۷ به ظرفیت ۱۰هزار ربات در سال برسد
این دیگر “فناوری آینده” نیست —
رباتهای انساننما بهصورت رسمی وارد زیرساخت جهان شدهاند.
منبع:
https://interestingengineering.com/innovation/ubtech-secures-us37-million-deal
چین رسماً شروع به استفاده گسترده از رباتهای انساننما در مرز با ویتنام کرده است.
این رباتها در کارهای زیر بهکار گرفته میشوند:
• راهنمایی و هدایت مسافران
• بازرسی و گشتزنی
• پشتیبانی لجستیکی
• و همزمان استفاده صنعتی در کارخانههای فولاد، مس و آلومینیوم
✨ ستارهی این پروژه: Walker S2
اولین ربات انساننما که میتواند باتری خودش را بهصورت کاملاً خودکار تعویض کند — یعنی تقریباً ۲۴/۷ کار میکند.
ویژگیها:
• ۵۲ درجه آزادی
• دستهای بسیار دقیق و قوی
• بینایی استریو
• سیستم هوش مصنوعی UBTech BrainNet 2.0 / Co-Agent AI برای برنامهریزی و اجرای خودمختار وظایف
📈اینکه UBTech تاکنون ۱.۱ میلیارد یوان قرارداد امضا کرده و قصد دارد:
• امسال ۵۰۰ ربات تحویل دهد
• سال بعد تولید را ۱۰ برابر کند
• و تا ۲۰۲۷ به ظرفیت ۱۰هزار ربات در سال برسد
این دیگر “فناوری آینده” نیست —
رباتهای انساننما بهصورت رسمی وارد زیرساخت جهان شدهاند.
منبع:
https://interestingengineering.com/innovation/ubtech-secures-us37-million-deal
🔥3👍2❤1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
✨ قابلیت جدید و کاربردی در ChatGPT
اینکه OpenAI یک ویژگی کوچک اما فوقالعاده مهم اضافه کرد:
حالا میتوانید پرامپت را بعد از شروع پاسخ مدل اصلاح کنید — بدون اینکه فرآیند از اول ریست شود.
✳️یعنی اگر وسط اجرای Deep Research یا یک وظیفهٔ طولانی ناگهان یادتان بیاید که نکتهای را نگفتید، دیگر لازم نیست همهچیز را دوباره اجرا کنید. فقط «Update» را بزنید و ادامه میرود.
❌این قابلیت در:
• وظایف طولانی
• ایجنتها
• ریزونینگهای چندمرحلهای
بسیار ارزشمند است و کلی زمان ذخیره میکند.
— ساده، تمیز، هوشمند 🌙🤖
@rss_ai_ir
#ChatGPT #OpenAI #AI #PromptEngineering #DeepResearch
اینکه OpenAI یک ویژگی کوچک اما فوقالعاده مهم اضافه کرد:
حالا میتوانید پرامپت را بعد از شروع پاسخ مدل اصلاح کنید — بدون اینکه فرآیند از اول ریست شود.
✳️یعنی اگر وسط اجرای Deep Research یا یک وظیفهٔ طولانی ناگهان یادتان بیاید که نکتهای را نگفتید، دیگر لازم نیست همهچیز را دوباره اجرا کنید. فقط «Update» را بزنید و ادامه میرود.
❌این قابلیت در:
• وظایف طولانی
• ایجنتها
• ریزونینگهای چندمرحلهای
بسیار ارزشمند است و کلی زمان ذخیره میکند.
— ساده، تمیز، هوشمند 🌙🤖
@rss_ai_ir
#ChatGPT #OpenAI #AI #PromptEngineering #DeepResearch
👍3👏1😁1
Media is too big
VIEW IN TELEGRAM
🔥 استودیو Hunyuan 3D به نسخهٔ 1.1 آپدیت شد!
مدل جدید Hunyuan 3D-PolyGen 1.5 حالا مشهای سهبعدی با کیفیت بسیار بالاتر تولید میکند.
✨ ویژگیهای مهم:
• مشهای Quad واقعی
و PolyGen 1.5 فقط مثل قبل مشهای مثلثی نمیسازد — حالا Quad Meshهای تمیز و حرفهای تولید میکند.
این یعنی تاپولوژی بهتر، وایرفریم مرتبتر و ادیت راحتتر.
🎮 کاربردهای عملی
مشهای Quad برای بازیسازها، انیماتورها، طراحان 3D و پروژههای VR ایدهآل هستند.
کیفیت و تمیزی لبهها، مدل را مستقیم قابل استفاده در تولید میکند.
⚙️ پشتیبانی از فرمتهای مختلف
هر دو نوع Quad و Tri تولید میشود — بنابراین برای هر نوع pipeline مناسب است.
🔗 استفاده از نسخهٔ ۱.۱:
https://3d.hunyuan.tencent.com/studio
#Hunyuan3D #PolyGen #3DStudio #GenerativeAI #3DModeling
#QuadMesh #GameDev #3DDesign #AIGraphics #MeshGeneration
#ComputerGraphics #CGI #3DArtists #AIinDesign #TencentAI
مدل جدید Hunyuan 3D-PolyGen 1.5 حالا مشهای سهبعدی با کیفیت بسیار بالاتر تولید میکند.
✨ ویژگیهای مهم:
• مشهای Quad واقعی
و PolyGen 1.5 فقط مثل قبل مشهای مثلثی نمیسازد — حالا Quad Meshهای تمیز و حرفهای تولید میکند.
این یعنی تاپولوژی بهتر، وایرفریم مرتبتر و ادیت راحتتر.
🎮 کاربردهای عملی
مشهای Quad برای بازیسازها، انیماتورها، طراحان 3D و پروژههای VR ایدهآل هستند.
کیفیت و تمیزی لبهها، مدل را مستقیم قابل استفاده در تولید میکند.
⚙️ پشتیبانی از فرمتهای مختلف
هر دو نوع Quad و Tri تولید میشود — بنابراین برای هر نوع pipeline مناسب است.
🔗 استفاده از نسخهٔ ۱.۱:
https://3d.hunyuan.tencent.com/studio
#Hunyuan3D #PolyGen #3DStudio #GenerativeAI #3DModeling
#QuadMesh #GameDev #3DDesign #AIGraphics #MeshGeneration
#ComputerGraphics #CGI #3DArtists #AIinDesign #TencentAI
🔥2❤1🥰1
Media is too big
VIEW IN TELEGRAM
✨ Paper2Video:
تبدیل خودکار مقاله علمی به ویدئو
📝 خلاصه:
اینکه PaperTalker یک فریمورک چندعاملی است که میتواند از یک مقاله علمی، بهصورت خودکار ویدئوی کامل بسازد — شامل اسلایدها، زیرنویس، گفتار و چهره سخنگو.
نتیجه نهایی نسبت به روشهای موجود دقیقتر، اطلاعاتیتر و بدون نیاز به تولید دستی محتوا است.
🔹 تاریخ انتشار: 6 اکتبر
🔹 لینکها:
• arXiv:
https://arxiv.org/abs/2510.05096
• PDF:
https://arxiv.org/pdf/2510.05096
• پروژه:
https://showlab.github.io/Paper2Video/
• گیتهاب:
https://showlab.github.io/Paper2Video/
✨ دیتاستهای مرتبط:
• https://huggingface.co/datasets/ZaynZhu/Paper2Video
#VideoGeneration #AI #AcademicCommunication #MachineLearning #MultimodalAI
تبدیل خودکار مقاله علمی به ویدئو
📝 خلاصه:
اینکه PaperTalker یک فریمورک چندعاملی است که میتواند از یک مقاله علمی، بهصورت خودکار ویدئوی کامل بسازد — شامل اسلایدها، زیرنویس، گفتار و چهره سخنگو.
نتیجه نهایی نسبت به روشهای موجود دقیقتر، اطلاعاتیتر و بدون نیاز به تولید دستی محتوا است.
🔹 تاریخ انتشار: 6 اکتبر
🔹 لینکها:
• arXiv:
https://arxiv.org/abs/2510.05096
• PDF:
https://arxiv.org/pdf/2510.05096
• پروژه:
https://showlab.github.io/Paper2Video/
• گیتهاب:
https://showlab.github.io/Paper2Video/
✨ دیتاستهای مرتبط:
• https://huggingface.co/datasets/ZaynZhu/Paper2Video
#VideoGeneration #AI #AcademicCommunication #MachineLearning #MultimodalAI
❤2🔥1👏1
⚠️ اقتصاد آمریکا حالا روی دوش هوش مصنوعی بنا شده است
سرمایهگذاریِ واقعیِ ثابتِ بخش خصوصی آمریکا در دیتاسنترها طی سه سال گذشته بیش از ۳۰۰٪ رشد کرده.
در همین مدت، سرمایهگذاری تورمتعدیلشده در سایر ساختمانهای تجاری—مثل دفاتر اداری، فروشگاهها، هتلها، انبارها، کارخانهها و تأسیسات—تقریباً رشد صفر داشته است.
در نیمه اول سال ۲۰۲۵، هزینههای مربوط به AI بیش از ۶۲.۵٪ از رشد ۱.۶ درصدی GDP آمریکا را تشکیل دادهاند.
یعنی ۱ واحد درصد از ۱.۶ واحد فقط از AI آمده است.
به عبارت دیگر:
🇺🇸 بدون هوش مصنوعی، اقتصاد آمریکا وارد رکود میشد.
#AI #Economy #AIGrowth #US_Economy #DataCenters #TechTrends #aipost
@rss_ai_ir
سرمایهگذاریِ واقعیِ ثابتِ بخش خصوصی آمریکا در دیتاسنترها طی سه سال گذشته بیش از ۳۰۰٪ رشد کرده.
در همین مدت، سرمایهگذاری تورمتعدیلشده در سایر ساختمانهای تجاری—مثل دفاتر اداری، فروشگاهها، هتلها، انبارها، کارخانهها و تأسیسات—تقریباً رشد صفر داشته است.
در نیمه اول سال ۲۰۲۵، هزینههای مربوط به AI بیش از ۶۲.۵٪ از رشد ۱.۶ درصدی GDP آمریکا را تشکیل دادهاند.
یعنی ۱ واحد درصد از ۱.۶ واحد فقط از AI آمده است.
به عبارت دیگر:
🇺🇸 بدون هوش مصنوعی، اقتصاد آمریکا وارد رکود میشد.
#AI #Economy #AIGrowth #US_Economy #DataCenters #TechTrends #aipost
@rss_ai_ir
🔒 سرقت اطلاعات کاربران API اوپناِیآی
اوپناِیآی اعلام کرد که اوایل نوامبر سرویس آنالیتیک Mixpanel که برای تحلیل رفتار کاربران استفاده میکرد، هک شده و دادههای مربوط به کاربران API افشا شده است.
چه چیزهایی لو رفته؟
• نام صاحب اکانت API
• ایمیل مرتبط با اکانت
• موقعیت تقریبی (شهر، منطقه، کشور) بر اساس داده مرورگر
• سیستمعامل و مرورگر مورد استفاده
• وبسایتهایی که کاربر از آنها وارد شده
• شناسههای سازمانی یا کاربری متصل به اکانت API
⛔ خوشبختانه: کلیدهای API، رمز عبورها و اطلاعات پرداخت فاش نشدهاند.
این حادثه یادآوری مهمی است:
حتی ابزارهای آنالیتیک هم میتوانند نقطه ضعف امنیتی باشند.
برای امنیت، سازمانها و کاربران باید اکانتهای خود را بررسی و سیاستهای امنیتیشان را بهروزرسانی کنند.
#OpenAI #CyberSecurity #DataLeak #APISecurity #InfoSec #Privacy #AISecurity
اوپناِیآی اعلام کرد که اوایل نوامبر سرویس آنالیتیک Mixpanel که برای تحلیل رفتار کاربران استفاده میکرد، هک شده و دادههای مربوط به کاربران API افشا شده است.
چه چیزهایی لو رفته؟
• نام صاحب اکانت API
• ایمیل مرتبط با اکانت
• موقعیت تقریبی (شهر، منطقه، کشور) بر اساس داده مرورگر
• سیستمعامل و مرورگر مورد استفاده
• وبسایتهایی که کاربر از آنها وارد شده
• شناسههای سازمانی یا کاربری متصل به اکانت API
⛔ خوشبختانه: کلیدهای API، رمز عبورها و اطلاعات پرداخت فاش نشدهاند.
این حادثه یادآوری مهمی است:
حتی ابزارهای آنالیتیک هم میتوانند نقطه ضعف امنیتی باشند.
برای امنیت، سازمانها و کاربران باید اکانتهای خود را بررسی و سیاستهای امنیتیشان را بهروزرسانی کنند.
#OpenAI #CyberSecurity #DataLeak #APISecurity #InfoSec #Privacy #AISecurity
❤2😁2
🌟 گوگل میخواهد رقابت هوش مصنوعی را نه با سرعت، بلکه با کاهش هزینهٔ محاسبات ببرد.
در حالی که انویدیا GPUها را با حاشیه سود بالا به کلودها میفروشد و هزینه نهایی برای مشتریان بالا میرود، گوگل TPUها را تقریباً به قیمت تمامشده تولید و عرضه میکند.
نتیجه؟ کاهش شدید هزینهٔ هر توکن در پردازشهای هوش مصنوعی.
🔹 کلید ماجرا:
بزرگترین هزینه در AI، آموزش نیست—بلکه اینفرنس است؛ یعنی هزینهٔ تولید توکن پس از استقرار مدل.
وقتی مدل اجرا میشود، تقریباً تمام بودجه صرف توکنسازی میشود، نه آموزش.
🔹 مزیت گوگل
با یکپارچهسازی عمودی (طراحی چیپ → دیتاسنتر → شبکه → سرویسهای ابری)، گوگل میتواند هزینهٔ هر توکن را دائماً پایین بیاورد و همین کاهش را مستقیم به کاربران منتقل کند.
🔹 چرا این مهم است؟
اگر قیمت اهمیت بیشتری از سرعت پیدا کند، بسیاری از شرکتها TPU را به GPU ترجیح خواهند داد.
🔹 نقش انویدیا
انویدیا همچنان رهبر آموزش مدلهای بزرگ خواهد بود، اما ممکن است نتواند همین حاشیه سود بالا را حفظ کند—بهخصوص اگر حجم بزرگی از اینفرنس به TPU منتقل شود.
🔹 برتری دیگر گوگل
اکوسیستم عظیمی مثل Search، YouTube، Android و Workspace ظرفیت TPUها را بهطور کامل پر میکند و تقاضای پایدار تضمین میشود.
منبع:
https://x.com/KrisPatel99/status/1993259550544191645
@rss_ai_ir
#Google #TPU #Nvidia #AI #MachineLearning #Inference #CloudComputing #TechEconomics
در حالی که انویدیا GPUها را با حاشیه سود بالا به کلودها میفروشد و هزینه نهایی برای مشتریان بالا میرود، گوگل TPUها را تقریباً به قیمت تمامشده تولید و عرضه میکند.
نتیجه؟ کاهش شدید هزینهٔ هر توکن در پردازشهای هوش مصنوعی.
🔹 کلید ماجرا:
بزرگترین هزینه در AI، آموزش نیست—بلکه اینفرنس است؛ یعنی هزینهٔ تولید توکن پس از استقرار مدل.
وقتی مدل اجرا میشود، تقریباً تمام بودجه صرف توکنسازی میشود، نه آموزش.
🔹 مزیت گوگل
با یکپارچهسازی عمودی (طراحی چیپ → دیتاسنتر → شبکه → سرویسهای ابری)، گوگل میتواند هزینهٔ هر توکن را دائماً پایین بیاورد و همین کاهش را مستقیم به کاربران منتقل کند.
🔹 چرا این مهم است؟
اگر قیمت اهمیت بیشتری از سرعت پیدا کند، بسیاری از شرکتها TPU را به GPU ترجیح خواهند داد.
🔹 نقش انویدیا
انویدیا همچنان رهبر آموزش مدلهای بزرگ خواهد بود، اما ممکن است نتواند همین حاشیه سود بالا را حفظ کند—بهخصوص اگر حجم بزرگی از اینفرنس به TPU منتقل شود.
🔹 برتری دیگر گوگل
اکوسیستم عظیمی مثل Search، YouTube، Android و Workspace ظرفیت TPUها را بهطور کامل پر میکند و تقاضای پایدار تضمین میشود.
منبع:
https://x.com/KrisPatel99/status/1993259550544191645
@rss_ai_ir
#Google #TPU #Nvidia #AI #MachineLearning #Inference #CloudComputing #TechEconomics
👍1
🌟 مدل ToolOrchestra؛ انقلاب تازه در هوش مصنوعی عاملمحور
انویدیا بههمراه دانشگاه هنگکنگ «ToolOrchestra» را معرفی کرده؛ روشی برای آموزش رهبر ارکسترهای هوش مصنوعی که میتوانند چندین مدل و ابزار را همزمان هماهنگ کنند.
نتیجهٔ این رویکرد، Orchestrator-8B است — مدلی بر پایه Qwen3 که بهجای حل مسئله بهتنهایی، میان تفکر و فراخوانی ابزارها سوئیچ میکند:
جستجوگر وب، مفسر کد، مدلهای تخصصی ریاضی و حتی غولهایی مثل Claude و Llama-Nemotron.
✨ دستاوردها:
♻️حل مسائل ۲.۵ برابر سریعتر
♻️هزینهٔ استقرار ۷۰٪ کمتر
♻️کسب ۳۷.۱٪ در بِنچمارک سخت Humanity’s Last Exam
(بالاتر از GPT-5 با ۳۵.۱٪)
📎 پروژه با لایسنس Apache 2.0 منتشر شده است.
https://research.nvidia.com/labs/lpr/ToolOrchestra/
https://huggingface.co/nvidia/Orchestrator-8B
https://arxiv.org/pdf/2511.21689
https://huggingface.co/datasets/nvidia/ToolScale
https://github.com/NVlabs/ToolOrchestra
#AI #LLM #NVIDIA #Orchestrator #ToolOrchestra #Agents #MachineLearning
انویدیا بههمراه دانشگاه هنگکنگ «ToolOrchestra» را معرفی کرده؛ روشی برای آموزش رهبر ارکسترهای هوش مصنوعی که میتوانند چندین مدل و ابزار را همزمان هماهنگ کنند.
نتیجهٔ این رویکرد، Orchestrator-8B است — مدلی بر پایه Qwen3 که بهجای حل مسئله بهتنهایی، میان تفکر و فراخوانی ابزارها سوئیچ میکند:
جستجوگر وب، مفسر کد، مدلهای تخصصی ریاضی و حتی غولهایی مثل Claude و Llama-Nemotron.
✨ دستاوردها:
♻️حل مسائل ۲.۵ برابر سریعتر
♻️هزینهٔ استقرار ۷۰٪ کمتر
♻️کسب ۳۷.۱٪ در بِنچمارک سخت Humanity’s Last Exam
(بالاتر از GPT-5 با ۳۵.۱٪)
📎 پروژه با لایسنس Apache 2.0 منتشر شده است.
https://research.nvidia.com/labs/lpr/ToolOrchestra/
https://huggingface.co/nvidia/Orchestrator-8B
https://arxiv.org/pdf/2511.21689
https://huggingface.co/datasets/nvidia/ToolScale
https://github.com/NVlabs/ToolOrchestra
#AI #LLM #NVIDIA #Orchestrator #ToolOrchestra #Agents #MachineLearning
❤6
⚡️ یکی از مهمترین آپدیتهای حوزهی مدلهای تصویری منتشر شد؛ ابزار Ai Toolkit حالا امکان آموزش LoRA برای Z-Image Turbo را فراهم کرده است.
🧩 توسعه این قابلیت توسط Ostris انجام شده؛ همان سازندهی پکیج محبوب آموزش مدلهای دیفیوژن. این بار با استفاده از De-Distill Adapter، امکان تربیت لورا روی نسخهی توربوی Z-Image در اختیار کاربران قرار گرفته است.
🎛️همچنین Ai Toolkit یک ابزار همهجانبه است که هم از طریق GUI و هم Command Line اجرا میشود؛ مناسب برای کسانی که روی سختافزار خانگی کار میکنند ولی نیاز به امکانات حرفهای دارند.
🚀 طبق تستهای اولیه:
آموزش از ۱۲GB VRAM به بالا امکانپذیر است.
آموزش یک کاراکتر روی ۱۷ تصویر و ۳۰۰۰ استپ، روی RTX 5090 حدود ۹۰ دقیقه زمان میبرد.
📝 راهنمای کامل آموزش نیز بهزودی توسط سازنده منتشر میشود.
https://github.com/ostris/ai-toolkit
https://huggingface.co/ostris/zimage_turbo_training_adapter
@rss_ai_ir
#هوش_مصنوعی #مدل_تولیدی #دیفیوژن #زیمج #LoRA #AIToolkit #ZImageTurbo
🧩 توسعه این قابلیت توسط Ostris انجام شده؛ همان سازندهی پکیج محبوب آموزش مدلهای دیفیوژن. این بار با استفاده از De-Distill Adapter، امکان تربیت لورا روی نسخهی توربوی Z-Image در اختیار کاربران قرار گرفته است.
🎛️همچنین Ai Toolkit یک ابزار همهجانبه است که هم از طریق GUI و هم Command Line اجرا میشود؛ مناسب برای کسانی که روی سختافزار خانگی کار میکنند ولی نیاز به امکانات حرفهای دارند.
🚀 طبق تستهای اولیه:
آموزش از ۱۲GB VRAM به بالا امکانپذیر است.
آموزش یک کاراکتر روی ۱۷ تصویر و ۳۰۰۰ استپ، روی RTX 5090 حدود ۹۰ دقیقه زمان میبرد.
📝 راهنمای کامل آموزش نیز بهزودی توسط سازنده منتشر میشود.
https://github.com/ostris/ai-toolkit
https://huggingface.co/ostris/zimage_turbo_training_adapter
@rss_ai_ir
#هوش_مصنوعی #مدل_تولیدی #دیفیوژن #زیمج #LoRA #AIToolkit #ZImageTurbo
✨ شاخص جدید Iceberg Index از MIT نشان میدهد قدرت واقعی هوش مصنوعی بسیار فراتر از چیزی است که میبینیم
بر اساس این مطالعه، هوش مصنوعی همین امروز توان انجام کارهایی را دارد که معادل ۱۱.۷٪ کل دستمزدهای سالانه آمریکا است — یعنی حدود ۱.۲ تریلیون دلار!
جالب اینجاست که بخش قابل مشاهدهٔ کاربردهای فعلی هوش مصنوعی فقط ۲.۲٪ از این پتانسیل است؛ چیزی شبیه نوک یک کوه یخ.
🔍 نکات کلیدی پژوهش:
✳️توان بالقوهٔ فعلی هوش مصنوعی برابر با ۱۱.۷٪ از wage bill آمریکا است.
✳️میزان استفادهٔ فعلی ما فقط یکپنجم این ظرفیت را پوشش میدهد.
✳️مدلسازی روی ۱۵۱ میلیون نیروی کار و ۳۲ هزار مهارت انجام شده است.
✳️پیام واضح: نقطهٔ شروع تغییرات واقعی در ساختار شغلها و بهرهوری تازه در حال ظاهر شدن است.
✳️این مطالعه هشدار میدهد که تحولات بازار کار بسیار عمیقتر از بحثهای روزمره دربارهٔ اخراجها و اتوماسیون است؛ موج اصلی هنوز نرسیده.
🌐 منبع: CNBC
#هوش_مصنوعی #اقتصاد_دیجیتال #بازار_کار #مطالعات_MIT #AI #Technology 🚀
@rss_ai_ir
---
بر اساس این مطالعه، هوش مصنوعی همین امروز توان انجام کارهایی را دارد که معادل ۱۱.۷٪ کل دستمزدهای سالانه آمریکا است — یعنی حدود ۱.۲ تریلیون دلار!
جالب اینجاست که بخش قابل مشاهدهٔ کاربردهای فعلی هوش مصنوعی فقط ۲.۲٪ از این پتانسیل است؛ چیزی شبیه نوک یک کوه یخ.
🔍 نکات کلیدی پژوهش:
✳️توان بالقوهٔ فعلی هوش مصنوعی برابر با ۱۱.۷٪ از wage bill آمریکا است.
✳️میزان استفادهٔ فعلی ما فقط یکپنجم این ظرفیت را پوشش میدهد.
✳️مدلسازی روی ۱۵۱ میلیون نیروی کار و ۳۲ هزار مهارت انجام شده است.
✳️پیام واضح: نقطهٔ شروع تغییرات واقعی در ساختار شغلها و بهرهوری تازه در حال ظاهر شدن است.
✳️این مطالعه هشدار میدهد که تحولات بازار کار بسیار عمیقتر از بحثهای روزمره دربارهٔ اخراجها و اتوماسیون است؛ موج اصلی هنوز نرسیده.
🌐 منبع: CNBC
#هوش_مصنوعی #اقتصاد_دیجیتال #بازار_کار #مطالعات_MIT #AI #Technology 🚀
@rss_ai_ir
---
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 دموی تاریخی یان لیکان از سال ۱۹۸۹؛ نقطهی تولد شبکههای کانولوشنی
🔍 در این ویدیو، یان لکُن اولین نسخه عملی CNN را نمایش میدهد؛ همان الگوریتمی که پایه و اساس تمام مدلهای کانولوشنی مدرن شد.
امروز همین ایده ساده به فناوریهایی قدرت میدهد که تشخیص تصویر، بینایی ماشین، خودروهای خودران و حتی سیستمهای پزشکی را متحول کردهاند.
⏳ شگفتانگیز است که این مسیر از یک دموی آزمایشی در ۱۹۸۹ شروع شد و اکنون به دنیایی با مدلهای چندمیلیاردپارامتری رسیدهایم.
🧠 پیشرفت هوش مصنوعی فقط یک جهش تکنولوژیک نیست؛ نتیجهی دههها تحقیق، پشتکار و نوآوری است.
@rss_ai_ir
#هوش_مصنوعی #دیپ_لرنینگ #بینایی_ماشین #CNN #یادگیری_عمیق 🍀
🔍 در این ویدیو، یان لکُن اولین نسخه عملی CNN را نمایش میدهد؛ همان الگوریتمی که پایه و اساس تمام مدلهای کانولوشنی مدرن شد.
امروز همین ایده ساده به فناوریهایی قدرت میدهد که تشخیص تصویر، بینایی ماشین، خودروهای خودران و حتی سیستمهای پزشکی را متحول کردهاند.
⏳ شگفتانگیز است که این مسیر از یک دموی آزمایشی در ۱۹۸۹ شروع شد و اکنون به دنیایی با مدلهای چندمیلیاردپارامتری رسیدهایم.
🧠 پیشرفت هوش مصنوعی فقط یک جهش تکنولوژیک نیست؛ نتیجهی دههها تحقیق، پشتکار و نوآوری است.
@rss_ai_ir
#هوش_مصنوعی #دیپ_لرنینگ #بینایی_ماشین #CNN #یادگیری_عمیق 🍀
❤4
🌏 چین از آمریکا در بازار جهانی مدلهای متنباز هوش مصنوعی پیشی گرفت
بررسی مشترک MIT و Hugging Face نشان میدهد که برای اولین بار، مدلهای متنباز ساخت چین توانستهاند در تعداد دانلودهای جهانی از مدلهای آمریکایی جلو بزنند.
🔹 سهم چین: ۱۷٪
🔹 سهم ایالات متحده: ۱۵.۸٪
این تغییر، نتیجهی رشد انفجاری مدلهایی مثل DeepSeek و Qwen است؛ دو مدلی که اکنون بخش بزرگی از جامعهی متنباز جهانی را تحت تأثیر قرار دادهاند.
در مقابل، شرکتهای آمریکایی مثل Google، Anthropic و OpenAI بیشتر بر مدلهای بسته و اختصاصی تمرکز کردهاند، و همین باعث شده در رقابت متنباز عقب بمانند.
منبع: Article — Paper
#هوش_مصنوعی #مدل_متن_باز #چین #DeepSeek #Qwen #AI #MachineLearning
بررسی مشترک MIT و Hugging Face نشان میدهد که برای اولین بار، مدلهای متنباز ساخت چین توانستهاند در تعداد دانلودهای جهانی از مدلهای آمریکایی جلو بزنند.
🔹 سهم چین: ۱۷٪
🔹 سهم ایالات متحده: ۱۵.۸٪
این تغییر، نتیجهی رشد انفجاری مدلهایی مثل DeepSeek و Qwen است؛ دو مدلی که اکنون بخش بزرگی از جامعهی متنباز جهانی را تحت تأثیر قرار دادهاند.
در مقابل، شرکتهای آمریکایی مثل Google، Anthropic و OpenAI بیشتر بر مدلهای بسته و اختصاصی تمرکز کردهاند، و همین باعث شده در رقابت متنباز عقب بمانند.
منبع: Article — Paper
#هوش_مصنوعی #مدل_متن_باز #چین #DeepSeek #Qwen #AI #MachineLearning