This media is not supported in your browser
VIEW IN TELEGRAM
✨ روش COREA: همترازی سهبعدی Coarse-to-Fine بین Gaussianهای سهبعدی قابلنوردهی مجدد و SDF با نظارت دوطرفه 3D-to-3D
📝 خلاصه:
روش COREA یک چارچوب نوآورانه است که نمایش سهبعدی Gaussians و توابع فاصله علامتدار (SDF) را بهصورت دقیق و مرحلهبهمرحله (coarse-to-fine) با یکدیگر همتراز میکند.
این مدل یادگیری هندسه را مستقیماً در فضای سهبعدی انجام میدهد و با نظارت دوطرفه 3D-to-3D، محدودیتهای روشهای قبلی را برطرف میکند.
🔍 مزایا و دستاوردها:
♻️تولید هندسه بسیار دقیقتر
♻️نورپردازی مجدد طبیعیتر و سازگارتر
بهبود چشمگیر در
• ساخت مش (Mesh Reconstruction)
• رندرینگ فیزیکی مبتنی بر نور (PBR)
• بازسازی دیدهای جدید (Novel View Synthesis)
یکپارچهسازی Gaussian Splatting با نمایش SDF
---
🔹 تاریخ انتشار: ۸ دسامبر
🔹 لینک مقالهها و پروژه
• Arxiv:
https://arxiv.org/abs/2512.07107
• PDF:
https://arxiv.org/pdf/2512.07107
• Project Page:
https://cau-vilab.github.io/COREA/
• Github:
https://github.com/CAU-VILab/COREA-arXiv
==================================
#AI #DataScience #MachineLearning #HuggingFace #Research
📝 خلاصه:
روش COREA یک چارچوب نوآورانه است که نمایش سهبعدی Gaussians و توابع فاصله علامتدار (SDF) را بهصورت دقیق و مرحلهبهمرحله (coarse-to-fine) با یکدیگر همتراز میکند.
این مدل یادگیری هندسه را مستقیماً در فضای سهبعدی انجام میدهد و با نظارت دوطرفه 3D-to-3D، محدودیتهای روشهای قبلی را برطرف میکند.
🔍 مزایا و دستاوردها:
♻️تولید هندسه بسیار دقیقتر
♻️نورپردازی مجدد طبیعیتر و سازگارتر
بهبود چشمگیر در
• ساخت مش (Mesh Reconstruction)
• رندرینگ فیزیکی مبتنی بر نور (PBR)
• بازسازی دیدهای جدید (Novel View Synthesis)
یکپارچهسازی Gaussian Splatting با نمایش SDF
---
🔹 تاریخ انتشار: ۸ دسامبر
🔹 لینک مقالهها و پروژه
• Arxiv:
https://arxiv.org/abs/2512.07107
• PDF:
https://arxiv.org/pdf/2512.07107
• Project Page:
https://cau-vilab.github.io/COREA/
• Github:
https://github.com/CAU-VILab/COREA-arXiv
==================================
#AI #DataScience #MachineLearning #HuggingFace #Research
This media is not supported in your browser
VIEW IN TELEGRAM
✨ مدل EgoEdit: ویرایش ویدئوهای اولشخص به صورت بلادرنگ
📝 خلاصه:
مدل EgoEdit یک مدل و دیتاست جدید برای ویرایش ویدئوهای اولشخص (Egocentric Video Editing) است که میتواند در زمان واقعی و تنها با دستورهای متنی، ویدئو را تغییر دهد.
این سیستم برای شرایط چالشی مثل لرزش شدید دوربین، حرکت بدن و تعامل دست–شیء طراحی شده و نسبت به روشهای موجود عملکرد دقیقتر و پایدارتری دارد.
🔸 ویژگیها:
♻️ویرایش لحظهای ویدئوهای POV بدون نیاز به ماسکگذاری دستی
♻️مدیریت هوشمند egomotion (حرکت شدید دوربین روی سر/چشم)
♻️تشخیص بهتر تعامل دست با اشیا
♻️مدل سبک و سریع برای استفاده روی دستگاههای کاربردی
♻️معرفی یک دیتاست و بنچمارک استاندارد برای ارزیابی سیستمهای ویرایش اولشخص
🔹 تاریخ انتشار: ۵ دسامبر
🔗 لینکها:
• ArXiv:
https://arxiv.org/abs/2512.06065
• PDF:
https://arxiv.org/pdf/2512.06065
• صفحه پروژه:
https://snap-research.github.io/EgoEdit/
• گیتهاب:
https://github.com/snap-research/EgoEdit
==============================
#AI #DataScience #MachineLearning #HuggingFace #Research
📝 خلاصه:
مدل EgoEdit یک مدل و دیتاست جدید برای ویرایش ویدئوهای اولشخص (Egocentric Video Editing) است که میتواند در زمان واقعی و تنها با دستورهای متنی، ویدئو را تغییر دهد.
این سیستم برای شرایط چالشی مثل لرزش شدید دوربین، حرکت بدن و تعامل دست–شیء طراحی شده و نسبت به روشهای موجود عملکرد دقیقتر و پایدارتری دارد.
🔸 ویژگیها:
♻️ویرایش لحظهای ویدئوهای POV بدون نیاز به ماسکگذاری دستی
♻️مدیریت هوشمند egomotion (حرکت شدید دوربین روی سر/چشم)
♻️تشخیص بهتر تعامل دست با اشیا
♻️مدل سبک و سریع برای استفاده روی دستگاههای کاربردی
♻️معرفی یک دیتاست و بنچمارک استاندارد برای ارزیابی سیستمهای ویرایش اولشخص
🔹 تاریخ انتشار: ۵ دسامبر
🔗 لینکها:
• ArXiv:
https://arxiv.org/abs/2512.06065
• PDF:
https://arxiv.org/pdf/2512.06065
• صفحه پروژه:
https://snap-research.github.io/EgoEdit/
• گیتهاب:
https://github.com/snap-research/EgoEdit
==============================
#AI #DataScience #MachineLearning #HuggingFace #Research
👍1
🧠 قدرت Support Vector Machines (SVM) در یادگیری ماشین 🚀
الگوریتمهای SVM یکی از قدرتمندترین روشهای یادگیری نظارتشده برای طبقهبندی و رگرسیون هستند و سالهاست در مسائل پیچیده دنیای واقعی استفاده میشوند.
🔹 چرا SVM مهم است؟
1️⃣ مقاومت بالا (Robustness)
قابلیت کار با دادههای با ابعاد بالا و مقاومت در برابر نویز و دادههای پرت.
2️⃣ بیشینهسازی حاشیه (Margin Maximization)
یافتن بهترین ابرصفحه با بیشترین فاصله بین کلاسها برای تعمیم بهتر روی دادههای جدید.
3️⃣ ترفند کرنل (Kernel Trick)
امکان حل مسائل غیرخطی با نگاشت دادهها به فضاهای با بعد بالاتر.
4️⃣ Regularization
استفاده از L1 و L2 برای جلوگیری از overfitting و بهبود تعمیمپذیری.
5️⃣ انعطافپذیری بالا
پشتیبانی از انواع مختلف مانند C-SVM، ν-SVM و ε-SVM برای سناریوهای متفاوت.
6️⃣ قابلیت تفسیرپذیری
نقش کلیدی Support Vectorها در تصمیمگیری مدل، برخلاف بسیاری از مدلهای بلکباکس.
🎯 با وجود موج مدلهای عمیق، SVM همچنان یکی از ابزارهای کلاسیک و قابلاعتماد برای حل مسائل پیچیده است.
#MachineLearning #SVM #DataScience #ArtificialIntelligence #AI
@rss_ai_ir
الگوریتمهای SVM یکی از قدرتمندترین روشهای یادگیری نظارتشده برای طبقهبندی و رگرسیون هستند و سالهاست در مسائل پیچیده دنیای واقعی استفاده میشوند.
🔹 چرا SVM مهم است؟
1️⃣ مقاومت بالا (Robustness)
قابلیت کار با دادههای با ابعاد بالا و مقاومت در برابر نویز و دادههای پرت.
2️⃣ بیشینهسازی حاشیه (Margin Maximization)
یافتن بهترین ابرصفحه با بیشترین فاصله بین کلاسها برای تعمیم بهتر روی دادههای جدید.
3️⃣ ترفند کرنل (Kernel Trick)
امکان حل مسائل غیرخطی با نگاشت دادهها به فضاهای با بعد بالاتر.
4️⃣ Regularization
استفاده از L1 و L2 برای جلوگیری از overfitting و بهبود تعمیمپذیری.
5️⃣ انعطافپذیری بالا
پشتیبانی از انواع مختلف مانند C-SVM، ν-SVM و ε-SVM برای سناریوهای متفاوت.
6️⃣ قابلیت تفسیرپذیری
نقش کلیدی Support Vectorها در تصمیمگیری مدل، برخلاف بسیاری از مدلهای بلکباکس.
🎯 با وجود موج مدلهای عمیق، SVM همچنان یکی از ابزارهای کلاسیک و قابلاعتماد برای حل مسائل پیچیده است.
#MachineLearning #SVM #DataScience #ArtificialIntelligence #AI
@rss_ai_ir
👍9❤7😁6🔥5🥰4👏3🎉2
This media is not supported in your browser
VIEW IN TELEGRAM
✨ MoCapAnything:
کپچر حرکتی سهبعدی برای هر نوع اسکلت از ویدئوی تکدوربینه 🎥🦴
این پژوهش یک فریمورک مرجعمحور معرفی میکند که میتواند انیمیشنهای مبتنی بر چرخش را تنها از یک ویدئوی معمولی بازسازی کند؛ آن هم برای هر مدل سهبعدی ریگشده—حتی بین گونههای مختلف (انسان، حیوان، موجودات فانتزی).
🔹 نکات کلیدی
✳️بازسازی حرکت سهبعدی از ویدئوی تکدوربینه
✳️پشتیبانی از اسکلتهای دلخواه و ریگهای متنوع
✳️ریتارگتینگ بینگونهای (cross-species)
✳️مقیاسپذیر برای تولید انیمیشن 3D
📅 تاریخ انتشار: 11 دسامبر
📄 مقاله:
• arXiv: https://arxiv.org/abs/2512.10881
• PDF: https://arxiv.org/pdf/2512.10881
https://animotionlab.github.io/MoCapAnything
@rss_ai_ir
#AI #DataScience #MachineLearning #ComputerGraphics #MotionCapture #3DAnimation
کپچر حرکتی سهبعدی برای هر نوع اسکلت از ویدئوی تکدوربینه 🎥🦴
این پژوهش یک فریمورک مرجعمحور معرفی میکند که میتواند انیمیشنهای مبتنی بر چرخش را تنها از یک ویدئوی معمولی بازسازی کند؛ آن هم برای هر مدل سهبعدی ریگشده—حتی بین گونههای مختلف (انسان، حیوان، موجودات فانتزی).
🔹 نکات کلیدی
✳️بازسازی حرکت سهبعدی از ویدئوی تکدوربینه
✳️پشتیبانی از اسکلتهای دلخواه و ریگهای متنوع
✳️ریتارگتینگ بینگونهای (cross-species)
✳️مقیاسپذیر برای تولید انیمیشن 3D
📅 تاریخ انتشار: 11 دسامبر
📄 مقاله:
• arXiv: https://arxiv.org/abs/2512.10881
• PDF: https://arxiv.org/pdf/2512.10881
https://animotionlab.github.io/MoCapAnything
@rss_ai_ir
#AI #DataScience #MachineLearning #ComputerGraphics #MotionCapture #3DAnimation
👍10👏9🔥6🥰6😁3🎉3❤1
🧠✨ پژوهش جدید Anthropic: جداسازی «دانش خطرناک» از دانش عادی داخل مدلهای زبانی
باز هم بحث Alignment، اما اینبار با یک ایده واقعاً جالب. Anthropic روشی معرفی کرده به نام Selective Gradient Masking که هدفش اینه دانش خطرناک رو طوری داخل مدل ذخیره کنه که بعداً بشه خیلی تمیز حذفش کرد.
🔍 مسئله کجاست؟
در مرحله پریتریِن عملاً هیچ الاینمنتی وجود نداره و همهچیز بعداً اضافه میشه. تا امروز تنها راه این بود که دادههای «خطرناک» رو از دیتاست حذف کنن که:
خیلی پرهزینه و زمانبره 🕰️
کلی دانش مفید هم همراهش حذف میشه و مدل ضعیفتر میشه 😕
🧩 راهحل Anthropic چیه؟
بهجای دست زدن به دیتاست، کاری میکنن که دانش خطرناک توی یک بخش مشخص از پارامترهای مدل جمع بشه 👇
⚙️ مکانیزم کار:
برای هر بلاک ترنسفورمر یک هد توجه اضافه میشه با برچسب forget
وقتی داده «خطرناک» وارد میشه، همه گرادیانها صفر میشن بهجز گرادیانهای forget
این باعث میشه دانش خطرناک فقط همونجا ذخیره بشه
در بعضی پاسها، اکتیویشنها عمداً صفر میشن تا مدل بدون این پارامترها هم پایدار بمونه
🌀 نکته خلاقانه:
حتی دادههای خطرناک برچسبنخورده بعد از مدتی خودبهخود جذب این پارامترها میشن!
حال اینکه، Anthropic به این میگه اثر جذب (Absorption Effect)
📉 نتیجه؟
بعد از حذف این پارامترها:
مدل خیلی کمتر «احمق» میشه نسبت به حذف دادهها
رفتار مدل طوریه که انگار اصلاً چنین دانشی رو هیچوقت ندیده، نه اینکه موقتاً فراموش کرده باشه
🎯 جمعبندی:
از نظر ایده و مهندسی، این یکی از جدیترین تلاشها برای حل ریشهای مشکل الاینمنت محسوب میشه. هنوز اول راهه، ولی بذر مهمیه 🌱
🔗 لینک پژوهش:
https://alignment.anthropic.com/2025/selective-gradient-masking/
@rss_ai_ir
#هوش_مصنوعی #Alignment #Anthropic #LLM #ایمنی_هوش_مصنوعی #MachineLearning
باز هم بحث Alignment، اما اینبار با یک ایده واقعاً جالب. Anthropic روشی معرفی کرده به نام Selective Gradient Masking که هدفش اینه دانش خطرناک رو طوری داخل مدل ذخیره کنه که بعداً بشه خیلی تمیز حذفش کرد.
🔍 مسئله کجاست؟
در مرحله پریتریِن عملاً هیچ الاینمنتی وجود نداره و همهچیز بعداً اضافه میشه. تا امروز تنها راه این بود که دادههای «خطرناک» رو از دیتاست حذف کنن که:
خیلی پرهزینه و زمانبره 🕰️
کلی دانش مفید هم همراهش حذف میشه و مدل ضعیفتر میشه 😕
🧩 راهحل Anthropic چیه؟
بهجای دست زدن به دیتاست، کاری میکنن که دانش خطرناک توی یک بخش مشخص از پارامترهای مدل جمع بشه 👇
⚙️ مکانیزم کار:
برای هر بلاک ترنسفورمر یک هد توجه اضافه میشه با برچسب forget
وقتی داده «خطرناک» وارد میشه، همه گرادیانها صفر میشن بهجز گرادیانهای forget
این باعث میشه دانش خطرناک فقط همونجا ذخیره بشه
در بعضی پاسها، اکتیویشنها عمداً صفر میشن تا مدل بدون این پارامترها هم پایدار بمونه
🌀 نکته خلاقانه:
حتی دادههای خطرناک برچسبنخورده بعد از مدتی خودبهخود جذب این پارامترها میشن!
حال اینکه، Anthropic به این میگه اثر جذب (Absorption Effect)
📉 نتیجه؟
بعد از حذف این پارامترها:
مدل خیلی کمتر «احمق» میشه نسبت به حذف دادهها
رفتار مدل طوریه که انگار اصلاً چنین دانشی رو هیچوقت ندیده، نه اینکه موقتاً فراموش کرده باشه
🎯 جمعبندی:
از نظر ایده و مهندسی، این یکی از جدیترین تلاشها برای حل ریشهای مشکل الاینمنت محسوب میشه. هنوز اول راهه، ولی بذر مهمیه 🌱
🔗 لینک پژوهش:
https://alignment.anthropic.com/2025/selective-gradient-masking/
@rss_ai_ir
#هوش_مصنوعی #Alignment #Anthropic #LLM #ایمنی_هوش_مصنوعی #MachineLearning
👏22🎉15👍13🥰13🔥12😁12❤10
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ گوگل Ironwood؛ قدرتمندترین TPU نسل هفتم
🔥 گوگل با معرفی Ironwood (TPU v7) عملاً سطح جدیدی از توان پردازشی برای مدلهای بزرگ هوش مصنوعی تعریف کرده است.
💪 توان پردازشی:
• ۴٬۶۱۴ FP8 TFLOPS
• ۱۹۲ گیگابایت حافظه HBM3E روی هر چیپ
• پهنای باند حافظه تا ۷٫۳۷ ترابایتبرثانیه
🚀 مقیاسپذیری:
• پادهایی با حداکثر ۹٬۲۱۶ شتابدهنده
• مجموع توان: ۴۲٫۵ اگزافلاپس FP8 برای آموزش و استنتاج
• برای مقایسه: Nvidia GB300 NVL72 فقط حدود ۰٫۳۶ اگزافلاپس
🔗 شبکه و ارتباطات:
• شبکه اختصاصی Inter-Chip Interconnect با سرعت ۹٫۶ ترابیتبرثانیه
• حدود ۱٫۷۷ پتابایت حافظه HBM3E در هر پاد
• باز هم برتری عددی نسبت به سیستمهای رقیب انویدیا
🧠 جمعبندی:
اینکه Ironwood حالا ستون اصلی گوگل برای اجرای LLMهای عظیم و مدلهای چندوجهی است؛ ترکیبی از قدرت، مقیاس و اتصال که رقبا را به چالش جدی میکشد.
@rss_ai_ir
#AI #Google #TPU #Ironwood #LLM #DataCenter #MachineLearning
🔥 گوگل با معرفی Ironwood (TPU v7) عملاً سطح جدیدی از توان پردازشی برای مدلهای بزرگ هوش مصنوعی تعریف کرده است.
💪 توان پردازشی:
• ۴٬۶۱۴ FP8 TFLOPS
• ۱۹۲ گیگابایت حافظه HBM3E روی هر چیپ
• پهنای باند حافظه تا ۷٫۳۷ ترابایتبرثانیه
🚀 مقیاسپذیری:
• پادهایی با حداکثر ۹٬۲۱۶ شتابدهنده
• مجموع توان: ۴۲٫۵ اگزافلاپس FP8 برای آموزش و استنتاج
• برای مقایسه: Nvidia GB300 NVL72 فقط حدود ۰٫۳۶ اگزافلاپس
🔗 شبکه و ارتباطات:
• شبکه اختصاصی Inter-Chip Interconnect با سرعت ۹٫۶ ترابیتبرثانیه
• حدود ۱٫۷۷ پتابایت حافظه HBM3E در هر پاد
• باز هم برتری عددی نسبت به سیستمهای رقیب انویدیا
🧠 جمعبندی:
اینکه Ironwood حالا ستون اصلی گوگل برای اجرای LLMهای عظیم و مدلهای چندوجهی است؛ ترکیبی از قدرت، مقیاس و اتصال که رقبا را به چالش جدی میکشد.
@rss_ai_ir
#AI #Google #TPU #Ironwood #LLM #DataCenter #MachineLearning
👍8🔥7❤6👏5😁5🎉3🥰2🙏1
🚀 مدل Paper2Slides حالا متنباز شد!
حالا میتونی مقالههای علمی و گزارشهای فنی رو فقط با یک کلیک به اسلایدهای حرفهای تبدیل کنی 📊✨
ما همین الان اسلایدهای مربوط به DeepSeek V3.2 رو باهاش ساختیم؛
استایلهای مختلف، طراحی تمیز و خروجی واقعاً قابل ارائه 👌
🔥 اینکه Paper2Slides چه کارهایی میکنه؟
📄 پشتیبانی از فرمتهای مختلف:
PDF، Word، Excel، PowerPoint و بیشتر
🧠 درک محتوا:
ایدههای کلیدی، جدولها، فرمولها، نمودارها و دادهها رو خودش استخراج میکنه
🎨 شخصیسازی کامل:
تمهای آماده + امکان تغییر استایل به سلیقه خودت
⚡ سرعت بالا:
اسلایدهای باکیفیت در چند دقیقه
🔗 گیتهاب:
github.com/HKUDS/Paper2Slides
📢 @rss_ai_ir
#AI #OpenSource #Presentation #Research #MachineLearning #Productivity
حالا میتونی مقالههای علمی و گزارشهای فنی رو فقط با یک کلیک به اسلایدهای حرفهای تبدیل کنی 📊✨
ما همین الان اسلایدهای مربوط به DeepSeek V3.2 رو باهاش ساختیم؛
استایلهای مختلف، طراحی تمیز و خروجی واقعاً قابل ارائه 👌
🔥 اینکه Paper2Slides چه کارهایی میکنه؟
📄 پشتیبانی از فرمتهای مختلف:
PDF، Word، Excel، PowerPoint و بیشتر
🧠 درک محتوا:
ایدههای کلیدی، جدولها، فرمولها، نمودارها و دادهها رو خودش استخراج میکنه
🎨 شخصیسازی کامل:
تمهای آماده + امکان تغییر استایل به سلیقه خودت
⚡ سرعت بالا:
اسلایدهای باکیفیت در چند دقیقه
🔗 گیتهاب:
github.com/HKUDS/Paper2Slides
📢 @rss_ai_ir
#AI #OpenSource #Presentation #Research #MachineLearning #Productivity
🥰20🔥19👍16👏15🎉14❤9😁9
🚀 یک چارچوب بنیادین جدید برای فهم «سازگاری» در عاملهای هوش مصنوعی
📘 پژوهشی ۶۵ صفحهای از دانشگاههای استنفورد، پرینستون، هاروارد، واشنگتن و چند مرکز تراز اول دیگر، برای اولینبار یک طبقهبندی کامل از شیوههای سازگاری در سامانههای Agentic AI ارائه میدهد.
🧠 ایدهی اصلی چیست؟
تقریباً همهی عاملهای پیچیدهی امروزی را میتوان با ۴ نوع پایهای سازگاری توضیح داد:
دو نوع مربوط به خودِ عامل و دو نوع مربوط به ابزارهایی که عامل استفاده میکند.
🤖 عامل هوشمند یعنی چه؟
مدلهایی که میتوانند:
ابزار صدا بزنند 🛠️
حافظه داشته باشند 🧩
وظایف چندمرحلهای انجام دهند 🔁
🔄 سازگاری یعنی چه؟
هر تغییری که عامل یا ابزارها بر اساس بازخورد انجام میدهند؛ از نتیجهی اجرای کد تا ارزیابی انسانی.
🧩 ۴ نوع سازگاری معرفیشده:
A1 — سازگاری عامل از اجرای ابزار
عامل از نتیجهی اجرای ابزارها یاد میگیرد (موفق شد/شکست خورد).
A2 — سازگاری عامل از ارزیابی خروجی
بهبود عامل بر اساس کیفیت خروجیها (فیدبک انسانی یا خودکار).
T1 — سازگاری ابزار مستقل از عامل
ابزارها جداگانه آموزش میبینند، عامل ثابت میماند.
T2 — سازگاری ابزار از سیگنالهای عامل
ابزارها خودشان را با رفتار عامل وفق میدهند.
📊 چرا این کار مهم است؟
برای اولینبار روشهای سازگاری عاملها سیستماتیک شدهاند.
کمک میکند هزینه، انعطافپذیری و مقیاسپذیری را بهتر بسنجیم.
مسیر تکامل معماریهای عاملمحور نسل بعد را روشن میکند.
🔎 جمعبندی:
دو محور کلیدی داریم:
آیا عامل تغییر میکند؟
آیا ابزار تغییر میکند؟
و داده/بازخورد، سوخت هر دو است 🔥
📎 لینک مقاله:
https://github.com/pat-jj/Awesome-Adaptation-of-Agentic-AI/blob/main/paper.pdf
#AI #AgenticAI #Research #MachineLearning #LLM #Adaptation
@rss_ai_ir
📘 پژوهشی ۶۵ صفحهای از دانشگاههای استنفورد، پرینستون، هاروارد، واشنگتن و چند مرکز تراز اول دیگر، برای اولینبار یک طبقهبندی کامل از شیوههای سازگاری در سامانههای Agentic AI ارائه میدهد.
🧠 ایدهی اصلی چیست؟
تقریباً همهی عاملهای پیچیدهی امروزی را میتوان با ۴ نوع پایهای سازگاری توضیح داد:
دو نوع مربوط به خودِ عامل و دو نوع مربوط به ابزارهایی که عامل استفاده میکند.
🤖 عامل هوشمند یعنی چه؟
مدلهایی که میتوانند:
ابزار صدا بزنند 🛠️
حافظه داشته باشند 🧩
وظایف چندمرحلهای انجام دهند 🔁
🔄 سازگاری یعنی چه؟
هر تغییری که عامل یا ابزارها بر اساس بازخورد انجام میدهند؛ از نتیجهی اجرای کد تا ارزیابی انسانی.
🧩 ۴ نوع سازگاری معرفیشده:
A1 — سازگاری عامل از اجرای ابزار
عامل از نتیجهی اجرای ابزارها یاد میگیرد (موفق شد/شکست خورد).
A2 — سازگاری عامل از ارزیابی خروجی
بهبود عامل بر اساس کیفیت خروجیها (فیدبک انسانی یا خودکار).
T1 — سازگاری ابزار مستقل از عامل
ابزارها جداگانه آموزش میبینند، عامل ثابت میماند.
T2 — سازگاری ابزار از سیگنالهای عامل
ابزارها خودشان را با رفتار عامل وفق میدهند.
📊 چرا این کار مهم است؟
برای اولینبار روشهای سازگاری عاملها سیستماتیک شدهاند.
کمک میکند هزینه، انعطافپذیری و مقیاسپذیری را بهتر بسنجیم.
مسیر تکامل معماریهای عاملمحور نسل بعد را روشن میکند.
🔎 جمعبندی:
دو محور کلیدی داریم:
آیا عامل تغییر میکند؟
آیا ابزار تغییر میکند؟
و داده/بازخورد، سوخت هر دو است 🔥
📎 لینک مقاله:
https://github.com/pat-jj/Awesome-Adaptation-of-Agentic-AI/blob/main/paper.pdf
#AI #AgenticAI #Research #MachineLearning #LLM #Adaptation
@rss_ai_ir
❤31🔥30😁29🎉25🥰21👍20👏19
This media is not supported in your browser
VIEW IN TELEGRAM
✨چارچوب H2R-Grounder: تبدیل ویدئوی تعامل انسان به ویدئوی ربات با درک فیزیکی 🤖🎥
📌 یک چارچوب جدید ویدئو به ویدئو معرفی شده که میتواند ویدئوهای تعامل انسان–شیء را بدون نیاز به دادههای جفتشده، به ویدئوهای واقعگرایانه از دستکاری رباتها تبدیل کند.
🧠 ایدهی اصلی چیست؟
این روش با استفاده از مدلهای مولد و آموزش unpaired، رفتار انسان را به شکلی فیزیکیمحور به رفتار ربات ترجمه میکند؛ یعنی رباتها میتوانند از ویدئوهای انسانی یاد بگیرند، بدون اینکه دادهی دقیق انسان–ربات در اختیار باشد.
🚀 چرا مهم است؟
• کاهش شدید هزینه جمعآوری داده برای آموزش رباتها
• یادگیری مهارتهای دستکاری از ویدئوهای معمولی انسان
• یک گام جدی به سمت آموزش مقیاسپذیر رباتها با دادههای دنیای واقعی
📄 لینکها:
🔹 arXiv: https://arxiv.org/abs/2512.09406
🔹 PDF: https://arxiv.org/pdf/2512.09406
🔹 Project Page: https://showlab.github.io/H2R-Grounder/
🔹 GitHub: https://github.com/showlab/H2R-Grounder
@rss_ai_ir
#AI 🤖 #Robotics 🦾 #MachineLearning 🧠 #ComputerVision 👁️ #Research 📚
📌 یک چارچوب جدید ویدئو به ویدئو معرفی شده که میتواند ویدئوهای تعامل انسان–شیء را بدون نیاز به دادههای جفتشده، به ویدئوهای واقعگرایانه از دستکاری رباتها تبدیل کند.
🧠 ایدهی اصلی چیست؟
این روش با استفاده از مدلهای مولد و آموزش unpaired، رفتار انسان را به شکلی فیزیکیمحور به رفتار ربات ترجمه میکند؛ یعنی رباتها میتوانند از ویدئوهای انسانی یاد بگیرند، بدون اینکه دادهی دقیق انسان–ربات در اختیار باشد.
🚀 چرا مهم است؟
• کاهش شدید هزینه جمعآوری داده برای آموزش رباتها
• یادگیری مهارتهای دستکاری از ویدئوهای معمولی انسان
• یک گام جدی به سمت آموزش مقیاسپذیر رباتها با دادههای دنیای واقعی
📄 لینکها:
🔹 arXiv: https://arxiv.org/abs/2512.09406
🔹 PDF: https://arxiv.org/pdf/2512.09406
🔹 Project Page: https://showlab.github.io/H2R-Grounder/
🔹 GitHub: https://github.com/showlab/H2R-Grounder
@rss_ai_ir
#AI 🤖 #Robotics 🦾 #MachineLearning 🧠 #ComputerVision 👁️ #Research 📚
❤6🎉6👍4🥰4👏4😁4🔥2
⭐️مجموعه Nous Research کد منبع Nomos 1 را بهصورت متنباز منتشر کرد
با وجود اندازه نسبتاً کوچک ۳۰ میلیارد پارامتر، این مدل موفق شد امتیاز 87 از 120 را در آزمون Putnam کسب کند؛ یکی از معتبرترین و سختترین مسابقات ریاضی جهان.
🔹 چنین امتیازی معادل رتبه دوم در میان ۳۹۸۸ شرکتکننده در Putnam 2024 است.
🔹 مدل Nomos 1 هشت حل کاملاً بینقص ارائه داده است.
🔹 برای مقایسه، Qwen3-30B در همان شرایط تنها 24 از 120 امتیاز گرفت؛ موضوعی که نشان میدهد برتری Nomos بیشتر به کیفیت داده و فرایند آموزش برمیگردد، نه شرایط آزمون.
📌 نکته مهم:
ارزیابی پاسخها بهصورت کور (Blind Review) انجام شده و توسط یک شرکتکننده واقعی Putnam از میان ۲۰۰ نفر برتر صورت گرفته که پاسخهای ناشناس را بررسی کرده است.
⏱ شرایط زمانی نیز کاملاً واقعی بوده:
— برای هر بخش، ۳ ساعت زمان دقیقاً مشابه شرکتکنندگان انسانی.
🧠 ساختار استدلال Nomos:
ابتدا چند «worker» مسائل سختتر را حل میکنند و خودشان راهحلها را ارزیابی میکنند
سپس در مرحله نهایی، سیستم پاسخها را تجمیع کرده و بهترین نتیجه را انتخاب میکند
🔗 لینکها:
▪ HuggingFace: https://huggingface.co/NousResearch/nomos-1
▪ GitHub: https://github.com/NousResearch/nomos
@rss_ai_ir
#AI #LLM #MachineLearning #Math #OpenSource
با وجود اندازه نسبتاً کوچک ۳۰ میلیارد پارامتر، این مدل موفق شد امتیاز 87 از 120 را در آزمون Putnam کسب کند؛ یکی از معتبرترین و سختترین مسابقات ریاضی جهان.
🔹 چنین امتیازی معادل رتبه دوم در میان ۳۹۸۸ شرکتکننده در Putnam 2024 است.
🔹 مدل Nomos 1 هشت حل کاملاً بینقص ارائه داده است.
🔹 برای مقایسه، Qwen3-30B در همان شرایط تنها 24 از 120 امتیاز گرفت؛ موضوعی که نشان میدهد برتری Nomos بیشتر به کیفیت داده و فرایند آموزش برمیگردد، نه شرایط آزمون.
📌 نکته مهم:
ارزیابی پاسخها بهصورت کور (Blind Review) انجام شده و توسط یک شرکتکننده واقعی Putnam از میان ۲۰۰ نفر برتر صورت گرفته که پاسخهای ناشناس را بررسی کرده است.
⏱ شرایط زمانی نیز کاملاً واقعی بوده:
— برای هر بخش، ۳ ساعت زمان دقیقاً مشابه شرکتکنندگان انسانی.
🧠 ساختار استدلال Nomos:
ابتدا چند «worker» مسائل سختتر را حل میکنند و خودشان راهحلها را ارزیابی میکنند
سپس در مرحله نهایی، سیستم پاسخها را تجمیع کرده و بهترین نتیجه را انتخاب میکند
🔗 لینکها:
▪ HuggingFace: https://huggingface.co/NousResearch/nomos-1
▪ GitHub: https://github.com/NousResearch/nomos
@rss_ai_ir
#AI #LLM #MachineLearning #Math #OpenSource
👏14🥰10😁9👍7🎉7❤5🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
📊 الگوریتم K-means؛ یکی از پایهایترین روشهای خوشهبندی در علم داده و یادگیری ماشین
الگوریتم K-means با تکرار چند مرحله ساده، دادهها را به خوشههایی معنادار تقسیم میکند. قلب این الگوریتم «همگرایی» است؛ جایی که مراکز خوشهها و تخصیص نقاط بهتدریج پایدار میشوند. 🔁
✅ چرا K-means محبوب است؟
🚀 همگرایی سریع روی اغلب دیتاستها
🧩 ساختار ساده و قابلتفسیر برای کشف گروهها
📈 مقیاسپذیری بالا برای دادههای بزرگ
❌ محدودیتها:
🎯 وابستگی شدید به مقداردهی اولیه مراکز
📐 حساسیت به مقیاس ویژگیها
⚠️ امکان ایجاد خوشههای خالی یا ناپایدار
🛠️ برای رسیدن به همگرایی پایدار:
از k-means++ برای انتخاب هوشمند مراکز اولیه استفاده کنید
نرمالسازی ویژگیها را فراموش نکنید
آستانه همگرایی و تعداد تکرارها را منطقی تنظیم کنید
🔍 در فرآیند همگرایی، ابتدا هر نقطه به نزدیکترین مرکز تخصیص داده میشود، سپس مرکز هر خوشه بهعنوان میانگین نقاط آن بهروزرسانی میگردد. این چرخه تا زمانی ادامه پیدا میکند که مراکز تغییر محسوسی نداشته باشند.
📌 یادگیری درست K-means یعنی خوشهبندی قابل اعتماد و قابل تحلیل.
👉 @rss_ai_ir
#علم_داده #یادگیری_ماشین #KMeans #خوشه_بندی #DataScience #MachineLearning
الگوریتم K-means با تکرار چند مرحله ساده، دادهها را به خوشههایی معنادار تقسیم میکند. قلب این الگوریتم «همگرایی» است؛ جایی که مراکز خوشهها و تخصیص نقاط بهتدریج پایدار میشوند. 🔁
✅ چرا K-means محبوب است؟
🚀 همگرایی سریع روی اغلب دیتاستها
🧩 ساختار ساده و قابلتفسیر برای کشف گروهها
📈 مقیاسپذیری بالا برای دادههای بزرگ
❌ محدودیتها:
🎯 وابستگی شدید به مقداردهی اولیه مراکز
📐 حساسیت به مقیاس ویژگیها
⚠️ امکان ایجاد خوشههای خالی یا ناپایدار
🛠️ برای رسیدن به همگرایی پایدار:
از k-means++ برای انتخاب هوشمند مراکز اولیه استفاده کنید
نرمالسازی ویژگیها را فراموش نکنید
آستانه همگرایی و تعداد تکرارها را منطقی تنظیم کنید
🔍 در فرآیند همگرایی، ابتدا هر نقطه به نزدیکترین مرکز تخصیص داده میشود، سپس مرکز هر خوشه بهعنوان میانگین نقاط آن بهروزرسانی میگردد. این چرخه تا زمانی ادامه پیدا میکند که مراکز تغییر محسوسی نداشته باشند.
📌 یادگیری درست K-means یعنی خوشهبندی قابل اعتماد و قابل تحلیل.
👉 @rss_ai_ir
#علم_داده #یادگیری_ماشین #KMeans #خوشه_بندی #DataScience #MachineLearning
👍2
🇨🇳 چین روی تراشههای بومی خود قمار بزرگی میکند
💰 چین در حال بررسی بستهای تا سقف ۷۰ میلیارد دلار مشوقهای جدید برای صنعت نیمهرساناهاست؛ یکی از بزرگترین مداخلات دولتی تاریخ این کشور برای کاهش وابستگی به تراشههای خارجی و تضمین توان بلندمدت در هوش مصنوعی و امنیت ملی.
⚙️ در صورت تصویب، این بسته میتواند همسطح یا حتی بزرگتر از قانون CHIPS آمریکا باشد و تمرکز آن بر تقویت بازیگران داخلی مثل SMIC، هواوی و Moore Threads است.
با اینکه چین هنوز حدود ۶ سال از TSMC در لبه فناوری عقبتر است، اما استراتژیاش روی مقیاس، تابآوری و کنترل زنجیره تأمین متمرکز شده، نه فقط پیشرفتهترین نودها.
🔍 چرا این حرکت مهم است؟
1️⃣ وابستگی چین به فناوری آمریکا کمتر از چیزی است که بسیاری تصور میکردند، بهویژه در نودهای بالغ و تخصصی که برای AI، خودرو و دفاع حیاتیاند.
2️⃣ خطوط تولید داخلی سریعتر از انتظار پیش میروند و بهنظر میرسد تحریمها بهجای توقف، اجرای صنعتی را تسریع کردهاند.
🧠 در نهایت، شاید این تصمیم حتی مهمتر از پیشرفت چین در مدلهای متنباز هوش مصنوعی باشد؛ چون تراشهها سقف توان محاسباتی، استقلال صنعتی و اهرم ژئوپولیتیکی را تعیین میکنند.
@rss_ai_ir
#AI #China #Semiconductors #Chips #Geopolitics #MachineLearning
💰 چین در حال بررسی بستهای تا سقف ۷۰ میلیارد دلار مشوقهای جدید برای صنعت نیمهرساناهاست؛ یکی از بزرگترین مداخلات دولتی تاریخ این کشور برای کاهش وابستگی به تراشههای خارجی و تضمین توان بلندمدت در هوش مصنوعی و امنیت ملی.
⚙️ در صورت تصویب، این بسته میتواند همسطح یا حتی بزرگتر از قانون CHIPS آمریکا باشد و تمرکز آن بر تقویت بازیگران داخلی مثل SMIC، هواوی و Moore Threads است.
با اینکه چین هنوز حدود ۶ سال از TSMC در لبه فناوری عقبتر است، اما استراتژیاش روی مقیاس، تابآوری و کنترل زنجیره تأمین متمرکز شده، نه فقط پیشرفتهترین نودها.
🔍 چرا این حرکت مهم است؟
1️⃣ وابستگی چین به فناوری آمریکا کمتر از چیزی است که بسیاری تصور میکردند، بهویژه در نودهای بالغ و تخصصی که برای AI، خودرو و دفاع حیاتیاند.
2️⃣ خطوط تولید داخلی سریعتر از انتظار پیش میروند و بهنظر میرسد تحریمها بهجای توقف، اجرای صنعتی را تسریع کردهاند.
🧠 در نهایت، شاید این تصمیم حتی مهمتر از پیشرفت چین در مدلهای متنباز هوش مصنوعی باشد؛ چون تراشهها سقف توان محاسباتی، استقلال صنعتی و اهرم ژئوپولیتیکی را تعیین میکنند.
@rss_ai_ir
#AI #China #Semiconductors #Chips #Geopolitics #MachineLearning
✨ پرومپتسازی خودکار برای LLMها، بدون دردسر!
🧠 چارچوب Promptomatix یک سیستم هوشمند برای بهینهسازی خودکار پرومپتهاست که متن عادی را به پرومپتهای باکیفیت و کارآمد تبدیل میکند؛ بدون نیاز به تیون دستی.
🚀 چرا مهم است؟
⚙️ بهبود عملکرد مدلها در وظایف مختلف
✂️ کاهش طول پرومپت و سربار محاسباتی
🤖 حذف آزمونوخطای دستی در Prompt Engineering
📈 افزایش بهرهوری و پایداری نتایج
📅 زمان انتشار: 17 جولای
🔗 لینکها:
arXiv:
https://arxiv.org/abs/2507.14241
PDF:
https://arxiv.org/pdf/2507.14241
GitHub:
https://github.com/SalesforceAIResearch/promptomatix
📣 منبع:
@rss_ai_ir
#هوش_مصنوعی #یادگیری_ماشین #مهندسی_پرومپت #LLM #AI #MachineLearning
🧠 چارچوب Promptomatix یک سیستم هوشمند برای بهینهسازی خودکار پرومپتهاست که متن عادی را به پرومپتهای باکیفیت و کارآمد تبدیل میکند؛ بدون نیاز به تیون دستی.
🚀 چرا مهم است؟
⚙️ بهبود عملکرد مدلها در وظایف مختلف
✂️ کاهش طول پرومپت و سربار محاسباتی
🤖 حذف آزمونوخطای دستی در Prompt Engineering
📈 افزایش بهرهوری و پایداری نتایج
📅 زمان انتشار: 17 جولای
🔗 لینکها:
arXiv:
https://arxiv.org/abs/2507.14241
PDF:
https://arxiv.org/pdf/2507.14241
GitHub:
https://github.com/SalesforceAIResearch/promptomatix
📣 منبع:
@rss_ai_ir
#هوش_مصنوعی #یادگیری_ماشین #مهندسی_پرومپت #LLM #AI #MachineLearning