VIRSUN
7.19K subscribers
1.45K photos
819 videos
5 files
908 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
روش COREA: هم‌ترازی سه‌بعدی Coarse-to-Fine بین Gaussianهای سه‌بعدی قابل‌نوردهی مجدد و SDF با نظارت دوطرفه 3D-to-3D

📝 خلاصه:
روش COREA یک چارچوب نوآورانه است که نمایش سه‌بعدی Gaussians و توابع فاصله علامت‌دار (SDF) را به‌صورت دقیق و مرحله‌به‌مرحله (coarse-to-fine) با یکدیگر هم‌تراز می‌کند.
این مدل یادگیری هندسه را مستقیماً در فضای سه‌بعدی انجام می‌دهد و با نظارت دوطرفه 3D-to-3D، محدودیت‌های روش‌های قبلی را برطرف می‌کند.

🔍 مزایا و دستاوردها:

♻️تولید هندسه بسیار دقیق‌تر

♻️نورپردازی مجدد طبیعی‌تر و سازگارتر

بهبود چشمگیر در
• ساخت مش (Mesh Reconstruction)
• رندرینگ فیزیکی مبتنی بر نور (PBR)
• بازسازی دیدهای جدید (Novel View Synthesis)

یکپارچه‌سازی Gaussian Splatting با نمایش SDF



---

🔹 تاریخ انتشار: ۸ دسامبر

🔹 لینک‌ مقاله‌ها و پروژه
• Arxiv:
https://arxiv.org/abs/2512.07107
• PDF:
https://arxiv.org/pdf/2512.07107
• Project Page:
https://cau-vilab.github.io/COREA/
• Github:
https://github.com/CAU-VILab/COREA-arXiv

==================================


#AI #DataScience #MachineLearning #HuggingFace #Research
This media is not supported in your browser
VIEW IN TELEGRAM
مدل EgoEdit: ویرایش ویدئوهای اول‌شخص به صورت بلادرنگ

📝 خلاصه:
مدل EgoEdit یک مدل و دیتاست جدید برای ویرایش ویدئوهای اول‌شخص (Egocentric Video Editing) است که می‌تواند در زمان واقعی و تنها با دستورهای متنی، ویدئو را تغییر دهد.
این سیستم برای شرایط چالشی مثل لرزش شدید دوربین، حرکت بدن و تعامل دست–شی‌ء طراحی شده و نسبت به روش‌های موجود عملکرد دقیق‌تر و پایدار‌تری دارد.

🔸 ویژگی‌ها:

♻️ویرایش لحظه‌ای ویدئوهای POV بدون نیاز به ماسک‌گذاری دستی

♻️مدیریت هوشمند egomotion (حرکت شدید دوربین روی سر/چشم)

♻️تشخیص بهتر تعامل دست با اشیا

♻️مدل سبک و سریع برای استفاده روی دستگاه‌های کاربردی

♻️معرفی یک دیتاست و بنچ‌مارک استاندارد برای ارزیابی سیستم‌های ویرایش اول‌شخص


🔹 تاریخ انتشار: ۵ دسامبر

🔗 لینک‌ها:
• ArXiv:
https://arxiv.org/abs/2512.06065
• PDF:
https://arxiv.org/pdf/2512.06065
• صفحه پروژه:
https://snap-research.github.io/EgoEdit/
• گیت‌هاب:
https://github.com/snap-research/EgoEdit

==============================


#AI #DataScience #MachineLearning #HuggingFace #Research
👍1
🧠 قدرت Support Vector Machines (SVM) در یادگیری ماشین 🚀

الگوریتم‌های SVM یکی از قدرتمندترین روش‌های یادگیری نظارت‌شده برای طبقه‌بندی و رگرسیون هستند و سال‌هاست در مسائل پیچیده دنیای واقعی استفاده می‌شوند.

🔹 چرا SVM مهم است؟

1️⃣ مقاومت بالا (Robustness)
قابلیت کار با داده‌های با ابعاد بالا و مقاومت در برابر نویز و داده‌های پرت.

2️⃣ بیشینه‌سازی حاشیه (Margin Maximization)
یافتن بهترین ابرصفحه با بیشترین فاصله بین کلاس‌ها برای تعمیم بهتر روی داده‌های جدید.

3️⃣ ترفند کرنل (Kernel Trick)
امکان حل مسائل غیرخطی با نگاشت داده‌ها به فضاهای با بعد بالاتر.

4️⃣ Regularization
استفاده از L1 و L2 برای جلوگیری از overfitting و بهبود تعمیم‌پذیری.

5️⃣ انعطاف‌پذیری بالا
پشتیبانی از انواع مختلف مانند C-SVM، ν-SVM و ε-SVM برای سناریوهای متفاوت.

6️⃣ قابلیت تفسیرپذیری
نقش کلیدی Support Vectorها در تصمیم‌گیری مدل، برخلاف بسیاری از مدل‌های بلک‌باکس.

🎯 با وجود موج مدل‌های عمیق، SVM همچنان یکی از ابزارهای کلاسیک و قابل‌اعتماد برای حل مسائل پیچیده است.

#MachineLearning #SVM #DataScience #ArtificialIntelligence #AI
@rss_ai_ir
👍97😁6🔥5🥰4👏3🎉2
This media is not supported in your browser
VIEW IN TELEGRAM
MoCapAnything:
کپچر حرکتی سه‌بعدی برای هر نوع اسکلت از ویدئوی تک‌دوربینه 🎥🦴

این پژوهش یک فریم‌ورک مرجع‌محور معرفی می‌کند که می‌تواند انیمیشن‌های مبتنی بر چرخش را تنها از یک ویدئوی معمولی بازسازی کند؛ آن هم برای هر مدل سه‌بعدی ریگ‌شده—حتی بین گونه‌های مختلف (انسان، حیوان، موجودات فانتزی).

🔹 نکات کلیدی

✳️بازسازی حرکت سه‌بعدی از ویدئوی تک‌دوربینه

✳️پشتیبانی از اسکلت‌های دلخواه و ریگ‌های متنوع

✳️ریتارگتینگ بین‌گونه‌ای (cross-species)

✳️مقیاس‌پذیر برای تولید انیمیشن 3D


📅 تاریخ انتشار: 11 دسامبر
📄 مقاله:
• arXiv: https://arxiv.org/abs/2512.10881
• PDF: https://arxiv.org/pdf/2512.10881

https://animotionlab.github.io/MoCapAnything

@rss_ai_ir

#AI #DataScience #MachineLearning #ComputerGraphics #MotionCapture #3DAnimation
👍10👏9🔥6🥰6😁3🎉31
🧠 پژوهش جدید Anthropic: جداسازی «دانش خطرناک» از دانش عادی داخل مدل‌های زبانی

باز هم بحث Alignment، اما این‌بار با یک ایده واقعاً جالب. Anthropic روشی معرفی کرده به نام Selective Gradient Masking که هدفش اینه دانش خطرناک رو طوری داخل مدل ذخیره کنه که بعداً بشه خیلی تمیز حذفش کرد.

🔍 مسئله کجاست؟
در مرحله پری‌تریِن عملاً هیچ الاینمنتی وجود نداره و همه‌چیز بعداً اضافه می‌شه. تا امروز تنها راه این بود که داده‌های «خطرناک» رو از دیتاست حذف کنن که:

خیلی پرهزینه و زمان‌بره 🕰️

کلی دانش مفید هم همراهش حذف می‌شه و مدل ضعیف‌تر می‌شه 😕


🧩 راه‌حل Anthropic چیه؟
به‌جای دست زدن به دیتاست، کاری می‌کنن که دانش خطرناک توی یک بخش مشخص از پارامترهای مدل جمع بشه 👇

⚙️ مکانیزم کار:

برای هر بلاک ترنسفورمر یک هد توجه اضافه می‌شه با برچسب forget

وقتی داده «خطرناک» وارد می‌شه، همه گرادیان‌ها صفر می‌شن به‌جز گرادیان‌های forget

این باعث می‌شه دانش خطرناک فقط همون‌جا ذخیره بشه

در بعضی پاس‌ها، اکتیویشن‌ها عمداً صفر می‌شن تا مدل بدون این پارامترها هم پایدار بمونه


🌀 نکته خلاقانه:
حتی داده‌های خطرناک برچسب‌نخورده بعد از مدتی خودبه‌خود جذب این پارامترها می‌شن!
حال اینکه، Anthropic به این می‌گه اثر جذب (Absorption Effect)

📉 نتیجه؟
بعد از حذف این پارامترها:

مدل خیلی کمتر «احمق» می‌شه نسبت به حذف داده‌ها

رفتار مدل طوریه که انگار اصلاً چنین دانشی رو هیچ‌وقت ندیده، نه این‌که موقتاً فراموش کرده باشه


🎯 جمع‌بندی:
از نظر ایده و مهندسی، این یکی از جدی‌ترین تلاش‌ها برای حل ریشه‌ای مشکل الاینمنت محسوب می‌شه. هنوز اول راهه، ولی بذر مهمیه 🌱

🔗 لینک پژوهش:
https://alignment.anthropic.com/2025/selective-gradient-masking/

@rss_ai_ir

#هوش_مصنوعی #Alignment #Anthropic #LLM #ایمنی_هوش_مصنوعی #MachineLearning
👏22🎉15👍13🥰13🔥12😁1210
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ گوگل Ironwood؛ قدرتمندترین TPU نسل هفتم

🔥 گوگل با معرفی Ironwood (TPU v7) عملاً سطح جدیدی از توان پردازشی برای مدل‌های بزرگ هوش مصنوعی تعریف کرده است.

💪 توان پردازشی:
• ‌۴٬۶۱۴ FP8 TFLOPS
• ‌۱۹۲ گیگابایت حافظه HBM3E روی هر چیپ
• ‌پهنای باند حافظه تا ۷٫۳۷ ترابایت‌برثانیه

🚀 مقیاس‌پذیری:
• پادهایی با حداکثر ۹٬۲۱۶ شتاب‌دهنده
• مجموع توان: ‌۴۲٫۵ اگزافلاپس FP8 برای آموزش و استنتاج
• برای مقایسه: Nvidia GB300 NVL72 فقط حدود ۰٫۳۶ اگزافلاپس

🔗 شبکه و ارتباطات:
• شبکه اختصاصی Inter-Chip Interconnect با سرعت ۹٫۶ ترابیت‌برثانیه
• حدود ۱٫۷۷ پتابایت حافظه HBM3E در هر پاد
• باز هم برتری عددی نسبت به سیستم‌های رقیب انویدیا

🧠 جمع‌بندی:
اینکه Ironwood حالا ستون اصلی گوگل برای اجرای LLMهای عظیم و مدل‌های چندوجهی است؛ ترکیبی از قدرت، مقیاس و اتصال که رقبا را به چالش جدی می‌کشد.

@rss_ai_ir

#AI #Google #TPU #Ironwood #LLM #DataCenter #MachineLearning
👍8🔥76👏5😁5🎉3🥰2🙏1
🚀 مدل Paper2Slides حالا متن‌باز شد!

حالا می‌تونی مقاله‌های علمی و گزارش‌های فنی رو فقط با یک کلیک به اسلایدهای حرفه‌ای تبدیل کنی 📊

ما همین الان اسلایدهای مربوط به DeepSeek V3.2 رو باهاش ساختیم؛
استایل‌های مختلف، طراحی تمیز و خروجی واقعاً قابل ارائه 👌

🔥 اینکه Paper2Slides چه کارهایی می‌کنه؟

📄 پشتیبانی از فرمت‌های مختلف:
PDF، Word، Excel، PowerPoint و بیشتر

🧠 درک محتوا:
ایده‌های کلیدی، جدول‌ها، فرمول‌ها، نمودارها و داده‌ها رو خودش استخراج می‌کنه

🎨 شخصی‌سازی کامل:
تم‌های آماده + امکان تغییر استایل به سلیقه خودت

سرعت بالا:
اسلایدهای باکیفیت در چند دقیقه

🔗 گیت‌هاب:
github.com/HKUDS/Paper2Slides

📢 @rss_ai_ir

#AI #OpenSource #Presentation #Research #MachineLearning #Productivity
🥰20🔥19👍16👏15🎉149😁9
🚀 یک چارچوب بنیادین جدید برای فهم «سازگاری» در عامل‌های هوش مصنوعی

📘 پژوهشی ۶۵ صفحه‌ای از دانشگاه‌های استنفورد، پرینستون، هاروارد، واشنگتن و چند مرکز تراز اول دیگر، برای اولین‌بار یک طبقه‌بندی کامل از شیوه‌های سازگاری در سامانه‌های Agentic AI ارائه می‌دهد.

🧠 ایده‌ی اصلی چیست؟
تقریباً همه‌ی عامل‌های پیچیده‌ی امروزی را می‌توان با ۴ نوع پایه‌ای سازگاری توضیح داد:
دو نوع مربوط به خودِ عامل و دو نوع مربوط به ابزارهایی که عامل استفاده می‌کند.

🤖 عامل هوشمند یعنی چه؟
مدل‌هایی که می‌توانند:

ابزار صدا بزنند 🛠️

حافظه داشته باشند 🧩

وظایف چندمرحله‌ای انجام دهند 🔁


🔄 سازگاری یعنی چه؟
هر تغییری که عامل یا ابزارها بر اساس بازخورد انجام می‌دهند؛ از نتیجه‌ی اجرای کد تا ارزیابی انسانی.

🧩 ۴ نوع سازگاری معرفی‌شده:

A1 — سازگاری عامل از اجرای ابزار
عامل از نتیجه‌ی اجرای ابزارها یاد می‌گیرد (موفق شد/شکست خورد).

A2 — سازگاری عامل از ارزیابی خروجی
بهبود عامل بر اساس کیفیت خروجی‌ها (فیدبک انسانی یا خودکار).

T1 — سازگاری ابزار مستقل از عامل
ابزارها جداگانه آموزش می‌بینند، عامل ثابت می‌ماند.

T2 — سازگاری ابزار از سیگنال‌های عامل
ابزارها خودشان را با رفتار عامل وفق می‌دهند.

📊 چرا این کار مهم است؟

برای اولین‌بار روش‌های سازگاری عامل‌ها سیستماتیک شده‌اند.

کمک می‌کند هزینه، انعطاف‌پذیری و مقیاس‌پذیری را بهتر بسنجیم.

مسیر تکامل معماری‌های عامل‌محور نسل بعد را روشن می‌کند.


🔎 جمع‌بندی:
دو محور کلیدی داریم:

آیا عامل تغییر می‌کند؟

آیا ابزار تغییر می‌کند؟
و داده/بازخورد، سوخت هر دو است 🔥


📎 لینک مقاله:
https://github.com/pat-jj/Awesome-Adaptation-of-Agentic-AI/blob/main/paper.pdf

#AI #AgenticAI #Research #MachineLearning #LLM #Adaptation
@rss_ai_ir
31🔥30😁29🎉25🥰21👍20👏19
This media is not supported in your browser
VIEW IN TELEGRAM
چارچوب H2R-Grounder: تبدیل ویدئوی تعامل انسان به ویدئوی ربات با درک فیزیکی 🤖🎥

📌 یک چارچوب جدید ویدئو به ویدئو معرفی شده که می‌تواند ویدئوهای تعامل انسان–شیء را بدون نیاز به داده‌های جفت‌شده، به ویدئوهای واقع‌گرایانه از دست‌کاری ربات‌ها تبدیل کند.

🧠 ایده‌ی اصلی چیست؟
این روش با استفاده از مدل‌های مولد و آموزش unpaired، رفتار انسان را به شکلی فیزیکی‌محور به رفتار ربات ترجمه می‌کند؛ یعنی ربات‌ها می‌توانند از ویدئوهای انسانی یاد بگیرند، بدون این‌که داده‌ی دقیق انسان–ربات در اختیار باشد.

🚀 چرا مهم است؟
• کاهش شدید هزینه جمع‌آوری داده برای آموزش ربات‌ها
• یادگیری مهارت‌های دست‌کاری از ویدئوهای معمولی انسان
• یک گام جدی به سمت آموزش مقیاس‌پذیر ربات‌ها با داده‌های دنیای واقعی

📄 لینک‌ها:
🔹 arXiv: https://arxiv.org/abs/2512.09406
🔹 PDF: https://arxiv.org/pdf/2512.09406
🔹 Project Page: https://showlab.github.io/H2R-Grounder/
🔹 GitHub: https://github.com/showlab/H2R-Grounder

@rss_ai_ir

#AI 🤖 #Robotics 🦾 #MachineLearning 🧠 #ComputerVision 👁️ #Research 📚
6🎉6👍4🥰4👏4😁4🔥2
⭐️مجموعه Nous Research کد منبع Nomos 1 را به‌صورت متن‌باز منتشر کرد

با وجود اندازه نسبتاً کوچک ۳۰ میلیارد پارامتر، این مدل موفق شد امتیاز 87 از 120 را در آزمون Putnam کسب کند؛ یکی از معتبرترین و سخت‌ترین مسابقات ریاضی جهان.

🔹 چنین امتیازی معادل رتبه دوم در میان ۳۹۸۸ شرکت‌کننده در Putnam 2024 است.
🔹 مدل Nomos 1 هشت حل کاملاً بی‌نقص ارائه داده است.
🔹 برای مقایسه، Qwen3-30B در همان شرایط تنها 24 از 120 امتیاز گرفت؛ موضوعی که نشان می‌دهد برتری Nomos بیشتر به کیفیت داده و فرایند آموزش برمی‌گردد، نه شرایط آزمون.

📌 نکته مهم:
ارزیابی پاسخ‌ها به‌صورت کور (Blind Review) انجام شده و توسط یک شرکت‌کننده واقعی Putnam از میان ۲۰۰ نفر برتر صورت گرفته که پاسخ‌های ناشناس را بررسی کرده است.

شرایط زمانی نیز کاملاً واقعی بوده:
— برای هر بخش، ۳ ساعت زمان دقیقاً مشابه شرکت‌کنندگان انسانی.

🧠 ساختار استدلال Nomos:

ابتدا چند «worker» مسائل سخت‌تر را حل می‌کنند و خودشان راه‌حل‌ها را ارزیابی می‌کنند

سپس در مرحله نهایی، سیستم پاسخ‌ها را تجمیع کرده و بهترین نتیجه را انتخاب می‌کند


🔗 لینک‌ها:
HuggingFace: https://huggingface.co/NousResearch/nomos-1
GitHub: https://github.com/NousResearch/nomos

@rss_ai_ir

#AI #LLM #MachineLearning #Math #OpenSource
👏14🥰10😁9👍7🎉75🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
📊 الگوریتم K-means؛ یکی از پایه‌ای‌ترین روش‌های خوشه‌بندی در علم داده و یادگیری ماشین

الگوریتم K-means با تکرار چند مرحله ساده، داده‌ها را به خوشه‌هایی معنادار تقسیم می‌کند. قلب این الگوریتم «همگرایی» است؛ جایی که مراکز خوشه‌ها و تخصیص نقاط به‌تدریج پایدار می‌شوند. 🔁

چرا K-means محبوب است؟

🚀 همگرایی سریع روی اغلب دیتاست‌ها

🧩 ساختار ساده و قابل‌تفسیر برای کشف گروه‌ها

📈 مقیاس‌پذیری بالا برای داده‌های بزرگ


محدودیت‌ها:

🎯 وابستگی شدید به مقداردهی اولیه مراکز

📐 حساسیت به مقیاس ویژگی‌ها

⚠️ امکان ایجاد خوشه‌های خالی یا ناپایدار


🛠️ برای رسیدن به همگرایی پایدار:

از k-means++ برای انتخاب هوشمند مراکز اولیه استفاده کنید

نرمال‌سازی ویژگی‌ها را فراموش نکنید

آستانه همگرایی و تعداد تکرارها را منطقی تنظیم کنید


🔍 در فرآیند همگرایی، ابتدا هر نقطه به نزدیک‌ترین مرکز تخصیص داده می‌شود، سپس مرکز هر خوشه به‌عنوان میانگین نقاط آن به‌روزرسانی می‌گردد. این چرخه تا زمانی ادامه پیدا می‌کند که مراکز تغییر محسوسی نداشته باشند.

📌 یادگیری درست K-means یعنی خوشه‌بندی قابل اعتماد و قابل تحلیل.

👉 @rss_ai_ir

#علم_داده #یادگیری_ماشین #KMeans #خوشه_بندی #DataScience #MachineLearning
👍2
🇨🇳 چین روی تراشه‌های بومی خود قمار بزرگی می‌کند

💰 چین در حال بررسی بسته‌ای تا سقف ۷۰ میلیارد دلار مشوق‌های جدید برای صنعت نیمه‌رساناهاست؛ یکی از بزرگ‌ترین مداخلات دولتی تاریخ این کشور برای کاهش وابستگی به تراشه‌های خارجی و تضمین توان بلندمدت در هوش مصنوعی و امنیت ملی.

⚙️ در صورت تصویب، این بسته می‌تواند هم‌سطح یا حتی بزرگ‌تر از قانون CHIPS آمریکا باشد و تمرکز آن بر تقویت بازیگران داخلی مثل SMIC، هواوی و Moore Threads است.
با اینکه چین هنوز حدود ۶ سال از TSMC در لبه فناوری عقب‌تر است، اما استراتژی‌اش روی مقیاس، تاب‌آوری و کنترل زنجیره تأمین متمرکز شده، نه فقط پیشرفته‌ترین نودها.

🔍 چرا این حرکت مهم است؟
1️⃣ وابستگی چین به فناوری آمریکا کمتر از چیزی است که بسیاری تصور می‌کردند، به‌ویژه در نودهای بالغ و تخصصی که برای AI، خودرو و دفاع حیاتی‌اند.
2️⃣ خطوط تولید داخلی سریع‌تر از انتظار پیش می‌روند و به‌نظر می‌رسد تحریم‌ها به‌جای توقف، اجرای صنعتی را تسریع کرده‌اند.

🧠 در نهایت، شاید این تصمیم حتی مهم‌تر از پیشرفت چین در مدل‌های متن‌باز هوش مصنوعی باشد؛ چون تراشه‌ها سقف توان محاسباتی، استقلال صنعتی و اهرم ژئوپولیتیکی را تعیین می‌کنند.

@rss_ai_ir

#AI #China #Semiconductors #Chips #Geopolitics #MachineLearning
پرومپت‌سازی خودکار برای LLMها، بدون دردسر!

🧠 چارچوب Promptomatix یک سیستم هوشمند برای بهینه‌سازی خودکار پرومپت‌هاست که متن عادی را به پرومپت‌های باکیفیت و کارآمد تبدیل می‌کند؛ بدون نیاز به تیون دستی.

🚀 چرا مهم است؟

⚙️ بهبود عملکرد مدل‌ها در وظایف مختلف

✂️ کاهش طول پرومپت و سربار محاسباتی

🤖 حذف آزمون‌وخطای دستی در Prompt Engineering

📈 افزایش بهره‌وری و پایداری نتایج


📅 زمان انتشار: 17 جولای
🔗 لینک‌ها:

arXiv:
https://arxiv.org/abs/2507.14241

PDF:
https://arxiv.org/pdf/2507.14241

GitHub:
https://github.com/SalesforceAIResearch/promptomatix


📣 منبع:
@rss_ai_ir

#هوش_مصنوعی #یادگیری_ماشین #مهندسی_پرومپت #LLM #AI #MachineLearning