VIRSUN
9.37K subscribers
758 photos
439 videos
3 files
487 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 نگاهی به رباتیک اوپن‌ای‌آی در سال ۲۰۱۹

۶ سال قبل، خیلی پیش‌تر از ظهور ChatGPT، اوپن‌ای‌آی پروژه‌ای داشت که روی حل مکعب روبیک با یک دست رباتیک انسان‌نما با پنج انگشت کار می‌کرد.

اون زمان هنوز فاصله‌ی زیادی با ربات‌های انسان‌نمای امروزی (مثل Figure) بود، اما این مدل یکی از اولین نمونه‌هایی بود که فقط در شبیه‌سازی آموزش دید — خودش یک جور پیشرفت انقلابی محسوب می‌شد.

📌 روش مورد استفاده: Automated Domain Randomization (ADR)
در طول آموزش، شرایط فیزیکی تصادفی به شبیه‌سازی اضافه می‌شد (مثلاً تغییر نور، نیروها یا شرایط محیطی)، و همین باعث می‌شد شبکه‌ی عصبی برای مواجهه با موقعیت‌های غیرمنتظره‌ی دنیای واقعی آماده بشه.

⏱️ نتیجه؟

✳️ربات می‌تونست مکعب روبیک رو در ۲ تا ۴ دقیقه حل کنه.
✳️حتی در شرایط اختلال مثل قطع دوربین‌ها یا دخالت مکانیکی انسان هم همچنان کار می‌کرد.
✳️یک پروژه‌ی واقعاً خفن و الهام‌بخش بود 👏


---

#هوش_مصنوعی 🤖
#رباتیک 🦾
#OpenAI 💡
#Robotics
#RubikCube 🧩

@rss_ai_ir
🥰14🎉12👏11😁11🔥7👍54
⚡️ Qwen-ASR Toolkit —
ابزار قدرتمند Python برای تبدیل سریع گفتار به متن

این ابزار محدودیت ۳ دقیقه‌ای API مدل Qwen-ASR (نام قبلی: Qwen3-ASR-Flash) رو حذف می‌کنه و امکان تبدیل ساعت‌ها محتوای صوتی و تصویری رو فراهم می‌کنه.
راز کارش: تقسیم هوشمند فایل و پردازش موازی.


---

🔹 امکانات اصلی:

♻️رفع محدودیت ۳ دقیقه → پشتیبانی از فایل با هر طولی
♻️تقسیم‌بندی هوشمند با VAD (تشخیص گفتار از سکوت و نویز)
♻️سرعت بالا با پردازش چندنخی و موازی
♻️تبدیل خودکار فرمت به 16kHz mono
♻️پشتیبانی از همه فرمت‌ها: MP4, MOV, MKV, MP3, WAV, M4A و …
♻️اجرای ساده تنها با یک دستور CLI



---

🟢 نصب:
pip install qwen3-asr-toolkit

🔗 GitHub: Qwen3-ASR-Toolkit


---

#هوش_مصنوعی 🤖
#ASR 🎙️
#Speech2Text 📝
#Qwen
#OpenSource 💻

@rss_ai_ir
👍13😁12🥰118🔥7👏6🎉5
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 رباتی که وبستر–سالتو را بی‌نقص اجرا کرد!

⛔️اولین بار در جهان، AgiBot X2 موفق شد یکی از سخت‌ترین حرکات آکروباتیک را با دقت انسانی انجام دهد.

همانطور که می‌گویند: «استاد واقعی باید بتواند وبستر را درست فرود بیاید.»

#روبات #هوش_مصنوعی #آینده_فناوری

@rss_ai_ir
🔥15👍14👏14🥰1110😁9🎉7😱1
🚀 چگونه با کمک هوش مصنوعی هر چیزی را سریع‌تر یاد بگیریم

🕒 یادگیری در ۲۰ ساعت
یک برنامه ۲۰ ساعته بساز که روی ۲۰٪ مطالب کلیدی تمرکز کند و ۸۰٪ نتیجه بدهد. آن را به ۱۰ جلسه‌ی ۲ ساعته تقسیم کن و در پایان هر جلسه ۱۵ دقیقه مرور داشته باش.

📄 ساخت یک برگه تقلب یک‌صفحه‌ای
مفاهیم اصلی را در یک صفحه با بولت‌پوینت، نمودار و مثال خلاصه کن تا در ۵ دقیقه مرور شود.

👶 توضیح بده طوری که انگار ۵ سالم است
موضوع را ساده‌ترین شکل ممکن توضیح بده؛ با مثال‌های کوتاه و تشبیه. بعد سه سؤال بده تا مطمئن شوی فهمیدم.

🪜 نردبان یادگیری بساز
موضوع را به ۵ سطح سختی تقسیم کن؛ از مبتدی تا پیشرفته، با milestones روشن در هر مرحله.

📚 بهترین منابع یادگیری را پیدا کن
۵ منبع برتر (کتاب، ویدئو، دوره یا افراد) را معرفی کن و بگو چرا ارزش وقت گذاشتن دارند.

🧠 استفاده از تکنیک فاینمن
موضوع را ساده توضیح بده، از من بخواه دوباره برایت توضیح دهم. جاهایی که کم آوردم را نشان بده و دوباره مرور کن تا بتوانم خودم کامل توضیح دهم.

#یادگیری #هوش_مصنوعی #مطالعه #آینده

@rss_ai_ir
12🥰12🔥11😁9👍8👏6🎉6
📢 دیتاست تازه برای پژوهش‌های گفتار و NLP

📌 OleSpeech-IV-2025-EN-AR-100
(صد ساعت)

🎤 گفت‌وگوهای واقعی و بدون سناریو به زبان انگلیسی
🗂️ متن‌نویسی انسانی با برچسب‌گذاری گویندگان
🔎 دارای برچسب زمانی و هم‌پوشانی دیالوگ‌ها
📂 فایل‌های صوتی خام و بدون فشرده‌سازی

🔧 مناسب برای وظایف ASR، سیستم‌های مکالمه و تحلیل گفتار

🔗 لینک دیتاست

#NLP #هوش_مصنوعی #پردازش_گفتار #ASR

@rss_ai_ir
🔥14🎉11🥰10👏9👍8😁86
📰 ایلان ماسک اعلام کرد که باور دارد Grok 5 می‌تواند به سطح AGI برسد!

😅 باز هم وعده‌های بزرگ پشت وعده‌های بزرگ...
اما اگر جدی نگاه کنیم، نباید پتانسیل xAI را دست‌کم گرفت.

🔧 پشتوانه عظیم سخت‌افزاری
📊 حجم عظیم داده‌ها (از X گرفته تا تاکسی‌های خودران)
👩‍💻 یک واحد بزرگ برچسب‌گذاری داده تازه‌تأسیس

همه این‌ها یعنی شرایط برای رسیدن به یک جهش جدی در هوش مصنوعی فراهم است.

#ایلان_ماسک #هوش_مصنوعی #xAI #Grok

@rss_ai_ir
🔥1211🎉9👍8🥰8😁8👏7
⚡️تحقیق Tongyi DeepResearch نشان داد که عامل‌های هوش مصنوعی می‌توانند روی داده‌های مصنوعی، کار پژوهشی واقعی انجام دهند.

📊 نتایج کلیدی:

آزمون Humanity’s Last Exam (HLE):
دقت ۳۲.۹٪ در وظایف استدلال علمی

BrowseComp:
دقت ۴۳.۴٪ در پژوهش‌های وب پیچیده
نسخه چینی: دقت ۴۶.۷٪

xbench-DeepSearch:
دقت ۷۵٪ در وظایف جستجوی کاربری


🔎 این پیشرفت هزینه‌ها را کاهش می‌دهد، دسترسی را افزایش می‌دهد و مسیرهای تازه‌ای از علم و حقوق تا ناوبری باز می‌کند.


🔗 Blog
🔗 Model HuggingFace
🔗 Model ModelScope
🔗 GitHub Repo

#هوش_مصنوعی #پژوهش #عامل_هوشمند #داده_مصنوعی #Tongyi

@rss_ai_ir
🥰13👏13😁11🎉9👍85🔥4
🚨 دوربین‌های هوش مصنوعی و جراحی بدون دستیار

🔍 در شیلی، جراحان با کمک دوربین هدایت‌شده توسط هوش مصنوعی (بخشی از ربات MARS) برای اولین‌بار توانستند عمل برداشت کیسه صفرا را کاملاً به‌تنهایی انجام دهند — بدون نیاز به دستیار انسانی.

نکات مهم:

ترکیب ابزارهای جراحی مغناطیسی با نرم‌افزار هوشمند که زاویه‌ها و دید را به‌صورت پویا تنظیم می‌کند.

این اولین‌بار است که چنین عملی روی بیمار واقعی (نه فقط حیوانات یا شبیه‌سازی‌ها) انجام شده.

پروژه بخشی از تلاش‌های جهانی است؛ مثلاً دانشگاه جانز هاپکینز پیش‌تر روی خوک‌ها جراحی‌های پیچیده با سیستم‌های مشابه انجام داده بود.

بازار ربات‌های جراحی در حال رشد عظیم است: ۱۵.۶ میلیارد دلار در ۲۰۲۴ → پیش‌بینی رشد تا ۶۴.۴ میلیارد دلار در ۲۰۳۴.


⚡️ این یعنی ورود ملموس‌تر هوش مصنوعی به دنیای اتوماسیون جراحی؛ اما پرسش کلیدی باقی می‌ماند: آیا این سیستم‌ها می‌توانند در شرایط متنوع و پرخطر عملکرد قابل‌اعتمادی داشته باشند؟ و موانع قانونی، ایمنی و پذیرش تا چه حد سریع رفع خواهند شد؟

@rss_ai_ir

#هوش_مصنوعی #رباتیک #پزشکی #اتوماسیون #جراحی #AI #HealthTech
19👏18😁16🥰13🔥11👍9🎉7
💳 گوگل پروتکل جدید پرداخت عامل‌ها (AP2) را معرفی کرد

گوگل چارچوبی جهانی به نام AP2 عرضه کرده که به عامل‌های هوش مصنوعی اجازه می‌دهد پرداخت‌ها را به‌صورت امن بین فروشندگان و پلتفرم‌ها انجام دهند.

🔹 دستورهای دیجیتال: هر مرحله شفاف و رسمی است — از Intent Mandate («برایم کفش نایکی سفید پیدا کن») تا Cart Mandate («الان بخر»). این یعنی وضوح کامل در نیت، تأیید و قیمت.

🔹 عامل به‌عنوان وکیل دیجیتال: عامل تنها نقش نماینده شما را دارد، اما معامله به‌طور قانونی بین شما و فروشنده ثبت می‌شود.

🔹 حمایت صنعتی گسترده: بیش از ۶۰ شریک بزرگ از جمله Mastercard، PayPal، Intuit و Salesforce از این طرح پشتیبانی می‌کنند.

⚡️ اگر AP2 به‌طور گسترده پذیرفته شود، می‌تواند به ستون فقرات حقوقی و فنی اقتصاد پرداخت‌های ماشینی تبدیل شود.

@rss_ai_ir

#هوش_مصنوعی #پرداخت_دیجیتال #گوگل #فینتک #AI #پرداخت_ماشینی
👏21🔥14😁14🎉1412🥰11👍10
This media is not supported in your browser
VIEW IN TELEGRAM
🍕 Superpixel Anything (SOTA) —
مدل سوپراپیکسل همه‌کاره 🍕

🔹 SuperPixel Anything Model (SPAM)
یک فریم‌ورک انعطاف‌پذیر برای سگمنتیشن تصاویر است. این مدل ترکیبی از استخراج ویژگی‌های تصویری برای تولید سوپراپیکسل و یک مدل از پیش‌آموزش‌دیده در مقیاس بزرگ است که امکان سگمنتیشن بدون وابستگی به معنا (semantic-agnostic) را فراهم می‌کند. نتیجه: سوپراپیکسل‌هایی که به‌طور دقیق با ماسک‌ها منطبق می‌شوند.

📌 ویژگی‌ها:

♻️تولید سوپراپیکسل‌های سازگار با ساختار تصویر
♻️قابلیت استفاده در کاربردهای مختلف بینایی ماشین
♻️دیتاست و ریپوی متن‌باز برای پژوهشگران



👉 مقاله: arxiv.org/pdf/2509.12791
👉 کد: github.com/waldo-j/spam

@rss_ai_ir

#هوش_مصنوعی #بینایی_ماشین #Superpixel #Segmentation #AI #SOTA
🥰17😁16👏15🔥13🎉1311👍9
🚀 Claude Code + Figma MCP Server

⛔️حالا دیزاین‌های Figma را می‌توان مستقیم به کد تبدیل کرد! با ادغام جدید Claude Code و Figma MCP Server، توسعه‌دهندگان می‌توانند از طریق ترمینال، طرح‌ها را به کامپوننت‌های آماده تبدیل کنند.

⚙️ نحوه کار:

فعال‌سازی MCP سرور در اپ دسکتاپ Figma
اتصال به Claude Code تنها با یک دستور ساده


⚠️ اما محدودیت‌ها:

♻️نمی‌تواند کد موجود را آپدیت کند
♻️در فلوهای چندفریمی مشکل دارد
♻️امکان بهبود بصری (Visual Refinement) ندارد
♻️فقط در دسترس توسعه‌دهندگان است، نه طراحان


💡 در مقاله همچنین اشاره شده که Fusion از Builder.io جایگزین قوی‌تری است، چون قابلیت‌های بیشتری دارد:

ادیت بصری
آپدیت دقیق و جزئی روی کد
حتی امکان انتشار مستقیم کد در محیط پروداکشن توسط افراد غیرتوسعه‌دهنده
این ادغام بیشتر یک قدم رو به جلو است، اما هنوز فاصله زیادی با ابزارهای کامل‌تر دارد.

@rss_ai_ir

#Claude #Figma #MCP #AI #طراحی #کدنویسی #هوش_مصنوعی #Productivity
🥰20👍17😁1412🔥12🎉10👏6
🚨 شکستن تاریخ توسط OpenAI در مسابقات جهانی برنامه‌نویسی ICPC!

در فینال مسابقات جهانی برنامه‌نویسی ICPC، سیستم استدلالی (Reasoning) اوپن‌اِی‌آی مقام اول مطلق را کسب کرد و توانست هر ۱۲ مسئله از ۱۲ مسئله را حل کند.

⚡️ نکات مهم:

در تاریخ این رقابت‌ها، هیچ تیم انسانی تا امروز به چنین نتیجه‌ای نرسیده بود.

همه‌چیز کاملاً مطابق قوانین بود: ۵ ساعت زمان، همان قالب استاندارد مسائل و پاسخ‌ها، بدون دخالت انسان.

۱۱ مسئله با اولین ارسال حل شدند، و برای مسئله دوازدهم ۹ بار ارسال انجام شد.

این یک مجموعه از مدل‌ها (Ensemble) بود، نه مدلی که صرفاً برای ICPC آموزش دیده باشد. همین مدل‌ها قبلاً در IMO و IOI هم شرکت کرده بودند.


🥇 مقام دوم (و اول بین انسان‌ها) به تیم دانشجویان دانشگاه دولتی سن‌پترزبورگ رسید؛ آنها ۱۱ مسئله را حل کردند و آخرین پاسخ را فقط ۲ دقیقه مانده به پایان ارسال کردند.
🥇 مدل گوگل هم توانست ۱۰ مسئله از ۱۲ را حل کند و مدال طلا بگیرد.

📌 نتیجه: برای اولین بار در تاریخ، هوش مصنوعی نه‌تنها به پای انسان‌ها در ICPC رسید، بلکه کاری کرد که هیچ انسانی تاکنون نتوانسته بود انجام دهد.

@rss_ai_ir

#هوش_مصنوعی #OpenAI #ICPC #مسابقه #برنامه_نویسی #شبکه_عصبی #آینده
12😁11🎉11👏8👍7🔥7🥰6
✴️ متا اولین مقاله خودش رو از لَبِ Superintelligence منتشر کرد:

📌 عنوان: REFRAG: Rethinking RAG based Decoding
هدف: افزایش سرعت RAG تا ۳۳ برابر بدون افت کیفیت! 🚀

🔎 ماجرا از کجاست؟
توی RAG اول یه retriever تیکه‌های مرتبط متن (چانک‌ها) رو پیدا می‌کنه، بعد همه‌ی اونها به LLM داده می‌شه. مشکل اینجاست که مدل فقط از بخشی از این چانک‌ها استفاده می‌کنه ولی ما هزینه پردازش همه‌شونو می‌دیم → مصرف منابع بالا + تأخیر زیاد.

🟢 راهکار REFRAG:
به جای توکن‌ها، امبدینگ فشرده‌ی چانک‌ها مستقیماً وارد دیکودر می‌شن.
کوتاه شدن ورودی مدل
کاهش حجم KV-cache
6–7 برابر افزایش throughput
باز شدن selective بعضی چانک‌ها برای حفظ جزئیات

⚠️ چالش: آموزش این روش پیچیده‌تره و برای کانتکست‌های کوچیک به‌صرفه نیست.

📊 اما نتیجه مهم: Time To First Token تا ۳۳ برابر سریع‌تر و امکان گسترش پنجره‌ی کانتکست به مقیاس خیلی بزرگ.

📄 مقاله کامل: arxiv.org/pdf/2509.01092

@rss_ai_ir
---

#REFRAG #RAG #Meta #AI #LLM #NeuralNetworks
👍15🔥10👏108🥰8😁8🎉7
⚡️ Ling-flash-2.0 منتشر شد! ⚡️

⛔️مدلی با ۱۰۰ میلیارد پارامتر اما فقط با حدود ۶.۱ میلیارد پارامتر فعال، که آن را فوق‌العاده کم‌هزینه و سریع در پردازش می‌کند.


🚀 ویژگی‌های کلیدی Ling-flash-2.0

♻️آموزش‌دیده روی ۲۰ تریلیون توکن همراه با مراحل pre-training و RL.
♻️بهترین عملکرد در بین مدل‌های متراکم تا ۴۰B پارامتر.
♻️بسیار قوی در استدلال پیچیده، تولید کد و تسک‌های فرانت‌اند.

⚙️ جزئیات معماری و کارایی

معماری MoE با نسبت فعال‌سازی ۱/۳۲.
تکنیک‌های پیشرفته مثل توزیع هوشمند متخصصان، تعادل توجه، و مسیریابی بدون زیان کمکی.
روی سخت‌افزار H20 سرعت تولید ۲۰۰+ توکن در ثانیه (۳ برابر سریع‌تر از مدل متراکم 36B).
پشتیبانی از کانتکست‌های ۱۲۸K با استفاده از YaRN.
📎 جزئیات بیشتر:
🔗 Hugging Face

@rss_ai_ir

#MoE #مدل_زبان #یادگیری_ماشین #هوش_مصنوعی #OpenSource
🎉28😁2019👍16🥰15👏14🔥11
🔍 چطور کدنویسی در یک شرکت FAANG انجام می‌شود (با کمک AI)

یک مهندس نرم‌افزار با بیش از ۱۰ سال تجربه (نیمی در FAANG) توضیح داده که AI کدنویسی کمکی فقط برای دمو یا یادگیری نیست، بلکه واقعاً در تولید کد استفاده می‌شود.

مراحل:
1️⃣ همیشه با یک مدرک طراحی فنی (Technical Design Doc) شروع می‌شود. اینجا معماری، تعاملات با تیم‌های دیگر و جزئیات سیستم مشخص می‌شود.
2️⃣ طراحی باید توسط Senior Engineers بررسی و نقد شود.
3️⃣ اگر تأیید شد، تیم‌ها وارد مستندسازی و توسعه می‌شوند.
4️⃣ در Backlog و Sprint Planning، وظایف به بخش‌های کوچک تقسیم می‌شوند.
5️⃣ در کدنویسی اصلی، AI نقش پررنگ دارد: با Test Driven Development، ابتدا AI تست‌ها را می‌نویسد، سپس توسعه‌دهنده فیچر را می‌سازد.
6️⃣ در Code Review، یک پروسه دو مرحله‌ای وجود دارد؛ AI هم در این مرحله کمک می‌کند.
7️⃣ اگر همه چیز در Staging درست بود، به Production می‌رود.

📈 نتیجه: حدود ۳۰٪ افزایش سرعت از زمان پیشنهاد فیچر تا رسیدن به محیط عملیاتی.

📌 نکته مهم: همیشه با طراحی و معماری شروع کنید، در گام‌های کوچک جلو بروید، و تست‌ها را از همان ابتدا بنویسید.

@rss_ai_ir
#FAANG #AI #کدنویسی #نرم‌افزار #هوش_مصنوعی #مهندسی_نرم‌افزار #TestDrivenDevelopment
12😁12👍10👏10🎉8🔥7🥰7
🧰 پژوهش مایکروسافت روی MCP و مشکل «تداخل فضای ابزار»

محققان مایکروسافت بررسی کردند که وقتی تعداد ابزارها در Model Context Protocol (MCP) زیاد می‌شود، عامل‌ها (Agents) به‌جای همکاری، مزاحم یکدیگر می‌شوند. این پدیده را Tool-Space Interference نامیدند.

🔎 نشانه‌ها:

✳️منوهای شلوغ با ابزارهای بیش از حد
✳️خروجی‌های بسیار حجیم (صدها هزار توکن)
✳️پارامترهای تو در تو و گیج‌کننده
✳️نام‌های تکراری برای ابزارها
✳️خطاهای مبهم و غیر استاندارد


📉 نتایج پژوهش:

♻️بعضی سرورها تا ۲۵۶ ابزار پیشنهاد می‌دادند (حد بهینه < ۲۰). در این حالت دقت تا ۸۵٪ افت می‌کرد.
♻️یک ابزار به‌طور متوسط ۵۵۷هزار توکن خروجی می‌داد، ۱۶ ابزار دیگر بالای ۱۲۸هزار توکن! این باعث شکست مدل و افت دقت تا ۹۱٪ شد.
♻️پارامترهای ۲۰ لایه‌ای باعث سردرگمی می‌شدند. با ساده‌سازی (flattening) موفقیت ۴۷٪ بیشتر شد.
♻️۷۷۵ نام تکراری در ابزارها شناسایی شد؛ واژه «search» در ۳۲ سرور تکرار شده بود.


⛔️ راهکارهای پیشنهادی مایکروسافت:

گروه‌بندی ابزارها در دسته‌های کوچک‌تر
کش کردن (cache) طرح‌ها و داده‌ها
استفاده از namespace برای نام‌گذاری یکتا
محدود کردن حجم خروجی و ساده‌سازی پارامترها
استانداردسازی خطاها و مدیریت منابع


📊 نکته جالب: استفاده هوشمندانه از namespace سرعت اجرای وظایف را تا ۴۰٪ افزایش داد.

📌 نتیجه: هرچه تعداد ابزار کمتر، پارامترها ساده‌تر و خروجی‌ها ساختارمندتر باشد، عامل‌ها به‌جای سردرگمی، شروع به همکاری مؤثر می‌کنند.
@rss_ai_ir

Link

#Microsoft #MCP #AI #Agents #هوش_مصنوعی #ابزار #مهندسی_سیستم
👍13🥰11😁11🔥10👏97🎉7
♻️خب دیگه، همه‌اش بحث المپیاد و مسابقه نباشه

⛔️😁 این بار اوپن‌اِی‌آی فقط در عرض یک ماه به GPT-5-Thinking قابلیتی اضافه کرده که کاربر بتونه مدت زمان تفکر مدل رو خودش انتخاب کنه؛ یعنی مشخص کنه که مدل برای هر سؤال چقدر عمیق و طولانی فکر کنه.

این دقیقاً همون چیزیه که می‌شه اسمش رو گذاشت انقلاب واقعی در دنیای هوش مصنوعی!

@rss_ai_ir

#هوش_مصنوعی #OpenAI #GPT5 #تفکر #نوآوری
15🔥12🥰11👏9👍7😁6🎉6👌2
This media is not supported in your browser
VIEW IN TELEGRAM
😳 ارتش چین با همکاری دانشگاه چونگ‌چینگ پروژه‌ای عجیب اجرا کرده: سگ‌های رباتیکی را به پرتابگر موشک مجهز کرده‌اند.

🔹 در رزمایش اخیر، این ربات‌ها تمام اهداف را با موفقیت مورد اصابت قرار دادند و رسانه‌ها از آن به عنوان یک «موفقیت کامل» یاد کردند.

🔹 چنین فناوری‌هایی بحث‌های جدی درباره امنیت، اخلاق و آینده جنگ‌ها به وجود آورده است.

به قول بعضی‌ها: «روز رستاخیز داره نزدیک میشه...»

@rss_ai_ir
#ربات #ارتش #چین #هوش_مصنوعی #روباتیک
👏1210👍10😁10🔥9🎉9🥰8😱1🌚1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀👽 DAM for SAM2 Tracking 👽🚀

🔬 محققان دانشگاه لیوبلیانا ماژول جدیدی به نام Distractor-Aware Memory (DAM) برای SAM2 معرفی کرده‌اند. این ماژول به‌صورت drop-in عمل می‌کند و باعث:

کاهش انحراف ردیابی (tracking drift) به سمت عوامل مزاحم (distractors)

بهبود توانایی بازتشخیص (redetection) بعد از انسداد شیء (occlusion)


💎 نتیجه؟ DAM4SAM عملکردی بهتر از SAM2.1 داشته و در ۱۰ بنچمارک مختلف SOTA را ثبت کرده است.

📌 منابع:
👉 Paper
👉 Project Page
👉 GitHub Repo

@rss_ai_ir

#AI #ComputerVision #Tracking #SAM2 #DAM4SAM #DeepLearning #SOTA
😁13👏1211👍9🔥8🥰6🎉6🤔1