🤖 بازگشت رباتیک در OpenAI
اوپنایآی در سکوت، واحد رباتیک خودش رو دوباره فعال کرده:
🔹 جذب پژوهشگر در زمینهی کنترل و آموزش رباتهای انساننما
🔹 استخدام مهندس برای شبیهسازها و نمونهسازی سیستمهای حسگر
🔹 نیاز به مکانیکهایی با تجربهی طراحی سیستمهای آماده برای تولید انبوه (۱ میلیون+ دستگاه)
✨ نکته مهم: در تمام آگهیها تأکید شده روی «رباتیک عمومی» بهعنوان مسیر رسیدن به AGI.
یادآوری: این واحد از سال ۲۰۲۱ متوقف بود و تازه از دسامبر دوباره شروع به کار کرده.
📌 تصور کن: سال ۲۰۲۸، GPT-10 ظرفهات رو میشوره! 🍽️🤖
---
#هوش_مصنوعی 🤖
#رباتیک 🦾
#AGI 🚀
#OpenAI 💡
#ربات_انسان_نما 👤
#فناوری_جدید
@rss_ai_ir
اوپنایآی در سکوت، واحد رباتیک خودش رو دوباره فعال کرده:
🔹 جذب پژوهشگر در زمینهی کنترل و آموزش رباتهای انساننما
🔹 استخدام مهندس برای شبیهسازها و نمونهسازی سیستمهای حسگر
🔹 نیاز به مکانیکهایی با تجربهی طراحی سیستمهای آماده برای تولید انبوه (۱ میلیون+ دستگاه)
✨ نکته مهم: در تمام آگهیها تأکید شده روی «رباتیک عمومی» بهعنوان مسیر رسیدن به AGI.
یادآوری: این واحد از سال ۲۰۲۱ متوقف بود و تازه از دسامبر دوباره شروع به کار کرده.
📌 تصور کن: سال ۲۰۲۸، GPT-10 ظرفهات رو میشوره! 🍽️🤖
---
#هوش_مصنوعی 🤖
#رباتیک 🦾
#AGI 🚀
#OpenAI 💡
#ربات_انسان_نما 👤
#فناوری_جدید
@rss_ai_ir
😁16🔥11👏10🥰9❤7👍6🎉5
This media is not supported in your browser
VIEW IN TELEGRAM
✋ دست؛ بزرگترین چالش رباتیک
یکی از سختترین مرزهای رباتیک هنوز هم دست است؛ ترکیبی از:
🔹 ظرافت برای انجام کارهای دقیق
🔹 آزادی حرکت برای انعطافپذیری
🔹 قدرت و پایداری برای استفاده در دنیای واقعی
🚀 همین حالا شاهد پیشرفتهای بزرگی در طراحی و کنترل دستهای رباتیک هستیم؛ گامی کلیدی بهسوی رباتهای انساننمای توانمندتر.
#رباتیک 🤖
#هوش_مصنوعی 🧠
#نوآوری 🚀
#ربات_انسان_نما 🦾
#فناوری_آینده
@rss_ai_ir
یکی از سختترین مرزهای رباتیک هنوز هم دست است؛ ترکیبی از:
🔹 ظرافت برای انجام کارهای دقیق
🔹 آزادی حرکت برای انعطافپذیری
🔹 قدرت و پایداری برای استفاده در دنیای واقعی
🚀 همین حالا شاهد پیشرفتهای بزرگی در طراحی و کنترل دستهای رباتیک هستیم؛ گامی کلیدی بهسوی رباتهای انساننمای توانمندتر.
#رباتیک 🤖
#هوش_مصنوعی 🧠
#نوآوری 🚀
#ربات_انسان_نما 🦾
#فناوری_آینده
@rss_ai_ir
🔥14🥰10🎉10👏9👍8❤7😁4🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 نگاهی به رباتیک اوپنایآی در سال ۲۰۱۹
۶ سال قبل، خیلی پیشتر از ظهور ChatGPT، اوپنایآی پروژهای داشت که روی حل مکعب روبیک با یک دست رباتیک انساننما با پنج انگشت کار میکرد.
✨ اون زمان هنوز فاصلهی زیادی با رباتهای انساننمای امروزی (مثل Figure) بود، اما این مدل یکی از اولین نمونههایی بود که فقط در شبیهسازی آموزش دید — خودش یک جور پیشرفت انقلابی محسوب میشد.
📌 روش مورد استفاده: Automated Domain Randomization (ADR)
در طول آموزش، شرایط فیزیکی تصادفی به شبیهسازی اضافه میشد (مثلاً تغییر نور، نیروها یا شرایط محیطی)، و همین باعث میشد شبکهی عصبی برای مواجهه با موقعیتهای غیرمنتظرهی دنیای واقعی آماده بشه.
⏱️ نتیجه؟
✳️ربات میتونست مکعب روبیک رو در ۲ تا ۴ دقیقه حل کنه.
✳️حتی در شرایط اختلال مثل قطع دوربینها یا دخالت مکانیکی انسان هم همچنان کار میکرد.
✳️یک پروژهی واقعاً خفن و الهامبخش بود 👏
---
#هوش_مصنوعی 🤖
#رباتیک 🦾
#OpenAI 💡
#Robotics
#RubikCube 🧩
@rss_ai_ir
۶ سال قبل، خیلی پیشتر از ظهور ChatGPT، اوپنایآی پروژهای داشت که روی حل مکعب روبیک با یک دست رباتیک انساننما با پنج انگشت کار میکرد.
✨ اون زمان هنوز فاصلهی زیادی با رباتهای انساننمای امروزی (مثل Figure) بود، اما این مدل یکی از اولین نمونههایی بود که فقط در شبیهسازی آموزش دید — خودش یک جور پیشرفت انقلابی محسوب میشد.
📌 روش مورد استفاده: Automated Domain Randomization (ADR)
در طول آموزش، شرایط فیزیکی تصادفی به شبیهسازی اضافه میشد (مثلاً تغییر نور، نیروها یا شرایط محیطی)، و همین باعث میشد شبکهی عصبی برای مواجهه با موقعیتهای غیرمنتظرهی دنیای واقعی آماده بشه.
⏱️ نتیجه؟
✳️ربات میتونست مکعب روبیک رو در ۲ تا ۴ دقیقه حل کنه.
✳️حتی در شرایط اختلال مثل قطع دوربینها یا دخالت مکانیکی انسان هم همچنان کار میکرد.
✳️یک پروژهی واقعاً خفن و الهامبخش بود 👏
---
#هوش_مصنوعی 🤖
#رباتیک 🦾
#OpenAI 💡
#Robotics
#RubikCube 🧩
@rss_ai_ir
🥰14🎉12👏11😁11🔥7👍5❤4
⚡️ Qwen-ASR Toolkit —
ابزار قدرتمند Python برای تبدیل سریع گفتار به متن
✅این ابزار محدودیت ۳ دقیقهای API مدل Qwen-ASR (نام قبلی: Qwen3-ASR-Flash) رو حذف میکنه و امکان تبدیل ساعتها محتوای صوتی و تصویری رو فراهم میکنه.
✨ راز کارش: تقسیم هوشمند فایل و پردازش موازی.
---
🔹 امکانات اصلی:
♻️رفع محدودیت ۳ دقیقه → پشتیبانی از فایل با هر طولی
♻️تقسیمبندی هوشمند با VAD (تشخیص گفتار از سکوت و نویز)
♻️سرعت بالا با پردازش چندنخی و موازی
♻️تبدیل خودکار فرمت به 16kHz mono
♻️پشتیبانی از همه فرمتها: MP4, MOV, MKV, MP3, WAV, M4A و …
♻️اجرای ساده تنها با یک دستور CLI
---
🟢 نصب:
🔗 GitHub: Qwen3-ASR-Toolkit
---
#هوش_مصنوعی 🤖
#ASR 🎙️
#Speech2Text 📝
#Qwen
#OpenSource 💻
@rss_ai_ir
ابزار قدرتمند Python برای تبدیل سریع گفتار به متن
✅این ابزار محدودیت ۳ دقیقهای API مدل Qwen-ASR (نام قبلی: Qwen3-ASR-Flash) رو حذف میکنه و امکان تبدیل ساعتها محتوای صوتی و تصویری رو فراهم میکنه.
✨ راز کارش: تقسیم هوشمند فایل و پردازش موازی.
---
🔹 امکانات اصلی:
♻️رفع محدودیت ۳ دقیقه → پشتیبانی از فایل با هر طولی
♻️تقسیمبندی هوشمند با VAD (تشخیص گفتار از سکوت و نویز)
♻️سرعت بالا با پردازش چندنخی و موازی
♻️تبدیل خودکار فرمت به 16kHz mono
♻️پشتیبانی از همه فرمتها: MP4, MOV, MKV, MP3, WAV, M4A و …
♻️اجرای ساده تنها با یک دستور CLI
---
🟢 نصب:
pip install qwen3-asr-toolkit
🔗 GitHub: Qwen3-ASR-Toolkit
---
#هوش_مصنوعی 🤖
#ASR 🎙️
#Speech2Text 📝
#Qwen
#OpenSource 💻
@rss_ai_ir
👍13😁12🥰11❤8🔥7👏6🎉5
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 رباتی که وبستر–سالتو را بینقص اجرا کرد!
⛔️اولین بار در جهان، AgiBot X2 موفق شد یکی از سختترین حرکات آکروباتیک را با دقت انسانی انجام دهد.
✅همانطور که میگویند: «استاد واقعی باید بتواند وبستر را درست فرود بیاید.» ✨
#روبات #هوش_مصنوعی #آینده_فناوری
@rss_ai_ir
⛔️اولین بار در جهان، AgiBot X2 موفق شد یکی از سختترین حرکات آکروباتیک را با دقت انسانی انجام دهد.
✅همانطور که میگویند: «استاد واقعی باید بتواند وبستر را درست فرود بیاید.» ✨
#روبات #هوش_مصنوعی #آینده_فناوری
@rss_ai_ir
🔥15👍14👏14🥰11❤10😁9🎉7😱1
🚀 چگونه با کمک هوش مصنوعی هر چیزی را سریعتر یاد بگیریم
🕒 یادگیری در ۲۰ ساعت
یک برنامه ۲۰ ساعته بساز که روی ۲۰٪ مطالب کلیدی تمرکز کند و ۸۰٪ نتیجه بدهد. آن را به ۱۰ جلسهی ۲ ساعته تقسیم کن و در پایان هر جلسه ۱۵ دقیقه مرور داشته باش.
📄 ساخت یک برگه تقلب یکصفحهای
مفاهیم اصلی را در یک صفحه با بولتپوینت، نمودار و مثال خلاصه کن تا در ۵ دقیقه مرور شود.
👶 توضیح بده طوری که انگار ۵ سالم است
موضوع را سادهترین شکل ممکن توضیح بده؛ با مثالهای کوتاه و تشبیه. بعد سه سؤال بده تا مطمئن شوی فهمیدم.
🪜 نردبان یادگیری بساز
موضوع را به ۵ سطح سختی تقسیم کن؛ از مبتدی تا پیشرفته، با milestones روشن در هر مرحله.
📚 بهترین منابع یادگیری را پیدا کن
۵ منبع برتر (کتاب، ویدئو، دوره یا افراد) را معرفی کن و بگو چرا ارزش وقت گذاشتن دارند.
🧠 استفاده از تکنیک فاینمن
موضوع را ساده توضیح بده، از من بخواه دوباره برایت توضیح دهم. جاهایی که کم آوردم را نشان بده و دوباره مرور کن تا بتوانم خودم کامل توضیح دهم.
#یادگیری #هوش_مصنوعی #مطالعه #آینده
@rss_ai_ir
🕒 یادگیری در ۲۰ ساعت
یک برنامه ۲۰ ساعته بساز که روی ۲۰٪ مطالب کلیدی تمرکز کند و ۸۰٪ نتیجه بدهد. آن را به ۱۰ جلسهی ۲ ساعته تقسیم کن و در پایان هر جلسه ۱۵ دقیقه مرور داشته باش.
📄 ساخت یک برگه تقلب یکصفحهای
مفاهیم اصلی را در یک صفحه با بولتپوینت، نمودار و مثال خلاصه کن تا در ۵ دقیقه مرور شود.
👶 توضیح بده طوری که انگار ۵ سالم است
موضوع را سادهترین شکل ممکن توضیح بده؛ با مثالهای کوتاه و تشبیه. بعد سه سؤال بده تا مطمئن شوی فهمیدم.
🪜 نردبان یادگیری بساز
موضوع را به ۵ سطح سختی تقسیم کن؛ از مبتدی تا پیشرفته، با milestones روشن در هر مرحله.
📚 بهترین منابع یادگیری را پیدا کن
۵ منبع برتر (کتاب، ویدئو، دوره یا افراد) را معرفی کن و بگو چرا ارزش وقت گذاشتن دارند.
🧠 استفاده از تکنیک فاینمن
موضوع را ساده توضیح بده، از من بخواه دوباره برایت توضیح دهم. جاهایی که کم آوردم را نشان بده و دوباره مرور کن تا بتوانم خودم کامل توضیح دهم.
#یادگیری #هوش_مصنوعی #مطالعه #آینده
@rss_ai_ir
❤12🥰12🔥11😁9👍8👏6🎉6
📢 دیتاست تازه برای پژوهشهای گفتار و NLP
📌 OleSpeech-IV-2025-EN-AR-100
(صد ساعت)
🎤 گفتوگوهای واقعی و بدون سناریو به زبان انگلیسی
🗂️ متننویسی انسانی با برچسبگذاری گویندگان
🔎 دارای برچسب زمانی و همپوشانی دیالوگها
📂 فایلهای صوتی خام و بدون فشردهسازی
🔧 مناسب برای وظایف ASR، سیستمهای مکالمه و تحلیل گفتار
🔗 لینک دیتاست
#NLP #هوش_مصنوعی #پردازش_گفتار #ASR
@rss_ai_ir
📌 OleSpeech-IV-2025-EN-AR-100
(صد ساعت)
🎤 گفتوگوهای واقعی و بدون سناریو به زبان انگلیسی
🗂️ متننویسی انسانی با برچسبگذاری گویندگان
🔎 دارای برچسب زمانی و همپوشانی دیالوگها
📂 فایلهای صوتی خام و بدون فشردهسازی
🔧 مناسب برای وظایف ASR، سیستمهای مکالمه و تحلیل گفتار
🔗 لینک دیتاست
#NLP #هوش_مصنوعی #پردازش_گفتار #ASR
@rss_ai_ir
🔥14🎉11🥰10👏9👍8😁8❤6
📰 ایلان ماسک اعلام کرد که باور دارد Grok 5 میتواند به سطح AGI برسد!
😅 باز هم وعدههای بزرگ پشت وعدههای بزرگ...
اما اگر جدی نگاه کنیم، نباید پتانسیل xAI را دستکم گرفت.
🔧 پشتوانه عظیم سختافزاری
📊 حجم عظیم دادهها (از X گرفته تا تاکسیهای خودران)
👩💻 یک واحد بزرگ برچسبگذاری داده تازهتأسیس
همه اینها یعنی شرایط برای رسیدن به یک جهش جدی در هوش مصنوعی فراهم است.
#ایلان_ماسک #هوش_مصنوعی #xAI #Grok
@rss_ai_ir
😅 باز هم وعدههای بزرگ پشت وعدههای بزرگ...
اما اگر جدی نگاه کنیم، نباید پتانسیل xAI را دستکم گرفت.
🔧 پشتوانه عظیم سختافزاری
📊 حجم عظیم دادهها (از X گرفته تا تاکسیهای خودران)
👩💻 یک واحد بزرگ برچسبگذاری داده تازهتأسیس
همه اینها یعنی شرایط برای رسیدن به یک جهش جدی در هوش مصنوعی فراهم است.
#ایلان_ماسک #هوش_مصنوعی #xAI #Grok
@rss_ai_ir
🔥12❤11🎉9👍8🥰8😁8👏7
⚡️تحقیق Tongyi DeepResearch نشان داد که عاملهای هوش مصنوعی میتوانند روی دادههای مصنوعی، کار پژوهشی واقعی انجام دهند.
📊 نتایج کلیدی:
آزمون Humanity’s Last Exam (HLE):
✅ دقت ۳۲.۹٪ در وظایف استدلال علمی
BrowseComp:
✅ دقت ۴۳.۴٪ در پژوهشهای وب پیچیده
✅نسخه چینی: دقت ۴۶.۷٪
xbench-DeepSearch:
✅دقت ۷۵٪ در وظایف جستجوی کاربری
🔎 این پیشرفت هزینهها را کاهش میدهد، دسترسی را افزایش میدهد و مسیرهای تازهای از علم و حقوق تا ناوبری باز میکند.
🔗 Blog
🔗 Model HuggingFace
🔗 Model ModelScope
🔗 GitHub Repo
#هوش_مصنوعی #پژوهش #عامل_هوشمند #داده_مصنوعی #Tongyi
@rss_ai_ir
📊 نتایج کلیدی:
آزمون Humanity’s Last Exam (HLE):
✅ دقت ۳۲.۹٪ در وظایف استدلال علمی
BrowseComp:
✅ دقت ۴۳.۴٪ در پژوهشهای وب پیچیده
✅نسخه چینی: دقت ۴۶.۷٪
xbench-DeepSearch:
✅دقت ۷۵٪ در وظایف جستجوی کاربری
🔎 این پیشرفت هزینهها را کاهش میدهد، دسترسی را افزایش میدهد و مسیرهای تازهای از علم و حقوق تا ناوبری باز میکند.
🔗 Blog
🔗 Model HuggingFace
🔗 Model ModelScope
🔗 GitHub Repo
#هوش_مصنوعی #پژوهش #عامل_هوشمند #داده_مصنوعی #Tongyi
@rss_ai_ir
🥰13👏13😁11🎉9👍8❤5🔥4
🚨 دوربینهای هوش مصنوعی و جراحی بدون دستیار
🔍 در شیلی، جراحان با کمک دوربین هدایتشده توسط هوش مصنوعی (بخشی از ربات MARS) برای اولینبار توانستند عمل برداشت کیسه صفرا را کاملاً بهتنهایی انجام دهند — بدون نیاز به دستیار انسانی.
✨ نکات مهم:
✅ترکیب ابزارهای جراحی مغناطیسی با نرمافزار هوشمند که زاویهها و دید را بهصورت پویا تنظیم میکند.
✅این اولینبار است که چنین عملی روی بیمار واقعی (نه فقط حیوانات یا شبیهسازیها) انجام شده.
✅پروژه بخشی از تلاشهای جهانی است؛ مثلاً دانشگاه جانز هاپکینز پیشتر روی خوکها جراحیهای پیچیده با سیستمهای مشابه انجام داده بود.
✅بازار رباتهای جراحی در حال رشد عظیم است: ۱۵.۶ میلیارد دلار در ۲۰۲۴ → پیشبینی رشد تا ۶۴.۴ میلیارد دلار در ۲۰۳۴.
⚡️ این یعنی ورود ملموستر هوش مصنوعی به دنیای اتوماسیون جراحی؛ اما پرسش کلیدی باقی میماند: آیا این سیستمها میتوانند در شرایط متنوع و پرخطر عملکرد قابلاعتمادی داشته باشند؟ و موانع قانونی، ایمنی و پذیرش تا چه حد سریع رفع خواهند شد؟
@rss_ai_ir
#هوش_مصنوعی #رباتیک #پزشکی #اتوماسیون #جراحی #AI #HealthTech
🔍 در شیلی، جراحان با کمک دوربین هدایتشده توسط هوش مصنوعی (بخشی از ربات MARS) برای اولینبار توانستند عمل برداشت کیسه صفرا را کاملاً بهتنهایی انجام دهند — بدون نیاز به دستیار انسانی.
✨ نکات مهم:
✅ترکیب ابزارهای جراحی مغناطیسی با نرمافزار هوشمند که زاویهها و دید را بهصورت پویا تنظیم میکند.
✅این اولینبار است که چنین عملی روی بیمار واقعی (نه فقط حیوانات یا شبیهسازیها) انجام شده.
✅پروژه بخشی از تلاشهای جهانی است؛ مثلاً دانشگاه جانز هاپکینز پیشتر روی خوکها جراحیهای پیچیده با سیستمهای مشابه انجام داده بود.
✅بازار رباتهای جراحی در حال رشد عظیم است: ۱۵.۶ میلیارد دلار در ۲۰۲۴ → پیشبینی رشد تا ۶۴.۴ میلیارد دلار در ۲۰۳۴.
⚡️ این یعنی ورود ملموستر هوش مصنوعی به دنیای اتوماسیون جراحی؛ اما پرسش کلیدی باقی میماند: آیا این سیستمها میتوانند در شرایط متنوع و پرخطر عملکرد قابلاعتمادی داشته باشند؟ و موانع قانونی، ایمنی و پذیرش تا چه حد سریع رفع خواهند شد؟
@rss_ai_ir
#هوش_مصنوعی #رباتیک #پزشکی #اتوماسیون #جراحی #AI #HealthTech
❤19👏18😁16🥰13🔥11👍9🎉7
💳 گوگل پروتکل جدید پرداخت عاملها (AP2) را معرفی کرد
گوگل چارچوبی جهانی به نام AP2 عرضه کرده که به عاملهای هوش مصنوعی اجازه میدهد پرداختها را بهصورت امن بین فروشندگان و پلتفرمها انجام دهند.
🔹 دستورهای دیجیتال: هر مرحله شفاف و رسمی است — از Intent Mandate («برایم کفش نایکی سفید پیدا کن») تا Cart Mandate («الان بخر»). این یعنی وضوح کامل در نیت، تأیید و قیمت.
🔹 عامل بهعنوان وکیل دیجیتال: عامل تنها نقش نماینده شما را دارد، اما معامله بهطور قانونی بین شما و فروشنده ثبت میشود.
🔹 حمایت صنعتی گسترده: بیش از ۶۰ شریک بزرگ از جمله Mastercard، PayPal، Intuit و Salesforce از این طرح پشتیبانی میکنند.
⚡️ اگر AP2 بهطور گسترده پذیرفته شود، میتواند به ستون فقرات حقوقی و فنی اقتصاد پرداختهای ماشینی تبدیل شود.
@rss_ai_ir
#هوش_مصنوعی #پرداخت_دیجیتال #گوگل #فینتک #AI #پرداخت_ماشینی
گوگل چارچوبی جهانی به نام AP2 عرضه کرده که به عاملهای هوش مصنوعی اجازه میدهد پرداختها را بهصورت امن بین فروشندگان و پلتفرمها انجام دهند.
🔹 دستورهای دیجیتال: هر مرحله شفاف و رسمی است — از Intent Mandate («برایم کفش نایکی سفید پیدا کن») تا Cart Mandate («الان بخر»). این یعنی وضوح کامل در نیت، تأیید و قیمت.
🔹 عامل بهعنوان وکیل دیجیتال: عامل تنها نقش نماینده شما را دارد، اما معامله بهطور قانونی بین شما و فروشنده ثبت میشود.
🔹 حمایت صنعتی گسترده: بیش از ۶۰ شریک بزرگ از جمله Mastercard، PayPal، Intuit و Salesforce از این طرح پشتیبانی میکنند.
⚡️ اگر AP2 بهطور گسترده پذیرفته شود، میتواند به ستون فقرات حقوقی و فنی اقتصاد پرداختهای ماشینی تبدیل شود.
@rss_ai_ir
#هوش_مصنوعی #پرداخت_دیجیتال #گوگل #فینتک #AI #پرداخت_ماشینی
👏21🔥14😁14🎉14❤12🥰11👍10
This media is not supported in your browser
VIEW IN TELEGRAM
🍕 Superpixel Anything (SOTA) —
مدل سوپراپیکسل همهکاره 🍕
🔹 SuperPixel Anything Model (SPAM)
یک فریمورک انعطافپذیر برای سگمنتیشن تصاویر است. این مدل ترکیبی از استخراج ویژگیهای تصویری برای تولید سوپراپیکسل و یک مدل از پیشآموزشدیده در مقیاس بزرگ است که امکان سگمنتیشن بدون وابستگی به معنا (semantic-agnostic) را فراهم میکند. نتیجه: سوپراپیکسلهایی که بهطور دقیق با ماسکها منطبق میشوند.
📌 ویژگیها:
♻️تولید سوپراپیکسلهای سازگار با ساختار تصویر
♻️قابلیت استفاده در کاربردهای مختلف بینایی ماشین
♻️دیتاست و ریپوی متنباز برای پژوهشگران
👉 مقاله: arxiv.org/pdf/2509.12791
👉 کد: github.com/waldo-j/spam
@rss_ai_ir
#هوش_مصنوعی #بینایی_ماشین #Superpixel #Segmentation #AI #SOTA
مدل سوپراپیکسل همهکاره 🍕
🔹 SuperPixel Anything Model (SPAM)
یک فریمورک انعطافپذیر برای سگمنتیشن تصاویر است. این مدل ترکیبی از استخراج ویژگیهای تصویری برای تولید سوپراپیکسل و یک مدل از پیشآموزشدیده در مقیاس بزرگ است که امکان سگمنتیشن بدون وابستگی به معنا (semantic-agnostic) را فراهم میکند. نتیجه: سوپراپیکسلهایی که بهطور دقیق با ماسکها منطبق میشوند.
📌 ویژگیها:
♻️تولید سوپراپیکسلهای سازگار با ساختار تصویر
♻️قابلیت استفاده در کاربردهای مختلف بینایی ماشین
♻️دیتاست و ریپوی متنباز برای پژوهشگران
👉 مقاله: arxiv.org/pdf/2509.12791
👉 کد: github.com/waldo-j/spam
@rss_ai_ir
#هوش_مصنوعی #بینایی_ماشین #Superpixel #Segmentation #AI #SOTA
🥰17😁16👏15🔥13🎉13❤11👍9
🚀 Claude Code + Figma MCP Server
⛔️حالا دیزاینهای Figma را میتوان مستقیم به کد تبدیل کرد! با ادغام جدید Claude Code و Figma MCP Server، توسعهدهندگان میتوانند از طریق ترمینال، طرحها را به کامپوننتهای آماده تبدیل کنند.
⚙️ نحوه کار:
❌فعالسازی MCP سرور در اپ دسکتاپ Figma
❌اتصال به Claude Code تنها با یک دستور ساده
⚠️ اما محدودیتها:
♻️نمیتواند کد موجود را آپدیت کند
♻️در فلوهای چندفریمی مشکل دارد
♻️امکان بهبود بصری (Visual Refinement) ندارد
♻️فقط در دسترس توسعهدهندگان است، نه طراحان
💡 در مقاله همچنین اشاره شده که Fusion از Builder.io جایگزین قویتری است، چون قابلیتهای بیشتری دارد:
✅ادیت بصری
✅آپدیت دقیق و جزئی روی کد
✅حتی امکان انتشار مستقیم کد در محیط پروداکشن توسط افراد غیرتوسعهدهنده
✅این ادغام بیشتر یک قدم رو به جلو است، اما هنوز فاصله زیادی با ابزارهای کاملتر دارد.
@rss_ai_ir
#Claude #Figma #MCP #AI #طراحی #کدنویسی #هوش_مصنوعی #Productivity
⛔️حالا دیزاینهای Figma را میتوان مستقیم به کد تبدیل کرد! با ادغام جدید Claude Code و Figma MCP Server، توسعهدهندگان میتوانند از طریق ترمینال، طرحها را به کامپوننتهای آماده تبدیل کنند.
⚙️ نحوه کار:
❌فعالسازی MCP سرور در اپ دسکتاپ Figma
❌اتصال به Claude Code تنها با یک دستور ساده
⚠️ اما محدودیتها:
♻️نمیتواند کد موجود را آپدیت کند
♻️در فلوهای چندفریمی مشکل دارد
♻️امکان بهبود بصری (Visual Refinement) ندارد
♻️فقط در دسترس توسعهدهندگان است، نه طراحان
💡 در مقاله همچنین اشاره شده که Fusion از Builder.io جایگزین قویتری است، چون قابلیتهای بیشتری دارد:
✅ادیت بصری
✅آپدیت دقیق و جزئی روی کد
✅حتی امکان انتشار مستقیم کد در محیط پروداکشن توسط افراد غیرتوسعهدهنده
✅این ادغام بیشتر یک قدم رو به جلو است، اما هنوز فاصله زیادی با ابزارهای کاملتر دارد.
@rss_ai_ir
#Claude #Figma #MCP #AI #طراحی #کدنویسی #هوش_مصنوعی #Productivity
🥰20👍17😁14❤12🔥12🎉10👏6
🚨 شکستن تاریخ توسط OpenAI در مسابقات جهانی برنامهنویسی ICPC!
در فینال مسابقات جهانی برنامهنویسی ICPC، سیستم استدلالی (Reasoning) اوپناِیآی مقام اول مطلق را کسب کرد و توانست هر ۱۲ مسئله از ۱۲ مسئله را حل کند.
⚡️ نکات مهم:
در تاریخ این رقابتها، هیچ تیم انسانی تا امروز به چنین نتیجهای نرسیده بود.
همهچیز کاملاً مطابق قوانین بود: ۵ ساعت زمان، همان قالب استاندارد مسائل و پاسخها، بدون دخالت انسان.
۱۱ مسئله با اولین ارسال حل شدند، و برای مسئله دوازدهم ۹ بار ارسال انجام شد.
این یک مجموعه از مدلها (Ensemble) بود، نه مدلی که صرفاً برای ICPC آموزش دیده باشد. همین مدلها قبلاً در IMO و IOI هم شرکت کرده بودند.
🥇 مقام دوم (و اول بین انسانها) به تیم دانشجویان دانشگاه دولتی سنپترزبورگ رسید؛ آنها ۱۱ مسئله را حل کردند و آخرین پاسخ را فقط ۲ دقیقه مانده به پایان ارسال کردند.
🥇 مدل گوگل هم توانست ۱۰ مسئله از ۱۲ را حل کند و مدال طلا بگیرد.
📌 نتیجه: برای اولین بار در تاریخ، هوش مصنوعی نهتنها به پای انسانها در ICPC رسید، بلکه کاری کرد که هیچ انسانی تاکنون نتوانسته بود انجام دهد.
@rss_ai_ir
#هوش_مصنوعی #OpenAI #ICPC #مسابقه #برنامه_نویسی #شبکه_عصبی #آینده
در فینال مسابقات جهانی برنامهنویسی ICPC، سیستم استدلالی (Reasoning) اوپناِیآی مقام اول مطلق را کسب کرد و توانست هر ۱۲ مسئله از ۱۲ مسئله را حل کند.
⚡️ نکات مهم:
در تاریخ این رقابتها، هیچ تیم انسانی تا امروز به چنین نتیجهای نرسیده بود.
همهچیز کاملاً مطابق قوانین بود: ۵ ساعت زمان، همان قالب استاندارد مسائل و پاسخها، بدون دخالت انسان.
۱۱ مسئله با اولین ارسال حل شدند، و برای مسئله دوازدهم ۹ بار ارسال انجام شد.
این یک مجموعه از مدلها (Ensemble) بود، نه مدلی که صرفاً برای ICPC آموزش دیده باشد. همین مدلها قبلاً در IMO و IOI هم شرکت کرده بودند.
🥇 مقام دوم (و اول بین انسانها) به تیم دانشجویان دانشگاه دولتی سنپترزبورگ رسید؛ آنها ۱۱ مسئله را حل کردند و آخرین پاسخ را فقط ۲ دقیقه مانده به پایان ارسال کردند.
🥇 مدل گوگل هم توانست ۱۰ مسئله از ۱۲ را حل کند و مدال طلا بگیرد.
📌 نتیجه: برای اولین بار در تاریخ، هوش مصنوعی نهتنها به پای انسانها در ICPC رسید، بلکه کاری کرد که هیچ انسانی تاکنون نتوانسته بود انجام دهد.
@rss_ai_ir
#هوش_مصنوعی #OpenAI #ICPC #مسابقه #برنامه_نویسی #شبکه_عصبی #آینده
❤12😁11🎉11👏8👍7🔥7🥰6
✴️ متا اولین مقاله خودش رو از لَبِ Superintelligence منتشر کرد:
📌 عنوان: REFRAG: Rethinking RAG based Decoding
هدف: افزایش سرعت RAG تا ۳۳ برابر بدون افت کیفیت! 🚀
🔎 ماجرا از کجاست؟
توی RAG اول یه retriever تیکههای مرتبط متن (چانکها) رو پیدا میکنه، بعد همهی اونها به LLM داده میشه. مشکل اینجاست که مدل فقط از بخشی از این چانکها استفاده میکنه ولی ما هزینه پردازش همهشونو میدیم → مصرف منابع بالا + تأخیر زیاد.
🟢 راهکار REFRAG:
به جای توکنها، امبدینگ فشردهی چانکها مستقیماً وارد دیکودر میشن.
➕ کوتاه شدن ورودی مدل
➕ کاهش حجم KV-cache
➕ 6–7 برابر افزایش throughput
➕ باز شدن selective بعضی چانکها برای حفظ جزئیات
⚠️ چالش: آموزش این روش پیچیدهتره و برای کانتکستهای کوچیک بهصرفه نیست.
📊 اما نتیجه مهم: Time To First Token تا ۳۳ برابر سریعتر و امکان گسترش پنجرهی کانتکست به مقیاس خیلی بزرگ.
📄 مقاله کامل: arxiv.org/pdf/2509.01092
@rss_ai_ir
---
#REFRAG #RAG #Meta #AI #LLM #NeuralNetworks
📌 عنوان: REFRAG: Rethinking RAG based Decoding
هدف: افزایش سرعت RAG تا ۳۳ برابر بدون افت کیفیت! 🚀
🔎 ماجرا از کجاست؟
توی RAG اول یه retriever تیکههای مرتبط متن (چانکها) رو پیدا میکنه، بعد همهی اونها به LLM داده میشه. مشکل اینجاست که مدل فقط از بخشی از این چانکها استفاده میکنه ولی ما هزینه پردازش همهشونو میدیم → مصرف منابع بالا + تأخیر زیاد.
🟢 راهکار REFRAG:
به جای توکنها، امبدینگ فشردهی چانکها مستقیماً وارد دیکودر میشن.
➕ کوتاه شدن ورودی مدل
➕ کاهش حجم KV-cache
➕ 6–7 برابر افزایش throughput
➕ باز شدن selective بعضی چانکها برای حفظ جزئیات
⚠️ چالش: آموزش این روش پیچیدهتره و برای کانتکستهای کوچیک بهصرفه نیست.
📊 اما نتیجه مهم: Time To First Token تا ۳۳ برابر سریعتر و امکان گسترش پنجرهی کانتکست به مقیاس خیلی بزرگ.
📄 مقاله کامل: arxiv.org/pdf/2509.01092
@rss_ai_ir
---
#REFRAG #RAG #Meta #AI #LLM #NeuralNetworks
👍15🔥10👏10❤8🥰8😁8🎉7
⚡️ Ling-flash-2.0 منتشر شد! ⚡️
⛔️مدلی با ۱۰۰ میلیارد پارامتر اما فقط با حدود ۶.۱ میلیارد پارامتر فعال، که آن را فوقالعاده کمهزینه و سریع در پردازش میکند.
🚀 ویژگیهای کلیدی Ling-flash-2.0
♻️آموزشدیده روی ۲۰ تریلیون توکن همراه با مراحل pre-training و RL.
♻️بهترین عملکرد در بین مدلهای متراکم تا ۴۰B پارامتر.
♻️بسیار قوی در استدلال پیچیده، تولید کد و تسکهای فرانتاند.
⚙️ جزئیات معماری و کارایی
✅معماری MoE با نسبت فعالسازی ۱/۳۲.
تکنیکهای پیشرفته مثل توزیع هوشمند متخصصان، تعادل توجه، و مسیریابی بدون زیان کمکی.
✅روی سختافزار H20 سرعت تولید ۲۰۰+ توکن در ثانیه (۳ برابر سریعتر از مدل متراکم 36B).
✅پشتیبانی از کانتکستهای ۱۲۸K با استفاده از YaRN.
📎 جزئیات بیشتر:
🔗 Hugging Face
@rss_ai_ir
#MoE #مدل_زبان #یادگیری_ماشین #هوش_مصنوعی #OpenSource
⛔️مدلی با ۱۰۰ میلیارد پارامتر اما فقط با حدود ۶.۱ میلیارد پارامتر فعال، که آن را فوقالعاده کمهزینه و سریع در پردازش میکند.
🚀 ویژگیهای کلیدی Ling-flash-2.0
♻️آموزشدیده روی ۲۰ تریلیون توکن همراه با مراحل pre-training و RL.
♻️بهترین عملکرد در بین مدلهای متراکم تا ۴۰B پارامتر.
♻️بسیار قوی در استدلال پیچیده، تولید کد و تسکهای فرانتاند.
⚙️ جزئیات معماری و کارایی
✅معماری MoE با نسبت فعالسازی ۱/۳۲.
تکنیکهای پیشرفته مثل توزیع هوشمند متخصصان، تعادل توجه، و مسیریابی بدون زیان کمکی.
✅روی سختافزار H20 سرعت تولید ۲۰۰+ توکن در ثانیه (۳ برابر سریعتر از مدل متراکم 36B).
✅پشتیبانی از کانتکستهای ۱۲۸K با استفاده از YaRN.
📎 جزئیات بیشتر:
🔗 Hugging Face
@rss_ai_ir
#MoE #مدل_زبان #یادگیری_ماشین #هوش_مصنوعی #OpenSource
🎉28😁20❤19👍16🥰15👏14🔥11
🔍 چطور کدنویسی در یک شرکت FAANG انجام میشود (با کمک AI)
یک مهندس نرمافزار با بیش از ۱۰ سال تجربه (نیمی در FAANG) توضیح داده که AI کدنویسی کمکی فقط برای دمو یا یادگیری نیست، بلکه واقعاً در تولید کد استفاده میشود.
مراحل:
1️⃣ همیشه با یک مدرک طراحی فنی (Technical Design Doc) شروع میشود. اینجا معماری، تعاملات با تیمهای دیگر و جزئیات سیستم مشخص میشود.
2️⃣ طراحی باید توسط Senior Engineers بررسی و نقد شود.
3️⃣ اگر تأیید شد، تیمها وارد مستندسازی و توسعه میشوند.
4️⃣ در Backlog و Sprint Planning، وظایف به بخشهای کوچک تقسیم میشوند.
5️⃣ در کدنویسی اصلی، AI نقش پررنگ دارد: با Test Driven Development، ابتدا AI تستها را مینویسد، سپس توسعهدهنده فیچر را میسازد.
6️⃣ در Code Review، یک پروسه دو مرحلهای وجود دارد؛ AI هم در این مرحله کمک میکند.
7️⃣ اگر همه چیز در Staging درست بود، به Production میرود.
📈 نتیجه: حدود ۳۰٪ افزایش سرعت از زمان پیشنهاد فیچر تا رسیدن به محیط عملیاتی.
📌 نکته مهم: همیشه با طراحی و معماری شروع کنید، در گامهای کوچک جلو بروید، و تستها را از همان ابتدا بنویسید.
@rss_ai_ir
#FAANG #AI #کدنویسی #نرمافزار #هوش_مصنوعی #مهندسی_نرمافزار #TestDrivenDevelopment
یک مهندس نرمافزار با بیش از ۱۰ سال تجربه (نیمی در FAANG) توضیح داده که AI کدنویسی کمکی فقط برای دمو یا یادگیری نیست، بلکه واقعاً در تولید کد استفاده میشود.
مراحل:
1️⃣ همیشه با یک مدرک طراحی فنی (Technical Design Doc) شروع میشود. اینجا معماری، تعاملات با تیمهای دیگر و جزئیات سیستم مشخص میشود.
2️⃣ طراحی باید توسط Senior Engineers بررسی و نقد شود.
3️⃣ اگر تأیید شد، تیمها وارد مستندسازی و توسعه میشوند.
4️⃣ در Backlog و Sprint Planning، وظایف به بخشهای کوچک تقسیم میشوند.
5️⃣ در کدنویسی اصلی، AI نقش پررنگ دارد: با Test Driven Development، ابتدا AI تستها را مینویسد، سپس توسعهدهنده فیچر را میسازد.
6️⃣ در Code Review، یک پروسه دو مرحلهای وجود دارد؛ AI هم در این مرحله کمک میکند.
7️⃣ اگر همه چیز در Staging درست بود، به Production میرود.
📈 نتیجه: حدود ۳۰٪ افزایش سرعت از زمان پیشنهاد فیچر تا رسیدن به محیط عملیاتی.
📌 نکته مهم: همیشه با طراحی و معماری شروع کنید، در گامهای کوچک جلو بروید، و تستها را از همان ابتدا بنویسید.
@rss_ai_ir
#FAANG #AI #کدنویسی #نرمافزار #هوش_مصنوعی #مهندسی_نرمافزار #TestDrivenDevelopment
❤12😁12👍10👏10🎉8🔥7🥰7
🧰 پژوهش مایکروسافت روی MCP و مشکل «تداخل فضای ابزار»
محققان مایکروسافت بررسی کردند که وقتی تعداد ابزارها در Model Context Protocol (MCP) زیاد میشود، عاملها (Agents) بهجای همکاری، مزاحم یکدیگر میشوند. این پدیده را Tool-Space Interference نامیدند.
🔎 نشانهها:
✳️منوهای شلوغ با ابزارهای بیش از حد
✳️خروجیهای بسیار حجیم (صدها هزار توکن)
✳️پارامترهای تو در تو و گیجکننده
✳️نامهای تکراری برای ابزارها
✳️خطاهای مبهم و غیر استاندارد
📉 نتایج پژوهش:
♻️بعضی سرورها تا ۲۵۶ ابزار پیشنهاد میدادند (حد بهینه < ۲۰). در این حالت دقت تا ۸۵٪ افت میکرد.
♻️یک ابزار بهطور متوسط ۵۵۷هزار توکن خروجی میداد، ۱۶ ابزار دیگر بالای ۱۲۸هزار توکن! این باعث شکست مدل و افت دقت تا ۹۱٪ شد.
♻️پارامترهای ۲۰ لایهای باعث سردرگمی میشدند. با سادهسازی (flattening) موفقیت ۴۷٪ بیشتر شد.
♻️۷۷۵ نام تکراری در ابزارها شناسایی شد؛ واژه «search» در ۳۲ سرور تکرار شده بود.
⛔️ راهکارهای پیشنهادی مایکروسافت:
✅گروهبندی ابزارها در دستههای کوچکتر
✅کش کردن (cache) طرحها و دادهها
✅استفاده از namespace برای نامگذاری یکتا
✅محدود کردن حجم خروجی و سادهسازی پارامترها
✅استانداردسازی خطاها و مدیریت منابع
📊 نکته جالب: استفاده هوشمندانه از namespace سرعت اجرای وظایف را تا ۴۰٪ افزایش داد.
📌 نتیجه: هرچه تعداد ابزار کمتر، پارامترها سادهتر و خروجیها ساختارمندتر باشد، عاملها بهجای سردرگمی، شروع به همکاری مؤثر میکنند.
@rss_ai_ir
Link
#Microsoft #MCP #AI #Agents #هوش_مصنوعی #ابزار #مهندسی_سیستم
محققان مایکروسافت بررسی کردند که وقتی تعداد ابزارها در Model Context Protocol (MCP) زیاد میشود، عاملها (Agents) بهجای همکاری، مزاحم یکدیگر میشوند. این پدیده را Tool-Space Interference نامیدند.
🔎 نشانهها:
✳️منوهای شلوغ با ابزارهای بیش از حد
✳️خروجیهای بسیار حجیم (صدها هزار توکن)
✳️پارامترهای تو در تو و گیجکننده
✳️نامهای تکراری برای ابزارها
✳️خطاهای مبهم و غیر استاندارد
📉 نتایج پژوهش:
♻️بعضی سرورها تا ۲۵۶ ابزار پیشنهاد میدادند (حد بهینه < ۲۰). در این حالت دقت تا ۸۵٪ افت میکرد.
♻️یک ابزار بهطور متوسط ۵۵۷هزار توکن خروجی میداد، ۱۶ ابزار دیگر بالای ۱۲۸هزار توکن! این باعث شکست مدل و افت دقت تا ۹۱٪ شد.
♻️پارامترهای ۲۰ لایهای باعث سردرگمی میشدند. با سادهسازی (flattening) موفقیت ۴۷٪ بیشتر شد.
♻️۷۷۵ نام تکراری در ابزارها شناسایی شد؛ واژه «search» در ۳۲ سرور تکرار شده بود.
⛔️ راهکارهای پیشنهادی مایکروسافت:
✅گروهبندی ابزارها در دستههای کوچکتر
✅کش کردن (cache) طرحها و دادهها
✅استفاده از namespace برای نامگذاری یکتا
✅محدود کردن حجم خروجی و سادهسازی پارامترها
✅استانداردسازی خطاها و مدیریت منابع
📊 نکته جالب: استفاده هوشمندانه از namespace سرعت اجرای وظایف را تا ۴۰٪ افزایش داد.
📌 نتیجه: هرچه تعداد ابزار کمتر، پارامترها سادهتر و خروجیها ساختارمندتر باشد، عاملها بهجای سردرگمی، شروع به همکاری مؤثر میکنند.
@rss_ai_ir
Link
#Microsoft #MCP #AI #Agents #هوش_مصنوعی #ابزار #مهندسی_سیستم
👍13🥰11😁11🔥10👏9❤7🎉7
❌♻️خب دیگه، همهاش بحث المپیاد و مسابقه نباشه
⛔️😁 این بار اوپناِیآی فقط در عرض یک ماه به GPT-5-Thinking قابلیتی اضافه کرده که کاربر بتونه مدت زمان تفکر مدل رو خودش انتخاب کنه؛ یعنی مشخص کنه که مدل برای هر سؤال چقدر عمیق و طولانی فکر کنه.
✨ این دقیقاً همون چیزیه که میشه اسمش رو گذاشت انقلاب واقعی در دنیای هوش مصنوعی!
@rss_ai_ir
#هوش_مصنوعی #OpenAI #GPT5 #تفکر #نوآوری
⛔️😁 این بار اوپناِیآی فقط در عرض یک ماه به GPT-5-Thinking قابلیتی اضافه کرده که کاربر بتونه مدت زمان تفکر مدل رو خودش انتخاب کنه؛ یعنی مشخص کنه که مدل برای هر سؤال چقدر عمیق و طولانی فکر کنه.
✨ این دقیقاً همون چیزیه که میشه اسمش رو گذاشت انقلاب واقعی در دنیای هوش مصنوعی!
@rss_ai_ir
#هوش_مصنوعی #OpenAI #GPT5 #تفکر #نوآوری
❤15🔥12🥰11👏9👍7😁6🎉6👌2
This media is not supported in your browser
VIEW IN TELEGRAM
😳 ارتش چین با همکاری دانشگاه چونگچینگ پروژهای عجیب اجرا کرده: سگهای رباتیکی را به پرتابگر موشک مجهز کردهاند.
🔹 در رزمایش اخیر، این رباتها تمام اهداف را با موفقیت مورد اصابت قرار دادند و رسانهها از آن به عنوان یک «موفقیت کامل» یاد کردند.
🔹 چنین فناوریهایی بحثهای جدی درباره امنیت، اخلاق و آینده جنگها به وجود آورده است.
به قول بعضیها: «روز رستاخیز داره نزدیک میشه...»
@rss_ai_ir
#ربات #ارتش #چین #هوش_مصنوعی #روباتیک
🔹 در رزمایش اخیر، این رباتها تمام اهداف را با موفقیت مورد اصابت قرار دادند و رسانهها از آن به عنوان یک «موفقیت کامل» یاد کردند.
🔹 چنین فناوریهایی بحثهای جدی درباره امنیت، اخلاق و آینده جنگها به وجود آورده است.
به قول بعضیها: «روز رستاخیز داره نزدیک میشه...»
@rss_ai_ir
#ربات #ارتش #چین #هوش_مصنوعی #روباتیک
👏12❤10👍10😁10🔥9🎉9🥰8😱1🌚1