VIRSUN
11.5K subscribers
1.2K photos
712 videos
5 files
786 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🤖🇨🇳 رکورد جهانی تازه برای ربات‌های پیاده‌رو

ربات تازه‌نفس ساخت چین توانست رکورد جهانی طولانی‌ترین مسیر پیموده‌شده بدون توقف را جابه‌جا کند:
بیش از ۱۰۶ کیلومتر پیاده‌روی مداوم بدون خرابی، توقف یا نیاز به مداخله انسان. 🔥🚶‍♂️🤖

این رکورد جدید نشان می‌دهد صنعت رباتیک چین با سرعتی بی‌سابقه در حال نزدیک‌شدن به استانداردهای انسانی در پایداری، مصرف انرژی و استقامت فیزیکی است.
برای شرکت‌هایی که روی ربات‌های انسان‌نما، تحویل خودکار، بازرسی صنعتی یا عملیات‌های طولانی کار می‌کنند، این پیشرفت یک نقطه‌عطف جدی محسوب می‌شود.

@rss_ai_ir
#رباتیک #هوش_مصنوعی #چین #Robot #AI #Innovation
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🦞 استفاده از تنها یک تصویر مصنوعی برای هر کلاس 🦞

پژوهشگران MIT روشی تازه به نام Linear Gradient Matching معرفی کرده‌اند؛ روشی نوآورانه برای دیتاست دیستیلیشن که اجازه می‌دهد تنها با یک تصویر مصنوعی برای هر کلاس، بتوان یک دسته‌بند خطی را آموزش داد — و حتی فراتر از آن!

این تکنیک، ساختار گرادیان‌ها را بازسازی می‌کند تا مدل بدون نیاز به مجموعه‌دادهٔ حجیم، رفتار همان دیتاست واقعی را تقلید کند.
نتیجه: کاهش شدید هزینهٔ داده‌سازی و سرعت بسیار بالاتر در آموزش مدل‌ها.

📌 لینک‌ها:

👉 مقاله:
arxiv.org/pdf/2511.16674
👉 پروژه:
linear-gradient-matching.github.io
👉 مخزن کد:
github.com/GeorgeCazenavette/linear-gradient-matching

@rss_ai_ir
#هوش_مصنوعی #دانشگاهی #دیپ‌لرنینگ #DataDistillation #AI 🧠
🔥1🙏1👌1
🔥 مقایسه Gemini 3.0 با رادیولوژیست‌ها؛ نتایج RadLE منتشر شد

دیروز نسخهٔ جدید Gemini 3.0 موج بزرگی در فضای هوش مصنوعی ایجاد کرد و بلافاصله این سؤال مطرح شد که:
«آیا این مدل می‌تواند از پس استدلال تصویری واقعیِ پزشکی بربیاید؟»

برای پاسخ، سخت‌ترین معیار موجود انتخاب شد: RadLE v1.

📊 نتایج تست Gemini 3.0 Pro روی RadLE v1

دقت ۵۱٪ — نخستین بار که یک مدل عمومی موفق شده عملکردش از رزیدنت‌های رادیولوژی بهتر باشد

رزیدنت‌های رادیولوژی: ۴۵٪

رادیولوژیست‌های هیئت‌مدارک‌دار: ۸۳٪

مدل به‌صورت پایدار استدلال مرحله‌به‌مرحله ارائه می‌کند؛ از تشخیص ضایعات ظریف تا پیدا کردن آپاندیس و حذف موارد مشابه


برای اولین بار در تاریخ، یک مدل عمومی هوش مصنوعی توانسته از «سطح کارآموزی» در سخت‌ترین بنچمارک رادیولوژی عبور کند.

@rss_ai_ir
#پزشکی #رادیولوژی #هوش_مصنوعی #Gemini #AI
2👏21🎉1
👈 نیمی از ثروت کره زمین در دستان این جمع است.
سازندگان آینده

@rss_ai_ir
👍3👌3👎1🕊1🗿1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 ربات AlohaMini؛ انقلاب ششصد دلاری در ربات‌های خانگی و Embodied-AI

دنیای رباتیک یک قدم دیگر به خانه‌های ما نزدیک‌تر شد. AlohaMini معرفی شده؛ رباتی دو‌دستی، موبایل و کاملاً قابل چاپ با پرینتر سه‌بعدی — با هزینه‌ای حدود ۶۰۰ دلار و امکان مونتاژ در حدود یک ساعت.

این ربات مخصوص علاقه‌مندان، پژوهشگران و توسعه‌دهندگانی است که می‌خواهند بدون هزینه‌های سنگین، روی هوش تجسم‌یافته (Embodied AI) و کارهای واقعی مانپولیشن آزمایش کنند.

ویژگی‌ها ◼️ دو بازوی رباتیک کامل
◼️ شاسی متحرک با قابلیت جابه‌جایی
◼️ سازه موتوردار با ارتفاع قابل تنظیم تا حدود ۶۰ سانتی‌متر
◼️ کاملاً متن‌باز و سازگار با LeRobot برای شروع سریع برنامه‌نویسی
◼️ دو نسخه:
 • Mini (کاملاً چاپ سه‌بعدی)
 • Pro (ترکیب مواد مقاوم‌تر)

🟢 این پروژه عملاً democratization رباتیک است — یعنی هر کسی، حتی در خانه، می‌تواند یک پلتفرم واقعی برای تمرین کنترل ربات، آموزش مدل‌های RL، Teleoperation و حتی یادگیری ادراکی بسازد.

📎 سورس کامل، فایل‌های چاپ، مونتاژ و کدها:
https://github.com/liyiteng/AlohaMini

@rss_ai_ir
#رباتیک 🤖 #هوش_مصنوعی #EmbodiedAI #AlohaMini #۳Dپرینت #DIY
1👍1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🌬️ تحریک بویایی با اولتراسوند؛ فعال‌سازی بوها بدون منبع واقعی!

پژوهشگران به دستاوردی خیره‌کننده رسیده‌اند: ایجاد حس بو فقط با تحریک نورون‌ها به کمک امواج اولتراسوند — بدون هیچ منبع بوی واقعی.

💠 آن‌ها یک هدست تخصصی ساخته‌اند که بخش‌های مختلف مرتبط با بویایی در مغز را هدف قرار می‌دهد.
💠 افراد با این دستگاه توانسته‌اند بوهایی مثل هوای تازه، دود آتش و حتی زباله را حس کنند — فقط با تحریک مغزی، نه با بوهای واقعی.

🔮 اگر این فناوری به هدست‌های واقعیت مجازی برسد، تجربه فیلم، بازی و شبیه‌سازی‌ها متحول می‌شود. تصور کنید
احساس بوی جنگل، دریا یا یک صحنه سینمایی… فقط با یک هدست!

@rss_ai_ir
#فناوری 🚀 #عصب_مهندسی #VR #بویایی #اولتراسوند
🤯2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🦊 نئورومحبت؛ نیکلای دروزدوف در نقش دوست تمام موجودات!

تصویری که مرز میان واقعیت و خیال را محو می‌کند؛
نیکلای دروزدوف، همان چهره محبوب دنیای حیات‌وحش، این‌بار در قالبی تازه و فوق‌دوستانه کنار همهٔ موجودات ایستاده است — نتیجهٔ ترکیب خلاقانه Nano Banana Pro و Kling 2.5.

از آن جنس تصاویری که لبخند را بی‌هزینه روی صورت می‌نشانند. 😊💚

@rss_ai_ir
#نئورومحبت 🌿 #هوش_مصنوعی #تولید_تصویر #NanoBananaPro #Kling25
2
🤟 گوگل در حال تقویت موقعیت خود؛ فاصله با OpenAI از همیشه کمتر شده است

سام آلتمن رسماً تأیید کرده که پیشرفت چشمگیر گوگل — به‌ویژه نتایج خیره‌کننده Gemini 3 — فشار کوتاه‌مدتی روی OpenAI ایجاد کرده است.

🔸 برتری یک‌طرفهٔ OpenAI دیگر مثل گذشته نیست.
گوگل و Anthropic با سرعت در حال رشدند، در حالی‌که OpenAI با هزینه‌های عظیم محاسباتی مواجه است و همین موضوع سرمایه‌گذاران را نگران کرده.

🔸 با این حال، آلتمن خوش‌بینی بلندمدت دارد.
او امید دارد مدل‌های جدید مانند Shallotpeat، پیشرفت در مراحل پیش‌‎آموزش و اتوماسیون گسترده، موج بعدی جهش‌های علمی را برای OpenAI رقم بزنند.

بخشی از نامهٔ داخلی آلتمن:

«نمی‌خواهم بدبینانه به‌نظر برسد — همچنان نتایج فوق‌العاده‌ای ارائه می‌کنیم… و انتظار دارم این روند ادامه پیدا کند.»

و جملهٔ نهایی او:

«درسته، خیلی سخت است که هم بهترین لابراتوار پژوهشی باشیم، هم بهترین شرکت زیرساختی AI و هم بهترین پلتفرم محصولی. اما این واقعیت ماست. و من موقعیت‌مان را با هیچ‌کس عوض نمی‌کنم :)»

🔗 منبع: The Information

@rss_ai_ir
#هوش_مصنوعی #Google #OpenAI #Gemini3 #AIIndustry
👍2
Media is too big
VIEW IN TELEGRAM
🤖 آیا ربات‌های انسان‌نما تبدیل به «سربازان فرابشری» می‌شوند؟

گزارش‌ها نشان می‌دهد استارتاپ رباتیک Foundation از سان‌فرانسیسکو در حال مذاکره با وزارت دفاع آمریکا است تا ربات انسان‌نمای خود، Phantom MK1، را برای کمک یا حتی جایگزینی سربازان در مأموریت‌های خطرناک به‌کار گیرد.

بر اساس اطلاعات منتشرشده، این شرکت تاکنون حدود ۱۰ میلیون دلار قرارداد دولتی دریافت کرده و قصد دارد ظرف چند ماه آینده ربات را به سطحی برساند که به‌صورت ۲۴ ساعته در میدان عمل کند.

📌 ویژگی‌های Phantom MK1

قد: ۱۷۵ سانتی‌متر

وزن: ۸۰ کیلوگرم

هشت دوربین روی سر برای بینایی محیط

توان حمل مداوم ۲۰ کیلوگرم و حمل لحظه‌ای تا ۳۶ کیلوگرم

قابلیت یادگیری مهارت‌های مرتبط با مأموریت‌های دفاعی:
• سرویس و سوخت‌رسانی هواپیماها
• باز کردن مسیرهای مسدود در میدان نبرد
• اجرای وظایف پرخطر بدون نیاز به حضور انسان


🔍 بنیان‌گذاران:
این استارتاپ توسط Sankaet Pathak (مدیرعامل سابق Synapse) و Mike LeBlanc (تفنگدار سابق نیروی دریایی آمریکا) ایجاد شده است.

⚠️ با نزدیک شدن ربات‌های انسان‌نما به کاربری نظامی، پرسش‌های مهمی درباره اخلاق، امنیت و آینده جنگ‌افزارهای خودمختار دوباره مطرح می‌شود.

@rss_ai_ir
#رباتیک ⚙️ #Humanoid #AI #دفاعی #روبات_انسان‌نما
👍1🔥1👏1
📨 گوگل تغییر مهمی در Gmail اعمال کرده است؛ از این پس «ویژگی‌های هوشمند» به‌صورت پیش‌فرض فعال هستند و این یعنی محتوای ایمیل‌های کاربران — شامل ضمیمه‌ها — می‌تواند به‌صورت ناشناس وارد سامانه‌های هوش مصنوعی گوگل شود.

🔍 طبق این تغییر، داده‌ها برای تحلیل و بهبود مدل‌های AI مورد استفاده قرار می‌گیرند، مگر این‌که کاربر خودش گزینه‌ها را غیرفعال کند.

⚙️ مسیر غیرفعال‌سازی:
Settings → Smart Features
و سپس خاموش‌کردن هر دو گزینه:
• Smart Features
• Workspace Smart Features

⚠️ نکته مهم: این اقدام پرسش‌های جدیدی درباره حریم خصوصی، مدیریت داده و شفافیت سامانه‌های هوش مصنوعی ایجاد کرده است.

@rss_ai_ir
#حریم_خصوصی 🔐 #Gmail #گوگل #هوش_مصنوعی
📘 خبر: «FrontierMath» مجموعه‌ای از سخت‌ترین مسائل ریاضیِ حال حاضر است؛ دقیقا همان جایی که مدل‌های بزرگ هوش مصنوعی مجبور می‌شوند توان واقعیِ استدلال و قدرت حل مسئلهٔ خود را نشان دهند.

📊 در تازه‌ترین نتایج، Gemini 3.0 Pro رکورد جدیدی ثبت کرده و حتی از GPT-5 نیز پیشی گرفته است. این عملکرد نشان می‌دهد موج انتظارات از نسل سوم Gemini کاملا منطقی بوده و مدل توانسته است از پسِ چالش‌های سطح Frontier به‌خوبی برآید.

🤔 حالا نگاه‌ها به سمت OpenAI است؛ باید دید پاسخ بعدی آنها در رقابت مدل‌های استدلالی چه خواهد بود و چه نسخه‌ای برای حفظ برتری ارائه می‌کنند.

@rss_ai_ir
#هوش_مصنوعی ⚡️ #ریاضیات #Gemini3 #LLM
🔥2👏1😁1
🚨 سیاست‌های جدید ChatGPT باعث شده برخی کاربران هنگام گفت‌وگوهای بیش‌ازحد «کودک‌محور» با درخواست تأیید هویت روبه‌رو شوند.
در این روند، سیستم از کاربر می‌خواهد از پاسپورت برای احراز هویت استفاده کند.

⚠️ اگر این تأیید انجام نشود، امکان تعلیق حساب ظرف دو ماه وجود دارد.
این تغییر بخشی از تلاش برای کاهش ریسک سوءاستفاده و مطابقت با قوانین بین‌المللی ایمنی کودکان است.

@rss_ai_ir
#هوش_مصنوعی #ChatGPT #امنیت_دیجیتال
4🤬1
🚀 مدل Uni-MoE-2.0-Omni؛ جهش تازه در دنیای مدل‌های اومنی‌مودال

مدلی که مرزهای چندمودالیتی را جابه‌جا کرده و وارد سطح اومنی‌مودالیتی شده است؛ یعنی فهم و تولید هم‌زمان گفتار، متن، تصویر، ویدئو و حتی تعاملات صوتی–تصویری.

نوآوری اصلی
پژوهشگران نشان داده‌اند چگونه می‌توان یک LLM معمولی را به‌صورت تکاملی به یک مدل MoE واقعی تبدیل کرد که همهٔ مدالیته‌ها را یکپارچه پردازش می‌کند.

🧠 معماری مدل
۱) Omnimodality 3D-RoPE + Dynamic-Capacity MoE
• هم‌ترازسازی گفتار، متن، تصویر و ویدئو در ابعاد زمانی–فضایی
• تخصیص پویا و هوشمند محاسبات متناسب با سختی هر وظیفه

۲) Encoder–Decoder عمیقاً ترکیب‌شده
• ورودی و خروجی‌های چندگانه در هر مدالیتی
• تعامل واقعی اومنی‌مودال بین همهٔ حالت‌ها

🛠 فرآیند آموزش
۱) مسیر پیش‌رونده:
Cross-modal alignment → Warm-up → MoE+RL → Generative training
• تبدیل LLMهای فشرده به MoE
• تنها با ۷۵ میلیارد توکن
• همگرایی پایدار، مخصوصاً در مرحله RL

۲) زبان، هستهٔ اصلی تمام وظایف
• همهٔ مدالیته‌ها به تولید زبان نگاشت می‌شوند
• سدهای بین مدالیته‌ها را حذف می‌کند

🎨 توانایی‌ها
تولید و تعامل صوتی
تولید و ویرایش تصویر
درک تصویر و ویدئو
تحلیل صوتی–تصویری
پشتیبانی از ۱۰+ وظیفهٔ چندمودال

🔥 نتایج کلیدی
در ۵۰+ مورد از ۷۶ وظیفه، بهتر از Qwen 2.5 Omni عمل کرده—درحالی‌که ۱.۲ تریلیون توکن مصرف کرده بود:
• درک ویدئو: ‌۵٪ بهتر
• فهم اومنی‌مودال: ‌۷٪ بهتر
• Speech-QA: ‌۴.۳٪ بهتر
• پردازش تصویر: ‌۷٪ بهتر

🌍 منابع متن‌باز
Model →
https://huggingface.co/collections/HIT-TMG/lychee-uni-moe-20
Code →
https://github.com/HITsz-TMG/Uni-MoE/tree/master/Uni-MoE-2
Homepage →
https://idealistxy.github.io/Uni-MoE-v2.github.io/

@rss_ai_ir
#هوش_مصنوعی #مدل_زبان #اومنی_مودال #MoE
👍1
🌐 بحث‌های تازه دربارهٔ زمان‌بندی AGI و سناریوی AI-2027

چندی پیش دربارهٔ توان پردازشی لازم برای آموزش Agent 0 و Agent 1 در گزارش AI-2027 صحبت شد و به این نتیجه رسیدیم که سرعت ساخت و راه‌اندازی دیتاسنترها کمی عقب‌تر از پیش‌بینی‌ها است. حالا با انتشار GPT-5.1-Codex-Max، تیم METR دوباره مدت انجام وظایف مهندسی را اندازه‌گیری کرده و نمودار جدید نشان می‌دهد که با پایان ۲۰۲۵، هنوز نشانه‌ای از جهش Agent 0 دیده نمی‌شود—هرچند کیفیت اندازه‌گیری‌شده کاملاً روی روند پیش‌بینی METR قرار دارد.

در فضای توییتر، بسیاری فقط به نمودار نگاه کرده و گمان کرده‌اند جابه‌جایی بازهٔ احتمالی از ۲۰۲۷ به ۲۰۲۸ یا ۲۰۲۹ یعنی «بی‌اعتبار شدن کامل» سناریو. اما اگر متن اصلی را دقیق خوانده باشید، روشن بود که سال ۲۰۲۷ انتخاب «نمادین» برای نمایش امکان‌پذیری سناریو است، نه ادعای قطعیت ریاضی.

نکات کلیدی از توضیحات خود نویسندگان:

🔹 همهٔ نویسندگان در زمان انتشار باور داشتند احتمال ظهور AGI تا پایان ۲۰۲۷ بیش از ۱۰٪ است؛ مد محتمل ۲۰۲۷ یا ۲۰۲۸ بود.
🔹 نویسندهٔ اصلی احتمال تحقق AGI تا پایان ۲۰۲۷ را حدود ۴۰٪ تخمین می‌زد—یعنی حتی پایین‌تر از تخمین میانه.
🔹 دلیل انتخاب ۲۰۲۷ این بود که در ابتدا این سال «میانهٔ پیش‌بینی» نویسندهٔ اصلی بود؛ بعدها با دقیق‌تر شدن تحلیل، میانه به ۲۰۲۸ منتقل شد.
🔹 هدف سناریو هرگز این نبود که «AGI دقیقاً در سال X رخ می‌دهد» بلکه این بود که:
«اگر AGI زودتر از انتظار برسد، شکل واقعی آن چگونه است؟ دولت‌ها چگونه واکنش نشان می‌دهند؟ پیامدهای سیستمی آن چیست؟»
🔹 اکنون میانهٔ جدید نویسندهٔ اصلی حدود ۲۰۳۰ است، ولی مد نویسندگان همچنان کمی زودتر قرار می‌گیرد.
🔹 نسخهٔ جدید مدل پیش‌بینی در راه است؛ پیشرفت کمی کندتر از انتظار بوده و مدل جدید برداشت‌های متفاوتی می‌دهد.

خط اصلی داستان این است:

📌 بحث بر سر «سال دقیق» نیست—بحث دربارهٔ قابلیت وقوع زودهنگام AGI و چگونگی مواجههٔ جامعه و دولت‌ها با آن است.
📌 فاصلهٔ ۲۰۲۷ تا ۲۰۳۰ در مقیاس تحول تمدنی تفاوت چندانی ایجاد نمی‌کند؛ آنچه مهم است آمادگی برای شوک AGI است، نه تقویم.

@rss_ai_ir
#هوش_مصنوعی #AGI #پیش‌بینی #تحلیل_صنعتی #متاورس_فکری
2
Media is too big
VIEW IN TELEGRAM
🎥 جمع‌بندی کامل جمنای ۳ — در این ویدئو بررسی می‌کنیم که آیا واقعاً نسخهٔ Gemini 3 Pro از ChatGPT پیشی گرفته یا نه؟

در این آموزش:
مقایسهٔ دقیق توانایی‌ها
⚙️ تست‌های عملی روی نوشتار، تحلیل و کدنویسی
📊 بررسی نقاط قوت و ضعف نسخهٔ جدید
🔍 تحلیل اینکه چرا جمنای ۳ در برخی بنچمارک‌ها رکوردشکنی کرده

اگر می‌خواهید بدانید این مدل در دنیای واقعی چگونه عمل می‌کند، این ویدئو را از دست ندهید.

@rss_ai_ir
#هوش_مصنوعی 🤖 #جمنای۳ #گوگل #ChatGPT #مدل_های_زبان #کدنویسی
👌2🔥1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 یک نقطهٔ عطف مهم در رباتیک صنعتی؛
شرکت Agility اعلام کرد که ربات انسان‌نمای Digit در عملیات واقعیِ مرکز لجستیک GXO بیش از ۱۰۰ هزار جعبه (totes) را جابه‌جا کرده است.

این خبر دقیقاً چند روز بعد از آن منتشر می‌شود که مدیرعامل Figure پیش‌بینی کرده بود Agility ظرف ۱۲ ماه آینده ورشکست می‌شود — و فقط یک روز پس از اعلام Figure دربارهٔ جابه‌جایی ۹۰ هزار قطعه در کارخانه BMW.

⚙️ رقابت ربات‌های انسان‌نما وارد فاز داغی شده؛ هر شرکت تلاش می‌کند ثابت کند که رباتش نه‌فقط یک دموی آزمایشگاهی، بلکه یک نیروی کار واقعی است.

@rss_ai_ir
#رباتیک #Agility #Digit #Figure #صنعت #AI
😁2👍1🔥1
🌟 فریم‌ورک جدید RL برای آموزش مدل‌های MoE از تیمی که Chatbot Arena را ساخته است

فریم‌ورک Miles توسط گروه LMSYS ORG معرفی شد؛ همان تیمی که پروژهٔ معروف slime را ساخته بود. اگر توسعه‌های اپن‌سورس را دنبال می‌کنید، می‌دانید slime یک ابزار فوق‌سبک برای پست‌تریـن است—و حتی برای GLM-4.6 هم استفاده شد.

همچنین Miles همان مسیر را ادامه می‌دهد، اما این بار با تمرکز بر آموزش مقیاس‌بالا برای معماری‌های MoE و پشتیبانی از بارهای سنگین در محیط‌های سازمانی.

⚙️ نکات فنی
• معماری بر پایهٔ True On-Policy؛ یعنی صفر شدن فاصلهٔ رفتاری بین مدل در حالت آموزش و حالت اجرا
• استفاده از Flash Attention 3، کتابخانه DeepGEMM و هسته‌های Thinking Machines Lab در کنار torch.compile
• پشتیبانی از Speculative Decoding همراه با آموزش آنلاین مدل پیش‌نویس—رویکردی که باعث می‌شود مدل draft دقیقاً با سیاست مدل اصلی حرکت کند
• افزایش سرعت تولید متن تا ۲۵٪ در مراحل پایانی آموزش

🧩 پایداری سیستم
• جلوگیری از کرش‌های غیرضروری OOM؛ اهمیت ویژه برای محیط‌های سازمانی که «هر گیگابایت یعنی هزینه»
• اصلاح مشکلات مصرف حافظه در FSDP
• وعدهٔ پشتیبانی از آموزش چندمُدی، سازگاری با SGLang v2 و نسخهٔ پیشرفته‌تر Speculative Decoding

📄 مقاله
🖥️ GitHub

@rss_ai_ir
#AI #ML #RL #MoE #LMSYS #Miles