This media is not supported in your browser
VIEW IN TELEGRAM
🤖🇨🇳 رکورد جهانی تازه برای رباتهای پیادهرو
ربات تازهنفس ساخت چین توانست رکورد جهانی طولانیترین مسیر پیمودهشده بدون توقف را جابهجا کند:
بیش از ۱۰۶ کیلومتر پیادهروی مداوم بدون خرابی، توقف یا نیاز به مداخله انسان. 🔥🚶♂️🤖
این رکورد جدید نشان میدهد صنعت رباتیک چین با سرعتی بیسابقه در حال نزدیکشدن به استانداردهای انسانی در پایداری، مصرف انرژی و استقامت فیزیکی است.
برای شرکتهایی که روی رباتهای انساننما، تحویل خودکار، بازرسی صنعتی یا عملیاتهای طولانی کار میکنند، این پیشرفت یک نقطهعطف جدی محسوب میشود.
@rss_ai_ir
#رباتیک #هوش_مصنوعی #چین #Robot #AI #Innovation
ربات تازهنفس ساخت چین توانست رکورد جهانی طولانیترین مسیر پیمودهشده بدون توقف را جابهجا کند:
بیش از ۱۰۶ کیلومتر پیادهروی مداوم بدون خرابی، توقف یا نیاز به مداخله انسان. 🔥🚶♂️🤖
این رکورد جدید نشان میدهد صنعت رباتیک چین با سرعتی بیسابقه در حال نزدیکشدن به استانداردهای انسانی در پایداری، مصرف انرژی و استقامت فیزیکی است.
برای شرکتهایی که روی رباتهای انساننما، تحویل خودکار، بازرسی صنعتی یا عملیاتهای طولانی کار میکنند، این پیشرفت یک نقطهعطف جدی محسوب میشود.
@rss_ai_ir
#رباتیک #هوش_مصنوعی #چین #Robot #AI #Innovation
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🦞 استفاده از تنها یک تصویر مصنوعی برای هر کلاس 🦞
پژوهشگران MIT روشی تازه به نام Linear Gradient Matching معرفی کردهاند؛ روشی نوآورانه برای دیتاست دیستیلیشن که اجازه میدهد تنها با یک تصویر مصنوعی برای هر کلاس، بتوان یک دستهبند خطی را آموزش داد — و حتی فراتر از آن!
این تکنیک، ساختار گرادیانها را بازسازی میکند تا مدل بدون نیاز به مجموعهدادهٔ حجیم، رفتار همان دیتاست واقعی را تقلید کند.
نتیجه: کاهش شدید هزینهٔ دادهسازی و سرعت بسیار بالاتر در آموزش مدلها.
📌 لینکها:
👉 مقاله:
arxiv.org/pdf/2511.16674
👉 پروژه:
linear-gradient-matching.github.io
👉 مخزن کد:
github.com/GeorgeCazenavette/linear-gradient-matching
@rss_ai_ir
#هوش_مصنوعی #دانشگاهی #دیپلرنینگ #DataDistillation #AI 🧠✨
پژوهشگران MIT روشی تازه به نام Linear Gradient Matching معرفی کردهاند؛ روشی نوآورانه برای دیتاست دیستیلیشن که اجازه میدهد تنها با یک تصویر مصنوعی برای هر کلاس، بتوان یک دستهبند خطی را آموزش داد — و حتی فراتر از آن!
این تکنیک، ساختار گرادیانها را بازسازی میکند تا مدل بدون نیاز به مجموعهدادهٔ حجیم، رفتار همان دیتاست واقعی را تقلید کند.
نتیجه: کاهش شدید هزینهٔ دادهسازی و سرعت بسیار بالاتر در آموزش مدلها.
📌 لینکها:
👉 مقاله:
arxiv.org/pdf/2511.16674
👉 پروژه:
linear-gradient-matching.github.io
👉 مخزن کد:
github.com/GeorgeCazenavette/linear-gradient-matching
@rss_ai_ir
#هوش_مصنوعی #دانشگاهی #دیپلرنینگ #DataDistillation #AI 🧠✨
🔥1🙏1👌1
🔥 مقایسه Gemini 3.0 با رادیولوژیستها؛ نتایج RadLE منتشر شد
دیروز نسخهٔ جدید Gemini 3.0 موج بزرگی در فضای هوش مصنوعی ایجاد کرد و بلافاصله این سؤال مطرح شد که:
«آیا این مدل میتواند از پس استدلال تصویری واقعیِ پزشکی بربیاید؟»
برای پاسخ، سختترین معیار موجود انتخاب شد: RadLE v1.
📊 نتایج تست Gemini 3.0 Pro روی RadLE v1
دقت ۵۱٪ — نخستین بار که یک مدل عمومی موفق شده عملکردش از رزیدنتهای رادیولوژی بهتر باشد
رزیدنتهای رادیولوژی: ۴۵٪
رادیولوژیستهای هیئتمدارکدار: ۸۳٪
مدل بهصورت پایدار استدلال مرحلهبهمرحله ارائه میکند؛ از تشخیص ضایعات ظریف تا پیدا کردن آپاندیس و حذف موارد مشابه
✨ برای اولین بار در تاریخ، یک مدل عمومی هوش مصنوعی توانسته از «سطح کارآموزی» در سختترین بنچمارک رادیولوژی عبور کند.
@rss_ai_ir
#پزشکی #رادیولوژی #هوش_مصنوعی #Gemini #AI
دیروز نسخهٔ جدید Gemini 3.0 موج بزرگی در فضای هوش مصنوعی ایجاد کرد و بلافاصله این سؤال مطرح شد که:
«آیا این مدل میتواند از پس استدلال تصویری واقعیِ پزشکی بربیاید؟»
برای پاسخ، سختترین معیار موجود انتخاب شد: RadLE v1.
📊 نتایج تست Gemini 3.0 Pro روی RadLE v1
دقت ۵۱٪ — نخستین بار که یک مدل عمومی موفق شده عملکردش از رزیدنتهای رادیولوژی بهتر باشد
رزیدنتهای رادیولوژی: ۴۵٪
رادیولوژیستهای هیئتمدارکدار: ۸۳٪
مدل بهصورت پایدار استدلال مرحلهبهمرحله ارائه میکند؛ از تشخیص ضایعات ظریف تا پیدا کردن آپاندیس و حذف موارد مشابه
✨ برای اولین بار در تاریخ، یک مدل عمومی هوش مصنوعی توانسته از «سطح کارآموزی» در سختترین بنچمارک رادیولوژی عبور کند.
@rss_ai_ir
#پزشکی #رادیولوژی #هوش_مصنوعی #Gemini #AI
⚡2👏2❤1🎉1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 ربات AlohaMini؛ انقلاب ششصد دلاری در رباتهای خانگی و Embodied-AI
دنیای رباتیک یک قدم دیگر به خانههای ما نزدیکتر شد. AlohaMini معرفی شده؛ رباتی دودستی، موبایل و کاملاً قابل چاپ با پرینتر سهبعدی — با هزینهای حدود ۶۰۰ دلار و امکان مونتاژ در حدود یک ساعت.
این ربات مخصوص علاقهمندان، پژوهشگران و توسعهدهندگانی است که میخواهند بدون هزینههای سنگین، روی هوش تجسمیافته (Embodied AI) و کارهای واقعی مانپولیشن آزمایش کنند.
✨ ویژگیها ◼️ دو بازوی رباتیک کامل
◼️ شاسی متحرک با قابلیت جابهجایی
◼️ سازه موتوردار با ارتفاع قابل تنظیم تا حدود ۶۰ سانتیمتر
◼️ کاملاً متنباز و سازگار با LeRobot برای شروع سریع برنامهنویسی
◼️ دو نسخه:
• Mini (کاملاً چاپ سهبعدی)
• Pro (ترکیب مواد مقاومتر)
🟢 این پروژه عملاً democratization رباتیک است — یعنی هر کسی، حتی در خانه، میتواند یک پلتفرم واقعی برای تمرین کنترل ربات، آموزش مدلهای RL، Teleoperation و حتی یادگیری ادراکی بسازد.
📎 سورس کامل، فایلهای چاپ، مونتاژ و کدها:
https://github.com/liyiteng/AlohaMini
@rss_ai_ir
#رباتیک 🤖 #هوش_مصنوعی #EmbodiedAI #AlohaMini #۳Dپرینت #DIY
دنیای رباتیک یک قدم دیگر به خانههای ما نزدیکتر شد. AlohaMini معرفی شده؛ رباتی دودستی، موبایل و کاملاً قابل چاپ با پرینتر سهبعدی — با هزینهای حدود ۶۰۰ دلار و امکان مونتاژ در حدود یک ساعت.
این ربات مخصوص علاقهمندان، پژوهشگران و توسعهدهندگانی است که میخواهند بدون هزینههای سنگین، روی هوش تجسمیافته (Embodied AI) و کارهای واقعی مانپولیشن آزمایش کنند.
✨ ویژگیها ◼️ دو بازوی رباتیک کامل
◼️ شاسی متحرک با قابلیت جابهجایی
◼️ سازه موتوردار با ارتفاع قابل تنظیم تا حدود ۶۰ سانتیمتر
◼️ کاملاً متنباز و سازگار با LeRobot برای شروع سریع برنامهنویسی
◼️ دو نسخه:
• Mini (کاملاً چاپ سهبعدی)
• Pro (ترکیب مواد مقاومتر)
🟢 این پروژه عملاً democratization رباتیک است — یعنی هر کسی، حتی در خانه، میتواند یک پلتفرم واقعی برای تمرین کنترل ربات، آموزش مدلهای RL، Teleoperation و حتی یادگیری ادراکی بسازد.
📎 سورس کامل، فایلهای چاپ، مونتاژ و کدها:
https://github.com/liyiteng/AlohaMini
@rss_ai_ir
#رباتیک 🤖 #هوش_مصنوعی #EmbodiedAI #AlohaMini #۳Dپرینت #DIY
❤1👍1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🌬️ تحریک بویایی با اولتراسوند؛ فعالسازی بوها بدون منبع واقعی!
پژوهشگران به دستاوردی خیرهکننده رسیدهاند: ایجاد حس بو فقط با تحریک نورونها به کمک امواج اولتراسوند — بدون هیچ منبع بوی واقعی.
💠 آنها یک هدست تخصصی ساختهاند که بخشهای مختلف مرتبط با بویایی در مغز را هدف قرار میدهد.
💠 افراد با این دستگاه توانستهاند بوهایی مثل هوای تازه، دود آتش و حتی زباله را حس کنند — فقط با تحریک مغزی، نه با بوهای واقعی.
🔮 اگر این فناوری به هدستهای واقعیت مجازی برسد، تجربه فیلم، بازی و شبیهسازیها متحول میشود. تصور کنید
احساس بوی جنگل، دریا یا یک صحنه سینمایی… فقط با یک هدست!
@rss_ai_ir
#فناوری 🚀 #عصب_مهندسی #VR #بویایی #اولتراسوند
پژوهشگران به دستاوردی خیرهکننده رسیدهاند: ایجاد حس بو فقط با تحریک نورونها به کمک امواج اولتراسوند — بدون هیچ منبع بوی واقعی.
💠 آنها یک هدست تخصصی ساختهاند که بخشهای مختلف مرتبط با بویایی در مغز را هدف قرار میدهد.
💠 افراد با این دستگاه توانستهاند بوهایی مثل هوای تازه، دود آتش و حتی زباله را حس کنند — فقط با تحریک مغزی، نه با بوهای واقعی.
🔮 اگر این فناوری به هدستهای واقعیت مجازی برسد، تجربه فیلم، بازی و شبیهسازیها متحول میشود. تصور کنید
احساس بوی جنگل، دریا یا یک صحنه سینمایی… فقط با یک هدست!
@rss_ai_ir
#فناوری 🚀 #عصب_مهندسی #VR #بویایی #اولتراسوند
🤯2🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🦊✨ نئورومحبت؛ نیکلای دروزدوف در نقش دوست تمام موجودات!
تصویری که مرز میان واقعیت و خیال را محو میکند؛
نیکلای دروزدوف، همان چهره محبوب دنیای حیاتوحش، اینبار در قالبی تازه و فوقدوستانه کنار همهٔ موجودات ایستاده است — نتیجهٔ ترکیب خلاقانه Nano Banana Pro و Kling 2.5.
از آن جنس تصاویری که لبخند را بیهزینه روی صورت مینشانند. 😊💚
@rss_ai_ir
#نئورومحبت 🌿 #هوش_مصنوعی #تولید_تصویر #NanoBananaPro #Kling25
تصویری که مرز میان واقعیت و خیال را محو میکند؛
نیکلای دروزدوف، همان چهره محبوب دنیای حیاتوحش، اینبار در قالبی تازه و فوقدوستانه کنار همهٔ موجودات ایستاده است — نتیجهٔ ترکیب خلاقانه Nano Banana Pro و Kling 2.5.
از آن جنس تصاویری که لبخند را بیهزینه روی صورت مینشانند. 😊💚
@rss_ai_ir
#نئورومحبت 🌿 #هوش_مصنوعی #تولید_تصویر #NanoBananaPro #Kling25
❤2
🤟 گوگل در حال تقویت موقعیت خود؛ فاصله با OpenAI از همیشه کمتر شده است
سام آلتمن رسماً تأیید کرده که پیشرفت چشمگیر گوگل — بهویژه نتایج خیرهکننده Gemini 3 — فشار کوتاهمدتی روی OpenAI ایجاد کرده است.
🔸 برتری یکطرفهٔ OpenAI دیگر مثل گذشته نیست.
گوگل و Anthropic با سرعت در حال رشدند، در حالیکه OpenAI با هزینههای عظیم محاسباتی مواجه است و همین موضوع سرمایهگذاران را نگران کرده.
🔸 با این حال، آلتمن خوشبینی بلندمدت دارد.
او امید دارد مدلهای جدید مانند Shallotpeat، پیشرفت در مراحل پیشآموزش و اتوماسیون گسترده، موج بعدی جهشهای علمی را برای OpenAI رقم بزنند.
بخشی از نامهٔ داخلی آلتمن:
«نمیخواهم بدبینانه بهنظر برسد — همچنان نتایج فوقالعادهای ارائه میکنیم… و انتظار دارم این روند ادامه پیدا کند.»
و جملهٔ نهایی او:
«درسته، خیلی سخت است که هم بهترین لابراتوار پژوهشی باشیم، هم بهترین شرکت زیرساختی AI و هم بهترین پلتفرم محصولی. اما این واقعیت ماست. و من موقعیتمان را با هیچکس عوض نمیکنم :)»
🔗 منبع: The Information
@rss_ai_ir
#هوش_مصنوعی ⚡ #Google #OpenAI #Gemini3 #AIIndustry
سام آلتمن رسماً تأیید کرده که پیشرفت چشمگیر گوگل — بهویژه نتایج خیرهکننده Gemini 3 — فشار کوتاهمدتی روی OpenAI ایجاد کرده است.
🔸 برتری یکطرفهٔ OpenAI دیگر مثل گذشته نیست.
گوگل و Anthropic با سرعت در حال رشدند، در حالیکه OpenAI با هزینههای عظیم محاسباتی مواجه است و همین موضوع سرمایهگذاران را نگران کرده.
🔸 با این حال، آلتمن خوشبینی بلندمدت دارد.
او امید دارد مدلهای جدید مانند Shallotpeat، پیشرفت در مراحل پیشآموزش و اتوماسیون گسترده، موج بعدی جهشهای علمی را برای OpenAI رقم بزنند.
بخشی از نامهٔ داخلی آلتمن:
«نمیخواهم بدبینانه بهنظر برسد — همچنان نتایج فوقالعادهای ارائه میکنیم… و انتظار دارم این روند ادامه پیدا کند.»
و جملهٔ نهایی او:
«درسته، خیلی سخت است که هم بهترین لابراتوار پژوهشی باشیم، هم بهترین شرکت زیرساختی AI و هم بهترین پلتفرم محصولی. اما این واقعیت ماست. و من موقعیتمان را با هیچکس عوض نمیکنم :)»
🔗 منبع: The Information
@rss_ai_ir
#هوش_مصنوعی ⚡ #Google #OpenAI #Gemini3 #AIIndustry
👍2
Media is too big
VIEW IN TELEGRAM
🤖 آیا رباتهای انساننما تبدیل به «سربازان فرابشری» میشوند؟
گزارشها نشان میدهد استارتاپ رباتیک Foundation از سانفرانسیسکو در حال مذاکره با وزارت دفاع آمریکا است تا ربات انساننمای خود، Phantom MK1، را برای کمک یا حتی جایگزینی سربازان در مأموریتهای خطرناک بهکار گیرد.
بر اساس اطلاعات منتشرشده، این شرکت تاکنون حدود ۱۰ میلیون دلار قرارداد دولتی دریافت کرده و قصد دارد ظرف چند ماه آینده ربات را به سطحی برساند که بهصورت ۲۴ ساعته در میدان عمل کند.
📌 ویژگیهای Phantom MK1
قد: ۱۷۵ سانتیمتر
وزن: ۸۰ کیلوگرم
هشت دوربین روی سر برای بینایی محیط
توان حمل مداوم ۲۰ کیلوگرم و حمل لحظهای تا ۳۶ کیلوگرم
قابلیت یادگیری مهارتهای مرتبط با مأموریتهای دفاعی:
• سرویس و سوخترسانی هواپیماها
• باز کردن مسیرهای مسدود در میدان نبرد
• اجرای وظایف پرخطر بدون نیاز به حضور انسان
🔍 بنیانگذاران:
این استارتاپ توسط Sankaet Pathak (مدیرعامل سابق Synapse) و Mike LeBlanc (تفنگدار سابق نیروی دریایی آمریکا) ایجاد شده است.
⚠️ با نزدیک شدن رباتهای انساننما به کاربری نظامی، پرسشهای مهمی درباره اخلاق، امنیت و آینده جنگافزارهای خودمختار دوباره مطرح میشود.
@rss_ai_ir
#رباتیک ⚙️ #Humanoid #AI #دفاعی #روبات_انساننما
گزارشها نشان میدهد استارتاپ رباتیک Foundation از سانفرانسیسکو در حال مذاکره با وزارت دفاع آمریکا است تا ربات انساننمای خود، Phantom MK1، را برای کمک یا حتی جایگزینی سربازان در مأموریتهای خطرناک بهکار گیرد.
بر اساس اطلاعات منتشرشده، این شرکت تاکنون حدود ۱۰ میلیون دلار قرارداد دولتی دریافت کرده و قصد دارد ظرف چند ماه آینده ربات را به سطحی برساند که بهصورت ۲۴ ساعته در میدان عمل کند.
📌 ویژگیهای Phantom MK1
قد: ۱۷۵ سانتیمتر
وزن: ۸۰ کیلوگرم
هشت دوربین روی سر برای بینایی محیط
توان حمل مداوم ۲۰ کیلوگرم و حمل لحظهای تا ۳۶ کیلوگرم
قابلیت یادگیری مهارتهای مرتبط با مأموریتهای دفاعی:
• سرویس و سوخترسانی هواپیماها
• باز کردن مسیرهای مسدود در میدان نبرد
• اجرای وظایف پرخطر بدون نیاز به حضور انسان
🔍 بنیانگذاران:
این استارتاپ توسط Sankaet Pathak (مدیرعامل سابق Synapse) و Mike LeBlanc (تفنگدار سابق نیروی دریایی آمریکا) ایجاد شده است.
⚠️ با نزدیک شدن رباتهای انساننما به کاربری نظامی، پرسشهای مهمی درباره اخلاق، امنیت و آینده جنگافزارهای خودمختار دوباره مطرح میشود.
@rss_ai_ir
#رباتیک ⚙️ #Humanoid #AI #دفاعی #روبات_انساننما
👍1🔥1👏1
📨 گوگل تغییر مهمی در Gmail اعمال کرده است؛ از این پس «ویژگیهای هوشمند» بهصورت پیشفرض فعال هستند و این یعنی محتوای ایمیلهای کاربران — شامل ضمیمهها — میتواند بهصورت ناشناس وارد سامانههای هوش مصنوعی گوگل شود.
🔍 طبق این تغییر، دادهها برای تحلیل و بهبود مدلهای AI مورد استفاده قرار میگیرند، مگر اینکه کاربر خودش گزینهها را غیرفعال کند.
⚙️ مسیر غیرفعالسازی:
Settings → Smart Features
و سپس خاموشکردن هر دو گزینه:
• Smart Features
• Workspace Smart Features
⚠️ نکته مهم: این اقدام پرسشهای جدیدی درباره حریم خصوصی، مدیریت داده و شفافیت سامانههای هوش مصنوعی ایجاد کرده است.
@rss_ai_ir
#حریم_خصوصی 🔐 #Gmail #گوگل #هوش_مصنوعی
🔍 طبق این تغییر، دادهها برای تحلیل و بهبود مدلهای AI مورد استفاده قرار میگیرند، مگر اینکه کاربر خودش گزینهها را غیرفعال کند.
⚙️ مسیر غیرفعالسازی:
Settings → Smart Features
و سپس خاموشکردن هر دو گزینه:
• Smart Features
• Workspace Smart Features
⚠️ نکته مهم: این اقدام پرسشهای جدیدی درباره حریم خصوصی، مدیریت داده و شفافیت سامانههای هوش مصنوعی ایجاد کرده است.
@rss_ai_ir
#حریم_خصوصی 🔐 #Gmail #گوگل #هوش_مصنوعی
📘 خبر: «FrontierMath» مجموعهای از سختترین مسائل ریاضیِ حال حاضر است؛ دقیقا همان جایی که مدلهای بزرگ هوش مصنوعی مجبور میشوند توان واقعیِ استدلال و قدرت حل مسئلهٔ خود را نشان دهند.
📊 در تازهترین نتایج، Gemini 3.0 Pro رکورد جدیدی ثبت کرده و حتی از GPT-5 نیز پیشی گرفته است. این عملکرد نشان میدهد موج انتظارات از نسل سوم Gemini کاملا منطقی بوده و مدل توانسته است از پسِ چالشهای سطح Frontier بهخوبی برآید.
🤔 حالا نگاهها به سمت OpenAI است؛ باید دید پاسخ بعدی آنها در رقابت مدلهای استدلالی چه خواهد بود و چه نسخهای برای حفظ برتری ارائه میکنند.
@rss_ai_ir
#هوش_مصنوعی ⚡️ #ریاضیات #Gemini3 #LLM
📊 در تازهترین نتایج، Gemini 3.0 Pro رکورد جدیدی ثبت کرده و حتی از GPT-5 نیز پیشی گرفته است. این عملکرد نشان میدهد موج انتظارات از نسل سوم Gemini کاملا منطقی بوده و مدل توانسته است از پسِ چالشهای سطح Frontier بهخوبی برآید.
🤔 حالا نگاهها به سمت OpenAI است؛ باید دید پاسخ بعدی آنها در رقابت مدلهای استدلالی چه خواهد بود و چه نسخهای برای حفظ برتری ارائه میکنند.
@rss_ai_ir
#هوش_مصنوعی ⚡️ #ریاضیات #Gemini3 #LLM
🔥2👏1😁1
🚨 سیاستهای جدید ChatGPT باعث شده برخی کاربران هنگام گفتوگوهای بیشازحد «کودکمحور» با درخواست تأیید هویت روبهرو شوند.
در این روند، سیستم از کاربر میخواهد از پاسپورت برای احراز هویت استفاده کند.
⚠️ اگر این تأیید انجام نشود، امکان تعلیق حساب ظرف دو ماه وجود دارد.
این تغییر بخشی از تلاش برای کاهش ریسک سوءاستفاده و مطابقت با قوانین بینالمللی ایمنی کودکان است.
@rss_ai_ir
#هوش_مصنوعی #ChatGPT #امنیت_دیجیتال
در این روند، سیستم از کاربر میخواهد از پاسپورت برای احراز هویت استفاده کند.
⚠️ اگر این تأیید انجام نشود، امکان تعلیق حساب ظرف دو ماه وجود دارد.
این تغییر بخشی از تلاش برای کاهش ریسک سوءاستفاده و مطابقت با قوانین بینالمللی ایمنی کودکان است.
@rss_ai_ir
#هوش_مصنوعی #ChatGPT #امنیت_دیجیتال
❤4🤬1
🚀 مدل Uni-MoE-2.0-Omni؛ جهش تازه در دنیای مدلهای اومنیمودال
مدلی که مرزهای چندمودالیتی را جابهجا کرده و وارد سطح اومنیمودالیتی شده است؛ یعنی فهم و تولید همزمان گفتار، متن، تصویر، ویدئو و حتی تعاملات صوتی–تصویری.
✨ نوآوری اصلی
پژوهشگران نشان دادهاند چگونه میتوان یک LLM معمولی را بهصورت تکاملی به یک مدل MoE واقعی تبدیل کرد که همهٔ مدالیتهها را یکپارچه پردازش میکند.
🧠 معماری مدل
۱) Omnimodality 3D-RoPE + Dynamic-Capacity MoE
• همترازسازی گفتار، متن، تصویر و ویدئو در ابعاد زمانی–فضایی
• تخصیص پویا و هوشمند محاسبات متناسب با سختی هر وظیفه
۲) Encoder–Decoder عمیقاً ترکیبشده
• ورودی و خروجیهای چندگانه در هر مدالیتی
• تعامل واقعی اومنیمودال بین همهٔ حالتها
🛠 فرآیند آموزش
۱) مسیر پیشرونده:
Cross-modal alignment → Warm-up → MoE+RL → Generative training
• تبدیل LLMهای فشرده به MoE
• تنها با ۷۵ میلیارد توکن
• همگرایی پایدار، مخصوصاً در مرحله RL
۲) زبان، هستهٔ اصلی تمام وظایف
• همهٔ مدالیتهها به تولید زبان نگاشت میشوند
• سدهای بین مدالیتهها را حذف میکند
🎨 تواناییها
✔ تولید و تعامل صوتی
✔ تولید و ویرایش تصویر
✔ درک تصویر و ویدئو
✔ تحلیل صوتی–تصویری
✔ پشتیبانی از ۱۰+ وظیفهٔ چندمودال
🔥 نتایج کلیدی
در ۵۰+ مورد از ۷۶ وظیفه، بهتر از Qwen 2.5 Omni عمل کرده—درحالیکه ۱.۲ تریلیون توکن مصرف کرده بود:
• درک ویدئو: ۵٪ بهتر
• فهم اومنیمودال: ۷٪ بهتر
• Speech-QA: ۴.۳٪ بهتر
• پردازش تصویر: ۷٪ بهتر
🌍 منابع متنباز
Model →
https://huggingface.co/collections/HIT-TMG/lychee-uni-moe-20
Code →
https://github.com/HITsz-TMG/Uni-MoE/tree/master/Uni-MoE-2
Homepage →
https://idealistxy.github.io/Uni-MoE-v2.github.io/
@rss_ai_ir
#هوش_مصنوعی #مدل_زبان #اومنی_مودال #MoE
مدلی که مرزهای چندمودالیتی را جابهجا کرده و وارد سطح اومنیمودالیتی شده است؛ یعنی فهم و تولید همزمان گفتار، متن، تصویر، ویدئو و حتی تعاملات صوتی–تصویری.
✨ نوآوری اصلی
پژوهشگران نشان دادهاند چگونه میتوان یک LLM معمولی را بهصورت تکاملی به یک مدل MoE واقعی تبدیل کرد که همهٔ مدالیتهها را یکپارچه پردازش میکند.
🧠 معماری مدل
۱) Omnimodality 3D-RoPE + Dynamic-Capacity MoE
• همترازسازی گفتار، متن، تصویر و ویدئو در ابعاد زمانی–فضایی
• تخصیص پویا و هوشمند محاسبات متناسب با سختی هر وظیفه
۲) Encoder–Decoder عمیقاً ترکیبشده
• ورودی و خروجیهای چندگانه در هر مدالیتی
• تعامل واقعی اومنیمودال بین همهٔ حالتها
🛠 فرآیند آموزش
۱) مسیر پیشرونده:
Cross-modal alignment → Warm-up → MoE+RL → Generative training
• تبدیل LLMهای فشرده به MoE
• تنها با ۷۵ میلیارد توکن
• همگرایی پایدار، مخصوصاً در مرحله RL
۲) زبان، هستهٔ اصلی تمام وظایف
• همهٔ مدالیتهها به تولید زبان نگاشت میشوند
• سدهای بین مدالیتهها را حذف میکند
🎨 تواناییها
✔ تولید و تعامل صوتی
✔ تولید و ویرایش تصویر
✔ درک تصویر و ویدئو
✔ تحلیل صوتی–تصویری
✔ پشتیبانی از ۱۰+ وظیفهٔ چندمودال
🔥 نتایج کلیدی
در ۵۰+ مورد از ۷۶ وظیفه، بهتر از Qwen 2.5 Omni عمل کرده—درحالیکه ۱.۲ تریلیون توکن مصرف کرده بود:
• درک ویدئو: ۵٪ بهتر
• فهم اومنیمودال: ۷٪ بهتر
• Speech-QA: ۴.۳٪ بهتر
• پردازش تصویر: ۷٪ بهتر
🌍 منابع متنباز
Model →
https://huggingface.co/collections/HIT-TMG/lychee-uni-moe-20
Code →
https://github.com/HITsz-TMG/Uni-MoE/tree/master/Uni-MoE-2
Homepage →
https://idealistxy.github.io/Uni-MoE-v2.github.io/
@rss_ai_ir
#هوش_مصنوعی #مدل_زبان #اومنی_مودال #MoE
👍1
🌐 بحثهای تازه دربارهٔ زمانبندی AGI و سناریوی AI-2027
چندی پیش دربارهٔ توان پردازشی لازم برای آموزش Agent 0 و Agent 1 در گزارش AI-2027 صحبت شد و به این نتیجه رسیدیم که سرعت ساخت و راهاندازی دیتاسنترها کمی عقبتر از پیشبینیها است. حالا با انتشار GPT-5.1-Codex-Max، تیم METR دوباره مدت انجام وظایف مهندسی را اندازهگیری کرده و نمودار جدید نشان میدهد که با پایان ۲۰۲۵، هنوز نشانهای از جهش Agent 0 دیده نمیشود—هرچند کیفیت اندازهگیریشده کاملاً روی روند پیشبینی METR قرار دارد.
در فضای توییتر، بسیاری فقط به نمودار نگاه کرده و گمان کردهاند جابهجایی بازهٔ احتمالی از ۲۰۲۷ به ۲۰۲۸ یا ۲۰۲۹ یعنی «بیاعتبار شدن کامل» سناریو. اما اگر متن اصلی را دقیق خوانده باشید، روشن بود که سال ۲۰۲۷ انتخاب «نمادین» برای نمایش امکانپذیری سناریو است، نه ادعای قطعیت ریاضی.
نکات کلیدی از توضیحات خود نویسندگان:
🔹 همهٔ نویسندگان در زمان انتشار باور داشتند احتمال ظهور AGI تا پایان ۲۰۲۷ بیش از ۱۰٪ است؛ مد محتمل ۲۰۲۷ یا ۲۰۲۸ بود.
🔹 نویسندهٔ اصلی احتمال تحقق AGI تا پایان ۲۰۲۷ را حدود ۴۰٪ تخمین میزد—یعنی حتی پایینتر از تخمین میانه.
🔹 دلیل انتخاب ۲۰۲۷ این بود که در ابتدا این سال «میانهٔ پیشبینی» نویسندهٔ اصلی بود؛ بعدها با دقیقتر شدن تحلیل، میانه به ۲۰۲۸ منتقل شد.
🔹 هدف سناریو هرگز این نبود که «AGI دقیقاً در سال X رخ میدهد» بلکه این بود که:
«اگر AGI زودتر از انتظار برسد، شکل واقعی آن چگونه است؟ دولتها چگونه واکنش نشان میدهند؟ پیامدهای سیستمی آن چیست؟»
🔹 اکنون میانهٔ جدید نویسندهٔ اصلی حدود ۲۰۳۰ است، ولی مد نویسندگان همچنان کمی زودتر قرار میگیرد.
🔹 نسخهٔ جدید مدل پیشبینی در راه است؛ پیشرفت کمی کندتر از انتظار بوده و مدل جدید برداشتهای متفاوتی میدهد.
خط اصلی داستان این است:
📌 بحث بر سر «سال دقیق» نیست—بحث دربارهٔ قابلیت وقوع زودهنگام AGI و چگونگی مواجههٔ جامعه و دولتها با آن است.
📌 فاصلهٔ ۲۰۲۷ تا ۲۰۳۰ در مقیاس تحول تمدنی تفاوت چندانی ایجاد نمیکند؛ آنچه مهم است آمادگی برای شوک AGI است، نه تقویم.
@rss_ai_ir
#هوش_مصنوعی #AGI #پیشبینی #تحلیل_صنعتی #متاورس_فکری
چندی پیش دربارهٔ توان پردازشی لازم برای آموزش Agent 0 و Agent 1 در گزارش AI-2027 صحبت شد و به این نتیجه رسیدیم که سرعت ساخت و راهاندازی دیتاسنترها کمی عقبتر از پیشبینیها است. حالا با انتشار GPT-5.1-Codex-Max، تیم METR دوباره مدت انجام وظایف مهندسی را اندازهگیری کرده و نمودار جدید نشان میدهد که با پایان ۲۰۲۵، هنوز نشانهای از جهش Agent 0 دیده نمیشود—هرچند کیفیت اندازهگیریشده کاملاً روی روند پیشبینی METR قرار دارد.
در فضای توییتر، بسیاری فقط به نمودار نگاه کرده و گمان کردهاند جابهجایی بازهٔ احتمالی از ۲۰۲۷ به ۲۰۲۸ یا ۲۰۲۹ یعنی «بیاعتبار شدن کامل» سناریو. اما اگر متن اصلی را دقیق خوانده باشید، روشن بود که سال ۲۰۲۷ انتخاب «نمادین» برای نمایش امکانپذیری سناریو است، نه ادعای قطعیت ریاضی.
نکات کلیدی از توضیحات خود نویسندگان:
🔹 همهٔ نویسندگان در زمان انتشار باور داشتند احتمال ظهور AGI تا پایان ۲۰۲۷ بیش از ۱۰٪ است؛ مد محتمل ۲۰۲۷ یا ۲۰۲۸ بود.
🔹 نویسندهٔ اصلی احتمال تحقق AGI تا پایان ۲۰۲۷ را حدود ۴۰٪ تخمین میزد—یعنی حتی پایینتر از تخمین میانه.
🔹 دلیل انتخاب ۲۰۲۷ این بود که در ابتدا این سال «میانهٔ پیشبینی» نویسندهٔ اصلی بود؛ بعدها با دقیقتر شدن تحلیل، میانه به ۲۰۲۸ منتقل شد.
🔹 هدف سناریو هرگز این نبود که «AGI دقیقاً در سال X رخ میدهد» بلکه این بود که:
«اگر AGI زودتر از انتظار برسد، شکل واقعی آن چگونه است؟ دولتها چگونه واکنش نشان میدهند؟ پیامدهای سیستمی آن چیست؟»
🔹 اکنون میانهٔ جدید نویسندهٔ اصلی حدود ۲۰۳۰ است، ولی مد نویسندگان همچنان کمی زودتر قرار میگیرد.
🔹 نسخهٔ جدید مدل پیشبینی در راه است؛ پیشرفت کمی کندتر از انتظار بوده و مدل جدید برداشتهای متفاوتی میدهد.
خط اصلی داستان این است:
📌 بحث بر سر «سال دقیق» نیست—بحث دربارهٔ قابلیت وقوع زودهنگام AGI و چگونگی مواجههٔ جامعه و دولتها با آن است.
📌 فاصلهٔ ۲۰۲۷ تا ۲۰۳۰ در مقیاس تحول تمدنی تفاوت چندانی ایجاد نمیکند؛ آنچه مهم است آمادگی برای شوک AGI است، نه تقویم.
@rss_ai_ir
#هوش_مصنوعی #AGI #پیشبینی #تحلیل_صنعتی #متاورس_فکری
❤2
Media is too big
VIEW IN TELEGRAM
🎥 جمعبندی کامل جمنای ۳ — در این ویدئو بررسی میکنیم که آیا واقعاً نسخهٔ Gemini 3 Pro از ChatGPT پیشی گرفته یا نه؟
در این آموزش:
✨ مقایسهٔ دقیق تواناییها
⚙️ تستهای عملی روی نوشتار، تحلیل و کدنویسی
📊 بررسی نقاط قوت و ضعف نسخهٔ جدید
🔍 تحلیل اینکه چرا جمنای ۳ در برخی بنچمارکها رکوردشکنی کرده
اگر میخواهید بدانید این مدل در دنیای واقعی چگونه عمل میکند، این ویدئو را از دست ندهید.
@rss_ai_ir
#هوش_مصنوعی 🤖 #جمنای۳ #گوگل #ChatGPT #مدل_های_زبان #کدنویسی
در این آموزش:
✨ مقایسهٔ دقیق تواناییها
⚙️ تستهای عملی روی نوشتار، تحلیل و کدنویسی
📊 بررسی نقاط قوت و ضعف نسخهٔ جدید
🔍 تحلیل اینکه چرا جمنای ۳ در برخی بنچمارکها رکوردشکنی کرده
اگر میخواهید بدانید این مدل در دنیای واقعی چگونه عمل میکند، این ویدئو را از دست ندهید.
@rss_ai_ir
#هوش_مصنوعی 🤖 #جمنای۳ #گوگل #ChatGPT #مدل_های_زبان #کدنویسی
👌2🔥1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 یک نقطهٔ عطف مهم در رباتیک صنعتی؛
شرکت Agility اعلام کرد که ربات انساننمای Digit در عملیات واقعیِ مرکز لجستیک GXO بیش از ۱۰۰ هزار جعبه (totes) را جابهجا کرده است.
این خبر دقیقاً چند روز بعد از آن منتشر میشود که مدیرعامل Figure پیشبینی کرده بود Agility ظرف ۱۲ ماه آینده ورشکست میشود — و فقط یک روز پس از اعلام Figure دربارهٔ جابهجایی ۹۰ هزار قطعه در کارخانه BMW.
⚙️ رقابت رباتهای انساننما وارد فاز داغی شده؛ هر شرکت تلاش میکند ثابت کند که رباتش نهفقط یک دموی آزمایشگاهی، بلکه یک نیروی کار واقعی است.
@rss_ai_ir
#رباتیک #Agility #Digit #Figure #صنعت #AI
شرکت Agility اعلام کرد که ربات انساننمای Digit در عملیات واقعیِ مرکز لجستیک GXO بیش از ۱۰۰ هزار جعبه (totes) را جابهجا کرده است.
این خبر دقیقاً چند روز بعد از آن منتشر میشود که مدیرعامل Figure پیشبینی کرده بود Agility ظرف ۱۲ ماه آینده ورشکست میشود — و فقط یک روز پس از اعلام Figure دربارهٔ جابهجایی ۹۰ هزار قطعه در کارخانه BMW.
⚙️ رقابت رباتهای انساننما وارد فاز داغی شده؛ هر شرکت تلاش میکند ثابت کند که رباتش نهفقط یک دموی آزمایشگاهی، بلکه یک نیروی کار واقعی است.
@rss_ai_ir
#رباتیک #Agility #Digit #Figure #صنعت #AI
😁2👍1🔥1
🌟 فریمورک جدید RL برای آموزش مدلهای MoE از تیمی که Chatbot Arena را ساخته است
فریمورک Miles توسط گروه LMSYS ORG معرفی شد؛ همان تیمی که پروژهٔ معروف slime را ساخته بود. اگر توسعههای اپنسورس را دنبال میکنید، میدانید slime یک ابزار فوقسبک برای پستتریـن است—و حتی برای GLM-4.6 هم استفاده شد.
✅همچنین Miles همان مسیر را ادامه میدهد، اما این بار با تمرکز بر آموزش مقیاسبالا برای معماریهای MoE و پشتیبانی از بارهای سنگین در محیطهای سازمانی.
⚙️ نکات فنی
• معماری بر پایهٔ True On-Policy؛ یعنی صفر شدن فاصلهٔ رفتاری بین مدل در حالت آموزش و حالت اجرا
• استفاده از Flash Attention 3، کتابخانه DeepGEMM و هستههای Thinking Machines Lab در کنار torch.compile
• پشتیبانی از Speculative Decoding همراه با آموزش آنلاین مدل پیشنویس—رویکردی که باعث میشود مدل draft دقیقاً با سیاست مدل اصلی حرکت کند
• افزایش سرعت تولید متن تا ۲۵٪ در مراحل پایانی آموزش
🧩 پایداری سیستم
• جلوگیری از کرشهای غیرضروری OOM؛ اهمیت ویژه برای محیطهای سازمانی که «هر گیگابایت یعنی هزینه»
• اصلاح مشکلات مصرف حافظه در FSDP
• وعدهٔ پشتیبانی از آموزش چندمُدی، سازگاری با SGLang v2 و نسخهٔ پیشرفتهتر Speculative Decoding
📄 مقاله
🖥️ GitHub
@rss_ai_ir
#AI #ML #RL #MoE #LMSYS #Miles
فریمورک Miles توسط گروه LMSYS ORG معرفی شد؛ همان تیمی که پروژهٔ معروف slime را ساخته بود. اگر توسعههای اپنسورس را دنبال میکنید، میدانید slime یک ابزار فوقسبک برای پستتریـن است—و حتی برای GLM-4.6 هم استفاده شد.
✅همچنین Miles همان مسیر را ادامه میدهد، اما این بار با تمرکز بر آموزش مقیاسبالا برای معماریهای MoE و پشتیبانی از بارهای سنگین در محیطهای سازمانی.
⚙️ نکات فنی
• معماری بر پایهٔ True On-Policy؛ یعنی صفر شدن فاصلهٔ رفتاری بین مدل در حالت آموزش و حالت اجرا
• استفاده از Flash Attention 3، کتابخانه DeepGEMM و هستههای Thinking Machines Lab در کنار torch.compile
• پشتیبانی از Speculative Decoding همراه با آموزش آنلاین مدل پیشنویس—رویکردی که باعث میشود مدل draft دقیقاً با سیاست مدل اصلی حرکت کند
• افزایش سرعت تولید متن تا ۲۵٪ در مراحل پایانی آموزش
🧩 پایداری سیستم
• جلوگیری از کرشهای غیرضروری OOM؛ اهمیت ویژه برای محیطهای سازمانی که «هر گیگابایت یعنی هزینه»
• اصلاح مشکلات مصرف حافظه در FSDP
• وعدهٔ پشتیبانی از آموزش چندمُدی، سازگاری با SGLang v2 و نسخهٔ پیشرفتهتر Speculative Decoding
📄 مقاله
🖥️ GitHub
@rss_ai_ir
#AI #ML #RL #MoE #LMSYS #Miles