🇵🇱 استارتاپ لهستانی Pathway معماری جدیدی از شبکههای عصبی معرفی کرد —
🧬 Biological Dragon Hatchling (BDH)
هدف از این پروژه، ترکیب دو مسیر اصلی تکامل هوش مصنوعی است: ترنسفورمرها و مدلهای الهامگرفته از مغز انسان.
مطالعات (از جمله پژوهش اخیر DeepMind) نشان دادهاند که بین ساختار مغز و معماری ترنسفورمر شباهتهای عمیقی وجود دارد — اما مدلهای زبانی امروزی هنوز فاقد چند ویژگی کلیدی مغز هستند.
در BDH، پژوهشگران Pathway تصمیم گرفتند این شکاف را پر کنند و برخی ویژگیهای واقعی مغز را درون ترنسفورمر «پیوند» دهند.
نتیجه، یک شبکه گرافی است که در آن:
نورونها → رأسها (nodes)
سیناپسها → یالهای وزندار (weighted edges) هستند.
هر نورون فقط با همسایگان خود ارتباط دارد — درست مثل مغز انسان 🧠
---
⚙️ روش یادگیری:
در این مدل از قانون هب (Hebb’s Rule) استفاده شده است — همان قانونی که در مغز واقعی هم برقرار است:
> «نورونهایی که با هم فعال میشوند، ارتباطشان قویتر میشود.»
اگر دو نورون A و B بارها همزمان فعال شوند، وزن سیناپس بین آنها افزایش مییابد.
در عمل، این مکانیزم مشابه نوعی توجه (attention) است.
---
🧠 حافظه کوتاهمدت و بلندمدت:
وزنها در این مدل به دو بخش تقسیم میشوند:
ثابت (Fixed weights): حافظه بلندمدت؛ فقط در مرحله آموزش بهروز میشوند.
پویا (Dynamic weights): حافظه کوتاهمدت؛ در طول فرایند استدلال تغییر میکنند.
هر گام استدلال، در واقع نوعی «بهروزرسانی محلی» در شبکه سیناپسی است.
---
💻 نسخهی تانسوری (BDH-GPU):
✳️برای آموزش سریعتر، نسخهای از BDH بهصورت تانسوری بازنویسی شده که با ماتریسها و وکتورها کار میکند — یعنی میتوان آن را مثل ترنسفورمر معمولی آموزش داد.
✳️ساختار شامل لایههای Attention، MLP، ReLU و اکتیواسیونهای اختصاصی است.
---
📊 نتایج جالب:
1️⃣ قابلیت تفسیر بالا:
هر جفت نورون (i, j) سیناپس مخصوص به خود را دارد و وضعیت آن قابل مشاهده است.
هر نورون معنای مشخصی دارد — واقعاً یک مفهوم واحد را نمایش میدهد.
2️⃣ ادغام ساده مدلها:
دو مدل BDH را میتوان با یک کنکات ساده (concatenation) به هم متصل کرد — فوقالعاده برای مقیاسپذیری.
3️⃣ قانون مقیاس (Scaling Laws):
همچنین BDH همان رفتار مقیاسپذیری GPT-2 را نشان میدهد، و در تعداد پارامتر برابر، به دقت مشابهی در چندین وظیفه دست یافته است.
این یعنی هسته اصلی توان ترنسفورمر حفظ شده است ⚡
---
🔗 کد منبع در GitHub
📄 مقاله در arXiv
@rss_ai_ir
#هوش_مصنوعی #شبکه_عصبی #Pathway #BDH #AI #DeepLearning #Neuroscience #Transformers
🧬 Biological Dragon Hatchling (BDH)
هدف از این پروژه، ترکیب دو مسیر اصلی تکامل هوش مصنوعی است: ترنسفورمرها و مدلهای الهامگرفته از مغز انسان.
مطالعات (از جمله پژوهش اخیر DeepMind) نشان دادهاند که بین ساختار مغز و معماری ترنسفورمر شباهتهای عمیقی وجود دارد — اما مدلهای زبانی امروزی هنوز فاقد چند ویژگی کلیدی مغز هستند.
در BDH، پژوهشگران Pathway تصمیم گرفتند این شکاف را پر کنند و برخی ویژگیهای واقعی مغز را درون ترنسفورمر «پیوند» دهند.
نتیجه، یک شبکه گرافی است که در آن:
نورونها → رأسها (nodes)
سیناپسها → یالهای وزندار (weighted edges) هستند.
هر نورون فقط با همسایگان خود ارتباط دارد — درست مثل مغز انسان 🧠
---
⚙️ روش یادگیری:
در این مدل از قانون هب (Hebb’s Rule) استفاده شده است — همان قانونی که در مغز واقعی هم برقرار است:
> «نورونهایی که با هم فعال میشوند، ارتباطشان قویتر میشود.»
اگر دو نورون A و B بارها همزمان فعال شوند، وزن سیناپس بین آنها افزایش مییابد.
در عمل، این مکانیزم مشابه نوعی توجه (attention) است.
---
🧠 حافظه کوتاهمدت و بلندمدت:
وزنها در این مدل به دو بخش تقسیم میشوند:
ثابت (Fixed weights): حافظه بلندمدت؛ فقط در مرحله آموزش بهروز میشوند.
پویا (Dynamic weights): حافظه کوتاهمدت؛ در طول فرایند استدلال تغییر میکنند.
هر گام استدلال، در واقع نوعی «بهروزرسانی محلی» در شبکه سیناپسی است.
---
💻 نسخهی تانسوری (BDH-GPU):
✳️برای آموزش سریعتر، نسخهای از BDH بهصورت تانسوری بازنویسی شده که با ماتریسها و وکتورها کار میکند — یعنی میتوان آن را مثل ترنسفورمر معمولی آموزش داد.
✳️ساختار شامل لایههای Attention، MLP، ReLU و اکتیواسیونهای اختصاصی است.
---
📊 نتایج جالب:
1️⃣ قابلیت تفسیر بالا:
هر جفت نورون (i, j) سیناپس مخصوص به خود را دارد و وضعیت آن قابل مشاهده است.
هر نورون معنای مشخصی دارد — واقعاً یک مفهوم واحد را نمایش میدهد.
2️⃣ ادغام ساده مدلها:
دو مدل BDH را میتوان با یک کنکات ساده (concatenation) به هم متصل کرد — فوقالعاده برای مقیاسپذیری.
3️⃣ قانون مقیاس (Scaling Laws):
همچنین BDH همان رفتار مقیاسپذیری GPT-2 را نشان میدهد، و در تعداد پارامتر برابر، به دقت مشابهی در چندین وظیفه دست یافته است.
این یعنی هسته اصلی توان ترنسفورمر حفظ شده است ⚡
---
🔗 کد منبع در GitHub
📄 مقاله در arXiv
@rss_ai_ir
#هوش_مصنوعی #شبکه_عصبی #Pathway #BDH #AI #DeepLearning #Neuroscience #Transformers
👏2🙏1👌1
⚡️ معماری Mamba-3 بیسروصدا در کنفرانس ICLR منتشر شد — و شاید این آغاز پایان عصر ترنسفورمرها باشد.
✅معماری Mamba-3 نسل جدیدی از معماریهای مبتنی بر State Space Models (SSM) است که مدلها را هنگام کار با کانتکستهای طولانیتر، سریعتر، پایدارتر و کارآمدتر میکند.
✅در این معماری دیگر خبری از Attention Layers نیست — مدل بهجای آن، وضعیت درونی (internal state) خود را در طول زمان ذخیره و بهروزرسانی میکند.
---
📘 مروری کوتاه بر تکامل مامبا:
🔹 Mamba-1:
✳️مفهوم پویایی پیوسته (continuous dynamics) و حافظه انتخابی (selective memory) را معرفی کرد — یعنی مدل میتوانست بهصورت هوشمند فقط بخشهای مهم اطلاعات را به خاطر بسپارد، بدون هزینه سنگین توجه.
🔹 Mamba-2:
✳️نشان داد که بهروزرسانی وضعیت و مکانیزم توجه، از نظر ریاضی دو روی یک سکهاند — و همین کشف باعث شد محاسبات روی GPUها بسیار سریعتر شود.
🔹 Mamba-3:
✳️این ایده را به بلوغ رساند. حالا حافظه داخلی مدل بهصورت پیوسته و نرمتر تغییر میکند، زیرا بهجای گام ساده اویلر (Euler Step) از انتگرالگیری ذوزنقهای (Trapezoidal Integration) استفاده میکند.
✳️در این روش، بهجای محاسبهی تغییر وضعیت فقط در انتهای بازه، مدل میانگینی از ابتدا و انتها را با ضریب تطبیقی λ لحاظ میکند.
نتیجه: دقت بالاتر (تقریب مرتبه دوم) و پویایی طبیعیتر حافظه.
---
🧠 چه چیزهایی زیر کاپوت تغییر کرده؟
♻️حافظه بهصورت ریتمیک (Rhythmic Memory) عمل میکند — یعنی میتواند الگوهای تکرارشونده و تناوبی را (مثل ساختار زبان یا موسیقی) بهخوبی یاد بگیرد.
♻️طراحی چندورودی-چندخروجی (MIMO) امکان پردازش موازی چند جریان داده را فراهم کرده — دقیقاً مطابق با ساختار GPUهای مدرن.
---
⚙️ مزایا در عمل:
✅ مدیریت کارآمد توالیهای طولانی (متن، ژنوم، دادههای زمانی)
✅ سرعت خطی و تأخیر ثابت — مناسب برای چتباتها، ترجمه زنده، و گفتار به گفتار (real-time)
✅ بهرهوری انرژی بالا و مقیاسپذیری عالی — راه را برای هوش مصنوعی روی دستگاه (on-device AI) هموار میکند.
---
🚀 معماری Mamba-3 فقط جایگزینی سریعتر برای ترنسفورمر نیست — بلکه معماریای تازه است که عمق درک متنی، سرعت و پایداری را همزمان در خود دارد.
از سرورهای عظیم تا گوشیهای هوشمند.
🟢 جزئیات:
🔗 openreview.net/pdf?id=HwCvaJOiCj
@rss_ai_ir
#هوش_مصنوعی #Mamba3 #SSM #معماری_شبکه_عصبی #LLM #DeepLearning #AI
✅معماری Mamba-3 نسل جدیدی از معماریهای مبتنی بر State Space Models (SSM) است که مدلها را هنگام کار با کانتکستهای طولانیتر، سریعتر، پایدارتر و کارآمدتر میکند.
✅در این معماری دیگر خبری از Attention Layers نیست — مدل بهجای آن، وضعیت درونی (internal state) خود را در طول زمان ذخیره و بهروزرسانی میکند.
---
📘 مروری کوتاه بر تکامل مامبا:
🔹 Mamba-1:
✳️مفهوم پویایی پیوسته (continuous dynamics) و حافظه انتخابی (selective memory) را معرفی کرد — یعنی مدل میتوانست بهصورت هوشمند فقط بخشهای مهم اطلاعات را به خاطر بسپارد، بدون هزینه سنگین توجه.
🔹 Mamba-2:
✳️نشان داد که بهروزرسانی وضعیت و مکانیزم توجه، از نظر ریاضی دو روی یک سکهاند — و همین کشف باعث شد محاسبات روی GPUها بسیار سریعتر شود.
🔹 Mamba-3:
✳️این ایده را به بلوغ رساند. حالا حافظه داخلی مدل بهصورت پیوسته و نرمتر تغییر میکند، زیرا بهجای گام ساده اویلر (Euler Step) از انتگرالگیری ذوزنقهای (Trapezoidal Integration) استفاده میکند.
✳️در این روش، بهجای محاسبهی تغییر وضعیت فقط در انتهای بازه، مدل میانگینی از ابتدا و انتها را با ضریب تطبیقی λ لحاظ میکند.
نتیجه: دقت بالاتر (تقریب مرتبه دوم) و پویایی طبیعیتر حافظه.
---
🧠 چه چیزهایی زیر کاپوت تغییر کرده؟
♻️حافظه بهصورت ریتمیک (Rhythmic Memory) عمل میکند — یعنی میتواند الگوهای تکرارشونده و تناوبی را (مثل ساختار زبان یا موسیقی) بهخوبی یاد بگیرد.
♻️طراحی چندورودی-چندخروجی (MIMO) امکان پردازش موازی چند جریان داده را فراهم کرده — دقیقاً مطابق با ساختار GPUهای مدرن.
---
⚙️ مزایا در عمل:
✅ مدیریت کارآمد توالیهای طولانی (متن، ژنوم، دادههای زمانی)
✅ سرعت خطی و تأخیر ثابت — مناسب برای چتباتها، ترجمه زنده، و گفتار به گفتار (real-time)
✅ بهرهوری انرژی بالا و مقیاسپذیری عالی — راه را برای هوش مصنوعی روی دستگاه (on-device AI) هموار میکند.
---
🚀 معماری Mamba-3 فقط جایگزینی سریعتر برای ترنسفورمر نیست — بلکه معماریای تازه است که عمق درک متنی، سرعت و پایداری را همزمان در خود دارد.
از سرورهای عظیم تا گوشیهای هوشمند.
🟢 جزئیات:
🔗 openreview.net/pdf?id=HwCvaJOiCj
@rss_ai_ir
#هوش_مصنوعی #Mamba3 #SSM #معماری_شبکه_عصبی #LLM #DeepLearning #AI
❤2👍1
🧩 Segment Anything 3 –
نسل سوم سام از Meta بهصورت بیسر و صدا در ICLR منتشر شد!
📍 اگر SAM 1 فقط اجازه میداد با یک کلیک روی تصویر، شیء مورد نظر را بخشبندی کنید،
و SAM 2 قابلیت ویدیو و حافظه موقت (Memory) را اضافه کرده بود،
حالا SAM 3 پا را فراتر گذاشته:
کافی است فقط توصیف کنید چه چیزی میخواهید — مثلاً:
> «اتوبوس زرد مدرسه»، «گربه راهراه»، «سیب قرمز» 🍎
مدل خودش همه نمونههای آن شیء را در تصویر یا ویدیو پیدا کرده و ماسک دقیق رسم میکند.
به زبان ساده: بخشبندی تصویری بالاخره یاد گرفت حرف زدن! 🎯
---
💡 در SAM 3 دیگر از دستورهای طولانی خبری نیست — کافی است از اسمهای کوتاه، نمونههای تصویری یا ترکیبی از هر دو استفاده کنید.
❌شما فقط مفهوم را بیان میکنید، مدل خودش تشخیص میدهد و مرزها را ترسیم میکند.
---
🧠 زیرساخت دادهای عظیم پشت این مدل:
♻️۴ میلیون مفهوم منحصربهفرد (unique concepts)
♻️۵۲ میلیون ماسک تأییدشده توسط انسانها و LLMها (که کار یکدیگر را ارزیابی کردهاند)
---
⚙️ نتیجه:
✳️دقت حدوداً ۲ برابر بهتر از SAM 2
✳️عملکرد تقریباً همسطح با انسان در آزمونهای Open-Vocabulary
✳️سرعت در حد Real-Time (بلادرنگ)
---
📘 مقاله در ICLR:
🔗 openreview.net/forum?id=r35clVtGzw
@rss_ai_ir
#هوش_مصنوعی #SAM3 #SegmentAnything #Vision #ComputerVision #MetaAI #ICLR #Segmentation #AI
نسل سوم سام از Meta بهصورت بیسر و صدا در ICLR منتشر شد!
📍 اگر SAM 1 فقط اجازه میداد با یک کلیک روی تصویر، شیء مورد نظر را بخشبندی کنید،
و SAM 2 قابلیت ویدیو و حافظه موقت (Memory) را اضافه کرده بود،
حالا SAM 3 پا را فراتر گذاشته:
کافی است فقط توصیف کنید چه چیزی میخواهید — مثلاً:
> «اتوبوس زرد مدرسه»، «گربه راهراه»، «سیب قرمز» 🍎
مدل خودش همه نمونههای آن شیء را در تصویر یا ویدیو پیدا کرده و ماسک دقیق رسم میکند.
به زبان ساده: بخشبندی تصویری بالاخره یاد گرفت حرف زدن! 🎯
---
💡 در SAM 3 دیگر از دستورهای طولانی خبری نیست — کافی است از اسمهای کوتاه، نمونههای تصویری یا ترکیبی از هر دو استفاده کنید.
❌شما فقط مفهوم را بیان میکنید، مدل خودش تشخیص میدهد و مرزها را ترسیم میکند.
---
🧠 زیرساخت دادهای عظیم پشت این مدل:
♻️۴ میلیون مفهوم منحصربهفرد (unique concepts)
♻️۵۲ میلیون ماسک تأییدشده توسط انسانها و LLMها (که کار یکدیگر را ارزیابی کردهاند)
---
⚙️ نتیجه:
✳️دقت حدوداً ۲ برابر بهتر از SAM 2
✳️عملکرد تقریباً همسطح با انسان در آزمونهای Open-Vocabulary
✳️سرعت در حد Real-Time (بلادرنگ)
---
📘 مقاله در ICLR:
🔗 openreview.net/forum?id=r35clVtGzw
@rss_ai_ir
#هوش_مصنوعی #SAM3 #SegmentAnything #Vision #ComputerVision #MetaAI #ICLR #Segmentation #AI
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🎨 Mesh2Motion — نسخهی اپنسورس Mixamo در مرورگر!
اگر با Mixamo کار کردهاید، حالا میتوانید نسخهی آزاد و کاملاً تحت وب آن را امتحان کنید:
Mesh2Motion 👇
💡 کافی است مدل سهبعدی خود را آپلود کنید —
سیستم بهصورت خودکار ریگ (Rig) را ایجاد میکند، با قابلیت ویرایش دستی،
و سپس میتوانید انیمیشن دلخواهتان را روی آن اعمال کرده و در نهایت خروجی بگیرید (📦 GLB / GLTF).
---
⚙️ امکانات اصلی:
♻️رینگ خودکار با کنترلهای دقیق تنظیم دستی
♻️اعمال انیمیشن آماده یا سفارشی
♻️پشتیبانی از مرورگر، بدون نصب هیچ نرمافزاری
♻️خروجی سازگار با تمامی موتورهای سهبعدی (Blender, Unity, Unreal و غیره)
---
🌐 سایت: mesh2motion.org
🎬 دمو: app.mesh2motion.org
💻 کد منبع: github.com/scottpetrovic/mesh2motion-app
@rss_ai_ir
#3D #Mesh2Motion #Rigging #Animation #OpenSource #Blender #Unreal #Unity #AI #WebTools
اگر با Mixamo کار کردهاید، حالا میتوانید نسخهی آزاد و کاملاً تحت وب آن را امتحان کنید:
Mesh2Motion 👇
💡 کافی است مدل سهبعدی خود را آپلود کنید —
سیستم بهصورت خودکار ریگ (Rig) را ایجاد میکند، با قابلیت ویرایش دستی،
و سپس میتوانید انیمیشن دلخواهتان را روی آن اعمال کرده و در نهایت خروجی بگیرید (📦 GLB / GLTF).
---
⚙️ امکانات اصلی:
♻️رینگ خودکار با کنترلهای دقیق تنظیم دستی
♻️اعمال انیمیشن آماده یا سفارشی
♻️پشتیبانی از مرورگر، بدون نصب هیچ نرمافزاری
♻️خروجی سازگار با تمامی موتورهای سهبعدی (Blender, Unity, Unreal و غیره)
---
🌐 سایت: mesh2motion.org
🎬 دمو: app.mesh2motion.org
💻 کد منبع: github.com/scottpetrovic/mesh2motion-app
@rss_ai_ir
#3D #Mesh2Motion #Rigging #Animation #OpenSource #Blender #Unreal #Unity #AI #WebTools
👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🥋 Unitree G1 Kungfu Kid V6.0 —
وقتی رباتها واقعاً “هنرهای رزمی” یاد میگیرند!
عنوان را همانطور میگذاریم: برای تاریخ.
تا بعدها یادمان بماند، وقتی عدهای هنوز در کامنتها مینوشتند
«این فقط رندر کامپیوتری است!» 😏
اما نه، این بار ویدیو واقعی است —
⛔️ربات Unitree G1 در نسخهی Kungfu Kid V6.0 حالا حرکات نمایشی و تعادلی انجام میدهد که حتی برای انسانها سخت است.
چرخش، پرش، عقبگرد، دفاع و فلیپ کامل — همه در لحظه و با کنترل فیزیکی واقعی.
🎥 حرکت “فلیپ عقب” (Backflip) هنوز هم نفسگیر است —
و حالا دیگر شوخی نیست، این نسل جدید روباتهای رزمی واقعی است.
⚠️ هنوز میخواهید به این موجودات لگد بزنید؟
بهزودی شاید جواب بدهند. 😄
@rss_ai_ir
#Unitree #G1 #Robot #Humanoid #AI #Kungfu #RobotDynamics #BostonDynamics #FutureTech
وقتی رباتها واقعاً “هنرهای رزمی” یاد میگیرند!
عنوان را همانطور میگذاریم: برای تاریخ.
تا بعدها یادمان بماند، وقتی عدهای هنوز در کامنتها مینوشتند
«این فقط رندر کامپیوتری است!» 😏
اما نه، این بار ویدیو واقعی است —
⛔️ربات Unitree G1 در نسخهی Kungfu Kid V6.0 حالا حرکات نمایشی و تعادلی انجام میدهد که حتی برای انسانها سخت است.
چرخش، پرش، عقبگرد، دفاع و فلیپ کامل — همه در لحظه و با کنترل فیزیکی واقعی.
🎥 حرکت “فلیپ عقب” (Backflip) هنوز هم نفسگیر است —
و حالا دیگر شوخی نیست، این نسل جدید روباتهای رزمی واقعی است.
⚠️ هنوز میخواهید به این موجودات لگد بزنید؟
بهزودی شاید جواب بدهند. 😄
@rss_ai_ir
#Unitree #G1 #Robot #Humanoid #AI #Kungfu #RobotDynamics #BostonDynamics #FutureTech
❤1👏1
⚡️ گوگل سامانهای ساخت که خودش سازمان مییابد — و شاید مسیر ساخت مدلها را عوض کند!
پروژهای به نام TUMIX از تیم Google، بهگفتهی بسیاری، یکی از هیجانانگیزترین کارهای هوش مصنوعی امسال است.
---
💡 بهجای آموزش یک مدل غولپیکر دیگر، گوگل سیستمی ساخته که در آن چندین عامل هوشمند (AI agents) همزمان و هماهنگ کار میکنند.
هر کدام نقش مخصوص خود را دارند:
یکی کد مینویسد 💻
دیگری جستوجو میکند 🔍
سومی با زبان طبیعی استدلال میکند 🧠
همگی بهصورت مستقل روی یک مسئله کار میکنند، سپس پاسخها را با هم به اشتراک گذاشته، اصلاح کرده و به تصمیم نهایی جمعی میرسند.
---
📈 نتیجه:
مدل Gemini 2.5 + TUMIX در آزمونهای استدلالی تا 17.4٪ بهتر از همه سیستمهای دیگر عمل کرد،
در حالی که هزینهی استنتاج تقریباً نصف شد!
بدون دادهی جدید، بدون آموزش اضافی — فقط با هماهنگی هوشمند میان چند عامل.
---
✨ نکتهی جالب: راز موفقیت در بزرگی مدل نیست، بلکه در تنوع است.
گروهی از ۱۵ عامل متفاوت عملکردی بهتر از ۱۵ نسخهی یکسان از “بهترین مدل تکی” داشتند.
و وقتی خود Gemini عاملهای جدید طراحی کرد، سیستم حتی از قبل هم بهتر شد — یعنی خودتکاملی (self-evolution) در عمل!
---
🧩 این پژوهش نشان میدهد:
شاید گام بعدی در تکامل هوش مصنوعی، نه از «تریلیون پارامتر»، بلکه از شبکهای از مدلهای کوچک و هماهنگ بیاید که یاد میگیرند با هم فکر کنند.
📄 جزئیات کامل:
arxiv.org/pdf/2510.01279
@rss_ai_ir
#Google #TUMIX #AIagents #Gemini #AIresearch #Coordination #MultiAgent #ArtificialIntelligence
پروژهای به نام TUMIX از تیم Google، بهگفتهی بسیاری، یکی از هیجانانگیزترین کارهای هوش مصنوعی امسال است.
---
💡 بهجای آموزش یک مدل غولپیکر دیگر، گوگل سیستمی ساخته که در آن چندین عامل هوشمند (AI agents) همزمان و هماهنگ کار میکنند.
هر کدام نقش مخصوص خود را دارند:
یکی کد مینویسد 💻
دیگری جستوجو میکند 🔍
سومی با زبان طبیعی استدلال میکند 🧠
همگی بهصورت مستقل روی یک مسئله کار میکنند، سپس پاسخها را با هم به اشتراک گذاشته، اصلاح کرده و به تصمیم نهایی جمعی میرسند.
---
📈 نتیجه:
مدل Gemini 2.5 + TUMIX در آزمونهای استدلالی تا 17.4٪ بهتر از همه سیستمهای دیگر عمل کرد،
در حالی که هزینهی استنتاج تقریباً نصف شد!
بدون دادهی جدید، بدون آموزش اضافی — فقط با هماهنگی هوشمند میان چند عامل.
---
✨ نکتهی جالب: راز موفقیت در بزرگی مدل نیست، بلکه در تنوع است.
گروهی از ۱۵ عامل متفاوت عملکردی بهتر از ۱۵ نسخهی یکسان از “بهترین مدل تکی” داشتند.
و وقتی خود Gemini عاملهای جدید طراحی کرد، سیستم حتی از قبل هم بهتر شد — یعنی خودتکاملی (self-evolution) در عمل!
---
🧩 این پژوهش نشان میدهد:
شاید گام بعدی در تکامل هوش مصنوعی، نه از «تریلیون پارامتر»، بلکه از شبکهای از مدلهای کوچک و هماهنگ بیاید که یاد میگیرند با هم فکر کنند.
📄 جزئیات کامل:
arxiv.org/pdf/2510.01279
@rss_ai_ir
#Google #TUMIX #AIagents #Gemini #AIresearch #Coordination #MultiAgent #ArtificialIntelligence
❤3👏1👀1
This media is not supported in your browser
VIEW IN TELEGRAM
🚛🤖 یک ویدئوی دیگر که ثابت میکند خودکارسازی حملونقل خیلی نزدیکتر از آن چیزیست که فکر میکردیم.
@rss_ai_ir
#هوش_مصنوعی #رباتیک #حمل_و_نقل #خودران #اتوماسیون
@rss_ai_ir
#هوش_مصنوعی #رباتیک #حمل_و_نقل #خودران #اتوماسیون
👏4🤯2👍1😱1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖✨ شرکت Guangnian Innovation در شنژن از ربات پیشرفتهی M1 رونمایی کرد.
این ربات از یک سامانهی ماژولار مفصلی با درایو موازی استفاده میکند که بازده نیرویی را تا ۴۰٪ نسبت به طراحیهای سنتی افزایش میدهد. بدنهی سبک اما قدرتمند آن، موتورهایی پرتوان را در خود جای داده است.
🛞 ربات M1 ترکیبی از حرکت خارججادهای و حرکت سریع در مسیرهای صاف است، بهعلاوه از نورپردازی هوشمند و ناوبری خودکار بهره میبرد تا بتواند بهراحتی از میان چمن، سنگریزه و شیبهای تند عبور کند.
این ربات گامی بزرگ در مسیر رباتهای خودران و کاربردی در صنعت حملونقل و عملیات میدانی است.
#هوش_مصنوعی #ربات_انسان_نما #فناوری #GuangnianInnovation #M1
@rss_ai_ir
این ربات از یک سامانهی ماژولار مفصلی با درایو موازی استفاده میکند که بازده نیرویی را تا ۴۰٪ نسبت به طراحیهای سنتی افزایش میدهد. بدنهی سبک اما قدرتمند آن، موتورهایی پرتوان را در خود جای داده است.
🛞 ربات M1 ترکیبی از حرکت خارججادهای و حرکت سریع در مسیرهای صاف است، بهعلاوه از نورپردازی هوشمند و ناوبری خودکار بهره میبرد تا بتواند بهراحتی از میان چمن، سنگریزه و شیبهای تند عبور کند.
این ربات گامی بزرگ در مسیر رباتهای خودران و کاربردی در صنعت حملونقل و عملیات میدانی است.
#هوش_مصنوعی #ربات_انسان_نما #فناوری #GuangnianInnovation #M1
@rss_ai_ir
👍2
🧩 LightReasoner —
زمانی که مدلهای کوچک، مدلهای بزرگ را در استدلال بهتر آموزش میدهند
پژوهشگران روشی به نام LightReasoner معرفی کردهاند که به مدلهای کوچک اجازه میدهد به مدلهای بزرگتر بیاموزند کجا و چگونه باید استدلال کنند.
💡 ایدهی اصلی این است که:
بهجای آموزش مدل روی کل متن، فقط روی توکنهایی تمرکز شود که واقعاً مسیر استدلال را تغییر میدهند.
🔹 مکانیزم کار:
سیستم، یک مدل «استاد» و یک مدل «شاگرد» را روی یک مسئله اجرا میکند و نقاطی را پیدا میکند که در آنها پیشبینیهایشان تفاوت زیادی دارد.
این نقاط همان گامهای بحرانی هستند که مسیر پاسخ درست را تعیین میکنند.
سپس مدل:
❌فقط همین گامهای دشوار را نگه میدارد،
❌تفاوت استاد را به هدف آموزشی نرم تبدیل میکند،
❌توکنهای ساده و بدیهی را نادیده میگیرد.
📉 نتیجه:
♻️سرعت آموزش تا ۹۰٪ بیشتر،
♻️تعداد توکنهای آموزشی تا ۹۹٪ کمتر،
♻️اما دقت در بنچمارکهای ریاضی برابر یا حتی بالاتر از فاینتیونینگ سنتی است.
♻️اثر این روش زمانی بیشتر است که مدل شاگرد نهتنها کوچکتر، بلکه در حوزهی دانشی خاص نیز با مدل استاد متفاوت باشد.
حذف هر یک از مؤلفهها — انتخاب گامها یا اهداف متضاد — باعث افت عملکرد میشود.
📄 مقاله: arxiv.org/abs/2510.07962
#هوش_مصنوعی #یادگیری_ماشین #استدلال #LightReasoner #LLM
زمانی که مدلهای کوچک، مدلهای بزرگ را در استدلال بهتر آموزش میدهند
پژوهشگران روشی به نام LightReasoner معرفی کردهاند که به مدلهای کوچک اجازه میدهد به مدلهای بزرگتر بیاموزند کجا و چگونه باید استدلال کنند.
💡 ایدهی اصلی این است که:
بهجای آموزش مدل روی کل متن، فقط روی توکنهایی تمرکز شود که واقعاً مسیر استدلال را تغییر میدهند.
🔹 مکانیزم کار:
سیستم، یک مدل «استاد» و یک مدل «شاگرد» را روی یک مسئله اجرا میکند و نقاطی را پیدا میکند که در آنها پیشبینیهایشان تفاوت زیادی دارد.
این نقاط همان گامهای بحرانی هستند که مسیر پاسخ درست را تعیین میکنند.
سپس مدل:
❌فقط همین گامهای دشوار را نگه میدارد،
❌تفاوت استاد را به هدف آموزشی نرم تبدیل میکند،
❌توکنهای ساده و بدیهی را نادیده میگیرد.
📉 نتیجه:
♻️سرعت آموزش تا ۹۰٪ بیشتر،
♻️تعداد توکنهای آموزشی تا ۹۹٪ کمتر،
♻️اما دقت در بنچمارکهای ریاضی برابر یا حتی بالاتر از فاینتیونینگ سنتی است.
♻️اثر این روش زمانی بیشتر است که مدل شاگرد نهتنها کوچکتر، بلکه در حوزهی دانشی خاص نیز با مدل استاد متفاوت باشد.
حذف هر یک از مؤلفهها — انتخاب گامها یا اهداف متضاد — باعث افت عملکرد میشود.
📄 مقاله: arxiv.org/abs/2510.07962
#هوش_مصنوعی #یادگیری_ماشین #استدلال #LightReasoner #LLM
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
😳 باورکردنی نیست اگر این درز اطلاعات واقعیت داشته باشه!
🎶 احتمالاGemini 3.0 ظاهراً قادره موسیقی اصلی بسازه و خودش اجراش کنه!
گوگل واقعاً داره مرز بین مدل زبانی و هنرمند دیجیتال رو از بین میبره.
مدل نهتنها متن و تصویر، بلکه حالا نت، ریتم، و اجرای زندهی موسیقی رو هم تولید میکنه.
🎹 اگه درست باشه، یعنی وارد دورهای شدیم که مدلهای مولد چندوجهی (multimodal) واقعاً میتونن خلاقیت انسانی رو شبیهسازی کنن.
@rss_ai_ir
#Gemini3 #AI #Google #GenerativeAI #MusicAI #Innovation
🎶 احتمالاGemini 3.0 ظاهراً قادره موسیقی اصلی بسازه و خودش اجراش کنه!
گوگل واقعاً داره مرز بین مدل زبانی و هنرمند دیجیتال رو از بین میبره.
مدل نهتنها متن و تصویر، بلکه حالا نت، ریتم، و اجرای زندهی موسیقی رو هم تولید میکنه.
🎹 اگه درست باشه، یعنی وارد دورهای شدیم که مدلهای مولد چندوجهی (multimodal) واقعاً میتونن خلاقیت انسانی رو شبیهسازی کنن.
@rss_ai_ir
#Gemini3 #AI #Google #GenerativeAI #MusicAI #Innovation
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
😶🌫️ رندر؟ ویدیو؟ یا تولید مصنوعی؟
🎢 دیزنیلند چینی وارد صحنه شده...
از یه طرف، تولیدات تصویریای که دیگه از ویدیو واقعی قابل تشخیص نیستن.
از اون طرف، رباتهایی که از همین تولیدات مصنوعی هم واقعیتر بهنظر میان.
🔻 «راهروی واقعیت چرمی» داره تنگتر میشه — مرزی که بین انسان و ماشین بود، هر روز محوتر.
و جالبه که Unitree چطور با سگهای رباتیکش از مسیر «کودک و سرگرمی» وارد میشه،
تا روزی که اون موجودات بزرگترِ پشت حصار، بیان و روی چمنها قدم بزنن…
@rss_ai_ir
#رباتیک #Unitree #AI #Reality #RobotDogs #Future
🎢 دیزنیلند چینی وارد صحنه شده...
از یه طرف، تولیدات تصویریای که دیگه از ویدیو واقعی قابل تشخیص نیستن.
از اون طرف، رباتهایی که از همین تولیدات مصنوعی هم واقعیتر بهنظر میان.
🔻 «راهروی واقعیت چرمی» داره تنگتر میشه — مرزی که بین انسان و ماشین بود، هر روز محوتر.
و جالبه که Unitree چطور با سگهای رباتیکش از مسیر «کودک و سرگرمی» وارد میشه،
تا روزی که اون موجودات بزرگترِ پشت حصار، بیان و روی چمنها قدم بزنن…
@rss_ai_ir
#رباتیک #Unitree #AI #Reality #RobotDogs #Future
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 بساز انساننمای خودت!
پروژهی OpenArm یک طرح کاملاً متنباز برای ساخت ربات انساننماست که هرچیزی برای شروع لازم دارید را در اختیارتان میگذارد — از مدلهای CAD و فریمور تا نرمافزار کنترل و شبیهسازها.
🦾 با این سیستم میتونید بازوهای رباتیک بسازید، تغییر بدید و کنترل کنید؛
پشتیبانی از تلهاپراسیون با فیدبک نیرویی و جبران گرانش باعث میشه کنترل بازو طبیعی و دقیق باشه.
💡 یکپارچه با MuJoCo و Isaac Sim — میتونید قبل از اجرای واقعی، کنترل و حرکتها رو در محیط مجازی تست کنید.
🔩 هدف پروژه ساده است:
دموکراتیزه کردن رباتیک — تا هر پژوهشگر، استارتاپ یا علاقهمند بتونه از مرحلهی ایده به ربات واقعی برسه.
میتونید خودتون بسازید یا نسخهی آماده سفارش بدید.
توسعهدهنده: Enactic (توکیو، ژاپن) 🇯🇵
GitHub: github.com/enactic/OpenArm
@rss_ai_ir
#OpenSource #Robot #Humanoid #Robotics #AI #Engineering #Enactic
پروژهی OpenArm یک طرح کاملاً متنباز برای ساخت ربات انساننماست که هرچیزی برای شروع لازم دارید را در اختیارتان میگذارد — از مدلهای CAD و فریمور تا نرمافزار کنترل و شبیهسازها.
🦾 با این سیستم میتونید بازوهای رباتیک بسازید، تغییر بدید و کنترل کنید؛
پشتیبانی از تلهاپراسیون با فیدبک نیرویی و جبران گرانش باعث میشه کنترل بازو طبیعی و دقیق باشه.
💡 یکپارچه با MuJoCo و Isaac Sim — میتونید قبل از اجرای واقعی، کنترل و حرکتها رو در محیط مجازی تست کنید.
🔩 هدف پروژه ساده است:
دموکراتیزه کردن رباتیک — تا هر پژوهشگر، استارتاپ یا علاقهمند بتونه از مرحلهی ایده به ربات واقعی برسه.
میتونید خودتون بسازید یا نسخهی آماده سفارش بدید.
توسعهدهنده: Enactic (توکیو، ژاپن) 🇯🇵
GitHub: github.com/enactic/OpenArm
@rss_ai_ir
#OpenSource #Robot #Humanoid #Robotics #AI #Engineering #Enactic
❤3
This media is not supported in your browser
VIEW IN TELEGRAM
💻🤯 Gemini 3.0 Pro
میتواند شبیهساز کامل سیستمعامل بسازد!
گوگل با مدل جدید Gemini 3.0 Pro مرزهای خلاقیت هوش مصنوعی را جابهجا کرده است — کاربران گزارش دادهاند که این مدل میتواند تنها با یک پرامپت ساده، یک سیستمعامل شبیه Windows یا macOS را بهطور کامل در قالب یک فایل HTML ایجاد کند!
🔹 یکی از کاربران از Gemini خواسته بود:
🔹 نتیجه؟
یک شبیهساز کامل و تعاملی از Windows و macOS که تنها با HTML، CSS و JavaScript در مرورگر اجرا میشود — با آیکونها، انیمیشنها و اپهای واقعی.
🔹 دموی زنده را میتوانید اینجا ببینید:
🪟 نسخه Windows
🍎 نسخه macOS
🔹 نسخه عمومی Gemini 3.0 طبق شایعات در اکتبر منتشر میشود، و مدلهای Pro در Google AI Studio در دسترس خواهند بود.
اگر این دمو واقعاً بازتاب تواناییهای مدل باشد، Gemini بهزودی مرز بین دستیار برنامهنویسی و خالق خودکار نرمافزار را از بین خواهد برد.
@rss_ai_ir
#Gemini3 #AI #Google #WebOS #GenerativeAI #Coding #Innovation
میتواند شبیهساز کامل سیستمعامل بسازد!
گوگل با مدل جدید Gemini 3.0 Pro مرزهای خلاقیت هوش مصنوعی را جابهجا کرده است — کاربران گزارش دادهاند که این مدل میتواند تنها با یک پرامپت ساده، یک سیستمعامل شبیه Windows یا macOS را بهطور کامل در قالب یک فایل HTML ایجاد کند!
🔹 یکی از کاربران از Gemini خواسته بود:
> «یک سیستمعامل وب مانند Windows بساز با ویرایشگر متن، ترمینال (با پشتیبانی از Python)، فایلمنیجر، Paint، ویرایشگر ویدیو و چند ابزار دیگر.»
و مدل تمام کد را در یک مرحله تحویل داد.
🔹 نتیجه؟
یک شبیهساز کامل و تعاملی از Windows و macOS که تنها با HTML، CSS و JavaScript در مرورگر اجرا میشود — با آیکونها، انیمیشنها و اپهای واقعی.
🔹 دموی زنده را میتوانید اینجا ببینید:
🪟 نسخه Windows
🍎 نسخه macOS
🔹 نسخه عمومی Gemini 3.0 طبق شایعات در اکتبر منتشر میشود، و مدلهای Pro در Google AI Studio در دسترس خواهند بود.
اگر این دمو واقعاً بازتاب تواناییهای مدل باشد، Gemini بهزودی مرز بین دستیار برنامهنویسی و خالق خودکار نرمافزار را از بین خواهد برد.
@rss_ai_ir
#Gemini3 #AI #Google #WebOS #GenerativeAI #Coding #Innovation
❤4🔥3
🔥 خبر داغ برای علاقهمندان هوش مصنوعی!
کاربرها گزارش دادهاند که Veo 3.1 روی Google Flow فعال شده — البته فقط با VPN آمریکایی 🇺🇸 قابل دسترسه.
🎬 نسخهی جدید Veo طبق شایعات:
♻️پشتیبانی از ویدیوهای تا ۶۰ ثانیه
♻️سینک بهتر کاراکترها و اشیا
♻️حالتهای سینمایی و پریستهای نور و رنگ
♻️ابزار ساخت صحنه و ویرایش ویدیو داخل Flow
❌بهنظر میرسه گوگل داره جدیتر از همیشه وارد رقابت با Sora از OpenAI میشه.
@rss_ai_ir
#Veo3 #GoogleAI #Flow #VideoGeneration #GenerativeAI #Sora
کاربرها گزارش دادهاند که Veo 3.1 روی Google Flow فعال شده — البته فقط با VPN آمریکایی 🇺🇸 قابل دسترسه.
🎬 نسخهی جدید Veo طبق شایعات:
♻️پشتیبانی از ویدیوهای تا ۶۰ ثانیه
♻️سینک بهتر کاراکترها و اشیا
♻️حالتهای سینمایی و پریستهای نور و رنگ
♻️ابزار ساخت صحنه و ویرایش ویدیو داخل Flow
❌بهنظر میرسه گوگل داره جدیتر از همیشه وارد رقابت با Sora از OpenAI میشه.
@rss_ai_ir
#Veo3 #GoogleAI #Flow #VideoGeneration #GenerativeAI #Sora
🔥 پژوهشی تازه نشان میدهد که GPT-6 ممکن است نه فقط هوشمندتر، بلکه از نظر محاسباتی «زنده» باشد!
🧠 مقالهای با عنوان SEAL (Self-Adapting Language Models) در arXiv:2506.10943 منتشر شده که توضیح میدهد چگونه یک مدل زبانی میتواند پس از استقرار در دنیای واقعی، به یادگیری مداوم ادامه دهد — بدون نیاز به بازآموزی (retraining).
چند نفر از نویسندگان SEAL اکنون در OpenAI فعالیت میکنند 👀 و احتمال زیادی وجود دارد که این فناوری در GPT-6 به کار گرفته شود.
ویژگیهای کلیدی SEAL:
📚 یادگیری از دادههای جدید در زمان واقعی
🔧 ترمیم خودکار دانش تخریبشده
🧩 ایجاد حافظههای پایدار در میان جلسات مختلف
اگر GPT-6 این معماری را بپذیرد، دیگر صرفاً از دادهها استفاده نخواهد کرد — بلکه آنها را جذب میکند.
مدلی که با تغییر جهان، خودش هم تغییر میکند و هر روز بهتر میشود.
📈 این میتواند آغاز عصر یادگیری پیوسته باشد — پایانی بر دورهی مدلهای ثابت و منجمد.
به فصل جدید خوش آمدید.
https://arxiv.org/abs/2506.10943
@rss_ai_ir
#GPT6 #OpenAI #SEAL #AI #ContinuousLearning #MachineLearning
🧠 مقالهای با عنوان SEAL (Self-Adapting Language Models) در arXiv:2506.10943 منتشر شده که توضیح میدهد چگونه یک مدل زبانی میتواند پس از استقرار در دنیای واقعی، به یادگیری مداوم ادامه دهد — بدون نیاز به بازآموزی (retraining).
چند نفر از نویسندگان SEAL اکنون در OpenAI فعالیت میکنند 👀 و احتمال زیادی وجود دارد که این فناوری در GPT-6 به کار گرفته شود.
ویژگیهای کلیدی SEAL:
📚 یادگیری از دادههای جدید در زمان واقعی
🔧 ترمیم خودکار دانش تخریبشده
🧩 ایجاد حافظههای پایدار در میان جلسات مختلف
اگر GPT-6 این معماری را بپذیرد، دیگر صرفاً از دادهها استفاده نخواهد کرد — بلکه آنها را جذب میکند.
مدلی که با تغییر جهان، خودش هم تغییر میکند و هر روز بهتر میشود.
📈 این میتواند آغاز عصر یادگیری پیوسته باشد — پایانی بر دورهی مدلهای ثابت و منجمد.
به فصل جدید خوش آمدید.
https://arxiv.org/abs/2506.10943
@rss_ai_ir
#GPT6 #OpenAI #SEAL #AI #ContinuousLearning #MachineLearning
👍2👏1