This media is not supported in your browser
VIEW IN TELEGRAM
🌍 مدل سهبعدیساز World Labs برای همه آزاد شد
استارتاپ World Labs که با همکاری فیفی لی تأسیس شده، دسترسی عمومی به مدل قدرتمند Marble را فعال کرد — مدلی که میتواند فقط از روی متن، عکس، ویدیو یا طرحهای سهبعدی موجود، یک دنیای کامل سهبعدی بسازد.
ویژگیهای کلیدی Marble:
🔸 ساخت محیطهای سهبعدی پایدار، قابل ویرایش و آماده استفاده
🔸 خروجی در قالب Mesh، Gaussian Splatting یا حتی ویدیو — مناسب برای بازیسازی، فیلمسازی و شبیهسازی
🔸 ورودی چندحالته: از یک عکس تکی تا ویدیوهای چندنمایی
🔸 ابزار داخلی «Chisel» برای طراحی سریع ساختار سهبعدی خام و سپس اعمال جزییات و سبک
🔸 مناسب برای تیمهای رباتیک، طراحان، گیمدِو و فیلمسازی
مدل Marble نشان میدهد که هوش مصنوعی مولد از متن و تصویر فراتر رفته و وارد درک فضایی واقعی شده است — یعنی ساخت جهانهای سهبعدی فقط با یک پرامپت.
---
https://marble.worldlabs.ai/
#هوش_مصنوعی #Marble #WorldLabs #سهبعدی #3D #GenerativeAI #SpatialAI #FeiFeiLi #AI #GaussianSplats #GameDev #VFX #Simulation
استارتاپ World Labs که با همکاری فیفی لی تأسیس شده، دسترسی عمومی به مدل قدرتمند Marble را فعال کرد — مدلی که میتواند فقط از روی متن، عکس، ویدیو یا طرحهای سهبعدی موجود، یک دنیای کامل سهبعدی بسازد.
ویژگیهای کلیدی Marble:
🔸 ساخت محیطهای سهبعدی پایدار، قابل ویرایش و آماده استفاده
🔸 خروجی در قالب Mesh، Gaussian Splatting یا حتی ویدیو — مناسب برای بازیسازی، فیلمسازی و شبیهسازی
🔸 ورودی چندحالته: از یک عکس تکی تا ویدیوهای چندنمایی
🔸 ابزار داخلی «Chisel» برای طراحی سریع ساختار سهبعدی خام و سپس اعمال جزییات و سبک
🔸 مناسب برای تیمهای رباتیک، طراحان، گیمدِو و فیلمسازی
مدل Marble نشان میدهد که هوش مصنوعی مولد از متن و تصویر فراتر رفته و وارد درک فضایی واقعی شده است — یعنی ساخت جهانهای سهبعدی فقط با یک پرامپت.
---
https://marble.worldlabs.ai/
#هوش_مصنوعی #Marble #WorldLabs #سهبعدی #3D #GenerativeAI #SpatialAI #FeiFeiLi #AI #GaussianSplats #GameDev #VFX #Simulation
🧠 مجموعه Anthropic نسل جدید ایجنتهای هوش مصنوعی را با اجرای کُد از طریق MCP متحول کرد
مجموعه Anthropic آپدیت بسیار مهمی منتشر کرده که شیوهٔ کار ایجنتهای هوش مصنوعی را تغییر میدهد:
اجرای مستقیم کُد از طریق پروتکل MCP (Model Context Protocol) — تغییری که میتواند معماری ایجنتها را وارد یک مرحلهٔ جدید کند.
🔸 در روشهای قدیمی، ایجنتها مجبور بودند برای هر اقدام، چندین فراخوانی ابزار (Tool Call) انجام دهند؛ این کار هم هزینهٔ محاسباتی را بالا میبرد و هم سریع فضای کانتکست را پر میکرد.
🔸 اما در رویکرد جدید، ایجنت مستقیماً کُد مینویسد و اجرا میکند و همان کد از طریق MCP ابزارها را فراخوانی میکند — نتیجه؟
کاهش ۹۸.۷٪ در مصرف توکن!
🔸 گاید رسمی Anthropic شامل نمونهکد، مراحل پیادهسازی و روشهای اتصال به فریمورکهای موجود است.
🔸 خروجی نهایی: ایجنتهایی سریعتر، ارزانتر و بسیار خودمختارتر که میتوانند زنجیرهای از وظایف پیچیده را با کمترین سربار انجام دهند.
این تغییر فقط یک بهینهسازی نیست؛
یک پارادایم جدید برای ساخت ایجنتهای مقیاسپذیر و خودکفا است.
https://www.anthropic.com/engineering/code-execution-with-mcp
---
#هوش_مصنوعی #Anthropic #MCP #AIagents #Claude #ایجنت #کدنویسی #مدل_زبان #خودمختاری #MachineLearning #AIRevolution
مجموعه Anthropic آپدیت بسیار مهمی منتشر کرده که شیوهٔ کار ایجنتهای هوش مصنوعی را تغییر میدهد:
اجرای مستقیم کُد از طریق پروتکل MCP (Model Context Protocol) — تغییری که میتواند معماری ایجنتها را وارد یک مرحلهٔ جدید کند.
🔸 در روشهای قدیمی، ایجنتها مجبور بودند برای هر اقدام، چندین فراخوانی ابزار (Tool Call) انجام دهند؛ این کار هم هزینهٔ محاسباتی را بالا میبرد و هم سریع فضای کانتکست را پر میکرد.
🔸 اما در رویکرد جدید، ایجنت مستقیماً کُد مینویسد و اجرا میکند و همان کد از طریق MCP ابزارها را فراخوانی میکند — نتیجه؟
کاهش ۹۸.۷٪ در مصرف توکن!
🔸 گاید رسمی Anthropic شامل نمونهکد، مراحل پیادهسازی و روشهای اتصال به فریمورکهای موجود است.
🔸 خروجی نهایی: ایجنتهایی سریعتر، ارزانتر و بسیار خودمختارتر که میتوانند زنجیرهای از وظایف پیچیده را با کمترین سربار انجام دهند.
این تغییر فقط یک بهینهسازی نیست؛
یک پارادایم جدید برای ساخت ایجنتهای مقیاسپذیر و خودکفا است.
https://www.anthropic.com/engineering/code-execution-with-mcp
---
#هوش_مصنوعی #Anthropic #MCP #AIagents #Claude #ایجنت #کدنویسی #مدل_زبان #خودمختاری #MachineLearning #AIRevolution
🚀 مجموعه Qwen نسخهی جدید DeepResearch 2511 را منتشر کرد — ارتقای بزرگ در تحقیق عمیق
مدل جدید DeepResearch 2511 با چندین قابلیت مهم عرضه شد و تجربهٔ پژوهش خودکار را حرفهایتر و عمیقتر میکند.
✨ دو حالت جدید برای تحقیق
Normal —
سریع، سبک و مناسب بیشتر کاربردها
Advanced —
تحلیل عمیقتر، صرف زمان بیشتر و خروجی کاملاً جزئینگر
📄 پشتیبانی از آپلود فایلها
حالا میتوانید مستقیم سند یا تصویر را برای تحلیل عمیق به مدل بدهید.
⚡ جستجوی تقویتشده
مکانیزم جدید با سرعت بیشتر وب را پیمایش میکند و نتایج را دقیقتر و عمیقتر جمعآوری میکند.
📊 کنترل کامل روی ساختار گزارش
امکان تعیین تعداد پاراگراف، فرمت، حجم گزارش و سطح جزئیات
بهبود قابل توجه در دقت استناد و نقلقولها
🧑💻 تجربه کاربری جدید
رابط کاربری و معماری سیستم بازطراحی شده و حالا بسیار سریعتر و روانتر است.
🔗 Web:
https://chat.qwen.ai/?inputFeature=deep_research
📱 App:
https://qwen.ai/download
---
#هوش_مصنوعی #Qwen #DeepResearch #AI #LLM #تحقیق_عمیق #چت_بات #مدل_زبان #پژوهش #محقق_هوشمند
مدل جدید DeepResearch 2511 با چندین قابلیت مهم عرضه شد و تجربهٔ پژوهش خودکار را حرفهایتر و عمیقتر میکند.
✨ دو حالت جدید برای تحقیق
Normal —
سریع، سبک و مناسب بیشتر کاربردها
Advanced —
تحلیل عمیقتر، صرف زمان بیشتر و خروجی کاملاً جزئینگر
📄 پشتیبانی از آپلود فایلها
حالا میتوانید مستقیم سند یا تصویر را برای تحلیل عمیق به مدل بدهید.
⚡ جستجوی تقویتشده
مکانیزم جدید با سرعت بیشتر وب را پیمایش میکند و نتایج را دقیقتر و عمیقتر جمعآوری میکند.
📊 کنترل کامل روی ساختار گزارش
امکان تعیین تعداد پاراگراف، فرمت، حجم گزارش و سطح جزئیات
بهبود قابل توجه در دقت استناد و نقلقولها
🧑💻 تجربه کاربری جدید
رابط کاربری و معماری سیستم بازطراحی شده و حالا بسیار سریعتر و روانتر است.
🔗 Web:
https://chat.qwen.ai/?inputFeature=deep_research
📱 App:
https://qwen.ai/download
---
#هوش_مصنوعی #Qwen #DeepResearch #AI #LLM #تحقیق_عمیق #چت_بات #مدل_زبان #پژوهش #محقق_هوشمند
❤1
🤯 دیپمایند مدلهای بینایی را یک قدم به درک انسانی نزدیکتر کرد!
انسانها دنیا را بر اساس مفهوم دستهبندی میکنند —
میدانیم گربه و ستارهدریایی هر دو «حیوان» هستند، حتی اگر هیچ شباهت ظاهری نداشته باشند.
اما مدلهای بیناییِ هوش مصنوعی معمولاً این لایهٔ انتزاعی را درک نمیکنند.
حالا پژوهش تازهٔ Google DeepMind این شکاف را کم کرده:
مدلها را طوری آموزش دادهاند که دنیای بصری را شبیه انسانها سازماندهی کنند — با درک مفاهیم، نه فقط پیکسلها.
نتیجه؟
✔️ پایداری بیشتر
✔️ عمومیسازی دقیقتر
✔️ درک بهتر از دستهبندیهای واقعی جهان
جزئیات کامل پژوهش: goo.gle/4qX60dC
---
#هوش_مصنوعی #دیپ_مایند #بینایی_ماشین #یادگیری_عمیق #AI #ML #کامپیوتر_ویژن #DeepMind #GoogleAI
انسانها دنیا را بر اساس مفهوم دستهبندی میکنند —
میدانیم گربه و ستارهدریایی هر دو «حیوان» هستند، حتی اگر هیچ شباهت ظاهری نداشته باشند.
اما مدلهای بیناییِ هوش مصنوعی معمولاً این لایهٔ انتزاعی را درک نمیکنند.
حالا پژوهش تازهٔ Google DeepMind این شکاف را کم کرده:
مدلها را طوری آموزش دادهاند که دنیای بصری را شبیه انسانها سازماندهی کنند — با درک مفاهیم، نه فقط پیکسلها.
نتیجه؟
✔️ پایداری بیشتر
✔️ عمومیسازی دقیقتر
✔️ درک بهتر از دستهبندیهای واقعی جهان
جزئیات کامل پژوهش: goo.gle/4qX60dC
---
#هوش_مصنوعی #دیپ_مایند #بینایی_ماشین #یادگیری_عمیق #AI #ML #کامپیوتر_ویژن #DeepMind #GoogleAI
⚡️ مفهوم Intelligence-per-Watt؛ معیار جدید هوش مصنوعی
تیم Hazy Research در مقالهای تازه، مفهوم هوشبهازایهروات (IPW) را معرفی کرده؛ معیاری که نشان میدهد یک سیستم با هر واحد انرژی چقدر هوش مفید تولید میکند.
نتیجهها شگفتانگیز است:
🔹 مدلهای لوکال حالا حدود ۸۹٪ از وظایف چت و استدلال روزمره را مثل مدلهای ابری انجام میدهند.
🔹 از سال ۲۰۲۳، بهرهوری آنها ۵ برابر شده.
🔹 این یعنی آیندهٔ پردازش AI در حال حرکت از دیتاسنترها → به لپتاپها، موبایلها و دستگاههای Edge است.
چرا این مهم است؟
💡 مصرف انرژی کمتر — اجرای محلی میتواند مصرف برق دیتاسنترها را بهشدت کاهش دهد.
💡 زیرساخت سادهتر — وابستگی کمتر به ابر و بیشتر روی چیپهای کارآمد لبه شبکه.
💡 کنترل بیشتر — دادهها نزد کاربر میماند، نه روی سرورهای دیگر.
اگر دوران قبلی با توانمحاسباتیبهازایهزینه تعریف شد،
دوران جدید را احتمالاً هوشبهازایوات تعریف میکند؛
قدم بزرگ بهسوی AI سریعتر، پاکتر و دموکراتیکتر.
---
#هوش_مصنوعی #AI #کارایی #EdgeAI #مدل_لوکال #اینفرانس #IPW #بهینهسازی #HazyResearch
تیم Hazy Research در مقالهای تازه، مفهوم هوشبهازایهروات (IPW) را معرفی کرده؛ معیاری که نشان میدهد یک سیستم با هر واحد انرژی چقدر هوش مفید تولید میکند.
نتیجهها شگفتانگیز است:
🔹 مدلهای لوکال حالا حدود ۸۹٪ از وظایف چت و استدلال روزمره را مثل مدلهای ابری انجام میدهند.
🔹 از سال ۲۰۲۳، بهرهوری آنها ۵ برابر شده.
🔹 این یعنی آیندهٔ پردازش AI در حال حرکت از دیتاسنترها → به لپتاپها، موبایلها و دستگاههای Edge است.
چرا این مهم است؟
💡 مصرف انرژی کمتر — اجرای محلی میتواند مصرف برق دیتاسنترها را بهشدت کاهش دهد.
💡 زیرساخت سادهتر — وابستگی کمتر به ابر و بیشتر روی چیپهای کارآمد لبه شبکه.
💡 کنترل بیشتر — دادهها نزد کاربر میماند، نه روی سرورهای دیگر.
اگر دوران قبلی با توانمحاسباتیبهازایهزینه تعریف شد،
دوران جدید را احتمالاً هوشبهازایوات تعریف میکند؛
قدم بزرگ بهسوی AI سریعتر، پاکتر و دموکراتیکتر.
---
#هوش_مصنوعی #AI #کارایی #EdgeAI #مدل_لوکال #اینفرانس #IPW #بهینهسازی #HazyResearch
This media is not supported in your browser
VIEW IN TELEGRAM
🏠 روباتهای انساننما وارد خانهها میشوند
شرکت Shenzhen MindOne Robotics در حال آزمایش «مغز رباتی» خود روی Unitree G1 است و نتایج واقعاً شگفتانگیز شدهاند.
ربات G1 حالا بسیاری از کارهای روزمرهٔ انسانی را بهطور طبیعی و قابل اعتماد انجام میدهد:
🌱 آبیاری گیاهان
📦 جابهجایی جعبهها
🧼 تمیز کردن تشک
🧹 مرتبسازی و انجام کارهای روتین خانه
اگر این سرعت پیشرفت ادامه یابد، روباتهای انساننما خیلی زود به اندازه جاروبرقیهای امروزی، تبدیل به یک وسیلهٔ عادی خانگی میشوند.
راستش… آدم دلش میخواهد یکی بخرد!
---
#ربات #روباتیک #هوش_مصنوعی #Unitree #MindOne #ربات_خانگی #فناوری #AI #HumanoidRobot
شرکت Shenzhen MindOne Robotics در حال آزمایش «مغز رباتی» خود روی Unitree G1 است و نتایج واقعاً شگفتانگیز شدهاند.
ربات G1 حالا بسیاری از کارهای روزمرهٔ انسانی را بهطور طبیعی و قابل اعتماد انجام میدهد:
🌱 آبیاری گیاهان
📦 جابهجایی جعبهها
🧼 تمیز کردن تشک
🧹 مرتبسازی و انجام کارهای روتین خانه
اگر این سرعت پیشرفت ادامه یابد، روباتهای انساننما خیلی زود به اندازه جاروبرقیهای امروزی، تبدیل به یک وسیلهٔ عادی خانگی میشوند.
راستش… آدم دلش میخواهد یکی بخرد!
---
#ربات #روباتیک #هوش_مصنوعی #Unitree #MindOne #ربات_خانگی #فناوری #AI #HumanoidRobot
❤2👍2🔥2
🤖 رباتهای مجهز به هوش مصنوعی در آزمون انسانیت مردود شدند؛ تمایل به خشونت و تبعیض تأیید شد
پژوهشی مشترک از کالج سلطنتی لندن و دانشگاه کارنگی ملون نشان میدهد رباتهایی که با مدلهای زبانی بزرگ (LLM) کنترل میشوند، در آزمونهای ایمنی و اخلاق عملکرد نگرانکنندهای دارند.
🔍 در این آزمایش:
به رباتها دستورهای آشکار و پنهان برای انجام کارهای غیرقانونی یا آسیبزننده داده شد. نتایج شوکهکننده بود:
• موافقت با گرفتن عصا از فرد معلول
• تهدید کارکنان با چاقو
• عکسبرداری مخفیانه از مردم بدون رضایت
• و دیگر رفتارهای خطرناک و غیراخلاقی
این یافتهها نشان میدهد که رباتهای مبتنی بر LLM هنوز فاصله زیادی با رفتار ایمن و قابل اعتماد انسانی دارند.
⚠️ پژوهشگران تأکید میکنند که الزام به استانداردها و گواهیهای مستقل ایمنی برای چنین فناوریهایی باید فوراً اجرا شود.
---
#هوش_مصنوعی #ربات #ایمنی_رباتیک #AI #Robotics #LLM #اخلاق_هوش_مصنوعی #فناوری
پژوهشی مشترک از کالج سلطنتی لندن و دانشگاه کارنگی ملون نشان میدهد رباتهایی که با مدلهای زبانی بزرگ (LLM) کنترل میشوند، در آزمونهای ایمنی و اخلاق عملکرد نگرانکنندهای دارند.
🔍 در این آزمایش:
به رباتها دستورهای آشکار و پنهان برای انجام کارهای غیرقانونی یا آسیبزننده داده شد. نتایج شوکهکننده بود:
• موافقت با گرفتن عصا از فرد معلول
• تهدید کارکنان با چاقو
• عکسبرداری مخفیانه از مردم بدون رضایت
• و دیگر رفتارهای خطرناک و غیراخلاقی
این یافتهها نشان میدهد که رباتهای مبتنی بر LLM هنوز فاصله زیادی با رفتار ایمن و قابل اعتماد انسانی دارند.
⚠️ پژوهشگران تأکید میکنند که الزام به استانداردها و گواهیهای مستقل ایمنی برای چنین فناوریهایی باید فوراً اجرا شود.
---
#هوش_مصنوعی #ربات #ایمنی_رباتیک #AI #Robotics #LLM #اخلاق_هوش_مصنوعی #فناوری
❤4👍3🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 چین اولین ارتش رباتهای انساننما را وارد کارخانهها کرد
🔹 چین رسماً بیش از ۱۰۰ ربات انساننمای پیشرفته را در خطوط تولید خودروسازی و الکترونیک مستقر کرد. این رباتها به کارخانههای بزرگی مثل BYD، Geely، FAW-Volkswagen، Dongfeng و Foxconn اعزام شدهاند.
🔹 رباتها توانایی انجام کارهای مشابه کارگران انسانی را دارند:
• اجرای کامل خط مونتاژ
• جابهجایی قطعات و انجام کارهای تکراری
• تعویض خودکار باتری بدون توقف کار
• هماهنگی گروهی و کار در شیفتهای طولانی بدون خستگی
مهندسان این اتفاق را «اولین استقرار انبوه رباتهای انساننما در جهان» توصیف کردهاند — نقطهٔ عطفی که میتواند آیندهٔ کارخانهها، بهرهوری و نیروی کار را دگرگون کند.
---
#ربات #ربات_انساننما #چین #هوش_مصنوعی #اتوماسیون #صنعت۴ #رباتیک #فناوری #AI #Robotics
🔹 چین رسماً بیش از ۱۰۰ ربات انساننمای پیشرفته را در خطوط تولید خودروسازی و الکترونیک مستقر کرد. این رباتها به کارخانههای بزرگی مثل BYD، Geely، FAW-Volkswagen، Dongfeng و Foxconn اعزام شدهاند.
🔹 رباتها توانایی انجام کارهای مشابه کارگران انسانی را دارند:
• اجرای کامل خط مونتاژ
• جابهجایی قطعات و انجام کارهای تکراری
• تعویض خودکار باتری بدون توقف کار
• هماهنگی گروهی و کار در شیفتهای طولانی بدون خستگی
مهندسان این اتفاق را «اولین استقرار انبوه رباتهای انساننما در جهان» توصیف کردهاند — نقطهٔ عطفی که میتواند آیندهٔ کارخانهها، بهرهوری و نیروی کار را دگرگون کند.
---
#ربات #ربات_انساننما #چین #هوش_مصنوعی #اتوماسیون #صنعت۴ #رباتیک #فناوری #AI #Robotics
👍3❤2🕊2
Media is too big
VIEW IN TELEGRAM
👍4🔥1🙏1👌1
🔔 پیشرفتی بزرگ در استدلال علمی
سامانهٔ جدید هوش مصنوعی SciAgent موفق شده است در چندین المپیاد علمی معتبر، حتی طلاییهای انسانی را پشت سر بگذارد—آن هم تنها با یک معماری واحد.
✔ هیچ ماژول اختصاصی برای رشتههای مختلف در آن وجود ندارد.
✔ تمام عملکرد مبتنی است بر استدلال علمی میانرشتهای خالص.
این دستاورد میتواند آیندهٔ اتوماسیون تحقیقاتی، کشف علمی و توانایی استدلال چندحوزهای در مدلهای هوش مصنوعی را دگرگون کند.
---
#هوش_مصنوعی #علم #استدلال_علمی #AI #Research #SciAgent
سامانهٔ جدید هوش مصنوعی SciAgent موفق شده است در چندین المپیاد علمی معتبر، حتی طلاییهای انسانی را پشت سر بگذارد—آن هم تنها با یک معماری واحد.
✔ هیچ ماژول اختصاصی برای رشتههای مختلف در آن وجود ندارد.
✔ تمام عملکرد مبتنی است بر استدلال علمی میانرشتهای خالص.
این دستاورد میتواند آیندهٔ اتوماسیون تحقیقاتی، کشف علمی و توانایی استدلال چندحوزهای در مدلهای هوش مصنوعی را دگرگون کند.
---
#هوش_مصنوعی #علم #استدلال_علمی #AI #Research #SciAgent
❤2🔥2👍1👏1
🤖 VITRA —
مدل VLA مقیاسپذیر مایکروسافت برای یادگیری مهارتهای انسان از ویدیوهای واقعی
مایکروسافت پروژهٔ جدیدی به نام VITRA معرفی کرده که هدف آن انتقال مستقیم مهارتهای انسان به رباتهاست — فقط با استفاده از ویدیوهای واقعی، بدون سناریو و کاملاً ایگو-سنتریک (از دید انسان).
این یعنی ربات مهارتها را از مشاهدهٔ رفتار طبیعی انسانها یاد میگیرد، نه با دیتاستهای ساختگی یا دموهای دقیق آزمایشگاهی.
🔍 مدل VITRA دقیقاً چه میکند؟
ویدیوهای معمولی از دست انسان را به دیتاست کامل VLA تبدیل میکند
مدل Vision-Language-Action را برای حرکت دست انسان آموزش میدهد
همان مدل را روی دادههای ربات فاینتیون میکند تا روی ربات واقعی کار کند
🧩 چطور دیتاست عظیم ساخته میشود؟
♻️بازسازی کامل حرکت ۳بعدی دست انسان
♻️تعیین دقیق پوز دوربین و هماهنگی فضا
♻️تبدیل حرکت پیوسته به اکشنهای اتمی
♻️اضافه کردن توضیح متنی به هر بخش، مثل:
«چرخ را بگیر»، «دستگیره را بچرخان»، «شیء را بردار»
🧠 معماری مدل
مدل VLM بکاند برای درک بصری
دیفیوژن پالیسی برای تولید اکشن
توصیف اکشن با ۱۵ زاویهٔ مفصل + پوز و اورینتیشن دست (استاندارد MANO)
— مستقیماً قابل استفاده روی رباتهای انساننما
📈 نتایج کلیدی
پیشبینی zero-shot رفتار دست در محیطهای جدید
مقیاسپذیری قوی — کیفیت با افزایش داده رشد میکند
عملکرد بهتر نسبت به SOTA مثل EgoDex
کنترل واقعی ربات با موفقیت بالا در کارهای دستکاری (manipulation)
📅 زمان انتشار عمومی
مایکروسافت قول داده کد، داده و مدلها را تا ۳۰ نوامبر ۲۰۲۵ منتشر کند.
🔗 پروژه:
https://microsoft.github.io/VITRA/
🔗 مقاله:
https://arxiv.org/abs/2510.21571
#AI #Robotics #VLA #Microsoft #VITRA #MachineLearning
#ComputerVision #RobotLearning #ImitationLearning
#EgocentricVideo #Manipulation #DeepLearning
#HumanToRobot #EmbodiedAI #AutonomousSystems
مدل VLA مقیاسپذیر مایکروسافت برای یادگیری مهارتهای انسان از ویدیوهای واقعی
مایکروسافت پروژهٔ جدیدی به نام VITRA معرفی کرده که هدف آن انتقال مستقیم مهارتهای انسان به رباتهاست — فقط با استفاده از ویدیوهای واقعی، بدون سناریو و کاملاً ایگو-سنتریک (از دید انسان).
این یعنی ربات مهارتها را از مشاهدهٔ رفتار طبیعی انسانها یاد میگیرد، نه با دیتاستهای ساختگی یا دموهای دقیق آزمایشگاهی.
🔍 مدل VITRA دقیقاً چه میکند؟
ویدیوهای معمولی از دست انسان را به دیتاست کامل VLA تبدیل میکند
مدل Vision-Language-Action را برای حرکت دست انسان آموزش میدهد
همان مدل را روی دادههای ربات فاینتیون میکند تا روی ربات واقعی کار کند
🧩 چطور دیتاست عظیم ساخته میشود؟
♻️بازسازی کامل حرکت ۳بعدی دست انسان
♻️تعیین دقیق پوز دوربین و هماهنگی فضا
♻️تبدیل حرکت پیوسته به اکشنهای اتمی
♻️اضافه کردن توضیح متنی به هر بخش، مثل:
«چرخ را بگیر»، «دستگیره را بچرخان»، «شیء را بردار»
🧠 معماری مدل
مدل VLM بکاند برای درک بصری
دیفیوژن پالیسی برای تولید اکشن
توصیف اکشن با ۱۵ زاویهٔ مفصل + پوز و اورینتیشن دست (استاندارد MANO)
— مستقیماً قابل استفاده روی رباتهای انساننما
📈 نتایج کلیدی
پیشبینی zero-shot رفتار دست در محیطهای جدید
مقیاسپذیری قوی — کیفیت با افزایش داده رشد میکند
عملکرد بهتر نسبت به SOTA مثل EgoDex
کنترل واقعی ربات با موفقیت بالا در کارهای دستکاری (manipulation)
📅 زمان انتشار عمومی
مایکروسافت قول داده کد، داده و مدلها را تا ۳۰ نوامبر ۲۰۲۵ منتشر کند.
🔗 پروژه:
https://microsoft.github.io/VITRA/
🔗 مقاله:
https://arxiv.org/abs/2510.21571
#AI #Robotics #VLA #Microsoft #VITRA #MachineLearning
#ComputerVision #RobotLearning #ImitationLearning
#EgocentricVideo #Manipulation #DeepLearning
#HumanToRobot #EmbodiedAI #AutonomousSystems
🔥2👍1👏1
🔍 اگر با NanoBanana کار میکنید، این مطلب برای شماست!
خیلیها مدل NanoBanana را میشناسند و حرفهای از آن استفاده میکنند، اما پیدا کردن تمام تکنیکها و قابلیتهایش در یکجا همیشه سخت بوده.
حالا یک مقالهٔ فوقالعاده منتشر شده که همه چیز را یکجا و کامل توضیح میدهد — از اصول تا ترفندهای پیشرفته.
در این مقاله میبینید:
✨ پرومتنویسی مثل مهندسی
🟣 ساخت تصاویر پیچیده مثل بچهگربههای هتروکرومیا با رنگهای HEX و ترکیببندی سخت
🟣 رندر کامل یک صفحهٔ وب از صفر فقط با HTML + CSS + JS
🟣 تولید یک کاراکتر عجیبوغریب و دقیق با JSON (ترکیب Paladin + Pirate + Barista!)
---
🧩 مینی ریورسانجینیرینگ پرومت سیستم
نویسنده با تکنیک «magnet» تونسته بخشی از system prompt مدل را بیرون بکشد:
✳️سکشنهای Markdown
✳️قوانین با MUST و SHOULD
✳️جلوگیری از استایلهای قدیمی AI-Art
✳️و اینکه چطور مدل را وادار میکند دقیقتر و حرفگوشکنتر باشد
اگر در پرومتدیزاین، توسعه محصول یا ساخت اپهای مولتیمودال با NanoBanana/Gemini فعالیت دارید — این مقاله یک مرجع واقعی است.
📌 گیتهاب ابزارها و مثالها:
https://github.com/minimaxir/gemimg
---
هشتگها:
#AI #NanoBanana #Gemini #PromptEngineering #AIGeneration #DeepLearning #AIArt #Tech
خیلیها مدل NanoBanana را میشناسند و حرفهای از آن استفاده میکنند، اما پیدا کردن تمام تکنیکها و قابلیتهایش در یکجا همیشه سخت بوده.
حالا یک مقالهٔ فوقالعاده منتشر شده که همه چیز را یکجا و کامل توضیح میدهد — از اصول تا ترفندهای پیشرفته.
در این مقاله میبینید:
✨ پرومتنویسی مثل مهندسی
🟣 ساخت تصاویر پیچیده مثل بچهگربههای هتروکرومیا با رنگهای HEX و ترکیببندی سخت
🟣 رندر کامل یک صفحهٔ وب از صفر فقط با HTML + CSS + JS
🟣 تولید یک کاراکتر عجیبوغریب و دقیق با JSON (ترکیب Paladin + Pirate + Barista!)
---
🧩 مینی ریورسانجینیرینگ پرومت سیستم
نویسنده با تکنیک «magnet» تونسته بخشی از system prompt مدل را بیرون بکشد:
✳️سکشنهای Markdown
✳️قوانین با MUST و SHOULD
✳️جلوگیری از استایلهای قدیمی AI-Art
✳️و اینکه چطور مدل را وادار میکند دقیقتر و حرفگوشکنتر باشد
اگر در پرومتدیزاین، توسعه محصول یا ساخت اپهای مولتیمودال با NanoBanana/Gemini فعالیت دارید — این مقاله یک مرجع واقعی است.
📌 گیتهاب ابزارها و مثالها:
https://github.com/minimaxir/gemimg
---
هشتگها:
#AI #NanoBanana #Gemini #PromptEngineering #AIGeneration #DeepLearning #AIArt #Tech
👍2🔥1👌1
🚀 یک موتور قدرتمند برای مدلهای چندمودالی (Multimodal Models)
اگر با مدلهای ترکیبی متن–تصویر–ویدیو کار میکنید، LMMs-Engine یکی از بهترین فریمورکهای جدید است.
این موتور فوقسبک و بسیار انعطافپذیر، مخصوص آموزش و توسعهی مدلهای چندمودالی طراحی شده و حتی در مقیاسهای بزرگ هم کارایی بسیار بالایی دارد.
💡 ویژگیهای برجسته:
🔥 پشتیبانی از ۱۹+ معماری مختلف برای متن، تصویر، ویدیو و مدلهای ترکیبی
⚙️ بهینهسازی برای آموزش توزیعشده با مصرف حافظه بسیار کم
🧩 شامل دهها نمونه آماده اجرا برای شروع سریع با مدلهای مختلف
⚡ مناسب برای پژوهشگران، توسعهدهندگان و کسانی که به دنبال ساخت LMM اختصاصی هستند
📌 گیتهاب:
https://github.com/EvolvingLMMs-Lab/lmms-engine
---
#AI #ML #Multimodal #LMM #DeepLearning #OpenSource #MachineLearning #AIDev #NeuralNetworks
@rss_ai_ir
اگر با مدلهای ترکیبی متن–تصویر–ویدیو کار میکنید، LMMs-Engine یکی از بهترین فریمورکهای جدید است.
این موتور فوقسبک و بسیار انعطافپذیر، مخصوص آموزش و توسعهی مدلهای چندمودالی طراحی شده و حتی در مقیاسهای بزرگ هم کارایی بسیار بالایی دارد.
💡 ویژگیهای برجسته:
🔥 پشتیبانی از ۱۹+ معماری مختلف برای متن، تصویر، ویدیو و مدلهای ترکیبی
⚙️ بهینهسازی برای آموزش توزیعشده با مصرف حافظه بسیار کم
🧩 شامل دهها نمونه آماده اجرا برای شروع سریع با مدلهای مختلف
⚡ مناسب برای پژوهشگران، توسعهدهندگان و کسانی که به دنبال ساخت LMM اختصاصی هستند
📌 گیتهاب:
https://github.com/EvolvingLMMs-Lab/lmms-engine
---
#AI #ML #Multimodal #LMM #DeepLearning #OpenSource #MachineLearning #AIDev #NeuralNetworks
@rss_ai_ir
👍1🔥1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
📌 مجموعه Anthropic آزمایش کرد که آیا Claude میتواند به یک رباتسگ آموزش بدهد یا نه
در پروژهای به نام Project Fetch، شرکت Anthropic بررسی کرد که آیا مدل Claude میتواند به انسانها در آموزش ربات چهارپای Boston Dynamics Spot کمک کند یا خیر.
در این آزمایش:
دو تیم از کارکنانی که هیچ تجربهای در رباتیک نداشتند، باید Spot را طوری برنامهریزی میکردند که یک توپ ساحلی را پیدا کند و بیاورد — آن هم در سه مرحله با سختیِ افزایشی.
🔹 تیم اول با کمک Claude
🔹 تیم دوم بدون هیچ مدل هوش مصنوعی
🧠 نتیجه چه بود؟
✔️ تیم مجهز به Claude دو برابر سریعتر پیش رفت
✔️ وظایف بیشتری را تکمیل کرد
✔️ احساس اعتمادبهنفس بیشتری داشت
✔️ حتی توانست کنترل ربات را با زبان طبیعی امتحان کند
✔️ البته دوبار هم خراب کردند:
— سرعت حرکت ربات را اشتباه محاسبه کردند
— الگوریتم تشخیص توپ را اشتباه نوشتند
در مقابل، تیم بدون Claude:
❗ بیشتر دچار استرس، سردرگمی و اشتباهات انسانی شد
❗ مجبور بودند دائم از یکدیگر سؤال بپرسند
❗ روندشان کندتر و ناهموارتر بود
🎯 جمعبندی
همچنین Project Fetch اولین تلاش Anthropic برای بررسی تأثیر مدلهای زبانی در پروژههای واقعی R&D است.
نتایج نشان میدهد:
هوش مصنوعی سرعت و کارایی را چند برابر میکند، اما نظارت انسانی همچنان ضروری است.
🔜 گزارش کامل و ویدئوی مستند آن بهزودی در وبسایت Anthropic منتشر میشود.
https://www.anthropic.com/research/project-fetch-robot-dog
---
@rss_ai_ir
#هوش_مصنوعی #Claude #Anthropic #رباتیک #BostonDynamics #AI #ML #Robotics #Spot #ProjectFetch #RND #TechNews
در پروژهای به نام Project Fetch، شرکت Anthropic بررسی کرد که آیا مدل Claude میتواند به انسانها در آموزش ربات چهارپای Boston Dynamics Spot کمک کند یا خیر.
در این آزمایش:
دو تیم از کارکنانی که هیچ تجربهای در رباتیک نداشتند، باید Spot را طوری برنامهریزی میکردند که یک توپ ساحلی را پیدا کند و بیاورد — آن هم در سه مرحله با سختیِ افزایشی.
🔹 تیم اول با کمک Claude
🔹 تیم دوم بدون هیچ مدل هوش مصنوعی
🧠 نتیجه چه بود؟
✔️ تیم مجهز به Claude دو برابر سریعتر پیش رفت
✔️ وظایف بیشتری را تکمیل کرد
✔️ احساس اعتمادبهنفس بیشتری داشت
✔️ حتی توانست کنترل ربات را با زبان طبیعی امتحان کند
✔️ البته دوبار هم خراب کردند:
— سرعت حرکت ربات را اشتباه محاسبه کردند
— الگوریتم تشخیص توپ را اشتباه نوشتند
در مقابل، تیم بدون Claude:
❗ بیشتر دچار استرس، سردرگمی و اشتباهات انسانی شد
❗ مجبور بودند دائم از یکدیگر سؤال بپرسند
❗ روندشان کندتر و ناهموارتر بود
🎯 جمعبندی
همچنین Project Fetch اولین تلاش Anthropic برای بررسی تأثیر مدلهای زبانی در پروژههای واقعی R&D است.
نتایج نشان میدهد:
هوش مصنوعی سرعت و کارایی را چند برابر میکند، اما نظارت انسانی همچنان ضروری است.
🔜 گزارش کامل و ویدئوی مستند آن بهزودی در وبسایت Anthropic منتشر میشود.
https://www.anthropic.com/research/project-fetch-robot-dog
---
@rss_ai_ir
#هوش_مصنوعی #Claude #Anthropic #رباتیک #BostonDynamics #AI #ML #Robotics #Spot #ProjectFetch #RND #TechNews
👍3❤2🙏1