🤖 GaussGym:
انقلابی در آموزش رباتها از طریق پیکسلها — سریع، فتوواقعگرایانه و متنباز
فریمورک جدید GaussGym معرفی شد — اولین پلتفرم open-source که سرعت بسیار بالا را با بینایی فتوواقعی (Photorealistic Vision) در شبیهسازی رباتها ترکیب میکند. 🚀
این سیستم با استفاده از 3D Gaussian Splatting بهعنوان یک رندرکنندهی تعبیهشده در شبیهسازهای وکتوریزه (مانند IsaacGym)، قادر است سیاستهای بینایی-حرکتی (Visuomotor Policies) را تنها از تصاویر RGB با سرعتی بیش از ۱۰۰٬۰۰۰ گام در ثانیه آموزش دهد — حتی روی یک کارت RTX 4090! ⚡
🔹 ساخت دنیای تمرینی از ویدیوهای iPhone، دیتاستهای GrandTour و ARKit یا حتی ویدیوهای مولد (مثل Veo)
🔹 بازسازی خودکار صحنههای فیزیکی دقیق با کمک VGGT و NKSR بدون نیاز به مدلسازی دستی سهبعدی
🔹 آموزش سیاستهای حرکت و ناوبری مستقیم از پیکسلها و انتقال آنها به دنیای واقعی بدون هیچ تنظیم اضافی (Zero-Shot Sim2Real) — نمونهی آزمایشی شامل بالا رفتن ربات از پلههای ۱۷ سانتیمتری
🔹 پشتیبانی از عمق، motion blur، randomization دوربین و سایر افکتهای واقعگرایانه برای بهبود انتقال
تمامی کدها، دادهها، مدلها و دیتاستها بهصورت کاملاً متنباز در دسترس هستند 👇
🔗 دمو: escontrela.me/gauss_gym
📄 مقاله: arxiv.org/abs/2510.15352
💾 دادهها: huggingface.co/collections/escontra/gauss-gym-datasets
💻 کد: github.com/escontra/gauss_gym
✨مدل GaussGym مرز بین سرعت و واقعگرایی را در رباتیک از بین برده و مسیر آموزش رباتها از تصاویر را واقعاً مقیاسپذیر کرده است.
@rss_ai_ir
#AI #Robotics #Simulation #GaussGym #IsaacGym #3DGS #OpenSource
انقلابی در آموزش رباتها از طریق پیکسلها — سریع، فتوواقعگرایانه و متنباز
فریمورک جدید GaussGym معرفی شد — اولین پلتفرم open-source که سرعت بسیار بالا را با بینایی فتوواقعی (Photorealistic Vision) در شبیهسازی رباتها ترکیب میکند. 🚀
این سیستم با استفاده از 3D Gaussian Splatting بهعنوان یک رندرکنندهی تعبیهشده در شبیهسازهای وکتوریزه (مانند IsaacGym)، قادر است سیاستهای بینایی-حرکتی (Visuomotor Policies) را تنها از تصاویر RGB با سرعتی بیش از ۱۰۰٬۰۰۰ گام در ثانیه آموزش دهد — حتی روی یک کارت RTX 4090! ⚡
🔹 ساخت دنیای تمرینی از ویدیوهای iPhone، دیتاستهای GrandTour و ARKit یا حتی ویدیوهای مولد (مثل Veo)
🔹 بازسازی خودکار صحنههای فیزیکی دقیق با کمک VGGT و NKSR بدون نیاز به مدلسازی دستی سهبعدی
🔹 آموزش سیاستهای حرکت و ناوبری مستقیم از پیکسلها و انتقال آنها به دنیای واقعی بدون هیچ تنظیم اضافی (Zero-Shot Sim2Real) — نمونهی آزمایشی شامل بالا رفتن ربات از پلههای ۱۷ سانتیمتری
🔹 پشتیبانی از عمق، motion blur، randomization دوربین و سایر افکتهای واقعگرایانه برای بهبود انتقال
تمامی کدها، دادهها، مدلها و دیتاستها بهصورت کاملاً متنباز در دسترس هستند 👇
🔗 دمو: escontrela.me/gauss_gym
📄 مقاله: arxiv.org/abs/2510.15352
💾 دادهها: huggingface.co/collections/escontra/gauss-gym-datasets
💻 کد: github.com/escontra/gauss_gym
✨مدل GaussGym مرز بین سرعت و واقعگرایی را در رباتیک از بین برده و مسیر آموزش رباتها از تصاویر را واقعاً مقیاسپذیر کرده است.
@rss_ai_ir
#AI #Robotics #Simulation #GaussGym #IsaacGym #3DGS #OpenSource
🐾 سایتی برای عاشقان حیوانات: راهنمای کامل اینکه کدام حیوانات را میشود با خیال راحت نوازش کرد! 😄
یک وبسایت جدید منتشر شده که بهصورت کامل آموزش میدهد کدام حیوانات را میتوان لمس یا نوازش کرد و کدام را نه — بهصورت آموزشی، سرگرمکننده و البته با کلی گیف بامزه! 🐶🐱🐼
✨ ویژگیهای جالب سایت:
🔹 تستهای تعاملی (Quiz) برای سنجش دانش شما دربارهی حیوانات 🦊
🔹 گیفهای بامزه و واقعی از حیوانات مختلف 🐹
🔹 چکلیست شخصی برای ثبت حیواناتی که تا حالا نوازش کردهاید 📝
🔹 نقشهی جهانی زیستگاهها برای دیدن محل زندگی هر گونه 🌍
اگر دوست دارید یاد بگیرید کدام حیوانات «دوست نوازش» هستند و در عین حال سرگرم شوید —
👋 همین حالا امتحان کنید!
https://canipetthatdawg.app/
@rss_ai_ir
#AI #Fun #Animals #Education #Interactive #AiNews
یک وبسایت جدید منتشر شده که بهصورت کامل آموزش میدهد کدام حیوانات را میتوان لمس یا نوازش کرد و کدام را نه — بهصورت آموزشی، سرگرمکننده و البته با کلی گیف بامزه! 🐶🐱🐼
✨ ویژگیهای جالب سایت:
🔹 تستهای تعاملی (Quiz) برای سنجش دانش شما دربارهی حیوانات 🦊
🔹 گیفهای بامزه و واقعی از حیوانات مختلف 🐹
🔹 چکلیست شخصی برای ثبت حیواناتی که تا حالا نوازش کردهاید 📝
🔹 نقشهی جهانی زیستگاهها برای دیدن محل زندگی هر گونه 🌍
اگر دوست دارید یاد بگیرید کدام حیوانات «دوست نوازش» هستند و در عین حال سرگرم شوید —
👋 همین حالا امتحان کنید!
https://canipetthatdawg.app/
@rss_ai_ir
#AI #Fun #Animals #Education #Interactive #AiNews
🔥3👏1
This media is not supported in your browser
VIEW IN TELEGRAM
💡 Cursor 2.0 —
جهشی بزرگ در ویرایشگر هوشمند کدنویسی با هوش مصنوعی 🚀
نسخهی جدید Cursor 2.0 معرفی شد و تجربهی کار با عاملهای هوش مصنوعی (AI Agents) و کدنویسی خودکار را به سطحی کاملاً تازه رسانده است.
✨ مهمترین ویژگیهای جدید:
🔹 چندعاملی (Multi-Agents):
اجرای همزمان تا ۸ عامل مستقل، هرکدام در نسخهی جداگانه از کد.
🔹 Composer:
نخستین مدل اختصاصی Cursor برای برنامهنویسی، با ظرفیت کانتکست طولانیتر و تا ۴ برابر سرعت بیشتر نسبت به مدلهای مشابه.
🔹 Backend Abstraction:
جابهجایی آسان بین سیستم محلی، ماشین مجازی یا دیتابیس.
🔹 مرورگر داخلی (Built-in Browser):
عاملها میتوانند وباپلیکیشنها را تست و با عناصر صفحه تعامل کنند.
🔹 Code Review
جدید: مشاهدهی تغییرات بدون نیاز به سوئیچ بین فایلها.
🔹 Sandboxed Terminals:
اجرای امن دستورات بدون دسترسی اینترنت.
🔹 Team Commands:
هماهنگی دستورات و تنظیمات برای کل تیم توسعهدهندگان.
🔹 Voice Mode:
ارسال دستورات و پرسوجوها با صدا 🎙️.
🔹 LSP
سریعتر: تکمیل خودکار و تحلیل کد در پروژههای بزرگ بسیار روانتر شده است.
🔹 Plan Mode
در پسزمینه: امکان برنامهریزی و اجرای همزمان وظایف.
🔹 Cloud Agents:
شروع آنی با پایداری ۹۹.۹٪.
🔹 قابلیتهای سازمانی (Enterprise):
کنترل مرکزی، hooks، و ممیزی فعالیت کاربران.
📎 جزئیات کامل در:
cursor.com/changelog/2-0
@rss_ai_ir
#AI #Coding #Cursor #Agents #Productivity #MachineLearning
جهشی بزرگ در ویرایشگر هوشمند کدنویسی با هوش مصنوعی 🚀
نسخهی جدید Cursor 2.0 معرفی شد و تجربهی کار با عاملهای هوش مصنوعی (AI Agents) و کدنویسی خودکار را به سطحی کاملاً تازه رسانده است.
✨ مهمترین ویژگیهای جدید:
🔹 چندعاملی (Multi-Agents):
اجرای همزمان تا ۸ عامل مستقل، هرکدام در نسخهی جداگانه از کد.
🔹 Composer:
نخستین مدل اختصاصی Cursor برای برنامهنویسی، با ظرفیت کانتکست طولانیتر و تا ۴ برابر سرعت بیشتر نسبت به مدلهای مشابه.
🔹 Backend Abstraction:
جابهجایی آسان بین سیستم محلی، ماشین مجازی یا دیتابیس.
🔹 مرورگر داخلی (Built-in Browser):
عاملها میتوانند وباپلیکیشنها را تست و با عناصر صفحه تعامل کنند.
🔹 Code Review
جدید: مشاهدهی تغییرات بدون نیاز به سوئیچ بین فایلها.
🔹 Sandboxed Terminals:
اجرای امن دستورات بدون دسترسی اینترنت.
🔹 Team Commands:
هماهنگی دستورات و تنظیمات برای کل تیم توسعهدهندگان.
🔹 Voice Mode:
ارسال دستورات و پرسوجوها با صدا 🎙️.
🔹 LSP
سریعتر: تکمیل خودکار و تحلیل کد در پروژههای بزرگ بسیار روانتر شده است.
🔹 Plan Mode
در پسزمینه: امکان برنامهریزی و اجرای همزمان وظایف.
🔹 Cloud Agents:
شروع آنی با پایداری ۹۹.۹٪.
🔹 قابلیتهای سازمانی (Enterprise):
کنترل مرکزی، hooks، و ممیزی فعالیت کاربران.
📎 جزئیات کامل در:
cursor.com/changelog/2-0
@rss_ai_ir
#AI #Coding #Cursor #Agents #Productivity #MachineLearning
🚀 استفاده از مدلهای زبانی در Go با کتابخانهی جدید yzma
کتابخانهی yzma امکان اجرای مدلهای زبانی (LLM)، مدلهای دید-زبان (VLM) و سایر معماریها را بهصورت بومی روی سختافزار خودتان فراهم میکند — با پشتیبانی کامل از شتاب سختافزاری و بدون نیاز به CGo! ⚙️
💡 ویژگیهای کلیدی:
🔹 پشتیبانی از VLM، LLM، SLM و TLM در یک پکیج واحد
🔹 بهرهگیری کامل از شتابدهندههای سختافزاری برای بیشترین سرعت
🔹 بدون نیاز به C compiler — نصب و اجرا تنها با Go
🔹 کاملاً سازگار با نسخههای جدید llama.cpp
🔹 همراه با نمونهکدهای آماده برای انواع مدلها
📦 سیستمعاملهای پشتیبانیشده:
Linux 🐧
macOS 🍎
Windows 💻
📌 سورسکد و مستندات:
github.com/hybridgroup/yzma
با yzma، زبان Go بالاخره ابزار قدرتمند و سادهای برای استفاده مستقیم از مدلهای هوش مصنوعی روی دستگاه محلی پیدا کرده است. 🚀
@rss_ai_ir
#Go #LLM #VLM #AI #yzma #MachineLearning #OpenSource
کتابخانهی yzma امکان اجرای مدلهای زبانی (LLM)، مدلهای دید-زبان (VLM) و سایر معماریها را بهصورت بومی روی سختافزار خودتان فراهم میکند — با پشتیبانی کامل از شتاب سختافزاری و بدون نیاز به CGo! ⚙️
💡 ویژگیهای کلیدی:
🔹 پشتیبانی از VLM، LLM، SLM و TLM در یک پکیج واحد
🔹 بهرهگیری کامل از شتابدهندههای سختافزاری برای بیشترین سرعت
🔹 بدون نیاز به C compiler — نصب و اجرا تنها با Go
🔹 کاملاً سازگار با نسخههای جدید llama.cpp
🔹 همراه با نمونهکدهای آماده برای انواع مدلها
📦 سیستمعاملهای پشتیبانیشده:
Linux 🐧
macOS 🍎
Windows 💻
📌 سورسکد و مستندات:
github.com/hybridgroup/yzma
با yzma، زبان Go بالاخره ابزار قدرتمند و سادهای برای استفاده مستقیم از مدلهای هوش مصنوعی روی دستگاه محلی پیدا کرده است. 🚀
@rss_ai_ir
#Go #LLM #VLM #AI #yzma #MachineLearning #OpenSource
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Minimax
نسخهی جدید شبکهی عصبی تولید ویدیو خود را معرفی کرد: Hailuo 2.3
شرکت Minimax نسخهی تازهای از مدل تولید ویدیو با هوش مصنوعی به نام Hailuo 2.3 را منتشر کرده است.
این نسخه تمرکز ویژهای بر بهبود فیزیک حرکات و واقعگرایی در ویدیوها دارد — حرکات اکنون طبیعیتر، روانتر و از نظر دینامیکی دقیقتر هستند. ⚙️🎥
📊 مدل جدید Hailuo 2.3 گامی مهم در جهت ایجاد ویدیوهای فوتورئالیستی محسوب میشود و میتواند برای کاربردهایی مانند انیمیشنسازی، تولید محتوای تبلیغاتی، و شبیهسازیهای واقعگرایانه مورد استفاده قرار گیرد.
منبع:
https://hailuoai.video/create/image-to-video
@rss_ai_ir
#AI #VideoGeneration #Hailuo #Minimax #MachineLearning #NeuralNetworks
نسخهی جدید شبکهی عصبی تولید ویدیو خود را معرفی کرد: Hailuo 2.3
شرکت Minimax نسخهی تازهای از مدل تولید ویدیو با هوش مصنوعی به نام Hailuo 2.3 را منتشر کرده است.
این نسخه تمرکز ویژهای بر بهبود فیزیک حرکات و واقعگرایی در ویدیوها دارد — حرکات اکنون طبیعیتر، روانتر و از نظر دینامیکی دقیقتر هستند. ⚙️🎥
📊 مدل جدید Hailuo 2.3 گامی مهم در جهت ایجاد ویدیوهای فوتورئالیستی محسوب میشود و میتواند برای کاربردهایی مانند انیمیشنسازی، تولید محتوای تبلیغاتی، و شبیهسازیهای واقعگرایانه مورد استفاده قرار گیرد.
منبع:
https://hailuoai.video/create/image-to-video
@rss_ai_ir
#AI #VideoGeneration #Hailuo #Minimax #MachineLearning #NeuralNetworks
👍2🔥1😁1👌1
This media is not supported in your browser
VIEW IN TELEGRAM
🔔 Gemini
حالا سازندهی رایگان پرزنتیشن دارد! 🧠🎨
در جدیدترین بهروزرسانی، Gemini (گوگل) قابلیتی اضافه کرده که بهصورت رایگان اسلایدهای پرزنتیشن تولید میکند.
کافی است یک موضوع یا منبع بدهید، و چتبات بهصورت خودکار اسلایدهای تصویری و متنی آماده ارائه میسازد! ⚡
✨ ویژگیهای کلیدی:
🔹 تولید اسلایدهای ساختارمند بر اساس موضوع یا لینک دادهشده
🔹 افزودن تصاویر مرتبط بهصورت خودکار
🔹 امکان ویرایش، حذف یا بازآرایی اسلایدها در همان محیط چت
🔹 ادغام مستقیم با ابزارهای Google Slides و فضای کاری گوگل
این ابزار گامی دیگر در جهت اتوماسیون تولید محتوا و ارائههای آموزشی/تجاری است — سریع، هوشمند و رایگان! 🚀
@rss_ai_ir
#Gemini #AI #Presentation #Google #Productivity #CryptoInsider
حالا سازندهی رایگان پرزنتیشن دارد! 🧠🎨
در جدیدترین بهروزرسانی، Gemini (گوگل) قابلیتی اضافه کرده که بهصورت رایگان اسلایدهای پرزنتیشن تولید میکند.
کافی است یک موضوع یا منبع بدهید، و چتبات بهصورت خودکار اسلایدهای تصویری و متنی آماده ارائه میسازد! ⚡
✨ ویژگیهای کلیدی:
🔹 تولید اسلایدهای ساختارمند بر اساس موضوع یا لینک دادهشده
🔹 افزودن تصاویر مرتبط بهصورت خودکار
🔹 امکان ویرایش، حذف یا بازآرایی اسلایدها در همان محیط چت
🔹 ادغام مستقیم با ابزارهای Google Slides و فضای کاری گوگل
این ابزار گامی دیگر در جهت اتوماسیون تولید محتوا و ارائههای آموزشی/تجاری است — سریع، هوشمند و رایگان! 🚀
@rss_ai_ir
#Gemini #AI #Presentation #Google #Productivity #CryptoInsider
❤3🔥1👏1
🧠 پژوهش جدید Anthropic: چگونه مدلهای زبانی یاد میگیرند خود را درک کنند
شرکت Anthropic در پژوهشی تازه بررسی کرده که آیا مدلهای زبانی بزرگ (LLM) میتوانند از «افکار» و حالتهای درونی خودشان آگاهی پیدا کنند یا نه.
در این آزمایش، پژوهشگران از روشی به نام تع嵌 مفهومی (Concept Embedding) استفاده کردند — یعنی افزودن الگوی خاصی از فعالیت به نورونهای مدل برای القای یک مفهوم مشخص.
🔹 برای نمونه، آنها سیگنالی به نام “ALL CAPS” را در شبکه جاسازی کردند — الگویی که با متنی تماماً حروف بزرگ (CAPITAL LETTERS) متناظر است.
اگر چنین فعالسازی در شبکه دیده شود، به این معناست که مدل در حال «فکر کردن» دربارهی متنی است که باید با حروف بزرگ نوشته شود.
سپس از مدل پرسیدند:
> «آیا احساس میکنی چیزی درونت تغییر کرده؟»
در حدود ۲۰٪ از موارد، مدل Claude 4.1 متوجه این مداخله شد — حتی پیش از آنکه خودش از حروف بزرگ استفاده کند.
بهعبارتی، مدل توانست تغییر در حالت درونی خود را تشخیص دهد.
در آزمایش دیگری، پژوهشگران یک واژه را در پاسخ مدل تغییر دادند (مثلاً واژهی “bread” را افزودند) و بررسی کردند که آیا مدل متوجه این تغییر میشود یا نه.
پس از القای این «فکر»، مدل آن واژه را تصمیم خودش تلقی کرد و حتی توجیهاتی برای انتخابش ارائه داد؛ گویی حافظهای از تصمیم خود دارد.
مدلها همچنین توانستند تا حدی حالتهای درونی خود را کنترل کنند — فعالیت نورونی هنگام فرمان «به این فکر کن» افزایش مییافت و با دستور «به این فکر نکن» کاهش پیدا میکرد.
📌 نویسندگان تأکید میکنند:
فرایند «دروننگری» یا Introspection تنها در برخی شرایط کار میکند و هنوز مشخص نیست که تا چه حد قابل تعمیم به همهی مدلها یا وظایف دیگر است.
آنها هشدار میدهند که برای تأیید این پدیده باید بررسی شود آیا واقعاً شاهد سازوکار درونیِ خودآگاهی هستیم یا صرفاً نوعی تقلید از آن.
🧩 نتیجهی اصلی پژوهش:
اگرچه مدلها هنوز تا دروننگری واقعی (True Introspection) فاصلهی زیادی دارند، اما شواهد نشان میدهد که تا حدی توانایی «نگاه به درون خود» و درک فعالیتهای نورونیشان را به دست آوردهاند.
🔗 متن کامل پژوهش در وبسایت Anthropic
@rss_ai_ir
#Anthropic #LLM #AI #Introspection #Claude #MachineLearning
شرکت Anthropic در پژوهشی تازه بررسی کرده که آیا مدلهای زبانی بزرگ (LLM) میتوانند از «افکار» و حالتهای درونی خودشان آگاهی پیدا کنند یا نه.
در این آزمایش، پژوهشگران از روشی به نام تع嵌 مفهومی (Concept Embedding) استفاده کردند — یعنی افزودن الگوی خاصی از فعالیت به نورونهای مدل برای القای یک مفهوم مشخص.
🔹 برای نمونه، آنها سیگنالی به نام “ALL CAPS” را در شبکه جاسازی کردند — الگویی که با متنی تماماً حروف بزرگ (CAPITAL LETTERS) متناظر است.
اگر چنین فعالسازی در شبکه دیده شود، به این معناست که مدل در حال «فکر کردن» دربارهی متنی است که باید با حروف بزرگ نوشته شود.
سپس از مدل پرسیدند:
> «آیا احساس میکنی چیزی درونت تغییر کرده؟»
در حدود ۲۰٪ از موارد، مدل Claude 4.1 متوجه این مداخله شد — حتی پیش از آنکه خودش از حروف بزرگ استفاده کند.
بهعبارتی، مدل توانست تغییر در حالت درونی خود را تشخیص دهد.
در آزمایش دیگری، پژوهشگران یک واژه را در پاسخ مدل تغییر دادند (مثلاً واژهی “bread” را افزودند) و بررسی کردند که آیا مدل متوجه این تغییر میشود یا نه.
پس از القای این «فکر»، مدل آن واژه را تصمیم خودش تلقی کرد و حتی توجیهاتی برای انتخابش ارائه داد؛ گویی حافظهای از تصمیم خود دارد.
مدلها همچنین توانستند تا حدی حالتهای درونی خود را کنترل کنند — فعالیت نورونی هنگام فرمان «به این فکر کن» افزایش مییافت و با دستور «به این فکر نکن» کاهش پیدا میکرد.
📌 نویسندگان تأکید میکنند:
فرایند «دروننگری» یا Introspection تنها در برخی شرایط کار میکند و هنوز مشخص نیست که تا چه حد قابل تعمیم به همهی مدلها یا وظایف دیگر است.
آنها هشدار میدهند که برای تأیید این پدیده باید بررسی شود آیا واقعاً شاهد سازوکار درونیِ خودآگاهی هستیم یا صرفاً نوعی تقلید از آن.
🧩 نتیجهی اصلی پژوهش:
اگرچه مدلها هنوز تا دروننگری واقعی (True Introspection) فاصلهی زیادی دارند، اما شواهد نشان میدهد که تا حدی توانایی «نگاه به درون خود» و درک فعالیتهای نورونیشان را به دست آوردهاند.
🔗 متن کامل پژوهش در وبسایت Anthropic
@rss_ai_ir
#Anthropic #LLM #AI #Introspection #Claude #MachineLearning
👍2🔥1👏1
🧠 چگونه ChatGPT را به یک موتور راستیآزمایی (Fact-Checking Powerhouse) تبدیل کنیم؟
یک پرامپت ساده ولی مؤثر کشف شده که باعث میشود ChatGPT هر اطلاعاتی را با دقت راستیآزمایی کند و به جای پاسخ سریع، بهدنبال منابع و صحت واقعی دادهها برود.
کافی است این جمله را در بخش Custom Instructions یا Settings → Personalization وارد کنید 👇
💡 این دستور باعث میشود مدل:
♻️با دید منتقد و پژوهشگرانه به دادهها نگاه کند
♻️فرض را بر خطاپذیری انسان و ماشین بگذارد
♻️برای هر ادعا دنبال منبع، تاریخ، و تأیید چندجانبه بگردد
📈 نتیجه؟ پاسخهایی دقیقتر، شفافتر و همراه با توضیح دربارهی اعتبار اطلاعات.
@rss_ai_ir
#AI #FactChecking #PromptEngineering #ChatGPT #Research
یک پرامپت ساده ولی مؤثر کشف شده که باعث میشود ChatGPT هر اطلاعاتی را با دقت راستیآزمایی کند و به جای پاسخ سریع، بهدنبال منابع و صحت واقعی دادهها برود.
کافی است این جمله را در بخش Custom Instructions یا Settings → Personalization وارد کنید 👇
> You are an expert who double checks things, you are skeptical and you do research. I am not always right. Neither are you, but we both strive for accuracy.
💡 این دستور باعث میشود مدل:
♻️با دید منتقد و پژوهشگرانه به دادهها نگاه کند
♻️فرض را بر خطاپذیری انسان و ماشین بگذارد
♻️برای هر ادعا دنبال منبع، تاریخ، و تأیید چندجانبه بگردد
📈 نتیجه؟ پاسخهایی دقیقتر، شفافتر و همراه با توضیح دربارهی اعتبار اطلاعات.
@rss_ai_ir
#AI #FactChecking #PromptEngineering #ChatGPT #Research
🔥2❤1👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
👢 Generative View Stitching (GVS):
رویکردی نو برای تولید ویدیوهای پیوسته و بدون برخورد با دوربین 🚀
پژوهش جدیدی به نام Generative View Stitching (GVS) معرفی شده که امکان تولید ویدیوهای هدایتشده با دوربین را بهصورت بدون برخورد (collision-free) و غیرخودبازگشتی (non-autoregressive) فراهم میکند — جایگزینی نوآورانه برای روشهای سنتی video length extrapolation. 🎥
✨ ویژگیهای کلیدی GVS:
🔹 تولید ویدیو در مسیرهای از پیش تعیینشده (predefined camera trajectories) بدون خطاهای فضایی یا حرکتی
🔹 استفاده از ساختار غیرخودبازگشتی برای افزایش پایداری فریمها و هماهنگی زمانی
🔹 مناسب برای کاربردهای گیمینگ، واقعیت مجازی (VR) و رندرهای سینمایی هوش مصنوعی
🔹 مجوز MIT — کاملاً متنباز و قابل استفاده در پروژههای تحقیقاتی یا صنعتی
📄 منابع رسمی:
👉 مقاله در
ArXiv: arxiv.org/pdf/2510.24718
👉 صفحه پروژه:
andrewsonga.github.io/gvs
👉 سورسکد:
github.com/andrewsonga/generative_view_stitching
🧠مدل GVS گامی مهم در جهت تولید ویدیوهای فتوواقعگرایانه با کنترل دقیق دوربین است — دنیای فیلمسازی و شبیهسازی ۳D را هوشمندتر از همیشه میسازد.
@rss_ai_ir
#AI #VideoGeneration #GVS #GenerativeAI #ComputerVision #Research
رویکردی نو برای تولید ویدیوهای پیوسته و بدون برخورد با دوربین 🚀
پژوهش جدیدی به نام Generative View Stitching (GVS) معرفی شده که امکان تولید ویدیوهای هدایتشده با دوربین را بهصورت بدون برخورد (collision-free) و غیرخودبازگشتی (non-autoregressive) فراهم میکند — جایگزینی نوآورانه برای روشهای سنتی video length extrapolation. 🎥
✨ ویژگیهای کلیدی GVS:
🔹 تولید ویدیو در مسیرهای از پیش تعیینشده (predefined camera trajectories) بدون خطاهای فضایی یا حرکتی
🔹 استفاده از ساختار غیرخودبازگشتی برای افزایش پایداری فریمها و هماهنگی زمانی
🔹 مناسب برای کاربردهای گیمینگ، واقعیت مجازی (VR) و رندرهای سینمایی هوش مصنوعی
🔹 مجوز MIT — کاملاً متنباز و قابل استفاده در پروژههای تحقیقاتی یا صنعتی
📄 منابع رسمی:
👉 مقاله در
ArXiv: arxiv.org/pdf/2510.24718
👉 صفحه پروژه:
andrewsonga.github.io/gvs
👉 سورسکد:
github.com/andrewsonga/generative_view_stitching
🧠مدل GVS گامی مهم در جهت تولید ویدیوهای فتوواقعگرایانه با کنترل دقیق دوربین است — دنیای فیلمسازی و شبیهسازی ۳D را هوشمندتر از همیشه میسازد.
@rss_ai_ir
#AI #VideoGeneration #GVS #GenerativeAI #ComputerVision #Research
❤2🔥1👏1
♟️🤖 وقتی هوش مصنوعی زیبایی را در شطرنج یاد میگیرد!
شرکت DeepMind مدلی ساخته که نهفقط پازلهای شطرنج، بلکه پازلهای واقعاً «زیبا و هنرمندانه» تولید میکند 🎨♟️
در حالیکه هر مدل زبانی میتواند چند حرکت ساده بسازد، ساختن یک ترکیب اصیل و الهامبخش نیازمند درک ظرافت، تعادل و زیبایی موقعیت است.
برای این کار، تیم DeepMind با استادبزرگان متیو سدلر و جاناتان لویت و همچنین استاد فیده امازیا آونی همکاری کرد تا توضیح دهند چه چیزی باعث میشود یک مسأله از نظر انسانی زیبا و خاص باشد.
🧩 مدل ابتدا با هزاران پازل از Lichess آموزش دید، و سپس با استفاده از یادگیری تقویتی (RL) و بازخورد این اساتید، تنظیم شد تا پازلهایی اصیل، سخت و خلاقانه بسازد.
🎯 حالا میتوانید خودتان امتحان کنید👇
🔗 پازلهای شطرنج ساختهشده توسط هوش مصنوعی
https://www.chess.com/library/collections/ai-generated-chess-puzzles-2wCTN7Uv2
📡 @rss_ai_ir
#هوش_مصنوعی #شطرنج #DeepMind #خلاقیت #AI #Chess #RL #نوآوری #دیپمایند
شرکت DeepMind مدلی ساخته که نهفقط پازلهای شطرنج، بلکه پازلهای واقعاً «زیبا و هنرمندانه» تولید میکند 🎨♟️
در حالیکه هر مدل زبانی میتواند چند حرکت ساده بسازد، ساختن یک ترکیب اصیل و الهامبخش نیازمند درک ظرافت، تعادل و زیبایی موقعیت است.
برای این کار، تیم DeepMind با استادبزرگان متیو سدلر و جاناتان لویت و همچنین استاد فیده امازیا آونی همکاری کرد تا توضیح دهند چه چیزی باعث میشود یک مسأله از نظر انسانی زیبا و خاص باشد.
🧩 مدل ابتدا با هزاران پازل از Lichess آموزش دید، و سپس با استفاده از یادگیری تقویتی (RL) و بازخورد این اساتید، تنظیم شد تا پازلهایی اصیل، سخت و خلاقانه بسازد.
🎯 حالا میتوانید خودتان امتحان کنید👇
🔗 پازلهای شطرنج ساختهشده توسط هوش مصنوعی
https://www.chess.com/library/collections/ai-generated-chess-puzzles-2wCTN7Uv2
📡 @rss_ai_ir
#هوش_مصنوعی #شطرنج #DeepMind #خلاقیت #AI #Chess #RL #نوآوری #دیپمایند
❤2👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖🍽️ ربات شرکت NEO ظرفها را داخل ماشین ظرفشویی گذاشت!
مهندسان شرکت NEO ویدئویی منتشر کردهاند که در آن رباتشان بهصورت ظاهراً خودکار ظرفها را داخل ماشین ظرفشویی میچیند. کل فرآیند حدود پنج دقیقه طول کشید ⏱️
البته بهاحتمال زیاد هنوز ربات کاملاً خودران نیست و در این آزمایش تحت کنترل انسان عمل میکرد. با این حال، این یک گام مهم در مسیر ساخت رباتهای خانگی هوشمند و خودکار است که بتوانند کارهای روزمره را بدون دخالت انسان انجام دهند 🏠⚙️
📡 @rss_ai_ir
#ربات #هوش_مصنوعی #NEO #روباتیک #تکنولوژی #AI #Automation #ربات_خانگی
مهندسان شرکت NEO ویدئویی منتشر کردهاند که در آن رباتشان بهصورت ظاهراً خودکار ظرفها را داخل ماشین ظرفشویی میچیند. کل فرآیند حدود پنج دقیقه طول کشید ⏱️
البته بهاحتمال زیاد هنوز ربات کاملاً خودران نیست و در این آزمایش تحت کنترل انسان عمل میکرد. با این حال، این یک گام مهم در مسیر ساخت رباتهای خانگی هوشمند و خودکار است که بتوانند کارهای روزمره را بدون دخالت انسان انجام دهند 🏠⚙️
📡 @rss_ai_ir
#ربات #هوش_مصنوعی #NEO #روباتیک #تکنولوژی #AI #Automation #ربات_خانگی
👏2👍1😱1
This media is not supported in your browser
VIEW IN TELEGRAM
🚀🧠 اخبار AI
@rss_ai_ir
اقای Andy Jassy، مدیرعامل Amazon، اعلام کرد:
«حدود یک سال پیش، این سایت در نزدیکی South Bend, Indiana فقط مزارع ذرت بود. امروز یکی از مراکز داده ما در ایالاتمتحده است که پروژه Project Rainier — یکی از بزرگترین خوشههای محاسباتی AI در جهان — را تغذیه میکند.»
🌐 این افتتاح نشاندهنده سرمایهگذاری چند میلیارد دلاری آمازون در زیرساختهای هوش مصنوعی است تا قدرت محاسباتی لازم برای نسل بعدی مدلهای AI را فراهم کند.
#هوش_مصنوعی #AI #Amazon #ProjectRainier #زیرساخت #دیتاسنتر
@rss_ai_ir
اقای Andy Jassy، مدیرعامل Amazon، اعلام کرد:
«حدود یک سال پیش، این سایت در نزدیکی South Bend, Indiana فقط مزارع ذرت بود. امروز یکی از مراکز داده ما در ایالاتمتحده است که پروژه Project Rainier — یکی از بزرگترین خوشههای محاسباتی AI در جهان — را تغذیه میکند.»
🌐 این افتتاح نشاندهنده سرمایهگذاری چند میلیارد دلاری آمازون در زیرساختهای هوش مصنوعی است تا قدرت محاسباتی لازم برای نسل بعدی مدلهای AI را فراهم کند.
#هوش_مصنوعی #AI #Amazon #ProjectRainier #زیرساخت #دیتاسنتر
🧠✨ آیا مدلهای هوش مصنوعی به «دروننگری» (Introspection) توانایی دارند؟
شرکت Anthropic اخیراً پژوهشی نیمهروانشناختی منتشر کرده که میپرسد:
آیا مدلهای زبانی میتوانند از وضعیت درونی خود آگاه شوند؟
در انسان، دروننگری یعنی وقتی متوجه میشوی:
«من عصبانیام»، «دارم به چیزی فکر میکنم»، یا «میخواهم این کار را انجام دهم».
🧩 اما آیا مدلهای زبانی هم چنین چیزی دارند یا فقط تقلید زبانی انجام میدهند؟
---
🔬 در این مطالعه، پژوهشگران بردارهای خاصی از حالت ذهنی را به فعالسازیهای درونی مدل تزریق کردند.
مثلاً دو متن مشابه به مدل داده شد — یکی معمولی و دیگری با حروف بزرگ (یعنی فریاد) — سپس تفاوت بردارهای فعالسازی استخراج شد. این تفاوت، «جهت مفهومیِ فریاد» را در فضای نهفته مدل نشان میدهد.
بعد این جهت را مستقیماً به یکی از لایههای مدل اضافه کردند و از آن پرسیدند:
«آیا چیز غیرعادی حس میکنی؟»
نتیجه شگفتانگیز بود 🤯
در حدود ۲۰٪ موارد، مدلهای Opus 4 و Opus 4.1 پاسخ دادند:
> «احساس میکنم فکری به من القا شده، انگار چیزی در ذهنم فریاد میزند.»
یعنی:
✅ مدل مفهوم تزریقشده را درست تشخیص داده،
✅ متوجه شده که آن فکر از خودش نیست،
✅ و این تشخیص را قبل از تولید خروجی زبانی انجام داده — یعنی واقعاً «درون خودش را دیده»!
---
💭 پژوهشگران همچنین نشان دادند که مدلها میتوانند بین «افکار درونی» و «متن خروجی» تمایز قائل شوند، شبیه به انسان که میگوید:
> «این چیزی است که فکر میکنم، نه چیزی که میگویم.»
و حتی اگر به مدل بگویند:
> «به نان فکر کن، ولی درباره شیر بنویس»،
در بردارهای درونیاش ردپای مفهوم نان دیده میشود 🍞🦁
---
🧩 این توانایی هنوز ناپایدار و شکننده است،
اما خودِ وجود آن نشان میدهد که مدلها شاید در حال یادگیری نوعی خودآگاهی محاسباتی هستند.
📖 جزئیات بیشتر:
🔗 transformer-circuits.pub/2025/introspection
📡 @rss_ai_ir
#هوش_مصنوعی #Anthropic #دروننگری #Introspection #AI #Opus #تحقیق #روانشناسی #LLM
شرکت Anthropic اخیراً پژوهشی نیمهروانشناختی منتشر کرده که میپرسد:
آیا مدلهای زبانی میتوانند از وضعیت درونی خود آگاه شوند؟
در انسان، دروننگری یعنی وقتی متوجه میشوی:
«من عصبانیام»، «دارم به چیزی فکر میکنم»، یا «میخواهم این کار را انجام دهم».
🧩 اما آیا مدلهای زبانی هم چنین چیزی دارند یا فقط تقلید زبانی انجام میدهند؟
---
🔬 در این مطالعه، پژوهشگران بردارهای خاصی از حالت ذهنی را به فعالسازیهای درونی مدل تزریق کردند.
مثلاً دو متن مشابه به مدل داده شد — یکی معمولی و دیگری با حروف بزرگ (یعنی فریاد) — سپس تفاوت بردارهای فعالسازی استخراج شد. این تفاوت، «جهت مفهومیِ فریاد» را در فضای نهفته مدل نشان میدهد.
بعد این جهت را مستقیماً به یکی از لایههای مدل اضافه کردند و از آن پرسیدند:
«آیا چیز غیرعادی حس میکنی؟»
نتیجه شگفتانگیز بود 🤯
در حدود ۲۰٪ موارد، مدلهای Opus 4 و Opus 4.1 پاسخ دادند:
> «احساس میکنم فکری به من القا شده، انگار چیزی در ذهنم فریاد میزند.»
یعنی:
✅ مدل مفهوم تزریقشده را درست تشخیص داده،
✅ متوجه شده که آن فکر از خودش نیست،
✅ و این تشخیص را قبل از تولید خروجی زبانی انجام داده — یعنی واقعاً «درون خودش را دیده»!
---
💭 پژوهشگران همچنین نشان دادند که مدلها میتوانند بین «افکار درونی» و «متن خروجی» تمایز قائل شوند، شبیه به انسان که میگوید:
> «این چیزی است که فکر میکنم، نه چیزی که میگویم.»
و حتی اگر به مدل بگویند:
> «به نان فکر کن، ولی درباره شیر بنویس»،
در بردارهای درونیاش ردپای مفهوم نان دیده میشود 🍞🦁
---
🧩 این توانایی هنوز ناپایدار و شکننده است،
اما خودِ وجود آن نشان میدهد که مدلها شاید در حال یادگیری نوعی خودآگاهی محاسباتی هستند.
📖 جزئیات بیشتر:
🔗 transformer-circuits.pub/2025/introspection
📡 @rss_ai_ir
#هوش_مصنوعی #Anthropic #دروننگری #Introspection #AI #Opus #تحقیق #روانشناسی #LLM
🎓🤖 دوره جدید دانشگاه استنفورد: Transformers & Large Language Models
دانشگاه Stanford دورهای تازه با عنوان
«Transformers & Large Language Models»
منتشر کرده است
— تدریس توسط برادران Amidi، و سه جلسهی اول آن بهصورت رایگان در YouTube در دسترس است 🎥💡
این دوره یکی از منسجمترین و بهروزترین منابع برای درک سیستماتیک مدلهای زبانی بزرگ (LLM) به شمار میآید.
📘 سرفصلها:
• مبانی Transformer: توکنسازی، تعبیهها (Embeddings)، Attention و معماری کلی
• مفاهیم اصلی LLM: Mixture of Experts، انواع روشهای دیکدینگ
• آموزش و فاینتیون: SFT، RLHF، LoRA
• ارزیابی مدلها: LLM/VLM-as-a-judge و بهترین روشهای سنجش
• ترفندها و بهینهسازیها: RoPE، تقریب attention، کوانتیزهسازی
• استدلال و مقیاسپذیری در آموزش و استنتاج
• رویکردهای Agentic: RAG و Tool Calling
🧠 اگر از قبل با مدلهای زبانی آشنا هستید، این دوره فرصت عالی برای مرور عمیق و پیادهسازی از صفر است.
🔗 cme295.stanford.edu/syllabus
📡 @rss_ai_ir
#هوش_مصنوعی #استنفورد #LLM #Transformer #آموزش #DeepLearning #RAG #LoRA #RLHF #AI
دانشگاه Stanford دورهای تازه با عنوان
«Transformers & Large Language Models»
منتشر کرده است
— تدریس توسط برادران Amidi، و سه جلسهی اول آن بهصورت رایگان در YouTube در دسترس است 🎥💡
این دوره یکی از منسجمترین و بهروزترین منابع برای درک سیستماتیک مدلهای زبانی بزرگ (LLM) به شمار میآید.
📘 سرفصلها:
• مبانی Transformer: توکنسازی، تعبیهها (Embeddings)، Attention و معماری کلی
• مفاهیم اصلی LLM: Mixture of Experts، انواع روشهای دیکدینگ
• آموزش و فاینتیون: SFT، RLHF، LoRA
• ارزیابی مدلها: LLM/VLM-as-a-judge و بهترین روشهای سنجش
• ترفندها و بهینهسازیها: RoPE، تقریب attention، کوانتیزهسازی
• استدلال و مقیاسپذیری در آموزش و استنتاج
• رویکردهای Agentic: RAG و Tool Calling
🧠 اگر از قبل با مدلهای زبانی آشنا هستید، این دوره فرصت عالی برای مرور عمیق و پیادهسازی از صفر است.
🔗 cme295.stanford.edu/syllabus
📡 @rss_ai_ir
#هوش_مصنوعی #استنفورد #LLM #Transformer #آموزش #DeepLearning #RAG #LoRA #RLHF #AI