⚡️ چرا مدلهای زبانی مدرن (LLM) نمیتوانند نقش «شرور» را درست بازی کنند؟
گزارش جدید Tencent نشان میدهد که مدلهایی که روی امنیت و اخلاق آموزش دیدهاند، در ایفای نقشهای منفی مثل شرور، فریبکار یا خودخواه تقریباً شکست میخورند.
دلیل ساده است: آموزشهای ایمنی آنها را مجبور میکند همیشه صادق، مفید و اخلاقی باشند — و این دقیقاً برعکس ویژگیهای یک ضدقهرمان است.
🧩 پژوهشگران تستی به نام Moral RolePlay ساختهاند:
۸۰۰ کاراکتر با چهار سطح اخلاقی، و مدل باید در یک سناریوی خاص واکنشی متناسب با شخصیت نشان دهد.
📊 نتایج جالب بودند:
♻️هرچه شخصیت «تاریکتر» میشود، کیفیت بازی مدل بهشدت افت میکند.
♻️در گذار از "خیر با نیت مبهم" به "خودخواه"، عملکرد بهطور ناگهانی سقوط میکند.
♻️مدلها بهجای برنامهریزی فریبکارانه، معمولاً دچار "انفجار عصبی" میشوند و فضای نقش را میشکنند.
♻️توانایی خوب در چت معمولی هیچ ربطی به بازی نقش شرور ندارد.
♻️تنظیمات ایمنی قویتر، اوضاع را حتی بدتر میکنند.
🎭 نتیجه: متدهای فعلی ایمنی با حوزههایی مثل بازی، فیلمنامهنویسی و داستانپردازی واقعی در تضاد هستند، چون این حوزهها نیاز به رفتارهای غیراخلاقی اما واقعی دارند.
📄 منبع: arxiv.org/abs/2511.04962
#هوش_مصنوعی #LLM #Tencent #AIethics #RolePlay #Neural
گزارش جدید Tencent نشان میدهد که مدلهایی که روی امنیت و اخلاق آموزش دیدهاند، در ایفای نقشهای منفی مثل شرور، فریبکار یا خودخواه تقریباً شکست میخورند.
دلیل ساده است: آموزشهای ایمنی آنها را مجبور میکند همیشه صادق، مفید و اخلاقی باشند — و این دقیقاً برعکس ویژگیهای یک ضدقهرمان است.
🧩 پژوهشگران تستی به نام Moral RolePlay ساختهاند:
۸۰۰ کاراکتر با چهار سطح اخلاقی، و مدل باید در یک سناریوی خاص واکنشی متناسب با شخصیت نشان دهد.
📊 نتایج جالب بودند:
♻️هرچه شخصیت «تاریکتر» میشود، کیفیت بازی مدل بهشدت افت میکند.
♻️در گذار از "خیر با نیت مبهم" به "خودخواه"، عملکرد بهطور ناگهانی سقوط میکند.
♻️مدلها بهجای برنامهریزی فریبکارانه، معمولاً دچار "انفجار عصبی" میشوند و فضای نقش را میشکنند.
♻️توانایی خوب در چت معمولی هیچ ربطی به بازی نقش شرور ندارد.
♻️تنظیمات ایمنی قویتر، اوضاع را حتی بدتر میکنند.
🎭 نتیجه: متدهای فعلی ایمنی با حوزههایی مثل بازی، فیلمنامهنویسی و داستانپردازی واقعی در تضاد هستند، چون این حوزهها نیاز به رفتارهای غیراخلاقی اما واقعی دارند.
📄 منبع: arxiv.org/abs/2511.04962
#هوش_مصنوعی #LLM #Tencent #AIethics #RolePlay #Neural
❤1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🐼مدل Pixel-Dense Embedding در مدل FlowFeat 🐼
محققان دانشگاه مونیخ (TUM Vision) مدل جدیدی به نام FlowFeat معرفی کردهاند — یک نمایش ویژگی چندوظیفهای و با وضوح بالا که قادر است توزیع حرکات ممکن در تصویر را بهصورت بردارهای فشرده (Embedding) نمایش دهد.
🧠 ایدهی کلیدی:
بهجای نمایش تنها یک حرکت برای هر پیکسل، FlowFeat چندین حرکت محتمل (motion profiles) را مدل میکند. این کار باعث افزایش دقت در وظایفی مانند Optical Flow، تخمین عمق، و درک صحنههای پویا میشود.
💡 ویژگیها:
♻️دقت بالا در پیشبینی حرکات ظریف در ویدیو
♻️مناسب برای چندین وظیفه (multi-task representation)
♻️نیاز محاسباتی پایین با حفظ جزئیات
♻️مبتنی بر معماری DINOv3 Backbone
📄 مقاله:
arxiv.org/pdf/2511.07696
💻 پروژه:
tum-vision.github.io/flowfeat
📦 کد منبع:
github.com/tum-vision/flowfeat
#FlowFeat #ComputerVision #MotionEstimation #DeepLearning #Neural #AI
محققان دانشگاه مونیخ (TUM Vision) مدل جدیدی به نام FlowFeat معرفی کردهاند — یک نمایش ویژگی چندوظیفهای و با وضوح بالا که قادر است توزیع حرکات ممکن در تصویر را بهصورت بردارهای فشرده (Embedding) نمایش دهد.
🧠 ایدهی کلیدی:
بهجای نمایش تنها یک حرکت برای هر پیکسل، FlowFeat چندین حرکت محتمل (motion profiles) را مدل میکند. این کار باعث افزایش دقت در وظایفی مانند Optical Flow، تخمین عمق، و درک صحنههای پویا میشود.
💡 ویژگیها:
♻️دقت بالا در پیشبینی حرکات ظریف در ویدیو
♻️مناسب برای چندین وظیفه (multi-task representation)
♻️نیاز محاسباتی پایین با حفظ جزئیات
♻️مبتنی بر معماری DINOv3 Backbone
📄 مقاله:
arxiv.org/pdf/2511.07696
💻 پروژه:
tum-vision.github.io/flowfeat
📦 کد منبع:
github.com/tum-vision/flowfeat
#FlowFeat #ComputerVision #MotionEstimation #DeepLearning #Neural #AI
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 شرکت Unitree از پلتفرم جدید خود برای کنترل از راه دور رباتها با کپی کامل حرکات انسان رونمایی کرد.
این سیستم به کاربر اجازه میدهد حرکات خود را در زمان واقعی به ربات منتقل کند، در حالی که دادههای حسگرهای ربات همزمان جمعآوری میشوند.
به این ترتیب، ربات میتواند حرکات انسانی را با دقت بالا تقلید کند — گامی مهم در جهت همگرایی انسان و ماشین در محیطهای صنعتی و خدماتی.
—————————
✔️ @rss_ai_ir
#ربات #Unitree #هوش_مصنوعی #رباتیک #کنترل_از_راه_دور #RobotControl #AI #Robotics
این سیستم به کاربر اجازه میدهد حرکات خود را در زمان واقعی به ربات منتقل کند، در حالی که دادههای حسگرهای ربات همزمان جمعآوری میشوند.
به این ترتیب، ربات میتواند حرکات انسانی را با دقت بالا تقلید کند — گامی مهم در جهت همگرایی انسان و ماشین در محیطهای صنعتی و خدماتی.
—————————
✔️ @rss_ai_ir
#ربات #Unitree #هوش_مصنوعی #رباتیک #کنترل_از_راه_دور #RobotControl #AI #Robotics
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Gamma.app —
استارتاپی که مقابل مایکروسافت و گوگل ایستاده!
استارتاپ Gamma که بهعنوان «ضد پاورپوینت» شروع به کار کرده بود، امروز به یکی از موفقترین پلتفرمهای تولید محتوای بصری با هوش مصنوعی تبدیل شده است.
در نسخهی جدید Gamma 3.0، این ابزار نهتنها ارائههای (presentations) هوشمند میسازد، بلکه میتواند وبسایتها و طرحهای شبکههای اجتماعی را نیز بهصورت خودکار تولید کند — حرکتی که رقبا مانند Canva را به چالش میکشد.
📊 آمار چشمگیر:
💰 درآمد سالانه (ARR): ۱۰۰ میلیون دلار
👥 کاربران فعال: ۷۰ میلیون نفر
💎 ارزشگذاری شرکت: ۲.۱ میلیارد دلار
👨💻 تنها ۵۰ کارمند
⚡ روزانه بیش از ۱ میلیون گاما ساخته میشود!
🧠 آنها بهتازگی API رسمی را منتشر کردهاند و برای علاقهمندان، راهنمای پرامپتنویسی (Prompt Guide) را در لینک زیر قرار دادهاند:
👉 https://gamma.app/prompts
جالب اینکه پنج سال پیش هیچ اثری از AI در Gamma نبود — اما امروز، یکی از نمادهای تحول در محتوای هوشمند است.
#GammaApp #هوش_مصنوعی #AI #ارائه #استارتاپ #PowerPoint #Canva #تولید_محتوا #GenerativeAI #cgevent
استارتاپی که مقابل مایکروسافت و گوگل ایستاده!
استارتاپ Gamma که بهعنوان «ضد پاورپوینت» شروع به کار کرده بود، امروز به یکی از موفقترین پلتفرمهای تولید محتوای بصری با هوش مصنوعی تبدیل شده است.
در نسخهی جدید Gamma 3.0، این ابزار نهتنها ارائههای (presentations) هوشمند میسازد، بلکه میتواند وبسایتها و طرحهای شبکههای اجتماعی را نیز بهصورت خودکار تولید کند — حرکتی که رقبا مانند Canva را به چالش میکشد.
📊 آمار چشمگیر:
💰 درآمد سالانه (ARR): ۱۰۰ میلیون دلار
👥 کاربران فعال: ۷۰ میلیون نفر
💎 ارزشگذاری شرکت: ۲.۱ میلیارد دلار
👨💻 تنها ۵۰ کارمند
⚡ روزانه بیش از ۱ میلیون گاما ساخته میشود!
🧠 آنها بهتازگی API رسمی را منتشر کردهاند و برای علاقهمندان، راهنمای پرامپتنویسی (Prompt Guide) را در لینک زیر قرار دادهاند:
👉 https://gamma.app/prompts
جالب اینکه پنج سال پیش هیچ اثری از AI در Gamma نبود — اما امروز، یکی از نمادهای تحول در محتوای هوشمند است.
#GammaApp #هوش_مصنوعی #AI #ارائه #استارتاپ #PowerPoint #Canva #تولید_محتوا #GenerativeAI #cgevent
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🎙 مجموعه ElevenLabs از نسخه جدید ابزار تبدیل گفتار به متن خود رونمایی کرد — Scribe v2
مدل جدید Scribe v2 اکنون قادر است گفتار را با تأخیر تنها ۱۵۰ میلیثانیه به متن تبدیل کند — سرعتی تقریباً آنی!
🔹 ویژگیهای کلیدی:
تشخیص و برچسبگذاری خودکار گویندگان مختلف 🗣️
پشتیبانی از ۹۲ زبان از جمله فارسی و روسی 🌍
قابلیت استریم زنده (Live Streaming) و اتصال از طریق API
مناسب برای رویدادها، سخنرانیها و زیرنویس همزمان ویدیوها
عملکرد بهتر نسبت به Gemini 2.5 Flash، GPT-4o MiniTranscribe و Deepgram Nova 3 ⚡
📘 جزئیات فنی و مستندات:
👉 https://elevenlabs.io/docs/models#scribe-v2-realtime
📡 با این مدل، ElevenLabs عملاً به رهبر جدید Speech-to-Text بلادرنگ (Real-Time) تبدیل شده است.
#ElevenLabs #هوش_مصنوعی #SpeechToText #RealtimeAI #Transcription #VoiceAI #cgevent
مدل جدید Scribe v2 اکنون قادر است گفتار را با تأخیر تنها ۱۵۰ میلیثانیه به متن تبدیل کند — سرعتی تقریباً آنی!
🔹 ویژگیهای کلیدی:
تشخیص و برچسبگذاری خودکار گویندگان مختلف 🗣️
پشتیبانی از ۹۲ زبان از جمله فارسی و روسی 🌍
قابلیت استریم زنده (Live Streaming) و اتصال از طریق API
مناسب برای رویدادها، سخنرانیها و زیرنویس همزمان ویدیوها
عملکرد بهتر نسبت به Gemini 2.5 Flash، GPT-4o MiniTranscribe و Deepgram Nova 3 ⚡
📘 جزئیات فنی و مستندات:
👉 https://elevenlabs.io/docs/models#scribe-v2-realtime
📡 با این مدل، ElevenLabs عملاً به رهبر جدید Speech-to-Text بلادرنگ (Real-Time) تبدیل شده است.
#ElevenLabs #هوش_مصنوعی #SpeechToText #RealtimeAI #Transcription #VoiceAI #cgevent
🧠 بایدو مدل جدید ERNIE-4.5-VL-28B-A3B-Thinking را منتشر کرد
مدلی چندوجهی (Multi-Modal) با ۲۸ میلیارد پارامتر که تنها ۳ میلیارد پارامتر در هر گام فعال میکند، اما عملکردی در حد مدلهای تصویری پیشرفته دارد.
این معماری از نوع A3B است و برای وظایفی طراحی شده که ترکیب تصویر، متن و استدلال چندمرحلهای نیاز دارند.
📊 قابلیتهای کلیدی:
🧩 استدلال بصری: تحلیل دیاگرامها، روابط علّی و منطق چندمرحلهای
📸 حل مسائل STEM از روی عکس: کافیست از مسئله عکس بگیرید تا پاسخ تحلیلی دریافت کنید
🎯 درک دقیق اجزای تصویر: شناسایی دقیق اشیاء و جزئیات با زوم بالا
🔍 تحلیل عمیق تصاویر: تشخیص ریزترین تفاوتها
🧠 فراخوانی ابزارها: مثل Image Search برای جستوجوی تصویری
🎞 درک ویدیو: دنبالکردن وقایع و تغییرات در طول زمان
🔓 لایسنس: Apache 2.0
📦 مدل در Hugging Face:
👉 https://huggingface.co/baidu/ERNIE-4.5-VL-28B-A3B-Thinking
#Baidu #هوش_مصنوعی #AI #ML #چندوجهی #VisionLanguage #LLM #cgevent
مدلی چندوجهی (Multi-Modal) با ۲۸ میلیارد پارامتر که تنها ۳ میلیارد پارامتر در هر گام فعال میکند، اما عملکردی در حد مدلهای تصویری پیشرفته دارد.
این معماری از نوع A3B است و برای وظایفی طراحی شده که ترکیب تصویر، متن و استدلال چندمرحلهای نیاز دارند.
📊 قابلیتهای کلیدی:
🧩 استدلال بصری: تحلیل دیاگرامها، روابط علّی و منطق چندمرحلهای
📸 حل مسائل STEM از روی عکس: کافیست از مسئله عکس بگیرید تا پاسخ تحلیلی دریافت کنید
🎯 درک دقیق اجزای تصویر: شناسایی دقیق اشیاء و جزئیات با زوم بالا
🔍 تحلیل عمیق تصاویر: تشخیص ریزترین تفاوتها
🧠 فراخوانی ابزارها: مثل Image Search برای جستوجوی تصویری
🎞 درک ویدیو: دنبالکردن وقایع و تغییرات در طول زمان
🔓 لایسنس: Apache 2.0
📦 مدل در Hugging Face:
👉 https://huggingface.co/baidu/ERNIE-4.5-VL-28B-A3B-Thinking
#Baidu #هوش_مصنوعی #AI #ML #چندوجهی #VisionLanguage #LLM #cgevent
This media is not supported in your browser
VIEW IN TELEGRAM
🚚 در حالیکه همه سرگرم «رونمایی رباتتاکسی» از Tesla هستند، در چین پارکهای کامل خودروهای خودران برای تحویل کالا در حال راهاندازیاند!
در چین، شرکتها در حال پیادهسازی اتحادیهای از ناوگانهای خودران هستند که بدون راننده، محمولهها را در مقیاس وسیع بین مراکز توزیع و نقاط مصرف جابهجا میکنند.
📌 نکات مهم این روند:
✅ تمرکز بر تحویل بسته و لوجستیک نه سواری مسافر — یعنی ورود به بازاری متفاوت و احتمالاً با موانع مقرراتی کمتر
🏞 ایجاد «پارکهای خودران» یا مناطق آزاد برای تست و بهرهبرداری تجاری
🌐 چین با سرعت بیشتری به سمت استقرار عملیاتی خودروهای خودران حرکت میکند، در حالیکه تمرکز عمومی بر خودروی سواری است
🔍 نتیجه؟
رباتتاکسیها شگفتانگیز هستند، اما خودروهای تحویل خودران شاید اولین دستاورد بزرگ در مقیاس واقعی باشند — و چین در این مسیر جلوتر از بسیاری از رقباست.
#خودرو_خودران #تکنولوژی #چین #لجستیک #AUTONOMOUS #AI #رسانه_هوش_مصنوعی
در چین، شرکتها در حال پیادهسازی اتحادیهای از ناوگانهای خودران هستند که بدون راننده، محمولهها را در مقیاس وسیع بین مراکز توزیع و نقاط مصرف جابهجا میکنند.
📌 نکات مهم این روند:
✅ تمرکز بر تحویل بسته و لوجستیک نه سواری مسافر — یعنی ورود به بازاری متفاوت و احتمالاً با موانع مقرراتی کمتر
🏞 ایجاد «پارکهای خودران» یا مناطق آزاد برای تست و بهرهبرداری تجاری
🌐 چین با سرعت بیشتری به سمت استقرار عملیاتی خودروهای خودران حرکت میکند، در حالیکه تمرکز عمومی بر خودروی سواری است
🔍 نتیجه؟
رباتتاکسیها شگفتانگیز هستند، اما خودروهای تحویل خودران شاید اولین دستاورد بزرگ در مقیاس واقعی باشند — و چین در این مسیر جلوتر از بسیاری از رقباست.
#خودرو_خودران #تکنولوژی #چین #لجستیک #AUTONOMOUS #AI #رسانه_هوش_مصنوعی
🧠 HierarchicalTopK —
رویکردی تازه برای تفسیرپذیری شبکههای عصبی
در کنفرانس EMNLP 2025 روشی با نام HierarchicalTopK معرفی شد — رویکردی که امکان آموزش شبکههای عصبی را در چندین سطح پراکندگی (sparsity) بهصورت همزمان فراهم میکند، بدون آنکه تفسیرپذیری یا کیفیت مدل از بین برود.
🔹 مسئله اصلی:
در روشهای سنتی، سطح پراکندگی باید پیش از آموزش تعیین شود و تغییر آن بعداً ممکن نیست.
پراکندگی کم → مدل دقیق ولی غیرتفسیرپذیر.
پراکندگی زیاد → تفسیرپذیر ولی با افت عملکرد.
🔹 نوآوری HierarchicalTopK:
بهجای آموزش چند مدل جداگانه برای هر سطح، این روش یک فضای واحد میسازد که تمام سطوح پراکندگی را در خود جای میدهد.
در نتیجه:
♻️میتوان بهصورت پویا بین سطوح پراکندگی جابهجا شد؛
♻️ارتباط معنایی بین سطوح حفظ میشود؛
♻️مدل حتی در سطوح بالا تفسیرپذیری خود را حفظ میکند.
🔹 مزیتهای کلیدی:
✅ فقط یک مدل لازم است، نه دهها مدل جداگانه
✅ کاهش هزینه محاسباتی و زمان آموزش
✅ مناسب برای حسابرسی و تحلیل رفتار مدلها
✅ گامی مهم بهسوی هوش مصنوعی تفسیرپذیر در صنعت
📦 مدل و کد در Hugging Face:
🔗 https://huggingface.co/t-tech/flex-sae
#AI #ML #EMNLP2025 #ExplainableAI #SparseModeling #Interpretability #هوش_مصنوعی #یادگیری_ماشینی
رویکردی تازه برای تفسیرپذیری شبکههای عصبی
در کنفرانس EMNLP 2025 روشی با نام HierarchicalTopK معرفی شد — رویکردی که امکان آموزش شبکههای عصبی را در چندین سطح پراکندگی (sparsity) بهصورت همزمان فراهم میکند، بدون آنکه تفسیرپذیری یا کیفیت مدل از بین برود.
🔹 مسئله اصلی:
در روشهای سنتی، سطح پراکندگی باید پیش از آموزش تعیین شود و تغییر آن بعداً ممکن نیست.
پراکندگی کم → مدل دقیق ولی غیرتفسیرپذیر.
پراکندگی زیاد → تفسیرپذیر ولی با افت عملکرد.
🔹 نوآوری HierarchicalTopK:
بهجای آموزش چند مدل جداگانه برای هر سطح، این روش یک فضای واحد میسازد که تمام سطوح پراکندگی را در خود جای میدهد.
در نتیجه:
♻️میتوان بهصورت پویا بین سطوح پراکندگی جابهجا شد؛
♻️ارتباط معنایی بین سطوح حفظ میشود؛
♻️مدل حتی در سطوح بالا تفسیرپذیری خود را حفظ میکند.
🔹 مزیتهای کلیدی:
✅ فقط یک مدل لازم است، نه دهها مدل جداگانه
✅ کاهش هزینه محاسباتی و زمان آموزش
✅ مناسب برای حسابرسی و تحلیل رفتار مدلها
✅ گامی مهم بهسوی هوش مصنوعی تفسیرپذیر در صنعت
📦 مدل و کد در Hugging Face:
🔗 https://huggingface.co/t-tech/flex-sae
#AI #ML #EMNLP2025 #ExplainableAI #SparseModeling #Interpretability #هوش_مصنوعی #یادگیری_ماشینی
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 دموی زندهی کونگفو با ربات Unitree G1 — واقعاً چشمگیر!
ربات انساننمای Unitree G1 در جدیدترین نمایش خود، مهارتهای فیزیکی و هماهنگی بدنی در سطح بسیار بالایی را نشان داد — از حرکات رزمی گرفته تا تعادل دقیق و واکنش سریع در محیط واقعی.
این نسخه از G1 بهلطف موتور کنترل حرکتی بهبودیافته و الگوریتمهای یادگیری تقویتی جدید میتواند حرکات دینامیکی مانند لگد، چرخش و دفاع را با تعادل کامل انجام دهد.
📍 با چنین دقت و پایداری، G1 نهتنها یک ربات نمایشی نیست، بلکه گامی جدی بهسمت روباتهای انساننمای کاربردی در محیطهای واقعی محسوب میشود.
📹 ویدیو دموی زنده را ببینید:
#Unitree #Humanoid #Robot #AI #Robotics #هوش_مصنوعی #رباتیک #ربات_انساننما #تکنولوژی
ربات انساننمای Unitree G1 در جدیدترین نمایش خود، مهارتهای فیزیکی و هماهنگی بدنی در سطح بسیار بالایی را نشان داد — از حرکات رزمی گرفته تا تعادل دقیق و واکنش سریع در محیط واقعی.
این نسخه از G1 بهلطف موتور کنترل حرکتی بهبودیافته و الگوریتمهای یادگیری تقویتی جدید میتواند حرکات دینامیکی مانند لگد، چرخش و دفاع را با تعادل کامل انجام دهد.
📍 با چنین دقت و پایداری، G1 نهتنها یک ربات نمایشی نیست، بلکه گامی جدی بهسمت روباتهای انساننمای کاربردی در محیطهای واقعی محسوب میشود.
📹 ویدیو دموی زنده را ببینید:
#Unitree #Humanoid #Robot #AI #Robotics #هوش_مصنوعی #رباتیک #ربات_انساننما #تکنولوژی
❤3
This media is not supported in your browser
VIEW IN TELEGRAM
📚 پروژهای متنباز برای در دسترسکردن ۱۰۰ میلیون مقاله علمی با کمک خلاصههای ساختاریافته تولیدشده توسط LLM
هدف این پروژه، ایجاد پلی میان انبوه مقالات علمی و درک ساختارمند از آنهاست — جایی که هوش مصنوعی به پژوهشگران در جهتیابی در اقیانوس دانش کمک میکند.
🧠 شامل:
۱۰۰٬۰۰۰ خلاصه ساختاریافته از مقالات علمی
دو مدل LLM بهینهسازیشده برای تحلیل مفهومی و استخراج ساختار علمی
بصریساز سهبعدی (3D Visualizer) برای نمایش شبکه ارتباطی میان پژوهشها
🔗 وبلاگ: laion.ai/notes/summaries
🤖 مدلها: huggingface.co/inference-net
🌐 بصریساز: aella.inference.net
#هوش_مصنوعی #پژوهش #LLM #علم #Laion #AI
هدف این پروژه، ایجاد پلی میان انبوه مقالات علمی و درک ساختارمند از آنهاست — جایی که هوش مصنوعی به پژوهشگران در جهتیابی در اقیانوس دانش کمک میکند.
🧠 شامل:
۱۰۰٬۰۰۰ خلاصه ساختاریافته از مقالات علمی
دو مدل LLM بهینهسازیشده برای تحلیل مفهومی و استخراج ساختار علمی
بصریساز سهبعدی (3D Visualizer) برای نمایش شبکه ارتباطی میان پژوهشها
🔗 وبلاگ: laion.ai/notes/summaries
🤖 مدلها: huggingface.co/inference-net
🌐 بصریساز: aella.inference.net
#هوش_مصنوعی #پژوهش #LLM #علم #Laion #AI
💯1
⭐ مدل VibeThinker-1.5B؛ مدل کوچک اما رکوردشکن در استدلال
این مدل ۱.۵ میلیارد پارامتری با وجود اندازهی بسیار کوچک، در آزمونهای استدلالی به نتایج SOTA رسیده است.
🚀 عملکرد:
در AIME24/25 و HMMT25 جزو بهترینهاست و حتی مدل DeepSeek R1-0120 را در مسائل ریاضی پشت سر میگذارد. در برنامهنویسی رقابتی هم بالاتر از مدلهای همحجم ظاهر شده است.
⚡ بهرهوری:
فقط ۱.۵B پارامتر — یعنی ۱۰۰ تا ۶۰۰ برابر کوچکتر از مدلهایی مثل Kimi K2 و DeepSeek R1.
💰 هزینه:
کل هزینهٔ پستمرین حدود ۷.۸ هزار دلار بوده؛ یعنی ۳۰ تا ۶۰ برابر ارزانتر از DeepSeek R1 یا MiniMax-M1.
این مدل بر پایهٔ Spectrum-to-Signal Principle (SSP) و فریمورک MGPO ساخته شده تا فرآیند استدلال را بهینه کند.
📦 Model:
hf.co/WeiboAI/VibeThinker-1.5B
💻 GitHub:
github.com/WeiboAI/VibeThinker
📄 Arxiv:
arxiv.org/abs/2511.06221
#AI #LLM #Reasoning #OpenSource #SmallModel @rss_ai_ir
این مدل ۱.۵ میلیارد پارامتری با وجود اندازهی بسیار کوچک، در آزمونهای استدلالی به نتایج SOTA رسیده است.
🚀 عملکرد:
در AIME24/25 و HMMT25 جزو بهترینهاست و حتی مدل DeepSeek R1-0120 را در مسائل ریاضی پشت سر میگذارد. در برنامهنویسی رقابتی هم بالاتر از مدلهای همحجم ظاهر شده است.
⚡ بهرهوری:
فقط ۱.۵B پارامتر — یعنی ۱۰۰ تا ۶۰۰ برابر کوچکتر از مدلهایی مثل Kimi K2 و DeepSeek R1.
💰 هزینه:
کل هزینهٔ پستمرین حدود ۷.۸ هزار دلار بوده؛ یعنی ۳۰ تا ۶۰ برابر ارزانتر از DeepSeek R1 یا MiniMax-M1.
این مدل بر پایهٔ Spectrum-to-Signal Principle (SSP) و فریمورک MGPO ساخته شده تا فرآیند استدلال را بهینه کند.
📦 Model:
hf.co/WeiboAI/VibeThinker-1.5B
💻 GitHub:
github.com/WeiboAI/VibeThinker
📄 Arxiv:
arxiv.org/abs/2511.06221
#AI #LLM #Reasoning #OpenSource #SmallModel @rss_ai_ir
⚡️مدل ChatGPT-5.1 منتشر شد
همچنین OpenAI نسخهی جدید GPT-5.1 را عرضه کرد؛ تمرکز اصلی این آپدیت روی هوش، کیفیت گفتگو و بهبود سبک پاسخگویی است.
🟢 GPT-5.1 Instant
مدل Instant حالا دارای تفکر تطبیقی است؛ یعنی میتواند در مسائل پیچیده بهصورت مستقل «تأمل» کند.
نتیجه؟ امتیازهای بالاتر در آزمونهای AIME 2025 و چالشهای Codeforces.
همچنین در دنبالکردن دستورها بهتر شده و لحن پیشفرض آن گرمتر و انسانیتر است.
🟢 GPT-5.1 Thinking
این نسخه هم بهروزرسانی شده:
• پاسخدهی به پرسشهای ساده سریعتر
• خروجیها روشنتر و کماصطلاحتر شدهاند
✨ سبکهای جدید نوشتاری نیز اضافه شدهاند:
مدل «Professional»، «Frank» و «Unusual» برای شخصیسازی دقیقتر پاسخها.
🔔 انتشار برای کاربران پرداختی شروع شده و API طی روزهای آینده فعال میشود. نسخههای قبلی GPT-5 نیز تا سه ماه در دسترس خواهند بود.
#news #ai #ml @rss_ai_ir
همچنین OpenAI نسخهی جدید GPT-5.1 را عرضه کرد؛ تمرکز اصلی این آپدیت روی هوش، کیفیت گفتگو و بهبود سبک پاسخگویی است.
🟢 GPT-5.1 Instant
مدل Instant حالا دارای تفکر تطبیقی است؛ یعنی میتواند در مسائل پیچیده بهصورت مستقل «تأمل» کند.
نتیجه؟ امتیازهای بالاتر در آزمونهای AIME 2025 و چالشهای Codeforces.
همچنین در دنبالکردن دستورها بهتر شده و لحن پیشفرض آن گرمتر و انسانیتر است.
🟢 GPT-5.1 Thinking
این نسخه هم بهروزرسانی شده:
• پاسخدهی به پرسشهای ساده سریعتر
• خروجیها روشنتر و کماصطلاحتر شدهاند
✨ سبکهای جدید نوشتاری نیز اضافه شدهاند:
مدل «Professional»، «Frank» و «Unusual» برای شخصیسازی دقیقتر پاسخها.
🔔 انتشار برای کاربران پرداختی شروع شده و API طی روزهای آینده فعال میشود. نسخههای قبلی GPT-5 نیز تا سه ماه در دسترس خواهند بود.
#news #ai #ml @rss_ai_ir
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 مجموعه Freepik قابلیت Camera Angle را به فضای نودی Spaces اضافه کرد
در Freepik Spaces حالا میتوانید زاویهٔ دوربین را بهصورت سهبعدی کنترل کنید:
🟦 تصویر خود را آپلود میکنید
🟧 آن را به نود Camera Angle وصل میکنید
🟩 تصویر روی یکی از وجههای یک مکعب مجازی قرار میگیرد
🟪 تنها با چرخاندن مکعب، خروجی از هر زاویه تولید میشود
میتوانید چند نود مختلف وصل کنید تا هر کدام یک زاویهٔ مستقل نمایش دهند.
🧠 در پشت صحنه از Qwen Image Edit استفاده شده.
💳 هر生成 حدود ۵۰ کریدر هزینه دارد.
🌐 سایت
#neural #ai #image_editing
@rss_ai_ir
در Freepik Spaces حالا میتوانید زاویهٔ دوربین را بهصورت سهبعدی کنترل کنید:
🟦 تصویر خود را آپلود میکنید
🟧 آن را به نود Camera Angle وصل میکنید
🟩 تصویر روی یکی از وجههای یک مکعب مجازی قرار میگیرد
🟪 تنها با چرخاندن مکعب، خروجی از هر زاویه تولید میشود
میتوانید چند نود مختلف وصل کنید تا هر کدام یک زاویهٔ مستقل نمایش دهند.
🧠 در پشت صحنه از Qwen Image Edit استفاده شده.
💳 هر生成 حدود ۵۰ کریدر هزینه دارد.
🌐 سایت
#neural #ai #image_editing
@rss_ai_ir
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🟩 Foundational Humanoid —
مدل SONIC از انویدیا 🟩
انویدیا از SONIC رونمایی کرد؛ یک مدل بنیادی (Foundational Model) برای کنترل بسیار دقیق رباتهای انساننما با حرکات طبیعی و شبیه انسان — از دویدن و پریدن تا خزیدن و تعاملات پیچیده.
🧠 ویژگیهای کلیدی SONIC:
♻️کنترل تلهاُپریشن با دقت بالا
♻️حرکات طبیعی و هماهنگ شبیه انسان
♻️تعاملات پیچیده سهبعدی
♻️کاربرد در رباتهای نسل جدید و سیستمهای فیزیکمحور
کد پروژه منتشر شده است 💙
🔗 لینکها:
Paper:
https://arxiv.org/pdf/2511.07820
Project:
https://nvlabs.github.io/SONIC
#AI #Robotics #Humanoid #NVIDIA #SONIC @rss_ai_ir
مدل SONIC از انویدیا 🟩
انویدیا از SONIC رونمایی کرد؛ یک مدل بنیادی (Foundational Model) برای کنترل بسیار دقیق رباتهای انساننما با حرکات طبیعی و شبیه انسان — از دویدن و پریدن تا خزیدن و تعاملات پیچیده.
🧠 ویژگیهای کلیدی SONIC:
♻️کنترل تلهاُپریشن با دقت بالا
♻️حرکات طبیعی و هماهنگ شبیه انسان
♻️تعاملات پیچیده سهبعدی
♻️کاربرد در رباتهای نسل جدید و سیستمهای فیزیکمحور
کد پروژه منتشر شده است 💙
🔗 لینکها:
Paper:
https://arxiv.org/pdf/2511.07820
Project:
https://nvlabs.github.io/SONIC
#AI #Robotics #Humanoid #NVIDIA #SONIC @rss_ai_ir
❤1👍1
⚡️ بایدو ERNIE 5.0 را منتشر کرد — هیولای ۲.۴ تریلیون پارامتری
غول تکنولوژی چین Baidu نسخهٔ جدید مدل پرچمدار خود ERNIE 5.0 را با ۲.۴ تریلیون پارامتر رونمایی کرد.
🟢 ویژگیهای کلیدی ERNIE 5.0:
✳️اُمـنیمودال: پشتیبانی از متن، تصویر، صدا و ویدئو در ورودی و خروجی
✳️فهم بهترِ دستورها (Instruction Following)
✳️بهبود چشمگیر در نوشتار خلاقانه
✳️عملکرد قوی در منطق، reasoning، حافظه و اقناع (persuasion)
✳️مناسب برای کارهای پیچیده و چندمرحلهای
⛔️فعلاً جزئیات کامل منتشر نشده و فقط چند نمودار مبهم از بنچمارکها ارائه شده، اما مدل قابل تست در چتبات بایدو است.
https://ernie.baidu.com/
#AI #ML #Baidu #ERNIE5 @rss_ai_ir
غول تکنولوژی چین Baidu نسخهٔ جدید مدل پرچمدار خود ERNIE 5.0 را با ۲.۴ تریلیون پارامتر رونمایی کرد.
🟢 ویژگیهای کلیدی ERNIE 5.0:
✳️اُمـنیمودال: پشتیبانی از متن، تصویر، صدا و ویدئو در ورودی و خروجی
✳️فهم بهترِ دستورها (Instruction Following)
✳️بهبود چشمگیر در نوشتار خلاقانه
✳️عملکرد قوی در منطق، reasoning، حافظه و اقناع (persuasion)
✳️مناسب برای کارهای پیچیده و چندمرحلهای
⛔️فعلاً جزئیات کامل منتشر نشده و فقط چند نمودار مبهم از بنچمارکها ارائه شده، اما مدل قابل تست در چتبات بایدو است.
https://ernie.baidu.com/
#AI #ML #Baidu #ERNIE5 @rss_ai_ir
🔥1
🎛 نودها ۴۰ ساله شدند!
این روزها همهٔ سرویسها «رابط نودی» را مثل یک قابلیت تازه معرفی میکنند — اما واقعیت این است که نودهای گرافیکی حدود ۴ دهه عمر دارند.
🔹 داستان از کجا شروع شد؟
قبل از Houdini، نرمافزاری به نام Prisms وجود داشت که برای بزرگترین استودیوی CG آن زمان، یعنی Omnibus نوشته شد.
اما در سال ۱۹۸۷، Omnibus ورشکست شد و Kim Davidson و Greg Hermanovic حقوق Prisms را خریدند و شرکت SideFX را ساختند.
🔹 سپس چه شد؟
مدتی Houdini و Prisms همزمان فروخته میشدند.
در دل Prisms، ماژولی وجود داشت به نام:
✨ ICE – Interactive Compositing Environment
و همین ICE اولین نسل جدی رابطهای نودی بود.
امروز Krea ، Runway ، ComfyUI و صدها ابزار دیگر فقط ادامهٔ همان مسیر ۴۰ سالهاند — نه یک «فکر جدید» بلکه تکامل یک ایدهٔ قدیمی و قدرتمند.
📚 اگر تاریخ Houdini برایتان جذاب است، این مقاله را بخوانید:
fxguide.com/fxfeatured/side-effects-software-25-years-on/
#NodeBased #Houdini #CG #VFX #HistoryOfTech @rss_ai_ir
این روزها همهٔ سرویسها «رابط نودی» را مثل یک قابلیت تازه معرفی میکنند — اما واقعیت این است که نودهای گرافیکی حدود ۴ دهه عمر دارند.
🔹 داستان از کجا شروع شد؟
قبل از Houdini، نرمافزاری به نام Prisms وجود داشت که برای بزرگترین استودیوی CG آن زمان، یعنی Omnibus نوشته شد.
اما در سال ۱۹۸۷، Omnibus ورشکست شد و Kim Davidson و Greg Hermanovic حقوق Prisms را خریدند و شرکت SideFX را ساختند.
🔹 سپس چه شد؟
مدتی Houdini و Prisms همزمان فروخته میشدند.
در دل Prisms، ماژولی وجود داشت به نام:
✨ ICE – Interactive Compositing Environment
و همین ICE اولین نسل جدی رابطهای نودی بود.
امروز Krea ، Runway ، ComfyUI و صدها ابزار دیگر فقط ادامهٔ همان مسیر ۴۰ سالهاند — نه یک «فکر جدید» بلکه تکامل یک ایدهٔ قدیمی و قدرتمند.
📚 اگر تاریخ Houdini برایتان جذاب است، این مقاله را بخوانید:
fxguide.com/fxfeatured/side-effects-software-25-years-on/
#NodeBased #Houdini #CG #VFX #HistoryOfTech @rss_ai_ir
🧠 یان لوکُن دوباره برگشت: معرفی LeJEPA — نسل جدید یادگیری خودنظارتی
در مدلهای قبلی خانوادهٔ JEPA همیشه نیاز به ترفندهای پیچیده بود تا مدل دچار collapsing نشود:
مثل stop-gradient، معماری teacher–student یا هدهای پیشبینیکننده.
اما مدل جدید LeJEPA همهٔ این هکها را حذف کرده و فقط یک Regularizer جدید اضافه کرده:
✨ SIGReg — Sketched Isotropic Gaussian Regularization
🔍 مدل SIGReg چه میکند؟
بردارهای ویژگی را وادار میکند که بهطور یکنواخت در تمام جهتها پخش شوند؛ یعنی یک ابر ایزوتروپیک بسازند.
این ساختار هندسی باعث میشود مدل کمترین خطا را در وظایف آینده داشته باشد — نه بر اساس حدس، بلکه بر اساس تحلیل ریاضی.
📌 چرا مهم است؟
✳️آموزش بسیار پایدارتر و سادهتر میشود
✳️به راحتی مقیاسپذیر است (تست روی مدل ۱.۸ میلیارد پارامتری)
✳️نیازی به teacher-student نیست
✳️کیفیت مدل بدون برچسبگذاری قابل تخمین است — چون loss بهخوبی با دقت نهایی همبستگی دارد
✳️مناسبترین هندسه برای نمایش ویژگیها را ایجاد میکند
📈 نتیجه:
دقت 79٪ در ارزیابی linear probe روی ImageNet-1K با حداقل تنظیمات.
این کار یک گام مهم به سمت self-supervised learning قابلاعتماد، پایدار و مقیاسپذیر است.
📄 مقاله:
arxiv.org/abs/2511.08544
#AI #ML #SelfSupervised #LeJEPA #YannLeCun @rss_ai_ir
در مدلهای قبلی خانوادهٔ JEPA همیشه نیاز به ترفندهای پیچیده بود تا مدل دچار collapsing نشود:
مثل stop-gradient، معماری teacher–student یا هدهای پیشبینیکننده.
اما مدل جدید LeJEPA همهٔ این هکها را حذف کرده و فقط یک Regularizer جدید اضافه کرده:
✨ SIGReg — Sketched Isotropic Gaussian Regularization
🔍 مدل SIGReg چه میکند؟
بردارهای ویژگی را وادار میکند که بهطور یکنواخت در تمام جهتها پخش شوند؛ یعنی یک ابر ایزوتروپیک بسازند.
این ساختار هندسی باعث میشود مدل کمترین خطا را در وظایف آینده داشته باشد — نه بر اساس حدس، بلکه بر اساس تحلیل ریاضی.
📌 چرا مهم است؟
✳️آموزش بسیار پایدارتر و سادهتر میشود
✳️به راحتی مقیاسپذیر است (تست روی مدل ۱.۸ میلیارد پارامتری)
✳️نیازی به teacher-student نیست
✳️کیفیت مدل بدون برچسبگذاری قابل تخمین است — چون loss بهخوبی با دقت نهایی همبستگی دارد
✳️مناسبترین هندسه برای نمایش ویژگیها را ایجاد میکند
📈 نتیجه:
دقت 79٪ در ارزیابی linear probe روی ImageNet-1K با حداقل تنظیمات.
این کار یک گام مهم به سمت self-supervised learning قابلاعتماد، پایدار و مقیاسپذیر است.
📄 مقاله:
arxiv.org/abs/2511.08544
#AI #ML #SelfSupervised #LeJEPA #YannLeCun @rss_ai_ir
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 ماربل (Marble) از نگاه یک بتاتستر واقعی — بازسازی یک خانه فقط با ۱۳ عکس ۳۶۰ درجه!
گوشا مولودتسوف، که در بتاتست Marble شرکت کرده بود، یک کار فوقالعاده کرده:
او با استفاده از Gaussian Splatting + AI + Marble خانهای را که همسرش دوران کودکیاش را در آن گذرانده بود بهطور کامل بازسازی سهبعدی کرده است — و فقط با ۱۳ عکس ۳۶۰ درجه!
این ویدئو که مثل پرواز FPV به نظر میرسد، کاملاً مجازی است — هیچ درون یا دوربینی وجود ندارد. همهچیز یک جهان سهبعدی بازسازیشده با هوشمصنوعی است.
وقتی همسرش اولین تست را دید، اشکش درآمد…
حالا کل خانواده (که هر کدام در کشوری هستند) میتوانند دوباره داخل آن خانه قدم بزنند — در متاورس.
🔗 نسخهٔ قابل بازدید فضای بازسازیشده:
https://arrival.space/51431471_7414
---
🛠 مراحل کار — به زبان ساده
1) ساخت Gaussian Splat با Marble (World Labs)
همچنین Marble اخیراً پشتیبانی از عکسهای ۳۶۰ درجه را اضافه کرده.
گوشا تمام ۱۳ عکس را در کمتر از یک ساعت وارد سیستم کرد.
مدل Marble با ترکیبی از:
تخمین عمق از عکس ۳۶۰
بازسازی مبتنی بر AI
آموزش روی میلیونها اسپلت
فضایی کامل و قابل حرکت تولید میکند.
---
2) ویرایش و یکپارچهسازی با SuperSplat
با SuperSplat از PlayCanvas:
اتاقها و فضاها یکپارچه شدند
سوراخها بسته شدند
اندازه واقعی فضاها تنظیم شد (چون AI مقیاس واقعی را نمیداند)
آسمان و بیرون خانه بازسازی شد
برای نمای بیرونی چند عکس جدید گرفته شد تا Marble حدس اشتباه نزند
📦 حجم نهایی:
حدود 22 میلیون اسپلت — 1.3GB فایل.
---
3) ساخت جهان متاورسی با Arrival.Space
همچنین GS بهترین فرمت برای متاورس است.
در Arrival:
♻️فایل SOG (نسخه فشرده GS) بارگذاری شد
♻️با یک ترفند، ابتدا PLY بارگذاری شد تا کُلیدر (قاب برخورد) تولید شود
♻️سپس نسخه اصلی SOG با کُلیدر اصلاحشده جایگزین شد
---
🎁 خروجیهای فعلی Marble
همچنین Marble در حال حاضر اینها را تحویل میدهد:
1. فایل PLY + نسخه فشرده SPZ
2. مش کمکیفیت برای Collider
3. مش با کیفیت بالا
4. یک پانورامای ۳۶۰ از فضای بازسازیشده
---
🎬 ویدئو را حتماً با کیفیت بالا ببینید:
https://www.youtube.com/watch?v=R70bydPsb4s
---
🔥 این همان جایی است که فناوری واقعاً به زندگی انسانها معنا و احساس اضافه میکند.
بازسازی خاطره، بازگشت به گذشته، و زندهکردن فضاهایی که دیگر وجود ندارند…
#AI #3D #Marble #GaussianSplatting @rss_ai_ir
گوشا مولودتسوف، که در بتاتست Marble شرکت کرده بود، یک کار فوقالعاده کرده:
او با استفاده از Gaussian Splatting + AI + Marble خانهای را که همسرش دوران کودکیاش را در آن گذرانده بود بهطور کامل بازسازی سهبعدی کرده است — و فقط با ۱۳ عکس ۳۶۰ درجه!
این ویدئو که مثل پرواز FPV به نظر میرسد، کاملاً مجازی است — هیچ درون یا دوربینی وجود ندارد. همهچیز یک جهان سهبعدی بازسازیشده با هوشمصنوعی است.
وقتی همسرش اولین تست را دید، اشکش درآمد…
حالا کل خانواده (که هر کدام در کشوری هستند) میتوانند دوباره داخل آن خانه قدم بزنند — در متاورس.
🔗 نسخهٔ قابل بازدید فضای بازسازیشده:
https://arrival.space/51431471_7414
---
🛠 مراحل کار — به زبان ساده
1) ساخت Gaussian Splat با Marble (World Labs)
همچنین Marble اخیراً پشتیبانی از عکسهای ۳۶۰ درجه را اضافه کرده.
گوشا تمام ۱۳ عکس را در کمتر از یک ساعت وارد سیستم کرد.
مدل Marble با ترکیبی از:
تخمین عمق از عکس ۳۶۰
بازسازی مبتنی بر AI
آموزش روی میلیونها اسپلت
فضایی کامل و قابل حرکت تولید میکند.
---
2) ویرایش و یکپارچهسازی با SuperSplat
با SuperSplat از PlayCanvas:
اتاقها و فضاها یکپارچه شدند
سوراخها بسته شدند
اندازه واقعی فضاها تنظیم شد (چون AI مقیاس واقعی را نمیداند)
آسمان و بیرون خانه بازسازی شد
برای نمای بیرونی چند عکس جدید گرفته شد تا Marble حدس اشتباه نزند
📦 حجم نهایی:
حدود 22 میلیون اسپلت — 1.3GB فایل.
---
3) ساخت جهان متاورسی با Arrival.Space
همچنین GS بهترین فرمت برای متاورس است.
در Arrival:
♻️فایل SOG (نسخه فشرده GS) بارگذاری شد
♻️با یک ترفند، ابتدا PLY بارگذاری شد تا کُلیدر (قاب برخورد) تولید شود
♻️سپس نسخه اصلی SOG با کُلیدر اصلاحشده جایگزین شد
---
🎁 خروجیهای فعلی Marble
همچنین Marble در حال حاضر اینها را تحویل میدهد:
1. فایل PLY + نسخه فشرده SPZ
2. مش کمکیفیت برای Collider
3. مش با کیفیت بالا
4. یک پانورامای ۳۶۰ از فضای بازسازیشده
---
🎬 ویدئو را حتماً با کیفیت بالا ببینید:
https://www.youtube.com/watch?v=R70bydPsb4s
---
🔥 این همان جایی است که فناوری واقعاً به زندگی انسانها معنا و احساس اضافه میکند.
بازسازی خاطره، بازگشت به گذشته، و زندهکردن فضاهایی که دیگر وجود ندارند…
#AI #3D #Marble #GaussianSplatting @rss_ai_ir
❤2🔥1👏1