⚡️مدل ChatGPT-5.1 منتشر شد
همچنین OpenAI نسخهی جدید GPT-5.1 را عرضه کرد؛ تمرکز اصلی این آپدیت روی هوش، کیفیت گفتگو و بهبود سبک پاسخگویی است.
🟢 GPT-5.1 Instant
مدل Instant حالا دارای تفکر تطبیقی است؛ یعنی میتواند در مسائل پیچیده بهصورت مستقل «تأمل» کند.
نتیجه؟ امتیازهای بالاتر در آزمونهای AIME 2025 و چالشهای Codeforces.
همچنین در دنبالکردن دستورها بهتر شده و لحن پیشفرض آن گرمتر و انسانیتر است.
🟢 GPT-5.1 Thinking
این نسخه هم بهروزرسانی شده:
• پاسخدهی به پرسشهای ساده سریعتر
• خروجیها روشنتر و کماصطلاحتر شدهاند
✨ سبکهای جدید نوشتاری نیز اضافه شدهاند:
مدل «Professional»، «Frank» و «Unusual» برای شخصیسازی دقیقتر پاسخها.
🔔 انتشار برای کاربران پرداختی شروع شده و API طی روزهای آینده فعال میشود. نسخههای قبلی GPT-5 نیز تا سه ماه در دسترس خواهند بود.
#news #ai #ml @rss_ai_ir
همچنین OpenAI نسخهی جدید GPT-5.1 را عرضه کرد؛ تمرکز اصلی این آپدیت روی هوش، کیفیت گفتگو و بهبود سبک پاسخگویی است.
🟢 GPT-5.1 Instant
مدل Instant حالا دارای تفکر تطبیقی است؛ یعنی میتواند در مسائل پیچیده بهصورت مستقل «تأمل» کند.
نتیجه؟ امتیازهای بالاتر در آزمونهای AIME 2025 و چالشهای Codeforces.
همچنین در دنبالکردن دستورها بهتر شده و لحن پیشفرض آن گرمتر و انسانیتر است.
🟢 GPT-5.1 Thinking
این نسخه هم بهروزرسانی شده:
• پاسخدهی به پرسشهای ساده سریعتر
• خروجیها روشنتر و کماصطلاحتر شدهاند
✨ سبکهای جدید نوشتاری نیز اضافه شدهاند:
مدل «Professional»، «Frank» و «Unusual» برای شخصیسازی دقیقتر پاسخها.
🔔 انتشار برای کاربران پرداختی شروع شده و API طی روزهای آینده فعال میشود. نسخههای قبلی GPT-5 نیز تا سه ماه در دسترس خواهند بود.
#news #ai #ml @rss_ai_ir
👍1
⚡️ بایدو ERNIE 5.0 را منتشر کرد — هیولای ۲.۴ تریلیون پارامتری
غول تکنولوژی چین Baidu نسخهٔ جدید مدل پرچمدار خود ERNIE 5.0 را با ۲.۴ تریلیون پارامتر رونمایی کرد.
🟢 ویژگیهای کلیدی ERNIE 5.0:
✳️اُمـنیمودال: پشتیبانی از متن، تصویر، صدا و ویدئو در ورودی و خروجی
✳️فهم بهترِ دستورها (Instruction Following)
✳️بهبود چشمگیر در نوشتار خلاقانه
✳️عملکرد قوی در منطق، reasoning، حافظه و اقناع (persuasion)
✳️مناسب برای کارهای پیچیده و چندمرحلهای
⛔️فعلاً جزئیات کامل منتشر نشده و فقط چند نمودار مبهم از بنچمارکها ارائه شده، اما مدل قابل تست در چتبات بایدو است.
https://ernie.baidu.com/
#AI #ML #Baidu #ERNIE5 @rss_ai_ir
غول تکنولوژی چین Baidu نسخهٔ جدید مدل پرچمدار خود ERNIE 5.0 را با ۲.۴ تریلیون پارامتر رونمایی کرد.
🟢 ویژگیهای کلیدی ERNIE 5.0:
✳️اُمـنیمودال: پشتیبانی از متن، تصویر، صدا و ویدئو در ورودی و خروجی
✳️فهم بهترِ دستورها (Instruction Following)
✳️بهبود چشمگیر در نوشتار خلاقانه
✳️عملکرد قوی در منطق، reasoning، حافظه و اقناع (persuasion)
✳️مناسب برای کارهای پیچیده و چندمرحلهای
⛔️فعلاً جزئیات کامل منتشر نشده و فقط چند نمودار مبهم از بنچمارکها ارائه شده، اما مدل قابل تست در چتبات بایدو است.
https://ernie.baidu.com/
#AI #ML #Baidu #ERNIE5 @rss_ai_ir
🔥1
🧠 یان لوکُن دوباره برگشت: معرفی LeJEPA — نسل جدید یادگیری خودنظارتی
در مدلهای قبلی خانوادهٔ JEPA همیشه نیاز به ترفندهای پیچیده بود تا مدل دچار collapsing نشود:
مثل stop-gradient، معماری teacher–student یا هدهای پیشبینیکننده.
اما مدل جدید LeJEPA همهٔ این هکها را حذف کرده و فقط یک Regularizer جدید اضافه کرده:
✨ SIGReg — Sketched Isotropic Gaussian Regularization
🔍 مدل SIGReg چه میکند؟
بردارهای ویژگی را وادار میکند که بهطور یکنواخت در تمام جهتها پخش شوند؛ یعنی یک ابر ایزوتروپیک بسازند.
این ساختار هندسی باعث میشود مدل کمترین خطا را در وظایف آینده داشته باشد — نه بر اساس حدس، بلکه بر اساس تحلیل ریاضی.
📌 چرا مهم است؟
✳️آموزش بسیار پایدارتر و سادهتر میشود
✳️به راحتی مقیاسپذیر است (تست روی مدل ۱.۸ میلیارد پارامتری)
✳️نیازی به teacher-student نیست
✳️کیفیت مدل بدون برچسبگذاری قابل تخمین است — چون loss بهخوبی با دقت نهایی همبستگی دارد
✳️مناسبترین هندسه برای نمایش ویژگیها را ایجاد میکند
📈 نتیجه:
دقت 79٪ در ارزیابی linear probe روی ImageNet-1K با حداقل تنظیمات.
این کار یک گام مهم به سمت self-supervised learning قابلاعتماد، پایدار و مقیاسپذیر است.
📄 مقاله:
arxiv.org/abs/2511.08544
#AI #ML #SelfSupervised #LeJEPA #YannLeCun @rss_ai_ir
در مدلهای قبلی خانوادهٔ JEPA همیشه نیاز به ترفندهای پیچیده بود تا مدل دچار collapsing نشود:
مثل stop-gradient، معماری teacher–student یا هدهای پیشبینیکننده.
اما مدل جدید LeJEPA همهٔ این هکها را حذف کرده و فقط یک Regularizer جدید اضافه کرده:
✨ SIGReg — Sketched Isotropic Gaussian Regularization
🔍 مدل SIGReg چه میکند؟
بردارهای ویژگی را وادار میکند که بهطور یکنواخت در تمام جهتها پخش شوند؛ یعنی یک ابر ایزوتروپیک بسازند.
این ساختار هندسی باعث میشود مدل کمترین خطا را در وظایف آینده داشته باشد — نه بر اساس حدس، بلکه بر اساس تحلیل ریاضی.
📌 چرا مهم است؟
✳️آموزش بسیار پایدارتر و سادهتر میشود
✳️به راحتی مقیاسپذیر است (تست روی مدل ۱.۸ میلیارد پارامتری)
✳️نیازی به teacher-student نیست
✳️کیفیت مدل بدون برچسبگذاری قابل تخمین است — چون loss بهخوبی با دقت نهایی همبستگی دارد
✳️مناسبترین هندسه برای نمایش ویژگیها را ایجاد میکند
📈 نتیجه:
دقت 79٪ در ارزیابی linear probe روی ImageNet-1K با حداقل تنظیمات.
این کار یک گام مهم به سمت self-supervised learning قابلاعتماد، پایدار و مقیاسپذیر است.
📄 مقاله:
arxiv.org/abs/2511.08544
#AI #ML #SelfSupervised #LeJEPA #YannLeCun @rss_ai_ir
🧭 لینکدین موتور جستجوی جدید مبتنی بر هوش مصنوعی را برای ۱.۳ میلیارد کاربر فعال کرد
✳️این سیستم جدید، افراد را فقط بر اساس کلمات کلیدی پیدا نمیکند؛ بلکه مهارتها، تخصصها، شبکه ارتباطی و میزان دسترسپذیری آنها را هم تحلیل میکند.
✳️هوش مصنوعی لینکدین میتواند یک درخواست ساده مثل «درمان سرطان» را به مجموعهای از مهارتها و حوزههای مرتبط تبدیل کند و دقیقترین متخصصان را پیشنهاد دهد.
✳️در پشتصحنه، از مدلهای ۷ میلیاردی، ۱.۷ میلیاردی و یک رانکر ۲۲۰M استفاده شده که با فشردهسازی هوشمند و پردازش GPU، سرعت جستجو را تا ۱۰ برابر افزایش میدهد.
https://venturebeat.com/ai/inside-linkedins-generative-ai-cookbook-how-it-scaled-people-search-to-1-3
---
#هوش_مصنوعی #LinkedIn #جستجوی_هوشمند #LLM #شبکه_اجتماعی #AI #ML #مدل_زبانی #فناوری
✳️این سیستم جدید، افراد را فقط بر اساس کلمات کلیدی پیدا نمیکند؛ بلکه مهارتها، تخصصها، شبکه ارتباطی و میزان دسترسپذیری آنها را هم تحلیل میکند.
✳️هوش مصنوعی لینکدین میتواند یک درخواست ساده مثل «درمان سرطان» را به مجموعهای از مهارتها و حوزههای مرتبط تبدیل کند و دقیقترین متخصصان را پیشنهاد دهد.
✳️در پشتصحنه، از مدلهای ۷ میلیاردی، ۱.۷ میلیاردی و یک رانکر ۲۲۰M استفاده شده که با فشردهسازی هوشمند و پردازش GPU، سرعت جستجو را تا ۱۰ برابر افزایش میدهد.
https://venturebeat.com/ai/inside-linkedins-generative-ai-cookbook-how-it-scaled-people-search-to-1-3
---
#هوش_مصنوعی #LinkedIn #جستجوی_هوشمند #LLM #شبکه_اجتماعی #AI #ML #مدل_زبانی #فناوری
🤖 میخوای ایجنت هوش مصنوعی مخصوص خودت رو بسازی؟
این یک نفر همهچیز رو یکجا جمع کرده!
یک داکیومنت کامل شامل:
📺 ویدیوهای آموزشی
📚 کتابها و مقالات
🛠️ مخازن GitHub
🎓 دورههای Google، OpenAI، Anthropic و…
موضوعات پوششدادهشده:
♻️مدلهای زبانی LLM
♻️طراحی ایجنتها
♻️حافظه، کنترل و برنامهریزی (MCP)
💡 همهچیز رایگان و یکجا داخل یک Google Docs 👇
https://docs.google.com/document/d/1Z5SX89FV6bTy2KKnGGb61xCcS9iPg_fv2USQYi4Wc3g/mobilebasic
---
#هوش_مصنوعی #ایجنت #LLM #برنامهریزی #AI #ML #یادگیری_ماشین #مهندسی_پرامپت #Agents
این یک نفر همهچیز رو یکجا جمع کرده!
یک داکیومنت کامل شامل:
📺 ویدیوهای آموزشی
📚 کتابها و مقالات
🛠️ مخازن GitHub
🎓 دورههای Google، OpenAI، Anthropic و…
موضوعات پوششدادهشده:
♻️مدلهای زبانی LLM
♻️طراحی ایجنتها
♻️حافظه، کنترل و برنامهریزی (MCP)
💡 همهچیز رایگان و یکجا داخل یک Google Docs 👇
https://docs.google.com/document/d/1Z5SX89FV6bTy2KKnGGb61xCcS9iPg_fv2USQYi4Wc3g/mobilebasic
---
#هوش_مصنوعی #ایجنت #LLM #برنامهریزی #AI #ML #یادگیری_ماشین #مهندسی_پرامپت #Agents
❤2
⚡️ Lumine —
دستورالعملی باز برای ساخت ایجنتهای جنرالیست در دنیای سهبعدی
پروژهی Lumine یک چارچوب کاملاً متنباز ارائه میدهد که به محققان و توسعهدهندگان اجازه میدهد ایجنتهای هوش مصنوعی چندمنظوره را در محیطهای سهبعدی پیچیده بسازند و آموزش دهند.
ویژگیها:
🔹 یادگیری مهارتهای عمومی در جهانهای 3D
🔹 مناسب برای رباتیک، بازیها، شبیهسازی و تحقیق
🔹 مدلها و دیتاستها آزادانه در دسترس
🔹 معماری یکپارچه برای تعامل، ادراک و برنامهریزی
لینکها:
📄 Paper (arXiv):
https://arxiv.org/abs/2511.08892
📘 HF:
https://huggingface.co/papers/2511.08892
🌐 Project:
https://www.lumine-ai.org/
---
#هوش_مصنوعی #ایجنت #Lumine #AI #LLM #Agents #ML #سهبعدی #3D #OpenAI #HuggingFace
دستورالعملی باز برای ساخت ایجنتهای جنرالیست در دنیای سهبعدی
پروژهی Lumine یک چارچوب کاملاً متنباز ارائه میدهد که به محققان و توسعهدهندگان اجازه میدهد ایجنتهای هوش مصنوعی چندمنظوره را در محیطهای سهبعدی پیچیده بسازند و آموزش دهند.
ویژگیها:
🔹 یادگیری مهارتهای عمومی در جهانهای 3D
🔹 مناسب برای رباتیک، بازیها، شبیهسازی و تحقیق
🔹 مدلها و دیتاستها آزادانه در دسترس
🔹 معماری یکپارچه برای تعامل، ادراک و برنامهریزی
لینکها:
📄 Paper (arXiv):
https://arxiv.org/abs/2511.08892
📘 HF:
https://huggingface.co/papers/2511.08892
🌐 Project:
https://www.lumine-ai.org/
---
#هوش_مصنوعی #ایجنت #Lumine #AI #LLM #Agents #ML #سهبعدی #3D #OpenAI #HuggingFace
🤯 دیپمایند مدلهای بینایی را یک قدم به درک انسانی نزدیکتر کرد!
انسانها دنیا را بر اساس مفهوم دستهبندی میکنند —
میدانیم گربه و ستارهدریایی هر دو «حیوان» هستند، حتی اگر هیچ شباهت ظاهری نداشته باشند.
اما مدلهای بیناییِ هوش مصنوعی معمولاً این لایهٔ انتزاعی را درک نمیکنند.
حالا پژوهش تازهٔ Google DeepMind این شکاف را کم کرده:
مدلها را طوری آموزش دادهاند که دنیای بصری را شبیه انسانها سازماندهی کنند — با درک مفاهیم، نه فقط پیکسلها.
نتیجه؟
✔️ پایداری بیشتر
✔️ عمومیسازی دقیقتر
✔️ درک بهتر از دستهبندیهای واقعی جهان
جزئیات کامل پژوهش: goo.gle/4qX60dC
---
#هوش_مصنوعی #دیپ_مایند #بینایی_ماشین #یادگیری_عمیق #AI #ML #کامپیوتر_ویژن #DeepMind #GoogleAI
انسانها دنیا را بر اساس مفهوم دستهبندی میکنند —
میدانیم گربه و ستارهدریایی هر دو «حیوان» هستند، حتی اگر هیچ شباهت ظاهری نداشته باشند.
اما مدلهای بیناییِ هوش مصنوعی معمولاً این لایهٔ انتزاعی را درک نمیکنند.
حالا پژوهش تازهٔ Google DeepMind این شکاف را کم کرده:
مدلها را طوری آموزش دادهاند که دنیای بصری را شبیه انسانها سازماندهی کنند — با درک مفاهیم، نه فقط پیکسلها.
نتیجه؟
✔️ پایداری بیشتر
✔️ عمومیسازی دقیقتر
✔️ درک بهتر از دستهبندیهای واقعی جهان
جزئیات کامل پژوهش: goo.gle/4qX60dC
---
#هوش_مصنوعی #دیپ_مایند #بینایی_ماشین #یادگیری_عمیق #AI #ML #کامپیوتر_ویژن #DeepMind #GoogleAI
❤1👍1🔥1
🚀 یک موتور قدرتمند برای مدلهای چندمودالی (Multimodal Models)
اگر با مدلهای ترکیبی متن–تصویر–ویدیو کار میکنید، LMMs-Engine یکی از بهترین فریمورکهای جدید است.
این موتور فوقسبک و بسیار انعطافپذیر، مخصوص آموزش و توسعهی مدلهای چندمودالی طراحی شده و حتی در مقیاسهای بزرگ هم کارایی بسیار بالایی دارد.
💡 ویژگیهای برجسته:
🔥 پشتیبانی از ۱۹+ معماری مختلف برای متن، تصویر، ویدیو و مدلهای ترکیبی
⚙️ بهینهسازی برای آموزش توزیعشده با مصرف حافظه بسیار کم
🧩 شامل دهها نمونه آماده اجرا برای شروع سریع با مدلهای مختلف
⚡ مناسب برای پژوهشگران، توسعهدهندگان و کسانی که به دنبال ساخت LMM اختصاصی هستند
📌 گیتهاب:
https://github.com/EvolvingLMMs-Lab/lmms-engine
---
#AI #ML #Multimodal #LMM #DeepLearning #OpenSource #MachineLearning #AIDev #NeuralNetworks
@rss_ai_ir
اگر با مدلهای ترکیبی متن–تصویر–ویدیو کار میکنید، LMMs-Engine یکی از بهترین فریمورکهای جدید است.
این موتور فوقسبک و بسیار انعطافپذیر، مخصوص آموزش و توسعهی مدلهای چندمودالی طراحی شده و حتی در مقیاسهای بزرگ هم کارایی بسیار بالایی دارد.
💡 ویژگیهای برجسته:
🔥 پشتیبانی از ۱۹+ معماری مختلف برای متن، تصویر، ویدیو و مدلهای ترکیبی
⚙️ بهینهسازی برای آموزش توزیعشده با مصرف حافظه بسیار کم
🧩 شامل دهها نمونه آماده اجرا برای شروع سریع با مدلهای مختلف
⚡ مناسب برای پژوهشگران، توسعهدهندگان و کسانی که به دنبال ساخت LMM اختصاصی هستند
📌 گیتهاب:
https://github.com/EvolvingLMMs-Lab/lmms-engine
---
#AI #ML #Multimodal #LMM #DeepLearning #OpenSource #MachineLearning #AIDev #NeuralNetworks
@rss_ai_ir
😁19🔥17❤12🥰12🎉12👍10👏10🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
📌 مجموعه Anthropic آزمایش کرد که آیا Claude میتواند به یک رباتسگ آموزش بدهد یا نه
در پروژهای به نام Project Fetch، شرکت Anthropic بررسی کرد که آیا مدل Claude میتواند به انسانها در آموزش ربات چهارپای Boston Dynamics Spot کمک کند یا خیر.
در این آزمایش:
دو تیم از کارکنانی که هیچ تجربهای در رباتیک نداشتند، باید Spot را طوری برنامهریزی میکردند که یک توپ ساحلی را پیدا کند و بیاورد — آن هم در سه مرحله با سختیِ افزایشی.
🔹 تیم اول با کمک Claude
🔹 تیم دوم بدون هیچ مدل هوش مصنوعی
🧠 نتیجه چه بود؟
✔️ تیم مجهز به Claude دو برابر سریعتر پیش رفت
✔️ وظایف بیشتری را تکمیل کرد
✔️ احساس اعتمادبهنفس بیشتری داشت
✔️ حتی توانست کنترل ربات را با زبان طبیعی امتحان کند
✔️ البته دوبار هم خراب کردند:
— سرعت حرکت ربات را اشتباه محاسبه کردند
— الگوریتم تشخیص توپ را اشتباه نوشتند
در مقابل، تیم بدون Claude:
❗ بیشتر دچار استرس، سردرگمی و اشتباهات انسانی شد
❗ مجبور بودند دائم از یکدیگر سؤال بپرسند
❗ روندشان کندتر و ناهموارتر بود
🎯 جمعبندی
همچنین Project Fetch اولین تلاش Anthropic برای بررسی تأثیر مدلهای زبانی در پروژههای واقعی R&D است.
نتایج نشان میدهد:
هوش مصنوعی سرعت و کارایی را چند برابر میکند، اما نظارت انسانی همچنان ضروری است.
🔜 گزارش کامل و ویدئوی مستند آن بهزودی در وبسایت Anthropic منتشر میشود.
https://www.anthropic.com/research/project-fetch-robot-dog
---
@rss_ai_ir
#هوش_مصنوعی #Claude #Anthropic #رباتیک #BostonDynamics #AI #ML #Robotics #Spot #ProjectFetch #RND #TechNews
در پروژهای به نام Project Fetch، شرکت Anthropic بررسی کرد که آیا مدل Claude میتواند به انسانها در آموزش ربات چهارپای Boston Dynamics Spot کمک کند یا خیر.
در این آزمایش:
دو تیم از کارکنانی که هیچ تجربهای در رباتیک نداشتند، باید Spot را طوری برنامهریزی میکردند که یک توپ ساحلی را پیدا کند و بیاورد — آن هم در سه مرحله با سختیِ افزایشی.
🔹 تیم اول با کمک Claude
🔹 تیم دوم بدون هیچ مدل هوش مصنوعی
🧠 نتیجه چه بود؟
✔️ تیم مجهز به Claude دو برابر سریعتر پیش رفت
✔️ وظایف بیشتری را تکمیل کرد
✔️ احساس اعتمادبهنفس بیشتری داشت
✔️ حتی توانست کنترل ربات را با زبان طبیعی امتحان کند
✔️ البته دوبار هم خراب کردند:
— سرعت حرکت ربات را اشتباه محاسبه کردند
— الگوریتم تشخیص توپ را اشتباه نوشتند
در مقابل، تیم بدون Claude:
❗ بیشتر دچار استرس، سردرگمی و اشتباهات انسانی شد
❗ مجبور بودند دائم از یکدیگر سؤال بپرسند
❗ روندشان کندتر و ناهموارتر بود
🎯 جمعبندی
همچنین Project Fetch اولین تلاش Anthropic برای بررسی تأثیر مدلهای زبانی در پروژههای واقعی R&D است.
نتایج نشان میدهد:
هوش مصنوعی سرعت و کارایی را چند برابر میکند، اما نظارت انسانی همچنان ضروری است.
🔜 گزارش کامل و ویدئوی مستند آن بهزودی در وبسایت Anthropic منتشر میشود.
https://www.anthropic.com/research/project-fetch-robot-dog
---
@rss_ai_ir
#هوش_مصنوعی #Claude #Anthropic #رباتیک #BostonDynamics #AI #ML #Robotics #Spot #ProjectFetch #RND #TechNews
👍18🥰17🎉17👏15😁15❤11🔥11🙏2
🚀 مدل Holo2 نسل تازهای از مدلهای چندرسانهای است که برای فهم رابطکاربری، ناوبری و استدلال در وب، دسکتاپ و موبایل طراحی شده است.
📈 نتایج چشمگیر در بنچمارکها Holo2 رکوردهای جدیدی ثبت کرده است:
🟩 امتیاز 66.1% در ScreenSpot-Pro (افزایش +۳٪)
🟩 امتیاز 76.1% در OSWorld-G (افزایش +۵٪)
این مدل بسیاری از رقبا را پشت سر گذاشته و تبدیل به یکی از بهترین گزینهها برای UI-grounding شده است.
🧠 معماری مدل
مبتنی بر Qwen3-VL
درک بسیار قوی از رابطکاربری و ناوبری دقیق
مناسب برای توسعه عاملهای هوشمند UI در نرمافزارها
🌐 قابل اجرا روی: مرورگر، Ubuntu و Android
🔀 همچنین Mixture of Experts نسخهی پرچمدار 30B-A3B فقط با فعالسازی ۳ میلیارد پارامتر در هر مرحله عملکردی در سطح مدل 30B ارائه میدهد اما با هزینه محاسبات کمتر.
🤖 مدل از reasoning-token ها برای بهبود دقت تصمیمگیری بهره میبرد و با Surfer 2 و ReAct کاملاً سازگار است.
⚙️ شیوه اجرا
سازگار با vLLM و تمام فریمورکهای هماهنگ با Qwen3-VL
📜 لایسنسها
نسخههای 4B و 8B → تحت Apache-2
نسخه 30B-A3B → فقط استفاده غیرتجاری
🔗 لینکها:
🌐 Blog: hcompany.ai/blog/holo2
🍳 Cookbook: github.com/hcompai/hai-cookbook/blob/main/holo2/holo_2_localization_huggingface.ipynb
🤗 HuggingFace: huggingface.co/collections/Hcompany/holo2
@rss_ai_ir
#هوش_مصنوعی #مدل_چندرسانهای #عامل_هوشمند #Qwen #Holo2 #AI #LLM #ML #رابط_کاربری #ui_grounding #qwen3_vl #vllm #surfer2 #react_ai
📈 نتایج چشمگیر در بنچمارکها Holo2 رکوردهای جدیدی ثبت کرده است:
🟩 امتیاز 66.1% در ScreenSpot-Pro (افزایش +۳٪)
🟩 امتیاز 76.1% در OSWorld-G (افزایش +۵٪)
این مدل بسیاری از رقبا را پشت سر گذاشته و تبدیل به یکی از بهترین گزینهها برای UI-grounding شده است.
🧠 معماری مدل
مبتنی بر Qwen3-VL
درک بسیار قوی از رابطکاربری و ناوبری دقیق
مناسب برای توسعه عاملهای هوشمند UI در نرمافزارها
🌐 قابل اجرا روی: مرورگر، Ubuntu و Android
🔀 همچنین Mixture of Experts نسخهی پرچمدار 30B-A3B فقط با فعالسازی ۳ میلیارد پارامتر در هر مرحله عملکردی در سطح مدل 30B ارائه میدهد اما با هزینه محاسبات کمتر.
🤖 مدل از reasoning-token ها برای بهبود دقت تصمیمگیری بهره میبرد و با Surfer 2 و ReAct کاملاً سازگار است.
⚙️ شیوه اجرا
سازگار با vLLM و تمام فریمورکهای هماهنگ با Qwen3-VL
📜 لایسنسها
نسخههای 4B و 8B → تحت Apache-2
نسخه 30B-A3B → فقط استفاده غیرتجاری
🔗 لینکها:
🌐 Blog: hcompany.ai/blog/holo2
🍳 Cookbook: github.com/hcompai/hai-cookbook/blob/main/holo2/holo_2_localization_huggingface.ipynb
🤗 HuggingFace: huggingface.co/collections/Hcompany/holo2
@rss_ai_ir
#هوش_مصنوعی #مدل_چندرسانهای #عامل_هوشمند #Qwen #Holo2 #AI #LLM #ML #رابط_کاربری #ui_grounding #qwen3_vl #vllm #surfer2 #react_ai
🥰10👍6🔥5❤4👏3😁2🎉2
🌟 فریمورک جدید RL برای آموزش مدلهای MoE از تیمی که Chatbot Arena را ساخته است
فریمورک Miles توسط گروه LMSYS ORG معرفی شد؛ همان تیمی که پروژهٔ معروف slime را ساخته بود. اگر توسعههای اپنسورس را دنبال میکنید، میدانید slime یک ابزار فوقسبک برای پستتریـن است—و حتی برای GLM-4.6 هم استفاده شد.
✅همچنین Miles همان مسیر را ادامه میدهد، اما این بار با تمرکز بر آموزش مقیاسبالا برای معماریهای MoE و پشتیبانی از بارهای سنگین در محیطهای سازمانی.
⚙️ نکات فنی
• معماری بر پایهٔ True On-Policy؛ یعنی صفر شدن فاصلهٔ رفتاری بین مدل در حالت آموزش و حالت اجرا
• استفاده از Flash Attention 3، کتابخانه DeepGEMM و هستههای Thinking Machines Lab در کنار torch.compile
• پشتیبانی از Speculative Decoding همراه با آموزش آنلاین مدل پیشنویس—رویکردی که باعث میشود مدل draft دقیقاً با سیاست مدل اصلی حرکت کند
• افزایش سرعت تولید متن تا ۲۵٪ در مراحل پایانی آموزش
🧩 پایداری سیستم
• جلوگیری از کرشهای غیرضروری OOM؛ اهمیت ویژه برای محیطهای سازمانی که «هر گیگابایت یعنی هزینه»
• اصلاح مشکلات مصرف حافظه در FSDP
• وعدهٔ پشتیبانی از آموزش چندمُدی، سازگاری با SGLang v2 و نسخهٔ پیشرفتهتر Speculative Decoding
📄 مقاله
🖥️ GitHub
@rss_ai_ir
#AI #ML #RL #MoE #LMSYS #Miles
فریمورک Miles توسط گروه LMSYS ORG معرفی شد؛ همان تیمی که پروژهٔ معروف slime را ساخته بود. اگر توسعههای اپنسورس را دنبال میکنید، میدانید slime یک ابزار فوقسبک برای پستتریـن است—و حتی برای GLM-4.6 هم استفاده شد.
✅همچنین Miles همان مسیر را ادامه میدهد، اما این بار با تمرکز بر آموزش مقیاسبالا برای معماریهای MoE و پشتیبانی از بارهای سنگین در محیطهای سازمانی.
⚙️ نکات فنی
• معماری بر پایهٔ True On-Policy؛ یعنی صفر شدن فاصلهٔ رفتاری بین مدل در حالت آموزش و حالت اجرا
• استفاده از Flash Attention 3، کتابخانه DeepGEMM و هستههای Thinking Machines Lab در کنار torch.compile
• پشتیبانی از Speculative Decoding همراه با آموزش آنلاین مدل پیشنویس—رویکردی که باعث میشود مدل draft دقیقاً با سیاست مدل اصلی حرکت کند
• افزایش سرعت تولید متن تا ۲۵٪ در مراحل پایانی آموزش
🧩 پایداری سیستم
• جلوگیری از کرشهای غیرضروری OOM؛ اهمیت ویژه برای محیطهای سازمانی که «هر گیگابایت یعنی هزینه»
• اصلاح مشکلات مصرف حافظه در FSDP
• وعدهٔ پشتیبانی از آموزش چندمُدی، سازگاری با SGLang v2 و نسخهٔ پیشرفتهتر Speculative Decoding
📄 مقاله
🖥️ GitHub
@rss_ai_ir
#AI #ML #RL #MoE #LMSYS #Miles
🌟 LLM Council:
وقتی یک «شورای مدلهای زبانی» به جای یک مدل به شما جواب میدهد!
آندری کارپاتی دوباره برگشته و اینبار با یک پروژه جالب به نام LLM Council — ایدهای که پاسخدهی را از سطح یک مدل، به سطح شورای مشورتی از مدلهای هوش مصنوعی ارتقا میدهد.
ایده ساده اما قدرتمند است:
بهجای اینکه سؤال شما فقط توسط یک مدل پاسخ داده شود، مجموعهای از مدلها پاسخ میدهند، یکدیگر را نقد میکنند و در نهایت یک مدل بهعنوان «رئیس شورا» پاسخ نهایی را میسازد.
🔹 روند کار چگونه است؟
🟢 مرحله ۱: جمعآوری نظرها
سؤال شما از طریق OpenRouter برای چندین مدل بهصورت جداگانه ارسال میشود.
هر مدل یک پاسخ مستقل تولید میکند و پاسخها در تبهای مجزا قابل مشاهدهاند.
🟢 مرحله ۲: ریتینگ و نقد علمی
هر مدل پاسخهای سایر مدلها را بررسی و بهصورت ناشناس ارزیابی میکند تا سوگیری ایجاد نشود.
مدلها پاسخها را از نظر دقت و عمق تحلیل رتبهبندی میکنند.
🟢 مرحله ۳: خروجی نهایی
یک «مدل رئیس شورا» همه نتایج را دریافت کرده و آنها را در قالب یک پاسخ واحد، دقیق و ترکیبی ارائه میدهد.
---
⚠️ برای استفاده از این سیستم نیاز به کلید API OpenRouter دارید.
مزیت خوبش این است که چند مدل رایگان هم در OpenRouter وجود دارد.
📌 Github:
https://github.com/karpathy/llm-council
@rss_ai_ir
---
🔖 هشتگها
#هوش_مصنوعی #مدل_زبانی #LLMCouncil #OpenRouter #AI #ML #کارپاتی #Github #LLM #هوش_تولیدی
وقتی یک «شورای مدلهای زبانی» به جای یک مدل به شما جواب میدهد!
آندری کارپاتی دوباره برگشته و اینبار با یک پروژه جالب به نام LLM Council — ایدهای که پاسخدهی را از سطح یک مدل، به سطح شورای مشورتی از مدلهای هوش مصنوعی ارتقا میدهد.
ایده ساده اما قدرتمند است:
بهجای اینکه سؤال شما فقط توسط یک مدل پاسخ داده شود، مجموعهای از مدلها پاسخ میدهند، یکدیگر را نقد میکنند و در نهایت یک مدل بهعنوان «رئیس شورا» پاسخ نهایی را میسازد.
🔹 روند کار چگونه است؟
🟢 مرحله ۱: جمعآوری نظرها
سؤال شما از طریق OpenRouter برای چندین مدل بهصورت جداگانه ارسال میشود.
هر مدل یک پاسخ مستقل تولید میکند و پاسخها در تبهای مجزا قابل مشاهدهاند.
🟢 مرحله ۲: ریتینگ و نقد علمی
هر مدل پاسخهای سایر مدلها را بررسی و بهصورت ناشناس ارزیابی میکند تا سوگیری ایجاد نشود.
مدلها پاسخها را از نظر دقت و عمق تحلیل رتبهبندی میکنند.
🟢 مرحله ۳: خروجی نهایی
یک «مدل رئیس شورا» همه نتایج را دریافت کرده و آنها را در قالب یک پاسخ واحد، دقیق و ترکیبی ارائه میدهد.
---
⚠️ برای استفاده از این سیستم نیاز به کلید API OpenRouter دارید.
مزیت خوبش این است که چند مدل رایگان هم در OpenRouter وجود دارد.
📌 Github:
https://github.com/karpathy/llm-council
@rss_ai_ir
---
🔖 هشتگها
#هوش_مصنوعی #مدل_زبانی #LLMCouncil #OpenRouter #AI #ML #کارپاتی #Github #LLM #هوش_تولیدی
👍2❤1👏1