VIRSUN
7.34K subscribers
1.44K photos
813 videos
5 files
902 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
⚡️مدل ChatGPT-5.1 منتشر شد

همچنین OpenAI نسخه‌ی جدید GPT-5.1 را عرضه کرد؛ تمرکز اصلی این آپدیت روی هوش، کیفیت گفتگو و بهبود سبک پاسخ‌گویی است.

🟢 GPT-5.1 Instant
مدل Instant حالا دارای تفکر تطبیقی است؛ یعنی می‌تواند در مسائل پیچیده به‌صورت مستقل «تأمل» کند.
نتیجه؟ امتیازهای بالاتر در آزمون‌های AIME 2025 و چالش‌های Codeforces.
همچنین در دنبال‌کردن دستورها بهتر شده و لحن پیش‌فرض آن گرم‌تر و انسانی‌تر است.

🟢 GPT-5.1 Thinking
این نسخه هم به‌روزرسانی شده:
• پاسخ‌دهی به پرسش‌های ساده سریع‌تر
• خروجی‌ها روشن‌تر و کم‌اصطلاح‌تر شده‌اند

سبک‌های جدید نوشتاری نیز اضافه شده‌اند:
مدل «Professional»، «Frank» و «Unusual» برای شخصی‌سازی دقیق‌تر پاسخ‌ها.

🔔 انتشار برای کاربران پرداختی شروع شده و API طی روزهای آینده فعال می‌شود. نسخه‌های قبلی GPT-5 نیز تا سه ماه در دسترس خواهند بود.

#news #ai #ml @rss_ai_ir
👍1
⚡️ بایدو ERNIE 5.0 را منتشر کرد — هیولای ۲.۴ تریلیون پارامتری

غول تکنولوژی چین Baidu نسخهٔ جدید مدل پرچم‌دار خود ERNIE 5.0 را با ۲.۴ تریلیون پارامتر رونمایی کرد.

🟢 ویژگی‌های کلیدی ERNIE 5.0:

✳️اُمـنی‌مودال: پشتیبانی از متن، تصویر، صدا و ویدئو در ورودی و خروجی

✳️فهم بهترِ دستورها (Instruction Following)

✳️بهبود چشمگیر در نوشتار خلاقانه

✳️عملکرد قوی در منطق، reasoning، حافظه و اقناع (persuasion)

✳️مناسب برای کارهای پیچیده و چندمرحله‌ای


⛔️فعلاً جزئیات کامل منتشر نشده و فقط چند نمودار مبهم از بنچمارک‌ها ارائه شده، اما مدل قابل تست در چت‌بات بایدو است.
https://ernie.baidu.com/

#AI #ML #Baidu #ERNIE5 @rss_ai_ir
🔥1
🧠 یان لوکُن دوباره برگشت: معرفی LeJEPA — نسل جدید یادگیری خودنظارتی

در مدل‌های قبلی خانوادهٔ JEPA همیشه نیاز به ترفندهای پیچیده بود تا مدل دچار collapsing نشود:
مثل stop-gradient،‌ معماری teacher–student یا هدهای پیش‌بینی‌کننده.

اما مدل جدید LeJEPA همهٔ این هک‌ها را حذف کرده و فقط یک Regularizer جدید اضافه کرده:
SIGReg — Sketched Isotropic Gaussian Regularization

🔍 مدل SIGReg چه می‌کند؟
بردارهای ویژگی را وادار می‌کند که به‌طور یکنواخت در تمام جهت‌ها پخش شوند؛ یعنی یک ابر ایزوتروپیک بسازند.
این ساختار هندسی باعث می‌شود مدل کمترین خطا را در وظایف آینده داشته باشد — نه بر اساس حدس، بلکه بر اساس تحلیل ریاضی.

📌 چرا مهم است؟

✳️آموزش بسیار پایدارتر و ساده‌تر می‌شود

✳️به راحتی مقیاس‌پذیر است (تست روی مدل ۱.۸ میلیارد پارامتری)

✳️نیازی به teacher-student نیست

✳️کیفیت مدل بدون برچسب‌گذاری قابل تخمین است — چون loss به‌خوبی با دقت نهایی همبستگی دارد

✳️مناسب‌ترین هندسه برای نمایش ویژگی‌ها را ایجاد می‌کند


📈 نتیجه:
دقت 79٪ در ارزیابی linear probe روی ImageNet-1K با حداقل تنظیمات.

این کار یک گام مهم به سمت self-supervised learning قابل‌اعتماد، پایدار و مقیاس‌پذیر است.

📄 مقاله:
arxiv.org/abs/2511.08544

#AI #ML #SelfSupervised #LeJEPA #YannLeCun @rss_ai_ir
🧭 لینکدین موتور جستجوی جدید مبتنی بر هوش مصنوعی را برای ۱.۳ میلیارد کاربر فعال کرد

✳️این سیستم جدید، افراد را فقط بر اساس کلمات کلیدی پیدا نمی‌کند؛ بلکه مهارت‌ها، تخصص‌ها، شبکه ارتباطی و میزان دسترس‌پذیری آن‌ها را هم تحلیل می‌کند.

✳️هوش مصنوعی لینکدین می‌تواند یک درخواست ساده مثل «درمان سرطان» را به مجموعه‌ای از مهارت‌ها و حوزه‌های مرتبط تبدیل کند و دقیق‌ترین متخصصان را پیشنهاد دهد.

✳️در پشت‌صحنه، از مدل‌های ۷ میلیاردی، ۱.۷ میلیاردی و یک رانکر ۲۲۰M استفاده شده که با فشرده‌سازی هوشمند و پردازش GPU، سرعت جستجو را تا ۱۰ برابر افزایش می‌دهد.

https://venturebeat.com/ai/inside-linkedins-generative-ai-cookbook-how-it-scaled-people-search-to-1-3

---

#هوش_مصنوعی #LinkedIn #جستجوی_هوشمند #LLM #شبکه_اجتماعی #AI #ML #مدل_زبانی #فناوری
🤖 می‌خوای ایجنت هوش مصنوعی مخصوص خودت رو بسازی؟
این یک نفر همه‌چیز رو یک‌جا جمع کرده!

یک داکیومنت کامل شامل:
📺 ویدیوهای آموزشی
📚 کتاب‌ها و مقالات
🛠️ مخازن GitHub
🎓 دوره‌های Google، OpenAI، Anthropic و…

موضوعات پوشش‌داده‌شده:
♻️مدل‌های زبانی LLM
♻️طراحی ایجنت‌ها
♻️حافظه، کنترل و برنامه‌ریزی (MCP)


💡 همه‌چیز رایگان و یک‌جا داخل یک Google Docs 👇
https://docs.google.com/document/d/1Z5SX89FV6bTy2KKnGGb61xCcS9iPg_fv2USQYi4Wc3g/mobilebasic


---

#هوش_مصنوعی #ایجنت #LLM #برنامه‌ریزی #AI #ML #یادگیری_ماشین #مهندسی_پرامپت #Agents
2
⚡️ Lumine —
دستورالعملی باز برای ساخت ایجنت‌های جنرالیست در دنیای سه‌بعدی

پروژه‌ی Lumine یک چارچوب کاملاً متن‌باز ارائه می‌دهد که به محققان و توسعه‌دهندگان اجازه می‌دهد ایجنت‌های هوش مصنوعی چندمنظوره را در محیط‌های سه‌بعدی پیچیده بسازند و آموزش دهند.

ویژگی‌ها:
🔹 یادگیری مهارت‌های عمومی در جهان‌های 3D
🔹 مناسب برای رباتیک، بازی‌ها، شبیه‌سازی و تحقیق
🔹 مدل‌ها و دیتاست‌ها آزادانه در دسترس
🔹 معماری یکپارچه برای تعامل، ادراک و برنامه‌ریزی

لینک‌ها:
📄 Paper (arXiv):
https://arxiv.org/abs/2511.08892
📘 HF:
https://huggingface.co/papers/2511.08892
🌐 Project:
https://www.lumine-ai.org/


---

#هوش_مصنوعی #ایجنت #Lumine #AI #LLM #Agents #ML #سه‌بعدی #3D #OpenAI #HuggingFace
🤯 دیپ‌مایند مدل‌های بینایی را یک قدم به درک انسانی نزدیک‌تر کرد!

انسان‌ها دنیا را بر اساس مفهوم دسته‌بندی می‌کنند —
می‌دانیم گربه و ستاره‌دریایی هر دو «حیوان» هستند، حتی اگر هیچ شباهت ظاهری نداشته باشند.

اما مدل‌های بیناییِ هوش مصنوعی معمولاً این لایهٔ انتزاعی را درک نمی‌کنند.

حالا پژوهش تازهٔ Google DeepMind این شکاف را کم کرده:
مدل‌ها را طوری آموزش داده‌اند که دنیای بصری را شبیه انسان‌ها سازمان‌دهی کنند — با درک مفاهیم، نه فقط پیکسل‌ها.

نتیجه؟
✔️ پایداری بیشتر
✔️ عمومی‌سازی دقیق‌تر
✔️ درک بهتر از دسته‌بندی‌های واقعی جهان

جزئیات کامل پژوهش: goo.gle/4qX60dC


---

#هوش_مصنوعی #دیپ_مایند #بینایی_ماشین #یادگیری_عمیق #AI #ML #کامپیوتر_ویژن #DeepMind #GoogleAI
1👍1🔥1
🚀 یک موتور قدرتمند برای مدل‌های چندمودالی (Multimodal Models)

اگر با مدل‌های ترکیبی متن–تصویر–ویدیو کار می‌کنید، LMMs-Engine یکی از بهترین فریم‌ورک‌های جدید است.
این موتور فوق‌سبک و بسیار انعطاف‌پذیر، مخصوص آموزش و توسعه‌ی مدل‌های چندمودالی طراحی شده و حتی در مقیاس‌های بزرگ هم کارایی بسیار بالایی دارد.

💡 ویژگی‌های برجسته:

🔥 پشتیبانی از ۱۹+ معماری مختلف برای متن، تصویر، ویدیو و مدل‌های ترکیبی

⚙️ بهینه‌سازی برای آموزش توزیع‌شده با مصرف حافظه بسیار کم

🧩 شامل ده‌ها نمونه آماده اجرا برای شروع سریع با مدل‌های مختلف

مناسب برای پژوهشگران، توسعه‌دهندگان و کسانی که به دنبال ساخت LMM اختصاصی هستند


📌 گیت‌هاب:
https://github.com/EvolvingLMMs-Lab/lmms-engine


---

#AI #ML #Multimodal #LMM #DeepLearning #OpenSource #MachineLearning #AIDev #NeuralNetworks
@rss_ai_ir
😁19🔥1712🥰12🎉12👍10👏10🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
📌 مجموعه Anthropic آزمایش کرد که آیا Claude می‌تواند به یک ربات‌سگ آموزش بدهد یا نه

در پروژه‌ای به نام Project Fetch، شرکت Anthropic بررسی کرد که آیا مدل Claude می‌تواند به انسان‌ها در آموزش ربات چهارپای Boston Dynamics Spot کمک کند یا خیر.

در این آزمایش:
دو تیم از کارکنانی که هیچ تجربه‌ای در رباتیک نداشتند، باید Spot را طوری برنامه‌ریزی می‌کردند که یک توپ ساحلی را پیدا کند و بیاورد — آن هم در سه مرحله با سختیِ افزایشی.

🔹 تیم اول با کمک Claude
🔹 تیم دوم بدون هیچ مدل هوش مصنوعی

🧠 نتیجه چه بود؟

✔️ تیم مجهز به Claude دو برابر سریع‌تر پیش رفت
✔️ وظایف بیشتری را تکمیل کرد
✔️ احساس اعتمادبه‌نفس بیشتری داشت
✔️ حتی توانست کنترل ربات را با زبان طبیعی امتحان کند
✔️ البته دوبار هم خراب کردند:
— سرعت حرکت ربات را اشتباه محاسبه کردند
— الگوریتم تشخیص توپ را اشتباه نوشتند

در مقابل، تیم بدون Claude:
بیشتر دچار استرس، سردرگمی و اشتباهات انسانی شد
مجبور بودند دائم از یکدیگر سؤال بپرسند
روندشان کندتر و ناهموارتر بود

🎯 جمع‌بندی

همچنین Project Fetch اولین تلاش Anthropic برای بررسی تأثیر مدل‌های زبانی در پروژه‌های واقعی R&D است.
نتایج نشان می‌دهد:
هوش مصنوعی سرعت و کارایی را چند برابر می‌کند، اما نظارت انسانی همچنان ضروری است.

🔜 گزارش کامل و ویدئوی مستند آن به‌زودی در وب‌سایت Anthropic منتشر می‌شود.


https://www.anthropic.com/research/project-fetch-robot-dog
---

@rss_ai_ir

#هوش_مصنوعی #Claude #Anthropic #رباتیک #BostonDynamics #AI #ML #Robotics #Spot #ProjectFetch #RND #TechNews
👍18🥰17🎉17👏15😁1511🔥11🙏2
🚀 مدل Holo2 نسل تازه‌ای از مدل‌های چندرسانه‌ای است که برای فهم رابط‌کاربری، ناوبری و استدلال در وب، دسکتاپ و موبایل طراحی شده است.

📈 نتایج چشمگیر در بنچمارک‌ها Holo2 رکوردهای جدیدی ثبت کرده است:

🟩 امتیاز 66.1% در ScreenSpot-Pro (افزایش +۳٪)

🟩 امتیاز 76.1% در OSWorld-G (افزایش +۵٪)
این مدل بسیاری از رقبا را پشت سر گذاشته و تبدیل به یکی از بهترین گزینه‌ها برای UI-grounding شده است.


🧠 معماری مدل

مبتنی بر Qwen3-VL

درک بسیار قوی از رابط‌کاربری و ناوبری دقیق

مناسب برای توسعه عامل‌های هوشمند UI در نرم‌افزارها


🌐 قابل اجرا روی: مرورگر، Ubuntu و Android

🔀 همچنین Mixture of Experts نسخه‌ی پرچم‌دار 30B-A3B فقط با فعال‌سازی ۳ میلیارد پارامتر در هر مرحله عملکردی در سطح مدل 30B ارائه می‌دهد اما با هزینه محاسبات کمتر.

🤖 مدل از reasoning-token ها برای بهبود دقت تصمیم‌گیری بهره می‌برد و با Surfer 2 و ReAct کاملاً سازگار است.

⚙️ شیوه اجرا
سازگار با vLLM و تمام فریم‌ورک‌های هماهنگ با Qwen3-VL

📜 لایسنس‌ها

نسخه‌های 4B و 8B → تحت Apache-2

نسخه 30B-A3B → فقط استفاده غیرتجاری


🔗 لینک‌ها:
🌐 Blog: hcompany.ai/blog/holo2
🍳 Cookbook: github.com/hcompai/hai-cookbook/blob/main/holo2/holo_2_localization_huggingface.ipynb
🤗 HuggingFace: huggingface.co/collections/Hcompany/holo2

@rss_ai_ir

#هوش_مصنوعی #مدل_چندرسانه‌ای #عامل_هوشمند #Qwen #Holo2 #AI #LLM #ML #رابط_کاربری #ui_grounding #qwen3_vl #vllm #surfer2 #react_ai
🥰10👍6🔥54👏3😁2🎉2
🌟 فریم‌ورک جدید RL برای آموزش مدل‌های MoE از تیمی که Chatbot Arena را ساخته است

فریم‌ورک Miles توسط گروه LMSYS ORG معرفی شد؛ همان تیمی که پروژهٔ معروف slime را ساخته بود. اگر توسعه‌های اپن‌سورس را دنبال می‌کنید، می‌دانید slime یک ابزار فوق‌سبک برای پست‌تریـن است—و حتی برای GLM-4.6 هم استفاده شد.

همچنین Miles همان مسیر را ادامه می‌دهد، اما این بار با تمرکز بر آموزش مقیاس‌بالا برای معماری‌های MoE و پشتیبانی از بارهای سنگین در محیط‌های سازمانی.

⚙️ نکات فنی
• معماری بر پایهٔ True On-Policy؛ یعنی صفر شدن فاصلهٔ رفتاری بین مدل در حالت آموزش و حالت اجرا
• استفاده از Flash Attention 3، کتابخانه DeepGEMM و هسته‌های Thinking Machines Lab در کنار torch.compile
• پشتیبانی از Speculative Decoding همراه با آموزش آنلاین مدل پیش‌نویس—رویکردی که باعث می‌شود مدل draft دقیقاً با سیاست مدل اصلی حرکت کند
• افزایش سرعت تولید متن تا ۲۵٪ در مراحل پایانی آموزش

🧩 پایداری سیستم
• جلوگیری از کرش‌های غیرضروری OOM؛ اهمیت ویژه برای محیط‌های سازمانی که «هر گیگابایت یعنی هزینه»
• اصلاح مشکلات مصرف حافظه در FSDP
• وعدهٔ پشتیبانی از آموزش چندمُدی، سازگاری با SGLang v2 و نسخهٔ پیشرفته‌تر Speculative Decoding

📄 مقاله
🖥️ GitHub

@rss_ai_ir
#AI #ML #RL #MoE #LMSYS #Miles
🌟 LLM Council:
وقتی یک «شورای مدل‌های زبانی» به جای یک مدل به شما جواب می‌دهد!

آندری کارپاتی دوباره برگشته و این‌بار با یک پروژه جالب به نام LLM Council — ایده‌ای که پاسخ‌دهی را از سطح یک مدل، به سطح شورای مشورتی از مدل‌های هوش مصنوعی ارتقا می‌دهد.

ایده ساده اما قدرتمند است:
به‌جای این‌که سؤال شما فقط توسط یک مدل پاسخ داده شود، مجموعه‌ای از مدل‌ها پاسخ می‌دهند، یکدیگر را نقد می‌کنند و در نهایت یک مدل به‌عنوان «رئیس شورا» پاسخ نهایی را می‌سازد.

🔹 روند کار چگونه است؟

🟢 مرحله ۱: جمع‌آوری نظرها
سؤال شما از طریق OpenRouter برای چندین مدل به‌صورت جداگانه ارسال می‌شود.
هر مدل یک پاسخ مستقل تولید می‌کند و پاسخ‌ها در تب‌های مجزا قابل مشاهده‌اند.

🟢 مرحله ۲: ریتینگ و نقد علمی
هر مدل پاسخ‌های سایر مدل‌ها را بررسی و به‌صورت ناشناس ارزیابی می‌کند تا سوگیری ایجاد نشود.
مدل‌ها پاسخ‌ها را از نظر دقت و عمق تحلیل رتبه‌بندی می‌کنند.

🟢 مرحله ۳: خروجی نهایی
یک «مدل رئیس شورا» همه نتایج را دریافت کرده و آن‌ها را در قالب یک پاسخ واحد، دقیق و ترکیبی ارائه می‌دهد.


---

⚠️ برای استفاده از این سیستم نیاز به کلید API OpenRouter دارید.
مزیت خوبش این است که چند مدل رایگان هم در OpenRouter وجود دارد.

📌 Github:
https://github.com/karpathy/llm-council
@rss_ai_ir
---
🔖 هشتگ‌ها
#هوش_مصنوعی #مدل_زبانی #LLMCouncil #OpenRouter #AI #ML #کارپاتی #Github #LLM #هوش_تولیدی
👍21👏1