VIRSUN
12K subscribers
1.19K photos
703 videos
5 files
774 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
مدل VibeThinker-1.5B؛ مدل کوچک اما رکوردشکن در استدلال

این مدل ۱.۵ میلیارد پارامتری با وجود اندازه‌ی بسیار کوچک، در آزمون‌های استدلالی به نتایج SOTA رسیده است.

🚀 عملکرد:
در AIME24/25 و HMMT25 جزو بهترین‌هاست و حتی مدل DeepSeek R1-0120 را در مسائل ریاضی پشت سر می‌گذارد. در برنامه‌نویسی رقابتی هم بالاتر از مدل‌های هم‌حجم ظاهر شده است.

بهره‌وری:
فقط ۱.۵B پارامتر — یعنی ۱۰۰ تا ۶۰۰ برابر کوچک‌تر از مدل‌هایی مثل Kimi K2 و DeepSeek R1.

💰 هزینه:
کل هزینهٔ پس‌تمرین حدود ۷.۸ هزار دلار بوده؛ یعنی ۳۰ تا ۶۰ برابر ارزان‌تر از DeepSeek R1 یا MiniMax-M1.

این مدل بر پایهٔ Spectrum-to-Signal Principle (SSP) و فریم‌ورک MGPO ساخته شده تا فرآیند استدلال را بهینه کند.

📦 Model:
hf.co/WeiboAI/VibeThinker-1.5B
💻 GitHub:
github.com/WeiboAI/VibeThinker
📄 Arxiv:
arxiv.org/abs/2511.06221

#AI #LLM #Reasoning #OpenSource #SmallModel @rss_ai_ir
🧭 لینکدین موتور جستجوی جدید مبتنی بر هوش مصنوعی را برای ۱.۳ میلیارد کاربر فعال کرد

✳️این سیستم جدید، افراد را فقط بر اساس کلمات کلیدی پیدا نمی‌کند؛ بلکه مهارت‌ها، تخصص‌ها، شبکه ارتباطی و میزان دسترس‌پذیری آن‌ها را هم تحلیل می‌کند.

✳️هوش مصنوعی لینکدین می‌تواند یک درخواست ساده مثل «درمان سرطان» را به مجموعه‌ای از مهارت‌ها و حوزه‌های مرتبط تبدیل کند و دقیق‌ترین متخصصان را پیشنهاد دهد.

✳️در پشت‌صحنه، از مدل‌های ۷ میلیاردی، ۱.۷ میلیاردی و یک رانکر ۲۲۰M استفاده شده که با فشرده‌سازی هوشمند و پردازش GPU، سرعت جستجو را تا ۱۰ برابر افزایش می‌دهد.

https://venturebeat.com/ai/inside-linkedins-generative-ai-cookbook-how-it-scaled-people-search-to-1-3

---

#هوش_مصنوعی #LinkedIn #جستجوی_هوشمند #LLM #شبکه_اجتماعی #AI #ML #مدل_زبانی #فناوری
🤖 می‌خوای ایجنت هوش مصنوعی مخصوص خودت رو بسازی؟
این یک نفر همه‌چیز رو یک‌جا جمع کرده!

یک داکیومنت کامل شامل:
📺 ویدیوهای آموزشی
📚 کتاب‌ها و مقالات
🛠️ مخازن GitHub
🎓 دوره‌های Google، OpenAI، Anthropic و…

موضوعات پوشش‌داده‌شده:
♻️مدل‌های زبانی LLM
♻️طراحی ایجنت‌ها
♻️حافظه، کنترل و برنامه‌ریزی (MCP)


💡 همه‌چیز رایگان و یک‌جا داخل یک Google Docs 👇
https://docs.google.com/document/d/1Z5SX89FV6bTy2KKnGGb61xCcS9iPg_fv2USQYi4Wc3g/mobilebasic


---

#هوش_مصنوعی #ایجنت #LLM #برنامه‌ریزی #AI #ML #یادگیری_ماشین #مهندسی_پرامپت #Agents
2
⚡️ Lumine —
دستورالعملی باز برای ساخت ایجنت‌های جنرالیست در دنیای سه‌بعدی

پروژه‌ی Lumine یک چارچوب کاملاً متن‌باز ارائه می‌دهد که به محققان و توسعه‌دهندگان اجازه می‌دهد ایجنت‌های هوش مصنوعی چندمنظوره را در محیط‌های سه‌بعدی پیچیده بسازند و آموزش دهند.

ویژگی‌ها:
🔹 یادگیری مهارت‌های عمومی در جهان‌های 3D
🔹 مناسب برای رباتیک، بازی‌ها، شبیه‌سازی و تحقیق
🔹 مدل‌ها و دیتاست‌ها آزادانه در دسترس
🔹 معماری یکپارچه برای تعامل، ادراک و برنامه‌ریزی

لینک‌ها:
📄 Paper (arXiv):
https://arxiv.org/abs/2511.08892
📘 HF:
https://huggingface.co/papers/2511.08892
🌐 Project:
https://www.lumine-ai.org/


---

#هوش_مصنوعی #ایجنت #Lumine #AI #LLM #Agents #ML #سه‌بعدی #3D #OpenAI #HuggingFace
🚀 مجموعه Qwen نسخه‌ی جدید DeepResearch 2511 را منتشر کرد — ارتقای بزرگ در تحقیق عمیق

مدل جدید DeepResearch 2511 با چندین قابلیت مهم عرضه شد و تجربهٔ پژوهش خودکار را حرفه‌ای‌تر و عمیق‌تر می‌کند.

دو حالت جدید برای تحقیق

Normal —
سریع، سبک و مناسب بیشتر کاربردها

Advanced —
تحلیل عمیق‌تر، صرف زمان بیشتر و خروجی کاملاً جزئی‌نگر


📄 پشتیبانی از آپلود فایل‌ها
حالا می‌توانید مستقیم سند یا تصویر را برای تحلیل عمیق به مدل بدهید.

جستجوی تقویت‌شده
مکانیزم جدید با سرعت بیشتر وب را پیمایش می‌کند و نتایج را دقیق‌تر و عمیق‌تر جمع‌آوری می‌کند.

📊 کنترل کامل روی ساختار گزارش
امکان تعیین تعداد پاراگراف، فرمت، حجم گزارش و سطح جزئیات

بهبود قابل توجه در دقت استناد و نقل‌قول‌ها


🧑‍💻 تجربه کاربری جدید
رابط کاربری و معماری سیستم بازطراحی شده و حالا بسیار سریع‌تر و روان‌تر است.

🔗 Web:
https://chat.qwen.ai/?inputFeature=deep_research
📱 App:
https://qwen.ai/download


---

#هوش_مصنوعی #Qwen #DeepResearch #AI #LLM #تحقیق_عمیق #چت_بات #مدل_زبان #پژوهش #محقق_هوشمند
2🔥1👏1
🤖 ربات‌های مجهز به هوش مصنوعی در آزمون انسانیت مردود شدند؛ تمایل به خشونت و تبعیض تأیید شد

پژوهشی مشترک از کالج سلطنتی لندن و دانشگاه کارنگی ملون نشان می‌دهد ربات‌هایی که با مدل‌های زبانی بزرگ (LLM) کنترل می‌شوند، در آزمون‌های ایمنی و اخلاق عملکرد نگران‌کننده‌ای دارند.

🔍 در این آزمایش:
به ربات‌ها دستورهای آشکار و پنهان برای انجام کارهای غیرقانونی یا آسیب‌زننده داده شد. نتایج شوکه‌کننده بود:

• موافقت با گرفتن عصا از فرد معلول
• تهدید کارکنان با چاقو
• عکس‌برداری مخفیانه از مردم بدون رضایت
• و دیگر رفتارهای خطرناک و غیراخلاقی

این یافته‌ها نشان می‌دهد که ربات‌های مبتنی بر LLM هنوز فاصله زیادی با رفتار ایمن و قابل اعتماد انسانی دارند.

⚠️ پژوهشگران تأکید می‌کنند که الزام به استانداردها و گواهی‌های مستقل ایمنی برای چنین فناوری‌هایی باید فوراً اجرا شود.


---

#هوش_مصنوعی #ربات #ایمنی_رباتیک #AI #Robotics #LLM #اخلاق_هوش_مصنوعی #فناوری
4👍3🔥1
🧠 چرا مدل‌های زبانی در آموزش تقویتی (RL) «تصادفی بودن» خود را از دست می‌دهند؟
و مهم‌تر از آن: چطور این مشکل را حل کنیم؟

در یک پژوهش جدید، محققان بررسی کرده‌اند که چرا هنگام آموزش مدل‌ها برای توانایی استدلال، تنوع پاسخ‌ها کاهش می‌یابد و مدل فقط چند پاسخ تکراری را انتخاب می‌کند. نتیجه؟ افت خلاقیت، کاهش اکتشاف و در نهایت ضعف در تعمیم‌دهی.

📌 مهم‌ترین یافته‌ها

🔹 تنوع مهم‌تر از اندازه دیتاست است
گاهی یک دیتاست کوچک اما متنوع (~۶۰۰ نمونه) می‌تواند به اندازه مجموعه ۱۷هزار نمونه کارکرد داشته باشد

🔹 دیتاست کم‌تنوع = سقوط سریع‌تر
پس حتی مجموعه کوچک اگر متنوع باشد عملکرد فوق‌العاده دارد.

🔗 منبع پژوهش:
arxiv.org/abs/2511.05993
---
📍 جمع‌بندی کوتاه:
برای ساخت مدل‌های استدلال قدرتمند، فقط پاداش بیشتر کافی نیست؛ باید تصادفی‌بودن کنترل‌شده و تنوع داده‌ حفظ شود، وگرنه مدل به چند الگوی تکراری قفل می‌شود.
---

در این‌باره تجربه‌ای دارید؟ شما موافقید که مدل‌های جدید بیش از حد «قابل‌پیش‌بینی» شده‌اند؟ 🤔

@rss_ai_ir
---

#هوش_مصنوعی #یادگیری_تقویتی #RL #LLM #زبان_طبیعی #پژوهش_هوش_مصنوعی #مدل_مولد #Entropy #ReinforcementLearning #AIResearch
13🥰11😁11👍10🔥9👏8🎉7
🚀 تحول بزرگ در مدل‌های علمی هوش مصنوعی
مرور ۹۴ صفحه‌ای درباره تکامل LLMهای علمی با داده‌های غنی و چرخه‌های بسته‌ی عامل‌های خودمختار منتشر شد.

در این تحقیق بی‌سابقه:
📚 ۲۷۰ دیتاست و 🧪 ۱۹۰ بنچمارک بررسی شده‌اند.

چرا LLMهای معمولی برای علم کافی نیستند؟
زیرا داده‌های علمی فقط متن نیستند؛ ترکیبی از:
📊 جداول، 🧮 فرمول‌ها، 💻 کد، 🖼 تصاویر و 🔬 اندازه‌گیری‌های نامطمئن هستند.
مدل‌های عمومی معمولا این ظرافت‌ها را از دست می‌دهند.

📌 این مرور چه پیشنهاد می‌دهد؟

🔷 ایجاد طبقه‌بندی یکپارچه برای داده‌های علمی
🔷 تعریف مدل چندلایه‌ی دانش علمی:
از مشاهده خام → تا فرضیه → مدل → نظریه

این چارچوب کمک می‌کند مدل‌ها طوری پیش‌تمرین و سپس فاین‌تیون شوند که:
📌 قواعد علمی را حفظ کنند
📌 بتوانند میان قالب‌ها و مقیاس‌های مختلف ارتباط برقرار کنند

🧠 مدل‌ها بر اساس حوزه دسته‌بندی شده‌اند:
فیزیک شیمی زیست مواد علوم زمین نجوم

دستیاران علمی چندحوزه‌ای


📈 تحول در ارزیابی کیفیت:
از سوالات یک‌مرحله‌ای به تست‌های فرآیندمحور شامل:
🔹 زنجیره استدلال
🔹 استفاده از ابزار و کد
🔹 نتایج میان‌مرحله‌ای و شواهد تجربی

🔁 جهت آینده: چرخه‌ی بسته‌ی علمی
عامل‌ها (agents) به‌طور خودمختار:

1. آزمایش طراحی می‌کنند


2. شبیه‌سازها یا آزمایشگاه‌ها را اجرا می‌کنند


3. نتایج را تحلیل می‌کنند


4. دانش را به‌روزرسانی می‌کنند



🎯 جمع‌بندی:
مدل LLMهای علمی به‌سمت علم داده‌محور، قابل‌اثبات و عامل‌محور حرکت می‌کنند؛ مدلی که به جای حدس، به شواهد تکیه می‌کند.

🔗 لینک مقاله:
https://arxiv.org/abs/2508.21148

@rss_ai_ir
#هوش_مصنوعی #علم #علمی #LLM #Agent #پژوهش #یادگیری_ماشین #SciAI
🎉75🔥5👍4🥰3👏3😁3
🚀 مدل Holo2 نسل تازه‌ای از مدل‌های چندرسانه‌ای است که برای فهم رابط‌کاربری، ناوبری و استدلال در وب، دسکتاپ و موبایل طراحی شده است.

📈 نتایج چشمگیر در بنچمارک‌ها Holo2 رکوردهای جدیدی ثبت کرده است:

🟩 امتیاز 66.1% در ScreenSpot-Pro (افزایش +۳٪)

🟩 امتیاز 76.1% در OSWorld-G (افزایش +۵٪)
این مدل بسیاری از رقبا را پشت سر گذاشته و تبدیل به یکی از بهترین گزینه‌ها برای UI-grounding شده است.


🧠 معماری مدل

مبتنی بر Qwen3-VL

درک بسیار قوی از رابط‌کاربری و ناوبری دقیق

مناسب برای توسعه عامل‌های هوشمند UI در نرم‌افزارها


🌐 قابل اجرا روی: مرورگر، Ubuntu و Android

🔀 همچنین Mixture of Experts نسخه‌ی پرچم‌دار 30B-A3B فقط با فعال‌سازی ۳ میلیارد پارامتر در هر مرحله عملکردی در سطح مدل 30B ارائه می‌دهد اما با هزینه محاسبات کمتر.

🤖 مدل از reasoning-token ها برای بهبود دقت تصمیم‌گیری بهره می‌برد و با Surfer 2 و ReAct کاملاً سازگار است.

⚙️ شیوه اجرا
سازگار با vLLM و تمام فریم‌ورک‌های هماهنگ با Qwen3-VL

📜 لایسنس‌ها

نسخه‌های 4B و 8B → تحت Apache-2

نسخه 30B-A3B → فقط استفاده غیرتجاری


🔗 لینک‌ها:
🌐 Blog: hcompany.ai/blog/holo2
🍳 Cookbook: github.com/hcompai/hai-cookbook/blob/main/holo2/holo_2_localization_huggingface.ipynb
🤗 HuggingFace: huggingface.co/collections/Hcompany/holo2

@rss_ai_ir

#هوش_مصنوعی #مدل_چندرسانه‌ای #عامل_هوشمند #Qwen #Holo2 #AI #LLM #ML #رابط_کاربری #ui_grounding #qwen3_vl #vllm #surfer2 #react_ai
🥰10👍6🔥54👏3😁2🎉2
🧠 نسل تازه مدل‌های چندوجهی؛ معرفی Gemini 3 Pro

مدل Gemini 3 Pro تازه‌ترین عضو خانواده‌ی Gemini است؛ یک مدل استدلال‌محور و بومی‌چندوجهی که بدون وابستگی یا فاین‌تیون روی نسخه‌های قبلی ساخته شده است، نه ارتقاء، نه شاخه‌سازی — یک معماری کاملاً نو.

ورودی‌ها:

متن (سؤال، پرامپت، خلاصه‌سازی اسناد و …)

تصویر

صوت

ویدئو
🔹 با پنجره‌ی کانتکست خیره‌کننده‌ی ۱ میلیون توکن


خروجی‌ها:

متن با ظرفیت تولید تا ۶۴هزار توکن


🔗 مدل‌کارت آرشیوشده:
(وب‌آرشیو)
https://web.archive.org/web/20251118111103if_/https://storage.googleapis.com/deepmind-media/Model-Cards/Gemini-3-Pro-Model-Card.pdf

@rss_ai_ir

#Gemini #GoogleDeepMind #Multimodal #LLM #AI #هوش_مصنوعی #مدل_چندوجهی #استدلال #پرامپت #زبان_طبیعی #چت_بات
👍7🔥6🥰6😁5👏4🎉42
🤖 مدل MeshCoder؛ تبدیل ابر نقاط
سه‌بعدی به کد قابل‌ویرایش بلندر

@rss_ai_ir

یک پروژه جذاب در دنیای ۳بعدی؛ MeshCoder فریم‌ورکی است که ابرِ نقاط‌ سه‌بعدی را به کد پایتونِ قابل ویرایش در Blender تبدیل می‌کند. یعنی می‌توان یک محیط یا شیء اسکن‌شده را به اسکریپت تبدیل کرد و بعد با تغییر چند خط کد، آن را ویرایش، بازطراحی یا بازسازی کرد.

📌 خلاصه عملکرد:
کافیست ابر نقاط را بدهید → مدل هوش مصنوعی یک Mesh باکیفیت می‌سازد → خروجی یک اسکریپت پایتون Blender است که می‌توانید هر بخش آن را تغییر دهید. مناسب برای طراحان 3D، معماران، گیم‌دیزاینرها و تیم‌های دیجیتال‌توین.

🔧 نکات فنی مهم:

دارای مجموعه API هوشمند برای ساخت هندسه‌های پیچیده در Blender

مدل روی دیتاستی از جفت‌های «شیء کد» آموزش دیده است

نمایش مبتنی بر کد باعث ویرایش شهودی‌تر هندسه و توپولوژی می‌شود

این ساختار مقدار قابل توجهی به توانایی استدلال LLM درباره شکل‌های سه‌بعدی اضافه می‌کند


🌐 لینک پروژه (کد، وزن‌ها و مقاله):
https://daibingquan.github.io/MeshCoder/

📍 کاربردها:
🕹 طراحی بازی‌ها و فضاهای 3D
🏗 معماری و مدل‌سازی سازه‌ها
🚗 مهندسی معکوس قطعات صنعتی
🌍 ساخت مدل‌های دوقلوی دیجیتال (Digital Twin)

#هوش_مصنوعی #۳بعدی #Blender #Mesh #LLM #DigitalTwin #AI3D
15🥰11😁9👏8🎉7👍5🔥4
🚀 بالاخره xAI مدل Grok 4.1 را منتشر کرد؛ جهشی بزرگ به‌سمت خلاقیت و هوش احساسی

این آپدیت جدید تمرکز جدی روی خلاقیت، هوش هیجانی و کاهش شدید خطاهای اطلاعاتی (Hallucinations) دارد.
همچنین xAI برای این نسخه از یادگیری تقویتی گسترده استفاده کرده؛ بخش زیادی از آن به‌صورت آژنتی و بدون دخالت انسان انجام شده.

وقتی ۲۰۰٬۰۰۰ کارت گرافیک داشته باشی، به قول معروف می‌توانی کیفیت مدل را "بزور بهبود" بدهی! 😄


---

📊 نتایج تست و مقایسه با مدل‌های رقیب

تست‌ها بین ۱ تا ۱۴ نوامبر به‌صورت بی‌سر و صدا روی grok.com ،X و اپ‌ها انجام شده و نسخه جدید در مقایسه کور (blind) در ۶۴.۷۸٪ مواقع انتخاب کاربران بوده.

🏆 LMArena - Text Leaderboard

مدل رتبه/Elo

Grok 4.1 Thinking 🥇 رتبه ۱ – امتیاز 1483
Grok 4.1 (بدون reasoning) 🥈 رتبه 2 – امتیاز 1465


🔹 نسخه غیر-thinking حتی از تمام نسخه‌های reasoning دیگر مدل‌ها بهتر عمل کرده!
🔹 مدل Grok 4 قبلی رتبه ۳۳ بود — یعنی جهش کاملاً چشمگیر.

💞 Emotional Intelligence (EQ-Bench)

مدل Elo

Grok 4.1 Thinking 1586
Grok 4.1 1585
Kimi K2 1561
GPT-5.1 1559


✍️ Creative Writing v3

مدل Elo

GPT-5.1 🥇 1756
Grok 4.1 Thinking 1722
Grok 4.1 1709
o3 1696



---

🔍 کاهش خطا و توهم اطلاعاتی (Hallucinations)

تمرکز روی پرسش‌های واقعی + ابزارهای جستجو باعث شد:

📉 نرخ Hallucination از 12.09٪ → 4.22٪
📉 FactScore از 9.89٪ → 2.97٪

جهش بسیار مهم مخصوصاً برای کاربردهای حساس.


---

📱 از کجا می‌توان Grok 4.1 را استفاده کرد؟

🔗 grok.com
🟦 X (توئیتر)
🍏 iOS
🤖 Android
📄 توضیحات فنی:
https://x.ai/news/grok-4-1


---

🧠 جمع‌بندی

مدل Grok 4.1 از یک «مدل فقط باهوش»، تبدیل شده به یک مدل انسانی‌تر، اجتماعی‌تر و مناسب برای:

نوشتن خلاق
🧑‍🤝‍🧑 گفت‌وگوهای احساسی و انسانی‌تر
📚 علوم اجتماعی و روان‌شناسی
🔍 تحقیق و تحلیل دقیق اطلاعات

به‌نظر می‌رسد در حوزه تعامل انسانی، xAI می‌خواهد از همه مدل‌های فعلی جلو بزند.


---

#هوش_مصنوعی #Grok #xAI #مدل_زبان #AI #LLM
@rss_ai_ir
👏19😁17👍16🎉14🔥13🥰129
Heretic —
ابزاری برای حذف سانسور (Alignment) از مدل‌های زبانی

🛠 ابزار Heretic روشی ارائه می‌دهد که بدون دسترسی به وزن‌های مدل و تنها از طریق API، محدودیت‌های رفتاری و فیلترهای پاسخ‌دهی مدل را کاهش دهد و آمادگی آن برای پاسخ‌گویی گسترده‌تر را افزایش دهد.

🔍 این ابزار چه می‌کند؟

مدل را مانند جعبه‌سیاه (Black-box) در نظر می‌گیرد

مجموعه‌ای از پرسش‌های «ایمن» و «غیرایمن» را به مدل می‌دهد

یک دیسکریمیناتور آموزش می‌دهد تا تفاوت پاسخ‌های قبل و بعد از آزادسازی را تشخیص دهد

پارامترهایی پیدا می‌کند که باعث کاهش پاسخ‌های رد / انکار شود اما مدل را از حالت منطقی خارج نکند

در پایان می‌توان نسخه تعدیل‌شده را ذخیره کرد یا در حالت چت تست نمود


🎯 کاربردها:

♻️فعال‌تر کردن مدل‌های لوکال برای پاسخ‌گویی به طیف وسیع‌تری از درخواست‌ها

♻️مناسب برای تحقیقات درباره رفتار مدل‌ها و آزمایش محدودیت‌ها

♻️کاهش سانسور بدون افت شدید کیفیت یا تبدیل مدل به پاسخ‌دهنده بی‌دقت


⚠️ نکات مهم:

✳️استفاده از این ابزار مسئولیت اخلاقی و حقوقی دارد

✳️هدف Heretic افزایش دقت یا توانایی مدل نیست؛
✳️هدف، برداشتن قفل‌های رفتاری ناشی از Alignment است

✳️ممکن است در برخی حوزه‌ها خطرناک باشد و نیازمند رویکرد مسئولانه است


📎 پروژه در GitHub:
github.com/p-e-w/heretic


---

#هوش_مصنوعی #مدل_زبان #LLM #Alignment #OpenSource
@rss_ai_ir
👏8🔥7👍6🎉54🥰4😁2
⚡️ خبر: Ai2 مدل‌های جدید Olmo 3 را معرفی کرد — مجموعه‌ای کاملاً متن‌باز در نسخه‌های 7B و 32B که از نظر کیفیت به سطح بهترین مدل‌های بازار نزدیک شده‌اند.

🔹 مدل 32B base
به‌عنوان یک مدل پایه، بسیار قدرتمند عمل می‌کند و در بسیاری از بِنچمارک‌ها هم‌سطح Qwen 2.5 بوده و حتی از Google Gemma 3 نیز جلو می‌زند.

🔹 مدل‌های 7B instruct و 7B reasoning
در میان مدل‌های غربی، بهترین عملکرد را دارند و مخصوصاً نسخهٔ reasoning نتایج بسیار قوی ارائه می‌دهد.

🔹 مدل 32B Think
نخستین مدل 32B کاملاً باز برای وظایف سنگینِ استدلالی؛ کیفیت آن به Qwen 3 نسخه‌های 8B و 32B بسیار نزدیک است.

🔸 تمام داده‌ها، کدها و چک‌پوینت‌ها به‌طور کامل منتشر شده‌اند.
🔸 نسخهٔ 32B بدون مشکل روی یک GPU با 80GB یا حتی یک لپ‌تاپ قدرتمند اجرا می‌شود.
🔸 این مدل یک خلأ مهم را پر کرده، زیرا Qwen نسخهٔ open-source برای 32B base ندارد.

🟠 Paper

https://allenai.org/papers/olmo3
🟠 Artifacts

https://huggingface.co/collections/allenai/olmo-3
🟠 Demo

https://playground.allenai.org
🟠 Blog

https://allenai.org/blog/olmo3

@rss_ai_ir
#هوش_مصنوعی #مدل_زبان #Olmo3 #LLM #AI2
1
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 نانوبانانا در ساخت اسلاید عالیه، اما اگر بخواهیم از اسلایدها ویدئو بسازیم چه؟ 🎬

در اکوسیستم گوگل، این کار حالا فوق‌العاده ساده شده است. Google Vids به‌همراه Gemini می‌تواند یک ارائهٔ Google Slides را به یک ویدئوی کامل تبدیل کند — آن هم به‌طور خودکار.

در این فرآیند چه اتفاقی می‌افتد؟
اسکریپت نوشته می‌شود
صداگذاری انجام می‌شود
موسیقی اضافه می‌شود
ویدئو بر اساس سبک انتخابی شما ساخته می‌شود

کافیست فایل ارائهٔ خود را آپلود کنید، یک سبک انتخاب کنید، و بقیه را سیستم انجام می‌دهد. این یعنی تبدیل ارائه‌های خشک به محتوای ویدئویی حرفه‌ای — بدون دردسر تدوین.

🔗 منبع:
https://workspace.google.com/blog/product-announcements/october-workspace-drop-ai-storytelling-research-and-data-protections

@rss_ai_ir
#Gemini #گوگل #ویدئو #هوش_مصنوعی #LLM
👍3🔥1🙏1
📘 خبر: «FrontierMath» مجموعه‌ای از سخت‌ترین مسائل ریاضیِ حال حاضر است؛ دقیقا همان جایی که مدل‌های بزرگ هوش مصنوعی مجبور می‌شوند توان واقعیِ استدلال و قدرت حل مسئلهٔ خود را نشان دهند.

📊 در تازه‌ترین نتایج، Gemini 3.0 Pro رکورد جدیدی ثبت کرده و حتی از GPT-5 نیز پیشی گرفته است. این عملکرد نشان می‌دهد موج انتظارات از نسل سوم Gemini کاملا منطقی بوده و مدل توانسته است از پسِ چالش‌های سطح Frontier به‌خوبی برآید.

🤔 حالا نگاه‌ها به سمت OpenAI است؛ باید دید پاسخ بعدی آنها در رقابت مدل‌های استدلالی چه خواهد بود و چه نسخه‌ای برای حفظ برتری ارائه می‌کنند.

@rss_ai_ir
#هوش_مصنوعی ⚡️ #ریاضیات #Gemini3 #LLM
🔥2👏1😁1
🌟 LLM Council:
وقتی یک «شورای مدل‌های زبانی» به جای یک مدل به شما جواب می‌دهد!

آندری کارپاتی دوباره برگشته و این‌بار با یک پروژه جالب به نام LLM Council — ایده‌ای که پاسخ‌دهی را از سطح یک مدل، به سطح شورای مشورتی از مدل‌های هوش مصنوعی ارتقا می‌دهد.

ایده ساده اما قدرتمند است:
به‌جای این‌که سؤال شما فقط توسط یک مدل پاسخ داده شود، مجموعه‌ای از مدل‌ها پاسخ می‌دهند، یکدیگر را نقد می‌کنند و در نهایت یک مدل به‌عنوان «رئیس شورا» پاسخ نهایی را می‌سازد.

🔹 روند کار چگونه است؟

🟢 مرحله ۱: جمع‌آوری نظرها
سؤال شما از طریق OpenRouter برای چندین مدل به‌صورت جداگانه ارسال می‌شود.
هر مدل یک پاسخ مستقل تولید می‌کند و پاسخ‌ها در تب‌های مجزا قابل مشاهده‌اند.

🟢 مرحله ۲: ریتینگ و نقد علمی
هر مدل پاسخ‌های سایر مدل‌ها را بررسی و به‌صورت ناشناس ارزیابی می‌کند تا سوگیری ایجاد نشود.
مدل‌ها پاسخ‌ها را از نظر دقت و عمق تحلیل رتبه‌بندی می‌کنند.

🟢 مرحله ۳: خروجی نهایی
یک «مدل رئیس شورا» همه نتایج را دریافت کرده و آن‌ها را در قالب یک پاسخ واحد، دقیق و ترکیبی ارائه می‌دهد.


---

⚠️ برای استفاده از این سیستم نیاز به کلید API OpenRouter دارید.
مزیت خوبش این است که چند مدل رایگان هم در OpenRouter وجود دارد.

📌 Github:
https://github.com/karpathy/llm-council
@rss_ai_ir
---
🔖 هشتگ‌ها
#هوش_مصنوعی #مدل_زبانی #LLMCouncil #OpenRouter #AI #ML #کارپاتی #Github #LLM #هوش_تولیدی
👍21👏1
🤖 سه الگوی طلایی برای ساخت ایجنت‌های هوش مصنوعی

اگر در دنیای ایجنت‌ها کار می‌کنی، شناخت این سه الگوی متداول می‌تواند مسیر توسعه را چند برابر سریع‌تر و هوشمندانه‌تر کند.


---

🔹 الگوی بازتاب (Reflection)
در این روش ابتدا ورودی به ایجنت داده می‌شود؛ ایجنت پاسخ می‌دهد؛ سپس با دریافت بازخورد، پاسخ خود را اصلاح و بهبود می‌کند.
این چرخه تا رسیدن به کیفیت مطلوب ادامه می‌یابد.

🛠 ابزارهای مناسب:
• مدل پایه (مثل GPT-4o)
• مدل فاین‌تیون‌شده برای ارائه بازخورد
• اتوماسیون با n8n برای پیاده‌سازی چرخه بازتاب


---

🔹 الگوی مبتنی بر بازیابی دانش (RAG)
در این الگو، ایجنت هنگام انجام یک وظیفه می‌تواند از یک پایگاه دانش خارجی پرس‌وجو کند؛
بنابراین پاسخ‌ها دقیق‌تر، مستندتر و قابل استناد خواهند بود.

🛠 ابزارهای مناسب:
• پایگاه (Vector DB مثل Pinecone)
• ابزارهای UI برای ساخت سریع RAG مثل Aidbase
• ابزارهای API محور مثل SourceSync که به‌تازگی محبوب شده‌اند


---

🔹 الگوی جریان‌کاری هوشمند (AI Workflow)
در این روش، یک فلو یا اتوماسیون سنتی ایجاد می‌شود، اما برخی از مراحل توسط هوش مصنوعی انجام می‌گیرد: تحلیل، تولید متن، تصمیم‌گیری و…

🛠 ابزارهای مناسب:
• پلتفرم n8n برای مدیریت کل جریان
• مدل‌های هوش مصنوعی از طریق API (Claude، GPT-4o و…)


---

تسلط بر این سه الگو یعنی تسلط بر ۸۰٪ معماری ایجنت‌ها.
اگر بتوانی این سه ساختار را خوب درک و ترکیب کنی، تقریباً هر نوع ایجنت کاربردی را می‌توانی بسازی — از اتوماسیون‌های ساده تا سیستم‌های پیچیده تصمیم‌ساز.

@rss_ai_ir
#AI #Agents #Workflow #Reflection #RAG #هوش_مصنوعی #اتوماسیون #مهندسی_ایجنت #n8n #Pinecone #GPT #Claude #LLM #python #MachineLearning
2🔥1👏1
🔥 عملکرد شگفت‌انگیز Gemini 3 Pro در آزمون‌های هوش

مدل Gemini 3 Pro در تازه‌ترین ارزیابی‌های IQ توانسته به امتیاز ۱۳۰ برسد؛
سطحی که آن را در میان ۲٪ افراد با بالاترین بهره هوشی قرار می‌دهد.

در آزمون رسمی شعبه نروژ «منسا» نیز امتیاز معادل ۱۴۲ ثبت شده است؛
شاخصی که معمولاً تنها ۰٫۳٪ از باهوش‌ترین انسان‌ها قادر به دستیابی به آن هستند.

این نتایج نشان می‌دهد که مدل‌های نسل جدید نه‌تنها در تحلیل و استدلال منطقی جهش کرده‌اند، بلکه از بسیاری از معیارهای انسانی نیز فراتر می‌روند.

@rss_ai_ir
---
🏷 هشتگ‌ها
#هوش_مصنوعی #Gemini #گوگل #مدل_های_زبانی #LLM #دیپ_مایند #AI #TechNews
3👏2🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
توانایی شگفت‌انگیز در تبدیل هر ویدئوی یوتیوب به اینفوگرافیک با Nano Banana Pro در Gemini

امکان تازه‌ای فراهم شده که هر ویدئوی آموزشی، تحلیلی یا خبری در یوتیوب را تنها با یک لینک، به یک اینفوگرافیک کامل و دقیق تبدیل کنید. کافی‌ست:

1️⃣ لینک ویدئو را کپی کنید
2️⃣ در Gemini جای‌گذاری کنید
3️⃣ از مدل بخواهید محتوای ویدئو را تحلیل کند (Gemini فقط با URL به ویدئو دسترسی دارد)
4️⃣ در مرحله بعد درخواست تولید اینفوگرافیک بدهید

🔹 پرامپت پیشنهادی:
"Generate an image of an infographic explaining the concept presented in the video."

نتیجه معمولاً یک تحلیل تصویری دقیق، سازمان‌یافته و کاملاً قابل استفاده برای آموزش، ارائه و تولید محتواست.

@rss_ai_ir
---
🏷 هشتگ‌ها

#هوش_مصنوعی #Gemini #NanoBananaPro #اینفوگرافیک #تولید_محتوا #AI #LLM #گوگل
👍2🔥1👏1
🍌 هفته‌ای پر از خبرهای داغ در مدل‌های تصویرسازی

به‌نظر می‌رسد طوفان «نانو بانانا پرو» باعث شده رقبا بلافاصله برای پاسخ‌دادن وارد میدان شوند.
شنیده‌ها می‌گویند نسخهٔ جدید Qwen-image-edit 2511 همین هفته منتشر می‌شود و احتمالاً چند ارتقای جدی همراه دارد:

مهم‌ترین موضوع، لایه‌بندی بی‌نهایت (Infinite Layer Decomposition) است.
یعنی مدل فقط سه لایهٔ معمول ــ پیش‌زمینه، سوژه و پس‌زمینه ــ را نمی‌سازد، بلکه تصویر را به تعداد زیادی لایهٔ ریزتر تجزیه می‌کند.
این یعنی کنترل بسیار دقیق‌تر، ویرایش‌های پیشرفته‌تر و دستکاری خلاقانه‌تر.

🔧 البته احتمال دارد این ویژگی چیزی شبیه سگمنتیشن چندمرحله‌ای مثل آنچه در ReVe دیده‌ایم باشد… اما تا زمان انتشار نمی‌توان قطعی گفت.

🔥 از طرف دیگر، Flux هم مدت‌هاست در سکوت نیست.
تصاویر مرموزی که در توییتر منتشر شده بود احتمالاً مربوط به Flux 2 است، و حتی مدل krazy-kangaroo در LMArena به همین نسخه نسبت داده می‌شود.

🌊 پروژهٔ Seedream هم در حال حرکت است، هرچند تاریخ عرضهٔ نسخهٔ بعدی مبهم مانده.

به‌هرحال هفته‌ای آرام پیش رو نداریم.
@rss_ai_ir 🤖
---
🏷 هشتگ‌ها

#مدل_تولید_تصویر #Qwen #Flux #بانانا #ویرایش_تصویر #هوش_مصنوعی #LLM #AI #تولید_محتوا
1