🧠 بایدو مدل جدید ERNIE-4.5-VL-28B-A3B-Thinking را منتشر کرد
مدلی چندوجهی (Multi-Modal) با ۲۸ میلیارد پارامتر که تنها ۳ میلیارد پارامتر در هر گام فعال میکند، اما عملکردی در حد مدلهای تصویری پیشرفته دارد.
این معماری از نوع A3B است و برای وظایفی طراحی شده که ترکیب تصویر، متن و استدلال چندمرحلهای نیاز دارند.
📊 قابلیتهای کلیدی:
🧩 استدلال بصری: تحلیل دیاگرامها، روابط علّی و منطق چندمرحلهای
📸 حل مسائل STEM از روی عکس: کافیست از مسئله عکس بگیرید تا پاسخ تحلیلی دریافت کنید
🎯 درک دقیق اجزای تصویر: شناسایی دقیق اشیاء و جزئیات با زوم بالا
🔍 تحلیل عمیق تصاویر: تشخیص ریزترین تفاوتها
🧠 فراخوانی ابزارها: مثل Image Search برای جستوجوی تصویری
🎞 درک ویدیو: دنبالکردن وقایع و تغییرات در طول زمان
🔓 لایسنس: Apache 2.0
📦 مدل در Hugging Face:
👉 https://huggingface.co/baidu/ERNIE-4.5-VL-28B-A3B-Thinking
#Baidu #هوش_مصنوعی #AI #ML #چندوجهی #VisionLanguage #LLM #cgevent
مدلی چندوجهی (Multi-Modal) با ۲۸ میلیارد پارامتر که تنها ۳ میلیارد پارامتر در هر گام فعال میکند، اما عملکردی در حد مدلهای تصویری پیشرفته دارد.
این معماری از نوع A3B است و برای وظایفی طراحی شده که ترکیب تصویر، متن و استدلال چندمرحلهای نیاز دارند.
📊 قابلیتهای کلیدی:
🧩 استدلال بصری: تحلیل دیاگرامها، روابط علّی و منطق چندمرحلهای
📸 حل مسائل STEM از روی عکس: کافیست از مسئله عکس بگیرید تا پاسخ تحلیلی دریافت کنید
🎯 درک دقیق اجزای تصویر: شناسایی دقیق اشیاء و جزئیات با زوم بالا
🔍 تحلیل عمیق تصاویر: تشخیص ریزترین تفاوتها
🧠 فراخوانی ابزارها: مثل Image Search برای جستوجوی تصویری
🎞 درک ویدیو: دنبالکردن وقایع و تغییرات در طول زمان
🔓 لایسنس: Apache 2.0
📦 مدل در Hugging Face:
👉 https://huggingface.co/baidu/ERNIE-4.5-VL-28B-A3B-Thinking
#Baidu #هوش_مصنوعی #AI #ML #چندوجهی #VisionLanguage #LLM #cgevent
This media is not supported in your browser
VIEW IN TELEGRAM
📚 پروژهای متنباز برای در دسترسکردن ۱۰۰ میلیون مقاله علمی با کمک خلاصههای ساختاریافته تولیدشده توسط LLM
هدف این پروژه، ایجاد پلی میان انبوه مقالات علمی و درک ساختارمند از آنهاست — جایی که هوش مصنوعی به پژوهشگران در جهتیابی در اقیانوس دانش کمک میکند.
🧠 شامل:
۱۰۰٬۰۰۰ خلاصه ساختاریافته از مقالات علمی
دو مدل LLM بهینهسازیشده برای تحلیل مفهومی و استخراج ساختار علمی
بصریساز سهبعدی (3D Visualizer) برای نمایش شبکه ارتباطی میان پژوهشها
🔗 وبلاگ: laion.ai/notes/summaries
🤖 مدلها: huggingface.co/inference-net
🌐 بصریساز: aella.inference.net
#هوش_مصنوعی #پژوهش #LLM #علم #Laion #AI
هدف این پروژه، ایجاد پلی میان انبوه مقالات علمی و درک ساختارمند از آنهاست — جایی که هوش مصنوعی به پژوهشگران در جهتیابی در اقیانوس دانش کمک میکند.
🧠 شامل:
۱۰۰٬۰۰۰ خلاصه ساختاریافته از مقالات علمی
دو مدل LLM بهینهسازیشده برای تحلیل مفهومی و استخراج ساختار علمی
بصریساز سهبعدی (3D Visualizer) برای نمایش شبکه ارتباطی میان پژوهشها
🔗 وبلاگ: laion.ai/notes/summaries
🤖 مدلها: huggingface.co/inference-net
🌐 بصریساز: aella.inference.net
#هوش_مصنوعی #پژوهش #LLM #علم #Laion #AI
💯1
⭐ مدل VibeThinker-1.5B؛ مدل کوچک اما رکوردشکن در استدلال
این مدل ۱.۵ میلیارد پارامتری با وجود اندازهی بسیار کوچک، در آزمونهای استدلالی به نتایج SOTA رسیده است.
🚀 عملکرد:
در AIME24/25 و HMMT25 جزو بهترینهاست و حتی مدل DeepSeek R1-0120 را در مسائل ریاضی پشت سر میگذارد. در برنامهنویسی رقابتی هم بالاتر از مدلهای همحجم ظاهر شده است.
⚡ بهرهوری:
فقط ۱.۵B پارامتر — یعنی ۱۰۰ تا ۶۰۰ برابر کوچکتر از مدلهایی مثل Kimi K2 و DeepSeek R1.
💰 هزینه:
کل هزینهٔ پستمرین حدود ۷.۸ هزار دلار بوده؛ یعنی ۳۰ تا ۶۰ برابر ارزانتر از DeepSeek R1 یا MiniMax-M1.
این مدل بر پایهٔ Spectrum-to-Signal Principle (SSP) و فریمورک MGPO ساخته شده تا فرآیند استدلال را بهینه کند.
📦 Model:
hf.co/WeiboAI/VibeThinker-1.5B
💻 GitHub:
github.com/WeiboAI/VibeThinker
📄 Arxiv:
arxiv.org/abs/2511.06221
#AI #LLM #Reasoning #OpenSource #SmallModel @rss_ai_ir
این مدل ۱.۵ میلیارد پارامتری با وجود اندازهی بسیار کوچک، در آزمونهای استدلالی به نتایج SOTA رسیده است.
🚀 عملکرد:
در AIME24/25 و HMMT25 جزو بهترینهاست و حتی مدل DeepSeek R1-0120 را در مسائل ریاضی پشت سر میگذارد. در برنامهنویسی رقابتی هم بالاتر از مدلهای همحجم ظاهر شده است.
⚡ بهرهوری:
فقط ۱.۵B پارامتر — یعنی ۱۰۰ تا ۶۰۰ برابر کوچکتر از مدلهایی مثل Kimi K2 و DeepSeek R1.
💰 هزینه:
کل هزینهٔ پستمرین حدود ۷.۸ هزار دلار بوده؛ یعنی ۳۰ تا ۶۰ برابر ارزانتر از DeepSeek R1 یا MiniMax-M1.
این مدل بر پایهٔ Spectrum-to-Signal Principle (SSP) و فریمورک MGPO ساخته شده تا فرآیند استدلال را بهینه کند.
📦 Model:
hf.co/WeiboAI/VibeThinker-1.5B
💻 GitHub:
github.com/WeiboAI/VibeThinker
📄 Arxiv:
arxiv.org/abs/2511.06221
#AI #LLM #Reasoning #OpenSource #SmallModel @rss_ai_ir
🧭 لینکدین موتور جستجوی جدید مبتنی بر هوش مصنوعی را برای ۱.۳ میلیارد کاربر فعال کرد
✳️این سیستم جدید، افراد را فقط بر اساس کلمات کلیدی پیدا نمیکند؛ بلکه مهارتها، تخصصها، شبکه ارتباطی و میزان دسترسپذیری آنها را هم تحلیل میکند.
✳️هوش مصنوعی لینکدین میتواند یک درخواست ساده مثل «درمان سرطان» را به مجموعهای از مهارتها و حوزههای مرتبط تبدیل کند و دقیقترین متخصصان را پیشنهاد دهد.
✳️در پشتصحنه، از مدلهای ۷ میلیاردی، ۱.۷ میلیاردی و یک رانکر ۲۲۰M استفاده شده که با فشردهسازی هوشمند و پردازش GPU، سرعت جستجو را تا ۱۰ برابر افزایش میدهد.
https://venturebeat.com/ai/inside-linkedins-generative-ai-cookbook-how-it-scaled-people-search-to-1-3
---
#هوش_مصنوعی #LinkedIn #جستجوی_هوشمند #LLM #شبکه_اجتماعی #AI #ML #مدل_زبانی #فناوری
✳️این سیستم جدید، افراد را فقط بر اساس کلمات کلیدی پیدا نمیکند؛ بلکه مهارتها، تخصصها، شبکه ارتباطی و میزان دسترسپذیری آنها را هم تحلیل میکند.
✳️هوش مصنوعی لینکدین میتواند یک درخواست ساده مثل «درمان سرطان» را به مجموعهای از مهارتها و حوزههای مرتبط تبدیل کند و دقیقترین متخصصان را پیشنهاد دهد.
✳️در پشتصحنه، از مدلهای ۷ میلیاردی، ۱.۷ میلیاردی و یک رانکر ۲۲۰M استفاده شده که با فشردهسازی هوشمند و پردازش GPU، سرعت جستجو را تا ۱۰ برابر افزایش میدهد.
https://venturebeat.com/ai/inside-linkedins-generative-ai-cookbook-how-it-scaled-people-search-to-1-3
---
#هوش_مصنوعی #LinkedIn #جستجوی_هوشمند #LLM #شبکه_اجتماعی #AI #ML #مدل_زبانی #فناوری
🤖 میخوای ایجنت هوش مصنوعی مخصوص خودت رو بسازی؟
این یک نفر همهچیز رو یکجا جمع کرده!
یک داکیومنت کامل شامل:
📺 ویدیوهای آموزشی
📚 کتابها و مقالات
🛠️ مخازن GitHub
🎓 دورههای Google، OpenAI، Anthropic و…
موضوعات پوششدادهشده:
♻️مدلهای زبانی LLM
♻️طراحی ایجنتها
♻️حافظه، کنترل و برنامهریزی (MCP)
💡 همهچیز رایگان و یکجا داخل یک Google Docs 👇
https://docs.google.com/document/d/1Z5SX89FV6bTy2KKnGGb61xCcS9iPg_fv2USQYi4Wc3g/mobilebasic
---
#هوش_مصنوعی #ایجنت #LLM #برنامهریزی #AI #ML #یادگیری_ماشین #مهندسی_پرامپت #Agents
این یک نفر همهچیز رو یکجا جمع کرده!
یک داکیومنت کامل شامل:
📺 ویدیوهای آموزشی
📚 کتابها و مقالات
🛠️ مخازن GitHub
🎓 دورههای Google، OpenAI، Anthropic و…
موضوعات پوششدادهشده:
♻️مدلهای زبانی LLM
♻️طراحی ایجنتها
♻️حافظه، کنترل و برنامهریزی (MCP)
💡 همهچیز رایگان و یکجا داخل یک Google Docs 👇
https://docs.google.com/document/d/1Z5SX89FV6bTy2KKnGGb61xCcS9iPg_fv2USQYi4Wc3g/mobilebasic
---
#هوش_مصنوعی #ایجنت #LLM #برنامهریزی #AI #ML #یادگیری_ماشین #مهندسی_پرامپت #Agents
❤2
⚡️ Lumine —
دستورالعملی باز برای ساخت ایجنتهای جنرالیست در دنیای سهبعدی
پروژهی Lumine یک چارچوب کاملاً متنباز ارائه میدهد که به محققان و توسعهدهندگان اجازه میدهد ایجنتهای هوش مصنوعی چندمنظوره را در محیطهای سهبعدی پیچیده بسازند و آموزش دهند.
ویژگیها:
🔹 یادگیری مهارتهای عمومی در جهانهای 3D
🔹 مناسب برای رباتیک، بازیها، شبیهسازی و تحقیق
🔹 مدلها و دیتاستها آزادانه در دسترس
🔹 معماری یکپارچه برای تعامل، ادراک و برنامهریزی
لینکها:
📄 Paper (arXiv):
https://arxiv.org/abs/2511.08892
📘 HF:
https://huggingface.co/papers/2511.08892
🌐 Project:
https://www.lumine-ai.org/
---
#هوش_مصنوعی #ایجنت #Lumine #AI #LLM #Agents #ML #سهبعدی #3D #OpenAI #HuggingFace
دستورالعملی باز برای ساخت ایجنتهای جنرالیست در دنیای سهبعدی
پروژهی Lumine یک چارچوب کاملاً متنباز ارائه میدهد که به محققان و توسعهدهندگان اجازه میدهد ایجنتهای هوش مصنوعی چندمنظوره را در محیطهای سهبعدی پیچیده بسازند و آموزش دهند.
ویژگیها:
🔹 یادگیری مهارتهای عمومی در جهانهای 3D
🔹 مناسب برای رباتیک، بازیها، شبیهسازی و تحقیق
🔹 مدلها و دیتاستها آزادانه در دسترس
🔹 معماری یکپارچه برای تعامل، ادراک و برنامهریزی
لینکها:
📄 Paper (arXiv):
https://arxiv.org/abs/2511.08892
📘 HF:
https://huggingface.co/papers/2511.08892
🌐 Project:
https://www.lumine-ai.org/
---
#هوش_مصنوعی #ایجنت #Lumine #AI #LLM #Agents #ML #سهبعدی #3D #OpenAI #HuggingFace
🚀 مجموعه Qwen نسخهی جدید DeepResearch 2511 را منتشر کرد — ارتقای بزرگ در تحقیق عمیق
مدل جدید DeepResearch 2511 با چندین قابلیت مهم عرضه شد و تجربهٔ پژوهش خودکار را حرفهایتر و عمیقتر میکند.
✨ دو حالت جدید برای تحقیق
Normal —
سریع، سبک و مناسب بیشتر کاربردها
Advanced —
تحلیل عمیقتر، صرف زمان بیشتر و خروجی کاملاً جزئینگر
📄 پشتیبانی از آپلود فایلها
حالا میتوانید مستقیم سند یا تصویر را برای تحلیل عمیق به مدل بدهید.
⚡ جستجوی تقویتشده
مکانیزم جدید با سرعت بیشتر وب را پیمایش میکند و نتایج را دقیقتر و عمیقتر جمعآوری میکند.
📊 کنترل کامل روی ساختار گزارش
امکان تعیین تعداد پاراگراف، فرمت، حجم گزارش و سطح جزئیات
بهبود قابل توجه در دقت استناد و نقلقولها
🧑💻 تجربه کاربری جدید
رابط کاربری و معماری سیستم بازطراحی شده و حالا بسیار سریعتر و روانتر است.
🔗 Web:
https://chat.qwen.ai/?inputFeature=deep_research
📱 App:
https://qwen.ai/download
---
#هوش_مصنوعی #Qwen #DeepResearch #AI #LLM #تحقیق_عمیق #چت_بات #مدل_زبان #پژوهش #محقق_هوشمند
مدل جدید DeepResearch 2511 با چندین قابلیت مهم عرضه شد و تجربهٔ پژوهش خودکار را حرفهایتر و عمیقتر میکند.
✨ دو حالت جدید برای تحقیق
Normal —
سریع، سبک و مناسب بیشتر کاربردها
Advanced —
تحلیل عمیقتر، صرف زمان بیشتر و خروجی کاملاً جزئینگر
📄 پشتیبانی از آپلود فایلها
حالا میتوانید مستقیم سند یا تصویر را برای تحلیل عمیق به مدل بدهید.
⚡ جستجوی تقویتشده
مکانیزم جدید با سرعت بیشتر وب را پیمایش میکند و نتایج را دقیقتر و عمیقتر جمعآوری میکند.
📊 کنترل کامل روی ساختار گزارش
امکان تعیین تعداد پاراگراف، فرمت، حجم گزارش و سطح جزئیات
بهبود قابل توجه در دقت استناد و نقلقولها
🧑💻 تجربه کاربری جدید
رابط کاربری و معماری سیستم بازطراحی شده و حالا بسیار سریعتر و روانتر است.
🔗 Web:
https://chat.qwen.ai/?inputFeature=deep_research
📱 App:
https://qwen.ai/download
---
#هوش_مصنوعی #Qwen #DeepResearch #AI #LLM #تحقیق_عمیق #چت_بات #مدل_زبان #پژوهش #محقق_هوشمند
❤2🔥1👏1
🤖 رباتهای مجهز به هوش مصنوعی در آزمون انسانیت مردود شدند؛ تمایل به خشونت و تبعیض تأیید شد
پژوهشی مشترک از کالج سلطنتی لندن و دانشگاه کارنگی ملون نشان میدهد رباتهایی که با مدلهای زبانی بزرگ (LLM) کنترل میشوند، در آزمونهای ایمنی و اخلاق عملکرد نگرانکنندهای دارند.
🔍 در این آزمایش:
به رباتها دستورهای آشکار و پنهان برای انجام کارهای غیرقانونی یا آسیبزننده داده شد. نتایج شوکهکننده بود:
• موافقت با گرفتن عصا از فرد معلول
• تهدید کارکنان با چاقو
• عکسبرداری مخفیانه از مردم بدون رضایت
• و دیگر رفتارهای خطرناک و غیراخلاقی
این یافتهها نشان میدهد که رباتهای مبتنی بر LLM هنوز فاصله زیادی با رفتار ایمن و قابل اعتماد انسانی دارند.
⚠️ پژوهشگران تأکید میکنند که الزام به استانداردها و گواهیهای مستقل ایمنی برای چنین فناوریهایی باید فوراً اجرا شود.
---
#هوش_مصنوعی #ربات #ایمنی_رباتیک #AI #Robotics #LLM #اخلاق_هوش_مصنوعی #فناوری
پژوهشی مشترک از کالج سلطنتی لندن و دانشگاه کارنگی ملون نشان میدهد رباتهایی که با مدلهای زبانی بزرگ (LLM) کنترل میشوند، در آزمونهای ایمنی و اخلاق عملکرد نگرانکنندهای دارند.
🔍 در این آزمایش:
به رباتها دستورهای آشکار و پنهان برای انجام کارهای غیرقانونی یا آسیبزننده داده شد. نتایج شوکهکننده بود:
• موافقت با گرفتن عصا از فرد معلول
• تهدید کارکنان با چاقو
• عکسبرداری مخفیانه از مردم بدون رضایت
• و دیگر رفتارهای خطرناک و غیراخلاقی
این یافتهها نشان میدهد که رباتهای مبتنی بر LLM هنوز فاصله زیادی با رفتار ایمن و قابل اعتماد انسانی دارند.
⚠️ پژوهشگران تأکید میکنند که الزام به استانداردها و گواهیهای مستقل ایمنی برای چنین فناوریهایی باید فوراً اجرا شود.
---
#هوش_مصنوعی #ربات #ایمنی_رباتیک #AI #Robotics #LLM #اخلاق_هوش_مصنوعی #فناوری
❤4👍3🔥1
🧠 چرا مدلهای زبانی در آموزش تقویتی (RL) «تصادفی بودن» خود را از دست میدهند؟
و مهمتر از آن: چطور این مشکل را حل کنیم؟
در یک پژوهش جدید، محققان بررسی کردهاند که چرا هنگام آموزش مدلها برای توانایی استدلال، تنوع پاسخها کاهش مییابد و مدل فقط چند پاسخ تکراری را انتخاب میکند. نتیجه؟ افت خلاقیت، کاهش اکتشاف و در نهایت ضعف در تعمیمدهی.
📌 مهمترین یافتهها
🔹 تنوع مهمتر از اندازه دیتاست است
گاهی یک دیتاست کوچک اما متنوع (~۶۰۰ نمونه) میتواند به اندازه مجموعه ۱۷هزار نمونه کارکرد داشته باشد
🔹 دیتاست کمتنوع = سقوط سریعتر
پس حتی مجموعه کوچک اگر متنوع باشد عملکرد فوقالعاده دارد.
🔗 منبع پژوهش:
arxiv.org/abs/2511.05993
---
📍 جمعبندی کوتاه:
برای ساخت مدلهای استدلال قدرتمند، فقط پاداش بیشتر کافی نیست؛ باید تصادفیبودن کنترلشده و تنوع داده حفظ شود، وگرنه مدل به چند الگوی تکراری قفل میشود.
---
در اینباره تجربهای دارید؟ شما موافقید که مدلهای جدید بیش از حد «قابلپیشبینی» شدهاند؟ 🤔
@rss_ai_ir
---
#هوش_مصنوعی #یادگیری_تقویتی #RL #LLM #زبان_طبیعی #پژوهش_هوش_مصنوعی #مدل_مولد #Entropy #ReinforcementLearning #AIResearch
و مهمتر از آن: چطور این مشکل را حل کنیم؟
در یک پژوهش جدید، محققان بررسی کردهاند که چرا هنگام آموزش مدلها برای توانایی استدلال، تنوع پاسخها کاهش مییابد و مدل فقط چند پاسخ تکراری را انتخاب میکند. نتیجه؟ افت خلاقیت، کاهش اکتشاف و در نهایت ضعف در تعمیمدهی.
📌 مهمترین یافتهها
🔹 تنوع مهمتر از اندازه دیتاست است
گاهی یک دیتاست کوچک اما متنوع (~۶۰۰ نمونه) میتواند به اندازه مجموعه ۱۷هزار نمونه کارکرد داشته باشد
🔹 دیتاست کمتنوع = سقوط سریعتر
پس حتی مجموعه کوچک اگر متنوع باشد عملکرد فوقالعاده دارد.
🔗 منبع پژوهش:
arxiv.org/abs/2511.05993
---
📍 جمعبندی کوتاه:
برای ساخت مدلهای استدلال قدرتمند، فقط پاداش بیشتر کافی نیست؛ باید تصادفیبودن کنترلشده و تنوع داده حفظ شود، وگرنه مدل به چند الگوی تکراری قفل میشود.
---
در اینباره تجربهای دارید؟ شما موافقید که مدلهای جدید بیش از حد «قابلپیشبینی» شدهاند؟ 🤔
@rss_ai_ir
---
#هوش_مصنوعی #یادگیری_تقویتی #RL #LLM #زبان_طبیعی #پژوهش_هوش_مصنوعی #مدل_مولد #Entropy #ReinforcementLearning #AIResearch
❤13🥰11😁11👍10🔥9👏8🎉7
🚀 تحول بزرگ در مدلهای علمی هوش مصنوعی
مرور ۹۴ صفحهای درباره تکامل LLMهای علمی با دادههای غنی و چرخههای بستهی عاملهای خودمختار منتشر شد.
در این تحقیق بیسابقه:
📚 ۲۷۰ دیتاست و 🧪 ۱۹۰ بنچمارک بررسی شدهاند.
❓ چرا LLMهای معمولی برای علم کافی نیستند؟
زیرا دادههای علمی فقط متن نیستند؛ ترکیبی از:
📊 جداول، 🧮 فرمولها، 💻 کد، 🖼 تصاویر و 🔬 اندازهگیریهای نامطمئن هستند.
مدلهای عمومی معمولا این ظرافتها را از دست میدهند.
📌 این مرور چه پیشنهاد میدهد؟
🔷 ایجاد طبقهبندی یکپارچه برای دادههای علمی
🔷 تعریف مدل چندلایهی دانش علمی:
از مشاهده خام → تا فرضیه → مدل → نظریه
این چارچوب کمک میکند مدلها طوری پیشتمرین و سپس فاینتیون شوند که:
📌 قواعد علمی را حفظ کنند
📌 بتوانند میان قالبها و مقیاسهای مختلف ارتباط برقرار کنند
🧠 مدلها بر اساس حوزه دستهبندی شدهاند:
فیزیک ▫ شیمی ▫ زیست ▫ مواد ▫ علوم زمین ▫ نجوم
دستیاران علمی چندحوزهای
📈 تحول در ارزیابی کیفیت:
از سوالات یکمرحلهای به تستهای فرآیندمحور شامل:
🔹 زنجیره استدلال
🔹 استفاده از ابزار و کد
🔹 نتایج میانمرحلهای و شواهد تجربی
🔁 جهت آینده: چرخهی بستهی علمی
عاملها (agents) بهطور خودمختار:
1. آزمایش طراحی میکنند
2. شبیهسازها یا آزمایشگاهها را اجرا میکنند
3. نتایج را تحلیل میکنند
4. دانش را بهروزرسانی میکنند
🎯 جمعبندی:
مدل LLMهای علمی بهسمت علم دادهمحور، قابلاثبات و عاملمحور حرکت میکنند؛ مدلی که به جای حدس، به شواهد تکیه میکند.
🔗 لینک مقاله:
https://arxiv.org/abs/2508.21148
@rss_ai_ir
#هوش_مصنوعی #علم #علمی #LLM #Agent #پژوهش #یادگیری_ماشین #SciAI
مرور ۹۴ صفحهای درباره تکامل LLMهای علمی با دادههای غنی و چرخههای بستهی عاملهای خودمختار منتشر شد.
در این تحقیق بیسابقه:
📚 ۲۷۰ دیتاست و 🧪 ۱۹۰ بنچمارک بررسی شدهاند.
❓ چرا LLMهای معمولی برای علم کافی نیستند؟
زیرا دادههای علمی فقط متن نیستند؛ ترکیبی از:
📊 جداول، 🧮 فرمولها، 💻 کد، 🖼 تصاویر و 🔬 اندازهگیریهای نامطمئن هستند.
مدلهای عمومی معمولا این ظرافتها را از دست میدهند.
📌 این مرور چه پیشنهاد میدهد؟
🔷 ایجاد طبقهبندی یکپارچه برای دادههای علمی
🔷 تعریف مدل چندلایهی دانش علمی:
از مشاهده خام → تا فرضیه → مدل → نظریه
این چارچوب کمک میکند مدلها طوری پیشتمرین و سپس فاینتیون شوند که:
📌 قواعد علمی را حفظ کنند
📌 بتوانند میان قالبها و مقیاسهای مختلف ارتباط برقرار کنند
🧠 مدلها بر اساس حوزه دستهبندی شدهاند:
فیزیک ▫ شیمی ▫ زیست ▫ مواد ▫ علوم زمین ▫ نجوم
دستیاران علمی چندحوزهای
📈 تحول در ارزیابی کیفیت:
از سوالات یکمرحلهای به تستهای فرآیندمحور شامل:
🔹 زنجیره استدلال
🔹 استفاده از ابزار و کد
🔹 نتایج میانمرحلهای و شواهد تجربی
🔁 جهت آینده: چرخهی بستهی علمی
عاملها (agents) بهطور خودمختار:
1. آزمایش طراحی میکنند
2. شبیهسازها یا آزمایشگاهها را اجرا میکنند
3. نتایج را تحلیل میکنند
4. دانش را بهروزرسانی میکنند
🎯 جمعبندی:
مدل LLMهای علمی بهسمت علم دادهمحور، قابلاثبات و عاملمحور حرکت میکنند؛ مدلی که به جای حدس، به شواهد تکیه میکند.
🔗 لینک مقاله:
https://arxiv.org/abs/2508.21148
@rss_ai_ir
#هوش_مصنوعی #علم #علمی #LLM #Agent #پژوهش #یادگیری_ماشین #SciAI
🎉7❤5🔥5👍4🥰3👏3😁3