VIRSUN
15.6K subscribers
362 photos
217 videos
2 files
223 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🔹 کانال توسط اساتید هوش مصنوعی مدیریت میشود
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
☀️مدل Surya: مدل‌های بنیادین هوش مصنوعی برای هلیوفیزیک و پیش‌بینی اثرات خورشید بر زمین و فضا

ناسا و IBM مدل Surya Heliophysics Foundational Model را به‌صورت اپن‌سورس منتشر کردند؛ مدلی عظیم‌مقیاس که با داده‌های ۹ سال رصد ماهواره Solar Dynamics Observatory (SDO) آموزش دیده است.

---

🟢 چرا مهم است؟
طوفان‌های خورشیدی می‌توانند زندگی ما را تحت‌تأثیر قرار دهند:
🛰 از کار انداختن ماهواره‌ها
✈️ اختلال در ناوبری هواپیماها
⚡️ ایجاد نوسان و قطعی برق
👨‍🚀 افزایش تهدیدهای پرتو برای فضانوردان

---

🟠 ویژگی‌های کلیدی Surya

✳️ آموزش‌دیده روی داده‌های ۱۴ ساله خورشید
✳️ توانایی پیش‌بینی فوران‌های خورشیدی ۲ ساعت قبل از وقوع
✳️ مشخص‌کردن دقیق محل انفجار روی سطح خورشید
✳️ کمک به آمادگی صنایع هواپیمایی، انرژی و مخابرات در برابر اختلال‌ها

---

🚀 ناسا و IBM دهه‌ها روی مدل‌های اقلیم و پیش‌بینی آب‌وهوا روی زمین کار کردند؛ حالا وارد مرحله‌ی جدیدی از «پیش‌بینی آب‌وهوای فضایی» شده‌اند.

🔗 [HuggingFace](https://huggingface.co/nasa-ibm-ai4science)
🔗 [مدل‌ها](https://huggingface.co/nasa-ibm-ai4science/models)
🔗 [داده‌ها](https://huggingface.co/nasa-ibm-ai4science/datasets)

@rss_ai_ir

#هوش_مصنوعی #ناسا #IBM #هلیوفیزیک #آب_و_هوای_فضایی #AI4Science 🌌
15👍11🎉11👏10🥰7😁7🔥6
This media is not supported in your browser
VIEW IN TELEGRAM
🔹 صنعت ۵.۰ چیست؟

صنعت ۵.۰ نسل جدید تحول صنعتی است که پس از صنعت ۴.۰ مطرح شده است.
در حالی‌که صنعت ۴.۰ تمرکز خود را بر اتوماسیون، اینترنت اشیا، داده‌های بزرگ و هوش مصنوعی قرار داده بود، در صنعت ۵.۰ محور اصلی همکاری انسان و ماشین است.

---

⚙️ ویژگی‌های کلیدی صنعت ۵.۰:

1. 🤝 هم‌افزایی انسان و ربات – ربات‌ها و هوش مصنوعی کارهای تکراری و سنگین را انجام می‌دهند و انسان‌ها بر خلاقیت و نوآوری تمرکز می‌کنند.
2. 🌍 پایداری و سبز بودن – توجه ویژه به انرژی‌های تجدیدپذیر، کاهش ضایعات و تولید پایدار.
3. 👨‍🏭 شخصی‌سازی تولید – ساخت محصولات مطابق با نیاز و سلیقه هر فرد.
4. 🛡 تمرکز بر رفاه انسانی – بهبود کیفیت زندگی و شرایط کاری کارکنان در کنار بهره‌وری.
5. 📡 فناوری‌های کلیدی – ترکیب هوش مصنوعی، رباتیک پیشرفته، اینترنت صنعتی اشیا، واقعیت افزوده/مجازی و تحلیل داده‌های پیشرفته.

---

🚀 تفاوت اصلی صنعت ۴.۰ و ۵.۰:

✳️ صنعت ۴.۰: تمرکز بر اتوماسیون کامل و دیجیتالی‌سازی کارخانه‌ها.
✳️ صنعت ۵.۰: تمرکز بر ترکیب توان ماشین‌ها با خلاقیت و هوش انسانی.

---

به زبان ساده:
صنعت ۴.۰ به‌دنبال کارخانه‌های هوشمند بود، اما صنعت ۵.۰ به‌دنبال کارخانه‌های انسان‌محور و پایدار است.

@rss_ai_ir

#صنعت۵_۰ #کارخانه_هوشمند #هوش_مصنوعی #رباتیک
🥰1513😁11👍8🔥6👏6🎉4
Media is too big
VIEW IN TELEGRAM
🤖 در مسابقات جهانی ربات‌های انسان‌نما، تیم Unitree در رقابت ۱۰۰ متر با مانع موفق شد هر سه مدال را از آن خود کند! 🥇🥈🥉

🔥 این موفقیت نشان‌دهنده‌ی سرعت بالای پیشرفت ربات‌های نسل جدید در تحرک و چابکی است.

@rss_ai_ir

#رباتیک #هوش_مصنوعی #Unitree #روبات #AI
😁13👍9🎉87👏7🔥6🥰5
📈 حباب یا تحول واقعی؟

🔹 سم آلتمن، مدیرعامل OpenAI، به‌تازگی گفت ممکنه هوش مصنوعی هم درگیر یک حباب سرمایه‌گذاری شده باشه — درست مثل دات‌کام‌های دهه ۹۰ میلادی. اون زمان بورس نزدک در کمتر از دو سال تقریباً ۸۰٪ سقوط کرد و خیلی از شرکت‌ها هیچ‌وقت به سوددهی نرسیدن.

🧩 به گفته آلتمن:
«حباب وقتی شکل می‌گیره که آدم‌های باهوش بیش‌ازحد مجذوب یک ایده خوب می‌شن. آیا الان در فاز هیجان‌زدگی بیش‌ازحد نسبت به AI هستیم؟ به‌نظرم بله. اما آیا AI همچنان بزرگ‌ترین اتفاق تاریخ معاصر به حساب میاد؟ به‌نظرم باز هم بله.»

📊 طبق گزارش تورستن اسلوک (اقتصاددان مشهور وال‌استریت)، اگر واقعا حبابی باشه، همین حالا هم از حباب اینترنتی بزرگ‌تره. نسبت قیمت به سود مورد انتظار (Forward P/E) برای ۱۰ شرکت برتر AI امروز خیلی بالاتره از اوج دات‌کام‌ها. (نمودار بالا)

🤔 حالا سؤال: اگر واقعا در دل یک حبابیم، کدوم استارتاپ‌ها می‌تونن بعد از ترکیدن حباب هم زنده بمونن؟

@rss_ai_ir

#هوش_مصنوعی #اقتصاد #استارتاپ #سرمایه‌گذاری #بازارهای_مالی
🔥9👍7👏76🥰5🎉5😁2
🧠 یک نکته مهم در شبکه‌های عصبی گرافی (GNN)

در GNNها، یکی از چالش‌های اساسی پدیده‌ی over-smoothing است. یعنی وقتی تعداد لایه‌ها زیاد می‌شود، بردارهای ویژگی نودها به مرور شبیه هم می‌شوند و گراف اطلاعات تمایزی خود را از دست می‌دهد.

🔹 چرا این اتفاق می‌افتد؟
چون در هر لایه، گره‌ها ویژگی‌های همسایه‌هایشان را جمع می‌کنند. اگر این کار چندین بار تکرار شود، همه گره‌ها به سمت یک نمایش یکنواخت همگرا می‌شوند.

🔹 راهکارها:

1. استفاده از residual connections یا skip connections برای حفظ اطلاعات اولیه.


2. به‌کارگیری attention mechanisms (مثل GAT) تا وزن همسایه‌ها یکسان نباشد.


3. محدود کردن عمق شبکه و استفاده از shallow GNN همراه با تکنیک‌های regularization.


4. استفاده از روش‌های جدید مثل GraphSAGE یا Jumping Knowledge Networks.



📌 پس اگر دیدید مدلتان با افزایش لایه‌ها به جای بهبود، دچار افت عملکرد می‌شود، احتمالاً با over-smoothing طرف هستید.

@rss_ai_ir

#هوش_مصنوعی #شبکه_عصبی #GraphNeuralNetwork #یادگیری_عمیق
🥰7😁7🎉75👍5👏5🔥3
📌 ۲۰ مفهوم کلیدی برای درک AI Agents

اگر می‌خواهید بهتر بفهمید ایجنت‌های هوش مصنوعی چطور عمل می‌کنند، این ۲۰ مفهوم پایه‌ای ضروری‌اند:

1️⃣ Agent: موجود خودمختار که ادراک می‌کند، تصمیم می‌گیرد و عمل می‌کند.
2️⃣ Environment: محیط یا کانتکستی که ایجنت در آن کار می‌کند.
3️⃣ Perception: دریافت و تفسیر داده‌های محیطی.
4️⃣ State: وضعیت یا نمای داخلی فعلی ایجنت از جهان.
5️⃣ Memory: ذخیره اطلاعات برای یادگیری و تداوم.
6️⃣ Large Language Models: مدل‌های زبانی قدرتمند (مثل GPT، PaLM) برای فهم و تولید زبان.
7️⃣ Reflex Agent: ایجنت واکنشی که بر اساس قوانین شرط-عمل کار می‌کند.
8️⃣ Knowledge Base: پایگاه داده ساختاریافته یا غیرساختاریافته برای تصمیم‌گیری.
9️⃣ Chain of Thought (CoT): روش استدلال مرحله به مرحله.
🔟 ReAct: چارچوبی که استدلال و عمل را ترکیب می‌کند.
1️⃣1️⃣ Tools: ابزارها یا APIها برای افزایش توانایی ایجنت.
1️⃣2️⃣ Action: هر کار یا رفتاری که ایجنت انجام می‌دهد.
1️⃣3️⃣ Planning: طراحی دنباله‌ای از اقدامات برای رسیدن به هدف.
1️⃣4️⃣ Orchestration: هماهنگی بین چند مرحله، ابزار یا ایجنت.
1️⃣5️⃣ Handoffs: انتقال وظایف بین ایجنت‌ها.
1️⃣6️⃣ Multi-Agent System: همکاری چند ایجنت در یک محیط مشترک.
1️⃣7️⃣ Swarm: رفتار هوشمند جمعی بدون مرکز کنترل.
1️⃣8️⃣ Agent Debate: بحث و جدل بین ایجنت‌ها برای رسیدن به پاسخ بهتر.
1️⃣9️⃣ Evaluation: سنجش عملکرد ایجنت.
2️⃣0️⃣ Learning Loop: چرخه یادگیری پیوسته از بازخوردها.

🧩 این مفاهیم پایه درک شما از ایجنت‌های هوشمند نسل جدید را کامل می‌کند و نشان می‌دهد چطور سیستم‌های هوش مصنوعی می‌توانند یاد بگیرند، همکاری کنند و تصمیم بگیرند.

@rss_ai_ir

#هوش_مصنوعی #AI_Agent #یادگیری_عمیق #شبکه_عصبی
7👏6😁6🎉6🔥4🥰4👍3
This media is not supported in your browser
VIEW IN TELEGRAM
📌 دامنه‌برداری (Domain Adaptation) در یادگیری ماشین

یکی از چالش‌های اصلی در هوش مصنوعی اینه که مدلی که روی یک دامنه (Domain) آموزش دیده، معمولاً روی دامنه‌های دیگه عملکرد خوبی نداره. به این مشکل می‌گن Domain Shift.

✦ مثلا:
🔹 مدلی که برای تشخیص عیب روی کاتدهای مس در یک کارخانه آموزش دیده، وقتی روی تصاویر کارخانه دیگه استفاده میشه (با نور، زاویه دوربین یا کیفیت متفاوت)، دچار افت دقت میشه.

اینجا Domain Adaptation وارد میشه 👇

🎯 تعریف:

فرآیندی که در اون یک مدل آموزش‌دیده روی دامنه مبدأ (Source Domain)، برای عملکرد بهتر روی دامنه مقصد (Target Domain) تطبیق داده میشه، بدون نیاز به برچسب‌گذاری گسترده روی داده‌های مقصد.

🔑 رویکردهای اصلی:

1. Feature Alignment

تطبیق توزیع ویژگی‌های مبدأ و مقصد با تکنیک‌هایی مثل MMD (Maximum Mean Discrepancy) یا CORAL.



2. Adversarial Learning

استفاده از شبکه‌های خصمانه (GAN) برای یادگیری نمایش مشترک بین دو دامنه.



3. Self-Training / Pseudo-Labeling

مدل روی داده مقصد پیش‌بینی می‌کنه و برچسب‌های احتمالی به‌صورت شبه‌برچسب برای یادگیری دوباره استفاده میشه.



4. Domain-Invariant Features

یادگیری ویژگی‌هایی که به دامنه وابسته نیستن و در هر دو محیط پایدار عمل می‌کنن.




🏭 کاربردهای صنعتی:

♻️پردازش تصویر: تشخیص عیب در خطوط تولید مختلف.
♻️پزشکی: مدلی که روی داده‌های MRI یک دستگاه آموزش دیده، روی دستگاه دیگه هم کار کنه.
♻️خودروهای خودران: انتقال یادگیری از شبیه‌ساز به دنیای واقعی.


خلاصه:
عبارت Domain Adaptation یعنی مدل رو طوری آموزش بدیم که انعطاف‌پذیر بشه و در محیط‌های جدید هم جواب بده، بدون اینکه لازم باشه از صفر دوباره داده‌گذاری کنیم.

@rss_ai_ir

#DomainAdaptation #MachineLearning #TransferLearning #هوش_مصنوعی
👍11🥰8😁76🔥6🎉5👏3
Media is too big
VIEW IN TELEGRAM
🏁 مسابقه‌ی ۱۰۰ متر، مهم‌ترین رویداد در مسابقات جهانی ربات‌های انسان‌نما بود.

🤖 ربات Tiangong در خط پایان سوم شد، اما چون به‌صورت کاملاً خودمختار (Autonomous) عمل می‌کرد، ضریب ۰.۸ روی زمانش اعمال شد و در نهایت مدال طلا 🥇 گرفت.

در مقابل، ربات Unitree که با کنترل از راه دور تنها ۲۲.۰۸ ثانیه دوید و اول به خط رسید، مدال نقره 🥈 را به‌دست آورد.

🔬 ربات Tiangong توسط یک مرکز نوآوری دولتی در پکن توسعه داده شده است.

@rss_ai_ir
🔥1👏1🙏1
در یک لایه کانولوشن (Convolutional Layer) در CNN، استفاده از فیلترهای کوچک‌تر (مثل 3×3 به جای 7×7) چه مزیت اصلی دارد؟
Anonymous Quiz
0%
کاهش Overfitting از طریق Dropout خودکار
39%
افزایش تعداد پارامترها و دقت شبکه.
56%
کاهش تعداد پارامترها و افزایش عمق شبکه برای استخراج ویژگی‌های پیچیده‌تر
6%
حذف نیاز به لایه Pooling.
👍1🔥1👏1
🔑 قانون «توقف روی صفر ممنوع»

در پروژه‌های هوش مصنوعی و رباتیک، خیلی وقت‌ها نتیجه‌ی نهایی اون چیزی نیست که انتظار داریم. مثلا:

♻️مدلی که فقط ۵۰٪ دقت داره.
♻️رباتی که تا نیمه‌ی مسیر می‌ره ولی نمی‌تونه کامل برگرده.
♻️الگوریتمی که سرعتش پایینه اما همچنان از حد تصادف بهتره.


اینجا اصل مهم اینه که هیچ‌وقت روی صفر توقف نکنیم. یعنی حتی اگر به هدف کامل نرسیدیم، همون پیشرفت کوچک یک دارایی ارزشمند محسوب میشه.

مدلی که از ۰ به ۵۰٪ دقت رسیده، پایه‌ای برای رسیدن به ۹۰٪ه.
رباتی که نیمه‌ی مسیر رو طی کرده، داده و تجربه‌ی واقعی برای بهبود کنترل ایجاد کرده.
شکست‌ها فقط زمانی بی‌ارزش میشن که روی صفر متوقف بشیم.

پس در علم و صنعت، اصل «توقف روی صفر ممنوع» یعنی: هر حرکت غیر صفر، یک گام به جلوست 🚀

@rss_ai_ir 🪙 | اصل رشد تدریجی
👍3🔥1👏1
🚀 متا با هوش مصنوعی، زبان ویدئوها را حذف می‌کند!

این هفته، شرکت متا (مالک اینستاگرام و فیسبوک) از یک قابلیت جدید و شگفت‌انگیز رونمایی کرد که می‌تواند نحوه تعامل ما با محتوای ویدئویی را برای همیشه تغییر دهد: ترجمه و دوبله صوتی آنی با هوش مصنوعی!

این قابلیت دقیقاً چه کاری انجام می‌دهد؟

تصور کنید در حال تماشای یک ویدئوی آموزشی به زبان ژاپنی یا یک استندآپ کمدی به زبان آلمانی در اینستاگرام هستید. با این قابلیت جدید:

۱. ترجمه خودکار: هوش مصنوعی متا به صورت خودکار صدای اصلی ویدئو را به زبان شما (مثلاً فارسی) ترجمه می‌کند.
۲. تولید صدای جدید: سپس، یک صدای جدید با زبان ترجمه‌شده تولید می‌کند که جایگزین صدای اصلی می‌شود.
۳. هماهنگ‌سازی لب (Lip-sync): بخش جالب ماجرا اینجاست! هوش مصنوعی به صورت اختیاری می‌تواند حرکات لب گوینده را طوری تغییر دهد که با صدای دوبله‌شده هماهنگ به نظر برسد. انگار که آن شخص از ابتدا به زبان شما صحبت می‌کرده است!

چرا این خبر اینقدر مهم است؟

✳️ شکستن barreiras زبانی: این بزرگترین مانع برای تولیدکنندگان محتوا و مخاطبان در سراسر جهان است. با این فناوری، محتوای شما می‌تواند بدون هیچ زحمتی به یک مخاطب جهانی دست پیدا کند.
✳️ افزایش دسترسی‌پذیری: افرادی که با زبان‌های دیگر مشکل دارند یا کم‌شنوا هستند، می‌توانند از محتوای بیشتری بهره‌مند شوند.
✳️ نمایش قدرت هوش مصنوعی مولد: این یک مثال عملی و فوق‌العاده از قدرت هوش مصنوعی مولد (Generative AI) در دنیای واقعی است که فراتر از تولید متن و عکس رفته و وارد حوزه صدا و ویدئو شده است.

⛔️ نگرانی‌ها و چالش‌ها

البته این فناوری چالش‌های خود را نیز دارد؛ از جمله احتمال ساخت ویدئوهای جعلی (Deepfake) و نگرانی در مورد حفظ اصالت و لحن اصلی گوینده. متا اعلام کرده که برای جلوگیری از سوءاستفاده، راهکارهایی را در نظر گرفته است.

نتیجه‌گیری:
این گام بزرگ متا نشان می‌دهد که آینده محتوا، جهانی و بدون مرزهای زبانی خواهد بود. به زودی، تماشای هر ویدئویی از هر کجای دنیا به زبان مادری خودمان، به یک امر عادی تبدیل خواهد شد.

#خبر_هوش_مصنوعی #متا #اینستاگرام #فیسبوک #ترجمه_صوتی #دوبله_هوشمند #هوش_مصنوعی_مولد #فناوری #آینده_محتوا #AI_News #Meta #LipSync
👍2🔥2👏1
🏆 سرویس تازه مبتنی بر هوش مصنوعی برای صعود سایت به رتبه‌های برتر یاندکس

سرویس Seopapa با تکیه بر تحلیل و بهینه‌سازی عوامل رفتاری کاربران، امکان ارتقای جایگاه سایت شما در نتایج جستجوی یاندکس را فراهم می‌کند. در زمان تنظیم، می‌توانید کلیدواژه‌های هدف و موقعیت جغرافیایی (شهر، منطقه یا کل کشور) را انتخاب کنید.

📊 دستاوردهای مورد انتظار:

♻️افزایش رتبه سایت در نتایج جستجو
♻️رشد ترافیک ارگانیک
♻️بالا رفتن تعداد درخواست‌ها و فروش


🎁 پس از ثبت‌نام، یک اعتبار تستی ۱۵۰۰۰ روبلی دریافت می‌کنید تا بدون پیش‌پرداخت، نتایج اولیه را مشاهده کنید.

🔗 سرویس: Seopapa.com

@rss_ai_ir
#SEO #AI #یاندکس #دیجیتال_مارکتینگ #промо
2👍1👏1
🌍 گوگل برای اولین بار آمار دقیقی از اثرات زیست‌محیطی مدل‌های هوش مصنوعی خود منتشر کرد.

🔹 هر درخواست متنی به Gemini مصرف می‌کند:
– حدود ۰.۲۴ وات انرژی (معادل ۹ ثانیه تماشای تلویزیون 📺)
– حدود ۰.۲۶ میلی‌لیتر آب (حدود ۵ قطره 💧)
– حدود ۰.۰۳ گرم CO₂ 🌫

این مقادیر کمتر از برآوردهایی است که پیش‌تر در منابع عمومی منتشر شده بود، زیرا گوگل همه‌چیز را حساب کرده: GPU، CPU، RAM، انرژی حالت آماده‌به‌کار و حتی سیستم‌های خنک‌سازی و زیرساخت دیتاسنتر.

جالب‌تر اینکه فقط در یک سال (مه ۲۰۲۴ تا مه ۲۰۲۵)، ردپای انرژی ۳۳ برابر و ردپای کربن ۴۴ برابر کاهش یافته. این موفقیت بیشتر به لطف طراحی اختصاصی چیپ‌ها، استفاده از انرژی تجدیدپذیر و دیتاسنترهای بهینه به دست آمده است.

📄 متن کامل گزارش (با امضای جف دین) اینجاست:
[PDF Report](https://services.google.com/fh/files/misc/measuring_the_environmental_impact_of_delivering_ai_at_google_scale.pdf)

@rss_ai_ir
#هوش_مصنوعی #Google #پایداری #AI
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 ورود DLSS به بلندر!

در نمایشگاه SIGGRAPH 2025 قابلیت جدیدی معرفی شد: استفاده از DLSS (فناوری آپ‌اسکیلینگ هوشمند انویدیا که معمولا در بازی‌ها به کار می‌رود) حالا در وِیوپورت بلندر (Cycles) هم ممکن است.

🔹 چطور کار می‌کند؟
– صحنه ابتدا در رزولوشن پایین رندر می‌شود.
– سپس DLSS با کمک هوش مصنوعی تصویر را به رزولوشن بالا ارتقا می‌دهد.
– نتیجه نهایی تقریبا مشابه رندر کامل است و حتی در انیمیشن هم بدون پرش و نویز (temporal consistency) دیده می‌شود.

⚡️ مزایا:
– کیفیت بالا با مصرف کمتر منابع پردازشی
– افزایش سرعت و روانی وِیوپورت
– عالی برای پروژه‌های سنگین سه‌بعدی

📌 منبع: [Reddit](https://www.reddit.com/r/blender/comments/1mpqv25/blender_showcases_dlss_upscalingdenoising_at/)

@rss_ai_ir
#Blender #DLSS #هوش_مصنوعی #SIGGRAPH2025 #رندرینگ
🚀 چطور AutoGLM-OS توانست از OpenAI و Anthropic جلو بزند؟

ایجاد یک عامل RL که بتواند به‌طور مستقل محیط دسکتاپ را کنترل کند، به‌نوعی جام مقدس در HCI به حساب می‌آید. اما GUIها برای انسان‌ها طراحی شده‌اند، نه ماشین‌ها، و مقیاس‌پذیری RL هم همیشه با مشکلاتی مثل ناکارایی و ناپایداری مواجه بوده است.

🔹 تیم Z.ai با معرفی فریم‌ورک COMPUTERRL توانست عامل AutoGLM-OS را بسازد که روی بِنچمارک OSWorld رکورد زد:
📊 ۴۸/۱٪ موفقیت – بالاتر از OpenAI CUA 03 (۴۲/۹٪)، UI-TARS-1.5 (۴۲/۵٪) و Claude 4.0 Sonnet (۳۰/۷٪).

📌 بنچمارک OSWorld چیست؟
یک بِنچمارک بزرگ با ۳۶۹ تسک روی Ubuntu، ویندوز و macOS.
اینجا هوش مصنوعی باید کارهای واقعی انجام دهد:

* کار با اپلیکیشن‌های دسکتاپ و وب 🌐
* مدیریت فایل‌ها 📂
* اجرای پروسس‌ها ⚙️
هر تسک شرایط اولیه و اسکریپت‌های ارزیابی استاندارد دارد تا نتایج قابل بازتولید باشند.

---

💡 سه نوآوری کلیدی که AutoGLM-OS را به SOTA رساند:

1️⃣ پارادایم جدید API-GUI
عامل می‌تواند بین تعامل GUI و فراخوانی‌های API سوییچ کند. جایی که API سریع‌تر است از آن استفاده می‌شود، و در کارهای عمومی GUI فعال می‌شود.
📈 نتیجه ابلیشن: افزایش نرخ موفقیت از ۱۱/۲٪ (GUI-only) به ۲۶/۲٪ (API-GUI).

2️⃣ زیرساخت RL توزیع‌شده و مقیاس‌پذیر

* استفاده از qemu-in-docker برای VMهای سبک ☁️
* ارتباط بین‌گرهی با gRPC 🔗
* فریم‌ورک کاملاً async به نام AgentRL ⚡️
این یعنی هزاران محیط موازی برای یادگیری آنلاین RL.

3️⃣ استراتژی آموزشی Entropulse

* رفع مشکل *entropy collapse*
* تناوب بین فازهای RL و SFT
* ایجاد دیتاست جدید از *trajectory*های موفق برای بهبود یادگیری اکتشافی
📈 پس از اولین فاز RL: ۴۲٪
📈 بعد از Entropulse: ۴۸/۱٪

---

📑 جزییات بیشتر: [Arxiv: 2508.14040](https://arxiv.org/pdf/2508.14040)
🌐 بِنچمارک: [OSWorld](https://os-world.github.io/)

@rss_ai_ir

#هوش_مصنوعی 🤖 #یادگیری_تقویتی #Agents #AutoGLM #OSWorld #Zai