This media is not supported in your browser
VIEW IN TELEGRAM
🔹🚀 معرفی OK Computer از Kimi AI
هوش مصنوعی جدیدی که مثل یک تیم کامل محصول عمل میکند!
---
✨ چه کاری انجام میدهد؟
🖥 با یک پرامپت ساده، وبسایتها و اپلیکیشنهای چندصفحهای میسازد.
🎨 طراحی، دیاگرام و پرزنتیشن کامل را خودش تولید میکند.
📊 قابلیت پردازش دیتاستهای عظیم (تا ۱ میلیون ردیف داده).
📑 تحقیق انجام میدهد و گزارش تحلیلی با راهکارهای عملی مینویسد.
👨💻 در نقش مدیر محصول، استراتژیست، طراح و مهندس همزمان ظاهر میشود.
---
🔑 اهمیت ماجرا
با OK Computer، دیگر برای ساخت یک محصول دیجیتال نیاز به تیم چندنفره نیست. کافی است یک پرامپت بنویسید تا تمام فرایند از ایده تا کدنویسی و ارائه انجام شود. این یعنی یک تحول بزرگ در اتوماسیون توسعه وب و نرمافزار.
https://www.kimi.com/
---
📌 @rss_ai_ir
#هوش_مصنوعی #KimiAI #OKComputer #توسعه_وب #اتوماسیون #استارتاپ #دیجیتال
هوش مصنوعی جدیدی که مثل یک تیم کامل محصول عمل میکند!
---
✨ چه کاری انجام میدهد؟
🖥 با یک پرامپت ساده، وبسایتها و اپلیکیشنهای چندصفحهای میسازد.
🎨 طراحی، دیاگرام و پرزنتیشن کامل را خودش تولید میکند.
📊 قابلیت پردازش دیتاستهای عظیم (تا ۱ میلیون ردیف داده).
📑 تحقیق انجام میدهد و گزارش تحلیلی با راهکارهای عملی مینویسد.
👨💻 در نقش مدیر محصول، استراتژیست، طراح و مهندس همزمان ظاهر میشود.
---
🔑 اهمیت ماجرا
با OK Computer، دیگر برای ساخت یک محصول دیجیتال نیاز به تیم چندنفره نیست. کافی است یک پرامپت بنویسید تا تمام فرایند از ایده تا کدنویسی و ارائه انجام شود. این یعنی یک تحول بزرگ در اتوماسیون توسعه وب و نرمافزار.
https://www.kimi.com/
---
📌 @rss_ai_ir
#هوش_مصنوعی #KimiAI #OKComputer #توسعه_وب #اتوماسیون #استارتاپ #دیجیتال
👏2👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
😂 این دیگه خیلی بامزهست!
آدم وقتی میبینه همچین چیزی ممکنه ساختهی هوش مصنوعی باشه، باز هم نمیتونه جلوی خندهش رو بگیره. چون مهم نیست واقعی باشه یا تولیدشده؛ مهم اینه که حال آدم رو خوب میکنه.
📌 @rss_ai_ir
#ویدیو #خنده #هوش_مصنوعی #سرگرمی
آدم وقتی میبینه همچین چیزی ممکنه ساختهی هوش مصنوعی باشه، باز هم نمیتونه جلوی خندهش رو بگیره. چون مهم نیست واقعی باشه یا تولیدشده؛ مهم اینه که حال آدم رو خوب میکنه.
📌 @rss_ai_ir
#ویدیو #خنده #هوش_مصنوعی #سرگرمی
🤣4👍1😁1🍌1
🚦 یادگیری ماشین در نقشهبرداری: تشخیص علائم جادهای در Yandex Maps 🚦
یکی از کیسهای جالب ML در دنیای واقعی مربوط به توسعهی دتکتور علائم جادهای در سرویس نقشه یاندکس است. این سیستم از یک کلاسبند دودویی ساده شروع شد و امروز با شبکههای عصبی پیچیده توانایی شناسایی تقریباً تمام علائم جادهای در روسیه را دارد.
📌 مسیر تکامل:
🔹 نسخه ۲۰۱۶ → مدل کلاسیک با ACFFeatures + WaldBoost، ولی مشکل اصلی «نزدیکبینی» بود (فقط علائم روبهرو را میدید).
🔹 مهاجرت به Faster R-CNN → امکان شناسایی علائم در زوایای مختلف.
🧠 راهکارهای معماری غیرمعمول:
تمام علائم محدودیت سرعت در یک کلاس → شبکه دوم روی تصویر برشخورده عدد را تشخیص میدهد.
برای علائم جهت خطوط هم همین رویکرد → یک مدل اضافی خروجی باینری بردار جهتها را میدهد.
علائم چندخطی (multi-lane) → مدل اختصاصی جداگانه برای پردازش.
🟢 چالش اصلی → دیتاست
به جای برچسبگذاری دستی ترابایتها عکس خیابانی، ابتدا با مدلهای اولیه عکسهای دارای علائم جدا شدند، سپس برای برچسبگذاری دقیق به آسنسرها داده شدند.
📊 اعداد نهایی:
✳️۳۰۰ هزار عکس در دیتاست
✳️۱.۵ میلیون علامت برچسبخورده
✳️۲۰۰+ کلاس مختلف علائم
✳️رایجترین علامت → عبور عابر پیاده
🎯 نتیجه عملی:
این سیستم باعث میشود دادههای نقشه بهصورت خودکار بهروز شوند. در سال بیش از ۲۰۰ هزار بهروزرسانی اتوماتیک انجام میگیرد، که روی مسیریابی و راهنمای صوتی محدودیت سرعت تأثیر مستقیم دارد.
📄 مقاله کامل: Habr
@rss_ai_ir
#هوش_مصنوعی #یادگیری_ماشین #نقشه #بینایی_ماشین 🚀
یکی از کیسهای جالب ML در دنیای واقعی مربوط به توسعهی دتکتور علائم جادهای در سرویس نقشه یاندکس است. این سیستم از یک کلاسبند دودویی ساده شروع شد و امروز با شبکههای عصبی پیچیده توانایی شناسایی تقریباً تمام علائم جادهای در روسیه را دارد.
📌 مسیر تکامل:
🔹 نسخه ۲۰۱۶ → مدل کلاسیک با ACFFeatures + WaldBoost، ولی مشکل اصلی «نزدیکبینی» بود (فقط علائم روبهرو را میدید).
🔹 مهاجرت به Faster R-CNN → امکان شناسایی علائم در زوایای مختلف.
🧠 راهکارهای معماری غیرمعمول:
تمام علائم محدودیت سرعت در یک کلاس → شبکه دوم روی تصویر برشخورده عدد را تشخیص میدهد.
برای علائم جهت خطوط هم همین رویکرد → یک مدل اضافی خروجی باینری بردار جهتها را میدهد.
علائم چندخطی (multi-lane) → مدل اختصاصی جداگانه برای پردازش.
🟢 چالش اصلی → دیتاست
به جای برچسبگذاری دستی ترابایتها عکس خیابانی، ابتدا با مدلهای اولیه عکسهای دارای علائم جدا شدند، سپس برای برچسبگذاری دقیق به آسنسرها داده شدند.
📊 اعداد نهایی:
✳️۳۰۰ هزار عکس در دیتاست
✳️۱.۵ میلیون علامت برچسبخورده
✳️۲۰۰+ کلاس مختلف علائم
✳️رایجترین علامت → عبور عابر پیاده
🎯 نتیجه عملی:
این سیستم باعث میشود دادههای نقشه بهصورت خودکار بهروز شوند. در سال بیش از ۲۰۰ هزار بهروزرسانی اتوماتیک انجام میگیرد، که روی مسیریابی و راهنمای صوتی محدودیت سرعت تأثیر مستقیم دارد.
📄 مقاله کامل: Habr
@rss_ai_ir
#هوش_مصنوعی #یادگیری_ماشین #نقشه #بینایی_ماشین 🚀
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Physics با Sora 2
… و کمی انیمه 🎬
⛔️مجموعه OpenAI در نسخهی جدید Sora 2 نهتنها کیفیت و واقعگرایی تولید ویدیو را ارتقا داده، بلکه امکان شبیهسازی دقیقتر فیزیک اجسام و محیط را هم اضافه کرده است.
یعنی حالا میتوانید حرکت مایعات، پرتاب اجسام یا حتی سقوط طبیعی یک شخصیت را با دقتی بسیار بالاتر تجربه کنید.
✨ و برای علاقهمندان به فرهنگ پاپ، دموی جدید Sora 2 پر از استایل انیمهای است — ترکیب جذاب بین واقعیت فیزیکی و دنیای هنری ژاپنی.
❌این یعنی آیندهی ویدیوهای مولد هوش مصنوعی در دو مسیر همزمان حرکت میکند:
1. دقت علمی و فیزیکی برای شبیهسازیهای جدی و صنعتی 🏭⚙️
2. خلاقیت هنری برای تولید محتوا، سرگرمی و انیمیشن 🎨🎥
به نظر شما، کدام بخش زودتر به بلوغ میرسد: شبیهسازیهای فیزیکی برای صنعت یا استایلهای هنری برای سرگرمی؟ 🤔
@rss_ai_ir
#هوش_مصنوعی #Sora2 #انیمه #فیزیک #تولید_ویدیو 🚀
… و کمی انیمه 🎬
⛔️مجموعه OpenAI در نسخهی جدید Sora 2 نهتنها کیفیت و واقعگرایی تولید ویدیو را ارتقا داده، بلکه امکان شبیهسازی دقیقتر فیزیک اجسام و محیط را هم اضافه کرده است.
یعنی حالا میتوانید حرکت مایعات، پرتاب اجسام یا حتی سقوط طبیعی یک شخصیت را با دقتی بسیار بالاتر تجربه کنید.
✨ و برای علاقهمندان به فرهنگ پاپ، دموی جدید Sora 2 پر از استایل انیمهای است — ترکیب جذاب بین واقعیت فیزیکی و دنیای هنری ژاپنی.
❌این یعنی آیندهی ویدیوهای مولد هوش مصنوعی در دو مسیر همزمان حرکت میکند:
1. دقت علمی و فیزیکی برای شبیهسازیهای جدی و صنعتی 🏭⚙️
2. خلاقیت هنری برای تولید محتوا، سرگرمی و انیمیشن 🎨🎥
به نظر شما، کدام بخش زودتر به بلوغ میرسد: شبیهسازیهای فیزیکی برای صنعت یا استایلهای هنری برای سرگرمی؟ 🤔
@rss_ai_ir
#هوش_مصنوعی #Sora2 #انیمه #فیزیک #تولید_ویدیو 🚀
🧠 معرفی AlphaEvolve توسط Google/DeepMind: هوش مصنوعی در خدمت کشف نتایج جدید در ریاضیات و علوم کامپیوتر تئوری
🔍 چطور کار میکند؟
مدلهای زبانی معمولاً سعی میکنند کل اثبات را یکجا بنویسند، اما این کار بسیار پیچیده و غیرقابلاعتماد است.
⛔️همچنین AlphaEvolve رویکرد متفاوتی دارد:
✅به جای نوشتن اثبات کامل، اجزای کوچکتری به نام gadget تولید میکند.
این تکهها بهسرعت و بهصورت خودکار قابلبررسیاند و اگر درست باشند، میتوان آنها را در کنار هم قرار داد و به قضایای بزرگتر رسید.
📈 چه چیزهایی پیدا شده است؟
✅یک نتیجهی جدید برای مسئلهی MAX-4-CUT (یکی از مسائل نظریه الگوریتمها و بهینهسازی ترکیبیاتی، نسخهای از MAX-CUT کلاسیک).
✅کرانهای پایینی قویتر برای مسائل روی گرافهای تصادفی، از جمله کار روی گرافهای رامانوجان.
✅سرعت بررسی قضایا نسبت به روشهای سنتی ۱۰٬۰۰۰ برابر سریعتر شده است.
🧩 چرا مهم است؟
ریاضیات نیازمند دقت ۱۰۰٪ است؛ اینجا هوش مصنوعی نقش تولیدکننده ایده را دارد و بخش بررسی همچنان دقیق و رسمی باقی میماند.
این رویکرد میتواند سالها کار انسانی را ذخیره کند و راه را برای کشف قضایا و الگوریتمهای جدید باز کند.
📄 جزییات بیشتر:
research.google/blog/ai-as-a-research-partner-advancing-theoretical-computer-science-with-alphaevolve/
@rss_ai_ir
#هوش_مصنوعی #ریاضیات #دیپمایند #پژوهش #LLM
🔍 چطور کار میکند؟
مدلهای زبانی معمولاً سعی میکنند کل اثبات را یکجا بنویسند، اما این کار بسیار پیچیده و غیرقابلاعتماد است.
⛔️همچنین AlphaEvolve رویکرد متفاوتی دارد:
✅به جای نوشتن اثبات کامل، اجزای کوچکتری به نام gadget تولید میکند.
این تکهها بهسرعت و بهصورت خودکار قابلبررسیاند و اگر درست باشند، میتوان آنها را در کنار هم قرار داد و به قضایای بزرگتر رسید.
📈 چه چیزهایی پیدا شده است؟
✅یک نتیجهی جدید برای مسئلهی MAX-4-CUT (یکی از مسائل نظریه الگوریتمها و بهینهسازی ترکیبیاتی، نسخهای از MAX-CUT کلاسیک).
✅کرانهای پایینی قویتر برای مسائل روی گرافهای تصادفی، از جمله کار روی گرافهای رامانوجان.
✅سرعت بررسی قضایا نسبت به روشهای سنتی ۱۰٬۰۰۰ برابر سریعتر شده است.
🧩 چرا مهم است؟
ریاضیات نیازمند دقت ۱۰۰٪ است؛ اینجا هوش مصنوعی نقش تولیدکننده ایده را دارد و بخش بررسی همچنان دقیق و رسمی باقی میماند.
این رویکرد میتواند سالها کار انسانی را ذخیره کند و راه را برای کشف قضایا و الگوریتمهای جدید باز کند.
📄 جزییات بیشتر:
research.google/blog/ai-as-a-research-partner-advancing-theoretical-computer-science-with-alphaevolve/
@rss_ai_ir
#هوش_مصنوعی #ریاضیات #دیپمایند #پژوهش #LLM
❤1👍1🔥1
⚡️ تغییر اتوانکودر در مدلهای latent diffusion سادهتر از آن چیزی است که فکر میکنید!
🚀 اDC-Gen یک فریمورک جدید برای شتاببخشی مدلهای دیفیوشن پس از آموزش است.
این روش هر مدل آماده را به یک فضای نهفتهی فشرده منتقل میکند و هم هزینه را کاهش میدهد و هم سرعت تولید را چندین برابر میکند.
🔑 ویژگیهای کلیدی:
🎯 وضوح بالا بدون افت کیفیت
نسخهی DC-Gen-FLUX.1-Krea-12B همان کیفیت نسخه اصلی را دارد اما ۵۳ برابر سریعتر روی H100 در حالت 4K اجرا میشود.
با NVFP4، تولید تصویر 4K تنها ۳.۵ ثانیه روی یک کارت NVIDIA 5090 (۲۰ مرحله) طول میکشد.
💸 هزینه پایین برای انطباق
انتقال مدل FLUX.1-Krea-12B به اتوانکودر عمیقاً فشرده تنها ۴۰ روز GPU روی H100 نیاز دارد.
📄 مقاله:
arxiv.org/abs/2509.25180
💻 کد:
github.com/dc-ai-projects/DC-Gen
🎨 مدلها:
huggingface.co/dc-ai/dc-gen
@rss_ai_ir
#هوش_مصنوعی #دیفیوشن #یادگیری_عمیق #AI
🚀 اDC-Gen یک فریمورک جدید برای شتاببخشی مدلهای دیفیوشن پس از آموزش است.
این روش هر مدل آماده را به یک فضای نهفتهی فشرده منتقل میکند و هم هزینه را کاهش میدهد و هم سرعت تولید را چندین برابر میکند.
🔑 ویژگیهای کلیدی:
🎯 وضوح بالا بدون افت کیفیت
نسخهی DC-Gen-FLUX.1-Krea-12B همان کیفیت نسخه اصلی را دارد اما ۵۳ برابر سریعتر روی H100 در حالت 4K اجرا میشود.
با NVFP4، تولید تصویر 4K تنها ۳.۵ ثانیه روی یک کارت NVIDIA 5090 (۲۰ مرحله) طول میکشد.
💸 هزینه پایین برای انطباق
انتقال مدل FLUX.1-Krea-12B به اتوانکودر عمیقاً فشرده تنها ۴۰ روز GPU روی H100 نیاز دارد.
📄 مقاله:
arxiv.org/abs/2509.25180
💻 کد:
github.com/dc-ai-projects/DC-Gen
🎨 مدلها:
huggingface.co/dc-ai/dc-gen
@rss_ai_ir
#هوش_مصنوعی #دیفیوشن #یادگیری_عمیق #AI
👍1🔥1👏1
🔥 خسته شدید از RLHF و RLVR؟ حالا روش جدیدی معرفی شده به نام Critique Reinforcement Learning (CRL)!
🧠 ایده اصلی:
در الگوریتمهای معمولی RL، مدل یاد میگیرد پاسخ نهایی بدهد.
اما در CRL مدل به جای تولید پاسخ، یاد میگیرد راهحل موجود را نقد و بررسی کند و مرحلهبهمرحله صحت آن را بسنجد.
پاداش هم نه برای جواب، بلکه برای نقد مفید و سازندهای داده میشود که در نهایت به قضاوت درست (True/False) منجر شود.
🚀 نتایج آزمایشها:
✅مدل Critique-Coder 4B توانست در LiveCodeBench-V5 امتیاز ۶۲٪ بگیرد — بالاتر از مدل 14B DeepCoder.
✅این آموزش روی rStar-Coder با روش GRPO انجام شده است.
✅مدلهای 4B و 8B در سایز خودشان به بهترینها تبدیل شدند.
📄 مقاله:
arxiv.org/abs/2509.22824
🌐 وبسایت:
tiger-ai-lab.github.io/Critique-Coder
🤗 مدلها:
HuggingFace Collection
@rss_ai_ir
#هوش_مصنوعی #RL #LLM #یادگیری_تقویتی
🧠 ایده اصلی:
در الگوریتمهای معمولی RL، مدل یاد میگیرد پاسخ نهایی بدهد.
اما در CRL مدل به جای تولید پاسخ، یاد میگیرد راهحل موجود را نقد و بررسی کند و مرحلهبهمرحله صحت آن را بسنجد.
پاداش هم نه برای جواب، بلکه برای نقد مفید و سازندهای داده میشود که در نهایت به قضاوت درست (True/False) منجر شود.
🚀 نتایج آزمایشها:
✅مدل Critique-Coder 4B توانست در LiveCodeBench-V5 امتیاز ۶۲٪ بگیرد — بالاتر از مدل 14B DeepCoder.
✅این آموزش روی rStar-Coder با روش GRPO انجام شده است.
✅مدلهای 4B و 8B در سایز خودشان به بهترینها تبدیل شدند.
📄 مقاله:
arxiv.org/abs/2509.22824
🌐 وبسایت:
tiger-ai-lab.github.io/Critique-Coder
🤗 مدلها:
HuggingFace Collection
@rss_ai_ir
#هوش_مصنوعی #RL #LLM #یادگیری_تقویتی
👍1🔥1👏1
Media is too big
VIEW IN TELEGRAM
🏫 Leju Robotics
مرکز عظیم آموزش رباتها را در پکن افتتاح کرد 🇨🇳
شرکت چینی Leju Robotics فضایی به وسعت ۱۰ هزار مترمربع را برای جمعآوری دادههای آموزشی رباتها تجهیز کرده است.
🔹 در این مرکز، سناریوهای مختلفی شبیهسازی میشوند:
کار در فروشگاه 🛒
فعالیت در محیطهای صنعتی 🏭
وظایف خانگی 🏠
🔹 دادهها به کمک لباسهای موشن کپچر و کنترلرها ثبت میشوند تا حرکتها و تعاملات انسانی دقیقاً به رباتها منتقل گردد.
این مرکز با حمایت مستقیم دولت چین راهاندازی شده و هدف اصلی آن حل مشکل کمبود داده برای آموزش مدلهای رباتیک است.
به نظر میرسد رقابت چین و آمریکا در حوزه رباتیک و هوش مصنوعی وارد مرحلهای داغتر شده است 🔥
@rss_ai_ir
#رباتیک #چین #هوش_مصنوعی #DigitalTwin #AI
مرکز عظیم آموزش رباتها را در پکن افتتاح کرد 🇨🇳
شرکت چینی Leju Robotics فضایی به وسعت ۱۰ هزار مترمربع را برای جمعآوری دادههای آموزشی رباتها تجهیز کرده است.
🔹 در این مرکز، سناریوهای مختلفی شبیهسازی میشوند:
کار در فروشگاه 🛒
فعالیت در محیطهای صنعتی 🏭
وظایف خانگی 🏠
🔹 دادهها به کمک لباسهای موشن کپچر و کنترلرها ثبت میشوند تا حرکتها و تعاملات انسانی دقیقاً به رباتها منتقل گردد.
این مرکز با حمایت مستقیم دولت چین راهاندازی شده و هدف اصلی آن حل مشکل کمبود داده برای آموزش مدلهای رباتیک است.
به نظر میرسد رقابت چین و آمریکا در حوزه رباتیک و هوش مصنوعی وارد مرحلهای داغتر شده است 🔥
@rss_ai_ir
#رباتیک #چین #هوش_مصنوعی #DigitalTwin #AI
🔥2👏1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔩 آموزش عاملمحور با محوریت کد 🔩
👉 تیم Show Lab از چارچوب جدیدی با نام Code2Video رونمایی کرده است؛ یک سیستم هوشمند عاملمحور که از کدهای اجرایی برای تولید ویدئوهای آموزشی با کیفیت بالا استفاده میکند.
❌ برخلاف مدلهای سنتی Text-to-Video که بر پایه پیکسل کار میکنند،
✅ این رویکرد با تکیه بر کد Manim (ابزار شبیهسازی ریاضی) تضمین میکند که ویدئوها شفاف، منسجم و قابل بازتولید باشند.
📌 مزایا:
✳️ویدئوهای آموزشی دقیق و قابل فهم
✳️تولید محتوای علمی بدون خطاهای بصری
✳️امکان بازتولید و ویرایش آسان با تغییر کد
📖 مقاله: arxiv.org/pdf/2510.01174
💻 ریپو: github.com/showlab/Code2Video
🌐 پروژه: showlab.github.io/Code2Video
@rss_ai_ir
#AI #Education #AgenticAI #Manim #Code2Video
👉 تیم Show Lab از چارچوب جدیدی با نام Code2Video رونمایی کرده است؛ یک سیستم هوشمند عاملمحور که از کدهای اجرایی برای تولید ویدئوهای آموزشی با کیفیت بالا استفاده میکند.
❌ برخلاف مدلهای سنتی Text-to-Video که بر پایه پیکسل کار میکنند،
✅ این رویکرد با تکیه بر کد Manim (ابزار شبیهسازی ریاضی) تضمین میکند که ویدئوها شفاف، منسجم و قابل بازتولید باشند.
📌 مزایا:
✳️ویدئوهای آموزشی دقیق و قابل فهم
✳️تولید محتوای علمی بدون خطاهای بصری
✳️امکان بازتولید و ویرایش آسان با تغییر کد
📖 مقاله: arxiv.org/pdf/2510.01174
💻 ریپو: github.com/showlab/Code2Video
🌐 پروژه: showlab.github.io/Code2Video
@rss_ai_ir
#AI #Education #AgenticAI #Manim #Code2Video
❤1👍1👏1👌1
🚀 در ByteDance Seed تکنیک جدیدی برای آموزش LLM معرفی شد: Knapsack RL
🔍 مشکل در RL کلاسیک:
در کارهای ساده همیشه موفقیت → بدون گرادیان
در کارهای سخت همیشه شکست → باز هم بدون گرادیان
💡 راهکار:
به جای توزیع یکنواخت rolloutها، بودجه محاسباتی مثل یک مسئله کولهپشتی (Knapsack) روی مواردی صرف میشود که واقعاً سیگنال آموزشی میدهند.
✨ نتایج:
🔼 +20–40% گرادیانهای غیرصفر بیشتر
🧮 تا 93 rollout برای مسائل سخت (بدون هزینه اضافه)
📈 +2–4 امتیاز میانگین، تا +9 در ریاضیات
💰 حدوداً دو برابر ارزانتر از روش توزیع یکنواخت
📄 جزییات بیشتر:
huggingface.co/papers/2509.25849
@rss_ai_ir 🤖
#هوش_مصنوعی #یادگیری_تقویتی #LLM #KnapsackRL #ByteDance #ماشین_لرنینگ #یادگیری_عمیق #AI #RLHF #MachineLearning
🔍 مشکل در RL کلاسیک:
در کارهای ساده همیشه موفقیت → بدون گرادیان
در کارهای سخت همیشه شکست → باز هم بدون گرادیان
💡 راهکار:
به جای توزیع یکنواخت rolloutها، بودجه محاسباتی مثل یک مسئله کولهپشتی (Knapsack) روی مواردی صرف میشود که واقعاً سیگنال آموزشی میدهند.
✨ نتایج:
🔼 +20–40% گرادیانهای غیرصفر بیشتر
🧮 تا 93 rollout برای مسائل سخت (بدون هزینه اضافه)
📈 +2–4 امتیاز میانگین، تا +9 در ریاضیات
💰 حدوداً دو برابر ارزانتر از روش توزیع یکنواخت
📄 جزییات بیشتر:
huggingface.co/papers/2509.25849
@rss_ai_ir 🤖
#هوش_مصنوعی #یادگیری_تقویتی #LLM #KnapsackRL #ByteDance #ماشین_لرنینگ #یادگیری_عمیق #AI #RLHF #MachineLearning