VIRSUN
6.14K subscribers
1.02K photos
583 videos
5 files
652 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
🔥 خسته شدید از RLHF و RLVR؟ حالا روش جدیدی معرفی شده به نام Critique Reinforcement Learning (CRL)!

🧠 ایده اصلی:
در الگوریتم‌های معمولی RL، مدل یاد می‌گیرد پاسخ نهایی بدهد.
اما در CRL مدل به جای تولید پاسخ، یاد می‌گیرد راه‌حل موجود را نقد و بررسی کند و مرحله‌به‌مرحله صحت آن را بسنجد.
پاداش هم نه برای جواب، بلکه برای نقد مفید و سازنده‌ای داده می‌شود که در نهایت به قضاوت درست (True/False) منجر شود.

🚀 نتایج آزمایش‌ها:

مدل Critique-Coder 4B توانست در LiveCodeBench-V5 امتیاز ۶۲٪ بگیرد — بالاتر از مدل 14B DeepCoder.

این آموزش روی rStar-Coder با روش GRPO انجام شده است.

مدل‌های 4B و 8B در سایز خودشان به بهترین‌ها تبدیل شدند.


📄 مقاله:
arxiv.org/abs/2509.22824
🌐 وبسایت:
tiger-ai-lab.github.io/Critique-Coder
🤗 مدل‌ها:
HuggingFace Collection

@rss_ai_ir

#هوش_مصنوعی #RL #LLM #یادگیری_تقویتی
👍1🔥1👏1
Media is too big
VIEW IN TELEGRAM
🏫 Leju Robotics
مرکز عظیم آموزش ربات‌ها را در پکن افتتاح کرد
🇨🇳


شرکت چینی Leju Robotics فضایی به وسعت ۱۰ هزار مترمربع را برای جمع‌آوری داده‌های آموزشی ربات‌ها تجهیز کرده است.
🔹 در این مرکز، سناریوهای مختلفی شبیه‌سازی می‌شوند:
کار در فروشگاه 🛒
فعالیت در محیط‌های صنعتی 🏭
وظایف خانگی 🏠


🔹 داده‌ها به کمک لباس‌های موشن کپچر و کنترلرها ثبت می‌شوند تا حرکت‌ها و تعاملات انسانی دقیقاً به ربات‌ها منتقل گردد.
این مرکز با حمایت مستقیم دولت چین راه‌اندازی شده و هدف اصلی آن حل مشکل کمبود داده برای آموزش مدل‌های رباتیک است.
به نظر می‌رسد رقابت چین و آمریکا در حوزه رباتیک و هوش مصنوعی وارد مرحله‌ای داغ‌تر شده است 🔥


@rss_ai_ir
#رباتیک #چین #هوش_مصنوعی #DigitalTwin #AI
🔥2👏1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔩 آموزش عامل‌محور با محوریت کد 🔩

👉 تیم Show Lab از چارچوب جدیدی با نام Code2Video رونمایی کرده است؛ یک سیستم هوشمند عامل‌محور که از کدهای اجرایی برای تولید ویدئوهای آموزشی با کیفیت بالا استفاده می‌کند.

برخلاف مدل‌های سنتی Text-to-Video که بر پایه پیکسل کار می‌کنند،

این رویکرد با تکیه بر کد Manim (ابزار شبیه‌سازی ریاضی) تضمین می‌کند که ویدئوها شفاف، منسجم و قابل بازتولید باشند.

📌 مزایا:

✳️ویدئوهای آموزشی دقیق و قابل فهم
✳️تولید محتوای علمی بدون خطاهای بصری
✳️امکان بازتولید و ویرایش آسان با تغییر کد


📖 مقاله: arxiv.org/pdf/2510.01174
💻 ریپو: github.com/showlab/Code2Video
🌐 پروژه: showlab.github.io/Code2Video

@rss_ai_ir

#AI #Education #AgenticAI #Manim #Code2Video
1👍1👏1👌1
🚀 در ByteDance Seed تکنیک جدیدی برای آموزش LLM معرفی شد: Knapsack RL

🔍 مشکل در RL کلاسیک:

در کارهای ساده همیشه موفقیت → بدون گرادیان
در کارهای سخت همیشه شکست → باز هم بدون گرادیان


💡 راهکار:
به جای توزیع یکنواخت rolloutها، بودجه محاسباتی مثل یک مسئله کوله‌پشتی (Knapsack) روی مواردی صرف می‌شود که واقعاً سیگنال آموزشی می‌دهند.

نتایج:

🔼 ‌+20–40% گرادیان‌های غیرصفر بیشتر
🧮 تا 93 rollout برای مسائل سخت (بدون هزینه اضافه)
📈 ‌+2–4 امتیاز میانگین، تا +9 در ریاضیات
💰 ‌حدوداً دو برابر ارزان‌تر از روش توزیع یکنواخت


📄 جزییات بیشتر:
huggingface.co/papers/2509.25849

@rss_ai_ir 🤖

#هوش_مصنوعی #یادگیری_تقویتی #LLM #KnapsackRL #ByteDance #ماشین_لرنینگ #یادگیری_عمیق #AI #RLHF #MachineLearning
🎥 در Sora حالا پر از دیپ‌فیک‌های سم آلتمن شده!

🧩 مجموعه OpenAI اپلیکیشن اجتماعی جدیدی با سیستم cameo راه‌اندازی کرده:

♻️افراد می‌تونن اجازه بدن چهره‌شون در ویدئوهای ساخته‌شده استفاده بشه.

♻️برای این کار باید یک کلیپ بیومتریک کوتاه ضبط کنن (خوندن اعداد، چرخش سر، بررسی لباس) و سطح دسترسی رو انتخاب کنن.


😅 سم آلتمن دسترسی رو روی «برای همه» گذاشته → حالا صورتش تو ویدئوهای پوکمون، اسکتچ‌های فست‌فود و حتی «سرقت‌های GPU تقلبی» دیده میشه.

🚀 اما Sora فقط به متن بسنده نمی‌کنه:

✳️همچنین IP کاربر رو تحلیل می‌کنه تا کانتکست محلی اضافه کنه (شهر، تیم ورزشی، مناظر).
✳️از گفتگوهای قبلی ChatGPT استفاده می‌کنه تا علایق و سبک شما وارد ویدئو بشه.


📌 مثال: کاربری از فیلادلفیا «ویدئوی بیسبال» خواست → Sora به‌طور خودکار ویدئویی از Phillies ساخت.

👉 این یعنی گذر از «متن → ویدئو» به سمت ویدئوی شخصی‌سازی عمیق، جایی که داده‌های شما و محیط اطراف‌تون بخشی از خروجی میشن.

@rss_ai_ir 🤖


#هوش_مصنوعی #دیپ_فیک #Sora #OpenAI #SamAltman #AI #تولید_محتوا
1
📘 Anthropic منتشر کرد:
گاید عالی برای تنظیم مؤثر ایجنت‌ها

🔑 فرق اصلی با پرامپت‌نویسی کلاسیک اینجاست:

Prompt Engineering =
نوشتن دستور برای یک بار پاسخ.

Agent Engineering =
طراحی کل رفتار، حافظه، و کانتکست برای یک ایجنت دائمی.


💡 مقاله توضیح میده چطور باید context engineering رو جدی بگیریم: از مدیریت تاریخچه و اهداف تا انتخاب معماری حافظه.

📄 متن کامل:
anthropic.com/engineering/effective-context-engineering-for-ai-agents

@rss_ai_ir 🤖

#هوش_مصنوعی #LLM #AgentEngineering #PromptEngineering #Anthropic #AI
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 در meta.ai حالا میشه نمونه‌هایی شبیه Vine دید.

⛔️به نظرم از نظر مکانیک خیلی عقب‌تر از Sora ـه،
ولی خب این رقابت سریع پیش میره – بعید نیست ظرف چند هفته متا هم Cameo رو به سرویسش اضافه کنه.
@rss_ai_ir
#هوش_مصنوعی #MetaAI #Sora #دیپ‌فیک #AI #GenerativeAI
🔦 تولید تصویر با نور، نه GPU!

محققان دانشگاه UCLA یک مدل مولد نوری معرفی کرده‌اند که به جای تراشه‌ها و محاسبات سنگین، از نور و لنزها برای ساخت تصویر استفاده می‌کند.

🔬 چطور کار می‌کند؟
1️⃣ یک انکودر دیجیتال سبک، نویز اولیه را به یک الگوی فاز تبدیل می‌کند.
2️⃣ این الگو روی یک مدولاتور نوری (SLM) بارگذاری می‌شود.
3️⃣ نور از یک دی‌کدر پراش عبور می‌کند و تصویر مستقیم روی سنسور شکل می‌گیرد.

✔️ نتایج آزمایشی:

♻️تولید اعداد، چهره‌ها، پروانه‌ها و حتی نقاشی‌هایی در سبک «ون گوگ» 🎨
♻️کیفیت قابل مقایسه با مدل‌های دیفیوژن مدرن
♻️دو نسخه: تولید فوری (یک‌مرحله‌ای) و تولید تدریجی (چند مرحله‌ای مثل دیفیوژن)


چرا مهم است؟

بدون بار محاسباتی CPU/GPU
فوق سریع؛ قوانین فیزیک نور همان چیزی را انجام می‌دهند که GPU با میلیاردها عملیات محاسبه می‌کند
گامی به سوی هوش مصنوعی فوق کم‌مصرف برای دستگاه‌های AR/VR، دوربین‌های موبایل و سنسورهای فشرده


⚠️ چالش‌ها:

✳️دشواری در هم‌ترازی اجزای اپتیکی
✳️محدودیت در دقت ماسک‌های فاز
✳️حساسیت به کیفیت تجهیزات (نویز، عمق بیت و...)


⛔️با وجود این محدودیت‌ها، این تحقیق اولین قدم به سوی نسل جدیدی از هوش مصنوعی فوتونیکی است؛ جایی که محاسبات جای خود را به نور می‌دهند.

منبع: Nature 🔗
#هوش_مصنوعی #اپتیک #فوتونیک #تولید_تصویر #AI
@rss_ai_ir
🚀 IBM Granite 4.0 معرفی شد
— خانواده‌ای تازه از مدل‌های زبانی متن‌باز با وزن‌های آزاد، از ۳B تا ۳۲B پارامتر.

🔹 چهار مدل جدید:

♻️Granite 4.0 H Small — 32B / 9B پارامتر فعال
♻️Granite 4.0 H Tiny — 7B / 1B
♻️Granite 4.0 H Micro — 3B / 3B
♻️Granite 4.0 Micro — 3B / 3B


📊 بنچمارک (Artificial Analysis Index):

Granite 4.0 H Small → امتیاز 23 (۸ امتیاز بالاتر از Granite 3.3 8B) — بهتر از Gemma 3 27B (22)، اما ضعیف‌تر از Mistral Small 3.2 (29) و Qwen3 30B A3B (37).

Granite 4.0 Micro → امتیاز 16 — بهتر از Gemma 3 4B (15) و LFM 2 2.6B (12).


کارایی توکن:

Granite 4.0 Small → 5.2M tokens

Granite 4.0 Micro → 6.7M tokens
(کارایی به‌مراتب بالاتر از Granite 3.3 8B و بیشتر مدل‌های زیر 40B بدون قابلیت reasoning).


🔑 جزئیات فنی:

✳️کانتکست: تا 128K tokens
✳️لایسنس: Apache 2.0
✳️همچنین Granite 4.0 H Small روی Replicate با هزینه 0.06$ / 0.25$ به ازای ۱M توکن ورودی/خروجی
✳️همه مدل‌ها روی Hugging Face در دسترس هستند
✳️مدل Micro (3.4B) را می‌توان کاملاً لوکال اجرا کرد.


🔗 Hugging Face
🔗 Unsloth

@rss_ai_ir

#AI #IBM #Granite4 #LLM #OpenWeights
Media is too big
VIEW IN TELEGRAM
🚀🤖 ربات کروی 3.0 از آزمایشگاه Guangming و شرکت FLERA

🔵 چین دوباره با یک نوآوری جالب در حوزه رباتیک خبرساز شد: ربات کروی 3.0 که در نمایش ویدیویی جدید معرفی شده است.

ویژگی‌ها:

✳️طراحی کاملاً کروی برای حرکت روان و همه‌جهته روی سطوح مختلف
✳️بهبود چشمگیر در پایداری (Stability Enhancement) نسبت به نسخه‌های قبلی
✳️قابلیت عبور از موانع و حرکت در شرایط پیچیده محیطی
✳️وزن سبک و ابعاد جمع‌وجور، مناسب برای آزمایش‌های رباتیک و محیط‌های واقعی


⚙️ نکته جالب این نسخه، استفاده از سیستم‌های تقویت‌کننده پایداری است که باعث می‌شود ربات در زمان حرکت یا توقف کمتر دچار لرزش شود. همچنین تست‌های عبور از موانع نشان داده‌اند که این ربات به‌راحتی می‌تواند از سیم‌ها، اشیاء کوچک و سطح‌های ناهموار عبور کند.

📽 در ویدیوی منتشرشده، می‌توان مقایسه‌ی حالت قبل و بعد (Before/After) را دید که نشان‌دهنده‌ی ارتقای محسوس در عملکرد است.

🌍 چنین ربات‌هایی می‌توانند در آینده برای کاوش محیط‌های خطرناک، عملیات نجات، پایش صنعتی و حتی مأموریت‌های فضایی استفاده شوند.

@rss_ai_ir

#رباتیک #AI #چین #ربات_کروی #نوآوری #فناوری
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ انتشار Agent S3 – عامل هوشمند پیشرفته برای کنترل رایانه در سطح نزدیک به انسان

🔹 تیم Simular AI از نسل جدید عامل‌ها رونمایی کرد: Agent S3.
به‌جای پیچیده‌تر کردن یک مدل، این رویکرد چندین عامل را به‌طور موازی اجرا می‌کند و سپس بهترین نتیجه انتخاب می‌شود. این روش جدید با نام Behavior Best-of-N (bBoN) معرفی شده است.

🔍 نحوه کار:

✳️هر عامل تلاش می‌کند مسئله را حل کند.
✳️اقدامات او به یک روایت رفتاری (Behavioral Narrative) تبدیل می‌شود – توضیح کوتاهی از تغییرات واقعی روی صفحه.
✳️یک داور ویژه این روایت‌ها را مقایسه کرده و بهترین عملکرد را انتخاب می‌کند.


📊 نتایج کلیدی:

♻️GPT-5 با 10 عامل موازی → دقت 69.9٪
♻️GPT-5 Mini → دقت 60.2٪
♻️Agent S3 → بیش از 10٪ بهتر از بهترین روش‌های قبلی (SOTA)


📄 مقاله: arxiv.org/abs/2510.02250
💻 کد: github.com/simular-ai/Agent-S
📝 بلاگ: simular.ai/articles/agent-s3

@rss_ai_ir

#هوش_مصنوعی #AgentS3 #SimularAI #عامل_هوشمند #AI #Agents
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 سی‌دریم ۴ یک هفته رایگان + آواتارهای هوش مصنوعی

🎉 در یک حرکت غافلگیرانه، Dreamina امکان استفاده رایگان از Seedream 4 را تا تاریخ ۹ اکتبر فراهم کرده است 🚀

قابلیت جدید:

با اتصال از طریق VPN آمریکا گزینه AI Avatars فعال می‌شود.

مشابه Hedra: یک عکس + یک فایل صوتی (حداکثر ۱۵ ثانیه در حالت رایگان) آپلود کنید → یک آواتار متحرک واقعی تحویل بگیرید.

در تست‌ها (مثلاً با پرنسس 👑) حرکات سر و میمیک بسیار هماهنگ و طبیعی بود.

خروجی با رزولوشن ۱۰۸۸×۱۰۸۸ است، کیفیت هم بالاست و خبری از افت وضوح نیست.


🔗 امتحان کنید: dreamina.capcut.com/ai-tool/generate

@rss_ai_ir

#Seedream4 #Dreamina #هوش_مصنوعی #آواتار #AI
🔥1