VIRSUN

0:03

🔩 آموزش عامل‌محور با محوریت کد 🔩

👉 تیم Show Lab از چارچوب جدیدی با نام Code2Video رونمایی کرده است؛ یک سیستم هوشمند عامل‌محور که از کدهای اجرایی برای تولید ویدئوهای آموزشی با کیفیت بالا استفاده می‌کند.

❌ برخلاف مدل‌های سنتی Text-to-Video که بر پایه پیکسل کار می‌کنند،

✅ این رویکرد با تکیه بر کد Manim (ابزار شبیه‌سازی ریاضی) تضمین می‌کند که ویدئوها شفاف، منسجم و قابل بازتولید باشند.

📌 مزایا:

✳️ویدئوهای آموزشی دقیق و قابل فهم
✳️تولید محتوای علمی بدون خطاهای بصری
✳️امکان بازتولید و ویرایش آسان با تغییر کد

📖 مقاله: arxiv.org/pdf/2510.01174
💻 ریپو: github.com/showlab/Code2Video
🌐 پروژه: showlab.github.io/Code2Video

@rss_ai_ir

#AI #Education #AgenticAI #Manim #Code2Video

❤1👍1👏1👌1

326 views07:33

🚀 در ByteDance Seed تکنیک جدیدی برای آموزش LLM معرفی شد: Knapsack RL

🔍 مشکل در RL کلاسیک:

در کارهای ساده همیشه موفقیت → بدون گرادیان
در کارهای سخت همیشه شکست → باز هم بدون گرادیان

💡 راهکار:
به جای توزیع یکنواخت rolloutها، بودجه محاسباتی مثل یک مسئله کوله‌پشتی (Knapsack) روی مواردی صرف می‌شود که واقعاً سیگنال آموزشی می‌دهند.

✨ نتایج:

🔼 ‌+20–40% گرادیان‌های غیرصفر بیشتر
🧮 تا 93 rollout برای مسائل سخت (بدون هزینه اضافه)
📈 ‌+2–4 امتیاز میانگین، تا +9 در ریاضیات
💰 ‌حدوداً دو برابر ارزان‌تر از روش توزیع یکنواخت

📄 جزییات بیشتر:
huggingface.co/papers/2509.25849

@rss_ai_ir 🤖

#هوش_مصنوعی #یادگیری_تقویتی #LLM #KnapsackRL #ByteDance #ماشین_لرنینگ #یادگیری_عمیق #AI #RLHF #MachineLearning

1.09K views12:12

🎥 در Sora حالا پر از دیپ‌فیک‌های سم آلتمن شده!

🧩 مجموعه OpenAI اپلیکیشن اجتماعی جدیدی با سیستم cameo راه‌اندازی کرده:

♻️افراد می‌تونن اجازه بدن چهره‌شون در ویدئوهای ساخته‌شده استفاده بشه.

♻️برای این کار باید یک کلیپ بیومتریک کوتاه ضبط کنن (خوندن اعداد، چرخش سر، بررسی لباس) و سطح دسترسی رو انتخاب کنن.

😅 سم آلتمن دسترسی رو روی «برای همه» گذاشته → حالا صورتش تو ویدئوهای پوکمون، اسکتچ‌های فست‌فود و حتی «سرقت‌های GPU تقلبی» دیده میشه.

🚀 اما Sora فقط به متن بسنده نمی‌کنه:

✳️همچنین IP کاربر رو تحلیل می‌کنه تا کانتکست محلی اضافه کنه (شهر، تیم ورزشی، مناظر).
✳️از گفتگوهای قبلی ChatGPT استفاده می‌کنه تا علایق و سبک شما وارد ویدئو بشه.

📌 مثال: کاربری از فیلادلفیا «ویدئوی بیسبال» خواست → Sora به‌طور خودکار ویدئویی از Phillies ساخت.

👉 این یعنی گذر از «متن → ویدئو» به سمت ویدئوی شخصی‌سازی عمیق، جایی که داده‌های شما و محیط اطراف‌تون بخشی از خروجی میشن.

@rss_ai_ir 🤖

#هوش_مصنوعی #دیپ_فیک #Sora #OpenAI #SamAltman #AI #تولید_محتوا

❤1

1.15K viewsedited 12:13

📘 Anthropic منتشر کرد:
گاید عالی برای تنظیم مؤثر ایجنت‌ها

🔑 فرق اصلی با پرامپت‌نویسی کلاسیک اینجاست:

Prompt Engineering =
نوشتن دستور برای یک بار پاسخ.

Agent Engineering =
طراحی کل رفتار، حافظه، و کانتکست برای یک ایجنت دائمی.

💡 مقاله توضیح میده چطور باید context engineering رو جدی بگیریم: از مدیریت تاریخچه و اهداف تا انتخاب معماری حافظه.

📄 متن کامل:
anthropic.com/engineering/effective-context-engineering-for-ai-agents

@rss_ai_ir 🤖

#هوش_مصنوعی #LLM #AgentEngineering #PromptEngineering #Anthropic #AI

1.19K views12:19

0:40

🎬 در meta.ai حالا میشه نمونه‌هایی شبیه Vine دید.

⛔️به نظرم از نظر مکانیک خیلی عقب‌تر از Sora ـه،
ولی خب این رقابت سریع پیش میره – بعید نیست ظرف چند هفته متا هم Cameo رو به سرویسش اضافه کنه.
@rss_ai_ir
#هوش_مصنوعی #MetaAI #Sora #دیپ‌فیک #AI #GenerativeAI

1.15K views12:23

🔦 تولید تصویر با نور، نه GPU!

محققان دانشگاه UCLA یک مدل مولد نوری معرفی کرده‌اند که به جای تراشه‌ها و محاسبات سنگین، از نور و لنزها برای ساخت تصویر استفاده می‌کند.

🔬 چطور کار می‌کند؟
1️⃣ یک انکودر دیجیتال سبک، نویز اولیه را به یک الگوی فاز تبدیل می‌کند.
2️⃣ این الگو روی یک مدولاتور نوری (SLM) بارگذاری می‌شود.
3️⃣ نور از یک دی‌کدر پراش عبور می‌کند و تصویر مستقیم روی سنسور شکل می‌گیرد.

✔️ نتایج آزمایشی:

♻️تولید اعداد، چهره‌ها، پروانه‌ها و حتی نقاشی‌هایی در سبک «ون گوگ» 🎨
♻️کیفیت قابل مقایسه با مدل‌های دیفیوژن مدرن
♻️دو نسخه: تولید فوری (یک‌مرحله‌ای) و تولید تدریجی (چند مرحله‌ای مثل دیفیوژن)

⚡ چرا مهم است؟

✅بدون بار محاسباتی CPU/GPU
✅فوق سریع؛ قوانین فیزیک نور همان چیزی را انجام می‌دهند که GPU با میلیاردها عملیات محاسبه می‌کند
✅گامی به سوی هوش مصنوعی فوق کم‌مصرف برای دستگاه‌های AR/VR، دوربین‌های موبایل و سنسورهای فشرده

⚠️ چالش‌ها:

✳️دشواری در هم‌ترازی اجزای اپتیکی
✳️محدودیت در دقت ماسک‌های فاز
✳️حساسیت به کیفیت تجهیزات (نویز، عمق بیت و...)

⛔️با وجود این محدودیت‌ها، این تحقیق اولین قدم به سوی نسل جدیدی از هوش مصنوعی فوتونیکی است؛ جایی که محاسبات جای خود را به نور می‌دهند.

منبع: Nature 🔗
#هوش_مصنوعی #اپتیک #فوتونیک #تولید_تصویر #AI
@rss_ai_ir

1.17K views17:07

🚀 IBM Granite 4.0 معرفی شد
— خانواده‌ای تازه از مدل‌های زبانی متن‌باز با وزن‌های آزاد، از ۳B تا ۳۲B پارامتر.

🔹 چهار مدل جدید:

♻️Granite 4.0 H Small — 32B / 9B پارامتر فعال
♻️Granite 4.0 H Tiny — 7B / 1B
♻️Granite 4.0 H Micro — 3B / 3B
♻️Granite 4.0 Micro — 3B / 3B

📊 بنچمارک (Artificial Analysis Index):

Granite 4.0 H Small → امتیاز 23 (۸ امتیاز بالاتر از Granite 3.3 8B) — بهتر از Gemma 3 27B (22)، اما ضعیف‌تر از Mistral Small 3.2 (29) و Qwen3 30B A3B (37).

Granite 4.0 Micro → امتیاز 16 — بهتر از Gemma 3 4B (15) و LFM 2 2.6B (12).

⚡ کارایی توکن:

Granite 4.0 Small → 5.2M tokens

Granite 4.0 Micro → 6.7M tokens
(کارایی به‌مراتب بالاتر از Granite 3.3 8B و بیشتر مدل‌های زیر 40B بدون قابلیت reasoning).

🔑 جزئیات فنی:

✳️کانتکست: تا 128K tokens
✳️لایسنس: Apache 2.0
✳️همچنین Granite 4.0 H Small روی Replicate با هزینه 0.06$ / 0.25$ به ازای ۱M توکن ورودی/خروجی
✳️همه مدل‌ها روی Hugging Face در دسترس هستند
✳️مدل Micro (3.4B) را می‌توان کاملاً لوکال اجرا کرد.

🔗 Hugging Face
🔗 Unsloth

@rss_ai_ir

#AI #IBM #Granite4 #LLM #OpenWeights

1.17K views10:49

🚀🤖 ربات کروی 3.0 از آزمایشگاه Guangming و شرکت FLERA

🔵 چین دوباره با یک نوآوری جالب در حوزه رباتیک خبرساز شد: ربات کروی 3.0 که در نمایش ویدیویی جدید معرفی شده است.

✨ ویژگی‌ها:

✳️طراحی کاملاً کروی برای حرکت روان و همه‌جهته روی سطوح مختلف
✳️بهبود چشمگیر در پایداری (Stability Enhancement) نسبت به نسخه‌های قبلی
✳️قابلیت عبور از موانع و حرکت در شرایط پیچیده محیطی
✳️وزن سبک و ابعاد جمع‌وجور، مناسب برای آزمایش‌های رباتیک و محیط‌های واقعی

⚙️ نکته جالب این نسخه، استفاده از سیستم‌های تقویت‌کننده پایداری است که باعث می‌شود ربات در زمان حرکت یا توقف کمتر دچار لرزش شود. همچنین تست‌های عبور از موانع نشان داده‌اند که این ربات به‌راحتی می‌تواند از سیم‌ها، اشیاء کوچک و سطح‌های ناهموار عبور کند.

📽 در ویدیوی منتشرشده، می‌توان مقایسه‌ی حالت قبل و بعد (Before/After) را دید که نشان‌دهنده‌ی ارتقای محسوس در عملکرد است.

🌍 چنین ربات‌هایی می‌توانند در آینده برای کاوش محیط‌های خطرناک، عملیات نجات، پایش صنعتی و حتی مأموریت‌های فضایی استفاده شوند.

@rss_ai_ir

#رباتیک #AI #چین #ربات_کروی #نوآوری #فناوری

1.91K views10:54

0:30

⚡️ انتشار Agent S3 – عامل هوشمند پیشرفته برای کنترل رایانه در سطح نزدیک به انسان

🔹 تیم Simular AI از نسل جدید عامل‌ها رونمایی کرد: Agent S3.
به‌جای پیچیده‌تر کردن یک مدل، این رویکرد چندین عامل را به‌طور موازی اجرا می‌کند و سپس بهترین نتیجه انتخاب می‌شود. این روش جدید با نام Behavior Best-of-N (bBoN) معرفی شده است.

🔍 نحوه کار:

✳️هر عامل تلاش می‌کند مسئله را حل کند.
✳️اقدامات او به یک روایت رفتاری (Behavioral Narrative) تبدیل می‌شود – توضیح کوتاهی از تغییرات واقعی روی صفحه.
✳️یک داور ویژه این روایت‌ها را مقایسه کرده و بهترین عملکرد را انتخاب می‌کند.

📊 نتایج کلیدی:

♻️GPT-5 با 10 عامل موازی → دقت 69.9٪
♻️GPT-5 Mini → دقت 60.2٪
♻️Agent S3 → بیش از 10٪ بهتر از بهترین روش‌های قبلی (SOTA)

📄 مقاله: arxiv.org/abs/2510.02250
💻 کد: github.com/simular-ai/Agent-S
📝 بلاگ: simular.ai/articles/agent-s3

@rss_ai_ir

#هوش_مصنوعی #AgentS3 #SimularAI #عامل_هوشمند #AI #Agents

1.92K views10:56

0:07