VIRSUN

🚀 Physics با Sora 2
… و کمی انیمه 🎬

⛔️مجموعه OpenAI در نسخه‌ی جدید Sora 2 نه‌تنها کیفیت و واقع‌گرایی تولید ویدیو را ارتقا داده، بلکه امکان شبیه‌سازی دقیق‌تر فیزیک اجسام و محیط را هم اضافه کرده است.
یعنی حالا می‌توانید حرکت مایعات، پرتاب اجسام یا حتی سقوط طبیعی یک شخصیت را با دقتی بسیار بالاتر تجربه کنید.

✨ و برای علاقه‌مندان به فرهنگ پاپ، دموی جدید Sora 2 پر از استایل انیمه‌ای است — ترکیب جذاب بین واقعیت فیزیکی و دنیای هنری ژاپنی.

❌این یعنی آینده‌ی ویدیوهای مولد هوش مصنوعی در دو مسیر همزمان حرکت می‌کند:

1. دقت علمی و فیزیکی برای شبیه‌سازی‌های جدی و صنعتی 🏭⚙️
2. خلاقیت هنری برای تولید محتوا، سرگرمی و انیمیشن 🎨🎥

به نظر شما، کدام بخش زودتر به بلوغ می‌رسد: شبیه‌سازی‌های فیزیکی برای صنعت یا استایل‌های هنری برای سرگرمی؟ 🤔

@rss_ai_ir

#هوش_مصنوعی #Sora2 #انیمه #فیزیک #تولید_ویدیو 🚀

1.13K views15:15

VIRSUN

🧠 معرفی AlphaEvolve توسط Google/DeepMind: هوش مصنوعی در خدمت کشف نتایج جدید در ریاضیات و علوم کامپیوتر تئوری

🔍 چطور کار می‌کند؟
مدل‌های زبانی معمولاً سعی می‌کنند کل اثبات را یک‌جا بنویسند، اما این کار بسیار پیچیده و غیرقابل‌اعتماد است.

⛔️همچنین AlphaEvolve رویکرد متفاوتی دارد:
✅به جای نوشتن اثبات کامل، اجزای کوچک‌تری به نام gadget تولید می‌کند.
این تکه‌ها به‌سرعت و به‌صورت خودکار قابل‌بررسی‌اند و اگر درست باشند، می‌توان آن‌ها را در کنار هم قرار داد و به قضایای بزرگ‌تر رسید.

📈 چه چیزهایی پیدا شده است؟

✅یک نتیجه‌ی جدید برای مسئله‌ی MAX-4-CUT (یکی از مسائل نظریه الگوریتم‌ها و بهینه‌سازی ترکیبیاتی، نسخه‌ای از MAX-CUT کلاسیک).

✅کران‌های پایینی قوی‌تر برای مسائل روی گراف‌های تصادفی، از جمله کار روی گراف‌های رامانوجان.

✅سرعت بررسی قضایا نسبت به روش‌های سنتی ۱۰٬۰۰۰ برابر سریع‌تر شده است.

🧩 چرا مهم است؟

ریاضیات نیازمند دقت ۱۰۰٪ است؛ اینجا هوش مصنوعی نقش تولیدکننده ایده را دارد و بخش بررسی همچنان دقیق و رسمی باقی می‌ماند.

این رویکرد می‌تواند سال‌ها کار انسانی را ذخیره کند و راه را برای کشف قضایا و الگوریتم‌های جدید باز کند.

📄 جزییات بیشتر:
research.google/blog/ai-as-a-research-partner-advancing-theoretical-computer-science-with-alphaevolve/

@rss_ai_ir

#هوش_مصنوعی #ریاضیات #دیپ‌مایند #پژوهش #LLM

❤1👍1🔥1

1.14K views15:25

VIRSUN

⚡️ تغییر اتو‌انکودر در مدل‌های latent diffusion ساده‌تر از آن چیزی است که فکر می‌کنید!

🚀 اDC-Gen یک فریم‌ورک جدید برای شتاب‌بخشی مدل‌های دیفیوشن پس از آموزش است.
این روش هر مدل آماده را به یک فضای نهفته‌ی فشرده منتقل می‌کند و هم هزینه را کاهش می‌دهد و هم سرعت تولید را چندین برابر می‌کند.

🔑 ویژگی‌های کلیدی:

🎯 وضوح بالا بدون افت کیفیت
نسخه‌ی DC-Gen-FLUX.1-Krea-12B همان کیفیت نسخه اصلی را دارد اما ۵۳ برابر سریع‌تر روی H100 در حالت 4K اجرا می‌شود.
با NVFP4، تولید تصویر 4K تنها ۳.۵ ثانیه روی یک کارت NVIDIA 5090 (۲۰ مرحله) طول می‌کشد.

💸 هزینه پایین برای انطباق
انتقال مدل FLUX.1-Krea-12B به اتوانکودر عمیقاً فشرده تنها ۴۰ روز GPU روی H100 نیاز دارد.

📄 مقاله:
arxiv.org/abs/2509.25180
💻 کد:
github.com/dc-ai-projects/DC-Gen
🎨 مدل‌ها:
huggingface.co/dc-ai/dc-gen

@rss_ai_ir

#هوش_مصنوعی #دیفیوشن #یادگیری_عمیق #AI

👍1🔥1👏1

1.15K views15:32

VIRSUN

🔥 خسته شدید از RLHF و RLVR؟ حالا روش جدیدی معرفی شده به نام Critique Reinforcement Learning (CRL)!

🧠 ایده اصلی:
در الگوریتم‌های معمولی RL، مدل یاد می‌گیرد پاسخ نهایی بدهد.
اما در CRL مدل به جای تولید پاسخ، یاد می‌گیرد راه‌حل موجود را نقد و بررسی کند و مرحله‌به‌مرحله صحت آن را بسنجد.
پاداش هم نه برای جواب، بلکه برای نقد مفید و سازنده‌ای داده می‌شود که در نهایت به قضاوت درست (True/False) منجر شود.

🚀 نتایج آزمایش‌ها:

✅مدل Critique-Coder 4B توانست در LiveCodeBench-V5 امتیاز ۶۲٪ بگیرد — بالاتر از مدل 14B DeepCoder.

✅این آموزش روی rStar-Coder با روش GRPO انجام شده است.

✅مدل‌های 4B و 8B در سایز خودشان به بهترین‌ها تبدیل شدند.

📄 مقاله:
arxiv.org/abs/2509.22824
🌐 وبسایت:
tiger-ai-lab.github.io/Critique-Coder
🤗 مدل‌ها:
HuggingFace Collection

@rss_ai_ir

#هوش_مصنوعی #RL #LLM #یادگیری_تقویتی

👍1🔥1👏1

1.14K views17:18

🏫 Leju Robotics
مرکز عظیم آموزش ربات‌ها را در پکن افتتاح کرد 🇨🇳

شرکت چینی Leju Robotics فضایی به وسعت ۱۰ هزار مترمربع را برای جمع‌آوری داده‌های آموزشی ربات‌ها تجهیز کرده است.
🔹 در این مرکز، سناریوهای مختلفی شبیه‌سازی می‌شوند:
کار در فروشگاه 🛒
فعالیت در محیط‌های صنعتی 🏭
وظایف خانگی 🏠

🔹 داده‌ها به کمک لباس‌های موشن کپچر و کنترلرها ثبت می‌شوند تا حرکت‌ها و تعاملات انسانی دقیقاً به ربات‌ها منتقل گردد.
این مرکز با حمایت مستقیم دولت چین راه‌اندازی شده و هدف اصلی آن حل مشکل کمبود داده برای آموزش مدل‌های رباتیک است.
به نظر می‌رسد رقابت چین و آمریکا در حوزه رباتیک و هوش مصنوعی وارد مرحله‌ای داغ‌تر شده است 🔥

@rss_ai_ir
#رباتیک #چین #هوش_مصنوعی #DigitalTwin #AI

🔥2👏1🙏1

1.2K views17:48

VIRSUN

0:03

This media is not supported in your browser

VIEW IN TELEGRAM

🔩 آموزش عامل‌محور با محوریت کد 🔩

👉 تیم Show Lab از چارچوب جدیدی با نام Code2Video رونمایی کرده است؛ یک سیستم هوشمند عامل‌محور که از کدهای اجرایی برای تولید ویدئوهای آموزشی با کیفیت بالا استفاده می‌کند.

❌ برخلاف مدل‌های سنتی Text-to-Video که بر پایه پیکسل کار می‌کنند،

✅ این رویکرد با تکیه بر کد Manim (ابزار شبیه‌سازی ریاضی) تضمین می‌کند که ویدئوها شفاف، منسجم و قابل بازتولید باشند.

📌 مزایا:

✳️ویدئوهای آموزشی دقیق و قابل فهم
✳️تولید محتوای علمی بدون خطاهای بصری
✳️امکان بازتولید و ویرایش آسان با تغییر کد

📖 مقاله: arxiv.org/pdf/2510.01174
💻 ریپو: github.com/showlab/Code2Video
🌐 پروژه: showlab.github.io/Code2Video

@rss_ai_ir

#AI #Education #AgenticAI #Manim #Code2Video

❤2👍1👏1👌1

344 views07:33

VIRSUN

🚀 در ByteDance Seed تکنیک جدیدی برای آموزش LLM معرفی شد: Knapsack RL

🔍 مشکل در RL کلاسیک:

در کارهای ساده همیشه موفقیت → بدون گرادیان
در کارهای سخت همیشه شکست → باز هم بدون گرادیان

💡 راهکار:
به جای توزیع یکنواخت rolloutها، بودجه محاسباتی مثل یک مسئله کوله‌پشتی (Knapsack) روی مواردی صرف می‌شود که واقعاً سیگنال آموزشی می‌دهند.

✨ نتایج:

🔼 ‌+20–40% گرادیان‌های غیرصفر بیشتر
🧮 تا 93 rollout برای مسائل سخت (بدون هزینه اضافه)
📈 ‌+2–4 امتیاز میانگین، تا +9 در ریاضیات
💰 ‌حدوداً دو برابر ارزان‌تر از روش توزیع یکنواخت

📄 جزییات بیشتر:
huggingface.co/papers/2509.25849

@rss_ai_ir 🤖

#هوش_مصنوعی #یادگیری_تقویتی #LLM #KnapsackRL #ByteDance #ماشین_لرنینگ #یادگیری_عمیق #AI #RLHF #MachineLearning

1.1K views12:12

VIRSUN

🎥 در Sora حالا پر از دیپ‌فیک‌های سم آلتمن شده!

🧩 مجموعه OpenAI اپلیکیشن اجتماعی جدیدی با سیستم cameo راه‌اندازی کرده:

♻️افراد می‌تونن اجازه بدن چهره‌شون در ویدئوهای ساخته‌شده استفاده بشه.

♻️برای این کار باید یک کلیپ بیومتریک کوتاه ضبط کنن (خوندن اعداد، چرخش سر، بررسی لباس) و سطح دسترسی رو انتخاب کنن.

😅 سم آلتمن دسترسی رو روی «برای همه» گذاشته → حالا صورتش تو ویدئوهای پوکمون، اسکتچ‌های فست‌فود و حتی «سرقت‌های GPU تقلبی» دیده میشه.

🚀 اما Sora فقط به متن بسنده نمی‌کنه:

✳️همچنین IP کاربر رو تحلیل می‌کنه تا کانتکست محلی اضافه کنه (شهر، تیم ورزشی، مناظر).
✳️از گفتگوهای قبلی ChatGPT استفاده می‌کنه تا علایق و سبک شما وارد ویدئو بشه.

📌 مثال: کاربری از فیلادلفیا «ویدئوی بیسبال» خواست → Sora به‌طور خودکار ویدئویی از Phillies ساخت.

👉 این یعنی گذر از «متن → ویدئو» به سمت ویدئوی شخصی‌سازی عمیق، جایی که داده‌های شما و محیط اطراف‌تون بخشی از خروجی میشن.

@rss_ai_ir 🤖

#هوش_مصنوعی #دیپ_فیک #Sora #OpenAI #SamAltman #AI #تولید_محتوا

❤1

1.16K viewsedited 12:13

VIRSUN

📘 Anthropic منتشر کرد:
گاید عالی برای تنظیم مؤثر ایجنت‌ها

🔑 فرق اصلی با پرامپت‌نویسی کلاسیک اینجاست:

Prompt Engineering =
نوشتن دستور برای یک بار پاسخ.

Agent Engineering =
طراحی کل رفتار، حافظه، و کانتکست برای یک ایجنت دائمی.

💡 مقاله توضیح میده چطور باید context engineering رو جدی بگیریم: از مدیریت تاریخچه و اهداف تا انتخاب معماری حافظه.

📄 متن کامل:
anthropic.com/engineering/effective-context-engineering-for-ai-agents

@rss_ai_ir 🤖

#هوش_مصنوعی #LLM #AgentEngineering #PromptEngineering #Anthropic #AI

1.22K views12:19

VIRSUN

0:40

This media is not supported in your browser

VIEW IN TELEGRAM

🎬 در meta.ai حالا میشه نمونه‌هایی شبیه Vine دید.

⛔️به نظرم از نظر مکانیک خیلی عقب‌تر از Sora ـه،
ولی خب این رقابت سریع پیش میره – بعید نیست ظرف چند هفته متا هم Cameo رو به سرویسش اضافه کنه.
@rss_ai_ir
#هوش_مصنوعی #MetaAI #Sora #دیپ‌فیک #AI #GenerativeAI

1.16K views12:23

VIRSUN

🔦 تولید تصویر با نور، نه GPU!

محققان دانشگاه UCLA یک مدل مولد نوری معرفی کرده‌اند که به جای تراشه‌ها و محاسبات سنگین، از نور و لنزها برای ساخت تصویر استفاده می‌کند.

🔬 چطور کار می‌کند؟
1️⃣ یک انکودر دیجیتال سبک، نویز اولیه را به یک الگوی فاز تبدیل می‌کند.
2️⃣ این الگو روی یک مدولاتور نوری (SLM) بارگذاری می‌شود.
3️⃣ نور از یک دی‌کدر پراش عبور می‌کند و تصویر مستقیم روی سنسور شکل می‌گیرد.

✔️ نتایج آزمایشی:

♻️تولید اعداد، چهره‌ها، پروانه‌ها و حتی نقاشی‌هایی در سبک «ون گوگ» 🎨
♻️کیفیت قابل مقایسه با مدل‌های دیفیوژن مدرن
♻️دو نسخه: تولید فوری (یک‌مرحله‌ای) و تولید تدریجی (چند مرحله‌ای مثل دیفیوژن)

⚡ چرا مهم است؟

✅بدون بار محاسباتی CPU/GPU
✅فوق سریع؛ قوانین فیزیک نور همان چیزی را انجام می‌دهند که GPU با میلیاردها عملیات محاسبه می‌کند
✅گامی به سوی هوش مصنوعی فوق کم‌مصرف برای دستگاه‌های AR/VR، دوربین‌های موبایل و سنسورهای فشرده

⚠️ چالش‌ها:

✳️دشواری در هم‌ترازی اجزای اپتیکی
✳️محدودیت در دقت ماسک‌های فاز
✳️حساسیت به کیفیت تجهیزات (نویز، عمق بیت و...)

⛔️با وجود این محدودیت‌ها، این تحقیق اولین قدم به سوی نسل جدیدی از هوش مصنوعی فوتونیکی است؛ جایی که محاسبات جای خود را به نور می‌دهند.

منبع: Nature 🔗
#هوش_مصنوعی #اپتیک #فوتونیک #تولید_تصویر #AI
@rss_ai_ir

1.18K views17:07

About

Blog

Apps

Platform