This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 Physics با Sora 2
… و کمی انیمه 🎬
⛔️مجموعه OpenAI در نسخهی جدید Sora 2 نهتنها کیفیت و واقعگرایی تولید ویدیو را ارتقا داده، بلکه امکان شبیهسازی دقیقتر فیزیک اجسام و محیط را هم اضافه کرده است.
یعنی حالا میتوانید حرکت مایعات، پرتاب اجسام یا حتی سقوط طبیعی یک شخصیت را با دقتی بسیار بالاتر تجربه کنید.
✨ و برای علاقهمندان به فرهنگ پاپ، دموی جدید Sora 2 پر از استایل انیمهای است — ترکیب جذاب بین واقعیت فیزیکی و دنیای هنری ژاپنی.
❌این یعنی آیندهی ویدیوهای مولد هوش مصنوعی در دو مسیر همزمان حرکت میکند:
1. دقت علمی و فیزیکی برای شبیهسازیهای جدی و صنعتی 🏭⚙️
2. خلاقیت هنری برای تولید محتوا، سرگرمی و انیمیشن 🎨🎥
به نظر شما، کدام بخش زودتر به بلوغ میرسد: شبیهسازیهای فیزیکی برای صنعت یا استایلهای هنری برای سرگرمی؟ 🤔
@rss_ai_ir
#هوش_مصنوعی #Sora2 #انیمه #فیزیک #تولید_ویدیو 🚀
… و کمی انیمه 🎬
⛔️مجموعه OpenAI در نسخهی جدید Sora 2 نهتنها کیفیت و واقعگرایی تولید ویدیو را ارتقا داده، بلکه امکان شبیهسازی دقیقتر فیزیک اجسام و محیط را هم اضافه کرده است.
یعنی حالا میتوانید حرکت مایعات، پرتاب اجسام یا حتی سقوط طبیعی یک شخصیت را با دقتی بسیار بالاتر تجربه کنید.
✨ و برای علاقهمندان به فرهنگ پاپ، دموی جدید Sora 2 پر از استایل انیمهای است — ترکیب جذاب بین واقعیت فیزیکی و دنیای هنری ژاپنی.
❌این یعنی آیندهی ویدیوهای مولد هوش مصنوعی در دو مسیر همزمان حرکت میکند:
1. دقت علمی و فیزیکی برای شبیهسازیهای جدی و صنعتی 🏭⚙️
2. خلاقیت هنری برای تولید محتوا، سرگرمی و انیمیشن 🎨🎥
به نظر شما، کدام بخش زودتر به بلوغ میرسد: شبیهسازیهای فیزیکی برای صنعت یا استایلهای هنری برای سرگرمی؟ 🤔
@rss_ai_ir
#هوش_مصنوعی #Sora2 #انیمه #فیزیک #تولید_ویدیو 🚀
🧠 معرفی AlphaEvolve توسط Google/DeepMind: هوش مصنوعی در خدمت کشف نتایج جدید در ریاضیات و علوم کامپیوتر تئوری
🔍 چطور کار میکند؟
مدلهای زبانی معمولاً سعی میکنند کل اثبات را یکجا بنویسند، اما این کار بسیار پیچیده و غیرقابلاعتماد است.
⛔️همچنین AlphaEvolve رویکرد متفاوتی دارد:
✅به جای نوشتن اثبات کامل، اجزای کوچکتری به نام gadget تولید میکند.
این تکهها بهسرعت و بهصورت خودکار قابلبررسیاند و اگر درست باشند، میتوان آنها را در کنار هم قرار داد و به قضایای بزرگتر رسید.
📈 چه چیزهایی پیدا شده است؟
✅یک نتیجهی جدید برای مسئلهی MAX-4-CUT (یکی از مسائل نظریه الگوریتمها و بهینهسازی ترکیبیاتی، نسخهای از MAX-CUT کلاسیک).
✅کرانهای پایینی قویتر برای مسائل روی گرافهای تصادفی، از جمله کار روی گرافهای رامانوجان.
✅سرعت بررسی قضایا نسبت به روشهای سنتی ۱۰٬۰۰۰ برابر سریعتر شده است.
🧩 چرا مهم است؟
ریاضیات نیازمند دقت ۱۰۰٪ است؛ اینجا هوش مصنوعی نقش تولیدکننده ایده را دارد و بخش بررسی همچنان دقیق و رسمی باقی میماند.
این رویکرد میتواند سالها کار انسانی را ذخیره کند و راه را برای کشف قضایا و الگوریتمهای جدید باز کند.
📄 جزییات بیشتر:
research.google/blog/ai-as-a-research-partner-advancing-theoretical-computer-science-with-alphaevolve/
@rss_ai_ir
#هوش_مصنوعی #ریاضیات #دیپمایند #پژوهش #LLM
🔍 چطور کار میکند؟
مدلهای زبانی معمولاً سعی میکنند کل اثبات را یکجا بنویسند، اما این کار بسیار پیچیده و غیرقابلاعتماد است.
⛔️همچنین AlphaEvolve رویکرد متفاوتی دارد:
✅به جای نوشتن اثبات کامل، اجزای کوچکتری به نام gadget تولید میکند.
این تکهها بهسرعت و بهصورت خودکار قابلبررسیاند و اگر درست باشند، میتوان آنها را در کنار هم قرار داد و به قضایای بزرگتر رسید.
📈 چه چیزهایی پیدا شده است؟
✅یک نتیجهی جدید برای مسئلهی MAX-4-CUT (یکی از مسائل نظریه الگوریتمها و بهینهسازی ترکیبیاتی، نسخهای از MAX-CUT کلاسیک).
✅کرانهای پایینی قویتر برای مسائل روی گرافهای تصادفی، از جمله کار روی گرافهای رامانوجان.
✅سرعت بررسی قضایا نسبت به روشهای سنتی ۱۰٬۰۰۰ برابر سریعتر شده است.
🧩 چرا مهم است؟
ریاضیات نیازمند دقت ۱۰۰٪ است؛ اینجا هوش مصنوعی نقش تولیدکننده ایده را دارد و بخش بررسی همچنان دقیق و رسمی باقی میماند.
این رویکرد میتواند سالها کار انسانی را ذخیره کند و راه را برای کشف قضایا و الگوریتمهای جدید باز کند.
📄 جزییات بیشتر:
research.google/blog/ai-as-a-research-partner-advancing-theoretical-computer-science-with-alphaevolve/
@rss_ai_ir
#هوش_مصنوعی #ریاضیات #دیپمایند #پژوهش #LLM
❤1👍1🔥1
⚡️ تغییر اتوانکودر در مدلهای latent diffusion سادهتر از آن چیزی است که فکر میکنید!
🚀 اDC-Gen یک فریمورک جدید برای شتاببخشی مدلهای دیفیوشن پس از آموزش است.
این روش هر مدل آماده را به یک فضای نهفتهی فشرده منتقل میکند و هم هزینه را کاهش میدهد و هم سرعت تولید را چندین برابر میکند.
🔑 ویژگیهای کلیدی:
🎯 وضوح بالا بدون افت کیفیت
نسخهی DC-Gen-FLUX.1-Krea-12B همان کیفیت نسخه اصلی را دارد اما ۵۳ برابر سریعتر روی H100 در حالت 4K اجرا میشود.
با NVFP4، تولید تصویر 4K تنها ۳.۵ ثانیه روی یک کارت NVIDIA 5090 (۲۰ مرحله) طول میکشد.
💸 هزینه پایین برای انطباق
انتقال مدل FLUX.1-Krea-12B به اتوانکودر عمیقاً فشرده تنها ۴۰ روز GPU روی H100 نیاز دارد.
📄 مقاله:
arxiv.org/abs/2509.25180
💻 کد:
github.com/dc-ai-projects/DC-Gen
🎨 مدلها:
huggingface.co/dc-ai/dc-gen
@rss_ai_ir
#هوش_مصنوعی #دیفیوشن #یادگیری_عمیق #AI
🚀 اDC-Gen یک فریمورک جدید برای شتاببخشی مدلهای دیفیوشن پس از آموزش است.
این روش هر مدل آماده را به یک فضای نهفتهی فشرده منتقل میکند و هم هزینه را کاهش میدهد و هم سرعت تولید را چندین برابر میکند.
🔑 ویژگیهای کلیدی:
🎯 وضوح بالا بدون افت کیفیت
نسخهی DC-Gen-FLUX.1-Krea-12B همان کیفیت نسخه اصلی را دارد اما ۵۳ برابر سریعتر روی H100 در حالت 4K اجرا میشود.
با NVFP4، تولید تصویر 4K تنها ۳.۵ ثانیه روی یک کارت NVIDIA 5090 (۲۰ مرحله) طول میکشد.
💸 هزینه پایین برای انطباق
انتقال مدل FLUX.1-Krea-12B به اتوانکودر عمیقاً فشرده تنها ۴۰ روز GPU روی H100 نیاز دارد.
📄 مقاله:
arxiv.org/abs/2509.25180
💻 کد:
github.com/dc-ai-projects/DC-Gen
🎨 مدلها:
huggingface.co/dc-ai/dc-gen
@rss_ai_ir
#هوش_مصنوعی #دیفیوشن #یادگیری_عمیق #AI
👍1🔥1👏1
🔥 خسته شدید از RLHF و RLVR؟ حالا روش جدیدی معرفی شده به نام Critique Reinforcement Learning (CRL)!
🧠 ایده اصلی:
در الگوریتمهای معمولی RL، مدل یاد میگیرد پاسخ نهایی بدهد.
اما در CRL مدل به جای تولید پاسخ، یاد میگیرد راهحل موجود را نقد و بررسی کند و مرحلهبهمرحله صحت آن را بسنجد.
پاداش هم نه برای جواب، بلکه برای نقد مفید و سازندهای داده میشود که در نهایت به قضاوت درست (True/False) منجر شود.
🚀 نتایج آزمایشها:
✅مدل Critique-Coder 4B توانست در LiveCodeBench-V5 امتیاز ۶۲٪ بگیرد — بالاتر از مدل 14B DeepCoder.
✅این آموزش روی rStar-Coder با روش GRPO انجام شده است.
✅مدلهای 4B و 8B در سایز خودشان به بهترینها تبدیل شدند.
📄 مقاله:
arxiv.org/abs/2509.22824
🌐 وبسایت:
tiger-ai-lab.github.io/Critique-Coder
🤗 مدلها:
HuggingFace Collection
@rss_ai_ir
#هوش_مصنوعی #RL #LLM #یادگیری_تقویتی
🧠 ایده اصلی:
در الگوریتمهای معمولی RL، مدل یاد میگیرد پاسخ نهایی بدهد.
اما در CRL مدل به جای تولید پاسخ، یاد میگیرد راهحل موجود را نقد و بررسی کند و مرحلهبهمرحله صحت آن را بسنجد.
پاداش هم نه برای جواب، بلکه برای نقد مفید و سازندهای داده میشود که در نهایت به قضاوت درست (True/False) منجر شود.
🚀 نتایج آزمایشها:
✅مدل Critique-Coder 4B توانست در LiveCodeBench-V5 امتیاز ۶۲٪ بگیرد — بالاتر از مدل 14B DeepCoder.
✅این آموزش روی rStar-Coder با روش GRPO انجام شده است.
✅مدلهای 4B و 8B در سایز خودشان به بهترینها تبدیل شدند.
📄 مقاله:
arxiv.org/abs/2509.22824
🌐 وبسایت:
tiger-ai-lab.github.io/Critique-Coder
🤗 مدلها:
HuggingFace Collection
@rss_ai_ir
#هوش_مصنوعی #RL #LLM #یادگیری_تقویتی
👍1🔥1👏1
Media is too big
VIEW IN TELEGRAM
🏫 Leju Robotics
مرکز عظیم آموزش رباتها را در پکن افتتاح کرد 🇨🇳
شرکت چینی Leju Robotics فضایی به وسعت ۱۰ هزار مترمربع را برای جمعآوری دادههای آموزشی رباتها تجهیز کرده است.
🔹 در این مرکز، سناریوهای مختلفی شبیهسازی میشوند:
کار در فروشگاه 🛒
فعالیت در محیطهای صنعتی 🏭
وظایف خانگی 🏠
🔹 دادهها به کمک لباسهای موشن کپچر و کنترلرها ثبت میشوند تا حرکتها و تعاملات انسانی دقیقاً به رباتها منتقل گردد.
این مرکز با حمایت مستقیم دولت چین راهاندازی شده و هدف اصلی آن حل مشکل کمبود داده برای آموزش مدلهای رباتیک است.
به نظر میرسد رقابت چین و آمریکا در حوزه رباتیک و هوش مصنوعی وارد مرحلهای داغتر شده است 🔥
@rss_ai_ir
#رباتیک #چین #هوش_مصنوعی #DigitalTwin #AI
مرکز عظیم آموزش رباتها را در پکن افتتاح کرد 🇨🇳
شرکت چینی Leju Robotics فضایی به وسعت ۱۰ هزار مترمربع را برای جمعآوری دادههای آموزشی رباتها تجهیز کرده است.
🔹 در این مرکز، سناریوهای مختلفی شبیهسازی میشوند:
کار در فروشگاه 🛒
فعالیت در محیطهای صنعتی 🏭
وظایف خانگی 🏠
🔹 دادهها به کمک لباسهای موشن کپچر و کنترلرها ثبت میشوند تا حرکتها و تعاملات انسانی دقیقاً به رباتها منتقل گردد.
این مرکز با حمایت مستقیم دولت چین راهاندازی شده و هدف اصلی آن حل مشکل کمبود داده برای آموزش مدلهای رباتیک است.
به نظر میرسد رقابت چین و آمریکا در حوزه رباتیک و هوش مصنوعی وارد مرحلهای داغتر شده است 🔥
@rss_ai_ir
#رباتیک #چین #هوش_مصنوعی #DigitalTwin #AI
🔥2👏1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🔩 آموزش عاملمحور با محوریت کد 🔩
👉 تیم Show Lab از چارچوب جدیدی با نام Code2Video رونمایی کرده است؛ یک سیستم هوشمند عاملمحور که از کدهای اجرایی برای تولید ویدئوهای آموزشی با کیفیت بالا استفاده میکند.
❌ برخلاف مدلهای سنتی Text-to-Video که بر پایه پیکسل کار میکنند،
✅ این رویکرد با تکیه بر کد Manim (ابزار شبیهسازی ریاضی) تضمین میکند که ویدئوها شفاف، منسجم و قابل بازتولید باشند.
📌 مزایا:
✳️ویدئوهای آموزشی دقیق و قابل فهم
✳️تولید محتوای علمی بدون خطاهای بصری
✳️امکان بازتولید و ویرایش آسان با تغییر کد
📖 مقاله: arxiv.org/pdf/2510.01174
💻 ریپو: github.com/showlab/Code2Video
🌐 پروژه: showlab.github.io/Code2Video
@rss_ai_ir
#AI #Education #AgenticAI #Manim #Code2Video
👉 تیم Show Lab از چارچوب جدیدی با نام Code2Video رونمایی کرده است؛ یک سیستم هوشمند عاملمحور که از کدهای اجرایی برای تولید ویدئوهای آموزشی با کیفیت بالا استفاده میکند.
❌ برخلاف مدلهای سنتی Text-to-Video که بر پایه پیکسل کار میکنند،
✅ این رویکرد با تکیه بر کد Manim (ابزار شبیهسازی ریاضی) تضمین میکند که ویدئوها شفاف، منسجم و قابل بازتولید باشند.
📌 مزایا:
✳️ویدئوهای آموزشی دقیق و قابل فهم
✳️تولید محتوای علمی بدون خطاهای بصری
✳️امکان بازتولید و ویرایش آسان با تغییر کد
📖 مقاله: arxiv.org/pdf/2510.01174
💻 ریپو: github.com/showlab/Code2Video
🌐 پروژه: showlab.github.io/Code2Video
@rss_ai_ir
#AI #Education #AgenticAI #Manim #Code2Video
❤1👍1👏1👌1
🚀 در ByteDance Seed تکنیک جدیدی برای آموزش LLM معرفی شد: Knapsack RL
🔍 مشکل در RL کلاسیک:
در کارهای ساده همیشه موفقیت → بدون گرادیان
در کارهای سخت همیشه شکست → باز هم بدون گرادیان
💡 راهکار:
به جای توزیع یکنواخت rolloutها، بودجه محاسباتی مثل یک مسئله کولهپشتی (Knapsack) روی مواردی صرف میشود که واقعاً سیگنال آموزشی میدهند.
✨ نتایج:
🔼 +20–40% گرادیانهای غیرصفر بیشتر
🧮 تا 93 rollout برای مسائل سخت (بدون هزینه اضافه)
📈 +2–4 امتیاز میانگین، تا +9 در ریاضیات
💰 حدوداً دو برابر ارزانتر از روش توزیع یکنواخت
📄 جزییات بیشتر:
huggingface.co/papers/2509.25849
@rss_ai_ir 🤖
#هوش_مصنوعی #یادگیری_تقویتی #LLM #KnapsackRL #ByteDance #ماشین_لرنینگ #یادگیری_عمیق #AI #RLHF #MachineLearning
🔍 مشکل در RL کلاسیک:
در کارهای ساده همیشه موفقیت → بدون گرادیان
در کارهای سخت همیشه شکست → باز هم بدون گرادیان
💡 راهکار:
به جای توزیع یکنواخت rolloutها، بودجه محاسباتی مثل یک مسئله کولهپشتی (Knapsack) روی مواردی صرف میشود که واقعاً سیگنال آموزشی میدهند.
✨ نتایج:
🔼 +20–40% گرادیانهای غیرصفر بیشتر
🧮 تا 93 rollout برای مسائل سخت (بدون هزینه اضافه)
📈 +2–4 امتیاز میانگین، تا +9 در ریاضیات
💰 حدوداً دو برابر ارزانتر از روش توزیع یکنواخت
📄 جزییات بیشتر:
huggingface.co/papers/2509.25849
@rss_ai_ir 🤖
#هوش_مصنوعی #یادگیری_تقویتی #LLM #KnapsackRL #ByteDance #ماشین_لرنینگ #یادگیری_عمیق #AI #RLHF #MachineLearning
🎥 در Sora حالا پر از دیپفیکهای سم آلتمن شده!
🧩 مجموعه OpenAI اپلیکیشن اجتماعی جدیدی با سیستم cameo راهاندازی کرده:
♻️افراد میتونن اجازه بدن چهرهشون در ویدئوهای ساختهشده استفاده بشه.
♻️برای این کار باید یک کلیپ بیومتریک کوتاه ضبط کنن (خوندن اعداد، چرخش سر، بررسی لباس) و سطح دسترسی رو انتخاب کنن.
😅 سم آلتمن دسترسی رو روی «برای همه» گذاشته → حالا صورتش تو ویدئوهای پوکمون، اسکتچهای فستفود و حتی «سرقتهای GPU تقلبی» دیده میشه.
🚀 اما Sora فقط به متن بسنده نمیکنه:
✳️همچنین IP کاربر رو تحلیل میکنه تا کانتکست محلی اضافه کنه (شهر، تیم ورزشی، مناظر).
✳️از گفتگوهای قبلی ChatGPT استفاده میکنه تا علایق و سبک شما وارد ویدئو بشه.
📌 مثال: کاربری از فیلادلفیا «ویدئوی بیسبال» خواست → Sora بهطور خودکار ویدئویی از Phillies ساخت.
👉 این یعنی گذر از «متن → ویدئو» به سمت ویدئوی شخصیسازی عمیق، جایی که دادههای شما و محیط اطرافتون بخشی از خروجی میشن.
@rss_ai_ir 🤖
#هوش_مصنوعی #دیپ_فیک #Sora #OpenAI #SamAltman #AI #تولید_محتوا
🧩 مجموعه OpenAI اپلیکیشن اجتماعی جدیدی با سیستم cameo راهاندازی کرده:
♻️افراد میتونن اجازه بدن چهرهشون در ویدئوهای ساختهشده استفاده بشه.
♻️برای این کار باید یک کلیپ بیومتریک کوتاه ضبط کنن (خوندن اعداد، چرخش سر، بررسی لباس) و سطح دسترسی رو انتخاب کنن.
😅 سم آلتمن دسترسی رو روی «برای همه» گذاشته → حالا صورتش تو ویدئوهای پوکمون، اسکتچهای فستفود و حتی «سرقتهای GPU تقلبی» دیده میشه.
🚀 اما Sora فقط به متن بسنده نمیکنه:
✳️همچنین IP کاربر رو تحلیل میکنه تا کانتکست محلی اضافه کنه (شهر، تیم ورزشی، مناظر).
✳️از گفتگوهای قبلی ChatGPT استفاده میکنه تا علایق و سبک شما وارد ویدئو بشه.
📌 مثال: کاربری از فیلادلفیا «ویدئوی بیسبال» خواست → Sora بهطور خودکار ویدئویی از Phillies ساخت.
👉 این یعنی گذر از «متن → ویدئو» به سمت ویدئوی شخصیسازی عمیق، جایی که دادههای شما و محیط اطرافتون بخشی از خروجی میشن.
@rss_ai_ir 🤖
#هوش_مصنوعی #دیپ_فیک #Sora #OpenAI #SamAltman #AI #تولید_محتوا
❤1
📘 Anthropic منتشر کرد:
گاید عالی برای تنظیم مؤثر ایجنتها
🔑 فرق اصلی با پرامپتنویسی کلاسیک اینجاست:
Prompt Engineering =
نوشتن دستور برای یک بار پاسخ.
Agent Engineering =
طراحی کل رفتار، حافظه، و کانتکست برای یک ایجنت دائمی.
💡 مقاله توضیح میده چطور باید context engineering رو جدی بگیریم: از مدیریت تاریخچه و اهداف تا انتخاب معماری حافظه.
📄 متن کامل:
anthropic.com/engineering/effective-context-engineering-for-ai-agents
@rss_ai_ir 🤖
#هوش_مصنوعی #LLM #AgentEngineering #PromptEngineering #Anthropic #AI
گاید عالی برای تنظیم مؤثر ایجنتها
🔑 فرق اصلی با پرامپتنویسی کلاسیک اینجاست:
Prompt Engineering =
نوشتن دستور برای یک بار پاسخ.
Agent Engineering =
طراحی کل رفتار، حافظه، و کانتکست برای یک ایجنت دائمی.
💡 مقاله توضیح میده چطور باید context engineering رو جدی بگیریم: از مدیریت تاریخچه و اهداف تا انتخاب معماری حافظه.
📄 متن کامل:
anthropic.com/engineering/effective-context-engineering-for-ai-agents
@rss_ai_ir 🤖
#هوش_مصنوعی #LLM #AgentEngineering #PromptEngineering #Anthropic #AI
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 در meta.ai حالا میشه نمونههایی شبیه Vine دید.
⛔️به نظرم از نظر مکانیک خیلی عقبتر از Sora ـه،
ولی خب این رقابت سریع پیش میره – بعید نیست ظرف چند هفته متا هم Cameo رو به سرویسش اضافه کنه.
@rss_ai_ir
#هوش_مصنوعی #MetaAI #Sora #دیپفیک #AI #GenerativeAI
⛔️به نظرم از نظر مکانیک خیلی عقبتر از Sora ـه،
ولی خب این رقابت سریع پیش میره – بعید نیست ظرف چند هفته متا هم Cameo رو به سرویسش اضافه کنه.
@rss_ai_ir
#هوش_مصنوعی #MetaAI #Sora #دیپفیک #AI #GenerativeAI
🔦 تولید تصویر با نور، نه GPU!
محققان دانشگاه UCLA یک مدل مولد نوری معرفی کردهاند که به جای تراشهها و محاسبات سنگین، از نور و لنزها برای ساخت تصویر استفاده میکند.
🔬 چطور کار میکند؟
1️⃣ یک انکودر دیجیتال سبک، نویز اولیه را به یک الگوی فاز تبدیل میکند.
2️⃣ این الگو روی یک مدولاتور نوری (SLM) بارگذاری میشود.
3️⃣ نور از یک دیکدر پراش عبور میکند و تصویر مستقیم روی سنسور شکل میگیرد.
✔️ نتایج آزمایشی:
♻️تولید اعداد، چهرهها، پروانهها و حتی نقاشیهایی در سبک «ون گوگ» 🎨
♻️کیفیت قابل مقایسه با مدلهای دیفیوژن مدرن
♻️دو نسخه: تولید فوری (یکمرحلهای) و تولید تدریجی (چند مرحلهای مثل دیفیوژن)
⚡ چرا مهم است؟
✅بدون بار محاسباتی CPU/GPU
✅فوق سریع؛ قوانین فیزیک نور همان چیزی را انجام میدهند که GPU با میلیاردها عملیات محاسبه میکند
✅گامی به سوی هوش مصنوعی فوق کممصرف برای دستگاههای AR/VR، دوربینهای موبایل و سنسورهای فشرده
⚠️ چالشها:
✳️دشواری در همترازی اجزای اپتیکی
✳️محدودیت در دقت ماسکهای فاز
✳️حساسیت به کیفیت تجهیزات (نویز، عمق بیت و...)
⛔️با وجود این محدودیتها، این تحقیق اولین قدم به سوی نسل جدیدی از هوش مصنوعی فوتونیکی است؛ جایی که محاسبات جای خود را به نور میدهند.
منبع: Nature 🔗
#هوش_مصنوعی #اپتیک #فوتونیک #تولید_تصویر #AI
@rss_ai_ir
محققان دانشگاه UCLA یک مدل مولد نوری معرفی کردهاند که به جای تراشهها و محاسبات سنگین، از نور و لنزها برای ساخت تصویر استفاده میکند.
🔬 چطور کار میکند؟
1️⃣ یک انکودر دیجیتال سبک، نویز اولیه را به یک الگوی فاز تبدیل میکند.
2️⃣ این الگو روی یک مدولاتور نوری (SLM) بارگذاری میشود.
3️⃣ نور از یک دیکدر پراش عبور میکند و تصویر مستقیم روی سنسور شکل میگیرد.
✔️ نتایج آزمایشی:
♻️تولید اعداد، چهرهها، پروانهها و حتی نقاشیهایی در سبک «ون گوگ» 🎨
♻️کیفیت قابل مقایسه با مدلهای دیفیوژن مدرن
♻️دو نسخه: تولید فوری (یکمرحلهای) و تولید تدریجی (چند مرحلهای مثل دیفیوژن)
⚡ چرا مهم است؟
✅بدون بار محاسباتی CPU/GPU
✅فوق سریع؛ قوانین فیزیک نور همان چیزی را انجام میدهند که GPU با میلیاردها عملیات محاسبه میکند
✅گامی به سوی هوش مصنوعی فوق کممصرف برای دستگاههای AR/VR، دوربینهای موبایل و سنسورهای فشرده
⚠️ چالشها:
✳️دشواری در همترازی اجزای اپتیکی
✳️محدودیت در دقت ماسکهای فاز
✳️حساسیت به کیفیت تجهیزات (نویز، عمق بیت و...)
⛔️با وجود این محدودیتها، این تحقیق اولین قدم به سوی نسل جدیدی از هوش مصنوعی فوتونیکی است؛ جایی که محاسبات جای خود را به نور میدهند.
منبع: Nature 🔗
#هوش_مصنوعی #اپتیک #فوتونیک #تولید_تصویر #AI
@rss_ai_ir