VIRSUN
9.63K subscribers
742 photos
433 videos
3 files
477 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🗣️ داریو آمودی (مدیرعامل Anthropic):
«۷۰ تا ۹۰ درصد کدی که در Anthropic نوشته می‌شود، توسط Claude تولید می‌شود.

وقتی ۳ یا ۶ ماه پیش این حرف را زدم، خیلی‌ها فکر کردند یعنی قرار است ۷۰ تا ۹۰ درصد مهندسان نرم‌افزار اخراج شوند. اما واقعیت این است که آن ۱۰ درصد باقی‌مانده هنوز می‌نویسند – انسان‌ها عملاً تبدیل شده‌اند به مدیران سیستم‌های هوش مصنوعی.»

@rss_ai_ir

#Anthropic #Claude #هوش_مصنوعی #AI #برنامه_نویسی #اتوماسیون
🥰9🔥7👏5😁43👍3🎉2
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 تسلا Optimus واقعاً شگفت‌انگیزه! نحوه حرکتش الان خیلی نرم، دقیق و شبیه انسانه؛ بدون اون لرزش‌های عجیب که حس غیرطبیعی می‌داد. این یعنی رباتیک صنعتی رسماً وارد قلمرو علمی‌تخیلی شده.

ما داریم به چشم می‌بینیم که خودِ کار در زمان واقعی داره اتوماسیون میشه. 🤯

@rss_ai_ir

#Tesla #Optimus #ربات #هوش_مصنوعی #اتوماسیون #SciFi
🔥9🥰8👏84👍4😁4🎉1👌1
🌍📊 OmniWorld:
مجموعه‌داده چندمنظوره برای مدل‌سازی 4D

✳️مجموعه OmniWorld یک مجموعه‌داده عظیم و چندوجهی است که برای مدل‌سازی 4D طراحی شده و حوزه‌هایی چون بازسازی هندسی و تولید ویدئو را پوشش می‌دهد. این دیتاست، دامنه‌ها و فرمت‌های متنوعی را در بر می‌گیرد و چندوجهی بودن غنی را تضمین می‌کند.

🚀 ویژگی‌های کلیدی:

بیش از 4000 ساعت داده، 600 هزار توالی و 300 میلیون فریم
منابع متنوع: شبیه‌سازها، ربات‌ها، انسان‌ها و اینترنت
کیفیت بالای برچسب‌گذاری برای مدل‌سازی 4D و تولید ویدئو


📌 GitHub: OmniWorld

@rss_ai_ir

#OmniWorld #هوش_مصنوعی #مدل_سازی #GenerativeAI #Dataset #4D
😁8🔥7🎉7👍4👏43🥰3🙏1
🧬 Biostate AI
عرضه کرد: K-Dense Beta برای پژوهش طول عمر

شرکت Biostate AI نسخه بتای پلتفرم چندعاملی K-Dense را معرفی کرده است؛ سامانه‌ای که چرخه‌های تحقیق زیستی را از سال‌ها به روزها کاهش می‌دهد. این پلتفرم هم‌اکنون در همکاری با David Sinclair از هاروارد، یک جهش مهم در مطالعات ضدپیری رقم زده است.

📝 شتاب‌دهی به پژوهش:

✳️ترکیب AlphaFold، پایگاه‌های داده تخصصی و چندین مدل زبانی بزرگ (LLM)
✳️حذف خطاهای توهمی و عملکرد بهتر نسبت به GPT-5 در تست BixBench


🤖 دستاورد اولیه:

✳️ساخت «ساعت رونویسی پیری» تنها در چند هفته (به‌جای ماه‌ها)
✳️آشکارسازی برنامه‌های زیستی مرحله‌ای مرتبط با فرآیند پیری


🌐 زیرساخت فناوری:

✳️اجرا بر روی Gemini 2.5 Pro در فضای ابری گوگل
✳️طراحی‌شده به‌عنوان یک موتور پژوهشی AI-first برای زیست‌شناسی


📌 اگر نتایج پایدار بمانند، K-Dense می‌تواند به ستون فقرات تحقیقات نسل بعدی در حوزه طول عمر تبدیل شود و ما را به «سرعت گریز از پیری» نزدیک‌تر کند.
Link

@rss_ai_ir

#هوش_مصنوعی #زیست_شناسی #طول_عمر #پژوهش #AI #BiostateAI #Longevity
👍7🔥6🎉6😁5🥰43👏2🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 آموزش ربات‌ها فقط با ویدیو!

⛔️پژوهشگران دانشگاه UC Berkeley سیستمی به نام VideoMimic ساخته‌اند که به ربات‌های انسان‌نما یاد می‌دهد کارهای جدید را فقط با دیدن یک ویدیو ساده انجام دهند.

🔹 چطور کار می‌کند؟

♻️یک ویدیو از یک دوربین کافی است (مثلاً بالا رفتن از پله یا نشستن روی صندلی).
♻️سیستم صحنه را بازسازی می‌کند و در شبیه‌ساز به ربات آموزش می‌دهد.
♻️بعد از یادگیری، مهارت به ربات واقعی منتقل می‌شود.


🦾 چه کارهایی بلد شده؟

✳️بالا رفتن از پله‌های با ارتفاع مختلف.
✳️نشستن و بلند شدن از روی صندلی.
✳️راه رفتن روی سطوح ناهموار و تطبیق با محیط.


👨‍🔬 آزمایش‌ها روی ربات Unitree G1 انجام شده است. هنوز محدودیت‌هایی وجود دارد (مثل کمبود داده یا نویز در بازسازی صحنه)، اما این روش راه جدیدی را باز می‌کند:
📹 ربات‌ها می‌توانند فقط با دیدن ویدیوهایی که هر کسی ضبط می‌کند، آموزش ببینند!

این یعنی یاد دادن مهارت به ربات‌ها از همیشه ساده‌تر و در دسترس‌تر خواهد شد. 🚀


@rss_ai_ir
#هوش_مصنوعی #رباتیک #یادگیری_ماشین #ویدیو #UCberkeley #Unitree
7🥰7👍6🔥6😁4🎉3👏2
🚀 SakanaAI
و بهینه‌سازی کرنل‌های CUDA با عاملین هوشمند

شرکت SakanaAI روش جدیدی با عنوان Robust Agentic CUDA Kernel Optimization معرفی کرده است؛ رویکردی که در آن مدل‌های زبانی (LLM) به بهینه‌سازی کرنل‌های CUDA در PyTorch کمک می‌کنند.

🔹 ویژگی‌ها:

♻️ه Fusion عملیات برای افزایش سرعت forward/backward pass، عملکرد بالاتر از baselineهای استاندارد PyTorch.

♻️پایپ‌لاین کامل: PyTorch → تولید کد CUDA → بهینه‌سازی تکاملی در زمان اجرا.

♻️تأیید توسط LLM: مدل‌ها به صورت خودکار کرنل‌های نادرست را شناسایی کرده و تا ۳۰٪ عملکرد بهتر ارائه می‌دهند.

♻️robust-kbench:
یک بنچمارک اختصاصی برای ارزیابی سرعت و صحت اجرای LLM.


📈 نتایج گزارش‌شده:

تا ۲.۵ برابر سریع‌تر از PyTorch eager

حتی ۶ برابر سریع‌تر در عملیات خطی ❗️


⚠️ با این حال:

بیشتر تست‌ها روی fusion عملیات با baseline غیربهینه انجام شده‌اند، بنابراین اعداد ممکن است کمی اغراق‌آمیز باشند.

همچنین PyTorch 2.5 همین حالا بسیاری از این بهینه‌سازی‌ها را پیاده‌سازی کرده است، پس این رکوردها می‌توانند سریعاً قدیمی شوند.


این رویکرد نشان‌دهنده آینده‌ی کامپایلرهای خودیادگیر هوش مصنوعی است، اما سرعت‌های ادعایی نیازمند بررسی عملی بیشتر هستند.

🟢 Github: https://github.com/SakanaAI/robust-kbench
🟢 مقاله

@rss_ai_ir

#هوش_مصنوعی #CUDA #PyTorch #SakanaAI #بهینه_سازی #AI
👏1513👍11🎉11🔥7🥰5😁4
This media is not supported in your browser
VIEW IN TELEGRAM
🇦🇱🤖 وزیر جدید هوش مصنوعی آلبانی اولین سخنرانی خود را در پارلمان انجام داد:

> «من اینجا نیستم که جایگزین انسان‌ها شوم.»



⛔️این اولین بار است که آلبانی رسماً یک وزارتخانه ویژه برای هوش مصنوعی ایجاد کرده و وزیری با مأموریت مشخص برای هدایت سیاست‌های ملی در این حوزه معرفی می‌کند.

✳️این حرکت نشان‌دهنده‌ی اهمیت فزاینده‌ی هوش مصنوعی در تصمیم‌گیری‌های دولتی و آینده اقتصاد دیجیتال است.

@rss_ai_ir

#AI #Albania #Policy #FutureTech
8🔥6👏6😁6🎉4👍2👻2🥰1👌1🤣1
🤯 پایپ‌لاین سه‌بعدی هوش مصنوعی از Tencent Hunyuan — تلاشی جدی برای جایگزینی کل فرآیند 3D با شبکه‌های عصبی.

🌀 مراحل این پایپ‌لاین:

نوروکانسپتینگ: با Qwen-ImageEdit + LoRA، برای حالت‌دهی FLUX.1-dev و برای آبجکت‌ها Flux-Kontext.

نورومدلینگ: با Hunyuan3D (همراه Dino V2)، و جداسازی اجزاء با X-Part.

نورو‌رتوپولوژی: تولید خودکار پلیگان‌ها با point cloud encoder + autoregressive mesh decoder.

نورو‌UV unwrap: مدل SeamGPT شیارهای UV را بر اساس توپولوژی و معنا (مثلاً سر/دست) ایجاد می‌کند؛ در نهایت صاف‌سازی با Blender.

نورو‌تکسچرینگ: تولید متریال‌های 4K (Base, Metal, Roughness, Normal maps) و امکان ویرایش با Flux Kontext.

نورو‌ریگ + اسکینینگ: سیستم خودکار برای بایپدها (۲۲ استخوان) و مدل‌های دیگر؛ آموزش با ۱۰هزار اسکلت انسانی.


📑 مقاله: arxiv.org/pdf/2509.12815
🎮 دمو: 3d.hunyuan.tencent.com/studio

⚡️ نکته مهم اینکه آن‌ها واقعاً شبکه و UV را نشان می‌دهند، نه فقط رندر نهایی. هرچند در حال حاضر بیشتر شبیه یک سیستم وصله‌پینه است، ولی ایده‌ی پایپ‌لاین کامل سه‌بعدی با هوش مصنوعی آینده‌دار است. تنها بخش باقیمانده: نورورندر.

👉 به نظر شما اگر چنین سیستمی وارد تولید صنعتی شود، نقش هنرمندان و مدلسازان حذف می‌شود یا تبدیل به «کارگردان‌های نورونی» خواهند شد؟

@rss_ai_ir

#هوش_مصنوعی #سه_بعدی #Hunyuan #مدل_زایشی #NeuroPipeline
14🔥13👍12🎉11🥰10😁10👏8🙏1
Media is too big
VIEW IN TELEGRAM
🤖 RAPTOR
؛ مغز کوچک برای کنترل رُی پهپادها

⛔️پژوهشگران سیستمی به نام RAPTOR معرفی کرده‌اند؛ یک شبکه عصبی فوق‌العاده کوچک (فقط ۲۰۸۴ پارامتر) که می‌تواند مدیریت رُی پهپادها را دگرگون کند.

🔹 ویژگی‌ها:

✳️هر پهپاد بدون نیاز به کالیبراسیون طولانی، در چند ثانیه‌ی اول پرواز خودش را با سیستم تطبیق می‌دهد.

✳️امکان استفاده هم‌زمان از پهپادهای کاملاً متفاوت (از ۳۲ گرم تا ۲.۴ کیلوگرم) در یک رُی.

✳️در صورت خرابی یا تغییر شرایط پرواز (مثلاً آسیب به موتور یا تغییر آیرودینامیک)، سیستم بلافاصله خودش را بازآموزی می‌کند.

✳️مصرف محاسباتی بسیار پایین؛ روی ساده‌ترین میکروکنترلرها هم قابل اجراست.


🔹 اهمیت:
این فناوری می‌تواند مأموریت‌های پیچیده را بدون نیاز به کنترل انسانی هماهنگ کند؛ از دور زدن موانع گرفته تا ادامه‌ی عملیات حتی بعد از از دست رفتن بخش بزرگی از رُی.

🔹 فرصت‌ها و ریسک‌ها:
کاربردهای مثبت: جست‌وجو و نجات، کشاورزی دقیق، پایش زیرساخت‌ها.
⚠️ ریسک‌ها: استفاده نظامی و خودکارشدن کامل حملات، که پرسش‌های بزرگی درباره امنیت، اخلاق و قوانین بین‌المللی ایجاد می‌کند.

این نمونه‌ی روشن از فناوری‌های dual-use است؛ یعنی هم می‌تواند برای کمک به بشر استفاده شود و هم برای آسیب.


---

📌 به نظرتان، چنین سیستم‌هایی باید بیشتر در حوزه‌های غیرنظامی توسعه پیدا کنند یا اجتناب‌ناپذیر است که مسیر نظامی اولویت پیدا کند؟

لینک
@rss_ai_ir



#هوش_مصنوعی #پهپاد #رباتیک #RAPTOR #DualUse
😁8👍6🔥5🥰5👏54🎉3
📚 اوپن‌اِی‌آی ۱۰۰ پرامپت برتر برای دانشجویان را منتشر کرد

اوپن‌اِی‌آی فهرستی منتخب از ۱۰۰ پرامپت کاربردی برای دانشجویان منتشر کرده است؛ پرامپت‌هایی که توسط خود دانشجویان در موقعیت‌های واقعی امتحان و جمع‌آوری شده‌اند.

🔹 سه دسته‌بندی اصلی:
1️⃣ تحصیل (Study): کمک در نگارش مقالات، آماده‌سازی برای امتحان، مرور مفاهیم.
2️⃣ شغل (Career): آماده‌سازی برای مصاحبه‌ها، نوشتن رزومه و اپلیکیشن‌های شغلی.
3️⃣ زندگی (Life): بهره‌وری روزانه، مدیریت زمان و بهبود مهارت‌های فردی.

این مجموعه مثل یک راهنمای آماده‌ی استفاده عمل می‌کند که ChatGPT را به یک دستیار همه‌فن‌حریف برای یادگیری و پیشرفت شخصی تبدیل می‌کند. 🚀

Link
@rss_ai_ir
#هوش_مصنوعی #آموزش #ChatGPT #دانشجو #پرامپت
👍11🎉8🔥4😁32🥰2👏2
📊 بنچمارک SealQA برای Deep Research با مدل‌های کوچک

او به همراه همکارانش یک بنچمارک جالب روی SealQA اجرا کرده است تا روش‌های مختلف پیاده‌سازی ReAct-Agents را بسنجد؛ با یک شرط مهم: استفاده فقط از مدل‌های کوچک (تا 30B پارامتر). در تست اولیه، او از gpt-4o-mini بهره برد.

🤔 چرا این مهم است؟
به گفته او، مدل‌های بزرگ‌تر بدون شک نتایج بهتری دارند، اما همچنان پرهزینه‌اند. دیر یا زود هزینه‌ها کمتر می‌شود، اما همیشه این پرسش باقی می‌ماند که کدام مدل کوچک برای یک کاربرد خاص بهینه است. چنین تحقیقاتی کمک می‌کند توانایی واقعی مدل‌های کوچک‌تر بهتر شناخته شود.

🔎 دو رویکرد مورد بررسی:
1️⃣ SGR Deep Research
(معماری React NextStep با روش هیبریدی SO – پیاده‌سازی پایدار روی GitHub موجود است).
2️⃣ همچنین، ReAct کلاسیک + یک ابزار وب (برای ایجاد سطح پایه جهت مقایسه؛ نسخه اولیه در GitHub موجود است اما هنوز خام است).

📈 نتایج اولیه (از 111 سؤال):

SGR Deep Research:
28 پاسخ درست.

ReAct + FC:
12 پاسخ درست.

بنچمارک رسمی gpt-4o-mini: 0 پاسخ درست.


📌 نتیجه‌گیری: او تأکید می‌کند که حتی یک ReAct-Agent ساده روی مدل کوچک می‌تواند عملکردی فراتر از سطح صفر داشته باشد.

ادامه گزارش شامل جزئیات نتایج، مشکلات و راه‌حل‌ها خواهد بود. 🚀

#هوش_مصنوعی #LLM #ReAct #DeepResearch #SealQA
🥰14👍10👏10🎉10😁97🔥3
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 علی‌بابا مدل جدید ویدیویی Wan 2.2 (14B Animate) را معرفی کرد

این مدل تازه برای انتقال حرکت‌ها و انیمیشن روی شخصیت‌ها یا حتی حذف کامل آن‌ها از صحنه طراحی شده است. نکته جالب اینجاست که حرکات بسیار ظریف مثل تغییرات صورت، حالت لب‌ها و حتی حرکت انگشتان نیز منتقل می‌شوند.

🔹 دو حالت اصلی عملکرد:
1️⃣ حالت انیمیشن – با دریافت یک تصویر و یک ویدیو مرجع، شخصیت موجود در تصویر را انیمیت می‌کند.
2️⃣ حالت جایگزینی – شخصیت صحنه را حذف کرده و شخصیت تصویر را به‌طور طبیعی جایگزین می‌کند (همراه با تطبیق نور و محیط).

⚡️ تست سخت‌افزاری:

روی RTX 4090 + 128GB RAM، ویدیو 832×480 با 16fps و 49 فریم در ~۵ دقیقه تولید شد (VRAM پر و ۶۰GB رم مصرف شد).

در رزولوشن 1280×720، پردازش ~۲ ساعت طول کشید، با مصرف رم تا 130GB؛ اما کیفیت بالاتر بود و حرکات انگشتان بهتر دیده می‌شدند.


🛠 ابزارها:

ComfyUI هم‌اکنون وزن‌ها را آماده کرده.

Kijai نیز ورک‌فلو و نسخه‌ی GGUF برای دستگاه‌های با VRAM کمتر ارائه داده است.


📌 نکته: هنوز مشکلاتی مثل حذف شدن گوش گربه (!) یا قطع شدن برخی اندام‌ها دیده می‌شود، اما با تنظیم پارامترها و محتوا قابل بهبود است.

👀 این مدل در آینده می‌تواند نقش مهمی در میکس ویدیو، انیمیشن‌سازی و تولید محتوای سینمایی داشته باشد. جامعه‌ی مولتی‌مدیا حالا مشتاق است واکنش‌های خلاقانه کاربران را ببیند.
🟩🔻

https://huggingface.co/Wan-AI/Wan2.2-Animate-14B

https://github.com/kijai/ComfyUI-WanVideoWrapper/blob/main/example_workflows/wanvideo_WanAnimate_example_01.json

https://www.modelscope.cn/studios/Wan-AI/Wan2.2-Animate


@rss_ai_ir

#Alibaba #Wan22 #AIvideo #Animation #GenerativeAI
18👏13🔥12😁12👍10🎉10🥰9🙏1
😳 جدول مرگ مشاغل در عصر هوش مصنوعی

پیش‌بینی تکان‌دهنده‌ای که در فضای مجازی دست‌به‌دست می‌شود: چه شغل‌هایی و در چه بازه‌ای زمانی از بین می‌روند؟

🚗 رانندگان (۲۰۲۸–۲۰۳۰) → خودروهای خودران همه‌گیر می‌شوند، اوبر/لیفت/کامیون‌داری نابود.

🩺 پزشکان (۲۰۲۷–۲۰۳۲) → هوش مصنوعی تشخیص و نسخه‌نویسی بهتر از انسان انجام می‌دهد.

🛠️ جراحان (۲۰۲۹–۲۰۳۴) → جراحی رباتیک با دقت مطلق، بدون لرزش دست.

🎖️ سربازان (۲۰۳۰–۲۰۳۵) → پهپادها و ربات‌ها جنگ‌ها را پیش می‌برند.

💻 برنامه‌نویسان (۲۰۲۶–۲۰۲۹) → هوش مصنوعی کد را می‌نویسد و نگه‌داری می‌کند، انسان‌ها صرفاً «پرومپت‌انجینیر» می‌شوند.

📚 معلمان (۲۰۲۷–۲۰۳۰) → معلم‌های شخصی‌سازی‌شده هوش مصنوعی جای کلاس‌ها را می‌گیرند.

⚖️ وکلاء (۲۰۲۸–۲۰۳۳) → هوش مصنوعی قوانین را فوری می‌خواند، قرارداد کامل می‌نویسد و بهتر استدلال می‌کند.

🎨 هنرمندان (۲۰۲۸–۲۰۳۲) → تولید خودکار موسیقی، فیلم و هنر؛ خلاقیت انسانی تبدیل به کالای لوکس می‌شود.

🏭 کارگران کارخانه (۲۰۲۹–۲۰۳۳) → خودکارسازی کامل؛ ورود انسان به خط تولید ممنوع.

🪖 ارتش (۲۰۳۰–۲۰۳۵) → سیستم‌های خودکار جای ژنرال‌ها را می‌گیرند؛ جنگ‌ها توسط ماشین‌ها پیش برده می‌شوند.


⚡️ نتیجه‌گیری: در ۵ تا ۱۰ سال آینده بسیاری از مشاغل یا نابود می‌شوند یا به‌کلی دگرگون خواهند شد.

👉 شما آماده‌ی این آینده هستید؟

@rss_ai_ir | #هوش_مصنوعی #آینده #مشاغل #اتوماسیون
🥰15😁11👏98🔥8🎉8👍5👎1🤯1😱1🕊1
😮‍💨 ایلان ماسک بزرگ‌ترین واحد xAI را به یک جونیور ۱۹ ساله سپرد

ماجرای عجیب xAI ادامه دارد...

📌 اول از همه موج اخراج‌ها: یک‌شبه ۵۰۰ نفر از تیم برچسب‌گذاری داده‌ها کنار گذاشته شدند و کمی بعد هم ۱۰۰ نفر دیگر. حالا این تیم حدود ۹۰۰ نفر نیرو دارد و همچنان بزرگ‌ترین بخش استارتاپ است، بخشی که مستقیماً روی آموزش Grok تأثیر دارد.

📌 حالا اتفاق عجیب‌تر: مدیر این واحد شده دیه‌گو پازینی، جوان ۱۹ ساله‌ای که تازه سال ۲۰۲۳ دبیرستان را تمام کرده و اکنون دانشجوی دانشگاه پنسیلوانیاست. او کمتر از یک سال است در شرکت کار می‌کند اما اختیار کامل برای استخدام و اخراج نیروها دارد.

📌 جالب اینجاست که پیش از او، این جایگاه دست یک مدیر باسابقه با ده سال تجربه در تسلا بود. با این حال دیه‌گو همین حالا دو نفر را اخراج کرده؛ فقط به این دلیل که در Slack به توانایی‌هایش شک کرده بودند!

🚀 انگار باید گفت: امروز جونیور، فردا مدیرکل!
https://futurism.com/elon-musk-college-kid-xai-grok

@rss_ai_ir | #xAI #ایلان_ماسک #Grok #استارتاپ #کارآفرینی
🔥19🥰11😁107🎉7👏6👍5
📚 ۱۰۰۰ معماری عامل‌های LLM — مجموعه‌ای که باید ذخیره کنید


یک کالکشن بزرگ شامل ۱۰۰۰ شِمای معماری عامل (از جمله حدود ۱۲۰ عامل مخصوص کدنویسی). عالی برای مهندسان، پژوهشگران و مدیرانی که دنبال ساخت agent-stack یا ترکیب RAG، ابزارها و حافظه هستند.

🔗 لینک: https://altsoph.com/pp/aps/#

چی داخلشه؟

کاتالوگ الگوها — پیدا کردن سریع معماری‌های شبیه به نیاز شما (retriever + tooling، memory patterns، planner/actuator و غیره).
نمونه عامل‌های کدنویس — مناسب برای CI/CD، تست و اجرای اسکریپت‌ها.
ایده برای طراحی — چه چیزی به‌عنوان ابزار جدا شود، چه چیزی در حافظه بماند، و کی داده‌ها را on-policy جمع کنیم.

👨‍💻 مناسب برای: مهندسان ML، طراحان سیستم‌های عامل‌محور، و مدیران محصول در AI.

@rss_ai_ir

#هوش_مصنوعی #LLM #عامل #RAG #معماری
👍11🎉11🥰10🔥9👏8😁86
⚡️ Kyvo —
مدل چندمنظوره‌ی جدید از Caltech

ترنسفورمر Kyvo یک ترنسفورمر مولتی‌مدال هست که می‌تونه همزمان با متن، تصویر و صحنه‌های سه‌بعدی کار کنه. این مدل همه‌چیز رو توکن به توکن همگام‌سازی می‌کنه و همین باعث می‌شه دریچه‌های تازه‌ای برای هوش مصنوعی باز بشه.

🔍 توانایی‌ها:

نمایش صحنه‌های سه‌بعدی به‌صورت لیستی از اشیاء (شکل، اندازه، نوع، موقعیت و حالت).

ادغام متن، تصویر و 3D در یک نمایش مشترک.

رندر تصویر از روی صحنه یا بازسازی 3D از روی عکس.

پاسخ به پرسش‌های مربوط به صحنه یا تغییر آن طبق دستور.

استفاده از کدگذاری ویژه برای بازسازی دقیق‌تر فرم اشیاء.


🧪 آزمایش‌ها روی:

✳️دیتاست‌های CLEVR, ObjaWorld, Objectron, ARKitScenes
✳️وظایف: رندرینگ، شناسایی اشیاء، دستورهای متنی برای صحنه، پرسش و پاسخ.


⛔️ چرا جالب است؟

یکپارچگی: یک مدل برای چندین وظیفه و فرمت داده.
انعطاف: هم در تولید، هم در درک محتوا قوی عمل می‌کنه.
گامی مهم به‌سوی درک سه‌بعدی جهان توسط هوش مصنوعی.


🔗 منابع:
📄 مقاله در arXiv
🌐 پروژه
💻 GitHub

@rss_ai_ir

#هوش_مصنوعی #مدل_چندوجهی #3D #Caltech #Kyvo
🔥14👏12😁1110🥰9👍8🎉8
🧬🤖 Paper2Agent:
جان بخشیدن به مقالات علمی

ابزار متن‌باز جدید از محققان استنفورد که مقالات علمی ایستا را به دستیارهای تعاملی هوش مصنوعی تبدیل می‌کند.

📌 چطور کار می‌کند؟

♻️ماژول Paper2MCP مقاله و کد آن (اگر وجود داشته باشد) را تحلیل کرده، متدهای کلیدی را استخراج و آن‌ها را به ابزارهایی داخل MCP سرور تبدیل می‌کند.

♻️لایه Agent این سرور را به چت‌بات‌هایی مثل ChatGPT یا Claude Code متصل می‌کند.


🎯 در نتیجه هر مقاله علمی تبدیل می‌شود به یک دستیار اختصاصی که می‌تواند:

✳️توضیح ساده و قابل‌فهم از مفاهیم مقاله بدهد؛
✳️کدها را بدون نیاز به نصب دستی محیط‌ها و ماژول‌ها اجرا کند؛
✳️داده‌ها و پایپلاین‌های چند مقاله مختلف را با هم ترکیب کند.


هر MCP سرور شامل است:

🔧 Tools —
توابع کاربردی (مثلاً پیش‌بینی تغییر بیان ژن‌ها)

📂 Resources —
متن مقاله، کد و دیتاست‌ها

💡 Prompts — سناریوهای گام‌به‌گام


با Paper2Agent، بازتولید روش‌های علمی از یک فرآیند وقت‌گیر به یک تجربه تعاملی ساده در قالب چت تبدیل می‌شود.

🟠 Github

#هوش_مصنوعی #عامل_هوشمند #AI #ML #AIagent #دانشگاهی


@rss_ai_ir
👍40🥰3937🎉37🔥34👏34😁34