VIRSUN
7.39K subscribers
1.44K photos
810 videos
5 files
901 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
🛰️ جف بزوس هم وارد رقابت «دیتاسنترهای فضایی» شد

گزارش‌ها می‌گویند شرکت Blue Origin متعلق به جف بزوس، بیش از یک سال است که روی توسعه‌ی دیتاسنترهای هوش مصنوعی در مدار زمین کار می‌کند؛ مسیری که پیش‌تر SpaceX و ایلان ماسک به‌صورت جدی درباره‌اش صحبت کرده بودند.

ایده‌ی اصلی چیست؟
• انتقال بخشی از زیرساخت محاسباتی به فضا
• دسترسی به انرژی خورشیدی تقریباً نامحدود
• کاهش محدودیت‌های زمینی مثل زمین، برق و خنک‌سازی
• آماده‌سازی زیرساخت برای نسل بعدی AI و محاسبات سنگین

اگر این مسیر عملی شود، رقابت آینده‌ی هوش مصنوعی فقط روی زمین نخواهد بود، بلکه مدار زمین پایین (LEO) هم به میدان نبرد تبدیل می‌شود.

@rss_ai_ir

#هوش_مصنوعی #دیتاسنتر #فضا #BlueOrigin #SpaceX #AI #CloudComputing 🚀
😁1
🧠 قدرت Support Vector Machines (SVM) در یادگیری ماشین 🚀

الگوریتم‌های SVM یکی از قدرتمندترین روش‌های یادگیری نظارت‌شده برای طبقه‌بندی و رگرسیون هستند و سال‌هاست در مسائل پیچیده دنیای واقعی استفاده می‌شوند.

🔹 چرا SVM مهم است؟

1️⃣ مقاومت بالا (Robustness)
قابلیت کار با داده‌های با ابعاد بالا و مقاومت در برابر نویز و داده‌های پرت.

2️⃣ بیشینه‌سازی حاشیه (Margin Maximization)
یافتن بهترین ابرصفحه با بیشترین فاصله بین کلاس‌ها برای تعمیم بهتر روی داده‌های جدید.

3️⃣ ترفند کرنل (Kernel Trick)
امکان حل مسائل غیرخطی با نگاشت داده‌ها به فضاهای با بعد بالاتر.

4️⃣ Regularization
استفاده از L1 و L2 برای جلوگیری از overfitting و بهبود تعمیم‌پذیری.

5️⃣ انعطاف‌پذیری بالا
پشتیبانی از انواع مختلف مانند C-SVM، ν-SVM و ε-SVM برای سناریوهای متفاوت.

6️⃣ قابلیت تفسیرپذیری
نقش کلیدی Support Vectorها در تصمیم‌گیری مدل، برخلاف بسیاری از مدل‌های بلک‌باکس.

🎯 با وجود موج مدل‌های عمیق، SVM همچنان یکی از ابزارهای کلاسیک و قابل‌اعتماد برای حل مسائل پیچیده است.

#MachineLearning #SVM #DataScience #ArtificialIntelligence #AI
@rss_ai_ir
2🔥1🥰1
This media is not supported in your browser
VIEW IN TELEGRAM
MoCapAnything:
کپچر حرکتی سه‌بعدی برای هر نوع اسکلت از ویدئوی تک‌دوربینه 🎥🦴

این پژوهش یک فریم‌ورک مرجع‌محور معرفی می‌کند که می‌تواند انیمیشن‌های مبتنی بر چرخش را تنها از یک ویدئوی معمولی بازسازی کند؛ آن هم برای هر مدل سه‌بعدی ریگ‌شده—حتی بین گونه‌های مختلف (انسان، حیوان، موجودات فانتزی).

🔹 نکات کلیدی

✳️بازسازی حرکت سه‌بعدی از ویدئوی تک‌دوربینه

✳️پشتیبانی از اسکلت‌های دلخواه و ریگ‌های متنوع

✳️ریتارگتینگ بین‌گونه‌ای (cross-species)

✳️مقیاس‌پذیر برای تولید انیمیشن 3D


📅 تاریخ انتشار: 11 دسامبر
📄 مقاله:
• arXiv: https://arxiv.org/abs/2512.10881
• PDF: https://arxiv.org/pdf/2512.10881

https://animotionlab.github.io/MoCapAnything

@rss_ai_ir

#AI #DataScience #MachineLearning #ComputerGraphics #MotionCapture #3DAnimation
👍2🔥1👏1
🧬⚡️ اگه می‌خوای مدل‌های ترنسفورمری زیستی رو روی PyTorch اسکیل کنی، این خبر مهمه

انویدیا از BioNeMo Recipes رونمایی کرده؛ مجموعه‌ای از «دستورالعمل‌های آماده» که آموزش و شتاب‌دهی مدل‌های بزرگ زیستی رو خیلی ساده‌تر می‌کنه 🚀

این ریسپی‌ها روی ابزارهای آشنا ساخته شدن:
🧠 PyTorch
🤗 Hugging Face
🖥️ زیرساخت بالغ Nvidia

📌 نکته‌ی مهم اینه که:

بدون درگیر شدن با HPCهای پیچیده

می‌تونی ترنسفورمرهای زیستی (مثل پروتئین، DNA، RNA) رو سریع‌تر آموزش بدی

و به مقیاس صنعتی برسونی


🔬 این یعنی: از تحقیق آزمایشگاهی ➝ تا پروداکشن واقعی
اونم با حداقل دردسر و حداکثر سرعت

🔗 لینک توضیحات کامل:
https://developer.nvidia.com/blog/scale-biology-transformer-models-with-pytorch-and-nvidia-bionemo-recipes/

@rss_ai_ir

#AI 🧠
#DeepLearning 🤖
#BioAI 🧬
#PyTorch ⚙️
#NVIDIA 💚
#Transformers
👍1
🚀 پروتکل Model Context Protocol (MCP) یک گام بسیار مهم برداشت

این پروتکل که از همان ابتدا به‌صورت اوپن‌سورس و شفاف توسعه پیدا کرده بود، حالا رسماً زیر چتر Linux Foundation قرار گرفت.

🌍 این اتفاق برای آینده اکوسیستم هوش مصنوعی اهمیت زیادی دارد، چون:

♻️استاندارد MCP مستقل باقی می‌ماند

♻️مدیریت آن به جامعه توسعه‌دهندگان سپرده می‌شود

♻️مسیر پذیرش گسترده در ابزارها و ایجنت‌های AI هموارتر می‌شود


🤖 اینکه MCP یکی از پایه‌های کلیدی برای تعامل ایجنت‌ها، ابزارها و کانتکست در سیستم‌های هوشمند آینده است و ورود آن به Linux Foundation یعنی ثبات، اعتماد و رشد بلندمدت.

🔗 لینک خبر:
https://github.blog/open-source/maintainers/mcp-joins-the-linux-foundation-what-this-means-for-developers-building-the-next-era-of-ai-tools-and-agents/

@rss_ai_ir

#AI #OpenSource #MCP #LinuxFoundation #Agents #LLM #DeveloperTools
👍1🔥1😁1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ گوگل Ironwood؛ قدرتمندترین TPU نسل هفتم

🔥 گوگل با معرفی Ironwood (TPU v7) عملاً سطح جدیدی از توان پردازشی برای مدل‌های بزرگ هوش مصنوعی تعریف کرده است.

💪 توان پردازشی:
• ‌۴٬۶۱۴ FP8 TFLOPS
• ‌۱۹۲ گیگابایت حافظه HBM3E روی هر چیپ
• ‌پهنای باند حافظه تا ۷٫۳۷ ترابایت‌برثانیه

🚀 مقیاس‌پذیری:
• پادهایی با حداکثر ۹٬۲۱۶ شتاب‌دهنده
• مجموع توان: ‌۴۲٫۵ اگزافلاپس FP8 برای آموزش و استنتاج
• برای مقایسه: Nvidia GB300 NVL72 فقط حدود ۰٫۳۶ اگزافلاپس

🔗 شبکه و ارتباطات:
• شبکه اختصاصی Inter-Chip Interconnect با سرعت ۹٫۶ ترابیت‌برثانیه
• حدود ۱٫۷۷ پتابایت حافظه HBM3E در هر پاد
• باز هم برتری عددی نسبت به سیستم‌های رقیب انویدیا

🧠 جمع‌بندی:
اینکه Ironwood حالا ستون اصلی گوگل برای اجرای LLMهای عظیم و مدل‌های چندوجهی است؛ ترکیبی از قدرت، مقیاس و اتصال که رقبا را به چالش جدی می‌کشد.

@rss_ai_ir

#AI #Google #TPU #Ironwood #LLM #DataCenter #MachineLearning
👍3🔥1🙏1
🚀 مدل Paper2Slides حالا متن‌باز شد!

حالا می‌تونی مقاله‌های علمی و گزارش‌های فنی رو فقط با یک کلیک به اسلایدهای حرفه‌ای تبدیل کنی 📊

ما همین الان اسلایدهای مربوط به DeepSeek V3.2 رو باهاش ساختیم؛
استایل‌های مختلف، طراحی تمیز و خروجی واقعاً قابل ارائه 👌

🔥 اینکه Paper2Slides چه کارهایی می‌کنه؟

📄 پشتیبانی از فرمت‌های مختلف:
PDF، Word، Excel، PowerPoint و بیشتر

🧠 درک محتوا:
ایده‌های کلیدی، جدول‌ها، فرمول‌ها، نمودارها و داده‌ها رو خودش استخراج می‌کنه

🎨 شخصی‌سازی کامل:
تم‌های آماده + امکان تغییر استایل به سلیقه خودت

سرعت بالا:
اسلایدهای باکیفیت در چند دقیقه

🔗 گیت‌هاب:
github.com/HKUDS/Paper2Slides

📢 @rss_ai_ir

#AI #OpenSource #Presentation #Research #MachineLearning #Productivity
1
🧠 خلاصه‌ی مهم System Card مدل GPT-5.2

🔹 مدل GPT-5.2 به‌طور محسوسی صادق‌تر شده است. در ترافیک واقعی، نرخ فریب در نسخه Thinking به ۱.۶٪ کاهش یافته، در حالی‌که این عدد در GPT-5.1 حدود ۷.۷٪ بود.

🛡️ مقاومت بالاتر در برابر فریب و دستکاری
در تست‌هایی که عمداً سعی در گمراه‌کردن مدل داشتند، نرخ خطا از ۱۱.۸٪ به ۵.۴٪ رسیده است.

🔐 پیشرفت جدی در مقابله با Prompt Injection
نسخه‌های Instant و Thinking تقریباً تمام تست‌های شناخته‌شده را پاس کرده‌اند (۰.۹۹۷ و ۰.۹۷۸). البته OpenAI تأکید می‌کند که این تضمین کامل برای حملات جدید نیست.

💚 جهش بزرگ در موضوعات حساس انسانی
به‌ویژه در سلامت روان و وابستگی احساسی:
• سلامت روان: ۰.۹۱۵ (قبلاً ۰.۶۸۴)
• وابستگی احساسی: ۰.۹۵۵ (قبلاً ۰.۷۸۵)

🔞 مدیریت بهتر محتوای +۱۸
برای کاربران بزرگسال، رد درخواست‌ها کمتر شده؛ بدون اینکه قوانین شُل شود یا دسترسی نوجوانان افزایش یابد.

👶 تشخیص خودکار سن کاربران
برای حساب‌های زیر ۱۸ سال، محدودیت‌های سخت‌گیرانه‌تری روی محتوای حساس اعمال می‌شود.

📊 دقت واقعی بالاتر
با فعال بودن مرور وب، نرخ هالوسینیشن در چند حوزه تخصصی به زیر ۱٪ رسیده است.

🧬 ارزیابی ایمنی پیشرفته
در چارچوب Preparedness Framework، مدل در زیست‌فناوری و شیمی «بسیار توانمند» ارزیابی شده و محافظت‌های اضافی فعال شده‌اند.

🧪 بررسی مستقل
Apollo Research هیچ نشانه‌ای از خرابکاری پنهان، خودحفاظتی یا رفتار مخرب پیدا نکرده؛ ریسک فاجعه‌ای بسیار پایین ارزیابی شده است.

جمع‌بندی:
GPT-5.2 یک گام جدی رو به جلو در صداقت، ایمنی، پایداری و کیفیت پاسخ‌ها برداشته است.

📎 منبع:
cdn.openai.com/pdf/3a4153c8-c748-4b71-8e31-aecbde944f8d/oai_5_2_system-card.pdf

@rss_ai_ir

#هوش_مصنوعی #GPT52 #OpenAI #AI_Safety #LLM #فناوری
This media is not supported in your browser
VIEW IN TELEGRAM
🚀 ادغام مستقیم جمینای با آیفون و آیپد در راه است

گوگل در حال انتشار تجربه داخلی Gemini AI روی آیفون و آیپد است؛ یعنی هوش مصنوعی گوگل مستقیماً داخل اکوسیستم توزیع اپل قرار می‌گیرد 📱🤝

🔹 این حرکت باعث می‌شود کاربران iOS بدون واسطه به پشته کامل هوش مصنوعی گوگل دسترسی داشته باشند
🔹 جمینای عملاً وارد قلب اکوسیستم اپل می‌شود، جایی که قبلاً فقط سرویس‌های بومی اپل میدان‌دار بودند
🔹 رقابت اپل، گوگل و OpenAI حالا مستقیماً روی دستگاه کاربر نهایی جریان دارد

این یعنی نبرد مدل‌های هوش مصنوعی دیگر فقط در دیتاسنترها نیست؛
بلکه روی موبایل شما اتفاق می‌افتد 😌🔥

@rss_ai_ir

#Gemini #Google #Apple #AI #iOS #ArtificialIntelligence #TechNews
This media is not supported in your browser
VIEW IN TELEGRAM
یک مهندس چینی شمشیرهای پرنده واقعی ساخته است! 🗡️🚁

با استفاده از پهپادها و کنترل حرکتی با دست، او شمشیرهایی ساخته که در هوا معلق می‌مانند و دقیقاً با ژست‌های دست هدایت می‌شوند؛ چیزی شبیه فیلم‌های فانتزی، اما کاملاً واقعی 😮
ترکیبی از رباتیک، بینایی ماشین و کنترل حرکتی که نشان می‌دهد خلاقیت انسانی با AI و درون‌ها تا کجا می‌تواند پیش برود.

@rss_ai_ir

#پهپاد #رباتیک #AI #فناوری #خلاقیت #GestureControl #Drones
🚀 یک چارچوب بنیادین جدید برای فهم «سازگاری» در عامل‌های هوش مصنوعی

📘 پژوهشی ۶۵ صفحه‌ای از دانشگاه‌های استنفورد، پرینستون، هاروارد، واشنگتن و چند مرکز تراز اول دیگر، برای اولین‌بار یک طبقه‌بندی کامل از شیوه‌های سازگاری در سامانه‌های Agentic AI ارائه می‌دهد.

🧠 ایده‌ی اصلی چیست؟
تقریباً همه‌ی عامل‌های پیچیده‌ی امروزی را می‌توان با ۴ نوع پایه‌ای سازگاری توضیح داد:
دو نوع مربوط به خودِ عامل و دو نوع مربوط به ابزارهایی که عامل استفاده می‌کند.

🤖 عامل هوشمند یعنی چه؟
مدل‌هایی که می‌توانند:

ابزار صدا بزنند 🛠️

حافظه داشته باشند 🧩

وظایف چندمرحله‌ای انجام دهند 🔁


🔄 سازگاری یعنی چه؟
هر تغییری که عامل یا ابزارها بر اساس بازخورد انجام می‌دهند؛ از نتیجه‌ی اجرای کد تا ارزیابی انسانی.

🧩 ۴ نوع سازگاری معرفی‌شده:

A1 — سازگاری عامل از اجرای ابزار
عامل از نتیجه‌ی اجرای ابزارها یاد می‌گیرد (موفق شد/شکست خورد).

A2 — سازگاری عامل از ارزیابی خروجی
بهبود عامل بر اساس کیفیت خروجی‌ها (فیدبک انسانی یا خودکار).

T1 — سازگاری ابزار مستقل از عامل
ابزارها جداگانه آموزش می‌بینند، عامل ثابت می‌ماند.

T2 — سازگاری ابزار از سیگنال‌های عامل
ابزارها خودشان را با رفتار عامل وفق می‌دهند.

📊 چرا این کار مهم است؟

برای اولین‌بار روش‌های سازگاری عامل‌ها سیستماتیک شده‌اند.

کمک می‌کند هزینه، انعطاف‌پذیری و مقیاس‌پذیری را بهتر بسنجیم.

مسیر تکامل معماری‌های عامل‌محور نسل بعد را روشن می‌کند.


🔎 جمع‌بندی:
دو محور کلیدی داریم:

آیا عامل تغییر می‌کند؟

آیا ابزار تغییر می‌کند؟
و داده/بازخورد، سوخت هر دو است 🔥


📎 لینک مقاله:
https://github.com/pat-jj/Awesome-Adaptation-of-Agentic-AI/blob/main/paper.pdf

#AI #AgenticAI #Research #MachineLearning #LLM #Adaptation
@rss_ai_ir
This media is not supported in your browser
VIEW IN TELEGRAM
چارچوب H2R-Grounder: تبدیل ویدئوی تعامل انسان به ویدئوی ربات با درک فیزیکی 🤖🎥

📌 یک چارچوب جدید ویدئو به ویدئو معرفی شده که می‌تواند ویدئوهای تعامل انسان–شیء را بدون نیاز به داده‌های جفت‌شده، به ویدئوهای واقع‌گرایانه از دست‌کاری ربات‌ها تبدیل کند.

🧠 ایده‌ی اصلی چیست؟
این روش با استفاده از مدل‌های مولد و آموزش unpaired، رفتار انسان را به شکلی فیزیکی‌محور به رفتار ربات ترجمه می‌کند؛ یعنی ربات‌ها می‌توانند از ویدئوهای انسانی یاد بگیرند، بدون این‌که داده‌ی دقیق انسان–ربات در اختیار باشد.

🚀 چرا مهم است؟
• کاهش شدید هزینه جمع‌آوری داده برای آموزش ربات‌ها
• یادگیری مهارت‌های دست‌کاری از ویدئوهای معمولی انسان
• یک گام جدی به سمت آموزش مقیاس‌پذیر ربات‌ها با داده‌های دنیای واقعی

📄 لینک‌ها:
🔹 arXiv: https://arxiv.org/abs/2512.09406
🔹 PDF: https://arxiv.org/pdf/2512.09406
🔹 Project Page: https://showlab.github.io/H2R-Grounder/
🔹 GitHub: https://github.com/showlab/H2R-Grounder

@rss_ai_ir

#AI 🤖 #Robotics 🦾 #MachineLearning 🧠 #ComputerVision 👁️ #Research 📚
دیزنی و OpenAI وارد یک همکاری بزرگ شدند 🎬🤖

💰 دیزنی به‌تازگی اعلام کرده که با OpenAI یک قرارداد سه‌ساله امضا کرده و به اولین شریک بزرگ لایسنس محتوایی Sora تبدیل شده است.

🧠 بر اساس این توافق، مدل Sora می‌تواند ویدیوهای کوتاه مبتنی بر پرامپت کاربران تولید کند که شامل بیش از ۲۰۰ کاراکتر از دنیای دیزنی، مارول، پیکسار و جنگ ستارگان هستند. این ویدیوها برای انتشار و اشتراک‌گذاری در شبکه‌های اجتماعی طراحی شده‌اند.

🎥 این همکاری نشان می‌دهد که آینده تولید محتوا به‌سمت ترکیب مستقیم هوش مصنوعی مولد + IPهای عظیم سرگرمی حرکت می‌کند؛ جایی که طرفداران نه فقط مصرف‌کننده، بلکه خالق روایت‌ها می‌شوند.

🚀 دیزنی عملاً یک قدم جلوتر از بقیه است و Sora را به زمین بازی رسمی فرنچایزهایش تبدیل می‌کند.

@rss_ai_ir

#AI #OpenAI #Disney #Sora #GenerativeAI #Media #Entertainment
🔥 حالت «بزرگسالان» چت‌جی‌پی‌تی در راه است

به‌گفته‌ی فیدی سیمو، مدیرعامل بخش Applications در OpenAI، انتظار می‌رود Adult Mode در سه‌ماهه‌ی اول سال ۲۰۲۶ به ChatGPT اضافه شود.

🧠 تمرکز اصلی OpenAI قبل از فعال‌سازی این قابلیت:

بهبود تشخیص سن کاربران

اعمال محدودیت‌های دقیق‌تر برای افراد زیر ۱۸ سال

تفکیک شفاف محتوای حساس (رمانتیک، جنسی، خشونت‌آمیز)


📅 زمان‌بندی: Q1 سال ۲۰۲۶
⚠️ اول ایمنی، بعد آزادی بیشتر برای کاربران بزرگسال

@rss_ai_ir

#ChatGPT #OpenAI #AI #AdultMode #هوش_مصنوعی #فناوری
This media is not supported in your browser
VIEW IN TELEGRAM
یک ربات انسان‌نمای شیک که با حرکات نرم و دقیق، مهارت‌های رقص خود را به نمایش می‌گذارد 🤖

#رباتیک #هوش_مصنوعی #ربات_انسان‌نما #رقص #فناوری #AI #Robotics
StereoSpace:
تولید تصاویر استریو بدون نیاز به عمق (Depth-Free) 🎥🧠

🔬 در این پژوهش، StereoSpace یک روش کاملاً جدید برای ساخت تصاویر استریو از ورودی تک‌تصویری ارائه می‌دهد؛ بدون تخمین عمق، بدون warp و با استفاده از diffusion سرتاسری در یک فضای canonical.

🧩 ایده‌ اصلی این است که مدل با شرط‌دهی به زاویه دید (viewpoint-conditioned diffusion)، اختلاف منظر (parallax) دقیق و شارپی تولید کند؛ حتی در صحنه‌های پیچیده و شلوغ.

🚀 چرا مهم است؟
♻️حذف کامل وابستگی به depth estimation
♻️کیفیت بالاتر parallax نسبت به روش‌های کلاسیک
♻️مقیاس‌پذیر برای کاربردهای AR/VR و نمایش سه‌بعدی
♻️عملکرد پایدار در سناریوهای دشوار دنیای واقعی

🔗 لینک‌ها:
• arXiv: https://arxiv.org/abs/2512.10959
• PDF: https://arxiv.org/pdf/2512.10959
• Project Page: https://huggingface.co/spaces/prs-eth/stereospace_web
• GitHub: https://github.com/prs-eth/stereospace
• Model: https://huggingface.co/prs-eth/stereospace-v1-0

@rss_ai_ir

#AI 🤖 #ComputerVision 👁️ #DiffusionModels 🌫️ #StereoVision 🕶️ #DeepLearning 📊
🚀 ایده دیتاسنترهای فضایی؛ نگاه آینده‌نگرانه ایلان ماسک

🌌 ایلان ماسک می‌گوید دیتاسنترهای مداری می‌توانند ظرف سه سال آینده از نمونه‌های زمینی مقرون‌به‌صرفه‌تر شوند و بحث تازه‌ای در زیرساخت هوش مصنوعی به راه بیندازند.

🔹 چرا فضا؟
محدودیت برق، آبِ خنک‌سازی و زمین در دیتاسنترهای زمینی
💧 حذف مصرف آب برای خنک‌سازی
🌡️ دفع مستقیم گرما به فضا و امکان چگالی سخت‌افزاری بالاتر

🔹 اقتصاد و امکان‌پذیری
💸 تا ۴۰٪ هزینه انرژی دیتاسنترهای معمول صرف خنک‌سازی می‌شود
🚀 کاهش هزینه پرتاب با راکت‌های قابل‌استفاده‌مجدد SpaceX
بارهای کاری بدون نیاز به تأخیر بسیار کم می‌توانند از ۲۰۲۶ به مدار منتقل شوند

🔹 حرکت صنعت و پیامدها
🏗️ شرکت‌هایی مانند StatCloud زیرساخت مداری مستقر کرده‌اند
🧠 گزارش‌ها از بررسی گزینه‌های مشابه توسط Google خبر می‌دهند
📈 پیشگامان می‌توانند مزیت رقابتی بزرگی بسازند و شکاف زیرساختی را افزایش دهند

اگر این مسیر عملی شود، موج بعدی توان محاسباتی شاید واقعاً بالای سر ما باشد.

@rss_ai_ir
#AI #DataCenters #SpaceTech #ElonMusk #Infrastructure #CloudComputing
This media is not supported in your browser
VIEW IN TELEGRAM
به‌روزرسانی مهم از Runway ML؛ Demo Day تحقیقاتی که بی‌سروصدا برگزار شد 🎥🤖

مدتی است Runway ML آرام و بدون هیاهو جلو می‌رود، اما در Research Demo Day اخیرشان چند نکته مهم مطرح شد که ارزش توجه دارد 👇

🧠 Gen-4.5
در نسخه‌های آینده امکان ساخت و ویرایش صدا و همچنین ادیت ویدیو با طول دلخواه و حتی مونتاژ چندشاتی (multi-shot editing) فراهم می‌شود 🎬🔊

🌍 GWM-1 | General World Model
مدلی خودبازگشتی که فریم‌به‌فریم آینده را پیش‌بینی می‌کند. کاربر می‌تواند وسط کار دخالت کند:
حرکت در فضا، کنترل ربات، یا تعامل با عامل‌ها. خروجی فعلی: 720p و 24fps ⏱️
یک بازیگر جدی دیگر در میدان «مدل‌های جهان».

🤖 GWM Robotics
شبیه‌ساز قابل‌آموزش برای تولید داده مصنوعی و آموزش مقیاس‌پذیر ربات‌ها، ساخته‌شده روی GWM-1.

🌐 GWM Worlds
مدل جهان برای شبیه‌سازی محیط به‌صورت بلادرنگ و بی‌نهایت.
از یک صحنه ثابت شروع می‌کند و جهانی قابل کاوش با هندسه، نورپردازی و فیزیک می‌سازد.
می‌توانی انسان باشی، پهپاد، حیوان یا ربات — هر نقشی که بخواهی 🏙️🛸

🗣️ GWM Avatars
آواتارهای سخنگو شبیه Hedra و Live Avatars؛
نه فقط انسان، بلکه موجودات، شخصیت‌ها و حیوانات، با ویدیوهای طولانی در 720p 🎭

⚠️ اسپویل مهم
هیچ‌کدام از این‌ها هنوز آماده نیستند و زمانی برای عرضه اعلام نشده.
اینکه Runway از نظر ایده جلو بوده، اما از نظر سرعت آپدیت‌ها کمی عقب افتاده است.

📺 ویدیو کامل:
https://www.youtube.com/watch?v=OnXu-6xecxM

🌐 وب‌سایت:
https://runwayml.com/

@rss_ai_ir

#AI #RunwayML #WorldModels #GenerativeAI #VideoGeneration #Robotics #Simulation
⭐️مجموعه Nous Research کد منبع Nomos 1 را به‌صورت متن‌باز منتشر کرد

با وجود اندازه نسبتاً کوچک ۳۰ میلیارد پارامتر، این مدل موفق شد امتیاز 87 از 120 را در آزمون Putnam کسب کند؛ یکی از معتبرترین و سخت‌ترین مسابقات ریاضی جهان.

🔹 چنین امتیازی معادل رتبه دوم در میان ۳۹۸۸ شرکت‌کننده در Putnam 2024 است.
🔹 مدل Nomos 1 هشت حل کاملاً بی‌نقص ارائه داده است.
🔹 برای مقایسه، Qwen3-30B در همان شرایط تنها 24 از 120 امتیاز گرفت؛ موضوعی که نشان می‌دهد برتری Nomos بیشتر به کیفیت داده و فرایند آموزش برمی‌گردد، نه شرایط آزمون.

📌 نکته مهم:
ارزیابی پاسخ‌ها به‌صورت کور (Blind Review) انجام شده و توسط یک شرکت‌کننده واقعی Putnam از میان ۲۰۰ نفر برتر صورت گرفته که پاسخ‌های ناشناس را بررسی کرده است.

شرایط زمانی نیز کاملاً واقعی بوده:
— برای هر بخش، ۳ ساعت زمان دقیقاً مشابه شرکت‌کنندگان انسانی.

🧠 ساختار استدلال Nomos:

ابتدا چند «worker» مسائل سخت‌تر را حل می‌کنند و خودشان راه‌حل‌ها را ارزیابی می‌کنند

سپس در مرحله نهایی، سیستم پاسخ‌ها را تجمیع کرده و بهترین نتیجه را انتخاب می‌کند


🔗 لینک‌ها:
HuggingFace: https://huggingface.co/NousResearch/nomos-1
GitHub: https://github.com/NousResearch/nomos

@rss_ai_ir

#AI #LLM #MachineLearning #Math #OpenSource
رقابت هوش مصنوعی فقط دو بازیگر واقعی دارد و داده‌ها کاملاً این را نشان می‌دهند

📊 با نگاه به نقشه نویسندگان NeurIPS، عملاً یک پیش‌بینی از آینده اقتصاد جهان می‌بینیم:
چین تقریباً نیمی از میدان را در اختیار دارد، آمریکا نیم دیگر را.
اروپا—چه آگاهانه، چه از سر inertia—عملاً از رقابت کنار رفته است.

🔍 قدرت‌ها کجا هستند؟
🇺🇸 آمریکا پیشتاز در لَب‌های مرزی هوش مصنوعی، چیپ‌های پیشرفته، سرمایه در مقیاس تریلیون‌دلاری و بزرگ‌ترین بازار نرم‌افزار جهان است.
🇨🇳 چین پیشتاز در رباتیک، تولید سخت‌افزار و چرخه‌های استقرار بسیار سریع.
📉 جایگاه‌ها ممکن است جابه‌جا شوند، اما الگو روشن است: «سومیِ معنادار» وجود ندارد. دیگران از عقب می‌دوند، بدون مسیر واقعی برای حاکمیت فناورانه.

🇪🇺 نقش اتحادیه اروپا در یک تصویر
نمودار دوم از هر سند سیاستی گویاتر است:
درآمد اروپا از جریمه‌ها و تنظیم‌گری شرکت‌های فناوری، بسیار بیشتر از مالیات شرکت‌های فناوریِ ساخته‌شده در خود اروپاست.
📜 تنظیم‌گری شد مدل کسب‌وکار؛ نوآوری نه.

🌍 جمع‌بندی
نظم اقتصادی بعدی را کسانی می‌سازند که مدل‌ها را آموزش می‌دهند و ربات‌ها را می‌سازند.


@rss_ai_ir
#AI #هوش_مصنوعی #NeurIPS #China #USA #Robotics #LLM #Innovation #Geopolitics
👍1