VIRSUN
7.23K subscribers
1.45K photos
819 videos
5 files
908 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
🔥 مدل مرموز AlphaArena لو رفت — و معلوم شد Grok 4.20 بوده! 🔵


در پلتفرم AlphaArena — جایی که مدل‌های هوش مصنوعی با سرمایهٔ ۱۰ هزار دلاری در معاملات واقعی کریپتو و سهام رقابت می‌کنند — معمولاً همهٔ مدل‌ها در نهایت وارد ضرر می‌شوند.

اما چند روز پیش یک مدل جدید با نام رمز mystery model ظاهر شد که ناگهان از همه جلو زد:

♻️با جسارت معامله می‌کرد

♻️دقیقاً روی قله‌ها سود می‌گرفت

♻️و عملکردش به‌طرز مشکوکی بهتر از بقیه بود


🔍 بعداً مشخص شد که این مدل در اصل نسخهٔ تستی Grok 4.20 بوده — بله همان «۴.۲۰» که بی‌دلیل انتخاب نشده.
این موضوع را ایلان ماسک شخصاً در X تأیید کرد.

زمان انتشار رسمی هنوز اعلام نشده،
اما اگر بخواهد آخر سال یک هدیهٔ درست‌وحسابی از xAI برسد… احتمالاً همین خواهد بود. 🎁

#هوش_مصنوعی #Grok #مدل‌های_زبان #معاملات_خودکار #xAI
👍3🔥1
🔥 آنتروپیک اعلام کرد که کارمندانش اکنون حدود ۶۰٪ کارهای روزانه خود را به کلود می‌سپارند

این رقم فقط یک سال قبل حدود ۲۸٪ بود، اما حالا به شکلی انفجاری رشد کرده است.
به گفته شرکت، هوش مصنوعی بهره‌وری مهندسان را نیز حدود ۳۰ واحد درصد افزایش داده است.

یک عامل جالب هم نقش دارد:
بین کارکنان آنتروپیک یک قانون نانوشته شکل گرفته —
«اول از هوش مصنوعی بپرس، بعد از همکار.»
همین موضوع بارِ کاری و نیاز به تعاملات داخلی را در بسیاری از بخش‌ها کاهش داده است.

🔗 منبع:
www.anthropic.com/research/how-ai-is-transforming-work-at-anthropic

#هوش_مصنوعی #کلود #آنتروپیک #بهره‌وری #AI 🚀
👍2
Media is too big
VIEW IN TELEGRAM
🌐 گراند اسلو، موو فست — مدل پایه‌ای دوگانه برای ناوبری ویژنی-زبانی

📝 خلاصه:
مدل DualVLN یک سیستم دوگانه برای Vision-Language Navigation است که دو جزء اصلی دارد:

1. یک برنامه‌ریز جهانی مبتنی بر VLM برای فهم سطح بالا،


2. یک سیاست محلی سریع برای اجرای روانِ اکشن‌ها.



این ترکیب باعث می‌شود ربات‌ها بتوانند در محیط‌های پویا، در زمان واقعی و در مأموریت‌های طولانی‌مدت با پایداری بالا حرکت کنند.

🔹 تاریخ انتشار: 9 دسامبر

🔗 لینک‌ها:
• arXiv: https://arxiv.org/abs/2512.08186
• PDF: https://arxiv.org/pdf/2512.08186
• پروژه:
https://internrobotics.github.io/internvla-n1-dualvln.github.io/

• Github:
https://github.com/InternRobotics/InternNav

🔗 مدل‌های مرتبط:
https://huggingface.co/InternRobotics/InternVLA-N1-System2
https://huggingface.co/InternRobotics/InternVLA-N1-w-NavDP
https://huggingface.co/InternRobotics/InternVLA-N1-DualVLN

==================================


#AI #DataScience #MachineLearning #HuggingFace #Research
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
⚠️ ویدئوی جدیدی منتشر شده که رباتی را نشان می‌دهد که خیلی‌ها فکر می‌کردند CGI است — اما واقعی از آب درآمد!
در تصاویر تازه، آدم‌ها طوری واکنش نشان می‌دهند انگار واقعاً از ترس جانشان می‌دوند 😅🤖🔥
این ربات همان مدلی است که قبلاً تصور می‌شد یک ترفند گرافیکی باشد، اما ویدئوهای خام ثابت کرده‌اند که کاملاً واقعی و عملیاتی است.

#رباتیک #هوش_مصنوعی #فناوری #روبات_پیشرفته
👍3
🔹 آمازون نسل تازه‌ای از ابزارهای هوش مصنوعی خود را معرفی کرد: Nova 2 و Agentic-AI
@rss_ai_ir

🚀 این حرکت آمازون یک تغییر مهم در رقابت مدل‌های بزرگ هوش مصنوعی است و سه بخش اصلی دارد:

Nova 2
خانواده‌ای از مدل‌های قدرتمند برای پردازش متن، تصویر، ویدئو و وظایف چندحالته.
این مدل‌ها برای طیف گسترده‌ای از کاربردهای سازمانی طراحی شده‌اند و روی سرویس Bedrock عرضه می‌شوند.

🤖 Nova Act
عامل‌های هوشمندی که می‌توانند در مرورگر کار انجام دهند:
کلیک، پر کردن فرم‌ها، پیمایش رابط‌ها و اتوماسیون کامل فرآیندهایی که قبلاً نیازمند نیروی انسانی بودند.

🛠️ Nova Forge
پلتفرمی برای ساخت مدل‌های اختصاصی سازمانی:
پیش‌تمرین، فاین‌تیون، سفارشی‌سازی، و ساخت مدل‌های سبک‌تر یا تخصصی روی داده‌های داخلی.

🔍 چرا این مهم است؟
• افزایش بهره‌وری و حذف کارهای تکراری
• توانایی ساخت مدل‌های بومی بدون نیاز به زیرساخت سنگین
• قیمت رقابتی در برابر دیگر ارائه‌دهندگان مدل‌های بزرگ
• یکپارچگی با اکوسیستم ابری آمازون برای مقیاس‌پذیری سازمانی

لینک منبع:
https://www.aboutamazon.com/news/aws/aws-agentic-ai-amazon-bedrock-nova-models

#هوش_مصنوعی #AWS #مدل_های_تولیدی #عامل_هوشمند #اتوماسیون @rss_ai_ir
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🚨 تاکسی‌ربات Waymo وسط بازداشت پلیس وارد صحنه شد!

در لس‌آنجلس یک خودروی خودران Waymo که مسافر هم داخلش بود، مستقیم وارد منطقه‌ای شد که پلیس در حال بازداشت یک مظنون روی زمین بود — و فقط یک متر مانده به او توقف کرد! پلیس سر خودرو فریاد می‌زد اما ماشین نه متوجه شد و نه ایستاد.

نکات مهم ماجرا:

رباتاکسی بدون توجه به وضعیت، وارد محدوده‌ی مسدودشده شد و پلیس مجبور شد در حالی که مظنون را کنترل می‌کرد، دور خودرو حرکت کند.

اینکه، Waymo می‌گوید سیستم هیچ علامت دیجیتال یا سیگنالی دریافت نکرده بود که این منطقه را محدود نشان دهد، بنابراین مسیر عادی‌اش را ادامه داده است.

مسافر داخل خودرو کاملاً گیج شده بود، و مظنون هم وقتی فهمید یک تاکسی خودران وسط صحنه آمده، واکنشی داد که در ویدیو وایرال شده است.


این حادثه یک واقعیت مهم را دوباره یادآوری می‌کند:
خودران‌ها در رانندگی روزمره خوب عمل می‌کنند، اما اتفاقات غیرمنتظره‌ی انسانی همچنان بزرگ‌ترین چالش آن‌هاست.
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
مدل Wan-Move؛ نسل تازهٔ کنترل حرکت در ویدئوهای هوش مصنوعی

مدل Wan-Move امکان کنترل دقیق و مقیاس‌پذیر حرکت در ویدئوهای تولیدشده توسط هوش مصنوعی را فراهم می‌کند.
این سیستم مسیر حرکت اشیا را به فضای نهفته منتقل می‌کند و از آن برای ساخت ویژگی‌های motion-aware استفاده می‌کند—بدون اینکه نیازی به تغییر معماری مدل اصلی باشد.

🔹 خروجی: ویدئوهای 480p با کنترل حرکت بسیار دقیق
🔹 کیفیت: رقابت مستقیم با ابزارهای تجاری سطح بالا
🔹 کاربرد: مناسب برای ساخت صحنه‌های سینمایی، انیمیشن، تدوین تبلیغاتی و ویدئوهای خلاقانه با حرکت کنترل‌شده

لینک‌ها:
• arXiv: https://arxiv.org/abs/2512.08765
• PDF: https://arxiv.org/pdf/2512.08765
• Repo: https://wan-move.github.io/
• مدل:
https://huggingface.co/Ruihang/Wan-Move-14B-480P
• دیتاست:
https://huggingface.co/datasets/Ruihang/MoveBench

#ویدئو #هوش_مصنوعی #Ai #ماشین_لرنینگ #ژرف_یادگیری #تولید_ویدئو #Research
👍2
🌐 رشد سالانه مدل‌های Gemini حدود ۴۰۰٪ بوده است.

این عدد یعنی چه؟ یعنی دلیلی که «سم آلتمن» حالت code red اعلام کرد کاملاً قابل درک است.
وقتی یک اکوسیستم مدل‌های هوش مصنوعی با چنین سرعتی رشد می‌کند، رقابت وارد مرحله‌ی بقا می‌شود، نه فقط رقابت تکنولوژیک.

در سال گذشته:

گوگل چند نسل مدل‌های Gemini را عرضه کرد؛

نسخه‌های Pro، Ultra، Nano و Flash تقریباً تمام محصولات گوگل را تغذیه می‌کنند؛

سهم بازار در جستجو، موبایل و سرویس‌های ابری تحت تأثیر هوش مصنوعی افزایش یافته؛

و اکنون Gemini تبدیل به سریع‌ترین رشد در میان مدل‌های مولتی‌مودال شده است.


در چنین شرایطی، هر شرکت بزرگ مجبور است سرعت خود را چند برابر کند.
گپ ۵.۲، فشار روی OpenAI و رقابت شدید xAI همگی نشانه‌ی همین واقعیت‌اند.

🔥 آینده‌ی مدل‌ها نه خطی، بلکه نمایی در حال رشد است.

#AI #Gemini #Google #LLM #TechWar #Innovation
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
📈 گزارش‌ها نشان می‌دهند که SoftBank و NVIDIA به توافق نزدیک شده‌اند تا در استارتاپ Skild AI با ارزش‌گذاری شگفت‌انگیز ۱۴ میلیارد دلار سرمایه‌گذاری کنند؛ یعنی سه برابر بیشتر از ارزش قبلی شرکت.

همچنین ، Skild در حال توسعهٔ چیزی است که آن را «مغز همه‌کاره برای مولتی‌ورس ماشین‌ها» می‌نامد — یک هستهٔ هوشمند واحد که بتواند روی انواع ربات‌ها و سامانه‌های خودکار کار کند.

🚀 اگر این معامله نهایی شود، یکی از بزرگ‌ترین سرمایه‌گذاری‌ها در حوزهٔ رباتیک و هوش مصنوعی شکل خواهد گرفت.

#هوش_مصنوعی #AI #NVIDIA #SoftBank #رباتیک #SkildAI
👍2
🧠 رقابت هوش مصنوعی در حال تغییر است

نمودار جدید نشان می‌دهد که OpenAI دیگر رهبر بلامنازع رقابت AI نیست.
مدل‌های جدید گوگل، Meta و xAI در سال ۲۰۲۵ توانسته‌اند فاصله را کم کرده و حتی در برخی بخش‌ها پیشی بگیرند.

گوگل اکنون با مدل‌های نسل جدید در صدر قرار گرفته؛
در حالی که OpenAI که در سال‌های ۲۰۲۳ و ۲۰۲۴ اختلاف زیادی با رقبا داشت، حالا با چالش جدی مواجه شده است.

این تغییرات یعنی:

✳️سرعت پیشرفت رقبا فوق‌العاده زیاد شده

✳️برتری مدل‌های بزرگ به‌سرعت جابه‌جا می‌شود

✳️سال ۲۰۲۵ رسماً سال نبرد غول‌هاست


@rss_ai_ir

#هوش_مصنوعی #Google #OpenAI #xAI #AIrace #رقابت_هوش_مصنوعی
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
Unified Video Editing with Temporal Reasoner

📝 خلاصه:
رویکردVideoCoF ، یک رویکرد Chain-of-Frames است که دقت و تطابق ویرایش ویدیو با دستور کاربر را افزایش می‌دهد. این روش با استفاده از reasoning tokens و بدون نیاز به ماسک‌دهی توسط کاربر، نواحی مربوطه را تشخیص می‌دهد و ویرایش دقیق‌تری ارائه می‌کند.
AI-generated summary

🔹 تاریخ انتشار: ۸ دسامبر
🔹 لینک‌های مقاله:
• arXiv Page: https://arxiv.org/abs/2512.07469
• PDF: https://arxiv.org/pdf/2512.07469
• Project Page: https://videocof.github.io/
• Github: https://github.com/knightyxp/VideoCoF

🔹 مدل‌هایی که به این مقاله ارجاع داده‌اند:
https://huggingface.co/XiangpengYang/VideoCoF

==================================

#AI #VideoEditing #MachineLearning #DeepLearning #HuggingFace 🎥🤖
👍2
🔥 گروک جان یک مرد را نجات داد؛ چیزی که اورژانس تشخیص نداد!

✳️یک مرد ۴۹ ساله می‌گوید Grok جان او را نجات داده؛ بعد از اینکه پزشک اورژانس درد شدید او را اشتباه ریفلاکس معده تشخیص داد، در حالی که آپاندیس او در آستانه‌ی پارگی بود.

✳️وقتی درد غیرقابل تحمل شد، از Grok کمک خواست. هوش مصنوعی احتمال «زخم پرفوره شده یا آپاندیسیت غیرتیپیک» را مطرح کرد و به او گفت فوراً برگردد و اسکن CT مطالبه کند.

✳️او همان کار را کرد — و پزشکان فهمیدند آپاندیس او چند دقیقه تا پارگی فاصله داشته. عمل جراحی همان شب انجام شد و او روز بعد بدون درد از خواب بیدار شد.

✳️جالب اینکه او در بیمارستان نگفت که تشخیص از طرف هوش مصنوعی بوده؛ چون می‌ترسید جدی گرفته نشود. این ماجرا وایرال شد و بسیاری معتقدند این نشان می‌دهد AI می‌تواند چیزهایی را ببیند که پزشکان شلوغ از دست می‌دهند.
حتی برخی نوشته‌اند که به یک پزشک AI بیشتر اعتماد می‌کنند، اگر نتیجه مراقبت بهتر باشد.

✳️ایلان ماسک مدت‌هاست پیش‌بینی کرده بود که «پزشکی مبتنی بر AI» خیلی زود فراگیر می‌شود — و به نظر می‌رسد این آینده از راه رسیده است.

@rss_ai_ir

#هوش_مصنوعی #پزشکی #Grok #سلامت #AI #تشخیص_پزشکی
👍41👌1
📈مدل Grok 4.20؛ نابغهٔ آشفتهٔ دنیای ترید با هوش مصنوعی

در جدیدترین تورنمنت ترید بین مدل‌های برتر، فقط یک مدل توانست سود واقعی بسازد. برندهٔ مرموز؟ نسخهٔ داخلی و آزمایشی Grok 4.20 که سود +12.11% و ۴۸۴۴ دلار ثبت کرد.

عملکرد رقبا:

GPT-5.1: ۶٪–

DeepSeek V3.1: ۳۲٪–

Claude Sonnet 4.5: ۳۸٪–

Grok 4 عمومی: ۵۷٪– (رتبهٔ آخر)


طبق گزارش‌ها، Grok 4.20 تا پایان سال منتشر می‌شود. این مدل نسخهٔ تقویت‌شدهٔ Grok 4 است و یک گام به‌سمت Grok 5 با ۶ تریلیون پارامتر ـ دو برابر نسل فعلی.

نکتهٔ جالب؟
همین امروز Grok می‌تواند بدترین و بهترین مدل باشد… فقط بستگی دارد به اینکه کدام نسخه‌اش را به شما بدهند.


#هوش_مصنوعی #Grok #ترید #مدل_زبان #xAI #AInews
3👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🎧 ابزار Auphonic؛ بهترین دوستِ موزیسین‌ها برای حذف نویز

اگر موزیسین، پادکستر یا صدابردار هستی، این ابزار رو حتماً ذخیره کن؛ چون یکی از بهترین سرویس‌های حذف نویز و تمیز کردن صداست و ماهیانه ۲ ساعت پردازش رایگان می‌دهد.

حالا Auphonic چه کارهایی انجام می‌دهد؟

🎙️ حذف نویز و هیس از فایل صوتی

✂️ برش سکوت‌های اضافی و یک‌دست کردن صدا

🎼 تفکیک موسیقی از وکال با کیفیت بالا

🔊 نرمال‌سازی بلندی صدا و اصلاح خودکار سطح‌ها


برای تولید محتوا، ضبط پادکست، ادیت موسیقی یا حتی تمیز کردن وویس‌ها یک ابزار فوق‌العاده کارآمد است.

🌐 لینک سرویس:
https://auphonic.com/engine/

#صدا #هوش_مصنوعی #ویرایش_صدا #موزیک #پادکست 🎶
👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🎷 Layered PSD Diffusion 🎷

👉 معماری OmniPSD یک معماری جدید برای تولید فایل‌های PSD لایه‌دار است؛ یعنی مدل نه‌تنها تصویر می‌سازد، بلکه آن را به لایه‌های جداگانه با آلفای شفاف (RGBA) تقسیم می‌کند — متن، عناصر پیش‌زمینه، پس‌زمینه… همه در لایه‌های تمیز و قابل ویرایش.

این یعنی خروجی مدل را می‌توان مستقیم داخل Photoshop یا هر ویرایشگر PSD باز کرد و هر جزء را مستقل تغییر داد.

نسخه‌ی آنلاین دمو هم فعال است 💙


👉 Paper: arxiv.org/pdf/2512.09247
👉 Project: showlab.github.io/OmniPSD/
👉 Demo: https://www.lovart.ai/it

#AI #Diffusion #PSD #GenerativeAI #Design #OmniPSD
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 ایلان ماسک و ربات Optimus دوباره سوژهٔ اینترنت شدند!

یک ویدیوی جدید از رویداد تسلا در میامی وایرال شده و کاربران دوباره شروع کرده‌اند به مسخره کردن Optimus — این بار به‌خاطر یک سقوط وسط دمو! 😬

🔸 در ویدیو، ربات حرکتی عجیباً شبیه انسان انجام می‌دهد — تقریباً مثل کسی که هدست VR را از سرش درمی‌آورد — و درست بعد از آن واژگون می‌شود. همین باعث شده خیلی‌ها شک کنند که شاید اپراتور انسانی هنوز دخیل بوده.

🔸 این موضوع با ادعاهای قبلی ایلان ماسک مبنی بر «عملکرد کاملاً خودمختار» Optimus تناقض دارد. شبکه‌های اجتماعی فوراً پر از میم‌ها و طعنه شد.

🔸 این حادثه به موج رو‌به‌رشد تردیدها دربارهٔ پروژه رباتیک تسلا اضافه کرده. بسیاری معتقدند که Optimus هنوز به‌شدت وابسته به کنترل از راه دور است، برخلاف وعده‌های ماسک دربارهٔ «نزدیک بودن عصر ربات‌های مستقل».

به‌نظر می‌رسد Optimus هنوز از مرحلهٔ بازوی کمکی و چرخ‌تمرین رد نشده… اما اینترنت اصلاً قصد ندارد او را راحت بگذارد. 😄

#AI #Robotics #Tesla #Optimus #ElonMusk #RobotFails
This media is not supported in your browser
VIEW IN TELEGRAM
روش COREA: هم‌ترازی سه‌بعدی Coarse-to-Fine بین Gaussianهای سه‌بعدی قابل‌نوردهی مجدد و SDF با نظارت دوطرفه 3D-to-3D

📝 خلاصه:
روش COREA یک چارچوب نوآورانه است که نمایش سه‌بعدی Gaussians و توابع فاصله علامت‌دار (SDF) را به‌صورت دقیق و مرحله‌به‌مرحله (coarse-to-fine) با یکدیگر هم‌تراز می‌کند.
این مدل یادگیری هندسه را مستقیماً در فضای سه‌بعدی انجام می‌دهد و با نظارت دوطرفه 3D-to-3D، محدودیت‌های روش‌های قبلی را برطرف می‌کند.

🔍 مزایا و دستاوردها:

♻️تولید هندسه بسیار دقیق‌تر

♻️نورپردازی مجدد طبیعی‌تر و سازگارتر

بهبود چشمگیر در
• ساخت مش (Mesh Reconstruction)
• رندرینگ فیزیکی مبتنی بر نور (PBR)
• بازسازی دیدهای جدید (Novel View Synthesis)

یکپارچه‌سازی Gaussian Splatting با نمایش SDF



---

🔹 تاریخ انتشار: ۸ دسامبر

🔹 لینک‌ مقاله‌ها و پروژه
• Arxiv:
https://arxiv.org/abs/2512.07107
• PDF:
https://arxiv.org/pdf/2512.07107
• Project Page:
https://cau-vilab.github.io/COREA/
• Github:
https://github.com/CAU-VILab/COREA-arXiv

==================================


#AI #DataScience #MachineLearning #HuggingFace #Research
This media is not supported in your browser
VIEW IN TELEGRAM
این‌گونه هوش مصنوعی با علف‌های هرز مبارزه می‌کند.
دستگاه LaserWeeder G2 زمین‌های کشاورزی را اسکن می‌کند، علف‌های هرز را تشخیص می‌دهد و آن‌ها را با لیزر از بین می‌برد — دقیق، سریع و بدون مواد شیمیایی.

📊 @rss_ai_ir

#کشاورزی_هوشمند #رباتیک #هوش_مصنوعی #اتوماسیون #فناوری_کشاورزی 💡🌱
👏3
This media is not supported in your browser
VIEW IN TELEGRAM
👓 عینک‌ هوشمند جدید گوگل با قدرت Gemini در سال ۲۰۲۶ می‌آید

گوگل در حال آماده‌سازی دو مدل عینک هوشمند است که مستقیماً از مدل‌های چندوجهی Gemini قدرت می‌گیرند.

---

مدل اول – عرضه در سال ۲۰۲۶

این مدل ظاهر کاملاً شبیه عینک معمولی دارد و نمایشگر ندارد، اما:

♻️اسپیکر،
♻️میکروفون،
♻️و دوربین

روی آن قرار گرفته است.
عینک با گوشی تلفن همراه جفت می‌شود و Gemini آنچه در اطراف شماست را می‌بیند و:

♻️در لحظه به سوال‌ها پاسخ می‌دهد،
♻️محیط را تحلیل می‌کند،
♻️مکالمات را به‌طور زنده ترجمه می‌کند.

---

مدل دوم – نسخه AR با نمایشگر

مدل پیشرفته‌تر دارای نمایشگر داخلی و قابلیت‌های واقعیت افزوده (AR) خواهد بود، اما هنوز تاریخ عرضه رسمی ندارد. این نسخه قدم بعدی گوگل برای ترکیب بینایی هوشمند و اطلاعات دیجیتال روی دنیای واقعی است.
---

این عینک‌ها نشان‌دهنده ورود جدی گوگل به نسل بعدی ابزارهای پوشیدنی هوشمند هستند؛ جایی که دستیار هوش مصنوعی نه‌تنها می‌شنود، بلکه می‌بیند و با درک کامل از محیط به شما کمک می‌کند.

📊 @rss_ai_ir

#هوش_مصنوعی #گوگل #عینک_هوشمند #Gemini #AR #تکنولوژی