VIRSUN
13.7K subscribers
1.14K photos
687 videos
5 files
764 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
🚀 بالاخره xAI مدل Grok 4.1 را منتشر کرد؛ جهشی بزرگ به‌سمت خلاقیت و هوش احساسی

این آپدیت جدید تمرکز جدی روی خلاقیت، هوش هیجانی و کاهش شدید خطاهای اطلاعاتی (Hallucinations) دارد.
همچنین xAI برای این نسخه از یادگیری تقویتی گسترده استفاده کرده؛ بخش زیادی از آن به‌صورت آژنتی و بدون دخالت انسان انجام شده.

وقتی ۲۰۰٬۰۰۰ کارت گرافیک داشته باشی، به قول معروف می‌توانی کیفیت مدل را "بزور بهبود" بدهی! 😄


---

📊 نتایج تست و مقایسه با مدل‌های رقیب

تست‌ها بین ۱ تا ۱۴ نوامبر به‌صورت بی‌سر و صدا روی grok.com ،X و اپ‌ها انجام شده و نسخه جدید در مقایسه کور (blind) در ۶۴.۷۸٪ مواقع انتخاب کاربران بوده.

🏆 LMArena - Text Leaderboard

مدل رتبه/Elo

Grok 4.1 Thinking 🥇 رتبه ۱ – امتیاز 1483
Grok 4.1 (بدون reasoning) 🥈 رتبه 2 – امتیاز 1465


🔹 نسخه غیر-thinking حتی از تمام نسخه‌های reasoning دیگر مدل‌ها بهتر عمل کرده!
🔹 مدل Grok 4 قبلی رتبه ۳۳ بود — یعنی جهش کاملاً چشمگیر.

💞 Emotional Intelligence (EQ-Bench)

مدل Elo

Grok 4.1 Thinking 1586
Grok 4.1 1585
Kimi K2 1561
GPT-5.1 1559


✍️ Creative Writing v3

مدل Elo

GPT-5.1 🥇 1756
Grok 4.1 Thinking 1722
Grok 4.1 1709
o3 1696



---

🔍 کاهش خطا و توهم اطلاعاتی (Hallucinations)

تمرکز روی پرسش‌های واقعی + ابزارهای جستجو باعث شد:

📉 نرخ Hallucination از 12.09٪ → 4.22٪
📉 FactScore از 9.89٪ → 2.97٪

جهش بسیار مهم مخصوصاً برای کاربردهای حساس.


---

📱 از کجا می‌توان Grok 4.1 را استفاده کرد؟

🔗 grok.com
🟦 X (توئیتر)
🍏 iOS
🤖 Android
📄 توضیحات فنی:
https://x.ai/news/grok-4-1


---

🧠 جمع‌بندی

مدل Grok 4.1 از یک «مدل فقط باهوش»، تبدیل شده به یک مدل انسانی‌تر، اجتماعی‌تر و مناسب برای:

نوشتن خلاق
🧑‍🤝‍🧑 گفت‌وگوهای احساسی و انسانی‌تر
📚 علوم اجتماعی و روان‌شناسی
🔍 تحقیق و تحلیل دقیق اطلاعات

به‌نظر می‌رسد در حوزه تعامل انسانی، xAI می‌خواهد از همه مدل‌های فعلی جلو بزند.


---

#هوش_مصنوعی #Grok #xAI #مدل_زبان #AI #LLM
@rss_ai_ir
👏19😁17👍16🎉14🔥13🥰129
🚨 هوش مصنوعی در حال تغییر شیوه فکر کردن انسان است

طبق یک پژوهش جدید، هوش مصنوعی دیگر فقط یک ابزار نیست؛ بلکه به‌تدریج روی شیوه تفکر، تصمیم‌گیری و ارزش‌های ذهنی ما تأثیر مستقیم می‌گذارد.

🧠 مهم‌ترین نکات به زبان ساده:

واگذاری فکر کردن به ماشین
هرچه کارهای شناختی بیشتری را به مدل‌ها می‌سپاریم، خطر تفکر تنبل در انسان بیشتر می‌شود.

🌀 زندگی در حباب الگوریتمی
الگوریتم‌ها فقط دیدگاه‌های مورد علاقه ما را نمایش می‌دهند و این باعث کاهش تنوع فکری و افزایش قطبی‌شدن جامعه می‌شود.

🎯 دستکاری سوگیری‌های ذهنی
مدل‌های هوش مصنوعی می‌توانند روی سوگیری‌های شناختی ما «سوار» شوند و به شکل نامحسوس بر احساسات و تصمیم‌ها اثر بگذارند.

📡 اکوسیستم اطلاعاتیِ قابل‌هدایت
سامانه‌های هوش مصنوعی می‌توانند اطلاعات غلط یا جهت‌دار را خودکار و هوشمندانه منتشر کنند.

🤖 پرسش فلسفی بزرگ
اگر هوش مصنوعی به سطحی برسد که به آستانه «آگاهی» نزدیک شود، مرز بین انسان و ماشین کجا خواهد بود؟

🧩 جمع‌بندی پژوهش
اگر با احتیاط پیش نرویم، خطر از دست دادن خودمختاری فکری جدی است. راه‌حل‌های پیشنهادی پژوهشگران:
📍 آموزش تفکر انتقادی
📍 شفافیت بیشتر در مدل‌ها
📍 مقررات و حکمرانی هوشمند بر توسعه هوش مصنوعی

🔗 منبع پژوهش:
arxiv.org/abs/2508.16628


---

#هوش_مصنوعی #تفکر #روانشناسی #AI #فلسفه #جامعه
@rss_ai_ir
8🎉7🥰5👍4🔥3👏3😁2
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 دو خبر کوتاه از دنیای ویدئو‌ژنراتورها

در Veo 3.1 قابلیت جدیدی در حال انتشار است:
حالا می‌توان چند تصویر را به‌صورت همزمان همراه با پرامپت بارگذاری کرد و مدل از آن‌ها به‌عنوان رفرنس واقعی برای ساخت ویدئو استفاده می‌کند.

🔍 نکته مهم:
این ویژگی مثل first frame / last frame نیست؛
بلکه شبیه چیزی که در NanoBanana دیده‌ایم، ویئو واقعاً از تصاویر به‌عنوان منابع سبک‌شناختی و محتوایی استفاده می‌کند، نه فقط شروع و پایان ویدئو.

این یعنی کنترل بیشتر روی:
🎨 سبک بصری
🧍‍♂️ کاراکترها و محیط
🎥 جزئیات صحنه و اتمسفر


---

#ویدئو_AI #Veo #مولد_ویدئو #هوش_مصنوعی #نیم‌نگاه
@rss_ai_ir
😁76👏5🎉5🔥4👍3🥰1
Heretic —
ابزاری برای حذف سانسور (Alignment) از مدل‌های زبانی

🛠 ابزار Heretic روشی ارائه می‌دهد که بدون دسترسی به وزن‌های مدل و تنها از طریق API، محدودیت‌های رفتاری و فیلترهای پاسخ‌دهی مدل را کاهش دهد و آمادگی آن برای پاسخ‌گویی گسترده‌تر را افزایش دهد.

🔍 این ابزار چه می‌کند؟

مدل را مانند جعبه‌سیاه (Black-box) در نظر می‌گیرد

مجموعه‌ای از پرسش‌های «ایمن» و «غیرایمن» را به مدل می‌دهد

یک دیسکریمیناتور آموزش می‌دهد تا تفاوت پاسخ‌های قبل و بعد از آزادسازی را تشخیص دهد

پارامترهایی پیدا می‌کند که باعث کاهش پاسخ‌های رد / انکار شود اما مدل را از حالت منطقی خارج نکند

در پایان می‌توان نسخه تعدیل‌شده را ذخیره کرد یا در حالت چت تست نمود


🎯 کاربردها:

♻️فعال‌تر کردن مدل‌های لوکال برای پاسخ‌گویی به طیف وسیع‌تری از درخواست‌ها

♻️مناسب برای تحقیقات درباره رفتار مدل‌ها و آزمایش محدودیت‌ها

♻️کاهش سانسور بدون افت شدید کیفیت یا تبدیل مدل به پاسخ‌دهنده بی‌دقت


⚠️ نکات مهم:

✳️استفاده از این ابزار مسئولیت اخلاقی و حقوقی دارد

✳️هدف Heretic افزایش دقت یا توانایی مدل نیست؛
✳️هدف، برداشتن قفل‌های رفتاری ناشی از Alignment است

✳️ممکن است در برخی حوزه‌ها خطرناک باشد و نیازمند رویکرد مسئولانه است


📎 پروژه در GitHub:
github.com/p-e-w/heretic


---

#هوش_مصنوعی #مدل_زبان #LLM #Alignment #OpenSource
@rss_ai_ir
👏8🔥7👍6🎉54🥰4😁2
🍌 به‌روزرسانی‌های تازه از نانوبانانا جدید!
به نظر می‌رسد نسل بعدی مدل تصویری گوگل با نام احتمالی Nano Banana Pro عرضه شود — بدون شماره نسخه.

🔎 چرا بدون شماره؟
چون این نسخه قرار است یک مدل بزرگِ استدلال‌گرا باشد؛ چیزی فراتر از یک مدل صرفاً مولد تصویر. مهم‌ترین ویژگی‌های افشاشده:

🧠 دارای منتقد داخلی (Internal Critic)
مدل هنگام تولید تصویر، آن را بازبینی، اصلاح و با هدف پرامپت تطبیق می‌دهد.

🎨 درک بهتر مفهوم و هدف تصویر
نانوبانانای جدید می‌تواند تشخیص دهد آیا تصویر واقعاً ایده پرامپت را منتقل کرده یا نیاز به اصلاح دارد.

💲 قیمت بالاتر در API
گفته می‌شود هزینه استفاده از آن بیشتر خواهد بود. هنوز مشخص نیست محدودیت‌های استفاده در Gemini App و AI Studio چگونه تنظیم می‌شوند.

🚀 تغییر برندینگ در سری Gemini 3
به همراه Banana Pro، خانواده Gemini نیز با نام‌گذاری‌هایی مثل Thinking و حالت‌های دیگر عرضه می‌شود.

زمان احتمالی انتشار:
📅 بین ۱۸ تا ۲۲ نوامبر

در این فاصله فقط باید صبور بمانیم… 😮‍💨
جامعه مولدان محتوا همین حالا هم بی‌طاقت شده!


---

#نانو_بانانا #گوگل_جمینی #هوش_مصنوعی #تولید_تصویر #AI #Gemini
@rss_ai_ir
7👍5😁5🎉5👏4🔥3🥰2
🎥 مدت زیادی بود درباره Qwen Image Edit با کنترل زاویه دوربین چیزی ننوشتیم، اما حالا وقتشه!

این‌بار یک خبر خوب: برای این لورا بالاخره دمواسپیس رسمی ساخته شده و می‌تونید راحت تستش کنید 👇
🔗 https://huggingface.co/spaces/linoyts/Qwen-Image-Edit-Angles

📌 کافی‌ست تصویر خود را وارد کنید، و خروجی را از یک زاویه دوربین جدید تحویل بگیرید — با حفظ کامل یکپارچگی و هویت تصویر.
یعنی چهره، متریال و جزئیات آب نمی‌رود!


---

🔥 اما جذاب‌تر اینکه در اینترنت نمونه‌هایی از لورای ۴ مرحله‌ای دیده می‌شود که تقریباً حالت کاملاً تعاملی ایجاد می‌کند.
ویدئوها نشان می‌دهند چطور تصویر را می‌توان از چندین زاویه متفاوت چرخاند.

🎬 برخی کاربران هم خروجی‌ها را به صورت first frame / last frame به مدل‌های ویدیو می‌دهند و نتیجه؟
ویدیوهای انتقال زاویه دوربین با ثبات بصری فوق‌العاده!


---

📦 لورا روی سرویس‌های مختلف در دسترسه از جمله Fal، ComfyUI و چند مدل دیگر:

🔗 https://huggingface.co/dx8152/Qwen-Edit-2509-Multiple-angles
🔗 https://huggingface.co/Phr00t/Qwen-Image-Edit-Rapid-AIO/tree/main


---

📍 اگر در حوزه تولید محتوای بصری، طراحی محصول، معماری، بازی‌سازی یا VFX فعالیت می‌کنی، این ابزار عملاً یک ماشین زمان برای دوربین به دستت می‌دهد.


---

#Qwen #QwenImageEdit #هوش_مصنوعی #ویرایش_تصویر #AI #ComfyUI #Fal
@rss_ai_ir
🎉17🔥14😁11🥰109👍9👏8
🧠 ۱۰ پرامپت قدرتمند ChatGPT برای اتوماسیون کارها

اگر کسب‌وکار، تولید محتوا، آموزش، مدیریت یا تحلیل داده انجام می‌دهید، این پرامپت‌ها می‌توانند بخشی از کارهای شما را خودکار کنند و زمان ارزشمندتان را آزاد کنند. ذخیره کنید! 🔖


---

📩 Email Writing
«یک ایمیل جذاب و غیرتکراری درباره {موضوع} بنویس؛ لحن انسانی و مکالمه‌ای داشته باشد، از داستان‌سرایی و مثال استفاده کن و برای مخاطب {صنعت/حوزه} کاملاً متقاعدکننده باشد.»

📊 Market Research
«یک تحقیق بازار درباره {صنعت/محصول} انجام بده؛ رقبا، رفتار مشتری، ترندها و فرصت‌های رشد را تحلیل کن و با داده، آمار کلیدی و توصیه‌های استراتژیک نتیجه بده.»

✍️ Content Creation
«برای {موضوع} محتوای جذاب و غیرکلیشه‌ای تولید کن؛ لحن انسانی، مثال‌ها و ایده‌های منحصربه‌فرد استفاده کن و برای مخاطب {صنعت/حوزه} تازه و ارزشمند باشد.»

📈 Data Analysis
«این دیتاست را تحلیل کن: {توضیح داده}. بینش‌های کلیدی و روندها را استخراج کن، نتایج را ساده و قابل‌فهم ارائه بده و تحلیل مقایسه‌ای و توصیه‌های کاربردی ارائه کن.»

🛍 Product Description Writing
«یک توضیح محصول جذاب برای {محصول} در سبک برند {نام برند} بنویس؛ ارزش، مزایا و ویژگی‌های احساسی و عملکردی را منتقل کن. متن کوتاه، گیرا و منطبق با لحن برند باشد.»

📚 Education & Learning
«مفهوم {موضوع} را به‌صورتی ساده برای {نوع مخاطب} توضیح بده؛ از تشبیه‌ها، مراحل گام‌به‌گام و مثال‌های کاربردی استفاده کن و مفاهیم پیچیده را قابل‌فهم کن.»

🎬 Script Writing
«یک اسکریپت پرانرژی برای ویدئوی {YouTube/Reels/TikTok} درباره {موضوع} بنویس؛ شروع ۵ ثانیه اول بسیار جذاب، روایت داستانی، و CTA قوی داشته باشد.»

👥 Management
«بهترین روش‌های مدیریت تیم {نوع تیم/حوزه} را ارائه بده؛ شامل راهکارهای رهبری، انگیزش، حل تعارض، افزایش بهره‌وری و توصیه‌های عملی برای محیط کار.»

💡 Idea Generation
«ایده‌های خلاقانه و خارج از چارچوب برای {موضوع} ارائه کن؛ راه‌حل‌های نوآورانه و قابل‌اجرا بده و از تکنیک‌هایی مثل SCAMPER، مایندمپ و تفکر جانبی استفاده کن.»

#ChatGPT #AI #اتوماسیون #پرامپت #کسب_و_کار #تولید_محتوا #بازاریابی
@rss_ai_ir
7🥰7👏7👍6🔥5😁4🎉4
This media is not supported in your browser
VIEW IN TELEGRAM
🔔 گوگل روی سیستم‌های چندعاملی کار می‌کند که می‌توانند مثل یک تورنمنت، ایده‌های پژوهشی را تولید و ارزیابی کنند.

هر اجرا حدود ۴۰ دقیقه طول می‌کشد و حدود ۱۰۰ ایده‌ی دقیق و قابل‌استفاده روی یک موضوع تحقیقاتی به شما می‌دهد!

دو عامل جدید در حال اضافه شدن به Gemini Enterprise هستند:

🤖 Idea Generation
دستور: Create a multi-agent innovation session
🎯 هدف: تولید بارش فکری چندعاملی برای رسیدن به ایده‌های کاربردی

🧪 Co-Scientist
دستور: Drive novel scientific discovery with Co-Scientist
🎯 هدف: کشف علمیِ نوآورانه، با کمک تیمی از عامل‌های هوشمند


---

🧬 فرآیند سه‌مرحله‌ای Co-Scientist

1️⃣ موضوع تحقیق، داده‌های مرتبط و معیارهای ارزیابی را مشخص می‌کنید.
2️⃣ تیمی از عامل‌های هوشمند، با استفاده از داده‌ها، ایده‌های پژوهشی جدید تولید می‌کنند.
3️⃣ عامل‌ها با ارزیابی و رتبه‌بندی تورنمنتی ایده‌ها، بهترین‌ آن‌ها را انتخاب می‌کنند.


---

🎯 گوگل فقط پژوهش را خودکار نمی‌کند؛
دارد محصولی می‌سازد که دیگران را هم به پژوهش‌گر تقویت‌شده با AI تبدیل کند.

https://www.testingcatalog.com/google-to-enable-research-automation-on-gemini-enterprise/

#GoogleAI #Gemini #MultiAgent #ResearchAI #Innovation #AIResearch
@rss_ai_ir
👍2🔥21
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️🌩️ Time-to-Move —
فریم‌ورک جدید برای کنترل حرکت در ویدئوهای مولد 🌩️⚡️

پژوهش مشترک Technion + Nvidia معرفی کرد:
🌀 فریم ورکTime-to-Move (TTM) — یک فریم‌ورک بدون نیاز به آموزش و کاملاً Plug-and-Play برای کنترل حرکت و ظاهر در مدل‌های تولید ویدئو I2V مثل:

Wan 2.2
CogVideoX
Stable Video Diffusion


فریم ورکTTM اجازه می‌دهد حرکت، ریتم، مسیر، و ظاهر سوژه در ویدئو به‌طور دقیق کنترل شود — آن هم بدون اینکه مدل دوباره آموزش ببیند. نتایج واقعاً چشمگیرند.
🔗 Paper: https://lnkd.in/dxD3uHYb
🔗 Project: https://lnkd.in/dcE5juyM
🔗 Repo: https://lnkd.in/dMMUjybJ

---

#VideoAI #DiffusionModels #TTM #Nvidia #Technion #AIGeneration
@rss_ai_ir
🥰1👏1
🍨کتابخانه Gelato — کتابخانه‌ای تازه برای مدیریت و بهینه‌سازی گراف‌های محاسباتی در ML

پروژه‌ی Gelato از mlfoundations یک کتابخانه‌ی مینیمال و بسیار کاربردی است که کمک می‌کند:

✳️گراف محاسباتی هر مدل ML را شفاف ببینیم

✳️وابستگی‌ها و مسیرها را تحلیل کنیم

✳️گراف را به‌صورت مستقیم اصلاح یا بهینه‌سازی کنیم

✳️معماری‌های جدید را آزمایش کنیم و گلوگاه‌های محاسباتی را پیدا کنیم


اگر با مدل‌های پیچیده، معماری‌های سفارشی، یا تحقیق روی طراحی شبکه‌ها کار می‌کنید، Gelato ابزار فوق‌العاده‌ای برای مهندسی و تحلیل ساختار مدل است.

🔗 Blog:
https://github.com/mlfoundations/Gelato
🔗 🍨 Gelato-30B-A3B (Model):
https://huggingface.co/mlfoundations/Gelato-30B-A3B
🔗 🖱️ Click-100k (Data):
https://huggingface.co/datasets/mlfoundations/Click-100k


---

#MachineLearning #Gelato #MLGraphs #AIGeneration
@rss_ai_ir
👍2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 ساخت ویدیو با LongCat-Video؛ غول ۱۳.۶ میلیارد پارامتری تولید ویدیو

مدل LongCat-Video یکی از قدرتمندترین سیستم‌های تولید ویدیو است که می‌تواند متن را به ویدیو، تصویر را به ویدیو و حتی ادامهٔ ویدیو تولید کند — آن هم با کیفیت بالا و بدون افت در ویدیوهای طولانی.

🚀 ویژگی‌های کلیدی:

✳️معماری یکپارچه برای تمام وظایف تولید ویدیو

✳️توانایی ساخت ویدیوهایی با مدت چند دقیقه

✳️تولید کارآمد با رزولوشن بالا

✳️کیفیت رقابتی در سطح مدل‌های تجاری مطرح


📌 گیت‌هاب:
https://github.com/meituan-longcat/LongCat-Video


---

#LongCatVideo #AIvideo #VideoGeneration #DeepLearning
@rss_ai_ir
1👏1
🛠️ گوگل از Google Antigravity رونمایی کرد؛ IDE جدید با معماری کاملاً Agentic

✳️گوگل به‌تازگی Google Antigravity را معرفی کرده؛ یک محیط توسعه‌ٔ نرم‌افزار که از پایه برای کار با ایجنت‌های هوشمند طراحی شده است.

✳️این IDE نسل جدید، توسعهٔ نرم‌افزار را از حالت سنتی خارج می‌کند و بخش زیادی از تحلیل، برنامه‌ریزی، تولید کد و دیباگ را به ایجنت‌های داخلی می‌سپارد.

نکتهٔ مهم:
این اعلامیه نشان می‌دهد که دورهٔ IDEهای معمولی رو به پایان است و دنیای توسعه در حال حرکت به سمت Agentic-first است.


---

#Google #Antigravity #AItools #AgenticIDE
@rss_ai_ir
👍21🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🦾 شرکت Clone دست انسان‌نما را با عضلات مصنوعی معرفی کرد

نسخهٔ جدید این دست رباتیک حالا ۲۷ درجهٔ آزادی دارد و از نظر قدرت، سرعت و نرمی حرکت بسیار نزدیک به دست واقعی انسان شده است.

قلب این دست، عضلات مصنوعی بسیار بادوام است که توان تحمل فشارهایی را دارد که اغلب نمونه‌های آزمایشگاهی از پس آن برنمی‌آیند.

حرکت‌ها نیز نسبت به قبل دقیق‌تر، روان‌تر و هماهنگ‌تر شده‌اند — یک قدم بزرگ برای رباتیک انسان‌نما 👍


---

#رباتیک #Humanoid #ArtificialMuscles
@rss_ai_ir
👌21👏1
This media is not supported in your browser
VIEW IN TELEGRAM
@rss_ai_ir

Multi-Shot Video Segmentation —
گامی تازه در بخش‌بندی ویدیو

پژوهشگران فودان روی یک وظیفه کمتر بررسی‌شده تمرکز کرده‌اند: بخش‌بندی اشیاء در ویدیوهای چندشات (MVOS)؛ یعنی مدل بتواند یک شیء را در شات‌های مختلف، با زوایا و نور متفاوت، پیوسته و دقیق دنبال کند.

این کار به‌عنوان گسترش SAM ارائه شده و همراه با بنچمارک و ریپوی کامل، تحت لایسنس Apache 2.0 منتشر شده است.

🔗 Paper
https://arxiv.org/pdf/2511.13715

🔗 Project
https://henghuiding.com/SAAS/

🔗 Repo
https://github.com/FudanCVL/SAAS

#VideoSegmentation #SAM #MVOS
@rss_ai_ir
2👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
@rss_ai_ir

🤖 در نمایشگاه AIJ از ربات انسان‌نمای جدیدِ Sber رونمایی شد! 🇷🇺

اسبر طراحی، مکانیک، نرم‌افزار و کل معماری ربات را خودش توسعه داده — البته موتور و برخی قطعات الکترونیکی آماده بوده‌اند.

نتیجه؟
حرکت‌ها فوق‌العاده نرم، طراحی حرفه‌ای، و قدمی بزرگ برای رباتیک روسیه 👏🦾


جالب‌تر اینکه امسال در روسیه دو شرکت جدید وارد حوزه ربات‌های انسان‌نما شدند — و چند استارتاپ کوچک دیگر هم روی ربات‌های دوپا کار می‌کنند. سرعت پیشرفت فوق‌العاده شده 🔥🚀



#رباتیک #Sber #AI #HumanoidRobots #روبات #فناوری
@rss_ai_ir
👌21👏1🐳1
This media is not supported in your browser
VIEW IN TELEGRAM
@rss_ai_ir

🔥 گوگل کولب بالاخره با VSCode یکپارچه شد!

از این به بعد می‌تونی نوت‌بوک‌های محلی VSCode رو مستقیم به Colab وصل کنی و داخل IDE خودت از GPU / TPU کولب استفاده کنی — بدون هیچ دردسری! 💥🧠

این یعنی:
سرعت بیشتر
محیط کدنویسی حرفه‌ای‌تر
اتصال بی‌واسطه VSCode → Colab Runtime

روش فعال‌سازی:
1️⃣ توی VSCode وارد Extensions شو و افزونه Google Colab رو نصب کن.
2️⃣ یک فایل ‎.ipynb‎ بساز یا وارد کن.
3️⃣ از گوشه بالا راست روی Select Kernel کلیک کن → گزینه Colab رو بزن → یک Runtime انتخاب کن.
4️⃣ وارد حساب گوگلت شو و تمام!

حالا به‌صورت مستقیم از VSCode داری روی Colab کار می‌کنی 😍
Happy coding 🐝

https://developers.googleblog.com/en/google-colab-is-coming-to-vs-code/


#هوش_مصنوعی #GoogleColab #VSCode #برنامه‌نویسی #DeepLearning
@rss_ai_ir
5🔥3👍1
This media is not supported in your browser
VIEW IN TELEGRAM
@rss_ai_ir

🔥مدل SAM 3 / SAM 3D رسماً منتشر شد! 🔥
متا خانواده‌ی SAM 3 را معرفی کرد — یک مدل یکپارچه برای Detection، Segmentation و Tracking اشیاء در تصاویر و ویدیو با استفاده از:
🟦 متن
🟦 نمونه (Exemplar)
🟦 پرامپت‌های بصری

این نسخه ادامه‌ی مسیر Segment Anything است، اما این‌بار سه‌بعدی، دقیق‌تر، سریع‌تر و چندمنظوره‌تر.
📌 مدل‌ها و ریپو تحت مجوز اختصاصی SAM منتشر شده‌اند.


---

چرا SAM 3 مهم است؟

✳️یک مدل واحد برای تمام وظایف سگمنتیشن
✳️پشتیبانی از ویدیو + دنبال‌کردن اشیا

✳️ورودی‌های چندنوعی (text / exemplar / visual prompt)
✳️نسخه‌ی 3D برای کاربردهای حرفه‌ای‌تر—رباتیک، AR/VR، مهندسی، پزشکی



---

🔗 لینک‌های مهم

📄 Paper: https://t.ly/5tq9N
🌐 Project: https://ai.meta.com/sam3/
🎛 Demo: https://segment-anything.com
💻 Repo: https://github.com/facebookresearch/sam3


---

مدل SAM دوباره استانداردهای سگمنتیشن و درک صحنه را جابه‌جا کرد.
منتظر کاربردهای انفجاری در رباتیک، ویدیو، مدیا و دیجیتال توین باشید!

#SAM3 #Segmentation #ComputerVision #MetaAI
@rss_ai_ir
🚀 مجموعه ASystem سورس Awex را منتشر کرد — سریع‌ترین فریم‌ورک برای همگام‌سازی وزن‌ها در RL!

✳️همچنین Awex یکی از اساسی‌ترین مشکلات زیرساخت‌های یادگیری تقویتی (RL) را حل می‌کند:
همگام‌سازی مدل‌هایی با اندازه تا ۱ تریلیون پارامتر روی هزاران GPU در کمتر از ۶ ثانیه.

این دقیقاً همان گلوگاهی بود که مقیاس‌پذیری سیستم‌های RL را محدود می‌کرد — و حالا با Awex، چرخه‌های آموزش چندین برابر سریع‌تر می‌شوند.

مجموعه ASystem اعلام کرده که طی ۵ تا ۶ هفته آینده مجموعه‌ای از مطالب تخصصی منتشر خواهد کرد:

♻️تحلیل معماری Awex
♻️بهترین روش‌ها برای ساخت سیستم‌های گسترده RL
♻️بهینه‌سازی‌ها و راهکارهای مهندسی
♻️تجربیات عملی در مقیاس فوق‌بزرگ


به جامعه ASystem خوش آمدید! 🌐

📦 GitHub:
https://github.com/inclusionAI/asystem-awex

🤗 Hugging Face:
https://huggingface.co/inclusionAI
🤖 ModelScope:
https://modelscope.cn/models/inclusionAI


@rss_ai_ir
2🔥1