VIRSUN
6.15K subscribers
1.03K photos
586 videos
5 files
657 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 ربات جدید Figure 03 در تاریخ ۹ اکتبر معرفی می‌شود! 🔥

شرکت Figure AI اعلام کرده که نسخه‌ی جدید ربات انسان‌نمای خود با نام Figure 03 را به‌زودی معرفی می‌کند — و ظاهرش واقعاً فوق‌العاده است!

این ربات ادامه‌ای از مدل‌های پیشین Figure 01 و Figure 02 است، اما با طراحی بهبودیافته، تحرک طبیعی‌تر و توانایی تعامل هوشمندتر.
پیش‌بینی می‌شود که Figure 03 از فناوری‌های جدید در بینایی ماشین، هماهنگی حرکتی و پردازش زبان بهره ببرد تا بتواند به‌صورت خودکار در محیط‌های صنعتی و خانگی کار کند.

به‌گفته‌ی تیم سازنده، هدف این نسخه نزدیک‌تر شدن به کاربردهای واقعی در کارخانه‌ها، انبارها و حتی محیط‌های انسانی است.

🔥‌ منتظر باشید — ظاهراً این بار قرار است Figure واقعا وارد مرحله‌ی انقلاب در ربات‌های انسان‌نما شود.

@rss_ai_ir
#FigureAI #Figure03 #ربات_انسان‌نما #هوش_مصنوعی #Robot #AI #Humanoid
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 ورزش سنگین در Sora!

مدل ویدیوساز Sora وارد مرحله‌ی جدیدی شده — صحنه‌هایی که فیزیک را تقریباً درست شبیه‌سازی می‌کنند... تا وقتی که یک هالتر وسط هوا می‌ماند 😅

حرکات آهسته، نور واقع‌گرایانه و جزئیات بدن شگفت‌انگیز است، اما هنوز مغز حس می‌کند چیزی طبیعی نیست — مثل وزنه‌برداری در دنیای خواب!

🧠 نکته جالب اینکه مدل‌هایی مثل Sora یا Veo واقعاً دارند فیزیک را یاد می‌گیرند:
وزن، شتاب، گشتاور و برخورد اجسام — بدون هیچ داده‌ی واقعی، فقط از روی تصویر.

نتیجه؟
🔹 ویدیوهایی خیره‌کننده
🔹 اما هنوز با منطق فیزیکیِ کمی اشتباه!

📌 خلاصه:
همچنین AI هنوز قوانین نیوتن را کامل بلد نیست... ولی به‌طرز خطرناکی دارد نزدیک می‌شود ⚙️

@rss_ai_ir
#Sora #هوش_مصنوعی #ویدیوژنراتور #AI #VideoGeneration #DeepLearning
😁4👍2🤣1
⚡️ پیشرفت بزرگ در انرژی همجوشی هسته‌ای!

پژوهشگران MIT موفق به ساخت مدل هیبریدی جدیدی شده‌اند که هوش مصنوعی را با قوانین فیزیک ترکیب می‌کند تا رفتار پلاسما را در راکتورهای همجوشی پیش‌بینی کند.

🔥 نکته‌ی کلیدی این پژوهش:
⛔️این مدل می‌تواند رفتار پلاسما در لحظه‌ی خاموش شدن یا کاهش توان را پیش‌بینی کند — بحرانی‌ترین مرحله‌ی کار راکتور که در آن خطر ناپایداری و تخریب بالا است.

⛔️برخلاف مدل‌های صرفاً هوش مصنوعی، این مدل با داده‌های بسیار کمتر آموزش می‌بیند اما دقت فوق‌العاده‌ای دارد.

⛔️همچنین پژوهشگران الگوریتمی طراحی کرده‌اند که پیش‌بینی‌ها را به دستورات کنترلی واقعی برای تنظیم توان میدان‌های مغناطیسی و دمای پلاسما تبدیل می‌کند تا فرآیند خاموشی به شکل ایمن و پایدار انجام شود.

🔗 منبع MIT
@rss_ai_ir

#هوش_مصنوعی #MIT #انرژی_همجوشی #پلاسما #AI #Science
3
Media is too big
VIEW IN TELEGRAM
🤖 آمازون هم وارد میدان آموزش ربات‌های انسان‌نما شد!

شرکت Amazon از ابتدای سال تیمی را برای آموزش ربات‌های انسان‌نما تشکیل داده و حالا نتایج چشمگیر خود را منتشر کرده است.

مدل Unitree G1 که توسط آمازون برای آزمایش‌ها استفاده می‌شود، حالا توانایی‌های جالبی دارد:
🔹 جابه‌جایی جعبه‌های مختلف
🔹 حرکت دادن و بالا رفتن از صندلی
🔹 بالا رفتن و پریدن از روی سکو
🔹 و حتی خزیدن! 🧗‍♂️

🎥 در ویدیو منتشرشده، حرکات G1 بسیار طبیعی و روان به‌نظر می‌رسند — چیزی که تا همین اواخر بعید بود از رباتی با این قیمت ببینیم.

🧠 راز موفقیت آمازون در موتور OmniRetarget است — سیستمی که داده‌های حرکتی باکیفیت تولید می‌کند تا ربات بتواند مانند انسان رفتار کند.

💡 چرا آمازون از Unitree چینی استفاده کرده؟
زیرا این ربات‌ها ارزان‌تر و در عین حال دقیق‌تر از نمونه‌های آمریکایی هستند و برای آموزش الگوریتم‌های حرکتی گزینه‌ای عالی محسوب می‌شوند.

#Amazon #ربات #Unitree #هوش_مصنوعی #رباتیک #AI #Robotics
@rss_ai_ir
💯1
🐍 پایتون به نسخه 3.14 رسید — حالا رسماً بدون GIL!

نسخه‌ی جدید پایتون، یعنی Python 3.14، منتشر شد و دیگر نسخه‌ی Free-threaded (یا بدون GIL) به‌صورت رسمی و غیرازآزمایشی پشتیبانی می‌شود 🎉

🔹 ویژگی‌های جدید مهم:
t-strings —
رشته‌های قالبی جدید برای فرمت‌گذاری ساده‌تر.
🚀 Free-threaded Python —
اجرای واقعی چندریسمانی بدون قفل سراسری مفسر.
🎨 Syntax Highlighting در REPL —
حالا رنگی و خواناتر.
📦 Zstandard Compression —
پشتیبانی از فشرده‌سازی سریع در کتابخانه استاندارد.
🔍 Remote Debugging در PDB —
اشکال‌زدایی از راه دور ساده‌تر از همیشه.

📄 لیست کامل تغییرات در مستندات رسمی:

docs.python.org/3.14/whatsnew/3.14.html

جالب اینکه هنوز بسیاری از ریپازیتوری‌های تولید تصویر و ویدیو به نسخه‌ی 3.10 نیاز دارند 😅

@rss_ai_ir
#Python #Programming #AI #Tech #FreeThreadedPython
2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 StreamDiffusionV2 —
نسل جدید ویدیوهای تعاملی در زمان واقعی!

پروژه‌ی StreamDiffusion به نسخه‌ی دوم رسیده و حالا یک سیستم متن‌باز برای تولید ویدیوهای تعاملی به‌صورت Real-Time است.
هدف تیم توسعه‌دهنده: رسیدن به تعادلی بین سرعت بالا و کیفیت بصری قابل‌قبول

🚀 ویژگی‌های کلیدی:

♻️کاهش قابل‌توجه flickering و boiling artifacts در ویدیوهای دیفیوژنی

♻️پشتیبانی از GPUهای متنوع و ساختار مقیاس‌پذیر

♻️امکان تنظیم تعداد مراحل denoising برای کنترل بهتر جزئیات

♻️تولید ویدیو با نرخ فریم بالا (High FPS) مناسب برای استریم، ولاگ و پلتفرم‌های محتوایی


🎮 در واقع، StreamDiffusionV2 را می‌توان نوعی Performance Animation Real-Time مدرن دانست — نسل جدیدی از ویدیو به‌کمک AI که مستقیماً از جریان ورودی، خروجی زنده می‌سازد.

📦 کد منبع:
🔗 github.com/chenfengxu714/StreamDiffusionV2
🌐 صفحه‌ی پروژه:
🔗 streamdiffusionv2.github.io

@rss_ai_ir
#AI #StreamDiffusionV2 #VideoGeneration #RealTimeAI #DiffusionModels
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 ده سال بود که این زن نمی‌توانست روی پاهایش بایستد...
امروز، به لطف یک ربات جدید، دوباره این حس را تجربه کرد.

فناوری مدرن هر روز معجزه‌های تازه‌ای خلق می‌کند — از هوش مصنوعی گرفته تا ربات‌های کمکی که زندگی انسان‌ها را بازمی‌گردانند 💙

@rss_ai_ir
#رباتیک #هوش_مصنوعی #پیشرفت_فناوری #AI #Robotics #Innovation
3
🎬 به‌روزرسانی جدید Veo 3.1 از گوگل در راه است!

طبق اطلاعات فاش‌شده در توییتر (۸ اکتبر ۲۰۲۵)، نسخه‌ی جدید مدل تولید ویدیو Veo 3.1 از Google به‌زودی منتشر می‌شود. این مدل در لیست انتظار Higgsfield AI و در کدهای داخلی Vertex AI مشاهده شده است.

ویژگی‌های احتمالی نسخه جدید:

بهبود در ثبات و هماهنگی شخصیت‌ها در طول ویدیو

افزایش مدت زمان تولید ویدیو تا ۶۰ ثانیه

اضافه شدن سازنده‌ی صحنه‌ها (Scene Builder)

وجود پریست‌های سینمایی (Cinematic Presets) برای خروجی‌های حرفه‌ای‌تر 🎥


جامعه‌ی هوش مصنوعی این تغییرات را گامی جدی از سوی گوگل برای رقابت مستقیم با Sora از OpenAI می‌داند، هرچند گوگل هنوز به‌صورت رسمی این خبر را تأیید نکرده است.

@rss_ai_ir
#Veo3 #Google #هوش_مصنوعی #تولید_ویدیو #AI #VideoGeneration
🎥 مدتی است که کاربران متوجه یک باگ جالب در مدل‌های تولید ویدیو شده‌اند:

وقتی از مدل بخواهید ویدیویی از یک انسان وارونه (سر به پایین) بسازد و سپس همان ویدیو را ۱۸۰ درجه بچرخانید، نتیجه کاملاً غیرمنطقی و خنده‌دار می‌شود! 😂

نسخه جدید Sora از OpenAI هم هنوز از این مشکل رنج می‌برد — به‌محض چرخاندن تصویر، فیزیک بدن، لباس و حتی جاذبه کاملاً به‌هم می‌ریزد.

👀 این مسئله نشان می‌دهد که حتی مدل‌های پیشرفته‌ی ویدیو هنوز در درک پایداری فیزیکی و جهت‌گیری فضایی به درستی عمل نمی‌کنند.

📌 شاید روزی برسد که هوش مصنوعی واقعاً بداند “بالا” کجاست!

@rss_ai_ir
#هوش_مصنوعی #Sora #ویدیو #AI #VideoGeneration #OpenAI
😁2
🎬 راهنمای رسمی پرامپت‌نویسی برای Sora 2 از OpenAI

اگر می‌خواهید از مدل Sora 2 بهترین خروجی ویدیویی بگیرید، ساختار پرامپت باید دقیق و مرحله‌به‌مرحله باشد 🎥👇


---

🧩 ۱. توضیح کلی صحنه

🔹 صحنه را با زبان ساده توصیف کنید.
🔹 شخصیت‌ها، لباس‌ها، دکور، آب‌وهوا و جزئیات دیگر را بنویسید.
🔹 هرچه توصیف جزئی‌تر باشد، ویدیو دقیق‌تر مطابق تخیل شما ساخته می‌شود.


---

🎥 ۲. سینماتوگرافی (فیلم‌برداری)

زاویه و نوع نما: مثل «نمای کلی در سطح چشم» یا «کلوزآپ با زاویه از پشت».

حال و هوا: «سینمایی و پرتنش»، «شاد و پرتحرک»، «احساس انتظار لوکس».

لنز و فیلتر: «لنز ۳۵ میلی‌متری با فیلتر نرم CPL».

نور و پالت رنگ: «نور گرم از چراغ و بازتاب سرد از پنجره».



---

🕺 ۳. حرکات و اکشن‌ها

حرکات را به صورت فهرست بنویسید.

هر حرکت را به یک لحظه زمانی مرتبط کنید (مثل فریم یا ثانیه خاص).


📋 مثال:

شخصیت اصلی وارد اتاق می‌شود.

مکث کوتاه، سپس لبخند می‌زند.

دوربین آرام به سمت چپ پن می‌کند.



---

💬 ۴. دیالوگ‌ها

اگر گفت‌وگو در صحنه هست:

دیالوگ‌ها را کوتاه و طبیعی بنویسید.

با زمان ویدیو (مثلاً ۱۰ ثانیه) هماهنگ باشند.



---

🎧 ۵. صداهای پس‌زمینه

صداهای محیطی را اضافه کنید تا فضا واقعی‌تر شود.
🎵 مثال:
«صدای گام‌ها روی چوب، زمزمه مردم و صدای بخار قهوه‌ساز».



---

📄 نمونه ساختار پرامپت

Scene Description:
یک کافه مدرن در شب؛ دختری با کت چرمی سیاه در حال نوشیدن قهوه کنار پنجره‌ای بارانی است.

Cinematography:
Camera shot: کلوزآپ از زاویه پایین
Mood: آرام و عاشقانه
Lens: لنز ۵۰ میلی‌متری با عمق میدان کم
Lighting: نور گرم از داخل کافه و انعکاس نور خیابان

Actions:
- دختر فنجان قهوه را بالا می‌برد
- لبخند می‌زند و به بیرون نگاه می‌کند
- باران روی شیشه می‌لغزد

Dialogue:
"شاید فردا روز بهتری باشه..."

Background Sound:
صدای باران، موسیقی ملایم جاز، و گفت‌وگوی آرام مشتریان


📘 با این ساختار، خروجی ویدیوهای شما در Sora 2 دقیق‌تر، سینمایی‌تر و واقع‌گرایانه‌تر خواهد بود.

@rss_ai_ir
#Sora2 #OpenAI #Prompting #VideoAI #هوش_مصنوعی #ویدیو
1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 این ربات واقعاً می‌تواند «کار واقعی» انجام دهد!

تصور کنید چنین سیستمی در خشکشویی‌های صنعتی مثل هتل‌ها، بیمارستان‌ها یا خانه‌های سالمندان استفاده شود — به‌صورت خودکار لباس‌ها را تا می‌کند و مرتب تحویل می‌دهد. 🧺

در نسخه‌های پیشرفته‌تر حتی می‌تواند لباس‌ها را تشخیص، دسته‌بندی و چینش هوشمند انجام دهد.

⚙️ این یعنی بسیاری از مشاغل خدماتی به‌زودی با ربات‌های خودکار جایگزین خواهند شد — دقیق‌تر، سریع‌تر و بدون خستگی.

👕 آینده‌ی صنعت شست‌وشو و پوشاک دیگر هرگز مثل قبل نخواهد بود.

@rss_ai_ir
#رباتیک #هوش_مصنوعی #اتوماسیون #AI #Robot #Automation #Laundry
👍2
🧠 مجموعه‌ای از «بسته‌های پرامپت» (Prompt Packs) در سایت OpenAI Academy منتشر شده است!

در این بخش، پرامپت‌های آماده و تخصصی برای حوزه‌های مختلف قرار گرفته‌اند — هر کدام با مثال‌های واقعی و سناریوهای کاربردی 👇

📦 دسته‌بندی‌ها:

💼 Sales — پرامپت‌های فروش و مذاکره

🧩 Product — طراحی و بهبود محصول

💻 IT & Engineering — راهکارهای فنی و مهندسی نرم‌افزار

👔 HR — جذب و مدیریت منابع انسانی

⚙️ Engineers — کمک در کدنویسی و حل مسائل فنی

🧭 Managers & Executives — برای مدیران، تحلیل تصمیم‌گیری و استراتژی


در هر بخش، ده‌ها پرامپت آماده وجود دارد که می‌توانید مستقیماً در ChatGPT استفاده کنید — از نگارش ایمیل گرفته تا طراحی سیستم یا تحلیل داده.

📎 لینک مستقیم:
🔗 academy.openai.com/public/tags/prompt-packs-6849a0f98c613939acef841c

@rss_ai_ir
#OpenAI #PromptEngineering #ChatGPT #پرامپت #هوش_مصنوعی
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Grok Imagine 0.9 Desktop
بالاخره منتشر شد!

در نسخه‌ی جدید، ویژگی Lip-sync عمومی اضافه شده — اما با نتایج بامزه‌ای 😄
مثلاً در ویدیوهای تست، کوسه و سنجاب هر دو هم‌زمان دهان باز می‌کنند (هرکدام با استایل خودش!) 🦈🐿

📉 مشکل اینجاست که الگوریتم لب‌خوانی مدل، روی تمام دهان‌ها و پوزه‌های موجود در تصویر اعمال می‌شود، و چون هنوز تفکیک موجودات انجام نمی‌دهد، حرکات لب‌ها به شکل هماهنگ ولی عجیب اجرا می‌شود.

با این حال، Grok Imagine 0.9 گام مهمی است به سمت ویدیوهای چندشخصیتی و هم‌زمان با صداهای مختلف 🎧

@rss_ai_ir
#Grok #xAI #LipSync #هوش_مصنوعی #AI #VideoGeneration
👍2
⚠️ ابزار حذف واترمارک Sora 2 منتشر شد — اما با خطرات جدی قانونی!

ابزاری جدید با نام Sora Watermark Remover به کاربران اجازه می‌دهد تا واترمارک و نشانه‌ی برند OpenAI را از ویدیوهای تولیدشده توسط Sora 2 حذف کنند، آن هم بدون افت کیفیت 🎥

اما توجه کنید 👇
🔸 طبق قوانین OpenAI، حذف یا دست‌کاری واترمارک‌ها و متادیتاهای ویدیو نقض شرایط استفاده (ToS) محسوب می‌شود.
🔸 این واترمارک‌ها برای شفاف‌سازی منشأ محتوای تولیدشده با هوش مصنوعی و جلوگیری از سوءاستفاده طراحی شده‌اند.
🔸 ابزارهایی از این نوع، حتی اگر از نظر فنی مؤثر باشند، می‌توانند منجر به مسدود شدن حساب Sora یا ChatGPT شوند.

از Sora 2 می‌توان برای ساخت محتوای حرفه‌ای استفاده کرد، اما حفظ واترمارک، احترام به قوانین و شفافیت در تولید محتوا است.

📌 توصیه: اگر می‌خواهید از ویدیوهای تولیدی در شبکه‌های اجتماعی (مثل TikTok) استفاده کنید، واترمارک را به بخشی از استایل خود تبدیل کنید — این کار به شناسایی و اعتماد مخاطب کمک می‌کند.

https://www.topyappers.com/tools/sora-watermark-remover

@rss_ai_ir
#Sora2 #OpenAI #AIContent #هوش_مصنوعی #قوانین #شفافیت
1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
💄 Pixel-Perfect Depth
؛ استاندارد جدید در تخمین عمق تک‌تصویری (SOTA)
💄


🔹 مدل Pixel-Perfect Depth یک سیستم پیشرفته برای تخمین عمق از تصاویر تک‌چشمی (mono-depth estimation) است که از Pixel-Space Diffusion Transformers استفاده می‌کند و اکنون رکورد جدیدی در دقت (SOTA) ثبت کرده است.


🚀 ویژگی‌ها:
✳️تخمین عمق با دقت پیکسلی و جزئیات خیره‌کننده 🖼️
✳️طراحی بر پایه ترنسفورمرهای دیفیوزنی در فضای تصویر (نه ویژگی‌ها)
✳️پشتیبانی از ساختارهای پیچیده و بافت‌های ظریف
✳️عملکرد عالی در سناریوهای واقعیت افزوده، نقشه‌برداری و بینایی رباتیک


📜 لایسنس آزاد: Apache 2.0

🔗 مقاله: lnkd.in/d8wxFpyY
🔗 پروژه: lnkd.in/dV5HhsqH
🔗 کد: lnkd.in/d9JKFBJq
🔗 دموی آنلاین: lnkd.in/d3wBkKJ9

@rss_ai_ir
#AI #ComputerVision #DepthEstimation #DiffusionModels #SOTA #هوش_مصنوعی
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🎭 GAGA.ART
چینی‌ها هم وارد میدان آواتارهای هوشمند شدند! 🇨🇳

پلتفرم GAGA.ART که خیلی‌ها آن را «نسخه‌ی چینی Hedra» می‌دانند، امکان ساخت آواتار سخنگو از روی یک عکس را فراهم کرده است — فقط کافی‌ست تصویر و متن یا صدای ورودی بدهید تا چهره شروع به صحبت کند. 🗣️

🎬 امکانات اصلی:

✳️ساخت ویدیو از عکس با ورودی متن یا صوت 🎤
✳️نسخه‌ی Gaga Actor برای لب‌خوانی از متن
✳️نسخه‌ی Gaga Avatar برای هماهنگی با صدای واقعی کاربر
✳️الگوریتم "Emotion-aware lipsync" (به‌گفته‌ی سازندگان، هماهنگ با احساسات و میکرو‌حرکات چهره!)


💰 مزایا و معایب واقعی:
۲۰۰ اعتبار رایگان برای شروع
ساخت تصویر و آواتار رایگان در برخی حالت‌ها
ویدیوها فقط ۱۰ ثانیه‌اند (در مقایسه با Hedra که تا چند دقیقه می‌سازد)
گاهی جزئیات چهره مثل دندان یا دهان غیرطبیعی به‌نظر می‌رسد
رابط کاربری هنوز خیلی ابتدایی است

🔗 آدرس: https://gaga.art/
📌 ورود با حساب Google ممکن است

در کل تجربه‌ی جالبی است، مخصوصاً اگر دنبال جایگزین رایگان برای Hedra یا Pika باشید — ولی هنوز راه زیادی تا کیفیت حرفه‌ای دارد.

@rss_ai_ir
#AvatarAI #LipSync #AI #هوش_مصنوعی #آواتار #GAGAART
2
This media is not supported in your browser
VIEW IN TELEGRAM
💡 مدل RND1 — انقلاب در تولید متن با رویکرد دیفیوژنی!

🧠 مدل RND1 یک مدل زبانی آزمایشی با ۳۰ میلیارد پارامتر است که بر پایه‌ی معماری Sparse Mixture-of-Experts (MoE) ساخته شده؛ اما فقط ۳ میلیارد پارامتر آن در هر لحظه فعال است.
یعنی قدرت زیاد، اما با مصرف بسیار کمتر! ⚙️

🔁 تفاوت اصلی RND1 با مدل‌های معمولی مثل GPT در این است که: مدل‌های کلاسیک (Autoregressive) متن را کلمه به کلمه تولید می‌کنند،
اما RND1 کل جمله را به‌صورت همزمان می‌سازد و سپس در چند مرحله آن را دقیق‌تر می‌کند — درست مثل مدل‌های دیفیوژنی که تصویر را از «نویز» بیرون می‌کشند. 🎨


---

🚀 چطور ساخته شد؟

تیم Radical Numerics موفق شد یک مدل زبانی موجود (Qwen3-30B-A3B) را به مدل دیفیوژنی تبدیل کند — بدون نیاز به آموزش از صفر!

این فرآیند را AR-to-Diffusion Conversion (A2D) می‌نامند:
۱️⃣ انتخاب یک مدل قوی شبیه GPT
۲️⃣ تغییر مکانیزم توجه (attention) تا مدل کل متن را همزمان ببیند
۳️⃣ آموزش روی داده‌های جدید با روش دیفیوژنی
۴️⃣ استفاده از نرخ یادگیری متفاوت برای بخش‌های مختلف شبکه تا مدل هم «یاد قدیمی» را نگه دارد، هم «تفکر جدید» یاد بگیرد 🧩


---

⚙️ ویژگی‌های کلیدی

🔸 اول MoE فعال: تنها ۳ میلیارد پارامتر در هر بار فعال می‌شوند → سرعت بالا و بهره‌وری انرژی عالی.
🔸 یادگیری پیوسته: دانش قبلی پاک نمی‌شود، بلکه در منطق جدید ادغام می‌شود.

🔸 همچنین Batchهای عظیم: آموزش پایدار حتی هنگام مشاهده‌ی هم‌زمان کل توکن‌ها.


---

چرا اهمیت دارد؟

تولید موازی متن — بدون تأخیر گام‌به‌گام
مصرف کمتر منابع با حفظ کیفیت GPTهای بزرگ
معماری هیبریدی بین AR و DLM
کاملاً متن‌باز (کد، گزارش و وزن‌ها در دسترس‌اند)
گامی مهم به‌سوی هوش خودبهبودیاب (RSI)؛ مدلی که می‌تواند خودش را طراحی و بهبود دهد 🤖


---

📎 منابع:
🔸 وبلاگ:
radicalnumerics.ai/blog/rnd1
🔸 کد:
github.com/RadicalNumerics/RND1
🔸 گزارش فنی:
rnd1_report.pdf
🔸 وزن‌ها:
huggingface.co/radicalnumerics/RND1-Base-0910


---

📡 @rss_ai_ir
#RND1 #RadicalNumerics #AI #DLM #DiffusionModel #MoE #OpenSource
👍1
🚀 راهنمای جدید Qwen برای مدل چندوجهی Qwen3-VL منتشر شد!


شرکت Qwen (وابسته به Alibaba) مجموعه‌ای از دفترچه‌های تعاملی (Notebooks) منتشر کرده که کاربردهای قدرتمند مدل چندوجهی Qwen3-VL را به‌صورت گام‌به‌گام نشان می‌دهد — هم برای اجرا روی سیستم محلی و هم از طریق API.
📚 در این مجموعه، ده‌ها مثال واقعی با توضیحات دقیق وجود دارد، از جمله:

🔸 تحلیل و استدلال روی تصاویر
🔸 عامل تعاملی با رابط کاربری (Computer-Use Agent)
🔸 برنامه‌نویسی چندوجهی (Multimodal Programming)
🔸 تشخیص اشیاء و صحنه‌ها (Omni Recognition)
🔸 استخراج داده از اسناد و PDFها
🔸 تشخیص دقیق اشیاء در تصاویر
🔸 OCR
و استخراج اطلاعات کلیدی
🔸 تحلیل سه‌بعدی و لنگرگذاری اشیاء (3D Anchoring)
🔸 درک متون طولانی
🔸 استدلال فضایی (Spatial Reasoning)
🔸 عامل موبایل (Mobile Agent)
🔸 تحلیل و درک ویدیو 🎥


🔗 منابع رسمی:
🟠 گیت‌هاب:
github.com/QwenLM/Qwen3-VL/tree/main/cookbooks
🟠 مستندات
API: alibabacloud.com/help/en/model-studio/user-guide/vision
🟠 تجربه آنلاین:
chat.qwen.ai/?models=qwen3-vl-plus


📌 اگر به دنبال مدلی هستید که بینایی، زبان و منطق فضایی را هم‌زمان ترکیب کند، Qwen3-VL یکی از پیشرفته‌ترین گزینه‌های متن‌باز امروز است.

@rss_ai_ir
#Qwen #Qwen3VL #هوش_مصنوعی #LLM #Multimodal #VisionLanguage #AI
1
Media is too big
VIEW IN TELEGRAM
🤖 Figure 03 —
نخستین ربات انسان‌نمای تجاری برای بازار انبوه

شرکت Figure AI از نسل سوم ربات انسان‌نمای خود با نام Figure 03 رونمایی کرد — نخستین مدلی که به‌طور ویژه برای تولید انبوه طراحی شده است.

این ربات با استفاده از تعامل مستقیم با انسان‌ها آموزش می‌بیند و می‌تواند مجموعه‌ای از وظایف خانگی و صنعتی را انجام دهد — از خانه و هتل گرفته تا انبارها و مراکز خدماتی.

🧠 سیستم هوش مصنوعی آن با نام Helix، بینایی، زبان و عمل را در یک چارچوب واحد ترکیب می‌کند، تا ربات بتواند مانند انسان‌ها در محیط واقعی تصمیم‌گیری و عمل کند.

🔧 ویژگی‌های جدید Figure 03:

♻️بدنه از مواد نرم و قابل شست‌وشو ساخته شده، بدون مکانیزم‌های باز یا خطرناک
♻️وزن ۹٪ کمتر از نسل قبلی
♻️تغییر روش تولید از CNC به قالب‌گیری صنعتی (molding) برای سرعت بالاتر در مونتاژ
♻️هدف تولید: ۱۲,۰۰۰ دستگاه در سال و رسیدن به ۱۰۰,۰۰۰ دستگاه طی چهار سال آینده


🎯 بهبودهای فنی:

✳️میدان دید وسیع‌تر برای دوربین‌ها
✳️دوربین‌های تعبیه‌شده در کف دست برای تعامل دقیق‌تر
✳️حسگرهای فشار لمسی پیشرفته
✳️سیستم صوتی جدید برای تشخیص بهتر صداها
✳️شارژ بی‌سیم با قابلیت انتقال داده
✳️قابلیت «تغییر لباس» با یونیفرم‌های مختلف برای محیط‌های کاری متفاوت 👕


🎥 در ویدیوهای رسمی، Figure 03 با حرکاتی نرم و طبیعی با انسان‌ها و اشیاء محیط تعامل می‌کند — اما هنوز باید دید در دنیای واقعی چه‌قدر قابل اعتماد خواهد بود.

💰 قیمت هنوز اعلام نشده است، اما این ربات گامی بزرگ به‌سوی حضور انسان‌نماها در زندگی روزمره محسوب می‌شود.

@rss_ai_ir
#Figure03 #FigureAI #هوش_مصنوعی #رباتیک #Humanoid #AI #Robotics #Helix
👍2🔥1👏1
💻 چرا دیگر خرید کارت گرافیک خانگی منطقی نیست؟ 😅

⛔️در یک نمودار جالب که اخیراً منتشر شده، به‌خوبی نشان داده شده که چرا عصر "هوش مصنوعی خانگی" به پایان رسیده است.

📈 طبق داده‌ها:

✳️نیاز سخت‌افزاری برای اجرای مدل‌های هوش مصنوعی سالانه ۴.۵ برابر رشد می‌کند.

✳️در بهترین حالت، طبق قانون مور، کارایی چیپ‌ها تنها هر ۱.۵ سال دو برابر می‌شود.

✳️حتی این آمار به حافظهٔ محدود روی تراشه‌ها اشاره‌ای نمی‌کند — که همان‌قدر بحرانی است.


نتیجه واضح است:
⚠️ نیاز به توان محاسباتی سریع‌تر از رشد سخت‌افزار افزایش می‌یابد، و کاربر معمولی دیگر نمی‌تواند هم‌پای این رقابت باقی بماند.

📊 در تصویر دوم، مقایسهٔ جالبی آمده:
هزینهٔ ساخت دیتاسنترها در آمریکا در سال ۲۰۲۵ تقریباً با هزینهٔ ساخت برج‌های اداری جدید برابر شده است!

🧠 دنیایی که زمانی با لپ‌تاپ و کارت گرافیک شخصی قابل تجربه بود، حالا به قلمرو ابرکامپیوترها و دیتاسنترها تبدیل شده.
می‌توان گفت عصر «یقه‌سفیدها و یقه‌آبی‌ها» جای خود را به یقه‌های سیلیکونی داده است 😎

@rss_ai_ir
#هوش_مصنوعی #GPU #AIHardware #Datacenter #NVIDIA #ComputePower
😢41👌1💯1🍌1