VIRSUN
6.12K subscribers
1.05K photos
605 videos
5 files
670 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 مجموعه DoorDash ربات تحویل خودکار خود به نام Dot را معرفی کرد! 🚚

شرکت DoorDash از ربات جدیدش با نام Dot رونمایی کرده است — یک ربات تحویل خودران که می‌تواند در خیابان‌ها و پیاده‌روها حرکت کند و سفارش‌ها را بدون نیاز به راننده به مقصد برساند.

🔹 ویژگی‌ها:

مجهز به سامانه‌ی هوش مصنوعی و لیدار برای درک محیط

توانایی تشخیص عابران، خودروها و موانع در مسیر

حرکت ایمن در مناطق شهری با سرعت کنترل‌شده

ارتباط مستقیم با اپلیکیشن DoorDash برای هماهنگی تحویل


این ربات بخشی از برنامه‌ی DoorDash برای کاهش هزینه‌های تحویل و افزایش پایداری زیست‌محیطی است.
با ورود Dot، آینده‌ی تحویل غذا شاید دیگر هرگز مثل قبل نباشد! 🍕🤖

@rss_ai_ir
#رباتیک #هوش_مصنوعی #DoorDash #AutonomousRobot #DeliveryRobot #AI
🤯 غیرقابل‌باور! مدل جدید سامسونگ، ۱۰٬۰۰۰ برابر کوچک‌تر از DeepSeek و Gemini 2.5 Pro — اما باهوش‌تر!

سامسونگ از مدل جدید خود با نام Tiny Recursive Model (TRM) رونمایی کرده است — مدلی که نشان می‌دهد هوش مصنوعی فقط به اندازه نیست، بلکه به نحوه‌ی تفکر بستگی دارد.

🧠 چطور کار می‌کند؟
به‌جای پیش‌بینی ساده‌ی متن مانند LLMهای کلاسیک، TRM به‌صورت بازگشتی (Recursive) فکر می‌کند:

1. ابتدا یک پاسخ اولیه می‌نویسد ✍️


2. سپس در «دفترچه‌ی ذهنی» پنهان خود منطق پاسخ را بررسی می‌کند 🧩


3. تا ۱۶ بار استدلالش را نقد و بازنویسی می‌کند 🔁


4. در نهایت نسخه‌ی بهینه‌شده و دقیق‌تری تولید می‌کند



📊 نتیجه:
این مدل در آزمون‌های ARC-AGI 1 و 2 (یکی از دقیق‌ترین معیارهای سنجش استدلال) از DeepSeek و Gemini 2.5 Pro پیشی گرفته است — با وجود اینکه ۱۰٬۰۰۰ برابر کوچک‌تر است!

⚙️ اهمیت:

اثباتی بر این‌که هوش مصنوعی را می‌توان با معماری بهتر و چرخه‌های منطقی عمیق‌تر، نه فقط پارامترهای بیشتر، بهبود داد.

اجرای سریع‌تر و کم‌هزینه‌تر 💡

نزدیک‌تر شدن به ایده‌های Neuro-Symbolic AI

گامی بزرگ به‌سوی مدل‌های فشرده اما باهوش جهانی 🌍


به‌نظر می‌رسد آینده‌ی هوش مصنوعی نه در غول‌های تریلیونی، بلکه در مدل‌های کوچکِ اندیشمند نهفته است. 🧩

https://arxiv.org/pdf/2510.04871v1

@rss_ai_ir 🤖
#Samsung #هوش_مصنوعی #TinyModel #TRM #AI #Reasoning #DeepSeek #Gemini2_5 #RecursiveAI
🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 ربات جدید Figure 03 در تاریخ ۹ اکتبر معرفی می‌شود! 🔥

شرکت Figure AI اعلام کرده که نسخه‌ی جدید ربات انسان‌نمای خود با نام Figure 03 را به‌زودی معرفی می‌کند — و ظاهرش واقعاً فوق‌العاده است!

این ربات ادامه‌ای از مدل‌های پیشین Figure 01 و Figure 02 است، اما با طراحی بهبودیافته، تحرک طبیعی‌تر و توانایی تعامل هوشمندتر.
پیش‌بینی می‌شود که Figure 03 از فناوری‌های جدید در بینایی ماشین، هماهنگی حرکتی و پردازش زبان بهره ببرد تا بتواند به‌صورت خودکار در محیط‌های صنعتی و خانگی کار کند.

به‌گفته‌ی تیم سازنده، هدف این نسخه نزدیک‌تر شدن به کاربردهای واقعی در کارخانه‌ها، انبارها و حتی محیط‌های انسانی است.

🔥‌ منتظر باشید — ظاهراً این بار قرار است Figure واقعا وارد مرحله‌ی انقلاب در ربات‌های انسان‌نما شود.

@rss_ai_ir
#FigureAI #Figure03 #ربات_انسان‌نما #هوش_مصنوعی #Robot #AI #Humanoid
🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 ورزش سنگین در Sora!

مدل ویدیوساز Sora وارد مرحله‌ی جدیدی شده — صحنه‌هایی که فیزیک را تقریباً درست شبیه‌سازی می‌کنند... تا وقتی که یک هالتر وسط هوا می‌ماند 😅

حرکات آهسته، نور واقع‌گرایانه و جزئیات بدن شگفت‌انگیز است، اما هنوز مغز حس می‌کند چیزی طبیعی نیست — مثل وزنه‌برداری در دنیای خواب!

🧠 نکته جالب اینکه مدل‌هایی مثل Sora یا Veo واقعاً دارند فیزیک را یاد می‌گیرند:
وزن، شتاب، گشتاور و برخورد اجسام — بدون هیچ داده‌ی واقعی، فقط از روی تصویر.

نتیجه؟
🔹 ویدیوهایی خیره‌کننده
🔹 اما هنوز با منطق فیزیکیِ کمی اشتباه!

📌 خلاصه:
همچنین AI هنوز قوانین نیوتن را کامل بلد نیست... ولی به‌طرز خطرناکی دارد نزدیک می‌شود ⚙️

@rss_ai_ir
#Sora #هوش_مصنوعی #ویدیوژنراتور #AI #VideoGeneration #DeepLearning
😁4👍2🤣1
⚡️ پیشرفت بزرگ در انرژی همجوشی هسته‌ای!

پژوهشگران MIT موفق به ساخت مدل هیبریدی جدیدی شده‌اند که هوش مصنوعی را با قوانین فیزیک ترکیب می‌کند تا رفتار پلاسما را در راکتورهای همجوشی پیش‌بینی کند.

🔥 نکته‌ی کلیدی این پژوهش:
⛔️این مدل می‌تواند رفتار پلاسما در لحظه‌ی خاموش شدن یا کاهش توان را پیش‌بینی کند — بحرانی‌ترین مرحله‌ی کار راکتور که در آن خطر ناپایداری و تخریب بالا است.

⛔️برخلاف مدل‌های صرفاً هوش مصنوعی، این مدل با داده‌های بسیار کمتر آموزش می‌بیند اما دقت فوق‌العاده‌ای دارد.

⛔️همچنین پژوهشگران الگوریتمی طراحی کرده‌اند که پیش‌بینی‌ها را به دستورات کنترلی واقعی برای تنظیم توان میدان‌های مغناطیسی و دمای پلاسما تبدیل می‌کند تا فرآیند خاموشی به شکل ایمن و پایدار انجام شود.

🔗 منبع MIT
@rss_ai_ir

#هوش_مصنوعی #MIT #انرژی_همجوشی #پلاسما #AI #Science
3
Media is too big
VIEW IN TELEGRAM
🤖 آمازون هم وارد میدان آموزش ربات‌های انسان‌نما شد!

شرکت Amazon از ابتدای سال تیمی را برای آموزش ربات‌های انسان‌نما تشکیل داده و حالا نتایج چشمگیر خود را منتشر کرده است.

مدل Unitree G1 که توسط آمازون برای آزمایش‌ها استفاده می‌شود، حالا توانایی‌های جالبی دارد:
🔹 جابه‌جایی جعبه‌های مختلف
🔹 حرکت دادن و بالا رفتن از صندلی
🔹 بالا رفتن و پریدن از روی سکو
🔹 و حتی خزیدن! 🧗‍♂️

🎥 در ویدیو منتشرشده، حرکات G1 بسیار طبیعی و روان به‌نظر می‌رسند — چیزی که تا همین اواخر بعید بود از رباتی با این قیمت ببینیم.

🧠 راز موفقیت آمازون در موتور OmniRetarget است — سیستمی که داده‌های حرکتی باکیفیت تولید می‌کند تا ربات بتواند مانند انسان رفتار کند.

💡 چرا آمازون از Unitree چینی استفاده کرده؟
زیرا این ربات‌ها ارزان‌تر و در عین حال دقیق‌تر از نمونه‌های آمریکایی هستند و برای آموزش الگوریتم‌های حرکتی گزینه‌ای عالی محسوب می‌شوند.

#Amazon #ربات #Unitree #هوش_مصنوعی #رباتیک #AI #Robotics
@rss_ai_ir
💯1
🐍 پایتون به نسخه 3.14 رسید — حالا رسماً بدون GIL!

نسخه‌ی جدید پایتون، یعنی Python 3.14، منتشر شد و دیگر نسخه‌ی Free-threaded (یا بدون GIL) به‌صورت رسمی و غیرازآزمایشی پشتیبانی می‌شود 🎉

🔹 ویژگی‌های جدید مهم:
t-strings —
رشته‌های قالبی جدید برای فرمت‌گذاری ساده‌تر.
🚀 Free-threaded Python —
اجرای واقعی چندریسمانی بدون قفل سراسری مفسر.
🎨 Syntax Highlighting در REPL —
حالا رنگی و خواناتر.
📦 Zstandard Compression —
پشتیبانی از فشرده‌سازی سریع در کتابخانه استاندارد.
🔍 Remote Debugging در PDB —
اشکال‌زدایی از راه دور ساده‌تر از همیشه.

📄 لیست کامل تغییرات در مستندات رسمی:

docs.python.org/3.14/whatsnew/3.14.html

جالب اینکه هنوز بسیاری از ریپازیتوری‌های تولید تصویر و ویدیو به نسخه‌ی 3.10 نیاز دارند 😅

@rss_ai_ir
#Python #Programming #AI #Tech #FreeThreadedPython
2🔥2
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 StreamDiffusionV2 —
نسل جدید ویدیوهای تعاملی در زمان واقعی!

پروژه‌ی StreamDiffusion به نسخه‌ی دوم رسیده و حالا یک سیستم متن‌باز برای تولید ویدیوهای تعاملی به‌صورت Real-Time است.
هدف تیم توسعه‌دهنده: رسیدن به تعادلی بین سرعت بالا و کیفیت بصری قابل‌قبول

🚀 ویژگی‌های کلیدی:

♻️کاهش قابل‌توجه flickering و boiling artifacts در ویدیوهای دیفیوژنی

♻️پشتیبانی از GPUهای متنوع و ساختار مقیاس‌پذیر

♻️امکان تنظیم تعداد مراحل denoising برای کنترل بهتر جزئیات

♻️تولید ویدیو با نرخ فریم بالا (High FPS) مناسب برای استریم، ولاگ و پلتفرم‌های محتوایی


🎮 در واقع، StreamDiffusionV2 را می‌توان نوعی Performance Animation Real-Time مدرن دانست — نسل جدیدی از ویدیو به‌کمک AI که مستقیماً از جریان ورودی، خروجی زنده می‌سازد.

📦 کد منبع:
🔗 github.com/chenfengxu714/StreamDiffusionV2
🌐 صفحه‌ی پروژه:
🔗 streamdiffusionv2.github.io

@rss_ai_ir
#AI #StreamDiffusionV2 #VideoGeneration #RealTimeAI #DiffusionModels
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 ده سال بود که این زن نمی‌توانست روی پاهایش بایستد...
امروز، به لطف یک ربات جدید، دوباره این حس را تجربه کرد.

فناوری مدرن هر روز معجزه‌های تازه‌ای خلق می‌کند — از هوش مصنوعی گرفته تا ربات‌های کمکی که زندگی انسان‌ها را بازمی‌گردانند 💙

@rss_ai_ir
#رباتیک #هوش_مصنوعی #پیشرفت_فناوری #AI #Robotics #Innovation
3
🎬 به‌روزرسانی جدید Veo 3.1 از گوگل در راه است!

طبق اطلاعات فاش‌شده در توییتر (۸ اکتبر ۲۰۲۵)، نسخه‌ی جدید مدل تولید ویدیو Veo 3.1 از Google به‌زودی منتشر می‌شود. این مدل در لیست انتظار Higgsfield AI و در کدهای داخلی Vertex AI مشاهده شده است.

ویژگی‌های احتمالی نسخه جدید:

بهبود در ثبات و هماهنگی شخصیت‌ها در طول ویدیو

افزایش مدت زمان تولید ویدیو تا ۶۰ ثانیه

اضافه شدن سازنده‌ی صحنه‌ها (Scene Builder)

وجود پریست‌های سینمایی (Cinematic Presets) برای خروجی‌های حرفه‌ای‌تر 🎥


جامعه‌ی هوش مصنوعی این تغییرات را گامی جدی از سوی گوگل برای رقابت مستقیم با Sora از OpenAI می‌داند، هرچند گوگل هنوز به‌صورت رسمی این خبر را تأیید نکرده است.

@rss_ai_ir
#Veo3 #Google #هوش_مصنوعی #تولید_ویدیو #AI #VideoGeneration
🎥 مدتی است که کاربران متوجه یک باگ جالب در مدل‌های تولید ویدیو شده‌اند:

وقتی از مدل بخواهید ویدیویی از یک انسان وارونه (سر به پایین) بسازد و سپس همان ویدیو را ۱۸۰ درجه بچرخانید، نتیجه کاملاً غیرمنطقی و خنده‌دار می‌شود! 😂

نسخه جدید Sora از OpenAI هم هنوز از این مشکل رنج می‌برد — به‌محض چرخاندن تصویر، فیزیک بدن، لباس و حتی جاذبه کاملاً به‌هم می‌ریزد.

👀 این مسئله نشان می‌دهد که حتی مدل‌های پیشرفته‌ی ویدیو هنوز در درک پایداری فیزیکی و جهت‌گیری فضایی به درستی عمل نمی‌کنند.

📌 شاید روزی برسد که هوش مصنوعی واقعاً بداند “بالا” کجاست!

@rss_ai_ir
#هوش_مصنوعی #Sora #ویدیو #AI #VideoGeneration #OpenAI
😁2
🎬 راهنمای رسمی پرامپت‌نویسی برای Sora 2 از OpenAI

اگر می‌خواهید از مدل Sora 2 بهترین خروجی ویدیویی بگیرید، ساختار پرامپت باید دقیق و مرحله‌به‌مرحله باشد 🎥👇


---

🧩 ۱. توضیح کلی صحنه

🔹 صحنه را با زبان ساده توصیف کنید.
🔹 شخصیت‌ها، لباس‌ها، دکور، آب‌وهوا و جزئیات دیگر را بنویسید.
🔹 هرچه توصیف جزئی‌تر باشد، ویدیو دقیق‌تر مطابق تخیل شما ساخته می‌شود.


---

🎥 ۲. سینماتوگرافی (فیلم‌برداری)

زاویه و نوع نما: مثل «نمای کلی در سطح چشم» یا «کلوزآپ با زاویه از پشت».

حال و هوا: «سینمایی و پرتنش»، «شاد و پرتحرک»، «احساس انتظار لوکس».

لنز و فیلتر: «لنز ۳۵ میلی‌متری با فیلتر نرم CPL».

نور و پالت رنگ: «نور گرم از چراغ و بازتاب سرد از پنجره».



---

🕺 ۳. حرکات و اکشن‌ها

حرکات را به صورت فهرست بنویسید.

هر حرکت را به یک لحظه زمانی مرتبط کنید (مثل فریم یا ثانیه خاص).


📋 مثال:

شخصیت اصلی وارد اتاق می‌شود.

مکث کوتاه، سپس لبخند می‌زند.

دوربین آرام به سمت چپ پن می‌کند.



---

💬 ۴. دیالوگ‌ها

اگر گفت‌وگو در صحنه هست:

دیالوگ‌ها را کوتاه و طبیعی بنویسید.

با زمان ویدیو (مثلاً ۱۰ ثانیه) هماهنگ باشند.



---

🎧 ۵. صداهای پس‌زمینه

صداهای محیطی را اضافه کنید تا فضا واقعی‌تر شود.
🎵 مثال:
«صدای گام‌ها روی چوب، زمزمه مردم و صدای بخار قهوه‌ساز».



---

📄 نمونه ساختار پرامپت

Scene Description:
یک کافه مدرن در شب؛ دختری با کت چرمی سیاه در حال نوشیدن قهوه کنار پنجره‌ای بارانی است.

Cinematography:
Camera shot: کلوزآپ از زاویه پایین
Mood: آرام و عاشقانه
Lens: لنز ۵۰ میلی‌متری با عمق میدان کم
Lighting: نور گرم از داخل کافه و انعکاس نور خیابان

Actions:
- دختر فنجان قهوه را بالا می‌برد
- لبخند می‌زند و به بیرون نگاه می‌کند
- باران روی شیشه می‌لغزد

Dialogue:
"شاید فردا روز بهتری باشه..."

Background Sound:
صدای باران، موسیقی ملایم جاز، و گفت‌وگوی آرام مشتریان


📘 با این ساختار، خروجی ویدیوهای شما در Sora 2 دقیق‌تر، سینمایی‌تر و واقع‌گرایانه‌تر خواهد بود.

@rss_ai_ir
#Sora2 #OpenAI #Prompting #VideoAI #هوش_مصنوعی #ویدیو
1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 این ربات واقعاً می‌تواند «کار واقعی» انجام دهد!

تصور کنید چنین سیستمی در خشکشویی‌های صنعتی مثل هتل‌ها، بیمارستان‌ها یا خانه‌های سالمندان استفاده شود — به‌صورت خودکار لباس‌ها را تا می‌کند و مرتب تحویل می‌دهد. 🧺

در نسخه‌های پیشرفته‌تر حتی می‌تواند لباس‌ها را تشخیص، دسته‌بندی و چینش هوشمند انجام دهد.

⚙️ این یعنی بسیاری از مشاغل خدماتی به‌زودی با ربات‌های خودکار جایگزین خواهند شد — دقیق‌تر، سریع‌تر و بدون خستگی.

👕 آینده‌ی صنعت شست‌وشو و پوشاک دیگر هرگز مثل قبل نخواهد بود.

@rss_ai_ir
#رباتیک #هوش_مصنوعی #اتوماسیون #AI #Robot #Automation #Laundry
👍2
🧠 مجموعه‌ای از «بسته‌های پرامپت» (Prompt Packs) در سایت OpenAI Academy منتشر شده است!

در این بخش، پرامپت‌های آماده و تخصصی برای حوزه‌های مختلف قرار گرفته‌اند — هر کدام با مثال‌های واقعی و سناریوهای کاربردی 👇

📦 دسته‌بندی‌ها:

💼 Sales — پرامپت‌های فروش و مذاکره

🧩 Product — طراحی و بهبود محصول

💻 IT & Engineering — راهکارهای فنی و مهندسی نرم‌افزار

👔 HR — جذب و مدیریت منابع انسانی

⚙️ Engineers — کمک در کدنویسی و حل مسائل فنی

🧭 Managers & Executives — برای مدیران، تحلیل تصمیم‌گیری و استراتژی


در هر بخش، ده‌ها پرامپت آماده وجود دارد که می‌توانید مستقیماً در ChatGPT استفاده کنید — از نگارش ایمیل گرفته تا طراحی سیستم یا تحلیل داده.

📎 لینک مستقیم:
🔗 academy.openai.com/public/tags/prompt-packs-6849a0f98c613939acef841c

@rss_ai_ir
#OpenAI #PromptEngineering #ChatGPT #پرامپت #هوش_مصنوعی
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 Grok Imagine 0.9 Desktop
بالاخره منتشر شد!

در نسخه‌ی جدید، ویژگی Lip-sync عمومی اضافه شده — اما با نتایج بامزه‌ای 😄
مثلاً در ویدیوهای تست، کوسه و سنجاب هر دو هم‌زمان دهان باز می‌کنند (هرکدام با استایل خودش!) 🦈🐿

📉 مشکل اینجاست که الگوریتم لب‌خوانی مدل، روی تمام دهان‌ها و پوزه‌های موجود در تصویر اعمال می‌شود، و چون هنوز تفکیک موجودات انجام نمی‌دهد، حرکات لب‌ها به شکل هماهنگ ولی عجیب اجرا می‌شود.

با این حال، Grok Imagine 0.9 گام مهمی است به سمت ویدیوهای چندشخصیتی و هم‌زمان با صداهای مختلف 🎧

@rss_ai_ir
#Grok #xAI #LipSync #هوش_مصنوعی #AI #VideoGeneration
👍2
⚠️ ابزار حذف واترمارک Sora 2 منتشر شد — اما با خطرات جدی قانونی!

ابزاری جدید با نام Sora Watermark Remover به کاربران اجازه می‌دهد تا واترمارک و نشانه‌ی برند OpenAI را از ویدیوهای تولیدشده توسط Sora 2 حذف کنند، آن هم بدون افت کیفیت 🎥

اما توجه کنید 👇
🔸 طبق قوانین OpenAI، حذف یا دست‌کاری واترمارک‌ها و متادیتاهای ویدیو نقض شرایط استفاده (ToS) محسوب می‌شود.
🔸 این واترمارک‌ها برای شفاف‌سازی منشأ محتوای تولیدشده با هوش مصنوعی و جلوگیری از سوءاستفاده طراحی شده‌اند.
🔸 ابزارهایی از این نوع، حتی اگر از نظر فنی مؤثر باشند، می‌توانند منجر به مسدود شدن حساب Sora یا ChatGPT شوند.

از Sora 2 می‌توان برای ساخت محتوای حرفه‌ای استفاده کرد، اما حفظ واترمارک، احترام به قوانین و شفافیت در تولید محتوا است.

📌 توصیه: اگر می‌خواهید از ویدیوهای تولیدی در شبکه‌های اجتماعی (مثل TikTok) استفاده کنید، واترمارک را به بخشی از استایل خود تبدیل کنید — این کار به شناسایی و اعتماد مخاطب کمک می‌کند.

https://www.topyappers.com/tools/sora-watermark-remover

@rss_ai_ir
#Sora2 #OpenAI #AIContent #هوش_مصنوعی #قوانین #شفافیت
1👍1
This media is not supported in your browser
VIEW IN TELEGRAM
💄 Pixel-Perfect Depth
؛ استاندارد جدید در تخمین عمق تک‌تصویری (SOTA)
💄


🔹 مدل Pixel-Perfect Depth یک سیستم پیشرفته برای تخمین عمق از تصاویر تک‌چشمی (mono-depth estimation) است که از Pixel-Space Diffusion Transformers استفاده می‌کند و اکنون رکورد جدیدی در دقت (SOTA) ثبت کرده است.


🚀 ویژگی‌ها:
✳️تخمین عمق با دقت پیکسلی و جزئیات خیره‌کننده 🖼️
✳️طراحی بر پایه ترنسفورمرهای دیفیوزنی در فضای تصویر (نه ویژگی‌ها)
✳️پشتیبانی از ساختارهای پیچیده و بافت‌های ظریف
✳️عملکرد عالی در سناریوهای واقعیت افزوده، نقشه‌برداری و بینایی رباتیک


📜 لایسنس آزاد: Apache 2.0

🔗 مقاله: lnkd.in/d8wxFpyY
🔗 پروژه: lnkd.in/dV5HhsqH
🔗 کد: lnkd.in/d9JKFBJq
🔗 دموی آنلاین: lnkd.in/d3wBkKJ9

@rss_ai_ir
#AI #ComputerVision #DepthEstimation #DiffusionModels #SOTA #هوش_مصنوعی
👍1
This media is not supported in your browser
VIEW IN TELEGRAM
🎭 GAGA.ART
چینی‌ها هم وارد میدان آواتارهای هوشمند شدند! 🇨🇳

پلتفرم GAGA.ART که خیلی‌ها آن را «نسخه‌ی چینی Hedra» می‌دانند، امکان ساخت آواتار سخنگو از روی یک عکس را فراهم کرده است — فقط کافی‌ست تصویر و متن یا صدای ورودی بدهید تا چهره شروع به صحبت کند. 🗣️

🎬 امکانات اصلی:

✳️ساخت ویدیو از عکس با ورودی متن یا صوت 🎤
✳️نسخه‌ی Gaga Actor برای لب‌خوانی از متن
✳️نسخه‌ی Gaga Avatar برای هماهنگی با صدای واقعی کاربر
✳️الگوریتم "Emotion-aware lipsync" (به‌گفته‌ی سازندگان، هماهنگ با احساسات و میکرو‌حرکات چهره!)


💰 مزایا و معایب واقعی:
۲۰۰ اعتبار رایگان برای شروع
ساخت تصویر و آواتار رایگان در برخی حالت‌ها
ویدیوها فقط ۱۰ ثانیه‌اند (در مقایسه با Hedra که تا چند دقیقه می‌سازد)
گاهی جزئیات چهره مثل دندان یا دهان غیرطبیعی به‌نظر می‌رسد
رابط کاربری هنوز خیلی ابتدایی است

🔗 آدرس: https://gaga.art/
📌 ورود با حساب Google ممکن است

در کل تجربه‌ی جالبی است، مخصوصاً اگر دنبال جایگزین رایگان برای Hedra یا Pika باشید — ولی هنوز راه زیادی تا کیفیت حرفه‌ای دارد.

@rss_ai_ir
#AvatarAI #LipSync #AI #هوش_مصنوعی #آواتار #GAGAART
2
This media is not supported in your browser
VIEW IN TELEGRAM
💡 مدل RND1 — انقلاب در تولید متن با رویکرد دیفیوژنی!

🧠 مدل RND1 یک مدل زبانی آزمایشی با ۳۰ میلیارد پارامتر است که بر پایه‌ی معماری Sparse Mixture-of-Experts (MoE) ساخته شده؛ اما فقط ۳ میلیارد پارامتر آن در هر لحظه فعال است.
یعنی قدرت زیاد، اما با مصرف بسیار کمتر! ⚙️

🔁 تفاوت اصلی RND1 با مدل‌های معمولی مثل GPT در این است که: مدل‌های کلاسیک (Autoregressive) متن را کلمه به کلمه تولید می‌کنند،
اما RND1 کل جمله را به‌صورت همزمان می‌سازد و سپس در چند مرحله آن را دقیق‌تر می‌کند — درست مثل مدل‌های دیفیوژنی که تصویر را از «نویز» بیرون می‌کشند. 🎨


---

🚀 چطور ساخته شد؟

تیم Radical Numerics موفق شد یک مدل زبانی موجود (Qwen3-30B-A3B) را به مدل دیفیوژنی تبدیل کند — بدون نیاز به آموزش از صفر!

این فرآیند را AR-to-Diffusion Conversion (A2D) می‌نامند:
۱️⃣ انتخاب یک مدل قوی شبیه GPT
۲️⃣ تغییر مکانیزم توجه (attention) تا مدل کل متن را همزمان ببیند
۳️⃣ آموزش روی داده‌های جدید با روش دیفیوژنی
۴️⃣ استفاده از نرخ یادگیری متفاوت برای بخش‌های مختلف شبکه تا مدل هم «یاد قدیمی» را نگه دارد، هم «تفکر جدید» یاد بگیرد 🧩


---

⚙️ ویژگی‌های کلیدی

🔸 اول MoE فعال: تنها ۳ میلیارد پارامتر در هر بار فعال می‌شوند → سرعت بالا و بهره‌وری انرژی عالی.
🔸 یادگیری پیوسته: دانش قبلی پاک نمی‌شود، بلکه در منطق جدید ادغام می‌شود.

🔸 همچنین Batchهای عظیم: آموزش پایدار حتی هنگام مشاهده‌ی هم‌زمان کل توکن‌ها.


---

چرا اهمیت دارد؟

تولید موازی متن — بدون تأخیر گام‌به‌گام
مصرف کمتر منابع با حفظ کیفیت GPTهای بزرگ
معماری هیبریدی بین AR و DLM
کاملاً متن‌باز (کد، گزارش و وزن‌ها در دسترس‌اند)
گامی مهم به‌سوی هوش خودبهبودیاب (RSI)؛ مدلی که می‌تواند خودش را طراحی و بهبود دهد 🤖


---

📎 منابع:
🔸 وبلاگ:
radicalnumerics.ai/blog/rnd1
🔸 کد:
github.com/RadicalNumerics/RND1
🔸 گزارش فنی:
rnd1_report.pdf
🔸 وزن‌ها:
huggingface.co/radicalnumerics/RND1-Base-0910


---

📡 @rss_ai_ir
#RND1 #RadicalNumerics #AI #DLM #DiffusionModel #MoE #OpenSource
👍1