VIRSUN

🤖 رباتWalker S2 : اولین ربات انسان‌نمای جهان با تعویض خودکار باتری!

📣 شرکت UBTECH Robotics از نسل جدید ربات انسان‌نمای خود با نام Walker S2 رونمایی کرد؛ مدلی انقلابی با قابلیت‌های منحصربه‌فرد برای تعامل، قدرت، و استقلال عملیاتی.

---

🦿 مشخصات فنی کلیدی Walker S2
▪️ قد: ۱۷۶ سانتی‌متر
▪️ وزن: ۷۳ کیلوگرم
▪️ سرعت حرکت: ۲ متر در ثانیه
▪️ ۵۲ درجه آزادی در مفاصل
▪️ زاویه چرخش بالاتنه: ۱۶۲ درجه
▪️ دسترسی افقی: ۱.۸ متر
▪️ توانایی حمل بار: تا ۱۵ کیلوگرم

---

🖐 دست رباتیک نسل چهارم (Gen-4)
این ربات به دو دست پیشرفته با ۱۱ درجه آزادی در هر دست مجهز است، همراه با ۶ سنسور لمسی.
🔹 توان گرفتن با یک انگشت: ۱ کیلوگرم
🔹 گرفتن کامل با دست: تا ۷.۵ کیلوگرم

---

🎧 تعامل صوتی و ادراکی پیشرفته
▪️ مجهز به ۴ میکروفون و ۲ بلندگو
▪️ پشتیبانی از مدل‌های زبانی (LLM) برای درک دستورات پیچیده
▪️ نمایشگر چهره ۴ اینچی گرد با قابلیت تعامل اجتماعی

---

🔋 سیستم هوشمند تعویض باتری
دارای دو باتری مجزا با قابلیت تعویض کاملاً خودکار است — تنها در ۳ دقیقه!
این ویژگی به ربات اجازه می‌دهد بدون توقف وظایف بحرانی، باتری خود را شارژ یا جایگزین کند.

---

👀 بینایی استریو RGB (مثل چشم انسان!)
سیستم دوچشمی RGB داخلی در سر ربات، امکان درک عمق و محیط را با دقتی مشابه بینایی انسان فراهم می‌سازد.

---

🧠 سیستم دوگانه هوش مصنوعی (BrainNet 2.0 + Co-Agents)
این معماری پیشرفته، به Walker S2 توانایی عملکرد کاملاً مستقل و نیز همکاری هماهنگ با سایر ربات‌ها را می‌دهد — گامی مهم به سوی ناوگان رباتیک!

---

🧩 موارد استفاده پیشنهادی:
خانه هوشمند | ربات خدماتی | صنعت | مراقبت از سالمندان | محیط‌های تحقیقاتی

---

#هوش_مصنوعی #ربات_انسان‌نما #رباتیک
@rss_ai_ir

❤1👍1🔥1

130 views14:15

💻 یادگیری فدرال (Federated Learning) چیست و چرا آینده‌ساز است؟

آیا تا به حال فکر کرده‌اید چگونه یک مدل هوش مصنوعی می‌تواند بدون دیدن مستقیم داده‌های شما آموزش ببیند؟
🔐 این دقیقاً همان کاری است که یادگیری فدرال انجام می‌دهد!

---

🔍 یادگیری فدرال چگونه کار می‌کند؟

1️⃣ حریم خصوصی محور: برخلاف روش‌های کلاسیک که همه داده‌ها به سرور مرکزی منتقل می‌شوند، در یادگیری فدرال داده‌ها روی دستگاه شما باقی می‌مانند.
✅ یعنی اطلاعات پزشکی، مکالمات، تصاویر یا داده‌های حساس هرگز از گوشی، لپ‌تاپ یا سیستم درمانی خارج نمی‌شوند.

2️⃣ یادگیری توزیع‌شده: هر دستگاه، نسخه‌ای از مدل AI را به‌صورت محلی آموزش می‌دهد.
📤 فقط به‌روزرسانی مدل (نه خود داده) به سرور مرکزی ارسال می‌شود.

3️⃣ ترکیب هوشمند نتایج: سرور مرکزی این به‌روزرسانی‌ها را از هزاران دستگاه جمع‌آوری و ترکیب می‌کند تا یک مدل قوی‌تر و عمومی‌تر بسازد.
📥 سپس نسخه بهبودیافته برای همه کاربران ارسال می‌شود.

---

🧠 کاربردهای کلیدی یادگیری فدرال
🔹 سلامت دیجیتال: آموزش مدل‌ها بر داده‌های بیماران بدون افشای اطلاعات شخصی
🔹 کیبورد گوشی: پیشنهاد هوشمند کلمات بدون ارسال پیام‌های شما
🔹 سیستم‌های مالی: تشخیص تقلب با حفظ امنیت مشتری‌ها

---

✨ یادگیری فدرال = هوش مصنوعی + حریم خصوصی + عملکرد توزیع‌شده
🔗 اگر به AI در پزشکی و امنیت داده علاقه دارید، ما را در آکادمی Med-AI دنبال کنید!

🎓 @rss_ai_ir | #FederatedLearning #PrivacyAI #MedicalAI

👍1🔥1👏1

114 views14:41

VIRSUN

🎯 هوش مصنوعی چندعاملی (Multi-Agent AI): وقتی ربات‌ها با هم کار می‌کنند!

آیا تا به حال فکر کرده‌اید اگر چند مدل هوش مصنوعی با هم گفت‌وگو و همکاری کنند، چه توانایی‌هایی پیدا می‌کنند؟ این همان دنیای جذاب سیستم‌های چندعاملی (Multi-Agent Systems) است!

---

🤖 هوش چندعاملی چیست؟
در این رویکرد، به‌جای یک مدل AI که به تنهایی تصمیم‌ می‌گیرد، چندین "عامل هوشمند" وجود دارد که هرکدام توانایی، هدف یا تخصص خاصی دارند و با همکاری یا رقابت، یک مسئله را حل می‌کنند.

---

🧠 مثال‌ها و کاربردها:

🔸 ربات‌های امدادگر: چند ربات در یک محیط فاجعه، هرکدام با نقش متفاوت (کشف مسیر، تشخیص انسان، حمل تجهیزات)، با هم هماهنگ می‌شوند.
🔸 مدل‌های زبانی هوشمند: یک مدل نقش استاد را بازی می‌کند، یکی شاگرد، و دیگری منتقد — با همکاری، یک مقاله علمی را بازنویسی می‌کنند!
🔸 بازی‌های استراتژیک: AIهایی که مذاکره می‌کنند، نقشه می‌کشند و حتی به‌طور مستقل تصمیم می‌گیرند که با چه کسی متحد شوند.

---

🚀 چرا آینده‌دار است؟
✅ مقیاس‌پذیر
✅ یادگیری اجتماعی
✅ قابلیت شبیه‌سازی جامعه‌های انسانی
✅ پایه‌گذار هوش عمومی (AGI)

---

📎 جالب اینجاست که پروژه‌هایی مثل AutoGPT، ChatDev و OpenAgents از همین ایده استفاده می‌کنند — چندین Agent که مثل یک تیم واقعی، پروژه را جلو می‌برند.

@rss_ai_ir | #AIAgents #AutoGPT #هوش_تعاملی

👍1🔥1

115 viewsedited 16:17

VIRSUN

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

🚨 مهارتی که هر مهندس یادگیری ماشین باید بلد باشه!

👨🏻‍💻 طراحی سیستم یادگیری ماشین اون مهارتیه که پایه و اساس هر پروژه موفقه — فرقی نمی‌کنه از چه مدلی استفاده می‌کنی!

📌 چرا اینقدر مهمه؟ چون برخلاف دنیای مدل‌ها که مدام در حال تغییره، اصول طراحی سیستم ML طی ۵ سال گذشته ثابت مونده و احتمالاً تا سال‌ها همین می‌مونه.

---

🧩 توی هر پروژه‌ی جدی ML، با ۳ نوع پایپ‌لاین اصلی سروکار داری:

1️⃣ Feature Pipeline
🔹 داده خام رو می‌گیری و تبدیلش می‌کنی به فیچرهای قابل استفاده (وکتور، امبدینگ و …)
🔹 خروجی می‌ره توی Feature Store یا Vector DB برای استفاده بعدی

---

2️⃣ Training / Fine-tuning Pipeline
🔹 فیچرهای تاریخی از Feature Store خونده می‌شن
🔹 مدل جدید ساخته یا مدل پایه فاین‌تیون می‌شه
🔹 نتیجه ثبت می‌شه در Model Registry

---

3️⃣ Inference Pipeline
🔹 مدل از رجیستری لود می‌شه
🔹 ورودی‌ها از سمت کلاینت (عدد، متن، تصویر و …) گرفته می‌شن
🔹 مدل پیش‌بینی یا تولید پاسخ می‌کنه و جواب برمی‌گردونه

✅ اینجاست که مشخص می‌شه مدل شما فقط خوب بوده یا واقعاً به درد دنیای واقعی می‌خوره!

---

💡 وقتی این سه بخش به‌درستی و در کنار CI/CD حرفه‌ای پیاده‌سازی بشن، تازه می‌تونی با افتخار بگی:
«من فقط مدل‌ساز نیستم — من مهندس ML هستم!»

📲 دنبال کن:
💡 @rss_ai_ir

❤2👍1🙏1

135 views16:21

🤖 تحول هوش مصنوعی با عامل‌های چندمرحله‌ای (Multi-Step Agents)
📺 بررسی عمیق در ویدیوی جدید یوتیوب
@rss_ai_ir | #AI #AGI #Agents

هوش مصنوعی دیگر فقط پاسخ‌گو نیست؛ حالا برنامه‌ریزی می‌کند، وظایف را می‌شکند، تصمیم می‌گیرد و یاد می‌گیرد!

در ویدیوی جدید، به بررسی یکی از مهم‌ترین پیشرفت‌های اخیر AI پرداخته می‌شود:
🧠 عامل‌های چندمرحله‌ای (Multi-Step Agents) — سیستم‌هایی که می‌توانند مسائل پیچیده را به گام‌های کوچک‌تر تقسیم کرده، اجرا کنند و نتایج را تحلیل و بهینه کنند.

🎯 نکات کلیدی ویدیو:

🔹 تفاوت Agent با مدل‌های ساده زبانی مثل GPT
🔹 توانایی تفکر چندمرحله‌ای و تعامل با محیط
🔹 چالش‌ها: پیاده‌سازی، ارزیابی، حافظه، و ابزارهای جانبی
🔹 ارتباط با آینده AGI (هوش عمومی مصنوعی)

📌 این ویدیو برای کسانی که می‌خواهند آینده شغلی، تحقیقاتی یا توسعه خود را با عامل‌های هوشمند گره بزنند، حیاتی است.

📽 تماشا کن:
🔗 YouTube - Multi-step AI Agents
🔗 لینک کتاب داخل فیلم

📡 دنبال کنید برای تحلیل تخصصی و منابع بیشتر:
@rss_ai_ir | #هوش_مصنوعی #LLM #Agent

🔥2👍1🙏1

143 views16:47

VIRSUN

🚀 مدل Grok 4 از xAI در صدر جدول مدل‌های زبانی!

📢 مدل Grok 4 که توسط تیم xAI به رهبری ایلان ماسک توسعه یافته، حالا رتبه ۱ را در جدول LLM Leaderboard به دست آورده!
🔝 این مدل موفق شده بیش از ۱۰۰ مدل دیگر از جمله مدل‌های قدرتمند OpenAI، گوگل، DeepSeek و سایر شرکت‌ها را پشت سر بگذارد.

✨ ایلان ماسک قبلاً گفته بود که Grok "باهوش‌ترین مدل زبانی دنیاست" — و حالا به‌نظر می‌رسد حق با او بوده!

📊 این رتبه‌بندی بر اساس معیارهای دقیق حل مسئله، درک متون، و توانایی در پاسخ‌گویی به سؤالات چندمرحله‌ای انجام شده است.

🌐 رقابت در دنیای LLMها داغ‌تر از همیشه است…

📎 @rss_ai_ir
📍 #LLM #Leaderboard |

❤2👍2🙏1

138 viewsedited 04:14

VIRSUN

🤖 ربات "Белка" از Droneshub: آینده‌ی حمل‌ونقل داخل ساختمان‌ها

🆕 شرکت Droneshub از ربات جدید خود به نام "Белка" رونمایی کرد — یک پلتفرم رباتیکی هوشمند برای جابجایی بارهای تا ۳۰ کیلوگرم در فضای داخلی ساختمان‌ها!

🔍 ویژگی‌های کلیدی: ▪️ ناوبری دقیق با لیدار و بینایی ماشین برای شناسایی محیط و جلوگیری از برخورد با موانع
▪️ ادغام با زیرساخت ساختمان برای فراخوانی آسانسور و انتخاب طبقه مورد نظر
▪️ کاربردهای متنوع: مناسب برای تحویل بسته به درب واحد در مجتمع‌های مسکونی، همچنین در هتل‌ها، رستوران‌ها و حتی برای وظایف نظافتی

💰 قیمت: بین ۱ تا ۲ میلیون روبل، بسته به نوع پیکربندی

🚀 این ربات نمونه‌ای از همگرایی فناوری‌های نوین مانند هوش مصنوعی، رباتیک و اینترنت اشیاء در حوزه لجستیک هوشمند است.

📌 @rss_ai_ir | #رباتیک #AI #روبات_خدماتی

👍1🔥1🙏1

160 views04:20

VIRSUN

🚀 نقشه راه جامع برای آینده هوش مصنوعی 🧠✨

اگر می‌خواهی در مسیر حرفه‌ای هوش مصنوعی بدرخشی، این موضوعات کلیدی را حتماً یاد بگیر:

1️⃣ ریاضیات پایه: جبر خطی، احتمال، آمار و بهینه‌سازی—پایه‌ و اساس همه الگوریتم‌ها

2️⃣ برنامه‌نویسی: ترجیحاً Python و آشنایی با کتابخانه‌هایی مثل NumPy، Pandas، Matplotlib

3️⃣ یادگیری ماشین: مفاهیم پایه مثل Classification، Regression، و الگوریتم‌هایی نظیر SVM، Random Forest و KNN

4️⃣ شبکه‌های عصبی و یادگیری عمیق:کار با فریم‌ورک‌هایی مثل TensorFlow و PyTorch، شناسایی ساختارهای CNN، RNN، Transformer

5️⃣ مدیریت داده‌ها و Data Engineering: جمع‌آوری، پاک‌سازی و مدیریت داده‌های بزرگ

6️⃣ یادگیری تقویتی و مولد (GANs): مسیر آینده، مخصوصاً برای رباتیک و مدل‌های مولد مانند ChatGPT

7️⃣ اخلاق و مدیریت ریسک:آشنایی با مفاهیمی مثل Bias، عدالت الگوریتمی و امنیت داده

8️⃣ موضوعات به‌روز: LLMها، یادگیری چندوظیفه‌ای (Multi-task learning)، مدل‌های Efficient، و کاربرد عملی (Deployment)

9️⃣ تجربه پروژه واقعی:انجام پروژه‌های کوچک و بزرگ، کار با دیتاست‌های دنیای واقعی و شرکت در رقابت‌ها، مثل Kaggle

🔟 مطالعه مداوم: دنبال کردن مقالات جدید، وبینارها و اخبار پژوهشی (arXiv, Papers With Code)

🌟 آینده هوش مصنوعی با ترکیبی از دانش عمیق، تجربه عملی و اشتیاق پیوسته روشن می‌شود. همین امروز شروع کن!

#هوش_مصنوعی #AI #نقشه_راه #یادگیری

@rss_ai_ir

🔥1🙏1👌1

127 views04:27

VIRSUN

1:21

This media is not supported in your browser

VIEW IN TELEGRAM

🧠🚀 سرویس جدید GitHub Spark؛ انقلابی در ساخت اپلیکیشن‌های هوشمند

✳️گیت‌هاب به‌تازگی از ابزاری نوآورانه به نام Spark رونمایی کرده است که امکان تولید و انتشار یک اپلیکیشن کامل فول‌استک را تنها با نوشتن یک پرامپت ساده به زبان طبیعی فراهم می‌کند.

✳️این سرویس با بهره‌گیری از مدل قدرتمند Claude Sonnet 4 به‌صورت خودکار مراحل توسعه مانند طراحی فرانت‌اند، پیاده‌سازی بک‌اند، احراز هویت، ساخت دیتابیس و حتی استقرار پروژه را انجام می‌دهد.

✳️کاربران می‌توانند بدون نیاز به تنظیم کلیدهای API، از مدل‌های هوش مصنوعی مختلف مانند OpenAI، Meta، DeepSeek، xAI و دیگران استفاده کنند.

✳️همچنین امکان ویرایش پروژه با پرامپت، رابط گرافیکی و حتی کدنویسی به کمک GitHub Copilot در اختیار شما قرار دارد. قابلیت‌هایی مانند GitHub Actions، ساخت ریپازیتوری، و همکاری با Copilot Agents نیز به شما کمک می‌کنند تا فرآیند توسعه را سریع‌تر و حرفه‌ای‌تر انجام دهید.

✳️در حال حاضر این سرویس به‌صورت پیش‌نمایش عمومی برای کاربران نسخه Copilot Pro+ فعال شده است.

📌 @rss_ai_ir | #هوش_مصنوعی #گیت‌هاب #Spark #اپلیکیشن_هوشمند #Claude #Copilot #AI4Dev

👍2🔥1👏1

259 viewsedited 04:33

VIRSUN

DiffuCoder_Understanding_And_Improving_Masked_Diffusion_Models_For.pdf

2.8 MB

🧠 انقلابی جدید در تولید کد با هوش مصنوعی: DiffuCoder

🔬 پژوهشگران اخیراً از مدل نوآورانه‌ای به نام DiffuCoder پرده‌برداری کرده‌اند؛ یک مدل زبانی بزرگ با ۷ میلیارد پارامتر از نوع Diffusion (dLLM) که به‌صورت اختصاصی برای تولید کد طراحی شده است.

🚀 برخلاف مدل‌های خودرگرسیو (مثل GPT) که توکن‌ها را از چپ به راست می‌نویسند، در DiffuCoder کدها به صورت غیربازگشتی و با بازنویسی‌های چندمرحله‌ای تولید می‌شوند؛ شبیه نقاشی‌ای که در هر مرحله دقیق‌تر می‌شود!

📌 نکات کلیدی مقاله:
1️⃣ درک رفتار dLLM در تولید کد: ترتیب تولید در این مدل‌ها کاملاً پویا و قابل تغییر است؛ یعنی مدل می‌تواند ابتدا وسط کد را بنویسد، سپس ابتدا و انتها را اصلاح کند!
2️⃣ الگوریتم Coupled-GRPO: پژوهشگران یک روش جدید مبتنی بر یادگیری تقویتی طراحی کرده‌اند که به‌طور خاص با ماهیت مدل‌های diffusion سازگار است و باعث افزایش چشمگیر عملکرد آن‌ها شده است.

📈 یافته مهم: افزایش sampling temperature در این مدل، نه تنها تنوع خروجی را بیشتر می‌کند، بلکه مسیر تولید کد را هم کاملاً متنوع و هوشمند می‌سازد. این قابلیت فضای جست‌وجوی بسیار وسیعی برای یافتن راه‌حل‌های بهینه ایجاد می‌کند.

🏆 در بنچمارک معتبر EvalPlus، استفاده از الگوریتم Coupled-GRPO باعث ۴.۴٪ بهبود عملکرد نسبت به حالت پایه شده است.

🌐 اگر به آینده‌ی تولید کد با AI علاقه‌مند هستید، DiffuCoder یکی از پیشرفته‌ترین مسیرها در مدل‌سازی غیرخطی و بازنویسی‌محور کد به شمار می‌رود.

🆔 @rss_ai_ir | #AI #DiffuCoder #CodeGeneration #LLM #هوش_مصنوعی

❤2👍2🙏1

145 viewsedited 05:27

🔍 نگاهی تخصصی به پشت صحنه پیشرفته‌ترین ربات‌ها در جهان

⛔️این ویدیو سفر جذابی است به داخل یکی از پیشرفته‌ترین آزمایشگاه‌های رباتیک دنیا، همراه با معرفی فناوری‌هایی که آینده ربات‌ها را شکل می‌دهند.

🌐 موضوعات برجسته ویدیو:

✅ نمایش ربات‌های چهارپا مانند «Unitree» با تحرک بالا و طراحی مهندسی دقیق
✅ بررسی عملکرد در محیط‌های چالشی و توانایی حرکت در سطوح ناهموار و حرکت سریع
✅ تجهیزاتی مثل لیدار، بینایی ماشین، و حسگرهای پیشرفته که به اجزای ادراکی ربات اجازه می‌دهند محیط اطراف خود را با دقت درک کنند

---

💡 چرا این ویدیو مهم است؟

این ویدیو به‌خوبی نمایش می‌دهد که ترکیب تکنولوژی‌های رباتیک مانند:

✅ طراحی مکانیکی دقیق برای تحرک
✅ الگوریتم‌های پیشرفته کنترل و تعادل
✅ ادراک سینتتیک با حسگرهای پیشرفته
چه‌قدر باعث پیشرفت واقعی در رباتیک کاربردی می‌شود.

---

🎯 کاربردهای ذکرشده یا در نظر گرفته‌شده:

✅ اجرای وظایف خدماتی یا لجستیکی در محیط‌های داخلی
✅ کاربرد در دفاتر صنعتی، مراکز تحقیقاتی یا خودران‌ها
✅ استفاده در موقعیت‌هایی که مکان‌های سخت‌گذر یا ناهموار باید پوشش داده شوند

❌♨️زیرنویس فارسی

@rss_ai_ir
#روباتیک #AI #ربات_چهارپا #Unitree #بینایی_ماشین #پیشرفت_فناوری

❤1👍1🙏1

273 viewsedited 06:09

VIRSUN

🤖 بردهای هوشمند مورد استفاده در ربات‌های انسان‌نما

♨️ربات‌های انسان‌نما (Humanoid Robots) برای عملکرد پیشرفته خود به بردهای الکترونیکی هوشمند و قدرتمند نیاز دارند تا پردازش تصویر، کنترل حرکت، درک صوتی و تصمیم‌گیری بلادرنگ را انجام دهند. در ادامه با برخی از مهم‌ترین بردهای مورد استفاده در این ربات‌ها آشنا می‌شویم:

🔹 NVIDIA Jetson Series
مناسب برای بینایی ماشین، یادگیری عمیق و پردازش آنی تصویر و ویدیو. مدل‌هایی مانند Jetson Xavier و Jetson Orin به‌دلیل داشتن GPU داخلی برای شبکه‌های عصبی ایده‌آل هستند.

🔹 Raspberry Pi 4/5
بردی ارزان، سبک و پرکاربرد برای کنترل وظایف ساده‌تر، رابط کاربری، یا حتی برخی پردازش‌های هوش مصنوعی با کمک شتاب‌دهنده‌هایی مثل Google Coral.

🔹 STM32 و Teensy
برای کنترل دقیق سروو موتورها و سنسورها به‌کار می‌روند. این میکروکنترلرها از دقت بالا و تأخیر کم برخوردارند و برای کنترل رباتیک حیاتی‌اند.

🔹 Intel NUC / Mini-PCs
در ربات‌هایی که به توان پردازشی بالا نیاز دارند، از این کامپیوترهای کوچک با سیستم‌عامل‌های کامل مانند Ubuntu برای اجرای مدل‌های هوش مصنوعی و پایپ‌لاین‌های پیچیده استفاده می‌شود.

🔹 Arduino Boards
برای کنترل اجزای پایه مانند سنسورها، موتورها، و ارتباط با سایر ماژول‌ها مناسب هستند. ترکیب آردوینو با بردهای پیشرفته‌تر رایج است.

🧠 بسیاری از ربات‌های انسان‌نما همچنین از ترکیب چند برد مختلف استفاده می‌کنند؛ مثلاً یک Jetson برای بینایی، یک STM32 برای کنترل موتورها، و یک برد دیگر برای پردازش صوت.

📌 هوش مصنوعی، یادگیری عمیق و پردازش ریل‌تایم، نیاز به سخت‌افزارهای انعطاف‌پذیر و قدرتمند دارند. انتخاب صحیح برد، بسته به نوع کاربرد (راه‌رفتن، حرف‌زدن، بینایی، تعامل…) نقش مهمی در عملکرد نهایی ربات ایفا می‌کند.

#روباتیک #ربات_انسان_نما #هوش_مصنوعی #Jetson #RaspberryPi #Arduino
🆔 @rss_ai_ir

👍2🔥1🙏1

144 viewsedited 06:09

VIRSUN

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

🎾 پرامپت حرفه‌ای برای ساخت تیزر تبلیغاتی با Veo 3 (ویدیو مولد هوش مصنوعی)

✳️در این سناریو، یک توپ تنیس ماکرو به آرامی باز می‌شود و دنیایی سوررئال درون آن آشکار می‌شود؛ شامل یک زمین خاکی خمیده با بازیکن زن که آماده زدن ضربه است. این صحنه همراه با حرکت دوربین، نورپردازی نرم و افکت صوتی واقعی، به‌صورت حلقه‌ای به حالت اولیه برمی‌گردد. برای ساخت چنین ویدیویی در Veo از پرامپت زیر استفاده کنید:

{
  "description": "A hyper-real macro tennis ball sits against a black background. It slowly cracks open like a shell to reveal a surreal spherical interior: a miniature curved clay court embedded within the felt-lined shell. A female tennis player stands centered in the middle third.",
  "style": "editorial realism",
  "camera": "macro static → pivot and dolly-in → lateral tracking to follow spinning ball",
  "lighting": "soft top-down editorial lighting with curved, tactile shadows",
  "scene": "interior of a spherical tennis ball with a warped clay court and surreal sportscape",
  "elements": [
    "matte neon-green tennis ball",
    "white seam detail",
    "shell-style lid opening upward",
    "miniature curved clay court",
    "floating net",
    "curved fencing and ambient lights",
    "female tennis player centered in middle third",
    "green felt-lined interior shell",
    "spinning tennis ball flying into right third",
    "macro ball exterior reforming at end"
  ],
  "motion": "ball cracks open → camera glides in → player strikes ball with grunt → ball spins toward lens → rotates into original macro position",
  "ending": "loop resolves with ball closing seamlessly into its original macro form, same angle and lighting",
  "audio": "no text, only ambient sound and sharp player grunt on impact"
}

#پرامپت_نویسی #هوش_مصنوعی #Veo3 #AiVideoPrompt
🆔 @rss_ai_ir

🔥3👍2😱1

168 viewsedited 06:34

VIRSUN

🧠 خلاصه‌سازی و جستجوی ویدیویی با ایجنت‌های چندمدلی از NVIDIA!

کمپانی NVIDIA یک ریپازیتوری فوق‌العاده منتشر کرده که به شما امکان می‌ده یک ایجنت هوشمند بسازید که:

🔍 ویدیو را فریم‌به‌فریم پردازش می‌کند
📝 خلاصه‌سازی انجام می‌دهد
📌 قابلیت جستجوی درون ویدیو دارد
💬 به سوالات مربوط به محتوای تصویری پاسخ می‌دهد

✅ این پروژه یک Blueprint کامل برای ساخت ایجنت‌های چندمدلی است که می‌تواند برای حوزه‌های دیگر نیز به‌کار رود.

📌 از مدل‌ها و سرویس‌های زیر استفاده شده:

✳️مدل‌های متنی Nemotron و NeMo Retriever
✳️مدل‌های دیداری-زبانی (VLM)
✳️معماری‌های RAG برداری (Vector RAG) و گرافی (Graph-RAG)

📦 با وجود اینکه از NVIDIA NIM استفاده شده، به راحتی می‌تونید با مدل‌ها و APIهای دیگر جایگزین کنید!

🔗 پروژه را اینجا ببینید و تست کنید: https://github.com/NVIDIA-AI-Blueprints/video-search-and-summarization

#هوش‌_مصنوعی #AI_Agent #RAG #Nvidia
🆔 @rss_ai_ir

🔥2👍1👏1

187 viewsedited 06:49

VIRSUN

📢 بزرگ‌ترین آپدیت ChatGPT در راه است!

🔹 به گزارش منابع معتبر (Reuters، Axios، Mashable)، OpenAI مدل انقلابی GPT-5 را به‌زودی و در مرداد یا شهریور معرفی می‌کند!

🌟 این نسخه جدید قراره:
- ترکیبی از مدل‌های پیشرفته GPT و سری o باشه (مثل GPT-4o)
- یکپارچگی و سادگی بیشتر رو بیاره و دیگه نیازی به انتخاب مدل نخواهیم داشت
- هوش مصنوعی رو همه‌کاره‌تر و قدرتمندتر از همیشه کنه

🗣 سم آلتمن تأکید کرده که نسخه اول GPT-5 به تدریج کامل‌تر می‌شود و در ماه‌های آینده پخته‌تر خواهد شد، اما از همون ابتدا جهش بزرگی به حساب میاد!

🔥 منتظر تجربه‌ی نسل جدید هوش مصنوعی باشید...
@rss_ai_ir

https://t.iss.one/rss_ai_ir

🔥2👏1👌1

316 viewsedited 07:01

VIRSUN

📱 گوگل از ابزار جدیدی به نام Opal رونمایی کرده که ساخت اپلیکیشن‌های هوش مصنوعی را بدون نیاز به حتی یک خط کدنویسی ممکن می‌سازد.

🔧 با این ابزار می‌توان مدل‌های مختلف هوش مصنوعی و دستورات را به‌صورت گرافیکی به هم متصل کرد و ورک‌فلوهای پیچیده و هوشمند ایجاد نمود — بدون نیاز به تخصص برنامه‌نویسی.

📌 این سرویس فعلاً به‌صورت نسخه بتا و فقط برای کاربران ایالات متحده فعال است، اما پیش‌بینی می‌شود به‌زودی در سطح جهانی منتشر شود.

🔗 برای مشاهده اطلاعات بیشتر و ثبت‌نام: developers.googleblog.com/en/introducing-opal

#هوش_مصنوعی #بدون_کدنویسی #اپلیکیشن_هوشمند

🆔 @rss_ai_ir

❤2🔥2👏1

208 views13:18

VIRSUN

📡 شناسایی افراد با امواج WiFi و ترنسفورمر – بدون دوربین، بدون تماس

⛔️پژوهشگران دانشگاه La Sapienza رم، سیستمی به نام WhoFi طراحی کرده‌اند که با استفاده از داده‌های CSI (Channel State Information) و مدل‌های ترنسفورمری، قادر به شناسایی افراد با دقت ۹۵.۵٪ است — حتی از پشت دیوار و بدون نیاز به هیچ تجهیز فیزیکی روی بدن فرد.

---

🔍 مبنای فنی سیستم:

1️⃣ CSI یا Channel State Information
در سیستم‌های وای‌فای مدرن (مثل 802.11n/ac/ax)، اطلاعاتی با دقت بالا از وضعیت کانال در هر آنتن و زیرحامل ثبت می‌شود. هر حرکت انسانی، به‌دلیل بازتاب و تداخل موج، الگوی منحصربه‌فردی در CSI ایجاد می‌کند.

2️⃣ ویژگی بیومتریک بدن
حرکات انسان (مثل راه رفتن، ایستادن، ژست خاص) باعث اختلال مشخصی در الگوهای فاز و دامنه CSI می‌شود که نوعی "اثر انگشت فرکانسی" محسوب می‌شود.

3️⃣ معماری مدل ترنسفورمر
با الهام از موفقیت مدل‌های زبانی، پژوهشگران از معماری ترنسفورمر (با attention mechanism) برای مدل‌سازی توالی زمانی CSI استفاده کرده‌اند.
این مدل قادر است از توزیع فضایی-زمانی سیگنال، هویت افراد را از یکدیگر تفکیک کند.

---

🎯 کاربردهای کلیدی:

♻️امنیت بدون تماس: شناسایی افراد بدون نیاز به دوربین یا حسگر تصویری
♻️سلامت و پایش از راه دور: مانیتورینگ سالمندان و بیماران بدون پوشیدن وسیله خاص
♻️خانه‌های هوشمند: تعامل انسانی بدون نیاز به فرمان صوتی یا لمس
♻️پایش در زندان یا مراکز حساس بدون ایجاد حریم‌شکنی فیزیکی

---

⚠️ چالش‌های اصلی:

♻️مسائل جدی حریم خصوصی: امکان شناسایی حتی از پشت دیوار، بدون اطلاع فرد
♻️پایداری در محیط‌های واقعی: تغییر در ساختار فضا یا حضور چند نفر می‌تواند اثرگذار باشد
♻️نیاز به داده‌های بزرگ و واقعی برای آموزش و fine-tuning

---

🧠 آیا این آغاز نسل جدیدی از سیستم‌های بیومتریک غیرفعال است؟
آیا آینده‌ی شناسایی به سمت “AI + سیگنال” و نه “AI + تصویر” می‌رود؟
نظر شما چیست؟
---

📚 واژه‌های کلیدی برای جستجو: Device-Free Passive Sensing, WiFi CSI, Gait Recognition via WiFi, Transformer for CSI

#هوش_مصنوعی #CSI #WiFiSensing #ترنسفورمر #سیگنال_و_هوش_مصنوعی #WhoFi
🆔 @rss_ai_ir

👍3🔥3👏1

216 viewsedited 15:15

About

Blog

Apps

Platform