VIRSUN

🌟 نانوبانانا در ساخت اسلاید عالیه، اما اگر بخواهیم از اسلایدها ویدئو بسازیم چه؟ 🎬

در اکوسیستم گوگل، این کار حالا فوق‌العاده ساده شده است. Google Vids به‌همراه Gemini می‌تواند یک ارائهٔ Google Slides را به یک ویدئوی کامل تبدیل کند — آن هم به‌طور خودکار.

در این فرآیند چه اتفاقی می‌افتد؟
✨ اسکریپت نوشته می‌شود
✨ صداگذاری انجام می‌شود
✨ موسیقی اضافه می‌شود
✨ ویدئو بر اساس سبک انتخابی شما ساخته می‌شود

کافیست فایل ارائهٔ خود را آپلود کنید، یک سبک انتخاب کنید، و بقیه را سیستم انجام می‌دهد. این یعنی تبدیل ارائه‌های خشک به محتوای ویدئویی حرفه‌ای — بدون دردسر تدوین.

🔗 منبع:
https://workspace.google.com/blog/product-announcements/october-workspace-drop-ai-storytelling-research-and-data-protections

@rss_ai_ir
#Gemini #گوگل #ویدئو #هوش_مصنوعی #LLM

👍3🙏2🔥1

329 views05:13

VIRSUN

0:29

This media is not supported in your browser

VIEW IN TELEGRAM

0:29

This media is not supported in your browser

VIEW IN TELEGRAM

در ادامه ماراتن نانابانانا پرو 🍌✨

🔍 خیلی‌ها نسخه‌ی جدید Nano Banana Pro را فقط یک ارتقای کیفی می‌بینند—درحالی‌که اصل ماجرا چیز دیگری است. کیفیت فوق‌العاده‌اش (مثل خروجی‌های 4K) فقط بخش کوچکی از داستان است.
واقعیت این است که دامنهٔ کاربردهای نانابانانا به‌طرز انفجاری گسترش یافته؛ آن هم فراتر از تولید یا ویرایش تصویر.

---

🎯 نکتهٔ مهم: کاربردهای تازه، نه فقط کیفیت تازه

چرا این نسخه نقطهٔ عطف است؟
چون دیگر فقط یک مدل تصویر نیست—نانابانانا را رسماً وارد NotebookLM کرده‌اند، و این یعنی یک دنیای جدید از کاربردها:

📌 ساخت مجموعه اسلایدها از صفر
📌 تولید اینفوگرافی و دایاگرام‌های توضیحی
📌 ایجاد گراف‌های تحلیلی
📌 ترکیب همهٔ این‌ها برای تبدیل‌شان به ویدئوهای ارائه‌ای، خودکار و هوشمند
📌 یکپارچگی کامل با اکوسیستم Workspace

نگاهی به ویدیوهای دمو کافی است تا بفهمید NotebookLM با نانابانانا تبدیل شده به یک ماشین تولید محتوای کامل از متن تا ویدئو.

---

🟡 چرا این برگ برنده دست گوگل است؟

زیرا گوگل یک اکوسیستم عظیم دارد: Docs، Slides، Sheets، Vids، Drive، NotebookLM…
هر ویژگی جدید را می‌تواند مستقیماً وارد این محصولات کند.
یعنی: یک مدل = ده‌ها کاربرد واقعی و آماده برای میلیون‌ها کاربر.

این همان نقطه‌ای است که OpenAI در آن ضعف دارد.
جز ChatGPT (یک نقطهٔ ورودی واحد)، جای خاصی برای تزریق مدل‌ها ندارد.
همچنین Atlas هم که قرار بود جایگاهی شبیه Workspace داشته باشد… «نپرید».

---

نتیجه؟

نانابانانا پرو نه‌فقط بهتر شده—بلکه همه‌جا حاضر شده.
از تولید ویدئو تا ساخت درسنامه و توضیح مفاهیم.
از اسلایدسازی تا تحلیل داده و خلاصه‌سازی تصویری.

این نسخه چیزی شبیه دایره‌المعارف مولتی‌مدیا با موتور Gemini 3 است.

---

@rss_ai_ir
#nanobanana #Gemini #گوگل #NotebookLM #تولید_محتوا #هوش_مصنوعی

👍5❤1💯1

380 views05:15

VIRSUN

سامانه تشخیص گفتار چندزبانه Omnilingual ASR 🌍🗣️
بیش از ۱۶۰۰ زبان (حتی زبان‌های کم‌منبع و محلی) را پشتیبانی می‌کند و سعی دارد شکاف زبانی در فناوری گفتار به متن را از بین ببرد.

✨ ویژگی‌ها:

✳️پشتیبانی از زبان‌های بسیار متنوع، از رایج تا کاملاً نادر

✳️امکان اضافه کردن زبان‌های جدید با داده‌ی آموزشی بسیار کم (few-shot / zero-shot)

✳️طراحی‌شده برای دسترس‌پذیری و شمول جوامع مختلف زبانی

✳️قابل تست و استفاده روی Hugging Face و در دسترس روی گیت‌هاب

لینک گیت‌هاب 🔗
https://github.com/facebookresearch/omnilingual-asr

@rss_ai_ir
#هوش_مصنوعی #تشخیص_گفتار #ASR #Multilingual #DeepLearning #SpeechToText

GitHub

GitHub - facebookresearch/omnilingual-asr: Omnilingual ASR Open-Source Multilingual SpeechRecognition for 1600+ Languages

Omnilingual ASR Open-Source Multilingual SpeechRecognition for 1600+ Languages - facebookresearch/omnilingual-asr

❤1🔥1👏1

384 views05:24

VIRSUN

0:34

This media is not supported in your browser

VIEW IN TELEGRAM

🤖 رندر بود یا ویدیو؟
این تیتر دیگر بیشتر از روی عادت نوشته می‌شود. تعداد کسانی که هنوز دنبال «رندر» هستند، تقریباً به اندازه طرفداران «طوطی آماری» شده؛ یعنی خیلی کم.

⚽️ فقط چند ماه قبل همه ویدیوهایی منتشر می‌کردند که ربات‌ها حتی نمی‌توانستند توپ فوتبال را درست بزنند؛ بیشتر شوت‌ها از توپ رد می‌شد.

⏳ اما حالا چند ماه گذشته…

✨ نتیجه واقعاً حیرت‌انگیز است.
هماهنگی حرکتی، سرعت واکنش و کنترل بدن ربات‌ها به سطحی رسیده که دیدنش آدم را متوقف می‌کند. حرکات دقیق، پایدار و نزدیک به توانایی انسان.

⚠️ و یک نکته مهم‌تر:
بهتر است هیچ‌وقت در فاصله نزدیک با این ربات‌ها درگیر نشوید؛ قدرت و سرعت آن‌ها در این مرحله دیگر شوخی‌بردار نیست.

@rss_ai_ir
#روباتیک 🤖 #فناوری #هوش_مصنوعی #ربات_انسان‌نما #اتوماسیون

🔥1

324 views14:11

VIRSUN

🤖 آینده‌ای که کار در آن «انتخابی» می‌شود

ایلان ماسک در نشست سرمایه‌گذاری آمریکا–عربستان اعلام کرد که طی ۱۰ تا ۲۰ سال آینده، با فراگیر شدن اتوماسیون و ربات‌های انسان‌نما، جهان به مرحله‌ای می‌رسد که کار کردن برای بسیاری از مردم «اختیاری» خواهد شد؛ دوره‌ای شبیه به اقتصاد فراوانی که در آن شاید مفهوم پول هم اهمیت گذشته را از دست بدهد.

📉 اما نگاه اقتصاددان‌ها محتاط‌تر است.
آن‌ها تأیید می‌کنند که اتوماسیون کامل مسیر قطعی آینده است، اما معتقدند بازه زمانی پیشنهادی ماسک دور از واقعیت است؛
• سرعت پذیرش ربات‌ها در صنایع پایین است،
• هزینه‌های جاری و سرمایه‌گذاری بسیار بالاست،
• و جامعه جهانی هنوز برای حمایت از میلیاردها نفر بدون شغل کلاسیک، ساختار اقتصادی و سیاسی لازم را ندارد.

⏳ آینده به سوی خودکارسازی پیش می‌رود، اما رسیدن به «جهان بدون نیاز به کار» هنوز با واقعیت‌های صنعتی و اجتماعی فاصله دارد.

@rss_ai_ir
#فناوری 🤖 #اقتصاد #اتوماسیون #روباتیک #هوش_مصنوعی

👍1

289 views14:11

VIRSUN

🎨✨ نانابانانا و ترفندهای تازه برای بازی با مختصات

یکی از جذاب‌ترین قابلیت‌های نسل جدید «نانابانانا پرو» همین توانایی تبدیل مختصات جغرافیایی به تصویر است. کافی است مختصات را در پرامپت بگذارید:

🟡 پرامپت:
Create an image of 45°58′35″N 7°39′31″E at sunset

نتیجه؟ منظره‌ای کارت‌پستالی از کوه ماترهورن. همان مقصد رؤیایی اسکی که از ایتالیا وارد می‌شوی (چروینیا) اما روی پیست‌های سوئیس (زِرمات) سر می‌خوری؛ تونل ۳۸۰۰ متری هم «بالاگرفتگی ارتفاع» را هدیه می‌دهد! 😅⛷️

🎯 ماجرا از این هم جذاب‌تر می‌شود
وقتی وارد Google Maps می‌شوید، روی نقطه‌ای از نقشه پین می‌گذارید، مختصات را کپی می‌کنید — مثل 59°56'09.8"N 30°19'17.7"E برای یکی از خیابان‌های سن‌پترزبورگ — و همان را به نانابانانا می‌دهید.

🤔 اما نکته جالب:
مدل اصولاً عکس واقعی تولید نمی‌کند؛ یک تصویر «عمومی‌شده» بر اساس انبوه داده‌های اینترنت می‌سازد.
برای جزیره قبرس هم تست شده:
• ساحل‌ها را اشتباه می‌کشد،
• حتی وسط کوهستان هم دریا نقاشی می‌کند!

در عوض حال‌وهوا، نور، حس مکان را فوق‌العاده درمی‌آورد — فقط نه با دقت ژئومپینگ واقعی.

این یعنی نانابانانا درک دقیقی از مفهوم فضا دارد، اما نه از طراحی دقیق جغرافیایی؛ یک نقاش تخیلی بسیار باسواد، نه یک نقشه‌بردار ماهواره‌ای.

@rss_ai_ir
#هوش_مصنوعی ✨ #مولدها #Gemini #NanoBanana #نقشه #بینایی_ماشین

❤2🔥1

287 views14:13

VIRSUN

🧬⚡️ راهنمای جدید انویدیا برای مقیاس‌پذیری مدل‌های زیستی

شرکت NVIDIA یک گاید جامع منتشر کرده که نشان می‌دهد چگونه می‌توان مدل‌های بیولوژی محاسباتی را تا مقیاس میلیاردها پارامتر گسترش داد—بدون نیاز به نوشتن CUDA دستی و بدون ساختن سیستم‌های پیچیده از صفر.

سه ایدهٔ کلیدی همه چیز را تغییر می‌دهند:

۱) به‌کارگیری Transformer Engine ⚙️
این موتور، بلاک‌های استاندارد ترنسفورمر را با نسخه‌های بهینه‌شده جایگزین می‌کند:
✔️ کاهش چشمگیر مصرف حافظه
✔️ افزایش سرعت ضرب‌های ماتریسی
✔️ پشتیبانی از FP8 و FP4
نتیجه: سرعت بیشتر در آموزش و استنتاج، بدون تغییر معماری مدل.

۲) گسترش آموزش تا مقیاس میلیارد پارامتر 🚀
با استفاده از FSDP و انواع موازی‌سازی ترکیبی، مدل می‌تواند روی چندین GPU یا چندین نود توزیع شود.
پیکربندی‌ها از قبل آماده‌اند و نیازی نیست مهندسی موازی‌سازی را دستی بسازید.

۳) صرفه‌جویی بزرگ در VRAM با sequence packing 💡
داده‌های زیستی—مثل توالی پروتئین‌ها—طول‌های بسیار متفاوت دارند و پدینگ زیاد باعث تلف شدن حافظه می‌شود.
همچنین Sequence Packing توالی‌ها را فشرده می‌کند، پدینگ‌ها حذف می‌شوند، و نتیجه:
✔️ سرعت بالاتر
✔️ مصرف VRAM کمتر
✔️ مدل‌های بزرگ‌تر روی GPUهای کوچک‌تر

مزیت نهایی این روش‌ها در BioNeMo Recipes این است که همچنان می‌توان از همان استک آشنای PyTorch + HuggingFace استفاده کرد، اما به عملکردی نزدیک به فریم‌ورک‌های سطح بالا رسید.

🔗 توضیحات کامل:
https://developer.nvidia.com/blog/scale-biology-transformer-models-with-pytorch-and-nvidia-bionemo-recipes/

@rss_ai_ir
#NVIDIA ⚡️ #BioAI #هوش_مصنوعی #زیست‌محاسباتی

1.21K views14:16

VIRSUN

0:44

This media is not supported in your browser

VIEW IN TELEGRAM

🤖🇨🇳 رکورد جهانی تازه برای ربات‌های پیاده‌رو

ربات تازه‌نفس ساخت چین توانست رکورد جهانی طولانی‌ترین مسیر پیموده‌شده بدون توقف را جابه‌جا کند:
بیش از ۱۰۶ کیلومتر پیاده‌روی مداوم بدون خرابی، توقف یا نیاز به مداخله انسان. 🔥🚶‍♂️🤖

این رکورد جدید نشان می‌دهد صنعت رباتیک چین با سرعتی بی‌سابقه در حال نزدیک‌شدن به استانداردهای انسانی در پایداری، مصرف انرژی و استقامت فیزیکی است.
برای شرکت‌هایی که روی ربات‌های انسان‌نما، تحویل خودکار، بازرسی صنعتی یا عملیات‌های طولانی کار می‌کنند، این پیشرفت یک نقطه‌عطف جدی محسوب می‌شود.

@rss_ai_ir
#رباتیک #هوش_مصنوعی #چین #Robot #AI #Innovation

👍1

1.14K views14:17

VIRSUN

0:02

This media is not supported in your browser

VIEW IN TELEGRAM

🦞 استفاده از تنها یک تصویر مصنوعی برای هر کلاس 🦞

پژوهشگران MIT روشی تازه به نام Linear Gradient Matching معرفی کرده‌اند؛ روشی نوآورانه برای دیتاست دیستیلیشن که اجازه می‌دهد تنها با یک تصویر مصنوعی برای هر کلاس، بتوان یک دسته‌بند خطی را آموزش داد — و حتی فراتر از آن!

این تکنیک، ساختار گرادیان‌ها را بازسازی می‌کند تا مدل بدون نیاز به مجموعه‌دادهٔ حجیم، رفتار همان دیتاست واقعی را تقلید کند.
نتیجه: کاهش شدید هزینهٔ داده‌سازی و سرعت بسیار بالاتر در آموزش مدل‌ها.

📌 لینک‌ها:

👉 مقاله:
arxiv.org/pdf/2511.16674
👉 پروژه:
linear-gradient-matching.github.io
👉 مخزن کد:
github.com/GeorgeCazenavette/linear-gradient-matching

@rss_ai_ir
#هوش_مصنوعی #دانشگاهی #دیپ‌لرنینگ #DataDistillation #AI 🧠✨

🔥1🙏1👌1

1.16K views14:20

VIRSUN

🔥 مقایسه Gemini 3.0 با رادیولوژیست‌ها؛ نتایج RadLE منتشر شد

دیروز نسخهٔ جدید Gemini 3.0 موج بزرگی در فضای هوش مصنوعی ایجاد کرد و بلافاصله این سؤال مطرح شد که:
«آیا این مدل می‌تواند از پس استدلال تصویری واقعیِ پزشکی بربیاید؟»

برای پاسخ، سخت‌ترین معیار موجود انتخاب شد: RadLE v1.

📊 نتایج تست Gemini 3.0 Pro روی RadLE v1

دقت ۵۱٪ — نخستین بار که یک مدل عمومی موفق شده عملکردش از رزیدنت‌های رادیولوژی بهتر باشد

رزیدنت‌های رادیولوژی: ۴۵٪

رادیولوژیست‌های هیئت‌مدارک‌دار: ۸۳٪

مدل به‌صورت پایدار استدلال مرحله‌به‌مرحله ارائه می‌کند؛ از تشخیص ضایعات ظریف تا پیدا کردن آپاندیس و حذف موارد مشابه

✨ برای اولین بار در تاریخ، یک مدل عمومی هوش مصنوعی توانسته از «سطح کارآموزی» در سخت‌ترین بنچمارک رادیولوژی عبور کند.

@rss_ai_ir
#پزشکی #رادیولوژی #هوش_مصنوعی #Gemini #AI

⚡2👏2❤1🎉1

1.18K views14:22

VIRSUN

👈 نیمی از ثروت کره زمین در دستان این جمع است.
سازندگان آینده

✅ @rss_ai_ir

👍3👌3❤1👎1🕊1🗿1

1.16K views16:06

VIRSUN

0:53

This media is not supported in your browser

VIEW IN TELEGRAM

🚀 ربات AlohaMini؛ انقلاب ششصد دلاری در ربات‌های خانگی و Embodied-AI

دنیای رباتیک یک قدم دیگر به خانه‌های ما نزدیک‌تر شد. AlohaMini معرفی شده؛ رباتی دو‌دستی، موبایل و کاملاً قابل چاپ با پرینتر سه‌بعدی — با هزینه‌ای حدود ۶۰۰ دلار و امکان مونتاژ در حدود یک ساعت.

این ربات مخصوص علاقه‌مندان، پژوهشگران و توسعه‌دهندگانی است که می‌خواهند بدون هزینه‌های سنگین، روی هوش تجسم‌یافته (Embodied AI) و کارهای واقعی مانپولیشن آزمایش کنند.

✨ ویژگی‌ها ◼️ دو بازوی رباتیک کامل
◼️ شاسی متحرک با قابلیت جابه‌جایی
◼️ سازه موتوردار با ارتفاع قابل تنظیم تا حدود ۶۰ سانتی‌متر
◼️ کاملاً متن‌باز و سازگار با LeRobot برای شروع سریع برنامه‌نویسی
◼️ دو نسخه:
• Mini (کاملاً چاپ سه‌بعدی)
• Pro (ترکیب مواد مقاوم‌تر)

🟢 این پروژه عملاً democratization رباتیک است — یعنی هر کسی، حتی در خانه، می‌تواند یک پلتفرم واقعی برای تمرین کنترل ربات، آموزش مدل‌های RL، Teleoperation و حتی یادگیری ادراکی بسازد.

📎 سورس کامل، فایل‌های چاپ، مونتاژ و کدها:
https://github.com/liyiteng/AlohaMini

@rss_ai_ir
#رباتیک 🤖 #هوش_مصنوعی #EmbodiedAI #AlohaMini #۳Dپرینت #DIY

❤1👍1🔥1👏1

1.2K views16:10

About

Blog

Apps

Platform