VIRSUN
13.4K subscribers
1.16K photos
693 videos
5 files
768 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
This media is not supported in your browser
VIEW IN TELEGRAM
🍯 بازکردن هوشمندانه‌ی UV برای مش‌های سه‌بعدی 🍯

روش PartUV یک تکنیک جدید برای UV Unwrapping است که به‌جای باز کردن کامل مش، آن را بر اساس «قطعات» تجزیه می‌کند. این مدل، ترکیبی از دانش یادگرفته‌شده دربارهٔ بخش‌های مختلف جسم و نشانه‌های هندسی است و در نهایت یک مجموعه کوچک، منظم و کاملاً هم‌راستا با ساختار قطعه‌ها تولید می‌کند.

مناسب برای:
مدل‌سازی سه‌بعدی، گیم، انیمیشن، ری‌تاپو، تکسچرینگ حرفه‌ای.
🎁 ریپوی پروژه هم منتشر شده.

🔗 لینک‌ها

• Paper: arxiv.org/pdf/2511.16659
• Project: www.zhaoningwang.com/PartUV/
• Repo: github.com/EricWang12/PartUV

#سه_بعدی #UV #Mesh #AI3D
👍1
📌 مجموعه Figure گزارشی مفصل منتشر کرد از اینکه ربات‌های Figure 02 چگونه به مدت ۱۱ ماه در کارخانه BMW کار کردند.

داستان اصلاً آزمایشگاهی نبود؛ این اولین جنگ واقعی صنعتی برای ربات‌ها بود. تنها ۶ ماه بعد از معرفی مدل 02، آن‌ها وارد خط تولید BMW شدند و تا ماه دهم به ظرفیت کاری کامل رسیدند.

🔧 شیفت کاری:
▪️ ۱۰ ساعت در روز
▪️ از دوشنبه تا جمعه
▪️ بیش از ۱۲۵۰ ساعت کار واقعی روی خط تولید

در مجموع، ربات‌ها بیش از ۹۰ هزار قطعه را جابه‌جا کردند و در تولید ۳۰ هزار خودرو سری X3 نقش مستقیم داشتند. همچنین بیش از ۱.۲ میلیون قدم برداشتند و حدود ۳۲۰ کیلومتر در فضای کارخانه راه رفتند.


---

🎯 وظیفه اصلی ربات‌ها

«لود کردن ورق‌های فلزی» — یک کار کلاسیک صنعتی، اما بسیار دقیق.
ربات باید ورق فلزی را بردارد و با دقت ۵ میلی‌متر داخل دستگاه جوش قرار دهد.

برای سنجش عملکرد، مهندسان KPIهای سختی تعیین کرده بودند:

🟢 ۸۴ ثانیه برای کامل‌کردن هر چرخه
🟢 بیش از ۹۹٪ نرخ موفقیت
🟢 صفر دخالت انسانی در هر شیفت

این اهداف باعث شد Figure الگوریتم‌های جدید هماهنگی چشم–دست و گام‌برداری تطبیقی را توسعه دهد.


---

🚧 چه چیزی خراب شد؟ تجربه واقعی یعنی پیدا کردن گلوگاه‌ها.

با ورود Figure 03، نسل دوم رسماً بازنشسته شد. مهم‌ترین نقطه‌ضعف Figure 02 در عمل چه بود؟

❗️ پیش‌دستی (Forearm)
به‌دلیل طراحی فشرده و نیاز به چابکی، این بخش:
— داغ می‌کرد
— تعمیرش سخت بود
— نقطه‌ضعف کل سیستم محسوب می‌شد

در Figure 03 معماری این بخش کاملاً اصلاح شد:
🔵 برد توزیع برق حذف شد
🔵 سیم‌کشی دینامیک کنار گذاشته شد
🔵 کنترلرهای موتور مستقیماً به کامپیوتر مرکزی وصل شدند

اساساً تجربه سخت کارخانه BMW تبدیل شد به یک نسخه‌ی کاملاً بهتر و مهندسی‌شده.

https://www.figure.ai/news/production-at-bmw

---
@rss_ai_ir
#هوش_مصنوعی #رباتیک #BMW #Figure #AI #Industry4_0
3
This media is not supported in your browser
VIEW IN TELEGRAM
🍌 مدل Nano Banana Pro؛ یک دمو جذاب از قدرت نسل جدید مدل‌های تصویری گوگل

⛔️در این نمونه، مدل با یک پرامپت ساده توانسته یک تصویر کاملاً سبک‌دار و دقیق بسازد:


🎨 پرامپت:
Generate a diagram of a two-layer neural network in the style of Stephen Biesty

🔧 نکته:
حرکت و انیمیشن نهایی هم با Veo 3 ساخته شده.

@rss_ai_ir
#هوش_مصنوعی #نقشه‌کشی #NanoBananaPro #گوگل #تولید_تصویر #AI
This media is not supported in your browser
VIEW IN TELEGRAM
ابزار مخصوص کسانی که از جدول‌سازی متنفرند

این سرویس فقط با یک پرامپت، خودش جدول را برایتان تکمیل می‌کند.
کافی است فایل را آپلود کنید یا لینک بدهید — بقیه کارها را هوش مصنوعی خودش انجام می‌دهد.

🔗 لینک
https://labs.ramp.com/sheets

@rss_ai_ir
#هوش_مصنوعی #جدول #بهره‌وری #AITools #اتوماسیون
🧠 نشانه‌های واقعی یک جهش علمی با GPT-5

هوش مصنوعی فقط ابزار نیست—کم‌کم تبدیل می‌شود به عضو فعال تیم پژوهشی.
نتایج جدید OpenAI دقیقاً همین را نشان می‌دهد:

همچنین GPT-5 دیگر فقط خلاصه نمی‌کند؛ خودش فرمول و قضیهٔ جدید می‌سازد
مدل توانایی استنتاج ریاضی و تولید روابط پیچیده را به‌صورت مستقل پیدا کرده است.

🌀 در فیزیک، روی تقارن‌های سیاه‌چاله‌ها کار می‌کند—و درست هم کار می‌کند
تحلیل ساختارهای SL(2,R) در فضا-زمان خمیده، چیزی فراتر از اتوکامپلیت است.
این یعنی فهم انتزاع، نه حفظ متن.

📚 منابع علمی فراموش‌شده را در چند دقیقه پیدا می‌کند
مقاله‌هایی که پژوهشگر انسانی شاید هرگز نبیند، توسط مدل از عمق آرشیوها بیرون کشیده می‌شود.

🧬 در زیست‌شناسی هم سازوکارهای جدید پیشنهاد می‌دهد
و حیرت‌انگیزتر اینکه برخی از این پیشنهادها با نتایج آزمایش‌هایی که هنوز منتشر نشده‌اند هم‌خوانی دارد.

🧪 پیشنهاد آزمایش در سطح یک هم‌نویسنده
دیگر نقش مدل فقط “کمک‌کننده” نیست؛ به بخشی از فرایند علمی تبدیل شده است.

📌 این یعنی چه؟

• هزینهٔ کشف علمی نزدیک به صفر می‌شود
• گلوگاه‌های تخصصی کلاسیک از بین می‌روند
• تیم‌های «انسان + هوش مصنوعی» از کل یک شاخه علمی سریع‌تر خواهند بود
• چرخهٔ کامل پژوهش—from idea to result—فشرده و خودکار می‌شود

اگر می‌پرسید شروع تکینگی فناورانه چه شکلی است…
احتمالاً بسیار شبیه همین چیزی است که اکنون می‌بینیم.

🔗 جزئیات کامل:
https://openai.com/index/accelerating-science-gpt-5/

@rss_ai_ir
#openai #chatgpt #هوش_مصنوعی #پژوهش #علم #GPT5
🔥2👍1👏1
🌉🤖 ابزار CodexMCP؛ پل هوشمند بین Claude Code و Codex برای کدنویسی تعاملی

ابزار CodexMCP مثل یک «لایه هماهنگ‌کننده» بین Claude Code و Codex عمل می‌کند و کمک می‌کند چند ایجنت هوش مصنوعی هم‌زمان روی یک پروژه کدنویسی کار کنند و خروجی منسجم‌تری بدهند.

🔹 پشتیبانی از دیالوگ‌های چندمرحله‌ای و انجام هم‌زمان چند تسک برنامه‌نویسی
🔹 مدیریت حرفه‌ای کانتکست و حفظ سشن‌ها برای کارهای طولانی و تکرارشونده
🔹 استفاده از Claude Code برای تحلیل نیازمندی، معماری و طراحی قبل از نوشتن کد
🔹 امکان ردیابی لاگ، جزییات خروجی و هندل‌کردن خطاها در فرآیند اجرای تسک‌ها

لینک GitHub:
https://github.com/GuDaStudio/codexmcp

@rss_ai_ir
#هوش_مصنوعی #برنامه_نویسی #کدنویسی_خودکار #MCP #Claude #Codex #python
👍1🔥1🥰1
🍕 Upsample Anything —
آپ‌سمپل‌کننده یونیورسال بدون نیاز به آموزش 🍕

مدل Upsample Anything یک روش جدید و بدون نیاز به آموزش برای بزرگ‌کردن هر نوع تصویر، ویدیو یا داده تصویری است.
این روش با یک بهینه‌سازی بسیار سبک در زمان اجرا کار می‌کند و نیاز به مدل‌های سنگین یا دیتاست‌های بزرگ ندارد.

🔍 برای کسانی که با سوپررزولوشن کار می‌کنند، این مقاله ارزش دیدن دارد.


📑 Paper:
https://lnkd.in/dsUfdtih

@rss_ai_ir
#Upsample #ImageAI #SuperResolution #ComputerVision #AI
1👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 نانوبانانا در ساخت اسلاید عالیه، اما اگر بخواهیم از اسلایدها ویدئو بسازیم چه؟ 🎬

در اکوسیستم گوگل، این کار حالا فوق‌العاده ساده شده است. Google Vids به‌همراه Gemini می‌تواند یک ارائهٔ Google Slides را به یک ویدئوی کامل تبدیل کند — آن هم به‌طور خودکار.

در این فرآیند چه اتفاقی می‌افتد؟
اسکریپت نوشته می‌شود
صداگذاری انجام می‌شود
موسیقی اضافه می‌شود
ویدئو بر اساس سبک انتخابی شما ساخته می‌شود

کافیست فایل ارائهٔ خود را آپلود کنید، یک سبک انتخاب کنید، و بقیه را سیستم انجام می‌دهد. این یعنی تبدیل ارائه‌های خشک به محتوای ویدئویی حرفه‌ای — بدون دردسر تدوین.

🔗 منبع:
https://workspace.google.com/blog/product-announcements/october-workspace-drop-ai-storytelling-research-and-data-protections

@rss_ai_ir
#Gemini #گوگل #ویدئو #هوش_مصنوعی #LLM
👍3🔥1🙏1
در ادامه ماراتن نانابانانا پرو 🍌

🔍 خیلی‌ها نسخه‌ی جدید Nano Banana Pro را فقط یک ارتقای کیفی می‌بینند—درحالی‌که اصل ماجرا چیز دیگری است. کیفیت فوق‌العاده‌اش (مثل خروجی‌های 4K) فقط بخش کوچکی از داستان است.
واقعیت این است که دامنهٔ کاربردهای نانابانانا به‌طرز انفجاری گسترش یافته؛ آن هم فراتر از تولید یا ویرایش تصویر.


---

🎯 نکتهٔ مهم: کاربردهای تازه، نه فقط کیفیت تازه

چرا این نسخه نقطهٔ عطف است؟
چون دیگر فقط یک مدل تصویر نیست—نانابانانا را رسماً وارد NotebookLM کرده‌اند، و این یعنی یک دنیای جدید از کاربردها:

📌 ساخت مجموعه اسلایدها از صفر
📌 تولید اینفوگرافی و دایاگرام‌های توضیحی
📌 ایجاد گراف‌های تحلیلی
📌 ترکیب همهٔ این‌ها برای تبدیل‌شان به ویدئوهای ارائه‌ای، خودکار و هوشمند
📌 یکپارچگی کامل با اکوسیستم Workspace

نگاهی به ویدیوهای دمو کافی است تا بفهمید NotebookLM با نانابانانا تبدیل شده به یک ماشین تولید محتوای کامل از متن تا ویدئو.


---

🟡 چرا این برگ برنده دست گوگل است؟

زیرا گوگل یک اکوسیستم عظیم دارد: Docs، Slides، Sheets، Vids، Drive، NotebookLM…
هر ویژگی جدید را می‌تواند مستقیماً وارد این محصولات کند.
یعنی: یک مدل = ده‌ها کاربرد واقعی و آماده برای میلیون‌ها کاربر.

این همان نقطه‌ای است که OpenAI در آن ضعف دارد.
جز ChatGPT (یک نقطهٔ ورودی واحد)، جای خاصی برای تزریق مدل‌ها ندارد.
همچنین Atlas هم که قرار بود جایگاهی شبیه Workspace داشته باشد… «نپرید».


---

نتیجه؟

نانابانانا پرو نه‌فقط بهتر شده—بلکه همه‌جا حاضر شده.
از تولید ویدئو تا ساخت درسنامه و توضیح مفاهیم.
از اسلایدسازی تا تحلیل داده و خلاصه‌سازی تصویری.

این نسخه چیزی شبیه دایره‌المعارف مولتی‌مدیا با موتور Gemini 3 است.


---

@rss_ai_ir
#nanobanana #Gemini #گوگل #NotebookLM #تولید_محتوا #هوش_مصنوعی
👍41💯1
سامانه تشخیص گفتار چندزبانه Omnilingual ASR 🌍🗣️
بیش از ۱۶۰۰ زبان (حتی زبان‌های کم‌منبع و محلی) را پشتیبانی می‌کند و سعی دارد شکاف زبانی در فناوری گفتار به متن را از بین ببرد.

ویژگی‌ها:

✳️پشتیبانی از زبان‌های بسیار متنوع، از رایج تا کاملاً نادر

✳️امکان اضافه کردن زبان‌های جدید با داده‌ی آموزشی بسیار کم (few-shot / zero-shot)

✳️طراحی‌شده برای دسترس‌پذیری و شمول جوامع مختلف زبانی

✳️قابل تست و استفاده روی Hugging Face و در دسترس روی گیت‌هاب


لینک گیت‌هاب 🔗
https://github.com/facebookresearch/omnilingual-asr

@rss_ai_ir
#هوش_مصنوعی #تشخیص_گفتار #ASR #Multilingual #DeepLearning #SpeechToText
1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 رندر بود یا ویدیو؟
این تیتر دیگر بیشتر از روی عادت نوشته می‌شود. تعداد کسانی که هنوز دنبال «رندر» هستند، تقریباً به اندازه طرفداران «طوطی آماری» شده؛ یعنی خیلی کم.

⚽️ فقط چند ماه قبل همه ویدیوهایی منتشر می‌کردند که ربات‌ها حتی نمی‌توانستند توپ فوتبال را درست بزنند؛ بیشتر شوت‌ها از توپ رد می‌شد.

اما حالا چند ماه گذشته…

نتیجه واقعاً حیرت‌انگیز است.
هماهنگی حرکتی، سرعت واکنش و کنترل بدن ربات‌ها به سطحی رسیده که دیدنش آدم را متوقف می‌کند. حرکات دقیق، پایدار و نزدیک به توانایی انسان.

⚠️ و یک نکته مهم‌تر:
بهتر است هیچ‌وقت در فاصله نزدیک با این ربات‌ها درگیر نشوید؛ قدرت و سرعت آن‌ها در این مرحله دیگر شوخی‌بردار نیست.

@rss_ai_ir
#روباتیک 🤖 #فناوری #هوش_مصنوعی #ربات_انسان‌نما #اتوماسیون
🔥1
🤖 آینده‌ای که کار در آن «انتخابی» می‌شود

ایلان ماسک در نشست سرمایه‌گذاری آمریکا–عربستان اعلام کرد که طی ۱۰ تا ۲۰ سال آینده، با فراگیر شدن اتوماسیون و ربات‌های انسان‌نما، جهان به مرحله‌ای می‌رسد که کار کردن برای بسیاری از مردم «اختیاری» خواهد شد؛ دوره‌ای شبیه به اقتصاد فراوانی که در آن شاید مفهوم پول هم اهمیت گذشته را از دست بدهد.

📉 اما نگاه اقتصاددان‌ها محتاط‌تر است.
آن‌ها تأیید می‌کنند که اتوماسیون کامل مسیر قطعی آینده است، اما معتقدند بازه زمانی پیشنهادی ماسک دور از واقعیت است؛
• سرعت پذیرش ربات‌ها در صنایع پایین است،
• هزینه‌های جاری و سرمایه‌گذاری بسیار بالاست،
• و جامعه جهانی هنوز برای حمایت از میلیاردها نفر بدون شغل کلاسیک، ساختار اقتصادی و سیاسی لازم را ندارد.

آینده به سوی خودکارسازی پیش می‌رود، اما رسیدن به «جهان بدون نیاز به کار» هنوز با واقعیت‌های صنعتی و اجتماعی فاصله دارد.

@rss_ai_ir
#فناوری 🤖 #اقتصاد #اتوماسیون #روباتیک #هوش_مصنوعی
👍1
🎨 نانابانانا و ترفندهای تازه برای بازی با مختصات

یکی از جذاب‌ترین قابلیت‌های نسل جدید «نانابانانا پرو» همین توانایی تبدیل مختصات جغرافیایی به تصویر است. کافی است مختصات را در پرامپت بگذارید:

🟡 پرامپت:
Create an image of 45°58′35″N 7°39′31″E at sunset

نتیجه؟ منظره‌ای کارت‌پستالی از کوه ماترهورن. همان مقصد رؤیایی اسکی که از ایتالیا وارد می‌شوی (چروینیا) اما روی پیست‌های سوئیس (زِرمات) سر می‌خوری؛ تونل ۳۸۰۰ متری هم «بالاگرفتگی ارتفاع» را هدیه می‌دهد! 😅⛷️

🎯 ماجرا از این هم جذاب‌تر می‌شود
وقتی وارد Google Maps می‌شوید، روی نقطه‌ای از نقشه پین می‌گذارید، مختصات را کپی می‌کنید — مثل 59°56'09.8"N 30°19'17.7"E برای یکی از خیابان‌های سن‌پترزبورگ — و همان را به نانابانانا می‌دهید.

🤔 اما نکته جالب:
مدل اصولاً عکس واقعی تولید نمی‌کند؛ یک تصویر «عمومی‌شده» بر اساس انبوه داده‌های اینترنت می‌سازد.
برای جزیره قبرس هم تست شده:
• ساحل‌ها را اشتباه می‌کشد،
• حتی وسط کوهستان هم دریا نقاشی می‌کند!

در عوض حال‌وهوا، نور، حس مکان را فوق‌العاده درمی‌آورد — فقط نه با دقت ژئومپینگ واقعی.

این یعنی نانابانانا درک دقیقی از مفهوم فضا دارد، اما نه از طراحی دقیق جغرافیایی؛ یک نقاش تخیلی بسیار باسواد، نه یک نقشه‌بردار ماهواره‌ای.

@rss_ai_ir
#هوش_مصنوعی #مولدها #Gemini #NanoBanana #نقشه #بینایی_ماشین
2🔥1
🧬⚡️ راهنمای جدید انویدیا برای مقیاس‌پذیری مدل‌های زیستی

شرکت NVIDIA یک گاید جامع منتشر کرده که نشان می‌دهد چگونه می‌توان مدل‌های بیولوژی محاسباتی را تا مقیاس میلیاردها پارامتر گسترش داد—بدون نیاز به نوشتن CUDA دستی و بدون ساختن سیستم‌های پیچیده از صفر.

سه ایدهٔ کلیدی همه چیز را تغییر می‌دهند:

۱) به‌کارگیری Transformer Engine ⚙️
این موتور، بلاک‌های استاندارد ترنسفورمر را با نسخه‌های بهینه‌شده جایگزین می‌کند:
✔️ کاهش چشمگیر مصرف حافظه
✔️ افزایش سرعت ضرب‌های ماتریسی
✔️ پشتیبانی از FP8 و FP4
نتیجه: سرعت بیشتر در آموزش و استنتاج، بدون تغییر معماری مدل.

۲) گسترش آموزش تا مقیاس میلیارد پارامتر 🚀
با استفاده از FSDP و انواع موازی‌سازی ترکیبی، مدل می‌تواند روی چندین GPU یا چندین نود توزیع شود.
پیکربندی‌ها از قبل آماده‌اند و نیازی نیست مهندسی موازی‌سازی را دستی بسازید.

۳) صرفه‌جویی بزرگ در VRAM با sequence packing 💡
داده‌های زیستی—مثل توالی پروتئین‌ها—طول‌های بسیار متفاوت دارند و پدینگ زیاد باعث تلف شدن حافظه می‌شود.
همچنین Sequence Packing توالی‌ها را فشرده می‌کند، پدینگ‌ها حذف می‌شوند، و نتیجه:
✔️ سرعت بالاتر
✔️ مصرف VRAM کمتر
✔️ مدل‌های بزرگ‌تر روی GPUهای کوچک‌تر

مزیت نهایی این روش‌ها در BioNeMo Recipes این است که همچنان می‌توان از همان استک آشنای PyTorch + HuggingFace استفاده کرد، اما به عملکردی نزدیک به فریم‌ورک‌های سطح بالا رسید.

🔗 توضیحات کامل:
https://developer.nvidia.com/blog/scale-biology-transformer-models-with-pytorch-and-nvidia-bionemo-recipes/

@rss_ai_ir
#NVIDIA ⚡️ #BioAI #هوش_مصنوعی #زیست‌محاسباتی