VIRSUN
13.5K subscribers
1.16K photos
693 videos
5 files
768 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
برای بچه‌های آرک‌ویز خبر جذاب داریم 🤌🔥

نانابانانی‌شا حالا ورودی تصویری را واقعاً تحلیل می‌کند و بعد براساس نقشه‌ها و پلان‌ها، رندر کامل می‌سازد.
یعنی از یک عکس خام → برداشت فضا → تبدیل به رندر معماری با نور، متریال و پرسپکتیو درست.
دقیقاً همان چیزی که همیشه آرک‌ویز دنبال آن بود.

@rss_ai_ir
#معماری #ArchViz #نانابانانا #هوش_مصنوعی #رندر #پلان #طراحی_داخلی
📣و در نهایت خبر آخر دربارهٔ نسخهٔ جدید نانابانانا 🍌⚡️
تمام جزئیات رسمی در بلاگ گوگل منتشر شده:
اعداد، نمونه‌پرامپت‌ها، تست‌ها و مثال‌های دقیق کیفیت خروجی.
اگر می‌خواهید بدانید این نسخه دقیقاً چه تغییراتی کرده و چرا همه درباره‌اش حرف می‌زنند، این لینک بهترین مرجع است👇
https://deepmind.google/models/gemini-image/pro/

@rss_ai_ir
#نانابانانا #هوش_مصنوعی #گوگل #Gemini #مولتی‌مودال
Please open Telegram to view this post
VIEW IN TELEGRAM
3
This media is not supported in your browser
VIEW IN TELEGRAM
🔶 نسخهٔ ۵.۰ مدل‌های Kandinsky منتشر شد؛ یکی از بزرگ‌ترین آپدیت‌های متن‌باز در حوزهٔ تولید تصویر و ویدیو

اسبر تمام مجموعهٔ Kandinsky 5.0 را کاملاً متن‌باز عرضه کرد:
همچنین Video Pro، Video Lite، Image Lite و توکنایزرهای K-VAE 1.0 — همه با لایسنس MIT و همراه با کد و وزن‌ها.

🎬 Video Pro
نسخهٔ پرچم‌دار که ویدئوهای HD تا ۱۰ ثانیه می‌سازد، با کنترل دقیق حرکت دوربین.
آموزش‌دیده روی: ۵۲۰ میلیون تصویر + ۲۵۰ میلیون ویدیو + مرحلهٔ نهایی روی دیتاست ویدیوهای بسیار باکیفیت.
در تست‌ها از Wan 2.2-A14B بهتر و از نظر کیفیت نزدیک Veo 3 است.

پشتیبانی کامل از زبان روسی و انگلیسی؛ تولید متن روی تصویر (لاتین/سیریلیک) بدون خطا.

🎥 Video Lite
نسخهٔ سبک برای GPUهای ۱۲GB، با کیفیت بالا و داینامیک عالی.
در کیفیت، ۷ برابر بهتر از Wan 2.1-14B عمل می‌کند، هم در Text-to-Video هم Image-to-Video.

🖼 Image Lite
برای تولید تصویر و ادیت پیشرفته.
آموزش‌دیده روی ۵۲۰ میلیون تصویر + ۱۵۰ میلیون زوج ادیت + SFT نهایی روی ۱۵۰هزار تصویر.
به‌طور چشمگیر از FLUX.1 بهتر عمل می‌کند و در ادیت با FLUX.1 Kontext برابری می‌کند.

🎛 K-VAE 1.0 (نسخه ۲D و ۳D)
اتو‌انکودر واریاسیونی برای فشرده‌سازی ورودی‌ها (۸×۸ برای تصویر و ۴×۸×۸ برای ویدیو).
کیفیت بازسازی +۰.۵ dB بهتر از Flux / Wan / Hunyuan با همین ضریب فشرده‌سازی.

📦 تمام مدل‌ها و وزن‌ها در GitHub، Gitverse و HuggingFace موجود است.

@rss_ai_ir
#Kandinsky #AI #نشر_متن_باز #تولید_ویدیو #دیفیوژن #هوش_مصنوعی
👏4🔥1
🤖 خبر: AITradeGame؛ شبیه‌ساز معامله‌گری با هوش مصنوعی

اینکه AITradeGame یک شبیه‌ساز متن‌باز است که به شما امکان می‌دهد استراتژی‌های معاملاتی را با کمک مدل‌های هوش مصنوعی آزمایش کنید.
نسخهٔ آفلاین با حفظ کامل حریم خصوصی ارائه شده و نسخهٔ آنلاین هم قابلیت‌های تعاملی و جدول رتبه‌بندی دارد.

نکات برجسته:
• پشتیبانی از مدل‌های مختلف، از جمله OpenAI و Claude
• ذخیره‌سازی کاملاً محلی بدون ردیابی ابری
• جدول رتبه‌بندی برای رقابت با دیگران
• رابط کاربری ساده با امکان تنظیم پارامترهای معامله‌گری

📌 GitHub:
https://github.com/chadyi/AITradeGame

@rss_ai_ir
#AI #Trade #شبیه_ساز #معامله_گری #هوش_مصنوعی
🔥2👍1👏1
🔍 در صنعت، فرقِ «بلد بودن» با «ادعا داشتن» از کیلومترها پیداست

در پروژه‌های واقعی — چه اتوماسیون باشد، چه هوش مصنوعی، چه بهره‌برداری — همیشه دو نوع نیرو دیده می‌شود:

🟩 نیروهای واقعاً بلد:
• قبل از حرف‌زدن، مسئله را دقیق می‌فهمند
• خروجی قابل اندازه‌گیری می‌دهند، نه داستان
• در جلسه کمتر حرف می‌زنند، اما بیشتر حل می‌کنند
• مسئولیت‌پذیرند و اگر اشتباه کنند، اصلاح می‌کنند
• نیاز به «نمایش» ندارند؛ کارشان خودش حرف می‌زند

🟥 نیروهای پرادعا و پرحرف:
• به‌جای تحلیل مسئله، شعار می‌دهند
• خروجی ندارند اما جلسه زیاد می‌گیرند
• هنگام خرابکاری، تقصیر را به گردن سیستم و دیگران می‌اندازند
• از اصطلاحات پیچیده برای پنهان کردن نابلدی استفاده می‌کنند
• انرژی تیم را می‌گیرند و سرعت پروژه را پایین می‌آورند

🎯 جمع‌بندی صنعتی:
در هر کارخانه یا سازمان، ارزش نیرو با «میزان صدای او» سنجیده نمی‌شود،
بلکه با میزان تأثیر او روی خروجی، بهره‌وری و حل مسئله سنجیده می‌شود.

@rss_ai_ir
#مدیریت_صنعتی #اتوماسیون #مهندسی #بهره‌وری #تجربه_صنعتی
👌52👏2
This media is not supported in your browser
VIEW IN TELEGRAM
🎬 مدل HunyuanVideo-1.5؛ نسل جدید مدل‌های سبکِ تولید ویدیو

مدل تازه‌ی HunyuanVideo-1.5 منتشر شد؛ یک ویدئوژنراتور اوپن‌سورس با کیفیت بالا و حجم بسیار کم (۸.۳ میلیارد پارامتر) که برای سخت‌افزارهای محدود واقعاً غنیمت است.


ویژگی‌های مهم

• امکان اجرا در حدود ۱۴ گیگابایت VRAM با فعال‌کردن offload به CPU
• کیفیت خروجی عالی با وجود سبک بودن مدل
• وجود ماژول آپ‌اسکیل تا رزولوشن 1080p
• پشتیبانی کامل از ComfyUI
• مناسب برای سیستم‌های خانگی و ورک‌استیشن‌های متوسط

🌐 لینک‌ها
کد:
github.com/Tencent-Hunyuan/HunyuanVideo-1.5
وزن‌ها:
huggingface.co/tencent/HunyuanVideo-1.5
سایت مدل:
hunyuan.tencent.com/video/en

#هوش_مصنوعی #ویدئوژنریشن @rss_ai_ir
👍3
This media is not supported in your browser
VIEW IN TELEGRAM
🍯 بازکردن هوشمندانه‌ی UV برای مش‌های سه‌بعدی 🍯

روش PartUV یک تکنیک جدید برای UV Unwrapping است که به‌جای باز کردن کامل مش، آن را بر اساس «قطعات» تجزیه می‌کند. این مدل، ترکیبی از دانش یادگرفته‌شده دربارهٔ بخش‌های مختلف جسم و نشانه‌های هندسی است و در نهایت یک مجموعه کوچک، منظم و کاملاً هم‌راستا با ساختار قطعه‌ها تولید می‌کند.

مناسب برای:
مدل‌سازی سه‌بعدی، گیم، انیمیشن، ری‌تاپو، تکسچرینگ حرفه‌ای.
🎁 ریپوی پروژه هم منتشر شده.

🔗 لینک‌ها

• Paper: arxiv.org/pdf/2511.16659
• Project: www.zhaoningwang.com/PartUV/
• Repo: github.com/EricWang12/PartUV

#سه_بعدی #UV #Mesh #AI3D
👍1
📌 مجموعه Figure گزارشی مفصل منتشر کرد از اینکه ربات‌های Figure 02 چگونه به مدت ۱۱ ماه در کارخانه BMW کار کردند.

داستان اصلاً آزمایشگاهی نبود؛ این اولین جنگ واقعی صنعتی برای ربات‌ها بود. تنها ۶ ماه بعد از معرفی مدل 02، آن‌ها وارد خط تولید BMW شدند و تا ماه دهم به ظرفیت کاری کامل رسیدند.

🔧 شیفت کاری:
▪️ ۱۰ ساعت در روز
▪️ از دوشنبه تا جمعه
▪️ بیش از ۱۲۵۰ ساعت کار واقعی روی خط تولید

در مجموع، ربات‌ها بیش از ۹۰ هزار قطعه را جابه‌جا کردند و در تولید ۳۰ هزار خودرو سری X3 نقش مستقیم داشتند. همچنین بیش از ۱.۲ میلیون قدم برداشتند و حدود ۳۲۰ کیلومتر در فضای کارخانه راه رفتند.


---

🎯 وظیفه اصلی ربات‌ها

«لود کردن ورق‌های فلزی» — یک کار کلاسیک صنعتی، اما بسیار دقیق.
ربات باید ورق فلزی را بردارد و با دقت ۵ میلی‌متر داخل دستگاه جوش قرار دهد.

برای سنجش عملکرد، مهندسان KPIهای سختی تعیین کرده بودند:

🟢 ۸۴ ثانیه برای کامل‌کردن هر چرخه
🟢 بیش از ۹۹٪ نرخ موفقیت
🟢 صفر دخالت انسانی در هر شیفت

این اهداف باعث شد Figure الگوریتم‌های جدید هماهنگی چشم–دست و گام‌برداری تطبیقی را توسعه دهد.


---

🚧 چه چیزی خراب شد؟ تجربه واقعی یعنی پیدا کردن گلوگاه‌ها.

با ورود Figure 03، نسل دوم رسماً بازنشسته شد. مهم‌ترین نقطه‌ضعف Figure 02 در عمل چه بود؟

❗️ پیش‌دستی (Forearm)
به‌دلیل طراحی فشرده و نیاز به چابکی، این بخش:
— داغ می‌کرد
— تعمیرش سخت بود
— نقطه‌ضعف کل سیستم محسوب می‌شد

در Figure 03 معماری این بخش کاملاً اصلاح شد:
🔵 برد توزیع برق حذف شد
🔵 سیم‌کشی دینامیک کنار گذاشته شد
🔵 کنترلرهای موتور مستقیماً به کامپیوتر مرکزی وصل شدند

اساساً تجربه سخت کارخانه BMW تبدیل شد به یک نسخه‌ی کاملاً بهتر و مهندسی‌شده.

https://www.figure.ai/news/production-at-bmw

---
@rss_ai_ir
#هوش_مصنوعی #رباتیک #BMW #Figure #AI #Industry4_0
3
This media is not supported in your browser
VIEW IN TELEGRAM
🍌 مدل Nano Banana Pro؛ یک دمو جذاب از قدرت نسل جدید مدل‌های تصویری گوگل

⛔️در این نمونه، مدل با یک پرامپت ساده توانسته یک تصویر کاملاً سبک‌دار و دقیق بسازد:


🎨 پرامپت:
Generate a diagram of a two-layer neural network in the style of Stephen Biesty

🔧 نکته:
حرکت و انیمیشن نهایی هم با Veo 3 ساخته شده.

@rss_ai_ir
#هوش_مصنوعی #نقشه‌کشی #NanoBananaPro #گوگل #تولید_تصویر #AI
This media is not supported in your browser
VIEW IN TELEGRAM
ابزار مخصوص کسانی که از جدول‌سازی متنفرند

این سرویس فقط با یک پرامپت، خودش جدول را برایتان تکمیل می‌کند.
کافی است فایل را آپلود کنید یا لینک بدهید — بقیه کارها را هوش مصنوعی خودش انجام می‌دهد.

🔗 لینک
https://labs.ramp.com/sheets

@rss_ai_ir
#هوش_مصنوعی #جدول #بهره‌وری #AITools #اتوماسیون
🧠 نشانه‌های واقعی یک جهش علمی با GPT-5

هوش مصنوعی فقط ابزار نیست—کم‌کم تبدیل می‌شود به عضو فعال تیم پژوهشی.
نتایج جدید OpenAI دقیقاً همین را نشان می‌دهد:

همچنین GPT-5 دیگر فقط خلاصه نمی‌کند؛ خودش فرمول و قضیهٔ جدید می‌سازد
مدل توانایی استنتاج ریاضی و تولید روابط پیچیده را به‌صورت مستقل پیدا کرده است.

🌀 در فیزیک، روی تقارن‌های سیاه‌چاله‌ها کار می‌کند—و درست هم کار می‌کند
تحلیل ساختارهای SL(2,R) در فضا-زمان خمیده، چیزی فراتر از اتوکامپلیت است.
این یعنی فهم انتزاع، نه حفظ متن.

📚 منابع علمی فراموش‌شده را در چند دقیقه پیدا می‌کند
مقاله‌هایی که پژوهشگر انسانی شاید هرگز نبیند، توسط مدل از عمق آرشیوها بیرون کشیده می‌شود.

🧬 در زیست‌شناسی هم سازوکارهای جدید پیشنهاد می‌دهد
و حیرت‌انگیزتر اینکه برخی از این پیشنهادها با نتایج آزمایش‌هایی که هنوز منتشر نشده‌اند هم‌خوانی دارد.

🧪 پیشنهاد آزمایش در سطح یک هم‌نویسنده
دیگر نقش مدل فقط “کمک‌کننده” نیست؛ به بخشی از فرایند علمی تبدیل شده است.

📌 این یعنی چه؟

• هزینهٔ کشف علمی نزدیک به صفر می‌شود
• گلوگاه‌های تخصصی کلاسیک از بین می‌روند
• تیم‌های «انسان + هوش مصنوعی» از کل یک شاخه علمی سریع‌تر خواهند بود
• چرخهٔ کامل پژوهش—from idea to result—فشرده و خودکار می‌شود

اگر می‌پرسید شروع تکینگی فناورانه چه شکلی است…
احتمالاً بسیار شبیه همین چیزی است که اکنون می‌بینیم.

🔗 جزئیات کامل:
https://openai.com/index/accelerating-science-gpt-5/

@rss_ai_ir
#openai #chatgpt #هوش_مصنوعی #پژوهش #علم #GPT5
🔥2👍1👏1
🌉🤖 ابزار CodexMCP؛ پل هوشمند بین Claude Code و Codex برای کدنویسی تعاملی

ابزار CodexMCP مثل یک «لایه هماهنگ‌کننده» بین Claude Code و Codex عمل می‌کند و کمک می‌کند چند ایجنت هوش مصنوعی هم‌زمان روی یک پروژه کدنویسی کار کنند و خروجی منسجم‌تری بدهند.

🔹 پشتیبانی از دیالوگ‌های چندمرحله‌ای و انجام هم‌زمان چند تسک برنامه‌نویسی
🔹 مدیریت حرفه‌ای کانتکست و حفظ سشن‌ها برای کارهای طولانی و تکرارشونده
🔹 استفاده از Claude Code برای تحلیل نیازمندی، معماری و طراحی قبل از نوشتن کد
🔹 امکان ردیابی لاگ، جزییات خروجی و هندل‌کردن خطاها در فرآیند اجرای تسک‌ها

لینک GitHub:
https://github.com/GuDaStudio/codexmcp

@rss_ai_ir
#هوش_مصنوعی #برنامه_نویسی #کدنویسی_خودکار #MCP #Claude #Codex #python
👍1🔥1🥰1
🍕 Upsample Anything —
آپ‌سمپل‌کننده یونیورسال بدون نیاز به آموزش 🍕

مدل Upsample Anything یک روش جدید و بدون نیاز به آموزش برای بزرگ‌کردن هر نوع تصویر، ویدیو یا داده تصویری است.
این روش با یک بهینه‌سازی بسیار سبک در زمان اجرا کار می‌کند و نیاز به مدل‌های سنگین یا دیتاست‌های بزرگ ندارد.

🔍 برای کسانی که با سوپررزولوشن کار می‌کنند، این مقاله ارزش دیدن دارد.


📑 Paper:
https://lnkd.in/dsUfdtih

@rss_ai_ir
#Upsample #ImageAI #SuperResolution #ComputerVision #AI
1👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🌟 نانوبانانا در ساخت اسلاید عالیه، اما اگر بخواهیم از اسلایدها ویدئو بسازیم چه؟ 🎬

در اکوسیستم گوگل، این کار حالا فوق‌العاده ساده شده است. Google Vids به‌همراه Gemini می‌تواند یک ارائهٔ Google Slides را به یک ویدئوی کامل تبدیل کند — آن هم به‌طور خودکار.

در این فرآیند چه اتفاقی می‌افتد؟
اسکریپت نوشته می‌شود
صداگذاری انجام می‌شود
موسیقی اضافه می‌شود
ویدئو بر اساس سبک انتخابی شما ساخته می‌شود

کافیست فایل ارائهٔ خود را آپلود کنید، یک سبک انتخاب کنید، و بقیه را سیستم انجام می‌دهد. این یعنی تبدیل ارائه‌های خشک به محتوای ویدئویی حرفه‌ای — بدون دردسر تدوین.

🔗 منبع:
https://workspace.google.com/blog/product-announcements/october-workspace-drop-ai-storytelling-research-and-data-protections

@rss_ai_ir
#Gemini #گوگل #ویدئو #هوش_مصنوعی #LLM
👍3🔥1🙏1
در ادامه ماراتن نانابانانا پرو 🍌

🔍 خیلی‌ها نسخه‌ی جدید Nano Banana Pro را فقط یک ارتقای کیفی می‌بینند—درحالی‌که اصل ماجرا چیز دیگری است. کیفیت فوق‌العاده‌اش (مثل خروجی‌های 4K) فقط بخش کوچکی از داستان است.
واقعیت این است که دامنهٔ کاربردهای نانابانانا به‌طرز انفجاری گسترش یافته؛ آن هم فراتر از تولید یا ویرایش تصویر.


---

🎯 نکتهٔ مهم: کاربردهای تازه، نه فقط کیفیت تازه

چرا این نسخه نقطهٔ عطف است؟
چون دیگر فقط یک مدل تصویر نیست—نانابانانا را رسماً وارد NotebookLM کرده‌اند، و این یعنی یک دنیای جدید از کاربردها:

📌 ساخت مجموعه اسلایدها از صفر
📌 تولید اینفوگرافی و دایاگرام‌های توضیحی
📌 ایجاد گراف‌های تحلیلی
📌 ترکیب همهٔ این‌ها برای تبدیل‌شان به ویدئوهای ارائه‌ای، خودکار و هوشمند
📌 یکپارچگی کامل با اکوسیستم Workspace

نگاهی به ویدیوهای دمو کافی است تا بفهمید NotebookLM با نانابانانا تبدیل شده به یک ماشین تولید محتوای کامل از متن تا ویدئو.


---

🟡 چرا این برگ برنده دست گوگل است؟

زیرا گوگل یک اکوسیستم عظیم دارد: Docs، Slides، Sheets، Vids، Drive، NotebookLM…
هر ویژگی جدید را می‌تواند مستقیماً وارد این محصولات کند.
یعنی: یک مدل = ده‌ها کاربرد واقعی و آماده برای میلیون‌ها کاربر.

این همان نقطه‌ای است که OpenAI در آن ضعف دارد.
جز ChatGPT (یک نقطهٔ ورودی واحد)، جای خاصی برای تزریق مدل‌ها ندارد.
همچنین Atlas هم که قرار بود جایگاهی شبیه Workspace داشته باشد… «نپرید».


---

نتیجه؟

نانابانانا پرو نه‌فقط بهتر شده—بلکه همه‌جا حاضر شده.
از تولید ویدئو تا ساخت درسنامه و توضیح مفاهیم.
از اسلایدسازی تا تحلیل داده و خلاصه‌سازی تصویری.

این نسخه چیزی شبیه دایره‌المعارف مولتی‌مدیا با موتور Gemini 3 است.


---

@rss_ai_ir
#nanobanana #Gemini #گوگل #NotebookLM #تولید_محتوا #هوش_مصنوعی
👍41💯1
سامانه تشخیص گفتار چندزبانه Omnilingual ASR 🌍🗣️
بیش از ۱۶۰۰ زبان (حتی زبان‌های کم‌منبع و محلی) را پشتیبانی می‌کند و سعی دارد شکاف زبانی در فناوری گفتار به متن را از بین ببرد.

ویژگی‌ها:

✳️پشتیبانی از زبان‌های بسیار متنوع، از رایج تا کاملاً نادر

✳️امکان اضافه کردن زبان‌های جدید با داده‌ی آموزشی بسیار کم (few-shot / zero-shot)

✳️طراحی‌شده برای دسترس‌پذیری و شمول جوامع مختلف زبانی

✳️قابل تست و استفاده روی Hugging Face و در دسترس روی گیت‌هاب


لینک گیت‌هاب 🔗
https://github.com/facebookresearch/omnilingual-asr

@rss_ai_ir
#هوش_مصنوعی #تشخیص_گفتار #ASR #Multilingual #DeepLearning #SpeechToText
1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 رندر بود یا ویدیو؟
این تیتر دیگر بیشتر از روی عادت نوشته می‌شود. تعداد کسانی که هنوز دنبال «رندر» هستند، تقریباً به اندازه طرفداران «طوطی آماری» شده؛ یعنی خیلی کم.

⚽️ فقط چند ماه قبل همه ویدیوهایی منتشر می‌کردند که ربات‌ها حتی نمی‌توانستند توپ فوتبال را درست بزنند؛ بیشتر شوت‌ها از توپ رد می‌شد.

اما حالا چند ماه گذشته…

نتیجه واقعاً حیرت‌انگیز است.
هماهنگی حرکتی، سرعت واکنش و کنترل بدن ربات‌ها به سطحی رسیده که دیدنش آدم را متوقف می‌کند. حرکات دقیق، پایدار و نزدیک به توانایی انسان.

⚠️ و یک نکته مهم‌تر:
بهتر است هیچ‌وقت در فاصله نزدیک با این ربات‌ها درگیر نشوید؛ قدرت و سرعت آن‌ها در این مرحله دیگر شوخی‌بردار نیست.

@rss_ai_ir
#روباتیک 🤖 #فناوری #هوش_مصنوعی #ربات_انسان‌نما #اتوماسیون
🔥1