VIRSUN
10.9K subscribers
1.2K photos
716 videos
5 files
789 links
📥 در کانال @rss_ai_ir هر روز: 🔹 جدیدترین خبرهای AI و فناوری
🗯اولویت ما هوش مصنوعی در صنعت میباشد اما نیم نگاهی به موارد دیگر در این زمینه داریم

ارتباط با ادمین 1:
@Ad1_rss_ai_ir

آدرس گروه
https://t.iss.one/rss_ai_ir_group
Download Telegram
مدل MSRNet؛ شبکهٔ چندمقیاسی بازگشتی برای آشکارسازی اشیای استتار‌شده
@rss_ai_ir

تشخیص اشیایی که عمداً در محیط «محو» شده‌اند همیشه یکی از سخت‌ترین چالش‌های بینایی ماشین بوده است.
مدل MSRNet با ترکیب Pyramid Vision Transformer و Recursive Feature Refinement توانسته یک جهش جدی ایجاد کند و در بنچمارک‌ها به State-of-the-Art برسد.

🔍 چرا MSRNet مهم است؟

✳️عملکرد عالی روی اجسام کوچک و چندگانه

✳️تقویت چندمرحله‌ای ویژگی‌ها با معماری بازگشتی

✳️یادگیری پایدارتر و دقت بالاتر نسبت به مدل‌های قبلی

✳️مناسب برای کاربردهایی مثل: نظارت، رباتیک، پزشکی و تحلیل حیات‌وحش


📅 تاریخ انتشار: ۱۶ نوامبر
📄 لینک مقاله:
arXiv: https://arxiv.org/abs/2511.12810
PDF: https://arxiv.org/pdf/2511.12810

🤗 مدل‌های منتشرشده:
https://huggingface.co/linaa98/MSRNet


---

#CamouflagedObjectDetection #MSRNet #ObjectDetection #ComputerVision #DeepLearning #VisionTransformer #AIResearch #NeuralNetworks
🔥1🙏1👌1
This media is not supported in your browser
VIEW IN TELEGRAM
⚡️ مدل Flux 2 رسماً منتشر شد – ارتقای بزرگ در نسل تصویر
@rss_ai_ir

مدل Flux 2 با یک آپدیت سنگین برگشته و حالا دقیق‌تر، واقع‌گراتر و بسیار توانمندتر شده است.

چه چیزهایی بهتر شده؟

♻️پشتیبانی همزمان از ۱۰ رفرنس

♻️درک بسیار بهتر از نور، متریال‌ها و اپتیک

♻️رندر دقیق‌تر و طبیعی‌تر متن

♻️خروجی با کیفیت ۴K واقعی

♻️تصاویر نرم‌تر، واقع‌گراتر و بدون «براقی پلاستیکی»

♻️امکان ترکیب، ویرایش و ژنریشن چندمرحله‌ای


🖥️ اجرای محلی هم کاملاً ممکن است
وزن‌ها باز هستند و با حدود ۶۵ گیگابایت می‌توانید مدل را روی سیستم خود اجرا کنید.

🟠 دمو:
https://playground.bfl.ai/image/generate

🟠 وزن‌ها:
https://huggingface.co/black-forest-labs

🟠 FLUX.2-dev در HF:
https://huggingface.co/black-forest-labs/FLUX.2-dev


---

#Flux2 #AI #ImageGeneration #AIGraphics #GenerativeAI #BlackForestLabs #DiffusionModels
👏4👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
📌 قدرت سگ‌ربات‌های جدید واقعاً شگفت‌انگیز شده است
@rss_ai_ir

ربات‌های چهارپا حالا به مرحله‌ای رسیده‌اند که توان، چابکی و کنترل آن‌ها جدی‌تر از هر زمان دیگری است. حرکاتی که چند سال پیش فقط در آزمایشگاه‌ها دیده می‌شد، امروز با دقت و ثبات بالا انجام می‌شود — از پرش و دویدن گرفته تا حمل بار و انجام کارهای صنعتی.

این سطح از قدرت یعنی:
💥 ورود جدی ربات‌ها به عملیات امداد، امنیت، بازرسی صنعتی
💥 توان انجام کارهایی که برای انسان خطرناک یا غیرممکن است
💥 گام بزرگ به سمت ربات‌های خودمختار در مقیاس وسیع

دنیای رباتیک واقعاً با سرعت باور نکردنی در حال تغییر است.

#رباتیک #هوش_مصنوعی #RobotDog #AI #Automation #FutureTech
🔥21🤯1👌1🌚1
This media is not supported in your browser
VIEW IN TELEGRAM
@rss_ai_ir

🍓 مدل MotionV2V — ویرایش حرکت در ویدئو با دقت بی‌سابقه 🍓

گوگل سیستم MotionV2V را معرفی کرد؛ روشی نوین برای ویرایش حرکت در ویدئو که به‌جای تغییر کل فریم، مستقیماً تفاوت حرکت بین ویدئوی اصلی و نسخه ویرایش‌شده را کنترل می‌کند.

این مدل بر پایه دیفیوشن کار می‌کند و امکان می‌دهد که:
حرکت یک فرد تغییر کند، بدون تغییر ظاهر
سرعت، جهت، یا شدت حرکت اصلاح شود
حرکت کاملاً جدید روی ویدئو اعمال شود
ویدئوهای ادیت‌شده، طبیعی و منسجم باقی بمانند

نتیجه؟
ویدئوهایی با حرکت‌های کاملاً کنترل‌شده، بدون artifacts و بدون پرش‌های عجیب.

🔗 لینک‌ها:

👉 Paper:
https://arxiv.org/pdf/2511.20640
👉 Project Page:
https://ryanndagreat.github.io/MotionV2V/
👉 GitHub (به‌زودی):
https://github.com/RyannDaGreat/MotionV2V

#MotionEditing #VideoAI #DiffusionModels #GoogleAI #GenerativeAI #DeepLearning
👍1🔥1
@rss_ai_ir

تشخیص تصاویر مصنوعی با گرادیان‌فیلدها — یک روش ساده و شگفت‌انگیز! 💡

در دنیایی که مدل‌های دیفیوشن هر روز واقعی‌تر می‌شوند، پیدا کردن یک روش ساده، سبک و قابل‌توضیح برای تشخیص عکس واقعی از مصنوعی واقعاً طلاست. این تکنیک دقیقاً همین کار را می‌کند 👇

🔍 ایده اصلی
با انجام یک تحلیل ساده روی گرادیان روشنایی تصویر و سپس استفاده از PCA، یک جداسازی پایدار بین:

📸 عکس‌های واقعی

🎨 تصاویر ساخته‌شده با دیفیوشن
به‌دست می‌آید.


🧠 چرا جواب می‌دهد؟

تصاویر واقعی، گرادیان‌هایی دارند که با نورپردازی فیزیکی و رفتار سنسور دوربین سازگار است؛ منسجم و طبیعی.

تصاویر دیفیوشن به‌دلیل فرآیند denoising دارای جزئیات ناپایدار و بافت‌های فرکانس‌بالا هستند که ساختگی بودن را لو می‌دهد.


🧮 مراحل کار (فقط چند قدم ساده):

1. تبدیل RGB → luminance


2. محاسبه spatial gradients


3. تبدیل گرادیان‌ها به ماتریس فلت‌شده


4. محاسبه covariance


5. انجام PCA و مشاهده جداسازی واضح در یک تصویر



🎯 نتیجه
بدون مدل طبقه‌بندی، بدون متادیتا، بدون شبکه عصبی — فقط با ریاضی پایه و تحلیل گرادیان‌ها می‌توان به‌راحتی تشخیص داد تصویر واقعی است یا مصنوعی. یک ابزار عالی برای پژوهشگران بینایی‌ماشین و متخصصان امنیت داده.

#SyntheticDetection #GradientFields #PCA #ComputerVision #DeepLearning #AIForensics @rss_ai_ir
4👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🔥 Smell Like Vision Spirit 🔥
@rss_ai_ir

👉 دیتاست New York Smells یک دیتاست بزرگ و جدید از ترکیب همزمان تصویر و داده‌های بویایی است که امکان یادگیری کراس‌مودال بین بو و بینایی را فراهم می‌کند.
👉 با چراغ خاموش هم شاید «کم‌خطرتر» باشد، اما حالا AI می‌تواند بو را هم بفهمد!
👉 دیتاست در دسترس است.


🔗 Paper:
https://arxiv.org/pdf/2511.20544
🔗 Project:
https://smell.cs.columbia.edu/

#AI #Multimodal #Dataset #SmellAI #DeepLearning @rss_ai_ir
👍3🔥1👏1
⚡️مجموعه NVIDIA نسخه FP4 مدل DeepSeek V3.1 را روی HuggingFace منتشر کرد

@rss_ai_ir

انویدیا نسخه‌ی کوانت‌شده FP4 از مدل DeepSeek V3.1 را منتشر کرد — و این یعنی سرعت بالاتر، مصرف حافظه کمتر، و همچنان کیفیت بسیار خوب متن.

🔹 مزیت اصلی FP4:
کمترین سطح کوانتیزاسیون بدون افت جدی کیفیت،
به‌خصوص وقتی با TensorRT-LLM اجرا شود.

🔹 نتیجه؟
• حافظه کمتر 🟢
• سرعت بیشتر 🟢
• عملکرد تقریباً هم‌سطح نسخه کامل 🟢

Hugging Face:

https://huggingface.co/nvidia/DeepSeek-V3.1-NVFP4

#NVIDIA #DeepSeek #LLM #FP4 #TensorRT @rss_ai_ir
🔥4👍1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
ویسِ چت‌جی‌پی‌تی مستقیم داخل همان چت فعال شد!
@rss_ai_ir 🎤🤖

از حالا می‌توانید بدون هیچ سوییچ یا مود جداگانه، فقط شروع کنید به صحبت‌کردن — چت‌جی‌پی‌تی هم‌زمان با حرف‌زدن شما پاسخ می‌دهد!

ویژگی‌های نسخه جدید:
🔹 ویس مستقیماً داخل همان پنجرهٔ چت
🔹 پاسخ‌ها در لحظه روی متن ظاهر می‌شوند
🔹 می‌توانید هم‌زمان اسکرول کنید، پیام‌های قبلی را ببینید
🔹 تصاویر، نقشه‌ها و ویژوال‌ها در لحظه نمایش داده می‌شوند
🔹 روی موبایل و وب فعال می‌شود
🔹 فقط کافی‌ست اپ را آپدیت کنید

این دقیقاً همان تجربهٔ یک دستیار شخصی لحظه‌ای است.
هوش مصنوعی که هم می‌بیند، هم می‌شنود، هم حرف می‌زند — و همه‌چیز در یک پنجره.

#ChatGPT #VoiceAI #AIUX #AIAssistant @rss_ai_ir
👍31🔥1👏1