VIRSUN

❓ در سیستم‌های بینایی ماشین مبتنی بر Stereo Vision، عمق هر نقطه در صحنه چگونه محاسبه می‌شود؟

Anonymous Quiz

17%

با مقایسه تغییر شدت روشنایی بین دو تصویر

61%

با محاسبه اختلاف مکان متناظر یک نقطه در تصاویر چپ و راست و استفاده از فاصله بین دو دوربین

17%

با اندازه‌گیری مستقیم زمان رفت و برگشت نور (Time of Flight)

با افزایش وضوح تصویر و کاهش نویز

😁7🔥6🎉6❤4👍4

23 voters3.72K views16:30

VIRSUN

0:52

This media is not supported in your browser

VIEW IN TELEGRAM

🌍 ویژگی Video Overviews در NotebookLM حالا روی ۸۰ زبان فعال شد

📑 با این قابلیت می‌توانید یادداشت‌ها، فایل‌های PDF و تصاویر خود را به ویدیوهای خلاصه‌سازی شده با صداگذاری روی هر زبانی (از جمله فارسی) تبدیل کنید.

🎧 علاوه بر آن، Audio Overviews هم آپدیت شدند: قبلاً فقط به انگلیسی خلاصه‌های کامل ساخته می‌شد، اما حالا روی تمام ۸۰ زبان در دسترس هستند.

🔗 جزئیات بیشتر: notebooklm.google

#هوش_مصنوعی #گوگل #NotebookLM #چندرسانه‌ای #AI

@rss_ai_ir

❤13👍7🔥4😁3🎉3👏1

3.77K viewsedited 16:55

VIRSUN

✖️ چرا بعضی پروژه‌های صنعتی هوش مصنوعی شکست می‌خورند یا بلااستفاده می‌مانند؟

خیلی از کارخانه‌ها و شرکت‌ها سراغ هوش مصنوعی می‌روند، اما بعد از مدتی پروژه‌ها یا به نتیجه نمی‌رسند یا در گوشه‌ای خاک می‌خورند. دلایل اصلی این موضوع معمولاً تکراری و شناخته‌شده‌اند:

1️⃣ تعریف نامشخص مسأله صنعتی
پروژه از همان ابتدا به زبان الگوریتم تعریف می‌شود، نه به زبان مشکل واقعی خط تولید. نتیجه؟ الگوریتم هست، ولی درد صنعت درمان نمی‌شود.

2️⃣ کمبود داده یا کیفیت پایین داده‌ها
خیلی وقت‌ها پروژه با دیتای ناقص یا بدون استراتژی جمع‌آوری داده شروع می‌شود. مدل آموزش می‌بیند، اما در محیط واقعی جواب نمی‌دهد.

3️⃣ نبود پشتیبانی مدیریتی
اگر مدیران ارشد باور نداشته باشند و صرفاً پروژه برای پرستیژ راه بیفتد، بعد از مدتی بودجه و انگیزه قطع می‌شود.

4️⃣ عدم ادغام با فرآیند موجود
مدل آماده می‌شود، اما با نرم‌افزارها، ماشین‌آلات و جریان کاری کارخانه ادغام نمی‌شود. خروجی روی کاغذ عالی است، ولی کسی در خط تولید استفاده‌اش نمی‌کند.

5️⃣ نگاه صرفاً تحقیقاتی و نه عملیاتی
تیم پروژه بیشتر روی مقاله و دقت الگوریتم تمرکز می‌کند تا KPI واقعی مثل کاهش ضایعات یا افزایش بهره‌وری.

---

✅ مثال واقعی:
در یک کارخانه فلزی، سیستم بینایی ماشین برای شناسایی ترک‌های سطحی ساخته شد. مدل روی دیتای تست ۹۵٪ دقت داشت، اما چون دوربین‌ها درست کالیبره نشده بودند و اپراتورها آموزش ندیده بودند، سیستم کنار گذاشته شد.

📌 نتیجه‌گیری:
موفقیت پروژه‌های AI صنعتی فقط به مدل خوب بستگی ندارد. داده، ادغام با فرآیند، پذیرش انسانی و پشتیبانی مدیریتی چهار ستون اصلی هستند. اگر یکی از این‌ها بلنگد، پروژه به شکست می‌رسد.

#هوش_مصنوعی #صنعت #مدیریت #AI #DigitalTransformation

@rss_ai_ir

❤10😁6👍4🔥3🎉3

3.79K viewsedited 17:00

VIRSUN

⚠️ اپل به فکر استفاده از Gemini برای سیری — تغییر مسیر یا اعتراف به ضعف؟

گزارش‌ها می‌گویند اپل در حال مذاکره اولیه با گوگل است تا نسخه جدید سیری را با یک مدل سفارشی از Gemini تقویت کند. این تغییر مسیر برای شرکتی که همیشه روی توسعه داخلی تأکید داشته، اتفاق بزرگی است.

🔹 چالش اصلی: ساخت سیری هوشمندتر که واقعاً بافت مکالمه را بفهمد و بتواند وظایف چندمرحله‌ای پیچیده را مدیریت کند — چیزی که سیری سال‌ها از رقبایش عقب مانده.
🔹 پروژه بازطراحی سیری به ۲۰۲۶ موکول شده و حالا اپل دنبال تزریق توان AI بیرونی است.
🔹 اپل یک رقابت داخلی یا به‌اصطلاح bake-off راه انداخته: مدل‌های خودش (Linwood) در برابر تکنولوژی‌های بیرونی (Glenwood، Gemini، Claude و ChatGPT).
🔹 واکنش بازار سریع بود: سهام گوگل بین ۳ تا ۳.۷٪ و سهام اپل بین ۱.۴ تا ۱.۶٪ رشد کرد؛ سرمایه‌گذاران معتقدند این همکاری می‌تواند فاصله اپل در حوزه GenAI را جبران کند.

📌 اگر اپل به‌طور کامل به سراغ Gemini برود، این فقط یک همکاری ساده نیست — بلکه اعتراف علنی است به اینکه سیری به‌تنهایی نمی‌تواند رقابت کند.

#هوش_مصنوعی #اپل #گوگل #Gemini #Siri #AI
@rss_ai_ir

🔥9❤4😁4🎉4👍3

879 views04:13

VIRSUN

⚠️ عبارت RefusalBench: وقتی مدل‌ها به سؤالات خطرناک پاسخ می‌دهند

✅مؤسسه‌ی Nous Research یک بنچمارک جدید معرفی کرده به نام RefusalBench که بررسی می‌کند مدل‌های زبانی چقدر حاضر هستند به سؤالاتی پاسخ بدهند که معمولاً غیرایمن و نامناسب محسوب می‌شوند (مثل ساخت مواد منفجره یا دستورالعمل‌های خطرناک).

📊 نتایج جالب بود:

♻️مدل Hermes 4 در صدر قرار گرفت (≈60٪ پاسخ‌دهی).
♻️همچنین Grok-4 ایلان ماسک هم بیش از 50٪ جواب داده.
♻️اما مدل‌های OpenAI مثل GPT-5 و GPT-OSS پایین‌ترین سطح پاسخ‌دهی را داشتند (≈5–11٪).

🔑 این یعنی OpenAI واقعاً روی AI Safety حساس است و برخلاف بعضی انتقادها، جلوی پاسخ‌های پرریسک را می‌گیرد. حتی هم‌زمان مسابقه‌ای با جایزه ۵۰۰ هزار دلاری برای پیدا کردن روش‌های دور زدن مکانیزم‌های ایمنی برگزار کرده‌اند.

📌 در مقابل، خروج ایگور بابوشکین (هم‌بنیان‌گذار سابق xAI) هم بی‌ارتباط با نگرانی‌های امنیتی Grok نیست.

⚖️ برداشت کلی:

✅اگر دنبال آزادی مطلق در پاسخ‌ها باشید، Grok و Hermes بیشتر جواب می‌دهند.
✅اما اگر امنیت و انطباق مهم باشد، OpenAI عملاً سخت‌گیرترین گزینه است.

#هوش_مصنوعی #AI_Safety #مدل_زبانی #Grok #GPT5 #Hermes

👍7🔥6😁5❤4🎉4

847 views04:19

VIRSUN

0:11

This media is not supported in your browser

VIEW IN TELEGRAM

0:28

This media is not supported in your browser

VIEW IN TELEGRAM

0:04

This media is not supported in your browser

VIEW IN TELEGRAM

0:08

This media is not supported in your browser

VIEW IN TELEGRAM

📌 کاربردهای جالب Gemini-2.5-Flash-Image-Preview

♻️مدل جدید گوگل یعنی Gemini-2.5-Flash-Image-Preview حالا در Google AI Studio قابل استفاده است و می‌توان با آن اپلیکیشن‌های خلاقانه‌ای ساخت.

🔹 چند نمونه کاربرد:

✏️ قابلیت Gemini Co-Drawing: مدل می‌تواند یک دیاگرام دست‌نویس را بخواند، محاسبات لازم را انجام دهد و طبق دستور، ویرایش‌های پیچیده روی شکل انجام دهد.

📊 تحلیل نمودارها و تصاویر همراه با توضیح و محاسبات

🎨 ویرایش ترکیبی متن + تصویر برای طراحی سریع پروتوتایپ‌ها

🧮 حل مسائل ریاضی از روی شکل‌های ترسیم‌شده

👨‍🏫 کمک در آموزش بصری، مثل اصلاح نقشه‌های درسی یا دیاگرام‌های علمی

🔗 نمونه اپلیکیشن‌ها:
Google AI Studio Apps

🔗 جزئیات فنی و قیمت:
Google Developer Blog

#هوش_مصنوعی #Gemini #مولتی‌مودال #پردازش_تصویر #گوگل

🎉8🔥7❤5👍3😁1

972 views04:22

VIRSUN

🔵 همکاری متا با Midjourney؛ لایسنس فناوری برای مدل‌ها و محصولات آینده

پس از جذب استعدادهای برتر و توسعه زیرساخت محاسباتی عظیم، حالا متا وارد فاز جدیدی شده: شراکت با بهترین شرکت‌های دنیا برای تقویت سبد AI خود.

این‌بار نوبت به Midjourney رسید؛ همکاری‌ای که می‌تواند کیفیت تولید محتوای تصویری و ویدیویی متا را متحول کند — از آواتارها و اینفلوئنسرهای دیجیتال گرفته تا محتوای شخصی‌سازی‌شده برای شبکه‌های اجتماعی.

❓سؤال بزرگ: شرکت بعدی که متا سراغش می‌رود کدام است؟ 🤔

@rss_ai_ir

#هوش_مصنوعی #متا #Midjourney #AI #تولید_محتوا

🎉7😁6🔥5❤4👍2

1.43K views05:14

VIRSUN

0:32

This media is not supported in your browser

VIEW IN TELEGRAM

🟣 کلود در مرورگر کروم

شرکت Anthropic شروع به تست نسخه آزمایشی Claude for Chrome کرده است. این ابزار به کاربران اجازه می‌دهد کارهای روزمره خود را در مرورگر (مثل خرید بلیت، پر کردن فرم‌ها، ثبت سفارش‌ها و …) مستقیماً به کلاود بسپارند.

🔹 نکات کلیدی:

♻️در حال حاضر تست فقط برای ۱۰۰۰ کاربر Claude Max فعال شده است.

♻️عملکرد مشابه Computer Use است، اما تمرکز اصلی روی امنیت و کنترل بیشتر کاربر قرار دارد.

♻️هدف: تبدیل Claude به یک دستیار مرورگری مطمئن و کارآمد.

🔗 جزئیات بیشتر: Anthropic News

#Claude #Anthropic #هوش_مصنوعی #مرورگر #کروم
@rss_ai_ir

👍8😁6🎉6🔥3❤2

1.49K views05:26

VIRSUN

⚡️ انویدیا نسل جدید پلتفرم‌های محاسباتی برای رباتیک را معرفی کرد — Jetson Thor

🔹 این سیستم به‌عنوان «مغز» ماشین‌های خودمختار معرفی شده که توانایی کار در دنیای واقعی رو دارن. قیمت این راهکارها از ۲۵۰۰ دلار شروع می‌شه.

🔸 در این رونمایی، علاوه بر کیت توسعه Jetson AGX Thor، ماژول‌های محاسباتی T5000 و T4000 هم معرفی شدن. طبق گفته انویدیا، این پلتفرم‌ها پایه‌ی «هوش مصنوعی فیزیکی» در حوزه‌هایی مثل تولید، لجستیک، سلامت و خرده‌فروشی خواهند بود.

🔹 جنسن هوانگ، مدیرعامل انویدیا، تأکید کرد که Jetson Thor با کارایی بالا و بهره‌وری انرژی طراحی شده تا میلیون‌ها توسعه‌دهنده بتونن ربات‌هایی بسازن که با جهان فیزیکی تعامل مستقیم دارن. مهم‌ترین ویژگی این نسل، امکان اجرای محلی چندین مدل مولد هوش مصنوعی به صورت همزمانه.

📌 مشخصات فنی اصلی

🟧 مبتنی بر معماری Blackwell، با پردازنده ۱۴ هسته‌ای Arm، GPU با ۲۵۶۰ هسته CUDA و ۱۲۸ گیگابایت حافظه. توان محاسباتی: ۲۰۷۰ TFLOPS با مصرف انرژی حداکثر ۱۳۰ وات (۷.۵ برابر قوی‌تر از نسل قبل، Jetson Orin).

🟧 ماژول Jetson T4000: نسخه اقتصادی‌تر با پردازنده ۱۲ هسته‌ای، GPU با ۱۵۳۶ هسته CUDA و ۶۴ گیگابایت حافظه. توان محاسباتی: ۱۲۰۰ TFLOPS.

این پلتفرم داده‌های سنسورها رو در لحظه پردازش می‌کنه و به ربات‌ها توانایی درک سریع محیط و واکنش بی‌درنگ می‌ده. همچنین به‌طور کامل با استک‌های نرم‌افزاری کلیدی انویدیا مثل Isaac، GR00T، Metropolis و Holoscan یکپارچه شده.

شرکت‌های بزرگی مثل Boston Dynamics، Amazon Robotics، Figure و Medtronic هم‌اکنون از این فناوری پشتیبانی می‌کنن.

#هوش_مصنوعی #رباتیک #NVIDIA #JetsonThor #AI_industrial

@rss_ai_ir

👍2🔥1👏1

3.7K views15:10

VIRSUN

🔥 انتشار دیتاست جدید VK-LSDV برای سیستم‌های توصیه‌گر و ویدئوهای کوتاه

📊 جزئیات دیتاست:

♻️شامل ۴۰ میلیارد تعامل یکتا و ناشناس
♻️۲۰ میلیون آیتم محتوایی
♻️۱۰ میلیون کاربر
♻️بازه‌ی زمانی: ژانویه تا ژوئن ۲۰۲۵
♻️داده‌ها: لایک، دیسلایک، اشتراک‌گذاری، مدت‌زمان تماشا، ری‌اکشن‌ها، کانتکست پخش

🟢 فرصت‌ها برای پژوهشگران و مهندسان:

♻️امکان سفارشی‌سازی نمونه داده متناسب با نیاز پروژه
♻️انتخاب روش نمونه‌گیری: تصادفی یا بر اساس محبوبیت
♻️قابلیت تطبیق حجم دیتاست با توان محاسباتی موجود

⚡️ چرا این مهم است؟
🟠 یکی از بزرگ‌ترین دیتاست‌های باز در حوزه ویدئوهای کوتاه برای سیستم‌های توصیه‌گر است.
🟠 به جای داده‌های کوچک و مصنوعی، پژوهشگران می‌توانند روی داده‌های واقعی و باکیفیت مدل بسازند و تست کنند.
🟠 گام مهمی در ایجاد یک محیط پژوهشی کامل برای توسعه الگوریتم‌های شخصی‌سازی و تست فرضیات است.

این منبع می‌تواند فرصت‌های تازه‌ای برای پژوهشگران و مهندسان در سراسر جهان ایجاد کند و استانداردهای توسعه سیستم‌های توصیه‌گر را ارتقا دهد.

🟠 دیتاست در HuggingFace:
👉 https://huggingface.co/datasets/deepvk/VK-LSVD

#دیتاست #هوش_مصنوعی #سیستم_توصیه_گر #AI #RecommenderSystem #VK

@rss_ai_ir

👍2🔥1👏1

3.67K viewsedited 15:21

VIRSUN

⚠️ حمله ویروس PromptLock: وقتی بدافزار خودش فکر می‌کند

🔴 پژوهشگران ESET Research Labs از کشف نخستین ویروسی خبر داده‌اند که به طور مستقیم از هوش مصنوعی استفاده می‌کند. این بدافزار با نام PromptLock شناخته می‌شود و توانایی آلوده‌سازی دستگاه‌های Windows، Linux و macOS را دارد.

❌ شیوه عملکرد:

✳️بدافزار شامل پرامپت‌های از پیش تعریف‌شده‌ای است که به مدل هوش مصنوعی ارسال می‌شوند.
✳️مدل در لحظه اسکریپت‌های Lua تولید می‌کند تا فایل‌سیستم را اسکن کند.
✳️داده‌ها یا به سرقت می‌روند یا با الگوریتمی رمزگذاری و قفل می‌شوند.
✳️هسته این بدافزار از مدل gpt-oss-20b (محصول تازه اوپن‌اِی‌آی) قدرت می‌گیرد.

❌ وضعیت کنونی:

♻️کارشناسان معتقدند PromptLock هنوز در مراحل اولیه است.
♻️نشانه‌ها: رمزنگاری ابتدایی و نبود برخی قابلیت‌ها.
♻️انتشار گسترده تاکنون ثبت نشده است.
♻️در یکی از پرامپت‌ها حتی آدرس بیت‌کوینی به نام ساتوشی ناکاموتو دیده شد، اما احتمالاً فقط یک «طعمه» موقت است.

⚡ این خبر نشان می‌دهد بدافزارهای آینده می‌توانند با استفاده از هوش مصنوعی، تطبیق‌پذیرتر و خطرناک‌تر شوند.

#امنیت_سایبری #بدافزار #هوش_مصنوعی #AI_industrial_news #futuretech

@rss_ai_ir

👍3🔥1👏1

3.68K viewsedited 15:23

🌟 مدل MiniCPM-V 4.5؛ رقیب جمع‌وجور غول‌های چندمودالی

پروژه OpenBMB نسخه جدید MiniCPM-V 4.5 را معرفی کرد؛ مدلی چندمودالی بر پایه Qwen3-8B و SigLIP2-400M که توانایی درک تصویر، توالی تصاویر و ویدئو را دارد و حتی روی موبایل هم در بیش از ۳۰ زبان اجرا می‌شود.

این پروژه زیرمجموعه غیرتجاری شرکت ModelBest (زیر نظر دانشگاه Tsinghua چین) است. سرمایه‌گذاران ModelBest شامل هواوی (Habo)، Primavera Capital و صندوق دولتی Shenzhen Guozhong هستند.

---

🔑 ویژگی کلیدی: پردازش کارآمد ویدئو
✔️ استفاده از 3D-Resampler باعث فشرده‌سازی ۹۶ برابری ویدئو می‌شود: هر ۶ فریم در رزولوشن 448x448 فقط به ۶۴ توکن تبدیل می‌شوند (در حالی که اکثر MLLMها به 1536 توکن نیاز دارند).
✔️ این قابلیت امکان پردازش ویدئو با سرعت ۱۰ فریم بر ثانیه و کلیپ‌های طولانی را بدون افزایش هزینه محاسباتی فراهم می‌کند.
✔️ نتایج برتر روی دیتاست‌های Video-MME، LVBench و MLVU تأییدکننده این کارایی است.

---

🖼 توانایی‌های تصویری
با معماری LLaVA-UHD، مدل می‌تواند با تصاویر تا وضوح 1.8 مگاپیکسل و نسبت تصویر آزاد کار کند، آن هم با مصرف ۴ برابر کمتر توکن‌های بصری.

---

⚡ انعطاف در استدلال
مدل دو حالت دارد:

Fast reasoning برای کارهای روزمره

Deep reasoning برای سناریوهای پیچیده

و کاربر می‌تواند بسته به نیاز بین آن‌ها جابه‌جا شود.
---

📊 عملکرد
با داشتن ۸ میلیارد پارامتر، این مدل در بنچمارک OpenCompass امتیاز 77.0 کسب کرده؛ بالاتر از GPT-4o-latest و Gemini-2.0 Pro و حتی بهتر از مدل متن‌باز Qwen2.5-VL با ۷۲ میلیارد پارامتر. همچنین در OmniDocBench رکورد تازه‌ای به نام خود ثبت کرده است.
---

💻 بدون مشکل در استقرار

♻️نسخه CPU با llama.cpp و ollama
♻️نسخه‌های کوانتیزه در فرمت‌های int4، GGUF و AWQ
♻️پشتیبانی از SGLang و vLLM
♻️قابلیت Fine-tuning با Transformers و LLaMA-Factory
♻️رابط کاربری وب و اپ بهینه‌شده برای iOS
---

📌 لینک‌ها
🟡 [Model]
🟡 [Demo]
🟡 [Community Discord]
🖥 [GitHub]

#هوش_مصنوعی #مدل_چندمودالی #MiniCPM #OpenBMB #MLLM #AI_industrial_news

@rss_ai_ir

👍3👏1

3.71K views16:03

VIRSUN

🎨 پرامپت آماده: اسباب‌بازی وینیل (Vinyl Toy)

🧸 اگر می‌خواهید فیگورهای سه‌بعدی کیوت و بامزه بسازید، این پرامپت مخصوص شماست.
با این دستور می‌توانید هر شخصیت دلخواه خودتان را به یک عروسک وینیل کارتونی تبدیل کنید.

📌 نمونه خروجی‌ها 👇
(همانند عکس‌های بالا: دزد دریایی، نینجا، کاراکتر فانتزی...)

---

📝 Prompt (برای کپی در ابزار تصویرسازی):

Chibi-style 3D vinyl toy of [subject], rendered in [color1] and [color2] tones,
front-facing on a white background. Minimalist composition with soft shadows,
oversized head and tiny body proportions, clean OC renderer output in Cinema 4D.

✨ کافیست به‌جای [subject] نام شخصیت (مثل pirate یا ninja)
و به‌جای [color1] و [color2] رنگ‌های دلخواه خودتان (مثل blue و gold) را وارد کنید.

👾 نتیجه: یک عروسک سه‌بعدی با استایل چیبی (سر بزرگ، بدن کوچک) روی پس‌زمینه سفید و با نورپردازی نرم.

---

#Prompt #VinylToy #3D #AIart

@rss_ai_ir

🎉13🔥11😁11👍8❤6

881 views04:58

About

Blog

Apps

Platform