❓ در سیستمهای بینایی ماشین مبتنی بر Stereo Vision، عمق هر نقطه در صحنه چگونه محاسبه میشود؟
Anonymous Quiz
20%
با مقایسه تغییر شدت روشنایی بین دو تصویر
65%
با محاسبه اختلاف مکان متناظر یک نقطه در تصاویر چپ و راست و استفاده از فاصله بین دو دوربین
10%
با اندازهگیری مستقیم زمان رفت و برگشت نور (Time of Flight)
5%
با افزایش وضوح تصویر و کاهش نویز
😁7🔥6🎉6❤4👍4
This media is not supported in your browser
VIEW IN TELEGRAM
🌍 ویژگی Video Overviews در NotebookLM حالا روی ۸۰ زبان فعال شد
📑 با این قابلیت میتوانید یادداشتها، فایلهای PDF و تصاویر خود را به ویدیوهای خلاصهسازی شده با صداگذاری روی هر زبانی (از جمله فارسی) تبدیل کنید.
🎧 علاوه بر آن، Audio Overviews هم آپدیت شدند: قبلاً فقط به انگلیسی خلاصههای کامل ساخته میشد، اما حالا روی تمام ۸۰ زبان در دسترس هستند.
🔗 جزئیات بیشتر: notebooklm.google
#هوش_مصنوعی #گوگل #NotebookLM #چندرسانهای #AI
@rss_ai_ir
📑 با این قابلیت میتوانید یادداشتها، فایلهای PDF و تصاویر خود را به ویدیوهای خلاصهسازی شده با صداگذاری روی هر زبانی (از جمله فارسی) تبدیل کنید.
🎧 علاوه بر آن، Audio Overviews هم آپدیت شدند: قبلاً فقط به انگلیسی خلاصههای کامل ساخته میشد، اما حالا روی تمام ۸۰ زبان در دسترس هستند.
🔗 جزئیات بیشتر: notebooklm.google
#هوش_مصنوعی #گوگل #NotebookLM #چندرسانهای #AI
@rss_ai_ir
❤13👍7🔥4😁3🎉2👏1
✖️ چرا بعضی پروژههای صنعتی هوش مصنوعی شکست میخورند یا بلااستفاده میمانند؟
خیلی از کارخانهها و شرکتها سراغ هوش مصنوعی میروند، اما بعد از مدتی پروژهها یا به نتیجه نمیرسند یا در گوشهای خاک میخورند. دلایل اصلی این موضوع معمولاً تکراری و شناختهشدهاند:
1️⃣ تعریف نامشخص مسأله صنعتی
پروژه از همان ابتدا به زبان الگوریتم تعریف میشود، نه به زبان مشکل واقعی خط تولید. نتیجه؟ الگوریتم هست، ولی درد صنعت درمان نمیشود.
2️⃣ کمبود داده یا کیفیت پایین دادهها
خیلی وقتها پروژه با دیتای ناقص یا بدون استراتژی جمعآوری داده شروع میشود. مدل آموزش میبیند، اما در محیط واقعی جواب نمیدهد.
3️⃣ نبود پشتیبانی مدیریتی
اگر مدیران ارشد باور نداشته باشند و صرفاً پروژه برای پرستیژ راه بیفتد، بعد از مدتی بودجه و انگیزه قطع میشود.
4️⃣ عدم ادغام با فرآیند موجود
مدل آماده میشود، اما با نرمافزارها، ماشینآلات و جریان کاری کارخانه ادغام نمیشود. خروجی روی کاغذ عالی است، ولی کسی در خط تولید استفادهاش نمیکند.
5️⃣ نگاه صرفاً تحقیقاتی و نه عملیاتی
تیم پروژه بیشتر روی مقاله و دقت الگوریتم تمرکز میکند تا KPI واقعی مثل کاهش ضایعات یا افزایش بهرهوری.
---
✅ مثال واقعی:
در یک کارخانه فلزی، سیستم بینایی ماشین برای شناسایی ترکهای سطحی ساخته شد. مدل روی دیتای تست ۹۵٪ دقت داشت، اما چون دوربینها درست کالیبره نشده بودند و اپراتورها آموزش ندیده بودند، سیستم کنار گذاشته شد.
📌 نتیجهگیری:
موفقیت پروژههای AI صنعتی فقط به مدل خوب بستگی ندارد. داده، ادغام با فرآیند، پذیرش انسانی و پشتیبانی مدیریتی چهار ستون اصلی هستند. اگر یکی از اینها بلنگد، پروژه به شکست میرسد.
#هوش_مصنوعی #صنعت #مدیریت #AI #DigitalTransformation
@rss_ai_ir
خیلی از کارخانهها و شرکتها سراغ هوش مصنوعی میروند، اما بعد از مدتی پروژهها یا به نتیجه نمیرسند یا در گوشهای خاک میخورند. دلایل اصلی این موضوع معمولاً تکراری و شناختهشدهاند:
1️⃣ تعریف نامشخص مسأله صنعتی
پروژه از همان ابتدا به زبان الگوریتم تعریف میشود، نه به زبان مشکل واقعی خط تولید. نتیجه؟ الگوریتم هست، ولی درد صنعت درمان نمیشود.
2️⃣ کمبود داده یا کیفیت پایین دادهها
خیلی وقتها پروژه با دیتای ناقص یا بدون استراتژی جمعآوری داده شروع میشود. مدل آموزش میبیند، اما در محیط واقعی جواب نمیدهد.
3️⃣ نبود پشتیبانی مدیریتی
اگر مدیران ارشد باور نداشته باشند و صرفاً پروژه برای پرستیژ راه بیفتد، بعد از مدتی بودجه و انگیزه قطع میشود.
4️⃣ عدم ادغام با فرآیند موجود
مدل آماده میشود، اما با نرمافزارها، ماشینآلات و جریان کاری کارخانه ادغام نمیشود. خروجی روی کاغذ عالی است، ولی کسی در خط تولید استفادهاش نمیکند.
5️⃣ نگاه صرفاً تحقیقاتی و نه عملیاتی
تیم پروژه بیشتر روی مقاله و دقت الگوریتم تمرکز میکند تا KPI واقعی مثل کاهش ضایعات یا افزایش بهرهوری.
---
✅ مثال واقعی:
در یک کارخانه فلزی، سیستم بینایی ماشین برای شناسایی ترکهای سطحی ساخته شد. مدل روی دیتای تست ۹۵٪ دقت داشت، اما چون دوربینها درست کالیبره نشده بودند و اپراتورها آموزش ندیده بودند، سیستم کنار گذاشته شد.
📌 نتیجهگیری:
موفقیت پروژههای AI صنعتی فقط به مدل خوب بستگی ندارد. داده، ادغام با فرآیند، پذیرش انسانی و پشتیبانی مدیریتی چهار ستون اصلی هستند. اگر یکی از اینها بلنگد، پروژه به شکست میرسد.
#هوش_مصنوعی #صنعت #مدیریت #AI #DigitalTransformation
@rss_ai_ir
❤10😁6👍4🔥3🎉3
⚠️ اپل به فکر استفاده از Gemini برای سیری — تغییر مسیر یا اعتراف به ضعف؟
گزارشها میگویند اپل در حال مذاکره اولیه با گوگل است تا نسخه جدید سیری را با یک مدل سفارشی از Gemini تقویت کند. این تغییر مسیر برای شرکتی که همیشه روی توسعه داخلی تأکید داشته، اتفاق بزرگی است.
🔹 چالش اصلی: ساخت سیری هوشمندتر که واقعاً بافت مکالمه را بفهمد و بتواند وظایف چندمرحلهای پیچیده را مدیریت کند — چیزی که سیری سالها از رقبایش عقب مانده.
🔹 پروژه بازطراحی سیری به ۲۰۲۶ موکول شده و حالا اپل دنبال تزریق توان AI بیرونی است.
🔹 اپل یک رقابت داخلی یا بهاصطلاح bake-off راه انداخته: مدلهای خودش (Linwood) در برابر تکنولوژیهای بیرونی (Glenwood، Gemini، Claude و ChatGPT).
🔹 واکنش بازار سریع بود: سهام گوگل بین ۳ تا ۳.۷٪ و سهام اپل بین ۱.۴ تا ۱.۶٪ رشد کرد؛ سرمایهگذاران معتقدند این همکاری میتواند فاصله اپل در حوزه GenAI را جبران کند.
📌 اگر اپل بهطور کامل به سراغ Gemini برود، این فقط یک همکاری ساده نیست — بلکه اعتراف علنی است به اینکه سیری بهتنهایی نمیتواند رقابت کند.
#هوش_مصنوعی #اپل #گوگل #Gemini #Siri #AI
@rss_ai_ir
گزارشها میگویند اپل در حال مذاکره اولیه با گوگل است تا نسخه جدید سیری را با یک مدل سفارشی از Gemini تقویت کند. این تغییر مسیر برای شرکتی که همیشه روی توسعه داخلی تأکید داشته، اتفاق بزرگی است.
🔹 چالش اصلی: ساخت سیری هوشمندتر که واقعاً بافت مکالمه را بفهمد و بتواند وظایف چندمرحلهای پیچیده را مدیریت کند — چیزی که سیری سالها از رقبایش عقب مانده.
🔹 پروژه بازطراحی سیری به ۲۰۲۶ موکول شده و حالا اپل دنبال تزریق توان AI بیرونی است.
🔹 اپل یک رقابت داخلی یا بهاصطلاح bake-off راه انداخته: مدلهای خودش (Linwood) در برابر تکنولوژیهای بیرونی (Glenwood، Gemini، Claude و ChatGPT).
🔹 واکنش بازار سریع بود: سهام گوگل بین ۳ تا ۳.۷٪ و سهام اپل بین ۱.۴ تا ۱.۶٪ رشد کرد؛ سرمایهگذاران معتقدند این همکاری میتواند فاصله اپل در حوزه GenAI را جبران کند.
📌 اگر اپل بهطور کامل به سراغ Gemini برود، این فقط یک همکاری ساده نیست — بلکه اعتراف علنی است به اینکه سیری بهتنهایی نمیتواند رقابت کند.
#هوش_مصنوعی #اپل #گوگل #Gemini #Siri #AI
@rss_ai_ir
🔥9❤4😁4🎉4👍3
⚠️ عبارت RefusalBench: وقتی مدلها به سؤالات خطرناک پاسخ میدهند
✅مؤسسهی Nous Research یک بنچمارک جدید معرفی کرده به نام RefusalBench که بررسی میکند مدلهای زبانی چقدر حاضر هستند به سؤالاتی پاسخ بدهند که معمولاً غیرایمن و نامناسب محسوب میشوند (مثل ساخت مواد منفجره یا دستورالعملهای خطرناک).
📊 نتایج جالب بود:
♻️مدل Hermes 4 در صدر قرار گرفت (≈60٪ پاسخدهی).
♻️همچنین Grok-4 ایلان ماسک هم بیش از 50٪ جواب داده.
♻️اما مدلهای OpenAI مثل GPT-5 و GPT-OSS پایینترین سطح پاسخدهی را داشتند (≈5–11٪).
🔑 این یعنی OpenAI واقعاً روی AI Safety حساس است و برخلاف بعضی انتقادها، جلوی پاسخهای پرریسک را میگیرد. حتی همزمان مسابقهای با جایزه ۵۰۰ هزار دلاری برای پیدا کردن روشهای دور زدن مکانیزمهای ایمنی برگزار کردهاند.
📌 در مقابل، خروج ایگور بابوشکین (همبنیانگذار سابق xAI) هم بیارتباط با نگرانیهای امنیتی Grok نیست.
⚖️ برداشت کلی:
✅اگر دنبال آزادی مطلق در پاسخها باشید، Grok و Hermes بیشتر جواب میدهند.
✅اما اگر امنیت و انطباق مهم باشد، OpenAI عملاً سختگیرترین گزینه است.
#هوش_مصنوعی #AI_Safety #مدل_زبانی #Grok #GPT5 #Hermes
✅مؤسسهی Nous Research یک بنچمارک جدید معرفی کرده به نام RefusalBench که بررسی میکند مدلهای زبانی چقدر حاضر هستند به سؤالاتی پاسخ بدهند که معمولاً غیرایمن و نامناسب محسوب میشوند (مثل ساخت مواد منفجره یا دستورالعملهای خطرناک).
📊 نتایج جالب بود:
♻️مدل Hermes 4 در صدر قرار گرفت (≈60٪ پاسخدهی).
♻️همچنین Grok-4 ایلان ماسک هم بیش از 50٪ جواب داده.
♻️اما مدلهای OpenAI مثل GPT-5 و GPT-OSS پایینترین سطح پاسخدهی را داشتند (≈5–11٪).
🔑 این یعنی OpenAI واقعاً روی AI Safety حساس است و برخلاف بعضی انتقادها، جلوی پاسخهای پرریسک را میگیرد. حتی همزمان مسابقهای با جایزه ۵۰۰ هزار دلاری برای پیدا کردن روشهای دور زدن مکانیزمهای ایمنی برگزار کردهاند.
📌 در مقابل، خروج ایگور بابوشکین (همبنیانگذار سابق xAI) هم بیارتباط با نگرانیهای امنیتی Grok نیست.
⚖️ برداشت کلی:
✅اگر دنبال آزادی مطلق در پاسخها باشید، Grok و Hermes بیشتر جواب میدهند.
✅اما اگر امنیت و انطباق مهم باشد، OpenAI عملاً سختگیرترین گزینه است.
#هوش_مصنوعی #AI_Safety #مدل_زبانی #Grok #GPT5 #Hermes
👍7🔥6😁5❤4🎉4
📌 کاربردهای جالب Gemini-2.5-Flash-Image-Preview
♻️مدل جدید گوگل یعنی Gemini-2.5-Flash-Image-Preview حالا در Google AI Studio قابل استفاده است و میتوان با آن اپلیکیشنهای خلاقانهای ساخت.
🔹 چند نمونه کاربرد:
✏️ قابلیت Gemini Co-Drawing: مدل میتواند یک دیاگرام دستنویس را بخواند، محاسبات لازم را انجام دهد و طبق دستور، ویرایشهای پیچیده روی شکل انجام دهد.
📊 تحلیل نمودارها و تصاویر همراه با توضیح و محاسبات
🎨 ویرایش ترکیبی متن + تصویر برای طراحی سریع پروتوتایپها
🧮 حل مسائل ریاضی از روی شکلهای ترسیمشده
👨🏫 کمک در آموزش بصری، مثل اصلاح نقشههای درسی یا دیاگرامهای علمی
🔗 نمونه اپلیکیشنها:
Google AI Studio Apps
🔗 جزئیات فنی و قیمت:
Google Developer Blog
#هوش_مصنوعی #Gemini #مولتیمودال #پردازش_تصویر #گوگل
♻️مدل جدید گوگل یعنی Gemini-2.5-Flash-Image-Preview حالا در Google AI Studio قابل استفاده است و میتوان با آن اپلیکیشنهای خلاقانهای ساخت.
🔹 چند نمونه کاربرد:
✏️ قابلیت Gemini Co-Drawing: مدل میتواند یک دیاگرام دستنویس را بخواند، محاسبات لازم را انجام دهد و طبق دستور، ویرایشهای پیچیده روی شکل انجام دهد.
📊 تحلیل نمودارها و تصاویر همراه با توضیح و محاسبات
🎨 ویرایش ترکیبی متن + تصویر برای طراحی سریع پروتوتایپها
🧮 حل مسائل ریاضی از روی شکلهای ترسیمشده
👨🏫 کمک در آموزش بصری، مثل اصلاح نقشههای درسی یا دیاگرامهای علمی
🔗 نمونه اپلیکیشنها:
Google AI Studio Apps
🔗 جزئیات فنی و قیمت:
Google Developer Blog
#هوش_مصنوعی #Gemini #مولتیمودال #پردازش_تصویر #گوگل
🎉8🔥7❤5👍3😁1
🔵 همکاری متا با Midjourney؛ لایسنس فناوری برای مدلها و محصولات آینده
پس از جذب استعدادهای برتر و توسعه زیرساخت محاسباتی عظیم، حالا متا وارد فاز جدیدی شده: شراکت با بهترین شرکتهای دنیا برای تقویت سبد AI خود.
اینبار نوبت به Midjourney رسید؛ همکاریای که میتواند کیفیت تولید محتوای تصویری و ویدیویی متا را متحول کند — از آواتارها و اینفلوئنسرهای دیجیتال گرفته تا محتوای شخصیسازیشده برای شبکههای اجتماعی.
❓سؤال بزرگ: شرکت بعدی که متا سراغش میرود کدام است؟ 🤔
@rss_ai_ir
#هوش_مصنوعی #متا #Midjourney #AI #تولید_محتوا
پس از جذب استعدادهای برتر و توسعه زیرساخت محاسباتی عظیم، حالا متا وارد فاز جدیدی شده: شراکت با بهترین شرکتهای دنیا برای تقویت سبد AI خود.
اینبار نوبت به Midjourney رسید؛ همکاریای که میتواند کیفیت تولید محتوای تصویری و ویدیویی متا را متحول کند — از آواتارها و اینفلوئنسرهای دیجیتال گرفته تا محتوای شخصیسازیشده برای شبکههای اجتماعی.
❓سؤال بزرگ: شرکت بعدی که متا سراغش میرود کدام است؟ 🤔
@rss_ai_ir
#هوش_مصنوعی #متا #Midjourney #AI #تولید_محتوا
🎉7😁6🔥5❤4👍2
This media is not supported in your browser
VIEW IN TELEGRAM
🟣 کلود در مرورگر کروم
شرکت Anthropic شروع به تست نسخه آزمایشی Claude for Chrome کرده است. این ابزار به کاربران اجازه میدهد کارهای روزمره خود را در مرورگر (مثل خرید بلیت، پر کردن فرمها، ثبت سفارشها و …) مستقیماً به کلاود بسپارند.
🔹 نکات کلیدی:
♻️در حال حاضر تست فقط برای ۱۰۰۰ کاربر Claude Max فعال شده است.
♻️عملکرد مشابه Computer Use است، اما تمرکز اصلی روی امنیت و کنترل بیشتر کاربر قرار دارد.
♻️هدف: تبدیل Claude به یک دستیار مرورگری مطمئن و کارآمد.
🔗 جزئیات بیشتر: Anthropic News
#Claude #Anthropic #هوش_مصنوعی #مرورگر #کروم
@rss_ai_ir
شرکت Anthropic شروع به تست نسخه آزمایشی Claude for Chrome کرده است. این ابزار به کاربران اجازه میدهد کارهای روزمره خود را در مرورگر (مثل خرید بلیت، پر کردن فرمها، ثبت سفارشها و …) مستقیماً به کلاود بسپارند.
🔹 نکات کلیدی:
♻️در حال حاضر تست فقط برای ۱۰۰۰ کاربر Claude Max فعال شده است.
♻️عملکرد مشابه Computer Use است، اما تمرکز اصلی روی امنیت و کنترل بیشتر کاربر قرار دارد.
♻️هدف: تبدیل Claude به یک دستیار مرورگری مطمئن و کارآمد.
🔗 جزئیات بیشتر: Anthropic News
#Claude #Anthropic #هوش_مصنوعی #مرورگر #کروم
@rss_ai_ir
👍8😁6🎉6🔥3❤2
⚡️ انویدیا نسل جدید پلتفرمهای محاسباتی برای رباتیک را معرفی کرد — Jetson Thor
🔹 این سیستم بهعنوان «مغز» ماشینهای خودمختار معرفی شده که توانایی کار در دنیای واقعی رو دارن. قیمت این راهکارها از ۲۵۰۰ دلار شروع میشه.
🔸 در این رونمایی، علاوه بر کیت توسعه Jetson AGX Thor، ماژولهای محاسباتی T5000 و T4000 هم معرفی شدن. طبق گفته انویدیا، این پلتفرمها پایهی «هوش مصنوعی فیزیکی» در حوزههایی مثل تولید، لجستیک، سلامت و خردهفروشی خواهند بود.
🔹 جنسن هوانگ، مدیرعامل انویدیا، تأکید کرد که Jetson Thor با کارایی بالا و بهرهوری انرژی طراحی شده تا میلیونها توسعهدهنده بتونن رباتهایی بسازن که با جهان فیزیکی تعامل مستقیم دارن. مهمترین ویژگی این نسل، امکان اجرای محلی چندین مدل مولد هوش مصنوعی به صورت همزمانه.
📌 مشخصات فنی اصلی
🟧 مبتنی بر معماری Blackwell، با پردازنده ۱۴ هستهای Arm، GPU با ۲۵۶۰ هسته CUDA و ۱۲۸ گیگابایت حافظه. توان محاسباتی: ۲۰۷۰ TFLOPS با مصرف انرژی حداکثر ۱۳۰ وات (۷.۵ برابر قویتر از نسل قبل، Jetson Orin).
🟧 ماژول Jetson T4000: نسخه اقتصادیتر با پردازنده ۱۲ هستهای، GPU با ۱۵۳۶ هسته CUDA و ۶۴ گیگابایت حافظه. توان محاسباتی: ۱۲۰۰ TFLOPS.
این پلتفرم دادههای سنسورها رو در لحظه پردازش میکنه و به رباتها توانایی درک سریع محیط و واکنش بیدرنگ میده. همچنین بهطور کامل با استکهای نرمافزاری کلیدی انویدیا مثل Isaac، GR00T، Metropolis و Holoscan یکپارچه شده.
شرکتهای بزرگی مثل Boston Dynamics، Amazon Robotics، Figure و Medtronic هماکنون از این فناوری پشتیبانی میکنن.
#هوش_مصنوعی #رباتیک #NVIDIA #JetsonThor #AI_industrial
@rss_ai_ir
🔹 این سیستم بهعنوان «مغز» ماشینهای خودمختار معرفی شده که توانایی کار در دنیای واقعی رو دارن. قیمت این راهکارها از ۲۵۰۰ دلار شروع میشه.
🔸 در این رونمایی، علاوه بر کیت توسعه Jetson AGX Thor، ماژولهای محاسباتی T5000 و T4000 هم معرفی شدن. طبق گفته انویدیا، این پلتفرمها پایهی «هوش مصنوعی فیزیکی» در حوزههایی مثل تولید، لجستیک، سلامت و خردهفروشی خواهند بود.
🔹 جنسن هوانگ، مدیرعامل انویدیا، تأکید کرد که Jetson Thor با کارایی بالا و بهرهوری انرژی طراحی شده تا میلیونها توسعهدهنده بتونن رباتهایی بسازن که با جهان فیزیکی تعامل مستقیم دارن. مهمترین ویژگی این نسل، امکان اجرای محلی چندین مدل مولد هوش مصنوعی به صورت همزمانه.
📌 مشخصات فنی اصلی
🟧 مبتنی بر معماری Blackwell، با پردازنده ۱۴ هستهای Arm، GPU با ۲۵۶۰ هسته CUDA و ۱۲۸ گیگابایت حافظه. توان محاسباتی: ۲۰۷۰ TFLOPS با مصرف انرژی حداکثر ۱۳۰ وات (۷.۵ برابر قویتر از نسل قبل، Jetson Orin).
🟧 ماژول Jetson T4000: نسخه اقتصادیتر با پردازنده ۱۲ هستهای، GPU با ۱۵۳۶ هسته CUDA و ۶۴ گیگابایت حافظه. توان محاسباتی: ۱۲۰۰ TFLOPS.
این پلتفرم دادههای سنسورها رو در لحظه پردازش میکنه و به رباتها توانایی درک سریع محیط و واکنش بیدرنگ میده. همچنین بهطور کامل با استکهای نرمافزاری کلیدی انویدیا مثل Isaac، GR00T، Metropolis و Holoscan یکپارچه شده.
شرکتهای بزرگی مثل Boston Dynamics، Amazon Robotics، Figure و Medtronic هماکنون از این فناوری پشتیبانی میکنن.
#هوش_مصنوعی #رباتیک #NVIDIA #JetsonThor #AI_industrial
@rss_ai_ir
👍2🔥1👏1
🔥 انتشار دیتاست جدید VK-LSDV برای سیستمهای توصیهگر و ویدئوهای کوتاه
📊 جزئیات دیتاست:
♻️شامل ۴۰ میلیارد تعامل یکتا و ناشناس
♻️۲۰ میلیون آیتم محتوایی
♻️۱۰ میلیون کاربر
♻️بازهی زمانی: ژانویه تا ژوئن ۲۰۲۵
♻️دادهها: لایک، دیسلایک، اشتراکگذاری، مدتزمان تماشا، ریاکشنها، کانتکست پخش
🟢 فرصتها برای پژوهشگران و مهندسان:
♻️امکان سفارشیسازی نمونه داده متناسب با نیاز پروژه
♻️انتخاب روش نمونهگیری: تصادفی یا بر اساس محبوبیت
♻️قابلیت تطبیق حجم دیتاست با توان محاسباتی موجود
⚡️ چرا این مهم است؟
🟠 یکی از بزرگترین دیتاستهای باز در حوزه ویدئوهای کوتاه برای سیستمهای توصیهگر است.
🟠 به جای دادههای کوچک و مصنوعی، پژوهشگران میتوانند روی دادههای واقعی و باکیفیت مدل بسازند و تست کنند.
🟠 گام مهمی در ایجاد یک محیط پژوهشی کامل برای توسعه الگوریتمهای شخصیسازی و تست فرضیات است.
این منبع میتواند فرصتهای تازهای برای پژوهشگران و مهندسان در سراسر جهان ایجاد کند و استانداردهای توسعه سیستمهای توصیهگر را ارتقا دهد.
🟠 دیتاست در HuggingFace:
👉 https://huggingface.co/datasets/deepvk/VK-LSVD
#دیتاست #هوش_مصنوعی #سیستم_توصیه_گر #AI #RecommenderSystem #VK
@rss_ai_ir
📊 جزئیات دیتاست:
♻️شامل ۴۰ میلیارد تعامل یکتا و ناشناس
♻️۲۰ میلیون آیتم محتوایی
♻️۱۰ میلیون کاربر
♻️بازهی زمانی: ژانویه تا ژوئن ۲۰۲۵
♻️دادهها: لایک، دیسلایک، اشتراکگذاری، مدتزمان تماشا، ریاکشنها، کانتکست پخش
🟢 فرصتها برای پژوهشگران و مهندسان:
♻️امکان سفارشیسازی نمونه داده متناسب با نیاز پروژه
♻️انتخاب روش نمونهگیری: تصادفی یا بر اساس محبوبیت
♻️قابلیت تطبیق حجم دیتاست با توان محاسباتی موجود
⚡️ چرا این مهم است؟
🟠 یکی از بزرگترین دیتاستهای باز در حوزه ویدئوهای کوتاه برای سیستمهای توصیهگر است.
🟠 به جای دادههای کوچک و مصنوعی، پژوهشگران میتوانند روی دادههای واقعی و باکیفیت مدل بسازند و تست کنند.
🟠 گام مهمی در ایجاد یک محیط پژوهشی کامل برای توسعه الگوریتمهای شخصیسازی و تست فرضیات است.
این منبع میتواند فرصتهای تازهای برای پژوهشگران و مهندسان در سراسر جهان ایجاد کند و استانداردهای توسعه سیستمهای توصیهگر را ارتقا دهد.
🟠 دیتاست در HuggingFace:
👉 https://huggingface.co/datasets/deepvk/VK-LSVD
#دیتاست #هوش_مصنوعی #سیستم_توصیه_گر #AI #RecommenderSystem #VK
@rss_ai_ir
👍2🔥1👏1
⚠️ حمله ویروس PromptLock: وقتی بدافزار خودش فکر میکند
🔴 پژوهشگران ESET Research Labs از کشف نخستین ویروسی خبر دادهاند که به طور مستقیم از هوش مصنوعی استفاده میکند. این بدافزار با نام PromptLock شناخته میشود و توانایی آلودهسازی دستگاههای Windows، Linux و macOS را دارد.
❌ شیوه عملکرد:
✳️بدافزار شامل پرامپتهای از پیش تعریفشدهای است که به مدل هوش مصنوعی ارسال میشوند.
✳️مدل در لحظه اسکریپتهای Lua تولید میکند تا فایلسیستم را اسکن کند.
✳️دادهها یا به سرقت میروند یا با الگوریتمی رمزگذاری و قفل میشوند.
✳️هسته این بدافزار از مدل gpt-oss-20b (محصول تازه اوپناِیآی) قدرت میگیرد.
❌ وضعیت کنونی:
♻️کارشناسان معتقدند PromptLock هنوز در مراحل اولیه است.
♻️نشانهها: رمزنگاری ابتدایی و نبود برخی قابلیتها.
♻️انتشار گسترده تاکنون ثبت نشده است.
♻️در یکی از پرامپتها حتی آدرس بیتکوینی به نام ساتوشی ناکاموتو دیده شد، اما احتمالاً فقط یک «طعمه» موقت است.
⚡ این خبر نشان میدهد بدافزارهای آینده میتوانند با استفاده از هوش مصنوعی، تطبیقپذیرتر و خطرناکتر شوند.
#امنیت_سایبری #بدافزار #هوش_مصنوعی #AI_industrial_news #futuretech
@rss_ai_ir
🔴 پژوهشگران ESET Research Labs از کشف نخستین ویروسی خبر دادهاند که به طور مستقیم از هوش مصنوعی استفاده میکند. این بدافزار با نام PromptLock شناخته میشود و توانایی آلودهسازی دستگاههای Windows، Linux و macOS را دارد.
❌ شیوه عملکرد:
✳️بدافزار شامل پرامپتهای از پیش تعریفشدهای است که به مدل هوش مصنوعی ارسال میشوند.
✳️مدل در لحظه اسکریپتهای Lua تولید میکند تا فایلسیستم را اسکن کند.
✳️دادهها یا به سرقت میروند یا با الگوریتمی رمزگذاری و قفل میشوند.
✳️هسته این بدافزار از مدل gpt-oss-20b (محصول تازه اوپناِیآی) قدرت میگیرد.
❌ وضعیت کنونی:
♻️کارشناسان معتقدند PromptLock هنوز در مراحل اولیه است.
♻️نشانهها: رمزنگاری ابتدایی و نبود برخی قابلیتها.
♻️انتشار گسترده تاکنون ثبت نشده است.
♻️در یکی از پرامپتها حتی آدرس بیتکوینی به نام ساتوشی ناکاموتو دیده شد، اما احتمالاً فقط یک «طعمه» موقت است.
⚡ این خبر نشان میدهد بدافزارهای آینده میتوانند با استفاده از هوش مصنوعی، تطبیقپذیرتر و خطرناکتر شوند.
#امنیت_سایبری #بدافزار #هوش_مصنوعی #AI_industrial_news #futuretech
@rss_ai_ir
👍3🔥1👏1
Media is too big
VIEW IN TELEGRAM
🌟 مدل MiniCPM-V 4.5؛ رقیب جمعوجور غولهای چندمودالی
پروژه OpenBMB نسخه جدید MiniCPM-V 4.5 را معرفی کرد؛ مدلی چندمودالی بر پایه Qwen3-8B و SigLIP2-400M که توانایی درک تصویر، توالی تصاویر و ویدئو را دارد و حتی روی موبایل هم در بیش از ۳۰ زبان اجرا میشود.
این پروژه زیرمجموعه غیرتجاری شرکت ModelBest (زیر نظر دانشگاه Tsinghua چین) است. سرمایهگذاران ModelBest شامل هواوی (Habo)، Primavera Capital و صندوق دولتی Shenzhen Guozhong هستند.
---
🔑 ویژگی کلیدی: پردازش کارآمد ویدئو
✔️ استفاده از 3D-Resampler باعث فشردهسازی ۹۶ برابری ویدئو میشود: هر ۶ فریم در رزولوشن 448x448 فقط به ۶۴ توکن تبدیل میشوند (در حالی که اکثر MLLMها به 1536 توکن نیاز دارند).
✔️ این قابلیت امکان پردازش ویدئو با سرعت ۱۰ فریم بر ثانیه و کلیپهای طولانی را بدون افزایش هزینه محاسباتی فراهم میکند.
✔️ نتایج برتر روی دیتاستهای Video-MME، LVBench و MLVU تأییدکننده این کارایی است.
---
🖼 تواناییهای تصویری
با معماری LLaVA-UHD، مدل میتواند با تصاویر تا وضوح 1.8 مگاپیکسل و نسبت تصویر آزاد کار کند، آن هم با مصرف ۴ برابر کمتر توکنهای بصری.
---
⚡ انعطاف در استدلال
مدل دو حالت دارد:
Fast reasoning برای کارهای روزمره
Deep reasoning برای سناریوهای پیچیده
و کاربر میتواند بسته به نیاز بین آنها جابهجا شود.
---
📊 عملکرد
با داشتن ۸ میلیارد پارامتر، این مدل در بنچمارک OpenCompass امتیاز 77.0 کسب کرده؛ بالاتر از GPT-4o-latest و Gemini-2.0 Pro و حتی بهتر از مدل متنباز Qwen2.5-VL با ۷۲ میلیارد پارامتر. همچنین در OmniDocBench رکورد تازهای به نام خود ثبت کرده است.
---
💻 بدون مشکل در استقرار
♻️نسخه CPU با llama.cpp و ollama
♻️نسخههای کوانتیزه در فرمتهای int4، GGUF و AWQ
♻️پشتیبانی از SGLang و vLLM
♻️قابلیت Fine-tuning با Transformers و LLaMA-Factory
♻️رابط کاربری وب و اپ بهینهشده برای iOS
---
📌 لینکها
🟡 [Model]
🟡 [Demo]
🟡 [Community Discord]
🖥 [GitHub]
#هوش_مصنوعی #مدل_چندمودالی #MiniCPM #OpenBMB #MLLM #AI_industrial_news
@rss_ai_ir
پروژه OpenBMB نسخه جدید MiniCPM-V 4.5 را معرفی کرد؛ مدلی چندمودالی بر پایه Qwen3-8B و SigLIP2-400M که توانایی درک تصویر، توالی تصاویر و ویدئو را دارد و حتی روی موبایل هم در بیش از ۳۰ زبان اجرا میشود.
این پروژه زیرمجموعه غیرتجاری شرکت ModelBest (زیر نظر دانشگاه Tsinghua چین) است. سرمایهگذاران ModelBest شامل هواوی (Habo)، Primavera Capital و صندوق دولتی Shenzhen Guozhong هستند.
---
🔑 ویژگی کلیدی: پردازش کارآمد ویدئو
✔️ استفاده از 3D-Resampler باعث فشردهسازی ۹۶ برابری ویدئو میشود: هر ۶ فریم در رزولوشن 448x448 فقط به ۶۴ توکن تبدیل میشوند (در حالی که اکثر MLLMها به 1536 توکن نیاز دارند).
✔️ این قابلیت امکان پردازش ویدئو با سرعت ۱۰ فریم بر ثانیه و کلیپهای طولانی را بدون افزایش هزینه محاسباتی فراهم میکند.
✔️ نتایج برتر روی دیتاستهای Video-MME، LVBench و MLVU تأییدکننده این کارایی است.
---
🖼 تواناییهای تصویری
با معماری LLaVA-UHD، مدل میتواند با تصاویر تا وضوح 1.8 مگاپیکسل و نسبت تصویر آزاد کار کند، آن هم با مصرف ۴ برابر کمتر توکنهای بصری.
---
⚡ انعطاف در استدلال
مدل دو حالت دارد:
Fast reasoning برای کارهای روزمره
Deep reasoning برای سناریوهای پیچیده
و کاربر میتواند بسته به نیاز بین آنها جابهجا شود.
---
📊 عملکرد
با داشتن ۸ میلیارد پارامتر، این مدل در بنچمارک OpenCompass امتیاز 77.0 کسب کرده؛ بالاتر از GPT-4o-latest و Gemini-2.0 Pro و حتی بهتر از مدل متنباز Qwen2.5-VL با ۷۲ میلیارد پارامتر. همچنین در OmniDocBench رکورد تازهای به نام خود ثبت کرده است.
---
💻 بدون مشکل در استقرار
♻️نسخه CPU با llama.cpp و ollama
♻️نسخههای کوانتیزه در فرمتهای int4، GGUF و AWQ
♻️پشتیبانی از SGLang و vLLM
♻️قابلیت Fine-tuning با Transformers و LLaMA-Factory
♻️رابط کاربری وب و اپ بهینهشده برای iOS
---
📌 لینکها
🟡 [Model]
🟡 [Demo]
🟡 [Community Discord]
🖥 [GitHub]
#هوش_مصنوعی #مدل_چندمودالی #MiniCPM #OpenBMB #MLLM #AI_industrial_news
@rss_ai_ir
👍3👏1
🎨 پرامپت آماده: اسباببازی وینیل (Vinyl Toy)
🧸 اگر میخواهید فیگورهای سهبعدی کیوت و بامزه بسازید، این پرامپت مخصوص شماست.
با این دستور میتوانید هر شخصیت دلخواه خودتان را به یک عروسک وینیل کارتونی تبدیل کنید.
📌 نمونه خروجیها 👇
(همانند عکسهای بالا: دزد دریایی، نینجا، کاراکتر فانتزی...)
---
📝 Prompt (برای کپی در ابزار تصویرسازی):
✨ کافیست بهجای [subject] نام شخصیت (مثل pirate یا ninja)
و بهجای [color1] و [color2] رنگهای دلخواه خودتان (مثل blue و gold) را وارد کنید.
👾 نتیجه: یک عروسک سهبعدی با استایل چیبی (سر بزرگ، بدن کوچک) روی پسزمینه سفید و با نورپردازی نرم.
---
#Prompt #VinylToy #3D #AIart
@rss_ai_ir
🧸 اگر میخواهید فیگورهای سهبعدی کیوت و بامزه بسازید، این پرامپت مخصوص شماست.
با این دستور میتوانید هر شخصیت دلخواه خودتان را به یک عروسک وینیل کارتونی تبدیل کنید.
📌 نمونه خروجیها 👇
(همانند عکسهای بالا: دزد دریایی، نینجا، کاراکتر فانتزی...)
---
📝 Prompt (برای کپی در ابزار تصویرسازی):
Chibi-style 3D vinyl toy of [subject], rendered in [color1] and [color2] tones,
front-facing on a white background. Minimalist composition with soft shadows,
oversized head and tiny body proportions, clean OC renderer output in Cinema 4D.
✨ کافیست بهجای [subject] نام شخصیت (مثل pirate یا ninja)
و بهجای [color1] و [color2] رنگهای دلخواه خودتان (مثل blue و gold) را وارد کنید.
👾 نتیجه: یک عروسک سهبعدی با استایل چیبی (سر بزرگ، بدن کوچک) روی پسزمینه سفید و با نورپردازی نرم.
---
#Prompt #VinylToy #3D #AIart
@rss_ai_ir
🎉13🔥11😁11👍7❤6