🧠 مدل جدید برای تشخیص چهره جعلی (Anti-Spoofing)
در مقالهی InstructFLIP محققان به بررسی یک مدل Vision-Language Unified پرداختهاند که با کمک دستورالعملهای زبانی میتواند تصاویر چهره را تحلیل کرده و حملات جعلی (Spoofing) را تشخیص دهد!
📌 نکات کلیدی:
🔹 مدل چندوظیفهای با ادغام تصویر و زبان
🔹 قابل استفاده برای حملات چاپی، ویدیویی و ماسک سهبعدی
🔹 بدون نیاز به دادههای زیاد برای هر نوع حمله
📎 لینکها:
🔧 کد پروژه در گیتهاب
📄 مقاله در arXiv
📂 دیتاست Replay-Attack
👁🗨 آینده تشخیص چهره، هوشمندتر از همیشه...
@rss_ai_ir
در مقالهی InstructFLIP محققان به بررسی یک مدل Vision-Language Unified پرداختهاند که با کمک دستورالعملهای زبانی میتواند تصاویر چهره را تحلیل کرده و حملات جعلی (Spoofing) را تشخیص دهد!
📌 نکات کلیدی:
🔹 مدل چندوظیفهای با ادغام تصویر و زبان
🔹 قابل استفاده برای حملات چاپی، ویدیویی و ماسک سهبعدی
🔹 بدون نیاز به دادههای زیاد برای هر نوع حمله
📎 لینکها:
🔧 کد پروژه در گیتهاب
📄 مقاله در arXiv
📂 دیتاست Replay-Attack
👁🗨 آینده تشخیص چهره، هوشمندتر از همیشه...
@rss_ai_ir
👍2❤1🔥1👏1
🤖 رباتها در خردهفروشی چین: اولین فروشگاه ۶S رباتیک افتتاح شد!
در شهر شنژن چین، اولین فروشگاه کاملاً تخصصی رباتها به سبک 6S راهاندازی شده؛ مفهومی نوآورانه که شامل فروش، اجاره، تعمیر، خدمات پس از فروش، مشاوره و تجربه عملی با رباتهاست!
📦 در این فروشگاه چه میبینید؟
▪️ رباتهای صنعتی، پزشکی، آموزشی و خانگی
▪️ قطعات برای مونتاژ و ارتقاء
▪️ محصولات شرکتهای برتر چینی با تمرکز بر قیمت مناسب و فراگیری
🎯 هدف: تبدیل رباتها به ابزاری روزمره همانند گوشی یا وسایل خانگی.
🔧 بازدیدکنندگان میتوانند با رباتها تعامل واقعی داشته باشند، مشاوره بگیرند و جدیدترین فناوریها را تجربه کنند.
📍 آینده خردهفروشی، هوشمندتر از همیشه...
#هوش_مصنوعی #رباتیک #خرده_فروشی_هوشمند #تکنولوژی
@rss_ai_ir
در شهر شنژن چین، اولین فروشگاه کاملاً تخصصی رباتها به سبک 6S راهاندازی شده؛ مفهومی نوآورانه که شامل فروش، اجاره، تعمیر، خدمات پس از فروش، مشاوره و تجربه عملی با رباتهاست!
📦 در این فروشگاه چه میبینید؟
▪️ رباتهای صنعتی، پزشکی، آموزشی و خانگی
▪️ قطعات برای مونتاژ و ارتقاء
▪️ محصولات شرکتهای برتر چینی با تمرکز بر قیمت مناسب و فراگیری
🎯 هدف: تبدیل رباتها به ابزاری روزمره همانند گوشی یا وسایل خانگی.
🔧 بازدیدکنندگان میتوانند با رباتها تعامل واقعی داشته باشند، مشاوره بگیرند و جدیدترین فناوریها را تجربه کنند.
📍 آینده خردهفروشی، هوشمندتر از همیشه...
#هوش_مصنوعی #رباتیک #خرده_فروشی_هوشمند #تکنولوژی
@rss_ai_ir
👍2🔥2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 مایکروسافت یک بار دیگر قدرت دادههای مصنوعی را در بینایی کامپیوتر به رخ کشید!
♻️مدلهای بینایی کامپیوتر انسانمحور امروزی نیازمند میلیاردها پارامتر، دیتاستهای عظیم و هزینههای بالای استنتاج هستند. اما آیا میتوان بدون صرف میلیونها دلار به همان دقت رسید؟
🔍 پاسخ مثبت است:
پژوهشگران مایکروسافت نشان دادهاند که مدلها میتوانند فقط با دادههای مصنوعی با کیفیت بالا آموزش ببینند و دقیقاً همان نتایج را ارائه دهند!
🔧 پروژه DAViD: چارچوبی متنباز برای تولید انسانهای دیجیتال با هندسه و بافت چهره دقیق.
🧠 کاربردهای کلیدی: • پیشبینی عمق (Depth Prediction)
• برآورد زاویهی سطح (Normal Estimation)
• سگمنتسازی پسزمینه و انسانها در عکس/ویدیو
🌟 چرا مهم است؟ • داده مصنوعی = لیبلگذاری پیکسلی بینقص
• تنوع بیپایان از زاویه، نور، صحنه، ژست
• مقیاسپذیری عالی برای آموزش از صفر یا فاینتیون کردن
📦 مایکروسافت همه چیز را متنباز کرده:
✅ ۳۰۰٬۰۰۰ نمونه
✅ مدلهای از پیشآموزشدیده
✅ کد کامل فریمورک
🔗 لینکها:
🔸 وبسایت پروژه
📄 مقاله آکادمیک
💻 کد در گیتهاب
🚀 اگر در حوزه بینایی کامپیوتر انسانمحور فعالیت میکنید، این پروژه یک نقطه شروع قدرتمند است — حتی بدون داده واقعی.
@rss_ai_ir
#بینایی_کامپیوتر #مایکروسافت #داده_مصنوعی #CV #هوش_مصنوعی #متن_باز
♻️مدلهای بینایی کامپیوتر انسانمحور امروزی نیازمند میلیاردها پارامتر، دیتاستهای عظیم و هزینههای بالای استنتاج هستند. اما آیا میتوان بدون صرف میلیونها دلار به همان دقت رسید؟
🔍 پاسخ مثبت است:
پژوهشگران مایکروسافت نشان دادهاند که مدلها میتوانند فقط با دادههای مصنوعی با کیفیت بالا آموزش ببینند و دقیقاً همان نتایج را ارائه دهند!
🔧 پروژه DAViD: چارچوبی متنباز برای تولید انسانهای دیجیتال با هندسه و بافت چهره دقیق.
🧠 کاربردهای کلیدی: • پیشبینی عمق (Depth Prediction)
• برآورد زاویهی سطح (Normal Estimation)
• سگمنتسازی پسزمینه و انسانها در عکس/ویدیو
🌟 چرا مهم است؟ • داده مصنوعی = لیبلگذاری پیکسلی بینقص
• تنوع بیپایان از زاویه، نور، صحنه، ژست
• مقیاسپذیری عالی برای آموزش از صفر یا فاینتیون کردن
📦 مایکروسافت همه چیز را متنباز کرده:
✅ ۳۰۰٬۰۰۰ نمونه
✅ مدلهای از پیشآموزشدیده
✅ کد کامل فریمورک
🔗 لینکها:
🔸 وبسایت پروژه
📄 مقاله آکادمیک
💻 کد در گیتهاب
🚀 اگر در حوزه بینایی کامپیوتر انسانمحور فعالیت میکنید، این پروژه یک نقطه شروع قدرتمند است — حتی بدون داده واقعی.
@rss_ai_ir
#بینایی_کامپیوتر #مایکروسافت #داده_مصنوعی #CV #هوش_مصنوعی #متن_باز
🔥4❤1👍1👏1
❓ در یک سامانه رباتیک بازوی صنعتی، کدامیک از گزینههای زیر مهمترین عامل در کنترل دقیق موقعیت انتهای بازو (End-Effector) است؟
Anonymous Quiz
26%
تعداد مفاصل و طول هر بخش از بازو
26%
نوع سنسور مجاورت استفادهشده در محیط
11%
دقت دوربین مورد استفاده در سیستم بینایی
37%
الگوریتم معکوس سینماتیک (Inverse Kinematics) برای محاسبه زاویه مفاصل
👍1🔥1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
😎 وقتی با این همه علم هوش مصنوعی از سر کار برمیگردی، حس میکنی یه ابرقهرمان دیجیتالی هستی!
🕺 هوش مصنوعی روی شونهت
🎧 پرامپتها توی ذهنت
💻 و کلی پروژه توی لپتاپت!
📍 @rss_ai_ir
#زندگی_با_AI #حس_خفن #مهندس_هوش_مصنوعی #techvibes
🕺 هوش مصنوعی روی شونهت
🎧 پرامپتها توی ذهنت
💻 و کلی پروژه توی لپتاپت!
📍 @rss_ai_ir
#زندگی_با_AI #حس_خفن #مهندس_هوش_مصنوعی #techvibes
😁2👍1🕊1
💠 نسل جدید داراییهای سهبعدی با ویژگیهای فیزیکی واقعی PhysX‑3D:
✅داده بساز، رفتار فیزیکی شبیهسازی کن، مدل سهبعدی واقعی بساز.
---
🧠 پروژه PhysX-3D یک انقلاب در تولید آبجکتهای سهبعدی است. این سیستم نه فقط شکل ظاهری، بلکه خواص فیزیکی هر شی (مثل جرم، جنس، حرکتپذیری و...) را نیز تولید میکند.
📊 آنالیز دیتاست PhysXNet + PhysXNet-XL:
📌 توزیع اجزای مدلها (شکل a):
اکثر آبجکتها بین 1 تا 20 جزء دارند، که نشاندهنده طراحی ساده و کاربردی است.
📌 ابعاد فیزیکی واقعی (شکل b):
بیشتر اشیا اندازهای بین 50 تا 200 سانتیمتر دارند؛ بسیار مناسب برای کاربردهای واقعگرایانه مثل متاورس، AR/VR یا رباتها.
📌 نوع حرکات و مفاصل (شکل c - چپ):
بیش از ۴۰٪ اشیا دارای مفصل لغزنده (Prismatic) و ۳۷٪ بدون محدودیت حرکتیاند؛ یعنی تنوع بالایی در رفتار حرکتی دارند.
📌 خواص فیزیکی مواد (شکل c - میانی و راست):
* مدول یانگ (سختی ماده) بیشتر بین 2 تا 4 و 3 تا 10 است.
* نسبت پواسون غالباً 0.25 تا 0.3
* چگالی رایج بین 1 تا 2.5 g/cm³
📌 توزیع موضوعی دادهها (شکل d):
ابر کلمات نشان میدهد بیشترین آبجکتها شامل:
📌 PhysXNet-XL (شکل e)
نسخه بزرگتر دیتاست با تولید رویهای، که بیش از ۵۳٪ آن شامل cabinet و ۲۹٪ شامل table است؛ تمرکز روی کاربردهای indoor.
---
🎯 این آمار نشون میده که:
* دیتاست بسیار گسترده و تنوعپذیر طراحی شده.
* ویژگیهای فیزیکی کاملاً قابل کنترل و واقعیاند.
* کاربرد در رباتیک، بازیسازی، شبیهسازهای صنعتی و آموزش مدلهای فیزیکمحور بسیار بالاست.
🖥 Github: https://github.com/ziangcao0312/PhysX-3D
📕 Paper: https://arxiv.org/pdf/2507.12465v1.pdf
🔗 Dataset: https://paperswithcode.com/dataset/shapenet
📌 برای پروژه کامل به پست قبل مراجعه کنید.
📡 بیشتر در:
@rss_ai_ir
#PhysX #3DVision #هوش_مصنوعی #Simulation #فیزیک #مدل_سهبعدی #AI_3D
✅داده بساز، رفتار فیزیکی شبیهسازی کن، مدل سهبعدی واقعی بساز.
---
🧠 پروژه PhysX-3D یک انقلاب در تولید آبجکتهای سهبعدی است. این سیستم نه فقط شکل ظاهری، بلکه خواص فیزیکی هر شی (مثل جرم، جنس، حرکتپذیری و...) را نیز تولید میکند.
📊 آنالیز دیتاست PhysXNet + PhysXNet-XL:
📌 توزیع اجزای مدلها (شکل a):
اکثر آبجکتها بین 1 تا 20 جزء دارند، که نشاندهنده طراحی ساده و کاربردی است.
📌 ابعاد فیزیکی واقعی (شکل b):
بیشتر اشیا اندازهای بین 50 تا 200 سانتیمتر دارند؛ بسیار مناسب برای کاربردهای واقعگرایانه مثل متاورس، AR/VR یا رباتها.
📌 نوع حرکات و مفاصل (شکل c - چپ):
بیش از ۴۰٪ اشیا دارای مفصل لغزنده (Prismatic) و ۳۷٪ بدون محدودیت حرکتیاند؛ یعنی تنوع بالایی در رفتار حرکتی دارند.
📌 خواص فیزیکی مواد (شکل c - میانی و راست):
* مدول یانگ (سختی ماده) بیشتر بین 2 تا 4 و 3 تا 10 است.
* نسبت پواسون غالباً 0.25 تا 0.3
* چگالی رایج بین 1 تا 2.5 g/cm³
📌 توزیع موضوعی دادهها (شکل d):
ابر کلمات نشان میدهد بیشترین آبجکتها شامل:
Furniture
, Table
, Chair
, Lamp
, Lighting
, Cabinet
هستند.📌 PhysXNet-XL (شکل e)
نسخه بزرگتر دیتاست با تولید رویهای، که بیش از ۵۳٪ آن شامل cabinet و ۲۹٪ شامل table است؛ تمرکز روی کاربردهای indoor.
---
🎯 این آمار نشون میده که:
* دیتاست بسیار گسترده و تنوعپذیر طراحی شده.
* ویژگیهای فیزیکی کاملاً قابل کنترل و واقعیاند.
* کاربرد در رباتیک، بازیسازی، شبیهسازهای صنعتی و آموزش مدلهای فیزیکمحور بسیار بالاست.
🔗 Dataset: https://paperswithcode.com/dataset/shapenet
📌 برای پروژه کامل به پست قبل مراجعه کنید.
📡 بیشتر در:
@rss_ai_ir
#PhysX #3DVision #هوش_مصنوعی #Simulation #فیزیک #مدل_سهبعدی #AI_3D
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🧠⌚ سنسورالام (SensorLM)؛ ساعتی که شما را مثل کتاب میخواند!
گوگل با استفاده از حدود ۶۰ میلیون ساعت داده ناشناس از ساعتهای هوشمند فیتبیت و پیکسل واچ، مدلی توسعه داده که قادر است اطلاعات خامی مثل ضربان قلب، تعداد قدمها و دمای بدن را به زبان طبیعی تبدیل کند.
📌 بهجای نمایش نمودارهای خشک، این مدل جملاتی مانند این تولید میکند:
«بعد از نوشیدن دومین فنجان قهوه، سطح استرس افزایش یافت، اما یک پیادهروی ۱۵ دقیقهای شما را به تعادل برگرداند.»
📊 روش کار تیم گوگل به این صورت بود:
۱. ساخت دیتاست عظیم شامل ۲.۵ میلیون روز فعالیت انسانی از ۱۲۷ کشور
۲. ایجاد برچسبگذاری چندلایه برای هر روز:
آمار: «پالس بین ۵۴ تا ۱۷۸، میانگین ۷۲»
ساختار: «افزایش تدریجی ضربان از ساعت ۱۱ تا ۱۲ ظهر»
معنا: «تمرین قدرتی به مدت ۲۶ دقیقه»
۳. آموزش ترنسفورمر چندوجهی با دو هدف:
مقایسه بین دادهی سنسور و متن (مثل مدل کلیپ)
تولید توضیح متنی (مثل مدل کوکا)
🚀 تواناییهای این مدل شامل موارد زیر است:
✔️ شناسایی دقیق فعالیت و استرس بدون نیاز به آموزش مجدد
✔️ پاسخ به درخواستهایی مانند «چه زمانی استرسم بالا بود؟» با بازههای زمانی دقیق
✔️ تطبیق با سبک زندگی کاربر تنها با چند نمونه
📌 مدل SensorLM، دادههای سنسوری دقیقهای را به زبان انسانی تبدیل میکند؛ حرکتی مهم برای از بین بردن شکاف میان دادهی خام و درک انسانی.
📄 مقاله: لینک
📎 بلاگ: لینک
📡 @rss_ai_ir
#سلامت_هوشمند #هوش_مصنوعی #گوگل #SensorLM #پوشیدنی #CLIP #CoCa #سلامت #AI
گوگل با استفاده از حدود ۶۰ میلیون ساعت داده ناشناس از ساعتهای هوشمند فیتبیت و پیکسل واچ، مدلی توسعه داده که قادر است اطلاعات خامی مثل ضربان قلب، تعداد قدمها و دمای بدن را به زبان طبیعی تبدیل کند.
📌 بهجای نمایش نمودارهای خشک، این مدل جملاتی مانند این تولید میکند:
«بعد از نوشیدن دومین فنجان قهوه، سطح استرس افزایش یافت، اما یک پیادهروی ۱۵ دقیقهای شما را به تعادل برگرداند.»
📊 روش کار تیم گوگل به این صورت بود:
۱. ساخت دیتاست عظیم شامل ۲.۵ میلیون روز فعالیت انسانی از ۱۲۷ کشور
۲. ایجاد برچسبگذاری چندلایه برای هر روز:
آمار: «پالس بین ۵۴ تا ۱۷۸، میانگین ۷۲»
ساختار: «افزایش تدریجی ضربان از ساعت ۱۱ تا ۱۲ ظهر»
معنا: «تمرین قدرتی به مدت ۲۶ دقیقه»
۳. آموزش ترنسفورمر چندوجهی با دو هدف:
مقایسه بین دادهی سنسور و متن (مثل مدل کلیپ)
تولید توضیح متنی (مثل مدل کوکا)
🚀 تواناییهای این مدل شامل موارد زیر است:
✔️ شناسایی دقیق فعالیت و استرس بدون نیاز به آموزش مجدد
✔️ پاسخ به درخواستهایی مانند «چه زمانی استرسم بالا بود؟» با بازههای زمانی دقیق
✔️ تطبیق با سبک زندگی کاربر تنها با چند نمونه
📌 مدل SensorLM، دادههای سنسوری دقیقهای را به زبان انسانی تبدیل میکند؛ حرکتی مهم برای از بین بردن شکاف میان دادهی خام و درک انسانی.
📄 مقاله: لینک
📎 بلاگ: لینک
📡 @rss_ai_ir
#سلامت_هوشمند #هوش_مصنوعی #گوگل #SensorLM #پوشیدنی #CLIP #CoCa #سلامت #AI
❤2👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥✨ مدل Aleph از Runway؛ فتوشاپی برای ویدیو، اما با جادوی هوش مصنوعی!
پلتفرم Runway بهتازگی از مدل Aleph رونمایی کرده؛ مدلی که میتوان آن را «فوتوشاپ برای ویدیو» نامید – البته فعلاً فقط برای ویدیوهای ۵ ثانیهای!
🧪 این مدل به کاربران اجازه میدهد تا:
🎭 چهرهها، اجسام و صحنهها را با دستورات متنی یا بصری تغییر دهند
🖌 بافت و استایل دلخواه را به کلیپها اضافه کنند
🪄 ویدیوها را فریم به فریم ادیت کنند، بدون نیاز به مهارت فنی در تدوین
🧠 از پایه برای ویرایش و بازسازی واقعگرایانه ویدیو طراحی شده؛ درست مثل یک مدل مولد قدرتمند که دنیای گرافیک را متحول میکند.
📎 اطلاعات بیشتر:
https://runwayml.com/research/introducing-runway-aleph
🧩 نتیجه؟ همانطور که Stable Diffusion عکاسی را تغییر داد، Aleph نیز آماده است تا تدوین ویدیو را متحول کند.
🎬 منتظر ویدیوهای خلاقانهتر، کوتاهتر و باحالتر از همیشه باشید!
📡 @rss_ai_ir
#ویدیو_هوشمند #runway #Aleph #هوش_مصنوعی #ویرایش_ویدیو #مدل_مولد #AI
پلتفرم Runway بهتازگی از مدل Aleph رونمایی کرده؛ مدلی که میتوان آن را «فوتوشاپ برای ویدیو» نامید – البته فعلاً فقط برای ویدیوهای ۵ ثانیهای!
🧪 این مدل به کاربران اجازه میدهد تا:
🎭 چهرهها، اجسام و صحنهها را با دستورات متنی یا بصری تغییر دهند
🖌 بافت و استایل دلخواه را به کلیپها اضافه کنند
🪄 ویدیوها را فریم به فریم ادیت کنند، بدون نیاز به مهارت فنی در تدوین
🧠 از پایه برای ویرایش و بازسازی واقعگرایانه ویدیو طراحی شده؛ درست مثل یک مدل مولد قدرتمند که دنیای گرافیک را متحول میکند.
📎 اطلاعات بیشتر:
https://runwayml.com/research/introducing-runway-aleph
🧩 نتیجه؟ همانطور که Stable Diffusion عکاسی را تغییر داد، Aleph نیز آماده است تا تدوین ویدیو را متحول کند.
🎬 منتظر ویدیوهای خلاقانهتر، کوتاهتر و باحالتر از همیشه باشید!
📡 @rss_ai_ir
#ویدیو_هوشمند #runway #Aleph #هوش_مصنوعی #ویرایش_ویدیو #مدل_مولد #AI
👍2🔥1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
📚 حالت Study Mode به ChatGPT اضافه شد!
✳️هوش مصنوعی دیگه فقط برای گرفتن جواب نیست! با ویژگی جدید OpenAI، یعنی Study Mode، یادگیری تعاملی و هدفمند وارد مرحله تازهای شده.
🧠 در این حالت:
♻️بهجای دادن پاسخ نهایی، مدل سوالهای راهنما میپرسه
♻️آموزش رو مرحلهبهمرحله جلو میبره
♻️سطح شما، هدف یادگیری و حتی تاریخچه چتها رو در نظر میگیره
♻️کوییز میگیره، نکات رو ارزیابی میکنه و یادگیری فعال رو تقویت میکنه
🔍 این یعنی ChatGPT تبدیل میشه به یک معلم خصوصی که:
♻️شما رو به فکر کردن وادار میکنه
♻️مفاهیم سخت رو با تصویرسازی شفاف توضیح میده (در نسخههای آینده)
♻️و بهمرور پیشرفتتون رو دنبال میکنه
🎓 برای همه کاربران نسخه رایگان، پلاس، پرو و تیم فعال شده. هنوز در مرحله ابتدایی هست ولی با بازخورد کاربرها قراره بهتر هم بشه!
📎 chatgpt.com/study
🔸 @rss_ai_ir
#مطالعه_هوشمند #آموزش_تعاملی #هوش_مصنوعی #ChatGPT #StudyMode #یادگیری
✳️هوش مصنوعی دیگه فقط برای گرفتن جواب نیست! با ویژگی جدید OpenAI، یعنی Study Mode، یادگیری تعاملی و هدفمند وارد مرحله تازهای شده.
🧠 در این حالت:
♻️بهجای دادن پاسخ نهایی، مدل سوالهای راهنما میپرسه
♻️آموزش رو مرحلهبهمرحله جلو میبره
♻️سطح شما، هدف یادگیری و حتی تاریخچه چتها رو در نظر میگیره
♻️کوییز میگیره، نکات رو ارزیابی میکنه و یادگیری فعال رو تقویت میکنه
🔍 این یعنی ChatGPT تبدیل میشه به یک معلم خصوصی که:
♻️شما رو به فکر کردن وادار میکنه
♻️مفاهیم سخت رو با تصویرسازی شفاف توضیح میده (در نسخههای آینده)
♻️و بهمرور پیشرفتتون رو دنبال میکنه
🎓 برای همه کاربران نسخه رایگان، پلاس، پرو و تیم فعال شده. هنوز در مرحله ابتدایی هست ولی با بازخورد کاربرها قراره بهتر هم بشه!
📎 chatgpt.com/study
🔸 @rss_ai_ir
#مطالعه_هوشمند #آموزش_تعاملی #هوش_مصنوعی #ChatGPT #StudyMode #یادگیری
👍3❤1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🛥 استفادهی هوشمندانه از عامل ChatGPT برای کنترل دوربین مداربسته!
✳️در این کاربرد جذاب، یک عامل (Agent) مبتنی بر ChatGPT به صورت زنده دوربین نظارتی را کنترل میکند — دنبال یک قایق فیروزهای رنگ میگردد و سعی میکند نام نوشتهشده روی آن را بخواند.
📸 چه کارهایی انجام میدهد؟
♻️خودش دوربین را زوم میکند
♻️زاویه را به سمت چپ یا راست تغییر میدهد
♻️زاویه دید مناسب را انتخاب میکند
♻️و در طول کار، بهصورت زنده گزارش عملکردش را میدهد:
«زوم میکنم... کمی به چپ حرکت میدم... دوربین را میچرخونم تا زاویه بهتری بگیرم...»
⚡️ نتیجه؟
این عامل بهخوبی از عهدهی کاری برمیآید که تا همین چند وقت پیش فقط از انسانها برمیآمد.
🔸 @rss_ai_ir
#هوش_مصنوعی #عامل_هوشمند #دوربین_هوشمند #ChatGPT #AI_Agent
✳️در این کاربرد جذاب، یک عامل (Agent) مبتنی بر ChatGPT به صورت زنده دوربین نظارتی را کنترل میکند — دنبال یک قایق فیروزهای رنگ میگردد و سعی میکند نام نوشتهشده روی آن را بخواند.
📸 چه کارهایی انجام میدهد؟
♻️خودش دوربین را زوم میکند
♻️زاویه را به سمت چپ یا راست تغییر میدهد
♻️زاویه دید مناسب را انتخاب میکند
♻️و در طول کار، بهصورت زنده گزارش عملکردش را میدهد:
«زوم میکنم... کمی به چپ حرکت میدم... دوربین را میچرخونم تا زاویه بهتری بگیرم...»
⚡️ نتیجه؟
این عامل بهخوبی از عهدهی کاری برمیآید که تا همین چند وقت پیش فقط از انسانها برمیآمد.
🔸 @rss_ai_ir
#هوش_مصنوعی #عامل_هوشمند #دوربین_هوشمند #ChatGPT #AI_Agent
👍3❤2🔥1👏1
📸 رتبهبندی جدید مدلهای تولید تصویر با هوش مصنوعی منتشر شد
@rss_ai_ir
🏆 مدل «Seedream 3.0» از شرکت ByteDance موفق شد جایگاه نخست را از GPT-4o بگیرد و در صدر قرار گیرد.
📉 مدل GPT-4o از OpenAI با اختلافی اندک در رتبه دوم قرار گرفته و مدلهای مختلف Imagen 4 از گوگل همچنان در تعقیب هستند اما هنوز به صدر نرسیدهاند.
📅 این مدلها همگی در بازه زمانی فروردین تا خرداد ۱۴۰۴ منتشر شدهاند و رقابت میان آنها شدیدتر از همیشه است.
⚙️ نکته جالب آن است که Seedream تنها با یک کارت گرافیک اجرا میشود و با این حال دقت بالایی دارد.
❓آیا عصر جدیدی برای تولید تصویر با هوش مصنوعی آغاز شده؟
❓آیا گوگل میتواند در بهروزرسانی بعدی صدر را پس بگیرد؟
📲 دیدگاه شما درباره این رقابت چیست؟
#هوش_مصنوعی #مدل_تصویرساز #تولید_تصویر
@rss_ai_ir
@rss_ai_ir
🏆 مدل «Seedream 3.0» از شرکت ByteDance موفق شد جایگاه نخست را از GPT-4o بگیرد و در صدر قرار گیرد.
📉 مدل GPT-4o از OpenAI با اختلافی اندک در رتبه دوم قرار گرفته و مدلهای مختلف Imagen 4 از گوگل همچنان در تعقیب هستند اما هنوز به صدر نرسیدهاند.
📅 این مدلها همگی در بازه زمانی فروردین تا خرداد ۱۴۰۴ منتشر شدهاند و رقابت میان آنها شدیدتر از همیشه است.
⚙️ نکته جالب آن است که Seedream تنها با یک کارت گرافیک اجرا میشود و با این حال دقت بالایی دارد.
❓آیا عصر جدیدی برای تولید تصویر با هوش مصنوعی آغاز شده؟
❓آیا گوگل میتواند در بهروزرسانی بعدی صدر را پس بگیرد؟
📲 دیدگاه شما درباره این رقابت چیست؟
#هوش_مصنوعی #مدل_تصویرساز #تولید_تصویر
@rss_ai_ir
👍1🔥1👏1
🎬 تحولی بزرگ در نسل جدید تولید ویدیو با هوش مصنوعی
@rss_ai_ir
در کمتر از یک سال، سطح تولید ویدیو توسط مدلهای هوش مصنوعی جهش قابل توجهی داشته. در حال حاضر میتوان با اطمینان گفت که گوگل با مدل Veo 3 در صدر قرار دارد؛ چه از نظر کیفیت خروجی و چه از نظر تجربه کاربری.
📝 یکی از جذابترین قابلیتهای این مدل، امکان تولید ویدیو بر اساس «استوریبورد» یا همان طرح اولیه صحنههاست. کافیست یک طرح ساده یا دیاگرام حرکتی از صحنه موردنظر بارگذاری کنید تا مدل، حرکت دوربین، اشیاء و افکتها را مطابق آن تولید کند.
🎥 چنین چیزی تا چند سال پیش غیرقابل تصور بود! حالا نهتنها ممکن شده، بلکه در حال ورود به بازار حرفهای سینماست.
📉 با اینکه قیمت این ابزارها برای کاربران عادی هنوز بالاست، اما در مقایسه با هزینههای ساخت سریال یا فیلم در استودیوها، مقرونبهصرفه و سریعتر است. بههمین دلیل، نتفلیکس بهتازگی برای اولینبار از فوتیج تولید شده با هوش مصنوعی در یکی از سریالهایش استفاده کرده.
🔄 این چرخه یعنی:
«کارایی → صرفهجویی → کیفیت بیشتر → سود → کارایی بیشتر»
📌 کاربرد این مدلها در صنعت فیلم و انیمیشن فقط شروع ماجراست.
#تولید_ویدیو #هوش_مصنوعی #Veo
@rss_ai_ir
@rss_ai_ir
در کمتر از یک سال، سطح تولید ویدیو توسط مدلهای هوش مصنوعی جهش قابل توجهی داشته. در حال حاضر میتوان با اطمینان گفت که گوگل با مدل Veo 3 در صدر قرار دارد؛ چه از نظر کیفیت خروجی و چه از نظر تجربه کاربری.
📝 یکی از جذابترین قابلیتهای این مدل، امکان تولید ویدیو بر اساس «استوریبورد» یا همان طرح اولیه صحنههاست. کافیست یک طرح ساده یا دیاگرام حرکتی از صحنه موردنظر بارگذاری کنید تا مدل، حرکت دوربین، اشیاء و افکتها را مطابق آن تولید کند.
🎥 چنین چیزی تا چند سال پیش غیرقابل تصور بود! حالا نهتنها ممکن شده، بلکه در حال ورود به بازار حرفهای سینماست.
📉 با اینکه قیمت این ابزارها برای کاربران عادی هنوز بالاست، اما در مقایسه با هزینههای ساخت سریال یا فیلم در استودیوها، مقرونبهصرفه و سریعتر است. بههمین دلیل، نتفلیکس بهتازگی برای اولینبار از فوتیج تولید شده با هوش مصنوعی در یکی از سریالهایش استفاده کرده.
🔄 این چرخه یعنی:
«کارایی → صرفهجویی → کیفیت بیشتر → سود → کارایی بیشتر»
📌 کاربرد این مدلها در صنعت فیلم و انیمیشن فقط شروع ماجراست.
#تولید_ویدیو #هوش_مصنوعی #Veo
@rss_ai_ir
🔥2❤1😱1🙏1
📉 کاهش چشمگیر نرخ نادیدهگرفتن هشدارها با کمک AI در پزشکی
@rss_ai_ir
نمودار بالا نشان میدهد چگونه نرخ نادیدهگیری هشدارهای قرمز (left in red rate) در پزشکانی که از دستیار هوشمند (AI) استفاده کردند بهمرور کاهش یافت.
🔹 در شروع (ژانویه ۲۰۲۵)، هر دو گروه (با و بدون AI) نرخ مشابهی در حدود ۳۵ تا ۴۰ درصد داشتند.
🔹 اما از هفته اول مارس به بعد — یعنی شروع استفاده کامل از AI — پزشکان گروه هوشمند عملکرد بهتری نشان دادند و نرخ نادیدهگیری به زیر ۲۰٪ کاهش یافت.
یعنی پزشکان بیشتر با توصیههای سیستم موافقت کردند و خطاها را اصلاح کردند.
💬 تمامی پزشکان این گروه (۱۰۰٪) گفتند که AI باعث بهبود کیفیت درمان شده و ۷۵٪ هم تأثیر آن را "قابلتوجه" دانستند.
یکی از آنها گفته:
«این سیستم بارها من را در تصمیمگیریهای بالینی درست یاری کرد.»
دیگری آن را «مشاور داخل مطب» نامیده.
📚 همچنین با گذشت زمان، پزشکان کمتر مرتکب اشتباهات تکراری میشدند — یعنی در واقع از سیستم یاد میگرفتند.
📌 در هیچیک از توصیههای AI، موردی ثبت نشد که پیشنهاد آن برای بیمار مضر باشد — حتی یکبار هم نه.
📎 اگر علاقهمند به پیادهسازی چنین سیستمی در کلینیک یا مرکز درمانی خود هستید، تمام دستورالعملها (prompts) در مقاله اصلی موجود است:
https://cdn.openai.com/pdf/a794887b-5a77-4207-bb62-e52c900463f1/penda_paper.pdf
📩 برای مشاوره مستقیم در همین حوزه به ما پیام دهید.
@rss_ai_ir
#پزشکی_هوشمند #هوش_مصنوعی #AIinMedicine #سلامت_دیجیتال
@rss_ai_ir
نمودار بالا نشان میدهد چگونه نرخ نادیدهگیری هشدارهای قرمز (left in red rate) در پزشکانی که از دستیار هوشمند (AI) استفاده کردند بهمرور کاهش یافت.
🔹 در شروع (ژانویه ۲۰۲۵)، هر دو گروه (با و بدون AI) نرخ مشابهی در حدود ۳۵ تا ۴۰ درصد داشتند.
🔹 اما از هفته اول مارس به بعد — یعنی شروع استفاده کامل از AI — پزشکان گروه هوشمند عملکرد بهتری نشان دادند و نرخ نادیدهگیری به زیر ۲۰٪ کاهش یافت.
یعنی پزشکان بیشتر با توصیههای سیستم موافقت کردند و خطاها را اصلاح کردند.
💬 تمامی پزشکان این گروه (۱۰۰٪) گفتند که AI باعث بهبود کیفیت درمان شده و ۷۵٪ هم تأثیر آن را "قابلتوجه" دانستند.
یکی از آنها گفته:
«این سیستم بارها من را در تصمیمگیریهای بالینی درست یاری کرد.»
دیگری آن را «مشاور داخل مطب» نامیده.
📚 همچنین با گذشت زمان، پزشکان کمتر مرتکب اشتباهات تکراری میشدند — یعنی در واقع از سیستم یاد میگرفتند.
📌 در هیچیک از توصیههای AI، موردی ثبت نشد که پیشنهاد آن برای بیمار مضر باشد — حتی یکبار هم نه.
📎 اگر علاقهمند به پیادهسازی چنین سیستمی در کلینیک یا مرکز درمانی خود هستید، تمام دستورالعملها (prompts) در مقاله اصلی موجود است:
https://cdn.openai.com/pdf/a794887b-5a77-4207-bb62-e52c900463f1/penda_paper.pdf
📩 برای مشاوره مستقیم در همین حوزه به ما پیام دهید.
@rss_ai_ir
#پزشکی_هوشمند #هوش_مصنوعی #AIinMedicine #سلامت_دیجیتال
👍2🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🧠 گامی به سوی مغز واحد برای رباتها
@rss_ai_ir
✳️تیمی از بهترین متخصصان رباتیک دنیا در حال توسعه یک مغز هوش مصنوعی واحد هستند — سیستمی که بتواند هر نوع رباتی را در هر وظیفهای کنترل کند.
♻️نه صرفاً یک قطعه کد، بلکه ذهنی عمومی برای تمام جهان ماشینهاست.
🔧 از رباتهای صنعتی تا انساننماها، هدف ایجاد زبانی واحد برای فهم، تصمیمگیری و اجراست — درست مثل مغز انسان.
🌐 آیندهای که در آن هر ربات بدون نیاز به برنامهریزی اختصاصی میتواند آموزش ببیند، تطبیق پیدا کند و مستقل عمل کند، حالا دور از دسترس نیست.
#رباتیک #هوش_مصنوعی #AI #اتوماسیون #فناوری_روز
@rss_ai_ir
✳️تیمی از بهترین متخصصان رباتیک دنیا در حال توسعه یک مغز هوش مصنوعی واحد هستند — سیستمی که بتواند هر نوع رباتی را در هر وظیفهای کنترل کند.
♻️نه صرفاً یک قطعه کد، بلکه ذهنی عمومی برای تمام جهان ماشینهاست.
🔧 از رباتهای صنعتی تا انساننماها، هدف ایجاد زبانی واحد برای فهم، تصمیمگیری و اجراست — درست مثل مغز انسان.
🌐 آیندهای که در آن هر ربات بدون نیاز به برنامهریزی اختصاصی میتواند آموزش ببیند، تطبیق پیدا کند و مستقل عمل کند، حالا دور از دسترس نیست.
#رباتیک #هوش_مصنوعی #AI #اتوماسیون #فناوری_روز
👍3🔥1👏1
📚 یکی از بهترین دورههای رایگان برای یادگیری تقویتی!
♻️دانشگاه UCL با همکاری DeepMind دورهای ۲۰ ساعته ارائه داده که بهجرئت میشه گفت یکی از کاملترین و محبوبترین منابع آموزش یادگیری تقویتی تو دنیاست.
🔍 از مفاهیم پایه مثل Q-Learning و SARSA شروع میکنه، بعد سراغ الگوریتمهای پیشرفتهتری مثل Rainbow DQN میره و در ادامه مفاهیمی مثل off-policy، eligibility trace و multi-step learning رو هم با دقت آموزش میده.
🎓 تا الان بیش از ۲۵۰ هزار نفر از محققها و توسعهدهندههای AI ازش استفاده کردن.
📺 ویدئوها روی یوتیوب هستن
💻 کدها و پروژهها توی گیتهاب
🔗 لینکها:
YouTube Playlist
GitHub Repo
#یادگیری_تقویتی #هوش_مصنوعی #RL #AI
@rss_ai_ir
♻️دانشگاه UCL با همکاری DeepMind دورهای ۲۰ ساعته ارائه داده که بهجرئت میشه گفت یکی از کاملترین و محبوبترین منابع آموزش یادگیری تقویتی تو دنیاست.
🔍 از مفاهیم پایه مثل Q-Learning و SARSA شروع میکنه، بعد سراغ الگوریتمهای پیشرفتهتری مثل Rainbow DQN میره و در ادامه مفاهیمی مثل off-policy، eligibility trace و multi-step learning رو هم با دقت آموزش میده.
🎓 تا الان بیش از ۲۵۰ هزار نفر از محققها و توسعهدهندههای AI ازش استفاده کردن.
📺 ویدئوها روی یوتیوب هستن
💻 کدها و پروژهها توی گیتهاب
🔗 لینکها:
YouTube Playlist
GitHub Repo
#یادگیری_تقویتی #هوش_مصنوعی #RL #AI
@rss_ai_ir
❤3🔥1👏1
🔍 تفاوت بین دوربین صنعتی (مثل Basler) و دوربینهای معمولی چیه؟
@rss_ai_ir
خیلی از افراد فکر میکنن همه دوربینها یکی هستن؛ اما دوربینهای صنعتی مثل Basler برای دنیای مهندسی و صنعت طراحی شدن، نه فقط برای عکس گرفتن!
📌 تفاوتهای اصلی:
✅ پایداری و دقت بالا
دوربین صنعتی میتونه ساعتها بدون وقفه کار کنه، با نویز بسیار کم و ثبات فوقالعاده در شرایط نوری مختلف.
✅ کنترلپذیری بالا
دوربینهای صنعتی از طریق نرمافزارهایی مثل pypylon یا GenICam قابل کنترل کامل هستن؛ حتی میشه exposure، gain، trigger و بسیاری از پارامترها رو بهصورت برنامهنویسیشده تغییر داد.
✅ سینک شدن با خط تولید
در پروژههای صنعتی، لازمه دوربین دقیقاً در لحظهای خاص عکس بگیره؛ این کار با پورتهای Trigger و I/O امکانپذیره — چیزی که دوربینهای معمولی ندارن.
✅ سنسور حرفهای
سنسور دوربین صنعتی طراحی شده برای اندازهگیری، پردازش تصویر، بینایی ماشین، نه فقط زیبایی عکس! به همین خاطر دقت رنگ و جزئیات در نور کم بسیار بهتره.
✅ رابطهای صنعتی (GigE, USB3 Vision)
برخلاف دوربینهای معمولی که اکثراً USB2 دارن، دوربینهای Basler معمولاً از GigE یا USB3 Vision پشتیبانی میکنن تا سرعت بالا و انتقال بدون تأخیر دادهها در محیطهای صنعتی تضمین بشه.
🚀 پس اگه دنبال دوربینی هستی که بشه روش برای کاربردهای بینایی ماشین، کنترل کیفیت، یا اتوماسیون صنعتی حساب کرد، دوربینهای معمولی جواب نمیدن؛ باید بری سراغ صنعتیها مثل Basler.
#بینایی_ماشین #دوربین_صنعتی #Basler #بینایی_ماشین #MachineVision #هوش_مصنوعی
@rss_ai_ir
خیلی از افراد فکر میکنن همه دوربینها یکی هستن؛ اما دوربینهای صنعتی مثل Basler برای دنیای مهندسی و صنعت طراحی شدن، نه فقط برای عکس گرفتن!
📌 تفاوتهای اصلی:
✅ پایداری و دقت بالا
دوربین صنعتی میتونه ساعتها بدون وقفه کار کنه، با نویز بسیار کم و ثبات فوقالعاده در شرایط نوری مختلف.
✅ کنترلپذیری بالا
دوربینهای صنعتی از طریق نرمافزارهایی مثل pypylon یا GenICam قابل کنترل کامل هستن؛ حتی میشه exposure، gain، trigger و بسیاری از پارامترها رو بهصورت برنامهنویسیشده تغییر داد.
✅ سینک شدن با خط تولید
در پروژههای صنعتی، لازمه دوربین دقیقاً در لحظهای خاص عکس بگیره؛ این کار با پورتهای Trigger و I/O امکانپذیره — چیزی که دوربینهای معمولی ندارن.
✅ سنسور حرفهای
سنسور دوربین صنعتی طراحی شده برای اندازهگیری، پردازش تصویر، بینایی ماشین، نه فقط زیبایی عکس! به همین خاطر دقت رنگ و جزئیات در نور کم بسیار بهتره.
✅ رابطهای صنعتی (GigE, USB3 Vision)
برخلاف دوربینهای معمولی که اکثراً USB2 دارن، دوربینهای Basler معمولاً از GigE یا USB3 Vision پشتیبانی میکنن تا سرعت بالا و انتقال بدون تأخیر دادهها در محیطهای صنعتی تضمین بشه.
🚀 پس اگه دنبال دوربینی هستی که بشه روش برای کاربردهای بینایی ماشین، کنترل کیفیت، یا اتوماسیون صنعتی حساب کرد، دوربینهای معمولی جواب نمیدن؛ باید بری سراغ صنعتیها مثل Basler.
#بینایی_ماشین #دوربین_صنعتی #Basler #بینایی_ماشین #MachineVision #هوش_مصنوعی
👍3👏1👌1
This media is not supported in your browser
VIEW IN TELEGRAM
🧺 ربات Figure 02 حالا میتونه ماشین لباسشویی رو روشن کنه و کار باهاش رو یاد بگیره!
این یعنی یک قدم دیگه به سمت رباتهایی که کارهای روزمره خونه رو انجام میدن 👕🤖
ربات با استفاده از هوش مصنوعی نهتنها ماشین لباسشویی رو شناسایی کرده، بلکه موفق شده مراحل روشنکردن و راهاندازی اون رو اجرا کنه — دقیقاً مثل یک انسان!
این قابلیت نشون میده که چطور مدلهای چندمنظوره مثل Figure 02 میتونن از تماشا و تجربه یاد بگیرن و وارد زندگی واقعی ما بشن.
📌 @rss_ai_ir
#رباتیک #هوش_مصنوعی #ربات_خانگی #Figure02 #روبات_لباسشویی #روبات_خدمتکار
این یعنی یک قدم دیگه به سمت رباتهایی که کارهای روزمره خونه رو انجام میدن 👕🤖
ربات با استفاده از هوش مصنوعی نهتنها ماشین لباسشویی رو شناسایی کرده، بلکه موفق شده مراحل روشنکردن و راهاندازی اون رو اجرا کنه — دقیقاً مثل یک انسان!
این قابلیت نشون میده که چطور مدلهای چندمنظوره مثل Figure 02 میتونن از تماشا و تجربه یاد بگیرن و وارد زندگی واقعی ما بشن.
📌 @rss_ai_ir
#رباتیک #هوش_مصنوعی #ربات_خانگی #Figure02 #روبات_لباسشویی #روبات_خدمتکار
👍5👏1👌1