VIRSUN
⚙️ چالش بزرگ طراحی سیستم سورتینگ صنعتی با هوش مصنوعی @rss_ai_ir --- ✅در یک سیستم بینایی ماشین صنعتی که با سرعت بالا مواد معدنی را تفکیک میکند، ترکیبی از چالشهای نرمافزاری، سختافزاری، نوری و کنترلی وجود دارد. اگر بخواهی چنین سیستمی بسازی، باید بتوانی…
✅ پاسخهای پیشنهادی به سوالات:
1️⃣ مدل پیشنهادی: YOLOv5 یا YOLO-Nano برای سرعت بالا و دقت مناسب در محیطهای صنعتی مناسب است.
2️⃣ روش آموزش: استفاده از دادههای متنوع و Augmentation شدید + Fine-Tuning روی دادههای واقعی خط تولید.
3️⃣ یادگیری آنلاین: بله، استفاده از روشهای Online Learning یا Active Learning برای بهروزرسانی مدل در حین اجرا توصیه میشود.
4️⃣ دقت قابل قبول: برای صنایع معدنی معمولاً دقت ۹۰٪ به بالا مطلوب است، اما برای جداسازی مواد گرانبها بالاتر از ۹۵٪ نیاز است.
5️⃣ ماژول پردازشی پیشنهادی:
• NVIDIA Jetson AGX Orin
• Google Coral Dev Board
• Xilinx Zynq MPSoC (برای latency بسیار پایین)
6️⃣ دوربین مناسب:
• دوربین صنعتی با shutter global و حداقل 120fps
• برندهایی مثل Basler یا IDS با لنز مقاوم در برابر گردوغبار و لرزش
7️⃣ نورپردازی مؤثر:
• ترکیبی از Backlight برای شناسایی لبهها و Dome Light برای بافت سطحی
8️⃣ مکانیسم جداسازی سریع:
• جت هوا (Air Ejector) به دلیل پاسخ سریع (زیر 10ms) و بدون قطعات متحرک
9️⃣ کنترل بلادرنگ:
• بله، استفاده از Real-Time PLC یا بردهایی مثل NI CompactRIO برای اجرای دقیق فرمانها ضروری است
🔟 مقابله با شرایط محیطی:
• استفاده از UPS صنعتی، سنسور حرارتی برای پایش دما، و جعبههای ضدغبار (IP67) برای حفاظت از سختافزار
📌 این پاسخها نقطه شروع خوبی هستند. برای اجرای واقعی، باید بسته به شرایط خط تولید، طراحی سفارشیسازی شود.✅
1️⃣ مدل پیشنهادی: YOLOv5 یا YOLO-Nano برای سرعت بالا و دقت مناسب در محیطهای صنعتی مناسب است.
2️⃣ روش آموزش: استفاده از دادههای متنوع و Augmentation شدید + Fine-Tuning روی دادههای واقعی خط تولید.
3️⃣ یادگیری آنلاین: بله، استفاده از روشهای Online Learning یا Active Learning برای بهروزرسانی مدل در حین اجرا توصیه میشود.
4️⃣ دقت قابل قبول: برای صنایع معدنی معمولاً دقت ۹۰٪ به بالا مطلوب است، اما برای جداسازی مواد گرانبها بالاتر از ۹۵٪ نیاز است.
5️⃣ ماژول پردازشی پیشنهادی:
• NVIDIA Jetson AGX Orin
• Google Coral Dev Board
• Xilinx Zynq MPSoC (برای latency بسیار پایین)
6️⃣ دوربین مناسب:
• دوربین صنعتی با shutter global و حداقل 120fps
• برندهایی مثل Basler یا IDS با لنز مقاوم در برابر گردوغبار و لرزش
7️⃣ نورپردازی مؤثر:
• ترکیبی از Backlight برای شناسایی لبهها و Dome Light برای بافت سطحی
8️⃣ مکانیسم جداسازی سریع:
• جت هوا (Air Ejector) به دلیل پاسخ سریع (زیر 10ms) و بدون قطعات متحرک
9️⃣ کنترل بلادرنگ:
• بله، استفاده از Real-Time PLC یا بردهایی مثل NI CompactRIO برای اجرای دقیق فرمانها ضروری است
🔟 مقابله با شرایط محیطی:
• استفاده از UPS صنعتی، سنسور حرارتی برای پایش دما، و جعبههای ضدغبار (IP67) برای حفاظت از سختافزار
📌 این پاسخها نقطه شروع خوبی هستند. برای اجرای واقعی، باید بسته به شرایط خط تولید، طراحی سفارشیسازی شود.✅
👍1🔥1👏1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 رباتهای یونیتری (Unitree) باز هم جنجالی شدند!
🚨 با اینکه این رباتها در دستهی رباتهای پیشرفته برای جابهجایی در زمینهای ناهموار قرار دارند، اما گاهی کوچکترین نقص در الگوریتمهای کنترل یا بینایی ماشین میتواند رفتار غیرقابلپیشبینی ایجاد کند.
⚙️ سوال مهم اینجاست:
آیا باید کنترل هوشمند این رباتها تقویت شود؟ یا شاید نیاز به قوانین سختگیرانهتری برای استفاده عمومی آنهاست؟
📡 نظر شما چیه؟
آیا به رباتهایی که خودشون تصمیم میگیرن اعتماد دارید؟
🧠 تحلیلها و پستهای داغ بیشتر در کانال:
@rss_ai_ir
#رباتیک #Unitree #هوش_مصنوعی #ربات_هوشمند #بینایی_ماشین #کنترل_پیشرفته #AI_Robotics
🚨 با اینکه این رباتها در دستهی رباتهای پیشرفته برای جابهجایی در زمینهای ناهموار قرار دارند، اما گاهی کوچکترین نقص در الگوریتمهای کنترل یا بینایی ماشین میتواند رفتار غیرقابلپیشبینی ایجاد کند.
⚙️ سوال مهم اینجاست:
آیا باید کنترل هوشمند این رباتها تقویت شود؟ یا شاید نیاز به قوانین سختگیرانهتری برای استفاده عمومی آنهاست؟
📡 نظر شما چیه؟
آیا به رباتهایی که خودشون تصمیم میگیرن اعتماد دارید؟
🧠 تحلیلها و پستهای داغ بیشتر در کانال:
@rss_ai_ir
#رباتیک #Unitree #هوش_مصنوعی #ربات_هوشمند #بینایی_ماشین #کنترل_پیشرفته #AI_Robotics
👍1🔥1😱1🤪1
🎯 هوشمندسازی نباید مُد باشد؛ باید مسئلهمحور باشد!
🚫 این روزها بسیاری از سازمانها، کارخانهها و حتی استارتاپها، بدون تحلیل دقیق نیاز، بهسرعت به سراغ سیستمهای هوش مصنوعی میروند. اما آیا هر مشکلی نیاز به AI دارد؟ آیا فقط چون رقبا از «هوش مصنوعی» استفاده میکنند، ما هم باید استفاده کنیم؟ پاسخ: قطعاً نه!
---
💡 چرا هوشمندسازی فقط وقتی مفید است که مسئلهمحور باشد؟
1️⃣ مسئله دقیقاً چیست؟
اگر مسأله روشن نیست، هوش مصنوعی نمیتواند معجزه کند. AI باید برای حل یک مشکل واقعی و ملموس استفاده شود، نه فقط برای افزایش کلاس پروژه!
2️⃣ آیا داده داریم؟
مدلهای هوشمند بدون داده، مثل ماشین بدون بنزین هستند. هر جا دادهی با کیفیت و قابل اعتماد نیست، نباید به سمت یادگیری ماشین رفت.
3️⃣ راه حل سادهتر وجود دارد؟
اگر یک الگوریتم سادهی منطقی (Rule-based) کار را بهتر، سریعتر و ارزانتر انجام میدهد، دلیلی ندارد از مدلی پیچیده با دهها میلیون پارامتر استفاده کنیم.
4️⃣ آیا هزینه/زمان توجیه دارد؟
مدلهای هوش مصنوعی نیاز به نگهداری، آپدیت، پایش، و گاهی آموزش مجدد دارند. اگر یک سیستم پایدار و کمهزینه کافیست، ورود به AI ممکن است اشتباه استراتژیک باشد.
---
📌 نتیجهگیری:
هوشمندسازی یعنی حل مسئله با ابزار درست.
نه تقلید کورکورانه، نه رقابت ناآگاهانه.
🚀 مهندس حرفهای، قبل از انتخاب ابزار، اول سؤال میپرسد!
📡 برای تحلیلهای فنی و حرفهای بیشتر:
@rss_ai_ir
#هوش_مصنوعی #اتوماسیون #AI #یادگیری_ماشین #مسئله_محور #تحلیل_سیستم #مهندسی_فنی #مد_نباشیم #هوشمند_فکر_کنیم
🚫 این روزها بسیاری از سازمانها، کارخانهها و حتی استارتاپها، بدون تحلیل دقیق نیاز، بهسرعت به سراغ سیستمهای هوش مصنوعی میروند. اما آیا هر مشکلی نیاز به AI دارد؟ آیا فقط چون رقبا از «هوش مصنوعی» استفاده میکنند، ما هم باید استفاده کنیم؟ پاسخ: قطعاً نه!
---
💡 چرا هوشمندسازی فقط وقتی مفید است که مسئلهمحور باشد؟
1️⃣ مسئله دقیقاً چیست؟
اگر مسأله روشن نیست، هوش مصنوعی نمیتواند معجزه کند. AI باید برای حل یک مشکل واقعی و ملموس استفاده شود، نه فقط برای افزایش کلاس پروژه!
2️⃣ آیا داده داریم؟
مدلهای هوشمند بدون داده، مثل ماشین بدون بنزین هستند. هر جا دادهی با کیفیت و قابل اعتماد نیست، نباید به سمت یادگیری ماشین رفت.
3️⃣ راه حل سادهتر وجود دارد؟
اگر یک الگوریتم سادهی منطقی (Rule-based) کار را بهتر، سریعتر و ارزانتر انجام میدهد، دلیلی ندارد از مدلی پیچیده با دهها میلیون پارامتر استفاده کنیم.
4️⃣ آیا هزینه/زمان توجیه دارد؟
مدلهای هوش مصنوعی نیاز به نگهداری، آپدیت، پایش، و گاهی آموزش مجدد دارند. اگر یک سیستم پایدار و کمهزینه کافیست، ورود به AI ممکن است اشتباه استراتژیک باشد.
---
📌 نتیجهگیری:
هوشمندسازی یعنی حل مسئله با ابزار درست.
نه تقلید کورکورانه، نه رقابت ناآگاهانه.
🚀 مهندس حرفهای، قبل از انتخاب ابزار، اول سؤال میپرسد!
📡 برای تحلیلهای فنی و حرفهای بیشتر:
@rss_ai_ir
#هوش_مصنوعی #اتوماسیون #AI #یادگیری_ماشین #مسئله_محور #تحلیل_سیستم #مهندسی_فنی #مد_نباشیم #هوشمند_فکر_کنیم
👍3👏1🙏1
🇨🇳 چین باز هم شگفتی آفرید؛ یک LLM متنباز دیگر وارد میدان شد!
📢 مدل زبانی GLM 4.5 رسماً معرفی شد و در بسیاری از بنچمارکها، پابهپای غولهای غربی مثل Claude 4 Opus و Gemini 2.5 Pro رقابت میکند!
📊 مقایسه با مدلهای مطرح دنیا:
🔹 AIME24:
GLM4.5 = 91.0 🔥
⬆️ بالاتر از Claude 4 Opus
🔹 MATH500:
GLM4.5 = 98.2 📐
⬆️ جلوتر از GPT-4.1!
🔹 GPQA:
GLM4.5 = 79.1
⬇️ کمی پایینتر از Gemini 2.5
🔹 SWE-bench (کدنویسی):
GLM4.5 = 64.2
⬇️ پایینتر از Sonnet 4
🔹 Terminal-Bench (تعامل CLI):
GLM4.5 = 37.5
⬇️ پایینتر از Opus 4
---
💥 این دستاورد یک زنگ خطر جدی برای آمریکا در رقابت مدلهای متنباز است.
چین با GLM4.5، نشان میدهد که دیگر تنها دنبال تقلید نیست، بلکه آماده پیشتازی است.
📌 اگر هوادار آینده هوش مصنوعی هستی، باید جدیتر از همیشه چشم به شرق بدوزی!
#مدل_زبان_بزرگ #هوش_مصنوعی #LLM #GLM4_5 #چین #متن_باز #رقابت_فناورانه
@rss_ai_ir
📢 مدل زبانی GLM 4.5 رسماً معرفی شد و در بسیاری از بنچمارکها، پابهپای غولهای غربی مثل Claude 4 Opus و Gemini 2.5 Pro رقابت میکند!
📊 مقایسه با مدلهای مطرح دنیا:
🔹 AIME24:
GLM4.5 = 91.0 🔥
⬆️ بالاتر از Claude 4 Opus
🔹 MATH500:
GLM4.5 = 98.2 📐
⬆️ جلوتر از GPT-4.1!
🔹 GPQA:
GLM4.5 = 79.1
⬇️ کمی پایینتر از Gemini 2.5
🔹 SWE-bench (کدنویسی):
GLM4.5 = 64.2
⬇️ پایینتر از Sonnet 4
🔹 Terminal-Bench (تعامل CLI):
GLM4.5 = 37.5
⬇️ پایینتر از Opus 4
---
💥 این دستاورد یک زنگ خطر جدی برای آمریکا در رقابت مدلهای متنباز است.
چین با GLM4.5، نشان میدهد که دیگر تنها دنبال تقلید نیست، بلکه آماده پیشتازی است.
📌 اگر هوادار آینده هوش مصنوعی هستی، باید جدیتر از همیشه چشم به شرق بدوزی!
#مدل_زبان_بزرگ #هوش_مصنوعی #LLM #GLM4_5 #چین #متن_باز #رقابت_فناورانه
@rss_ai_ir
🔥3😱1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🤖 ربات خونگیر با دقت ۹۴٪ در بیمارستانهای چین فعال شد!
در یکی از مراکز درمانی چین، برای اولین بار رباتی وارد فاز اجرایی شده که با استفاده از بینایی ماشین و الگوریتمهای یادگیری عمیق، عملیات خونگیری وریدی را بهصورت کاملاً خودکار انجام میدهد.
📈 دقت اعلامشده: ۹۴٪
🎯 مزایا:
♻️کاهش خطای انسانی
♻️مناسب برای بیماران اضطرابی یا کودکان
♻️قابلیت استفاده در شب و شرایط خاص
❗ اما سوالی مهم باقی میماند: آن ۶٪ باقیمانده چطور؟
در حوزه سلامت، حتی درصدهای کوچک میتوانند بحرانی باشند.
🧠 ورود رباتها به حوزه پزشکی، باید با دقت، نظارت مستمر و اخلاق حرفهای همراه باشد تا جایگزینی مطمئن برای پرستاران و پزشکان باشند.
#هوش_مصنوعی #ربات_پزشکی #ربات_خونگیری #AI_in_Healthcare
@rss_ai_ir
در یکی از مراکز درمانی چین، برای اولین بار رباتی وارد فاز اجرایی شده که با استفاده از بینایی ماشین و الگوریتمهای یادگیری عمیق، عملیات خونگیری وریدی را بهصورت کاملاً خودکار انجام میدهد.
📈 دقت اعلامشده: ۹۴٪
🎯 مزایا:
♻️کاهش خطای انسانی
♻️مناسب برای بیماران اضطرابی یا کودکان
♻️قابلیت استفاده در شب و شرایط خاص
❗ اما سوالی مهم باقی میماند: آن ۶٪ باقیمانده چطور؟
در حوزه سلامت، حتی درصدهای کوچک میتوانند بحرانی باشند.
🧠 ورود رباتها به حوزه پزشکی، باید با دقت، نظارت مستمر و اخلاق حرفهای همراه باشد تا جایگزینی مطمئن برای پرستاران و پزشکان باشند.
#هوش_مصنوعی #ربات_پزشکی #ربات_خونگیری #AI_in_Healthcare
@rss_ai_ir
👏2😁2👌1
🧠 زمین بازی نهایی برای آزمودن ایجنتهای هوش مصنوعی – همین حالا روی GitHub
اگر واقعاً میخواهی استاد AI Agent بشی، فقط مقاله نخون — کدها رو اجرا کن!
یک مخزن گیتهاب فوقالعاده که همهچیز برای یادگیری عملی و ساخت ایجنتهای پیشرفته رو فراهم کرده:
🔹 فهرست دستهبندیشده ایجنتها بر اساس نوع:
– ساده، RAG، چندحالته، خودگردان و...
🔹 کاربردها:
– تحلیل سرمایهگذاری، تحقیق، مدیریت سفر، راهاندازی محصول و...
🔹 امکانات ویژه:
– حلقههای خودمختار (Autonomous Loops)
– ایجنتهای چندعاملی (Multi-Agent)
– اتوماسیون مرورگر و GitHub
– ایجنتهایی با قابلیت تغییر و بهبود خودکار
– مدلسازی مالی و برنامهریزی full-stack
📁 ایجنتها Plug & Play هستن — فقط کلون کن، اجرا بگیر و مهندسی معکوس رو شروع کن.
🔗 لینک گیتهاب: Awesome LLM Agents
🎯 اگه واقعاً قصد داری ایجنت بسازی، اینجا دقیقاً آزمایشگاه توئه!
#هوش_مصنوعی #عامل_هوشمند #AI_Agent #کدنویسی #یادگیری_عمیق
@rss_ai_ir
اگر واقعاً میخواهی استاد AI Agent بشی، فقط مقاله نخون — کدها رو اجرا کن!
یک مخزن گیتهاب فوقالعاده که همهچیز برای یادگیری عملی و ساخت ایجنتهای پیشرفته رو فراهم کرده:
🔹 فهرست دستهبندیشده ایجنتها بر اساس نوع:
– ساده، RAG، چندحالته، خودگردان و...
🔹 کاربردها:
– تحلیل سرمایهگذاری، تحقیق، مدیریت سفر، راهاندازی محصول و...
🔹 امکانات ویژه:
– حلقههای خودمختار (Autonomous Loops)
– ایجنتهای چندعاملی (Multi-Agent)
– اتوماسیون مرورگر و GitHub
– ایجنتهایی با قابلیت تغییر و بهبود خودکار
– مدلسازی مالی و برنامهریزی full-stack
📁 ایجنتها Plug & Play هستن — فقط کلون کن، اجرا بگیر و مهندسی معکوس رو شروع کن.
🔗 لینک گیتهاب: Awesome LLM Agents
🎯 اگه واقعاً قصد داری ایجنت بسازی، اینجا دقیقاً آزمایشگاه توئه!
#هوش_مصنوعی #عامل_هوشمند #AI_Agent #کدنویسی #یادگیری_عمیق
@rss_ai_ir
❤3👍2🔥2
⚖️ — وکیل هوشمند تو Law ChatGPT!
♻️وقتی پای قرارداد و متنهای حقوقی وسطه، دیگه لازم نیست همه بندها رو با ذرهبین بخونی یا کلی پول خرج وکیل کنی.
♻️همچنین Law ChatGPT میتونه دقیق، سریع و خودکار اسناد حقوقیات رو بررسی کنه:
🔍 قابلیتها:
🔹 شناسایی بندهای پرریسک و مبهم
🔹 توضیح سادهی اصطلاحات پیچیدهی حقوقی
🔹 پشتیبانی از فایلهای PDF، قراردادها، توافقنامهها و اسناد رسمی
📎 فقط کافیه فایل رو بدی بهش — اون برات خلاصه میکنه، هشدار میده و همهچیزو برات قابلفهم میکنه.
🧠 دیگه لازم نیست فقط برای اینکه کسی بهت بگه “امضا نکن”، هزینه سنگین پرداخت کنی!
👨⚖️ همین الان تستش کن:
LawChatGPT
#هوش_مصنوعی #وکیل_هوشمند #بررسی_قرارداد #AI_Law #LegalTech
@rss_ai_ir
♻️وقتی پای قرارداد و متنهای حقوقی وسطه، دیگه لازم نیست همه بندها رو با ذرهبین بخونی یا کلی پول خرج وکیل کنی.
♻️همچنین Law ChatGPT میتونه دقیق، سریع و خودکار اسناد حقوقیات رو بررسی کنه:
🔍 قابلیتها:
🔹 شناسایی بندهای پرریسک و مبهم
🔹 توضیح سادهی اصطلاحات پیچیدهی حقوقی
🔹 پشتیبانی از فایلهای PDF، قراردادها، توافقنامهها و اسناد رسمی
📎 فقط کافیه فایل رو بدی بهش — اون برات خلاصه میکنه، هشدار میده و همهچیزو برات قابلفهم میکنه.
🧠 دیگه لازم نیست فقط برای اینکه کسی بهت بگه “امضا نکن”، هزینه سنگین پرداخت کنی!
👨⚖️ همین الان تستش کن:
LawChatGPT
#هوش_مصنوعی #وکیل_هوشمند #بررسی_قرارداد #AI_Law #LegalTech
@rss_ai_ir
👏3👍1🔥1
🧠 پشتهی توسعهدهندگان RAG (بازیابی + تولید) به زبان ساده!
♻️این تصویر، نمای کاملی از ابزارها و لایههای مورد استفاده برای ساخت سیستمهای RAG رو نشون میده — از استخراج داده گرفته تا مدل زبانی و ارزیابی نهایی.
📌 خلاصه مهمترین اجزا:
🔹 مدلهای زبانی (LLMs):
متنباز: LLaMA 3.3، Mistral، Phi-4، Qwen 2.5، Gemma 3، DeepSeek
بسته: GPT (OpenAI)، Claude (Anthropic)، Gemini (Google)، Cohere، Amazon
🔹 فریمورکها برای پیادهسازی RAG:
LangChain، LlamaIndex، Haystack، Txtai
🔹 دیتابیس برداری (Vector DBs):
Chroma، Pinecone، Weaviate، Qdrant، Milvus
🔹 استخراج داده:
از وب: Crawl4AI، ScrapeGraphAI، FireCrawl
از اسناد: MegaParser، Docling، LlamaParse، ExtractThinker
🔹 مدلهای برداری متن (Text Embedding):
SBERT، Nomic، Ollama، OpenAI، Cohere
🔹 ارزیابی عملکرد:
Giskard، Ragas، Trulens، Voyage AI
🔧 همه این ابزارها با هدف ساخت یک سیستم هوشمند RAG ترکیب میشن که بتونه اطلاعات رو از منابع مختلف بگیره، بفهمه، و خروجی دقیق تولید کنه.
📣 اگر میخوای مدلهای Retrieval-Augmented Generation حرفهای بسازی، این پشتهی ابزارها دقیقاً چیزیه که باید بلد باشی!
📍 آموزشها و ابزارهای بیشتر در:
@rss_ai_ir
#RAG #هوش_مصنوعی #LLM #LangChain #پردازش_زبان #بردار_متن #استخراج_داده #پشته_توسعه #AItools #openai #gemini #cohere #ragstack
♻️این تصویر، نمای کاملی از ابزارها و لایههای مورد استفاده برای ساخت سیستمهای RAG رو نشون میده — از استخراج داده گرفته تا مدل زبانی و ارزیابی نهایی.
📌 خلاصه مهمترین اجزا:
🔹 مدلهای زبانی (LLMs):
متنباز: LLaMA 3.3، Mistral، Phi-4، Qwen 2.5، Gemma 3، DeepSeek
بسته: GPT (OpenAI)، Claude (Anthropic)، Gemini (Google)، Cohere، Amazon
🔹 فریمورکها برای پیادهسازی RAG:
LangChain، LlamaIndex، Haystack، Txtai
🔹 دیتابیس برداری (Vector DBs):
Chroma، Pinecone، Weaviate، Qdrant، Milvus
🔹 استخراج داده:
از وب: Crawl4AI، ScrapeGraphAI، FireCrawl
از اسناد: MegaParser، Docling، LlamaParse، ExtractThinker
🔹 مدلهای برداری متن (Text Embedding):
SBERT، Nomic، Ollama، OpenAI، Cohere
🔹 ارزیابی عملکرد:
Giskard، Ragas، Trulens، Voyage AI
🔧 همه این ابزارها با هدف ساخت یک سیستم هوشمند RAG ترکیب میشن که بتونه اطلاعات رو از منابع مختلف بگیره، بفهمه، و خروجی دقیق تولید کنه.
📣 اگر میخوای مدلهای Retrieval-Augmented Generation حرفهای بسازی، این پشتهی ابزارها دقیقاً چیزیه که باید بلد باشی!
📍 آموزشها و ابزارهای بیشتر در:
@rss_ai_ir
#RAG #هوش_مصنوعی #LLM #LangChain #پردازش_زبان #بردار_متن #استخراج_داده #پشته_توسعه #AItools #openai #gemini #cohere #ragstack
👏2❤1🔥1
🧠 مدل جدید برای تشخیص چهره جعلی (Anti-Spoofing)
در مقالهی InstructFLIP محققان به بررسی یک مدل Vision-Language Unified پرداختهاند که با کمک دستورالعملهای زبانی میتواند تصاویر چهره را تحلیل کرده و حملات جعلی (Spoofing) را تشخیص دهد!
📌 نکات کلیدی:
🔹 مدل چندوظیفهای با ادغام تصویر و زبان
🔹 قابل استفاده برای حملات چاپی، ویدیویی و ماسک سهبعدی
🔹 بدون نیاز به دادههای زیاد برای هر نوع حمله
📎 لینکها:
🔧 کد پروژه در گیتهاب
📄 مقاله در arXiv
📂 دیتاست Replay-Attack
👁🗨 آینده تشخیص چهره، هوشمندتر از همیشه...
@rss_ai_ir
در مقالهی InstructFLIP محققان به بررسی یک مدل Vision-Language Unified پرداختهاند که با کمک دستورالعملهای زبانی میتواند تصاویر چهره را تحلیل کرده و حملات جعلی (Spoofing) را تشخیص دهد!
📌 نکات کلیدی:
🔹 مدل چندوظیفهای با ادغام تصویر و زبان
🔹 قابل استفاده برای حملات چاپی، ویدیویی و ماسک سهبعدی
🔹 بدون نیاز به دادههای زیاد برای هر نوع حمله
📎 لینکها:
🔧 کد پروژه در گیتهاب
📄 مقاله در arXiv
📂 دیتاست Replay-Attack
👁🗨 آینده تشخیص چهره، هوشمندتر از همیشه...
@rss_ai_ir
👍2❤1🔥1👏1
🤖 رباتها در خردهفروشی چین: اولین فروشگاه ۶S رباتیک افتتاح شد!
در شهر شنژن چین، اولین فروشگاه کاملاً تخصصی رباتها به سبک 6S راهاندازی شده؛ مفهومی نوآورانه که شامل فروش، اجاره، تعمیر، خدمات پس از فروش، مشاوره و تجربه عملی با رباتهاست!
📦 در این فروشگاه چه میبینید؟
▪️ رباتهای صنعتی، پزشکی، آموزشی و خانگی
▪️ قطعات برای مونتاژ و ارتقاء
▪️ محصولات شرکتهای برتر چینی با تمرکز بر قیمت مناسب و فراگیری
🎯 هدف: تبدیل رباتها به ابزاری روزمره همانند گوشی یا وسایل خانگی.
🔧 بازدیدکنندگان میتوانند با رباتها تعامل واقعی داشته باشند، مشاوره بگیرند و جدیدترین فناوریها را تجربه کنند.
📍 آینده خردهفروشی، هوشمندتر از همیشه...
#هوش_مصنوعی #رباتیک #خرده_فروشی_هوشمند #تکنولوژی
@rss_ai_ir
در شهر شنژن چین، اولین فروشگاه کاملاً تخصصی رباتها به سبک 6S راهاندازی شده؛ مفهومی نوآورانه که شامل فروش، اجاره، تعمیر، خدمات پس از فروش، مشاوره و تجربه عملی با رباتهاست!
📦 در این فروشگاه چه میبینید؟
▪️ رباتهای صنعتی، پزشکی، آموزشی و خانگی
▪️ قطعات برای مونتاژ و ارتقاء
▪️ محصولات شرکتهای برتر چینی با تمرکز بر قیمت مناسب و فراگیری
🎯 هدف: تبدیل رباتها به ابزاری روزمره همانند گوشی یا وسایل خانگی.
🔧 بازدیدکنندگان میتوانند با رباتها تعامل واقعی داشته باشند، مشاوره بگیرند و جدیدترین فناوریها را تجربه کنند.
📍 آینده خردهفروشی، هوشمندتر از همیشه...
#هوش_مصنوعی #رباتیک #خرده_فروشی_هوشمند #تکنولوژی
@rss_ai_ir
👍2🔥2👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥 مایکروسافت یک بار دیگر قدرت دادههای مصنوعی را در بینایی کامپیوتر به رخ کشید!
♻️مدلهای بینایی کامپیوتر انسانمحور امروزی نیازمند میلیاردها پارامتر، دیتاستهای عظیم و هزینههای بالای استنتاج هستند. اما آیا میتوان بدون صرف میلیونها دلار به همان دقت رسید؟
🔍 پاسخ مثبت است:
پژوهشگران مایکروسافت نشان دادهاند که مدلها میتوانند فقط با دادههای مصنوعی با کیفیت بالا آموزش ببینند و دقیقاً همان نتایج را ارائه دهند!
🔧 پروژه DAViD: چارچوبی متنباز برای تولید انسانهای دیجیتال با هندسه و بافت چهره دقیق.
🧠 کاربردهای کلیدی: • پیشبینی عمق (Depth Prediction)
• برآورد زاویهی سطح (Normal Estimation)
• سگمنتسازی پسزمینه و انسانها در عکس/ویدیو
🌟 چرا مهم است؟ • داده مصنوعی = لیبلگذاری پیکسلی بینقص
• تنوع بیپایان از زاویه، نور، صحنه، ژست
• مقیاسپذیری عالی برای آموزش از صفر یا فاینتیون کردن
📦 مایکروسافت همه چیز را متنباز کرده:
✅ ۳۰۰٬۰۰۰ نمونه
✅ مدلهای از پیشآموزشدیده
✅ کد کامل فریمورک
🔗 لینکها:
🔸 وبسایت پروژه
📄 مقاله آکادمیک
💻 کد در گیتهاب
🚀 اگر در حوزه بینایی کامپیوتر انسانمحور فعالیت میکنید، این پروژه یک نقطه شروع قدرتمند است — حتی بدون داده واقعی.
@rss_ai_ir
#بینایی_کامپیوتر #مایکروسافت #داده_مصنوعی #CV #هوش_مصنوعی #متن_باز
♻️مدلهای بینایی کامپیوتر انسانمحور امروزی نیازمند میلیاردها پارامتر، دیتاستهای عظیم و هزینههای بالای استنتاج هستند. اما آیا میتوان بدون صرف میلیونها دلار به همان دقت رسید؟
🔍 پاسخ مثبت است:
پژوهشگران مایکروسافت نشان دادهاند که مدلها میتوانند فقط با دادههای مصنوعی با کیفیت بالا آموزش ببینند و دقیقاً همان نتایج را ارائه دهند!
🔧 پروژه DAViD: چارچوبی متنباز برای تولید انسانهای دیجیتال با هندسه و بافت چهره دقیق.
🧠 کاربردهای کلیدی: • پیشبینی عمق (Depth Prediction)
• برآورد زاویهی سطح (Normal Estimation)
• سگمنتسازی پسزمینه و انسانها در عکس/ویدیو
🌟 چرا مهم است؟ • داده مصنوعی = لیبلگذاری پیکسلی بینقص
• تنوع بیپایان از زاویه، نور، صحنه، ژست
• مقیاسپذیری عالی برای آموزش از صفر یا فاینتیون کردن
📦 مایکروسافت همه چیز را متنباز کرده:
✅ ۳۰۰٬۰۰۰ نمونه
✅ مدلهای از پیشآموزشدیده
✅ کد کامل فریمورک
🔗 لینکها:
🔸 وبسایت پروژه
📄 مقاله آکادمیک
💻 کد در گیتهاب
🚀 اگر در حوزه بینایی کامپیوتر انسانمحور فعالیت میکنید، این پروژه یک نقطه شروع قدرتمند است — حتی بدون داده واقعی.
@rss_ai_ir
#بینایی_کامپیوتر #مایکروسافت #داده_مصنوعی #CV #هوش_مصنوعی #متن_باز
🔥4❤1👍1👏1
❓ در یک سامانه رباتیک بازوی صنعتی، کدامیک از گزینههای زیر مهمترین عامل در کنترل دقیق موقعیت انتهای بازو (End-Effector) است؟
Anonymous Quiz
26%
تعداد مفاصل و طول هر بخش از بازو
26%
نوع سنسور مجاورت استفادهشده در محیط
11%
دقت دوربین مورد استفاده در سیستم بینایی
37%
الگوریتم معکوس سینماتیک (Inverse Kinematics) برای محاسبه زاویه مفاصل
👍1🔥1🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
😎 وقتی با این همه علم هوش مصنوعی از سر کار برمیگردی، حس میکنی یه ابرقهرمان دیجیتالی هستی!
🕺 هوش مصنوعی روی شونهت
🎧 پرامپتها توی ذهنت
💻 و کلی پروژه توی لپتاپت!
📍 @rss_ai_ir
#زندگی_با_AI #حس_خفن #مهندس_هوش_مصنوعی #techvibes
🕺 هوش مصنوعی روی شونهت
🎧 پرامپتها توی ذهنت
💻 و کلی پروژه توی لپتاپت!
📍 @rss_ai_ir
#زندگی_با_AI #حس_خفن #مهندس_هوش_مصنوعی #techvibes
😁2👍1🕊1
💠 نسل جدید داراییهای سهبعدی با ویژگیهای فیزیکی واقعی PhysX‑3D:
✅داده بساز، رفتار فیزیکی شبیهسازی کن، مدل سهبعدی واقعی بساز.
---
🧠 پروژه PhysX-3D یک انقلاب در تولید آبجکتهای سهبعدی است. این سیستم نه فقط شکل ظاهری، بلکه خواص فیزیکی هر شی (مثل جرم، جنس، حرکتپذیری و...) را نیز تولید میکند.
📊 آنالیز دیتاست PhysXNet + PhysXNet-XL:
📌 توزیع اجزای مدلها (شکل a):
اکثر آبجکتها بین 1 تا 20 جزء دارند، که نشاندهنده طراحی ساده و کاربردی است.
📌 ابعاد فیزیکی واقعی (شکل b):
بیشتر اشیا اندازهای بین 50 تا 200 سانتیمتر دارند؛ بسیار مناسب برای کاربردهای واقعگرایانه مثل متاورس، AR/VR یا رباتها.
📌 نوع حرکات و مفاصل (شکل c - چپ):
بیش از ۴۰٪ اشیا دارای مفصل لغزنده (Prismatic) و ۳۷٪ بدون محدودیت حرکتیاند؛ یعنی تنوع بالایی در رفتار حرکتی دارند.
📌 خواص فیزیکی مواد (شکل c - میانی و راست):
* مدول یانگ (سختی ماده) بیشتر بین 2 تا 4 و 3 تا 10 است.
* نسبت پواسون غالباً 0.25 تا 0.3
* چگالی رایج بین 1 تا 2.5 g/cm³
📌 توزیع موضوعی دادهها (شکل d):
ابر کلمات نشان میدهد بیشترین آبجکتها شامل:
📌 PhysXNet-XL (شکل e)
نسخه بزرگتر دیتاست با تولید رویهای، که بیش از ۵۳٪ آن شامل cabinet و ۲۹٪ شامل table است؛ تمرکز روی کاربردهای indoor.
---
🎯 این آمار نشون میده که:
* دیتاست بسیار گسترده و تنوعپذیر طراحی شده.
* ویژگیهای فیزیکی کاملاً قابل کنترل و واقعیاند.
* کاربرد در رباتیک، بازیسازی، شبیهسازهای صنعتی و آموزش مدلهای فیزیکمحور بسیار بالاست.
🖥 Github: https://github.com/ziangcao0312/PhysX-3D
📕 Paper: https://arxiv.org/pdf/2507.12465v1.pdf
🔗 Dataset: https://paperswithcode.com/dataset/shapenet
📌 برای پروژه کامل به پست قبل مراجعه کنید.
📡 بیشتر در:
@rss_ai_ir
#PhysX #3DVision #هوش_مصنوعی #Simulation #فیزیک #مدل_سهبعدی #AI_3D
✅داده بساز، رفتار فیزیکی شبیهسازی کن، مدل سهبعدی واقعی بساز.
---
🧠 پروژه PhysX-3D یک انقلاب در تولید آبجکتهای سهبعدی است. این سیستم نه فقط شکل ظاهری، بلکه خواص فیزیکی هر شی (مثل جرم، جنس، حرکتپذیری و...) را نیز تولید میکند.
📊 آنالیز دیتاست PhysXNet + PhysXNet-XL:
📌 توزیع اجزای مدلها (شکل a):
اکثر آبجکتها بین 1 تا 20 جزء دارند، که نشاندهنده طراحی ساده و کاربردی است.
📌 ابعاد فیزیکی واقعی (شکل b):
بیشتر اشیا اندازهای بین 50 تا 200 سانتیمتر دارند؛ بسیار مناسب برای کاربردهای واقعگرایانه مثل متاورس، AR/VR یا رباتها.
📌 نوع حرکات و مفاصل (شکل c - چپ):
بیش از ۴۰٪ اشیا دارای مفصل لغزنده (Prismatic) و ۳۷٪ بدون محدودیت حرکتیاند؛ یعنی تنوع بالایی در رفتار حرکتی دارند.
📌 خواص فیزیکی مواد (شکل c - میانی و راست):
* مدول یانگ (سختی ماده) بیشتر بین 2 تا 4 و 3 تا 10 است.
* نسبت پواسون غالباً 0.25 تا 0.3
* چگالی رایج بین 1 تا 2.5 g/cm³
📌 توزیع موضوعی دادهها (شکل d):
ابر کلمات نشان میدهد بیشترین آبجکتها شامل:
Furniture
, Table
, Chair
, Lamp
, Lighting
, Cabinet
هستند.📌 PhysXNet-XL (شکل e)
نسخه بزرگتر دیتاست با تولید رویهای، که بیش از ۵۳٪ آن شامل cabinet و ۲۹٪ شامل table است؛ تمرکز روی کاربردهای indoor.
---
🎯 این آمار نشون میده که:
* دیتاست بسیار گسترده و تنوعپذیر طراحی شده.
* ویژگیهای فیزیکی کاملاً قابل کنترل و واقعیاند.
* کاربرد در رباتیک، بازیسازی، شبیهسازهای صنعتی و آموزش مدلهای فیزیکمحور بسیار بالاست.
🔗 Dataset: https://paperswithcode.com/dataset/shapenet
📌 برای پروژه کامل به پست قبل مراجعه کنید.
📡 بیشتر در:
@rss_ai_ir
#PhysX #3DVision #هوش_مصنوعی #Simulation #فیزیک #مدل_سهبعدی #AI_3D
Please open Telegram to view this post
VIEW IN TELEGRAM
❤2👍2🙏1
This media is not supported in your browser
VIEW IN TELEGRAM
🧠⌚ سنسورالام (SensorLM)؛ ساعتی که شما را مثل کتاب میخواند!
گوگل با استفاده از حدود ۶۰ میلیون ساعت داده ناشناس از ساعتهای هوشمند فیتبیت و پیکسل واچ، مدلی توسعه داده که قادر است اطلاعات خامی مثل ضربان قلب، تعداد قدمها و دمای بدن را به زبان طبیعی تبدیل کند.
📌 بهجای نمایش نمودارهای خشک، این مدل جملاتی مانند این تولید میکند:
«بعد از نوشیدن دومین فنجان قهوه، سطح استرس افزایش یافت، اما یک پیادهروی ۱۵ دقیقهای شما را به تعادل برگرداند.»
📊 روش کار تیم گوگل به این صورت بود:
۱. ساخت دیتاست عظیم شامل ۲.۵ میلیون روز فعالیت انسانی از ۱۲۷ کشور
۲. ایجاد برچسبگذاری چندلایه برای هر روز:
آمار: «پالس بین ۵۴ تا ۱۷۸، میانگین ۷۲»
ساختار: «افزایش تدریجی ضربان از ساعت ۱۱ تا ۱۲ ظهر»
معنا: «تمرین قدرتی به مدت ۲۶ دقیقه»
۳. آموزش ترنسفورمر چندوجهی با دو هدف:
مقایسه بین دادهی سنسور و متن (مثل مدل کلیپ)
تولید توضیح متنی (مثل مدل کوکا)
🚀 تواناییهای این مدل شامل موارد زیر است:
✔️ شناسایی دقیق فعالیت و استرس بدون نیاز به آموزش مجدد
✔️ پاسخ به درخواستهایی مانند «چه زمانی استرسم بالا بود؟» با بازههای زمانی دقیق
✔️ تطبیق با سبک زندگی کاربر تنها با چند نمونه
📌 مدل SensorLM، دادههای سنسوری دقیقهای را به زبان انسانی تبدیل میکند؛ حرکتی مهم برای از بین بردن شکاف میان دادهی خام و درک انسانی.
📄 مقاله: لینک
📎 بلاگ: لینک
📡 @rss_ai_ir
#سلامت_هوشمند #هوش_مصنوعی #گوگل #SensorLM #پوشیدنی #CLIP #CoCa #سلامت #AI
گوگل با استفاده از حدود ۶۰ میلیون ساعت داده ناشناس از ساعتهای هوشمند فیتبیت و پیکسل واچ، مدلی توسعه داده که قادر است اطلاعات خامی مثل ضربان قلب، تعداد قدمها و دمای بدن را به زبان طبیعی تبدیل کند.
📌 بهجای نمایش نمودارهای خشک، این مدل جملاتی مانند این تولید میکند:
«بعد از نوشیدن دومین فنجان قهوه، سطح استرس افزایش یافت، اما یک پیادهروی ۱۵ دقیقهای شما را به تعادل برگرداند.»
📊 روش کار تیم گوگل به این صورت بود:
۱. ساخت دیتاست عظیم شامل ۲.۵ میلیون روز فعالیت انسانی از ۱۲۷ کشور
۲. ایجاد برچسبگذاری چندلایه برای هر روز:
آمار: «پالس بین ۵۴ تا ۱۷۸، میانگین ۷۲»
ساختار: «افزایش تدریجی ضربان از ساعت ۱۱ تا ۱۲ ظهر»
معنا: «تمرین قدرتی به مدت ۲۶ دقیقه»
۳. آموزش ترنسفورمر چندوجهی با دو هدف:
مقایسه بین دادهی سنسور و متن (مثل مدل کلیپ)
تولید توضیح متنی (مثل مدل کوکا)
🚀 تواناییهای این مدل شامل موارد زیر است:
✔️ شناسایی دقیق فعالیت و استرس بدون نیاز به آموزش مجدد
✔️ پاسخ به درخواستهایی مانند «چه زمانی استرسم بالا بود؟» با بازههای زمانی دقیق
✔️ تطبیق با سبک زندگی کاربر تنها با چند نمونه
📌 مدل SensorLM، دادههای سنسوری دقیقهای را به زبان انسانی تبدیل میکند؛ حرکتی مهم برای از بین بردن شکاف میان دادهی خام و درک انسانی.
📄 مقاله: لینک
📎 بلاگ: لینک
📡 @rss_ai_ir
#سلامت_هوشمند #هوش_مصنوعی #گوگل #SensorLM #پوشیدنی #CLIP #CoCa #سلامت #AI
❤2👍1🔥1
This media is not supported in your browser
VIEW IN TELEGRAM
🎥✨ مدل Aleph از Runway؛ فتوشاپی برای ویدیو، اما با جادوی هوش مصنوعی!
پلتفرم Runway بهتازگی از مدل Aleph رونمایی کرده؛ مدلی که میتوان آن را «فوتوشاپ برای ویدیو» نامید – البته فعلاً فقط برای ویدیوهای ۵ ثانیهای!
🧪 این مدل به کاربران اجازه میدهد تا:
🎭 چهرهها، اجسام و صحنهها را با دستورات متنی یا بصری تغییر دهند
🖌 بافت و استایل دلخواه را به کلیپها اضافه کنند
🪄 ویدیوها را فریم به فریم ادیت کنند، بدون نیاز به مهارت فنی در تدوین
🧠 از پایه برای ویرایش و بازسازی واقعگرایانه ویدیو طراحی شده؛ درست مثل یک مدل مولد قدرتمند که دنیای گرافیک را متحول میکند.
📎 اطلاعات بیشتر:
https://runwayml.com/research/introducing-runway-aleph
🧩 نتیجه؟ همانطور که Stable Diffusion عکاسی را تغییر داد، Aleph نیز آماده است تا تدوین ویدیو را متحول کند.
🎬 منتظر ویدیوهای خلاقانهتر، کوتاهتر و باحالتر از همیشه باشید!
📡 @rss_ai_ir
#ویدیو_هوشمند #runway #Aleph #هوش_مصنوعی #ویرایش_ویدیو #مدل_مولد #AI
پلتفرم Runway بهتازگی از مدل Aleph رونمایی کرده؛ مدلی که میتوان آن را «فوتوشاپ برای ویدیو» نامید – البته فعلاً فقط برای ویدیوهای ۵ ثانیهای!
🧪 این مدل به کاربران اجازه میدهد تا:
🎭 چهرهها، اجسام و صحنهها را با دستورات متنی یا بصری تغییر دهند
🖌 بافت و استایل دلخواه را به کلیپها اضافه کنند
🪄 ویدیوها را فریم به فریم ادیت کنند، بدون نیاز به مهارت فنی در تدوین
🧠 از پایه برای ویرایش و بازسازی واقعگرایانه ویدیو طراحی شده؛ درست مثل یک مدل مولد قدرتمند که دنیای گرافیک را متحول میکند.
📎 اطلاعات بیشتر:
https://runwayml.com/research/introducing-runway-aleph
🧩 نتیجه؟ همانطور که Stable Diffusion عکاسی را تغییر داد، Aleph نیز آماده است تا تدوین ویدیو را متحول کند.
🎬 منتظر ویدیوهای خلاقانهتر، کوتاهتر و باحالتر از همیشه باشید!
📡 @rss_ai_ir
#ویدیو_هوشمند #runway #Aleph #هوش_مصنوعی #ویرایش_ویدیو #مدل_مولد #AI
👍2🔥1🤯1
This media is not supported in your browser
VIEW IN TELEGRAM
📚 حالت Study Mode به ChatGPT اضافه شد!
✳️هوش مصنوعی دیگه فقط برای گرفتن جواب نیست! با ویژگی جدید OpenAI، یعنی Study Mode، یادگیری تعاملی و هدفمند وارد مرحله تازهای شده.
🧠 در این حالت:
♻️بهجای دادن پاسخ نهایی، مدل سوالهای راهنما میپرسه
♻️آموزش رو مرحلهبهمرحله جلو میبره
♻️سطح شما، هدف یادگیری و حتی تاریخچه چتها رو در نظر میگیره
♻️کوییز میگیره، نکات رو ارزیابی میکنه و یادگیری فعال رو تقویت میکنه
🔍 این یعنی ChatGPT تبدیل میشه به یک معلم خصوصی که:
♻️شما رو به فکر کردن وادار میکنه
♻️مفاهیم سخت رو با تصویرسازی شفاف توضیح میده (در نسخههای آینده)
♻️و بهمرور پیشرفتتون رو دنبال میکنه
🎓 برای همه کاربران نسخه رایگان، پلاس، پرو و تیم فعال شده. هنوز در مرحله ابتدایی هست ولی با بازخورد کاربرها قراره بهتر هم بشه!
📎 chatgpt.com/study
🔸 @rss_ai_ir
#مطالعه_هوشمند #آموزش_تعاملی #هوش_مصنوعی #ChatGPT #StudyMode #یادگیری
✳️هوش مصنوعی دیگه فقط برای گرفتن جواب نیست! با ویژگی جدید OpenAI، یعنی Study Mode، یادگیری تعاملی و هدفمند وارد مرحله تازهای شده.
🧠 در این حالت:
♻️بهجای دادن پاسخ نهایی، مدل سوالهای راهنما میپرسه
♻️آموزش رو مرحلهبهمرحله جلو میبره
♻️سطح شما، هدف یادگیری و حتی تاریخچه چتها رو در نظر میگیره
♻️کوییز میگیره، نکات رو ارزیابی میکنه و یادگیری فعال رو تقویت میکنه
🔍 این یعنی ChatGPT تبدیل میشه به یک معلم خصوصی که:
♻️شما رو به فکر کردن وادار میکنه
♻️مفاهیم سخت رو با تصویرسازی شفاف توضیح میده (در نسخههای آینده)
♻️و بهمرور پیشرفتتون رو دنبال میکنه
🎓 برای همه کاربران نسخه رایگان، پلاس، پرو و تیم فعال شده. هنوز در مرحله ابتدایی هست ولی با بازخورد کاربرها قراره بهتر هم بشه!
📎 chatgpt.com/study
🔸 @rss_ai_ir
#مطالعه_هوشمند #آموزش_تعاملی #هوش_مصنوعی #ChatGPT #StudyMode #یادگیری
👍3❤1🔥1👏1
This media is not supported in your browser
VIEW IN TELEGRAM
🛥 استفادهی هوشمندانه از عامل ChatGPT برای کنترل دوربین مداربسته!
✳️در این کاربرد جذاب، یک عامل (Agent) مبتنی بر ChatGPT به صورت زنده دوربین نظارتی را کنترل میکند — دنبال یک قایق فیروزهای رنگ میگردد و سعی میکند نام نوشتهشده روی آن را بخواند.
📸 چه کارهایی انجام میدهد؟
♻️خودش دوربین را زوم میکند
♻️زاویه را به سمت چپ یا راست تغییر میدهد
♻️زاویه دید مناسب را انتخاب میکند
♻️و در طول کار، بهصورت زنده گزارش عملکردش را میدهد:
«زوم میکنم... کمی به چپ حرکت میدم... دوربین را میچرخونم تا زاویه بهتری بگیرم...»
⚡️ نتیجه؟
این عامل بهخوبی از عهدهی کاری برمیآید که تا همین چند وقت پیش فقط از انسانها برمیآمد.
🔸 @rss_ai_ir
#هوش_مصنوعی #عامل_هوشمند #دوربین_هوشمند #ChatGPT #AI_Agent
✳️در این کاربرد جذاب، یک عامل (Agent) مبتنی بر ChatGPT به صورت زنده دوربین نظارتی را کنترل میکند — دنبال یک قایق فیروزهای رنگ میگردد و سعی میکند نام نوشتهشده روی آن را بخواند.
📸 چه کارهایی انجام میدهد؟
♻️خودش دوربین را زوم میکند
♻️زاویه را به سمت چپ یا راست تغییر میدهد
♻️زاویه دید مناسب را انتخاب میکند
♻️و در طول کار، بهصورت زنده گزارش عملکردش را میدهد:
«زوم میکنم... کمی به چپ حرکت میدم... دوربین را میچرخونم تا زاویه بهتری بگیرم...»
⚡️ نتیجه؟
این عامل بهخوبی از عهدهی کاری برمیآید که تا همین چند وقت پیش فقط از انسانها برمیآمد.
🔸 @rss_ai_ir
#هوش_مصنوعی #عامل_هوشمند #دوربین_هوشمند #ChatGPT #AI_Agent
👍3❤2🔥1👏1
📸 رتبهبندی جدید مدلهای تولید تصویر با هوش مصنوعی منتشر شد
@rss_ai_ir
🏆 مدل «Seedream 3.0» از شرکت ByteDance موفق شد جایگاه نخست را از GPT-4o بگیرد و در صدر قرار گیرد.
📉 مدل GPT-4o از OpenAI با اختلافی اندک در رتبه دوم قرار گرفته و مدلهای مختلف Imagen 4 از گوگل همچنان در تعقیب هستند اما هنوز به صدر نرسیدهاند.
📅 این مدلها همگی در بازه زمانی فروردین تا خرداد ۱۴۰۴ منتشر شدهاند و رقابت میان آنها شدیدتر از همیشه است.
⚙️ نکته جالب آن است که Seedream تنها با یک کارت گرافیک اجرا میشود و با این حال دقت بالایی دارد.
❓آیا عصر جدیدی برای تولید تصویر با هوش مصنوعی آغاز شده؟
❓آیا گوگل میتواند در بهروزرسانی بعدی صدر را پس بگیرد؟
📲 دیدگاه شما درباره این رقابت چیست؟
#هوش_مصنوعی #مدل_تصویرساز #تولید_تصویر
@rss_ai_ir
@rss_ai_ir
🏆 مدل «Seedream 3.0» از شرکت ByteDance موفق شد جایگاه نخست را از GPT-4o بگیرد و در صدر قرار گیرد.
📉 مدل GPT-4o از OpenAI با اختلافی اندک در رتبه دوم قرار گرفته و مدلهای مختلف Imagen 4 از گوگل همچنان در تعقیب هستند اما هنوز به صدر نرسیدهاند.
📅 این مدلها همگی در بازه زمانی فروردین تا خرداد ۱۴۰۴ منتشر شدهاند و رقابت میان آنها شدیدتر از همیشه است.
⚙️ نکته جالب آن است که Seedream تنها با یک کارت گرافیک اجرا میشود و با این حال دقت بالایی دارد.
❓آیا عصر جدیدی برای تولید تصویر با هوش مصنوعی آغاز شده؟
❓آیا گوگل میتواند در بهروزرسانی بعدی صدر را پس بگیرد؟
📲 دیدگاه شما درباره این رقابت چیست؟
#هوش_مصنوعی #مدل_تصویرساز #تولید_تصویر
@rss_ai_ir
👍1🔥1👏1