VIRSUN

🩺 وقتی هوش مصنوعی از بسیاری از پزشکان بهتر عمل می‌کند

✅داریو آمودئی، مدیرعامل Anthropic، می‌گوید:

❌برخی از برندگان نوبل در زیست‌شناسی امروز از LLMها (مدل‌های زبانی بزرگ) مشاوره‌های بهتری نسبت به اکثر پزشکان دریافت می‌کنند.

🔹 او تأکید می‌کند که البته ۱٪ برتر پزشکان همچنان ارزش مراجعه حضوری دارند،
اما برای بقیه موارد، LLMها سریع‌تر، سازگارتر و دقیق‌تر عمل می‌کنند.

💡 چرا؟
زیرا بخش زیادی از کار پزشکی الگو‌یابی و ترکیب حقایق است، و این دقیقاً همان چیزی است که LLMها در آن می‌درخشند.

🌐 #هوش_مصنوعی #پزشکی_دیجیتال #LLM #AIHealthcare
🧠 @rss_ai_ir

❤8🔥7🎉7👍3😁1

216 viewsedited 03:21

VIRSUN

❓ در سامانه‌های بینایی ماشین مبتنی بر LiDAR، کدام ویژگی باعث می‌شود این فناوری برای نقشه‌برداری سه‌بعدی در محیط‌های صنعتی نسبت به دوربین RGB برتری داشته باشد؟

Anonymous Quiz

توانایی ثبت رنگ سطوح با دقت بالا

86%

قابلیت اندازه‌گیری مستقیم فاصله تا اشیا با استفاده از زمان پرواز پالس لیزر

مصرف انرژی کمتر در مقایسه با دوربین‌های معمولی

14%

نیاز نداشتن به پردازش پس از جمع‌آوری داده‌ها

🔥11😁6❤5👍2🎉1

14 voters196 views03:33

VIRSUN

This media is not supported in your browser

VIEW IN TELEGRAM

🚗 سیستم دوربین ۳۶۰ درجه خودرو (Surround View Monitoring)

سیستم دوربین ۳۶۰ درجه یا همان SVM – Surround View Monitoring یکی از فناوری‌های پیشرفته در حوزه کمک‌راننده یا ADAS است که با ترکیب تصاویر چند دوربین، نمایی کامل و پیوسته از محیط اطراف خودرو ایجاد می‌کند. این فناوری علاوه بر افزایش ایمنی، در پارک خودکار و رانندگی نیمه‌خودران نیز نقش کلیدی دارد.

---

🔍 ساختار و اجزای اصلی

1. دوربین‌ها

♻️دوربین جلو: نصب شده در بخش جلویی خودرو (معمولاً پشت لوگو یا جلوپنجره).
♻️دوربین عقب: نصب شده روی درب صندوق یا سپر عقب.
♻️دوربین‌های جانبی: تعبیه شده زیر آینه‌های بغل.
♻️هر دوربین معمولاً زاویه دیدی بیش از ۱۸۰ درجه دارد.

2. واحد پردازش تصویر

♻️حذف اعوجاج لنز (Lens Distortion Correction).
♻️ترکیب تصاویر (Image Stitching) برای ایجاد نمای یکپارچه.
♻️پردازش سریع با تأخیر بسیار کم برای نمایش لحظه‌ای.

3. نمایشگر داخل کابین

♻️نمایش نمای از بالا یا Bird’s Eye View.
♻️امکان تغییر نما به حالت سه‌بعدی، چند زاویه‌ای یا بزرگ‌نمایی.

---

⚙️ مراحل عملکرد

1. تصویربرداری همزمان از چهار یا چند دوربین با لنز واید.
2. کالیبراسیون دوربین‌ها برای تعیین موقعیت دقیق هر دوربین نسبت به خودرو.
3. تصحیح پرسپکتیو برای هماهنگ‌سازی زاویه دید.
4. ترکیب نرم و بدون مرز تصاویر (Image Blending).
5. نمایش خروجی نهایی به صورت آنی روی نمایشگر خودرو.

---

🧠 کاربرد هوش مصنوعی در این فناوری

♻️شناسایی موانع با مدل‌های بینایی ماشین مانند YOLO یا EfficientDet.
♻️هشدار برخورد با پیش‌بینی مسیر حرکت خودرو.
♻️شناسایی خطوط پارک برای پارک خودکار.
♻️تشخیص عابر پیاده در نقاط کور.

---

📊 مزایا و کاربردها

♻️افزایش ایمنی در محیط‌های شلوغ.
♻️تسهیل پارک حتی در فضاهای کوچک.
♻️کمک به مانورهای پیچیده مانند حرکت دنده عقب در مسیر باریک.
♻️کاهش ریسک برخورد با اجسام کوچک یا کودکان.
---

⚠️ چالش‌ها و محدودیت‌ها

♻️افت کیفیت تصویر در نور کم.
♻️نیاز به کالیبراسیون مجدد پس از تعمیر یا تعویض قطعات.
♻️هزینه بالای سیستم‌های پیشرفته مجهز به هوش مصنوعی.
---

🌐 #فناوری_خودرو #ADAS #بینایی_ماشین #پردازش_تصویر #هوش_مصنوعی
🧠 @rss_ai_ir

👍8❤5🔥5🎉4😁3

793 views03:43

VIRSUN

This media is not supported in your browser

VIEW IN TELEGRAM

🛰 جدیدترین روش‌های ترکینگ (Object Tracking) در بینایی ماشین

ترکینگ یا ردیابی اشیا یکی از مباحث کلیدی در بینایی ماشین است که هدف آن دنبال کردن یک یا چند هدف در توالی فریم‌های ویدئویی می‌باشد. در سال‌های اخیر، پیشرفت چشمگیری در این حوزه به کمک یادگیری عمیق رخ داده و روش‌ها به سمت دقیق‌تر، سریع‌تر و مقاوم‌تر در برابر چالش‌ها حرکت کرده‌اند.

---

🔹 ۱. ترکینگ تک‌شیء (Single Object Tracking – SOT)

در این روش‌ها تمرکز روی ردیابی یک هدف مشخص است.
جدیدترین رویکردها:
۱. شبکه‌های سیامی (Siamese Networks) مانند SiamRPN++، SiamMask، SiamBAN

✳️ایده: استخراج ویژگی از تصویر هدف و فریم جدید و مقایسه شباهت‌ها.
✳️ مزیت: سرعت بسیار بالا و قابل استفاده در ریل‌تایم.
✳️ چالش: حساسیت به تغییر شکل یا تغییر مقیاس شدید.

۲. ترنسفورمرمحور (Transformer-based Trackers) مانند TransT، STARK

✳️ ایده: استفاده از ویژن ترنسفورمر (ViT) برای مدل‌سازی وابستگی‌های بلندمدت بین فریم‌ها.
✳️ مزیت: دقت بالا حتی در شرایط نور و زاویه متفاوت.
✳️ چالش: نیاز به توان پردازشی بالاتر نسبت به CNN.

---

🔹 ۲. ترکینگ چندشیء (Multi-Object Tracking – MOT)

در این روش ردیابی چندین هدف همزمان مانند عابرین یا خودروها انجام می‌شود.
جدیدترین رویکردها:
۱. تشخیص و ردیابی همزمان (Joint Detection and Tracking) مانند FairMOT، CenterTrack، ByteTrack

✳️ایده: ادغام شناسایی و ردیابی در یک شبکه عصبی.
✳️ مزیت: دقت و سرعت بالا، کاهش خطاهای identity switch.

۲. ترنسفورمرمحور در MOT مانند MOTR، MeMOT

✳️ ایده: استفاده از ترنسفورمر برای مدل‌سازی وابستگی بین مسیر حرکت اشیا.
✳️ مزیت: عملکرد پایدار در صحنه‌های شلوغ و با پوشانندگی بالا.

۳. یادگیری انتهابه‌انتها (End-to-End Learning) مانند TrackFormer

✳️ایده: آموزش یک مدل واحد برای شناسایی و ردیابی بدون نیاز به پردازش‌های بعدی پیچیده.
✳️ مزیت: سادگی و کاهش زمان پردازش.

---

🔹 ۳. روش‌های هیبریدی (Hybrid Approaches)

در این روش‌ها Tracking-by-Detection با Optical Flow یا فیلتر کالمن و ذره‌ای ترکیب می‌شود.

✳️ نمونه: استفاده از YOLOv8 یا DETR برای تشخیص و فیلتر کالمن برای پیش‌بینی مسیر.
✳️ مزیت: ایجاد تعادل بین دقت و سرعت.

---

🔹 ۴. چالش‌های مهم و راهکارها

✳️پوشانده شدن هدف (Occlusion) → استفاده از حافظه بلندمدت مانند LSTM یا Transformer Memory.
✳️ تغییر مقیاس و ظاهر → بهره‌گیری از Data Augmentation گسترده و شبکه‌های چندمقیاسی.
✳️ پردازش بلادرنگ → استفاده از مدل‌های سبک مانند NanoTrack و YOLOv8-Track.

---

🌐 #بینایی_ماشین #ردیابی_اشیا #هوش_مصنوعی #پردازش_تصویر
🧠 @rss_ai_ir

👍7🔥6❤5😁5🎉3🙏1

798 views04:57

VIRSUN

🔍 انتشار دیتابیس پژوهشی: مزایا و معایب

✅ مزایا

✳️ افزایش اعتبار علمی و بیشتر شدن استنادها
✳️ تسریع پیشرفت علمی و صرفه‌جویی در وقت پژوهشگران
✳️ ایجاد امکان مقایسه عادلانه مدل‌ها
✳️ جذب همکاری‌های علمی و صنعتی جدید
✳️ شفافیت علمی و بازتولید نتایج

❌ معایب / ریسک‌ها

⛔️ از دست رفتن انحصار و مزیت رقابتی
⛔️ احتمال سوءاستفاده یا استفاده نادرست
⛔️ مسائل حقوقی و مالکیت داده‌ها
⛔️ ریسک حریم خصوصی و محرمانگی اطلاعات
⛔️ رقابت مستقیم و پیشی گرفتن دیگران در نتایج

📌 جمع‌بندی:
اگر داده‌ها عمومی و غیرحساس باشند، انتشارشان ارزشمند است.
اما در صورت صنعتی یا محرمانه بودن، بهتر است محدود یا تحت قرارداد به اشتراک گذاشته شوند.

#داده #تحقیق #هوش_مصنوعی #پژوهش
@rss_ai_ir

👍7🎉7🔥5❤4😁4🙏1

768 viewsedited 05:13

VIRSUN

0:05

This media is not supported in your browser

VIEW IN TELEGRAM

📌 نقشه راه برای تبدیل شدن به پرامپت انجینیر در سال ۲۰۲۵ 🧑🏻‍💻✨

برای متخصص شدن در حوزه Prompt Engineering باید مسیر زیر را طی کنید:

1️⃣ یادگیری مبانی اولیه پرامپت‌نویسی
2️⃣ آشنایی با مدل‌های زبانی (LLMs) و نحوه تنظیم آن‌ها
3️⃣ تمرین نوشتن پرامپت‌های کارآمد و بهینه
4️⃣ ساخت الگوهای پرامپت و درک معماری آن‌ها
5️⃣ تسلط بر تکنیک‌های پیشرفته در پرامپت‌نویسی
6️⃣ تجربه کار با مدل‌های چندوجهی (متنی–تصویری–صوتی)
7️⃣ تمرین مداوم برای تبدیل شدن به یک پرامپت‌نویس حرفه‌ای

🌐 آینده مشاغل مرتبط با هوش مصنوعی نیازمند مهارت در پرامپت‌نویسی است. کسی که این مهارت را دارد، نقش کلیدی در جهت‌دهی به مدل‌های هوش مصنوعی ایفا می‌کند.

#هوش_مصنوعی #PromptEngineering #AI #LLM #DeepLearning
@rss_ai_ir

👍9🔥6❤4🎉4😁1

826 viewsedited 05:26

VIRSUN

🛡️ ورود هوش مصنوعی به خط مقدم دفاع سایبری

هکرها امروز با کمک هوش مصنوعی به‌راحتی حملات فیشینگ بدون خطا، دیپ‌فیک‌ها و کدنویسی مخرب انجام می‌دهند. در پاسخ، شرکت‌ها نیز به سمت استفاده از عامل‌های هوش مصنوعی برای مقابله رفته‌اند.

🤖 پلتفرم ReliaQuest GreyMatter Agentic Teammates می‌تواند ایمیل‌های آلوده را قرنطینه کند، حساب‌های هک‌شده را قفل کند و بررسی تهدیدات را به‌طور خودکار انجام دهد.
⚡ این رویکرد بار زیادی را از دوش تحلیلگران انسانی برمی‌دارد تا آن‌ها روی نبردهای سایبری فعال تمرکز کنند.
❌ هدف این فناوری جایگزینی انسان نیست، بلکه مقابله با حملات هوش مصنوعی پیش از گسترش آن‌هاست.
📣 مدیران امنیتی تأکید می‌کنند که این ابزارها برای تقویت نیروهای انسانی طراحی شده‌اند، نه حذف آن‌ها.

وقتی مهاجمان سطح حملات خود را ارتقا می‌دهند، دفاع سایبری نمی‌تواند آنالوگ باقی بماند.

🌐 #امنیت_سایبری #هوش_مصنوعی #حمله_سایبری #AI_cyberdefense
🧠 @rss_ai_ir 🪙 🥇

🎉10❤6👍6🔥2👏1😁1

789 viewsedited 08:56

VIRSUN

1:00

This media is not supported in your browser

VIEW IN TELEGRAM

📊 شکاف قدرت محاسباتی هوش مصنوعی؛ آمریکا جلوتر از چین

🇺🇸 ایالات متحده مالک بیشترین منابع محاسباتی جهان برای آموزش مدل‌های هوش مصنوعی است و همچنان قوی‌ترین کلسترها را توسعه می‌دهد.

🇨🇳 چین در تلاش برای جبران عقب‌ماندگی است:

♻️تا سال ۲۰۲۵ حدود ۹۸ میلیارد دلار سرمایه‌گذاری می‌کند (+۴۸٪ نسبت به ۲۰۲۴)
♻️۵۶ میلیارد از سمت دولت و ۲۴ میلیارد از سوی غول‌های اینترنتی
♻️محدودیت‌های صادرات GPUهای پیشرفته رشد سریع را دشوار کرده است

🔧 چالش سخت‌افزاری

♻️آمریکا صادرات GPUهای برتر Nvidia و AMD را ممنوع کرده
♻️چین روی Huawei Ascend 910C حساب باز کرده (نسخه دوبرابر 910B)؛ اما همچنان از نظر سرعت، حافظه و اکوسیستم نرم‌افزاری ضعیف‌تر است

📜 بازی سیاسی

♻️آمریکا فروش نسخه‌های ضعیف‌تر H20 و MI308 را مجاز کرده؛ اما ۱۵٪ از درآمد آن به خزانه آمریکا می‌رود
♻️این اجازه دسترسی به GPUهای متوسط را فراهم می‌کند، ولی تراشه‌های رده‌بالا همچنان ممنوع هستند

⚡ چرا آمریکا جلوتر است؟

♻️حتی H20 هم از Huawei 910B قوی‌تر است
♻️نرم‌افزار Nvidia بسیار بالغ‌تر است و کارایی واقعی را افزایش می‌دهد
♻️آموزش مدل‌های بزرگ در چین هنوز پرهزینه‌تر و زمان‌برتر از آمریکا است

#هوش_مصنوعی 🤖 #AI_policy 📜 #محاسبات_پیشرفته ⚡ #Nvidia #Huawei #GPU #ایالات_متحده #چین
@rss_ai_ir

👍2🔥1👏1

741 viewsedited 09:03

VIRSUN

❓ در مدل‌های زبانی بزرگ، چرا افزایش اندازه پنجره زمینه (Context Window) اهمیت دارد؟

Anonymous Quiz

برای کاهش تعداد پارامترهای مدل و سبک‌تر شدن شبکه

73%

برای امکان درک وابستگی‌های طولانی‌تر در متن و تولید پاسخ‌های منسجم‌تر

برای کاهش نیاز به داده‌های آموزشی در مرحله پیش‌تمرین

14%

برای جلوگیری از بیش‌برازش روی داده‌های کوچک

👍13🎉8😁6❤5🔥4👏1

22 voters737 views09:15

VIRSUN

0:12

This media is not supported in your browser

VIEW IN TELEGRAM

0:10

This media is not supported in your browser

VIEW IN TELEGRAM

🎮 آینده بازی‌سازی با هوش مصنوعی

♻️شرکت Tencent فریم‌ورک جدیدی به نام Yan معرفی کرده که می‌تواند به شکل تعاملی و بلادرنگ، دنیای مجازی در سطح AAA بسازد. این سیستم بر پایه مدل‌های دیفیوشن طراحی شده و سه ماژول اصلی دارد:

🟡 Yan-Sim

✅شبیه‌سازی فیزیک واقعی و رندر 1080p با 60fps

✅فشرده‌سازی مکانی ۸ تا ۳۲ برابر و فشرده‌سازی زمانی ×۲

✅استفاده از causal temporal attention برای تولید فریم به فریم

✅تکنیک‌های بهینه‌سازی: DDIM با ۴ استپ، sliding window denoising، KV caching، pruning، و کوانتیزیشن به FP8

✅خروجی: تولید ویدئو تعاملی بی‌نهایت با تأخیر تنها 0.07 ثانیه

🟡 Yan-Gen

✳️تولید جهان چندوجهی (متن + تصویر) با توصیف سلسله‌مراتبی

✳️سطح جهانی: سبک، نورپردازی و توپولوژی ثابت جهان

✳️سطح محلی: رویدادها و تعاملات پویا

✳️امکان ترکیب سبک یک بازی با مکانیک بازی دیگر

✳️بعد از distillation: اجرای بلادرنگ با 12-17 FPS روی یک H20 یا تا 30FPS روی ۴ کارت

🟡 Yan-Edit

♻️ویرایش دنیای ساخته‌شده با دستورات متنی

♻️جداسازی شبیه‌سازی مکانیک (بر پایه نقشه‌های عمق) از رندرینگ تصویری

♻️رندرینگ توسط Yan-Gen + ControlNet با حفظ ساختار سه‌بعدی

♻️پشتیبانی از دستورات ساختاری ("افزودن شیء") و دستورات ظاهری ("تغییر رنگ")

📌 فعلاً تنها ویدیوهای دمو و گزارش فنی منتشر شده‌اند، اما قول داده شده که ماژول‌های Yan به‌صورت جداگانه عرضه شوند.

#هوش_مصنوعی 🤖 #بازی_سازی 🎮 #مدل_دیفیوشن #Tencent #AI_gaming

@rss_ai_ir

🎉11❤10👍7😁5🔥3

828 views09:20

VIRSUN

🚨 چه زمانی شغلت با پیشرفت هوش مصنوعی در خطر است؟

هوش مصنوعی قرار نیست همه رو شکست بده؛ فقط کسانی رو که در برابر تغییر منفعل می‌مونن. 👇

🔹 کارهای تکراری
اگر شغلت پر از وظایف روتین و ساده باشه (مثل ورود داده، ترجمه سطحی، یا پردازش فرم‌ها)، خیلی سریع‌تر جایگزین میشه.

🔹 یاد نگرفتن مهارت‌های جدید
کسی که کار با ابزارهای هوش مصنوعی رو یاد نگیره، به‌مرور از بقیه عقب می‌افته.

🔹 نداشتن مهارت ترکیبی
یک مهارت ساده کافی نیست. ترکیب مهارت‌ها (مثل مهندسی + AI یا مدیریت + تحلیل داده) جلوی شکست رو می‌گیره.

🔹 مقاومت در برابر تغییر
اگر هوش مصنوعی رو تهدید ببینی و ازش استفاده نکنی، همکارانی که زودتر به‌کار بگیرنش، موفق‌تر خواهند شد.

🔹 اتکا فقط به تجربه‌های گذشته
حتی متخصصان باتجربه هم اگر به‌روز نشن و از AI کمک نگیرن، موقعیتشون رو از دست می‌دن.

✅ پس به‌جای رقابت با AI، اون رو به ابزار شخصی خودت تبدیل کن؛ کارهای تکراری رو بهش بسپار و تمرکزت رو بذار روی خلاقیت، تحلیل و تصمیم‌گیری.

🌐 @rss_ai_ir
#هوش_مصنوعی #آینده_شغلی #DeepLearning

👍8🔥8😁7❤6🎉5

869 views09:25

VIRSUN

🔥 شفاف‌سازی بزرگ: DeepSeek-V2 در برابر غول آینده، DeepSeek-R2! 🔥

شاید شما هم شنیده باشید و بپرسید: "مگر الان DeepSeek-2 در دسترس نیست؟ 🤔 پس این همه هیجان برای چیست؟"

بله درسته، اما مدلی که الان موجوده با هیولایی که تا چند هفته دیگه از راه میرسه، دو داستان کاملاً متفاوته! بیاید یک بار برای همیشه این دو رو از هم جدا کنیم:

---

🏆 مدل فعلی: DeepSeek-V2 (قهرمان امروز)

این همون مدل قدرتمند و متن-بازی هست که چند ماه پیش عرضه شد و کلی سر و صدا کرد. با معماری بهینه MoE و ۲۳۶ میلیارد پارامتر، خودش رو به عنوان یک رقیب جدی برای بهترین‌های بازار ثابت کرد. این مدل، پایه و اساس موفقیت DeepSeek بود.

---

🚀 مدل آینده: DeepSeek-R2 (انقلاب فردا)

این همون غول مرحله آخریه که همه منتظرشیم و قراره اواخر ماه آگوست (اوایل شهریور) رونمایی بشه. این یک آپدیت ساده نیست، یک بازطراحی کامله!

✨ تفاوت‌های کلیدی R2:

🧠 معماری تکامل‌یافته: استفاده از Hybrid MoE با یک شبکه Gating فوق هوشمند که پردازش‌ها رو بهینه‌تر از همیشه می‌کنه.

📈 جهش پارامتری: صعود از ۲۳۶ میلیارد به عدد سرسام‌آور ۱.۲ تریلیون پارامتر! یعنی توانایی درک و تحلیلی در مقیاسی کاملاً جدید. 🤯

💰 برگ برنده اصلی: اینجاست که بازی عوض میشه! ادعای شگفت‌انگیز کاهش هزینه تا ۹۷٪ نسبت به مدل‌هایی مثل GPT-4o. اگر واقعی باشه، یک زلزله در دنیای AI خواهد بود!

🇨🇳 قدرت‌نمایی سخت‌افزاری: آموزش کامل بر روی تراشه‌های پیشرفته Ascend هواوی، که نشان از استقلال و پیشرفت چین در برابر انویدیا داره.

نتیجه‌گیری:
پس بله، DeepSeek-V2 عالیه، اما DeepSeek-R2 قراره قوانین بازی رو عوض کنه. جنگ آینده فقط سر "قوی‌ترین" بودن نیست، بلکه سر "بهینه‌ترین و ارزان‌ترین" بودنه.

شهریور ماه، شاهد یکی از سنگین‌ترین نبردهای تاریخ هوش مصنوعی خواهیم بود. آماده باشید! 💥

#هوش_مصنوعی #دیپ_سیک #تکنولوژی #DeepSeekR2 #GPT5 #رقابت_هوش_مصنوعی
@rss_ai_ir

❤16🎉9👍8😁7🔥3👏1

1.49K views09:48

VIRSUN

🚀مدل MolmoAct: نسل تازه مدل‌های بینایی-زبان-اکشن برای رباتیک

🧩 پژوهشگران در مقاله‌ای جدید MolmoAct را معرفی کرده‌اند؛ یک مدل متن‌باز VLA (Vision-Language-Action) که برای دستکاری رباتیک طراحی شده و با استدلال فضایی چندمرحله‌ای کار می‌کند.

🔹 ایده کلیدی
برخلاف روش‌های مرسوم end-to-end که از تصویر مستقیم به اکشن می‌روند، MolmoAct یک لایه میانی استدلال فضایی اضافه می‌کند تا:

♻️تعمیم‌پذیری بهتر

♻️شفافیت در تصمیم‌گیری

♻️امکان تعامل و اصلاح توسط کاربر

🔹 مراحل تولید خودبازگشتی (ARM)
مدل با ورودی تصویری + دستور زبانی سه نوع توکن تولید می‌کند:

1. توکن‌های عمق → نمایش هندسه سه‌بعدی صحنه

2. توکن‌های استدلال تصویری → مسیر دوبعدی (Polyline) برنامه‌ریزی‌شده برای ابزار انتهایی

3. توکن‌های اکشن سطح پایین

🔹 نتایج برجسته

📈 86.6% میانگین موفقیت در دیتاست LIBERO (بهترین عملکرد نسبت به همه مدل‌های پایه)

🦾 در وظایف واقعی، تا 22.7% بهبود پیشرفت کارها نسبت به خط پایه π-FAST در کارهای دو-دستی

🔹 اهمیت برای صنعت
ساختار شفاف و قابل‌ویرایش MolmoAct این امکان را می‌دهد که کاربران مسیر حرکت ربات را ویرایش کنند (Editable Trajectory Steering) و همین قابلیت آن را برای ربات‌های صنعتی و همکاری انسان-ماشین بسیار ارزشمند می‌کند.

📚 منبع: arXiv و HuggingFace

🌐 @rss_ai_ir
#هوش_مصنوعی #رباتیک #VisionLanguageModels #AI_industrial

😁9🔥8❤6🎉6👍5

1.42K views18:07

VIRSUN

🖥 مدل GPT-5 – بیشتر بهینه‌سازی هزینه تا جهش فناورانه

مقاله‌ای در The Register منتشر شد که نشان می‌دهد استراتژی اصلی پشت GPT-5 نه افزایش توانایی‌های نوین، بلکه کاهش هزینه‌های محاسباتی بوده است.

🔹 چه تغییراتی اعمال شده؟

♻️مدل ترکیبی: GPT-5 دیگر یک مدل واحد نیست؛ بلکه ترکیبی از یک مدل سبک، یک مدل سنگین و یک روتر است که بسته به نوع درخواست انتخاب می‌کند → کاهش بار پردازشی.

♻️خاموشی خودکار Reasoning: فعال شدن استدلال تنها در مواقع ضروری (کاربران رایگان کنترلی روی آن ندارند) → مصرف کمتر محاسبات و توکن.

♻️حذف موقت مدل‌های قدیمی: مانند غیرفعال‌سازی GPT-4o برای کاهش هزینه‌ها، که بعداً فقط برای کاربران پولی بازگشت.

♻️محدودیت کانتکست: ۸۰۰۰ توکن رایگان، تا ۱۲۸هزار توکن در Plus/Pro.

🔹 چرا بهره‌وری اهمیت پیدا کرد؟

📊 بیش از ۷۰۰ میلیون کاربر هفتگی، اما فقط حدود ۳٪ پولی هستند.

💰 هزینه محاسباتی سرسام‌آور، فشار برای جذب سرمایه جدید.

🤝 همکاری با مایکروسافت کمک می‌کند، اما رقبا مثل گوگل درآمد پایدار و زیرساخت بومی (TPU) دارند.

🏆 برای اکثر مردم جهان، ChatGPT = هوش مصنوعی؛ حفظ این جایگاه جهانی نیازمند صرفه‌جویی و بهره‌وری بالاتر است.

✅ پس GPT-5 بیش از آنکه جهشی فناورانه باشد، پاسخی به نیاز اقتصادی و رقابتی OpenAI است.

🌐 @rss_ai_ir
#هوش_مصنوعی #ChatGPT #OpenAI #AI #ML

🔥13🎉8👍6😁5❤3

1.38K views18:10

VIRSUN

📢 مدل جدید گوگل: Gemma 3 270M

مدل فشرده‌ای با ۲۷۰ میلیون پارامتر (۱۷۰M برای embedding و ۱۰۰M برای بلاک‌های ترنسفورمر) معرفی شد که توانایی بالایی در دنبال‌کردن دستورها از همان ابتدا دارد.

🔹 ویژگی‌ها

♻️پشتیبانی از ۲۵۶k توکن
♻️بهره‌وری انرژی: نسخه INT4 روی Pixel 9 Pro تنها ‌۰.۷۵٪ باتری را برای ۲۵ دیالوگ مصرف می‌کند
♻️ارائه‌ی نسخه‌های Pretrained و Instruction-tuned
♻️پشتیبانی از Quantization-Aware Training (QAT) برای اجرای INT4 بدون افت محسوس کیفیت

💼 موارد استفاده

✳️وظایف مشخص و پرحجم مانند تحلیل احساسات، استخراج موجودیت‌ها، پردازش متن و چک‌های انطباقی
✳️کاهش هزینه و تاخیر، قابلیت اجرا مستقیم روی دستگاه
✳️آزمایش و فاین‌تیون سریع
✳️حفظ کامل حریم خصوصی با پردازش لوکال
✳️ساخت یک ناوگان مدل‌های تخصصی کوچک برای وظایف مختلف

📊 در یک نمونه، Adaptive ML و SK Telecom مدل Gemma 3 4B را برای مدیریت محتوای چندزبانه فاین‌تیون کردند و از مدل‌های اختصاصی بزرگ‌تر عملکرد بهتری گرفتند.

👉 مدل Gemma 3 270M انتخابی عالی برای کاربردهای سریع، کم‌هزینه و روی‌دستگاهی است.

🟠 جزییات: Google Blog
🟠 HuggingFace: Gemma

@rss_ai_ir
#خبر #هوش_مصنوعی #یادگیری_عمیق #Gemma #Google

😁9🎉8🔥7👍6❤3

3.55K views18:17

About

Blog

Apps

Platform